A empresa afirma que o Sora não só compreende o conteúdo textual fornecido, mas também a sua representação no mundo físico. Além disso, pode gerar continuações de vídeos existentes e produzir vídeos a partir de imagens estáticas.
Para garantir uma utilização responsável da tecnologia, a OpenAI está a implementar medidas de segurança, incluindo testes administrados por especialistas em desinformação e discurso de ódio. Além disso, um grupo de artistas visuais, composto por profissionais como designers e cineastas, está a colaborar para otimizar a ferramenta para as suas criações.
O Sora utiliza uma técnica chamada “difusão” para gerar imagens a partir de pontos aleatórios, transformando gradualmente o ruído estático em imagens reconhecíveis. No entanto, a empresa reconhece que o modelo tem algumas limitações, como a dificuldade de replicar fisicamente cenas complexas e de compreender relações de causa e efeito.
Para mitigar os riscos de utilização indevida, a OpenAI está a desenvolver funcionalidades para detetar conteúdos enganadores e violações das políticas de utilização, como violência extrema ou conteúdos sexuais. A empresa sublinha a importância da aprendizagem contínua a partir da utilização da tecnologia no mundo real para garantir a sua segurança ao longo do tempo.