OpenAI revela nova solução capaz de transformar texto em vídeo realista [com video]

O Sora é um modelo de inteligência artificial capaz de criar vídeos realistas a partir de textos curtos. A ferramenta, que ainda está a ser analisada por especialistas, promete criar vídeos de até 60 segundos, com cenas intrincadas e movimentos de câmara complexos.
17 de Fevereiro, 2024

A empresa afirma que o Sora não só compreende o conteúdo textual fornecido, mas também a sua representação no mundo físico. Além disso, pode gerar continuações de vídeos existentes e produzir vídeos a partir de imagens estáticas.

Para garantir uma utilização responsável da tecnologia, a OpenAI está a implementar medidas de segurança, incluindo testes administrados por especialistas em desinformação e discurso de ódio. Além disso, um grupo de artistas visuais, composto por profissionais como designers e cineastas, está a colaborar para otimizar a ferramenta para as suas criações.

O Sora utiliza uma técnica chamada “difusão” para gerar imagens a partir de pontos aleatórios, transformando gradualmente o ruído estático em imagens reconhecíveis. No entanto, a empresa reconhece que o modelo tem algumas limitações, como a dificuldade de replicar fisicamente cenas complexas e de compreender relações de causa e efeito.

Para mitigar os riscos de utilização indevida, a OpenAI está a desenvolver funcionalidades para detetar conteúdos enganadores e violações das políticas de utilização, como violência extrema ou conteúdos sexuais. A empresa sublinha a importância da aprendizagem contínua a partir da utilização da tecnologia no mundo real para garantir a sua segurança ao longo do tempo.

Opinião