Introduction
Nouvellement annoncé par OpenAI, son dernier modèle d’IA, nommé Sora, est une révolution dans le domaine de la conversion du texte en vidéo. Les vidéos promotionnelles partagées révèlent un niveau d’efficacité qui est, sans équivoque, imposant.
Progrès significatifs de l’IA
Il y a à peine un an, la possibilité de générer des images et des vidéos de qualité grâce à l’IA semblait presque inatteignable. Souvenez-vous de l’épidémie de mains malproportionnées ? Il semblerait néanmoins que OpenAI a repoussé les limites en présentant un modèle qui pourrait révolutionner le domaine de la vidéo.
Zoom sur Sora
Sora est un modèle d’IA développé par OpenAI qui est capable de générer des vidéos de haute qualité, d’une durée allant jusqu’à une minute, en se basant simplement sur une description textuelle. « Sora est capable de générer des scènes complexes avec plusieurs personnages, des types de mouvements spécifiques, et des détails précis du sujet et de l’arrière-plan », dit OpenAI dans un blog post. « Le modèle comprend non seulement ce que l’utilisateur a demandé dans la description, mais aussi comment ces choses existent dans le monde réel. »
Imperfections de Sora
Cependant, Sora n’est pas dénué de problèmes. OpenAI admet que le modèle peut rencontrer des difficultés pour représenter correctement la cause et l’effet. Par exemple, s’il montre une personne en train de boire de l’eau dans un verre, il peut ne pas montrer le niveau d’eau qui baisse à chaque gorgée. Les ingénieurs de OpenAI travaillent aussi à améliorer la compréhension spatiale de Sora, comme la distinction entre la gauche et la droite ou le mouvement dans l’espace.
Disponibilité de Sora
À l’heure actuelle, le modèle n’est pas accessible au public et la société n’a pas encore annoncé de date de sortie. Il est actuellement en phase de « red teaming », où des utilisateurs spécialisés le testent pour identifier les potentiels risques.
Les enjeux de Sora
La combinaison de l’IA et de la vidéo représente d’importants enjeux. Nous avons vu récemment à quelle vitesse les images « deep fake » peuvent se propager et à quel point elles peuvent être dérangeantes. La vidéo élève ces enjeux de manière exponentielle.
Mesures de protection envisagées par OpenAI
Voici quelques mesures de sécurité que OpenAI a déjà mises ou prévoit de mettre en place :
- Un outil de détection qui peut alerter les utilisateurs lorsqu’une vidéo a été générée par Sora
- Des métadonnées C2PA pour suivre l’origine d’une vidéo
Limitations de Sora
Sora est également conçu pour rejeter les descriptions qui violent la politique de contenu d’OpenAI, par exemple les contenus illustrant la violence, le comportement sexuel, l’abus et les figures publiques.
Les retours sur Sora
La réception de ce modèle se situe entre l’excitation et la peur, comme cela est souvent le cas pour tout ce qui est lié à l’IA. Certains sont enthousiastes quant aux possibilités offertes aux entreprises et aux particuliers de créer des images de qualité à partir de simples descriptions textuelles. Pour les entreprises ayant des ressources créatives limitées, cela pourrait être une véritable révolution. Cependant, certains craignent l’impact sur le marché de l’emploi pour les emplois créatifs, tels que les designers et les animateurs. Leurs rôles deviendront-ils obsolètes ?
Conclusion
Même si cette crainte est souvent présente lorsque de nouveaux outils apparaissent, il est encore trop tôt pour le savoir, d’autant plus que le modèle n’est pas encore accessible au public. Est-il aussi bon qu’il en a l’air d’après les promotions d’OpenAI ? Nous devrons attendre pour le savoir.
€