BUENODIA

Google I/O 2026 dévoile Gemini Omni, l’IA multimodale vidéo

Logo Google I/O 2026 sur écran, avec visuel Gemini Omni et vignettes vidéo multimodales en arrière-plan

Gemini Omni transforme le montage multimodal

Lors du Google I/O 2026, Google a levé le voile sur Gemini Omni : une version de Gemini pensée non plus seulement pour lire du texte ou analyser des images, mais pour mêler texte, image, audio et vidéo dans un même raisonnement et en faire… du montage. L’idée est simple et ambitieuse : vous décrivez une scène, l’IA assemble des plans, ajuste la direction artistique, modifie votre apparence ou remixe une voix, sans que vous n’ayez besoin d’un logiciel de montage.

Gemini Omni Flash : la première brique du montage automatique

Gemini Omni Flash est la première brique visible de ce chantier. Le modèle ingère images, séquences audio et extraits vidéo, puis produit un montage à partir d’un prompt textuel.

Demis Hassabis a précisé que la commande vocale sera disponible prochainement — la promesse d’un flux de création entièrement piloté à la voix. Google annonce aussi une compréhension approfondie de la physique, de la culture et de l’histoire pour rendre les plans crédibles ; en pratique, cela vise à limiter les erreurs de cohérence, même si la firme reconnaît que des hallucinations subsisteront.

Disponibilité et filigrane SynthID

Gemini Omni Flash est accessible dès aujourd’hui aux abonnés Google AI Plus, Pro et Ultra via l’application Gemini et l’outil Flow. Tout contenu généré par Google Omni porte le filigrane SynthID, invisible à l’œil mais vérifiable.

Contrôles internes et limites éthiques

Les enjeux éthiques et techniques se posent d’emblée. Pour limiter les dérives, Google réserve encore l’édition et la modification vocale à des tests internes et déploiera une API pour développeurs dans les semaines à venir.

Le filigrane SynthID, déjà adopté par des acteurs comme Nvidia, OpenAI, Kakao et ElevenLabs, accompagne chaque création signée par les outils de génération. La protection n’est pas infaillible — certaines manipulations pourront contourner ces garde-fous — mais elle instaure au moins un repère traçable.

Détection intégrée pour protéger la vigilance

Google ne se contente pas d’offrir un outil de création : il propose aussi des outils de détection. La firme intègre dans Chrome et son moteur de recherche une fonction reposant sur Entourez pour repérer et signaler les images susceptibles d’avoir été générées par une IA.

Autrement dit, Google équipe à la fois les auteurs d’outils puissants et les lecteurs de moyens de vigilance.

Ce que cela change concrètement : pour les créateurs, la barrière technique entre idée et vidéo se réduit encore ; pour la société, la production de contenus visuels réalistes devient banale et pose de nouvelles questions de vérification et de responsabilité. Gemini Omni accélère la transformation multimodale — et montre qu’à mesure que la création devient plus simple, la nécessité d’outils de traçabilité et de règles claires devient urgente.

Publié le : 20 mai 2026
link