IA Bulletin — 18 mai 2026

Google I/O 2026 à la veille du keynote Gemini Omni /
LTX-2 NVFP8 fait passer la vidéo 4K sur RTX grand public /
Mistral Small Creative entre dans les Labs en modèle texte de création

Google I/O 2026 à la veille du keynote, attentes Gemini Omni, Veo et Gemini 3.5 dans une course frontale à Mythos et GPT-5.5

La conférence Google I/O 2026 ouvre demain matin son keynote, programmé le 19 mai à 19 heures heure de Paris sur le campus de Mountain View, et l'ensemble de la presse spécialisée converge sur trois attentes éditoriales fortes : un modèle Gemini Omni unifiant texte, image, vidéo et audio dans une seule passe d'inférence, une mise à jour de Veo avec sortie native synchronisée, et une nouvelle famille Gemini 3.2 ou 3.5 que les analystes jugent plus probable qu'un saut direct à Gemini 4.0 au vu de la cadence trimestrielle observée depuis fin 2025. Cette édition est lue par TechCrunch et The Verge comme un moment charnière : Google arrive après la sortie de GPT-5.5 Instant par OpenAI le 5 mai et de Claude Mythos Preview d'Anthropic le 12 mai, deux modèles qui ont déplacé le centre de gravité du marché vers le raisonnement multi-étapes et l'agent long-horizon. La présence d'Android XR au programme du keynote est confirmée, avec une démo annoncée de lunettes propulsées par Gemini, dans la même séquence que les Ray-Ban Meta Live AI mises en service la semaine du 12 mai. Du côté créatif, les fuites UI repérées le 2 mai par TestingCatalog puis confirmées par Android Authority le 14 mai pointent vers un onglet vidéo dans l'app Gemini portant la mention Powered by Omni avec édition par conversation et modèles de templates, ce qui suggère un déploiement consommateur immédiat plutôt qu'une simple démonstration de laboratoire. Google n'a confirmé officiellement aucune de ces fonctionnalités à ce jour, et la conférence sera scrutée pour évaluer si la firme reprend l'initiative créative qu'elle avait perdue depuis l'éclipse de Veo 3.1 par Sora 2.

Note éditoriale

La séquence Mythos – GPT-5.5 – I/O 2026 est devenue le calendrier réel qui structure le secteur, beaucoup plus que les versions logicielles d'Apple ou de Microsoft. Trois fournisseurs en deux semaines, chacun avec un saut technique mesurable et un narratif distinct : raisonnement profond pour Anthropic, super-app pour OpenAI, intégration omnimédia pour Google. Pour un atelier créatif, l'enjeu n'est pas de choisir un camp mais de garder trois prises en parallèle, parce qu'aucun des trois modèles ne dominera l'ensemble des tâches.

Le signal le plus intéressant à guetter demain n'est pas la performance brute d'Omni mais la politique d'API : si Google ouvre l'omnimodèle aux développeurs dès le 19 mai avec quotas raisonnables, l'avantage strategique est massif face à Sora 2 qui reste en accès restreint. Si l'annonce reste à l'état de démo cinéma, l'effet de réel sera proche de zéro pour les ateliers qui travaillent à l'échelle d'un trimestre. Le second signal est le sort réservé à Veo 3.1 : remplacement complet ou cohabitation, déprécation calendaire ou maintien en production. Les studios qui ont bâti leur pipeline sur Veo depuis novembre auront besoin d'une certitude opérationnelle, pas d'une promesse.

Sources : Yahoo Tech — Google I/O 2026: how to watch and what to expectAndroid Authority — Gemini Omni video model leakTechTimes — Google I/O 2026 keynote opens Tuesday behind Mythos and GPT-5.5

NVIDIA et Lightricks publient LTX-2 en NVFP8 dans ComfyUI, la génération vidéo 4K bascule sur cartes RTX grand public

NVIDIA et Lightricks annoncent en commun la publication des poids ouverts de LTX-2, modèle vidéo-audio temps réel précédemment réservé aux endpoints cloud, désormais distribué en NVFP8 directement compatible avec ComfyUI, AUTOMATIC1111, Llama.cpp et le runtime Hyperlink. Le format NVFP8 — flottant 8 bits avec mantisse étendue introduit par NVIDIA en novembre 2025 pour la série RTX 50 — permet de faire tenir un modèle vidéo de classe LTX-2 dans la VRAM des cartes consommateur RTX 4070 et 5070, là où la version FP16 demandait deux RTX 4090 en parallèle. Le bénéfice opérationnel mesuré par NVIDIA dans son billet RTX AI Garage est une bascule de l'inférence 4K vidéo générative depuis les clusters loués sur clouds tiers vers la tour personnelle de l'artiste, avec un temps de rendu de l'ordre de quatre minutes par seconde de vidéo en 3840×2160. Lightricks accompagne la sortie d'un fichier ComfyUI workflow officiel qui pré-câble l'enchaînement prompt → clip → upscale → audio synchronisé, et NVIDIA pousse un patch ComfyUI Desktop qui détecte automatiquement le NVFP8 sur les GPU compatibles. La démarche concrétise une feuille de route esquissée à CES 2026 en janvier où NVIDIA avait promis de ramener l'IA vidéo dans la station de travail individuelle.

Note éditoriale

Le passage de la 4K vidéo sur une carte à 600 euros change la politique tarifaire des ateliers et des studios indépendants beaucoup plus que la qualité visuelle de la vidéo elle-même. Tant que l'inférence demande huit cents euros par jour de cluster cloud, le tarif jour d'un poste de monteur intègre cette location et la facture client suit. Avec LTX-2 sur RTX 5070, le coût marginal de la quatrième variante d'un même plan tombe quasiment à zéro hors électricité, ce qui détruit la justification interne du shot unique et pousse mécaniquement vers la production de séries jetables.

Le contre-coup à anticiper est la banalisation des rendus IA 4K dans les plateformes de stock vidéo et les briefs marques. Le rendu 1080p était jusqu'ici un marqueur implicite de production légère, l'attente client glissera vers le 4K natif comme défaut, et les studios qui factureront un travail filmique vrai devront expliquer la valeur de leur prestation autrement que par la résolution. Le pari technique — NVFP8 tient ses promesses sur la stabilité temporelle inter-frames — sera vérifié dans les semaines qui viennent par les retours de la communauté ComfyUI, beaucoup plus pertinents qu'un communiqué NVIDIA.

Sources : NVIDIA Blog — RTX accelerates 4K AI video generation with LTX-2 and ComfyUI upgradesAMD — ComfyUI advancing professional-quality generative AIGitHub — ComfyUI repository

Mistral AI ajoute Small Creative à ses Labs, premier modèle texte explicitement orienté création

Mistral AI publie Small Creative dans la branche Labs de son hub modèles, qui regroupe les expérimentations ouvertes aux développeurs pré-version stable. Là où la lignée Mistral Small visait jusqu'ici le rapport coût-performance sur les tâches généralistes (résumé, classification, code court), Small Creative est positionné comme un modèle texte orienté création : dialogue de personnage à voix maintenue, brief de direction artistique d'album, traitement de plot points cinéma multi-actes, génération de copy publicitaire en variations alignées sur une charte. Le modèle est annoncé dans la fenêtre paramètres habituelle de Mistral Small (autour de 25 milliards de paramètres, contexte de 128 K tokens), et l'accent porte sur la fidélité stylistique à un échantillon de référence court plutôt que sur la créativité ex nihilo. L'API est ouverte immédiatement sur la plateforme Mistral à un tarif d'appel inférieur à GPT-5.5 Instant et à Claude Haiku 4.5, ce qui en fait un candidat sérieux pour les pipelines à fort volume où chaque token coûte. La société rappelle son ancrage européen et son adhésion à la NVIDIA Nemotron Coalition annoncée plus tôt en mai, qui réunit Black Forest Labs, Cursor, LangChain, Perplexity, Reflection AI, Sarvam et Thinking Machines Lab autour d'une fondation open trainée sur DGX Cloud.

Note éditoriale

Mistral assume enfin frontalement la verticale création, terrain où les anglo-saxons opèrent par défaut sans le nommer. Small Creative est moins une rupture technique qu'un acte de positionnement éditorial : le modèle est dimensionné pour servir des ateliers de communication, des maisons d'édition et des agences de design qui ne veulent pas payer un Sonnet par tour de génération. La fidélité stylistique à un échantillon court est exactement ce que demande un atelier de copywriting qui doit produire trente variantes d'un même slogan tout en restant dans la voix d'une marque — capacité que Claude et GPT savent faire au prix d'une dérive progressive sur de longues sessions.

Reste à voir comment Small Creative se comporte sur le français de niveau professionnel, terrain où Mistral a historiquement un avantage culturel mais où le décalage avec un Claude bien promptable s'est réduit en 2026. Pour un studio parisien qui rédige presque exclusivement en français, le bénéfice tarifaire ne compense pas une perte de tenue éditoriale ; pour un studio qui produit volume en anglais transactionnel — légendes Instagram, voice-over publicitaire, brief de pochette — l'écart de coût peut justifier la migration. Le seul vrai test sera un A/B aveugle sur des sorties Studio Takuya, et il vaut la peine de l'exécuter avant l'été.

Sources : Mistral AI — News and releasesNVIDIA Newsroom — Nemotron Coalition launchesMistral Docs — Changelog
So Long — Studio Takuya
So Long — Studio Takuya