IA Bulletin — 20 mai 2026

Gemini Omni Flash sort le jour J et avale Veo Nano Banana Genie /
Gemini Spark agent 24 heures ouvre la tarification AI Ultra à 100 dollars /
Andrej Karpathy ferme Eureka Labs et rejoint Anthropic

Gemini Omni Flash sort le jour J de Google I/O et fusionne Veo, Nano Banana et Genie dans un même modèle

Au keynote d'ouverture de Google I/O 2026 ce 19 mai à Mountain View, le DeepMind CEO Demis Hassabis a confirmé la sortie de Gemini Omni, modèle unifié qui réunit dans une même passe d'inférence les capacités de Veo pour la vidéo, de Nano Banana pour l'image et de Genie pour la simulation de monde, et qui peut prendre en entrée n'importe quelle combinaison de texte, image, audio et vidéo pour produire un livrable cohérent en sortie. La première itération commerciale, baptisée Gemini Omni Flash, a commencé son déploiement le jour même pour les abonnés Google AI Plus, Pro et Ultra, à la fois dans l'application Gemini grand public et dans la plateforme créative Flow. Le modèle conserve la cohérence des personnages, des décors et des mouvements d'un plan à l'autre, et accepte des modifications par dialogue successif sans regénération complète du clip. La conséquence opérationnelle est immédiate pour les studios qui avaient câblé leur pipeline sur Veo 3.1 : la marque Veo bascule en sous-couche d'Omni et la facturation, l'API et les quotas migrent sur la grille tarifaire Gemini, plus large mais plus exigeante en termes de prompt et de validation. Google a délibérément retenu pour plus tard la fonction la plus sensible, la génération vidéo à partir de portraits humains réels, en invoquant les contraintes de sécurité et d'identité que l'arrivée d'Omni amplifie mécaniquement.

Note éditoriale

La bascule de la marque Veo sous le toit de Gemini Omni est un signal stratégique plus qu'une simple évolution de produit. Google avait laissé Veo prendre une identité propre dans la presse créative et chez les studios pendant dix-huit mois, suffisamment pour s'installer comme référence indépendante. La fusion sous Omni dit deux choses : la firme veut une seule porte d'entrée pour la création multimodale, et elle accepte de sacrifier une marque qui marchait pour imposer une cohérence d'architecture. Pour les ateliers qui pratiquent la conception graphique d'un album ou la direction artistique vidéo, cela signifie que la maîtrise de Veo en tant que tel devient un savoir périmé, et que la nouvelle compétence valorisée est l'écriture de prompts multimodaux capables d'orchestrer image, vidéo et son dans un même flux.

Le second angle à observer est le retrait délibéré de la fonction portrait humain. Google a choisi de livrer l'outil créatif tout en bloquant la modalité la plus risquée pour les artistes vivants. C'est une concession ouverte aux pressions juridiques de l'industrie musicale et cinématographique, qui pourrait servir de précédent au moment où la régulation IA de l'Union européenne entre en application sur ces sujets.

Sources : TechTimes — Google Launches Gemini Omni Video Model, but Holds Back Its Riskiest FeatureDecrypt — Google Unveils Gemini Omni, a Next-Gen AI Video Builder That Can Simulate the WorldNews9 — Google I/O 2026: Gemini Omni Brings Advanced Multimodal AI Video Creation

Gemini Spark devient l'agent 24 heures sur 24 et installe un palier AI Ultra à 100 dollars par mois pour les créateurs

Le même keynote du 19 mai a confirmé l'existence de Gemini Spark, présenté par Google comme un « agent IA 24 heures sur 24 » qui vit dans le cloud, prend des initiatives sans tour explicite de l'utilisateur et continue à exécuter des tâches en arrière-plan pendant que l'utilisateur ne lui parle pas. Spark se distingue des assistants conversationnels classiques par sa persistance temporelle : il lit des courriels, surveille des fils RSS, prépare des brouillons, met à jour des feuilles de calcul, et restitue une synthèse quand l'utilisateur se reconnecte. Google a positionné l'outil dans une nouvelle gamme tarifaire AI Ultra facturée cent dollars par mois, présentée comme destinée aux « développeurs, créateurs et utilisateurs avancés ». L'offre inclut l'accès à Spark, à Gemini Omni Flash en quota étendu, et à Gemini 3.5 Flash, déclinaison plus rapide et moins coûteuse qui couvre la moitié à un tiers du prix des modèles frontières concurrents. La grille rejoint donc le palier équivalent de l'OpenAI Pro et du Claude Max, mais en l'attachant à un agent persistant que ni OpenAI ni Anthropic ne proposent encore sous cette forme.

Note éditoriale

L'installation d'un palier à cent dollars par mois sur le créneau créateur est un acte de marché autant que de produit. Le segment des créatifs indépendants payait jusqu'ici vingt ou trente euros pour Midjourney, Suno ou Runway, et ajoutait peu en abonnement Gemini Pro. Avec AI Ultra, Google demande de quintupler le ticket et propose en échange une infrastructure agentique unifiée, ce qui modifie la psychologie d'achat : le créateur n'achète plus une fonctionnalité mais un collaborateur cloud permanent. La question opérationnelle n'est pas le prix pris isolément mais le coût total d'outillage que cela représente quand on additionne Suno, Midjourney, Runway et désormais Gemini AI Ultra.

Le second angle à surveiller est la fiabilité contractuelle d'un agent qui agit de lui-même. Spark va lire, écrire et déclencher des actions sans validation manuelle de chaque étape, et la jurisprudence sur la responsabilité de l'utilisateur face à un brouillon envoyé par erreur reste à construire. Les ateliers qui s'équiperont devront documenter quels mandats explicites sont donnés à l'agent, sous peine de découvrir trop tard qu'un client a reçu une réponse automatique qu'aucun être humain n'avait validée.

Sources : CNBC — Google debuts new AI models, personal AI agents in effort to keep pace with OpenAI and AnthropicTom's Guide — Biggest Google I/O 2026 announcements: Gemini Spark, Intelligent Eyewear glasses and moreEngadget — Google I/O 2026: Live updates on XR glasses, Gemini, Search and more

Andrej Karpathy ferme Eureka Labs et rejoint Anthropic, geste symbolique fort dans la course aux modèles de raisonnement

Le 19 mai en fin de journée, Andrej Karpathy, cofondateur d'OpenAI et ancien directeur de l'intelligence artificielle chez Tesla, a annoncé sur X son arrivée chez Anthropic, mettant en pause son projet personnel d'école d'IA Eureka Labs dont les premières inscriptions devaient ouvrir cet été. Karpathy avait quitté OpenAI une première fois en 2017, y était revenu en 2023, puis avait définitivement claqué la porte en février 2024 pour se consacrer à la pédagogie et à la recherche personnelle, ouvrant sur YouTube une série de cours qui fait référence dans l'écosystème open-source du deep learning. Le ralliement à Anthropic intervient dix jours après l'annonce par la firme d'un engagement de 200 milliards de dollars sur les infrastructures cloud et GPU, principalement avec Google Cloud, qui place Anthropic à parité d'investissement avec OpenAI sur l'horizon 2027. Anthropic, qui ne dispose pas d'une figure publique aussi médiatique qu'Andrej Karpathy depuis le départ de plusieurs de ses chercheurs fondateurs, gagne avec ce ralliement un porte-parole technique reconnu par la communauté open-source et capable d'incarner la stratégie « modèle de raisonnement » que défend la firme face à l'éclatement produit d'OpenAI. La presse spécialisée lit l'annonce comme un signal de recentrement scientifique du marché vers les architectures de raisonnement multi-étapes plutôt que vers la course à la modalité.

Note éditoriale

Le mouvement de Karpathy se lit moins comme un transfert que comme une prise de position publique. En rejoignant Anthropic, il valide la ligne « moins de produits, plus de raisonnement » que défend Dario Amodei depuis dix-huit mois, et il signe une rupture nette avec l'évolution prise par OpenAI vers les agents grand public et la finance personnelle. Pour les ateliers créatifs qui hésitent encore à se câbler sur Claude ou sur ChatGPT, ce signal compte : il indique que les chercheurs de premier rang continuent à considérer Anthropic comme un environnement de recherche viable, et non comme une simple alternative commerciale.

Le contre-coup à anticiper est la perte d'Eureka Labs comme école indépendante, qui aurait offert un point d'entrée pédagogique non aligné sur un employeur de premier rang. La consolidation du paysage IA autour de quatre acteurs — OpenAI, Anthropic, Google, Meta — laisse de moins en moins de place aux figures intellectuelles capables d'enseigner la matière depuis l'extérieur, et la communauté open-source perd avec ce ralliement un porte-voix qui parlait depuis une position de retrait délibéré.

Sources : YourNews — AI Pioneer Andrej Karpathy Joins Anthropic in Major Boost to Competition With OpenAICNBC — Google debuts new AI models, personal AI agentsAnthropic — Claude Opus 4.7 news page
Coverart for French house music — Studio Takuya
Coverart for French house music — Studio Takuya