Takuya Studio — IA Bulletin

Runway pivote vers les world models /
Photoshop ouvre Gemini et FLUX 2 à côté de Firefly /
Gemini Omni fuite à la veille du Google I/O

Semaine de bascule pour la vidéo et l’image. Runway théorise dans TechCrunch sa pivot des outils vidéo vers les world models, assume vouloir battre Google sur le terrain de l’intelligence visuelle et empile 40 M$ d’ARR au deuxième trimestre 2026. Adobe ouvre Photoshop à trois moteurs au choix — Firefly Image 4, Gemini 3 Nano Banana Pro, FLUX 2 Pro — et cloût deux ans d’exclusivité Firefly. Sondo AI annonce dix millions d’utilisateurs et un million d’abonnés payants sur la génération de clips music-to-video. Reka acquiert Moonvalley pour viser les world models, HubSpot ouvre AEO Sensor sur les LLM, RSL Media pose le Human Consent Standard avec Cate Blanchett. Ogilvy India branche Google, DALL-E 2 et 3 ferment au profit de GPT-Image, Claude for Small Business arrive avec 15 skills et Canva. Seedance 2.0 entre en pipeline pro chez DeepBrain, Meta AI Muse Spark parle et dessine en direct, Spotify ouvre le CLI Save to Spotify aux agents. Gemini Omni fuite à neuf jours du keynote Google I/O, Higgsfield branche Claude sur trente modèles vidéo par MCP, BACH 1.0 vise le cinéma multi-shot. Lyria 3 Pro s’étend à Vertex et Google Vids, AutoMV publie son système multi-agents open-source, Anthropic loue Colossus 1 à xAI. Critterz entre en vente à Cannes, Suno V6 reste en limbes face à Universal et Sony, IFPI mesure la fraude streaming à 85 % chez Deezer. Sept éditions, du 11 au 17 mai 2026.

11 mai 2026
Critterz et l'entrée du long-métrage IA au Marché du Film / Suno V6 dans les limbes des labels majors / IFPI 2026 et la mesure de la fraude streaming IA
AGC Studios Critterz Cannes Market — Suno V6 limbo UMG Sony — IFPI 31,7 G$ Deezer 85% fraude
AGC Studios ouvre les ventes mondiales de Critterz au Marché du Film de Cannes, premier long-métrage familial intégrant l'IA dans toute sa chaîne de production sous direction humaine de Nik Kleverov (Native Foreign), avec Chad Nelson (OpenAI) producteur et le duo de Paddington au Pérou au scénario, budget sous les 30 millions de dollars en neuf mois de fabrication. Suno avait promis fin 2025 une V6 entraînée sur catalogue licencié pour 2026, mais cinq mois plus tard la V5.5 reste le dernier modèle accessible et les négociations avec Universal et Sony sont au point mort selon Music Business Worldwide. L'IFPI publie son Global Music Report 2026 : 31,7 milliards de dollars de revenus enregistrés (+6,4 %), douze accords de licence IA signés en un an, et 85 % des écoutes IA sur Deezer flaggées comme frauduleuses sur 60 000 morceaux quotidiens.
12 mai 2026
Lyria 3 Pro étendu à Vertex et Google Vids / AutoMV génère un clip complet en multi-agents / Anthropic loue Colossus 1 à xAI
Lyria 3 Pro étendu Vertex AI ProducerAI — AutoMV arXiv 2512.12196 multi-agents — Anthropic 300 MW Colossus 1 xAI
Google étend Lyria 3 Pro à Vertex AI, AI Studio, Gemini API, Google Vids, l'application Gemini et ProducerAI : pistes de trois minutes, structure intro/couplet/refrain/pont éditable au prompt, tatouage SynthID systématique. AutoMV publie sur arXiv 2512.12196 le premier système open-source de génération de clips musicaux à partir d'un morceau complet, sortie d'une collaboration Queen Mary, BUPT, Nanjing, HKUST et Manchester, avec agents scénariste, réalisateur, générateurs et vérificateur dotés de contrats d'interface. Anthropic annonce le 6 mai un partenariat de compute avec xAI et SpaceX : 300 mégawatts et 220 000 GPU Nvidia du Colossus 1 de Memphis sous un mois, lettre d'intention pour plusieurs gigawatts supplémentaires dont une infrastructure orbitale.
13 mai 2026
Gemini Omni fuite avant Google I/O / Higgsfield branche Claude au studio vidéo / BACH 1.0 vise le cinéma multi-shot
Gemini Omni clips fuités I/O 2026 — Higgsfield MCP Claude 30 modèles 4K — BACH 1.0 Video Rebirth 30 s multi-shot 1080p
Des clips générés par Gemini Omni, successeur unifié de Veo 3.1 fondant image, vidéo et audio spatial dans un seul passage d'inférence, fuitent dans l'application Gemini neuf jours avant Google I/O 2026, fixé au 19 mai. Higgsfield publie un connecteur Model Context Protocol qui ouvre Claude sur trente modèles vidéo — Veo 3.1, Sora 2, Kling 3.0, Seedance 2.0, Wan 2.6, MiniMax Hailuo, plus les modèles maison Soul Cinema — avec sortie 4K, quinze secondes, n'importe quel ratio. Video Rebirth, fondé par l'ex-distinguished scientist Tencent Wei Liu, lance BACH 1.0, moteur cinéma 30 secondes multi-shot 1080p 30 fps articulé sur Physics-Native Attention et Dual DiT, avec SFX, voix off et musique générés dans le même workflow et entrée sixième mondiale sur Artificial Analysis.
14 mai 2026
Seedance 2.0 passe en pipeline pro chez DeepBrain / Meta AI parle et dessine en direct / Spotify accueille les podcasts d'agents
DeepBrain AI STUDIOS + Seedance 2.0 — Meta AI Voice + Muse Spark image en direct — Spotify Save to Spotify CLI Claude Code OpenClaw
DeepBrain AI annonce le 13 mai l'intégration de Seedance 2.0, modèle vidéo multimodal de ByteDance, dans AI STUDIOS avec extension de la durée au-delà d'une minute, résolution maintenue lors des prolongations, prononciation corrigée et doublage industriel via mille voix dans cent cinquante langues. Meta déploie le 12 mai une conversation vocale dans son app Meta AI propulsée par Muse Spark : interruption naturelle, bascule de langue, génération d'images en temps réel pendant la conversation, et déploiement parallèle sur les Ray-Ban Meta et Oakley Meta avec Live AI qui interprète ce que la caméra voit. Spotify publie l'outil Save to Spotify, CLI public qui permet à Claude Code, OpenAI Codex et OpenClaw de générer un podcast personnel et de le déposer directement dans la bibliothèque utilisateur — la plateforme devient le canal de lecture d'agents tiers.
15 mai 2026
Ogilvy India branche Google sur l'atelier créatif / DALL-E 2 et 3 ferment au profit de GPT-Image / Claude équipe les petits studios
Ogilvy x Google AI Creative Studio brand-compliant — DALL-E 2 et 3 retirés le 12 mai · GPT-Image 1.5 et 2.0 — Claude for Small Business 15 skills 15 workflows Canva
Ogilvy India et Google annoncent le 14 mai un AI Creative Studio interne destiné à produire des assets stills et vidéo brand-compliant pour les marques clientes, avec hyper-personnalisation par segment, virtual try-ons et contrôle humain explicite à chaque étape. OpenAI a éteint le 12 mai DALL-E 2 et DALL-E 3 sur son endpoint /v1/images/generations, redirigeant les requêtes vers GPT-Image 1.5 et le successeur thinking GPT-Image 2.0 lancé le 21 avril avec rendu 2K, huit images cohérentes par prompt et texte lisible. Anthropic livre le 13 mai Claude for Small Business — 15 workflows agentiques, 15 skills réutilisables et 8 connecteurs nommés dont Canva — inclus dans les plans Team et Enterprise sans surcoût, avec tournée promotionnelle dans dix villes à partir de Chicago.
16 mai 2026
Reka avale Moonvalley pour viser les world models / HubSpot ouvre l'AEO Sensor au public / RSL Media pose le consentement IA en standard
Reka acquiert Moonvalley en all-share — pivot world models et robotique · dataset licencié — HubSpot AEO Sensor dashboard public ChatGPT Gemini Perplexity — RSL Media Cate Blanchett Human Consent Standard registre juin 2026
Reka AI annonce le 14 mai l'acquisition all-share de Moonvalley, jeune pousse torontoise dont le moteur vidéo est entraîné sur données intégralement licenciées : Reka cherche à pivoter vers les world models et la robotique, et hérite au passage d'un actif copyright-clean valorisé 154 M$ par les investisseurs précédents. HubSpot publie le 14 mai AEO Sensor, dashboard public et gratuit qui chiffre la volatilité, les citations et le trafic AI-referred sur ChatGPT, Gemini et Perplexity, avec historique remontant au 16 février 2026 — sortie qui tombe la semaine où le trafic ChatGPT marque son plus bas à douze mois. RSL Media, public benefit non-profit cofondé par Cate Blanchett, lance le 12 mai le Human Consent Standard (RSL-MEDIA 1.0), registre opt-in machine-lisible qui ouvre en juin et qui permet aux personnes de déclarer leurs permissions IA sur leurs œuvres et leurs attributs d'identité — Bardem, Clooney, Hanks, Mirren, Streep, Stewart, Soderbergh, Thompson, CAA et Music Artists Coalition au soutien.
17 mai 2026
Runway et le pari des world models contre Google / Photoshop ouvre Gemini Nano Banana Pro et FLUX 2 Pro à côté de Firefly / Sondo AI passe la barre des dix millions d'utilisateurs sur la génération de clips
Runway pivot world models — Anastasis Germanidis TechCrunch 15 mai · Gen-4.5 · 5,3 Md$ — Photoshop multi-moteurs Firefly Image 4 Gemini 3 Nano Banana Pro FLUX 2 Pro — Sondo AI 10 M utilisateurs 1 M abonnés payants 15 M clips music-to-video
Runway théorise dans TechCrunch le 15 mai sa pivot stratégique : la vidéo générative devient une brique vers les world models physiquement cohérents, et la société assume vouloir battre Google sur le terrain de l'intelligence visuelle plutôt que celui du langage, valorisée 5,3 Md$ après une Série E de 315 M$. Adobe ouvre Generative Fill, Expand et les outils de remplacement d'objet aux modèles tiers Gemini 3 Nano Banana Pro et Black Forest Labs FLUX 2 Pro à côté de Firefly Image 4, fin de l'exclusivité Firefly via une simple liste déroulante au pied du prompt. Sondo AI annonce le 14 mai dix millions d'utilisateurs et un million d'abonnés payants en un an, avec quinze millions de clips music-to-video produits — chaque créateur publie désormais plusieurs variantes du même morceau optimisées pour TikTok, Reels et Shorts.