IA Bulletin — 21 mai 2026

Stable Audio 3.0 sort en open weights et pousse la génération musicale au-delà de six minutes /
Google Flow Music ouvre l'édition section par section et débarque en application iOS /
Anthropic livre Self-Hosted Sandboxes et MCP Tunnels pour ses agents Claude Managed

Stability AI publie Stable Audio 3.0, famille de quatre modèles dont trois en poids ouverts, capable de générer six minutes vingt secondes de musique structurée

Stability AI a publié mercredi 20 mai 2026 Stable Audio 3.0, famille de quatre modèles de génération musicale dont les trois plus petits (small SFX, small, medium) sont distribués en poids ouverts sur Hugging Face et téléchargeables sans inscription. Le modèle large, accessible uniquement via API ou hébergement payant chez Stability, peut composer des morceaux structurés jusqu'à six minutes vingt secondes, soit plus du double de Stable Audio 2.0 sorti en 2024, en conservant ligne mélodique et logique de progression sur l'ensemble du morceau. La variante small est conçue pour tourner en local sur du matériel grand public et génère deux minutes d'audio sans connexion cloud, ce qui ouvre concrètement la porte à l'intégration dans des pipelines DAW autonomes. Les modèles ont été entraînés sur un mélange déclaré comme entièrement licencié, composé de 806 284 fichiers issus de la bibliothèque AudioSparx et de captations Creative Commons du catalogue Freesound, ce qui leur donne une assise juridique plus solide que celle de la concurrence Suno ou Udio. Stability a positionné l'ensemble comme une alternative explicite à l'enclos propriétaire des géants du son génératif, en pariant sur un retour de l'expérimentation artistique que la rétractation de Stable Audio 2.5 dans le périmètre WPP/amp avait laissé en suspens.

Note éditoriale

La publication des trois plus petits modèles en poids ouverts est l'événement central de ce 20 mai, pas la durée des morceaux. La compétition Suno, Udio, Lyria, ElevenMusic s'est entièrement structurée comme un marché de services fermés, avec licences distribuées au compte-gouttes et catalogue d'entraînement opaque. Stable Audio 3.0 réintroduit la possibilité d'un atelier musical IA où l'artiste contrôle le modèle, le finetune sur son propre matériel et l'inscrit dans une chaîne de production qu'il maîtrise — la même bascule que la création de pochette d'album sous IA a connue il y a deux ans avec l'arrivée de Flux et de SDXL côté image.

Le point d'attention pour les ateliers est la déclaration de licence. Stability annonce un corpus AudioSparx + Freesound, mais la chaîne d'auditabilité de cette licence reste à vérifier par les commanditaires sérieux avant tout usage commercial. Le modèle large resté propriétaire est un compromis lisible : Stability garde sa rente sur le tier le plus exigeant tout en libérant la base communautaire, et cette architecture en double cercle ressemble exactement à celle qu'imposait Black Forest Labs avec Flux il y a dix-huit mois.

Sources : Stability AI — Meet Stable Audio 3, the model family built for artistic experimentation with open-weight models — TechCrunch — Stability AI releases a new audio model that can create 6-minute songs — The Decoder — Stability AI launches Stable Audio 3.0 with up to six-minute tracks and open weights

Google Flow Music ouvre l'édition section par section sur Lyria 3 Pro et débarque comme application iOS pour orchestrer un clip avec Gemini Omni

Google a annoncé mardi 19 mai en marge du keynote I/O une refonte majeure de Google Flow Music, propulsée par Lyria 3 Pro, qui ouvre l'édition section par section d'un morceau : le créateur peut isoler une introduction, un refrain ou un pont, modifier l'arrangement, réécrire les paroles ou translaver le ton sans regénérer l'intégralité du fichier. Une fonction covers permet de transformer le style d'un morceau entier en conservant la mélodie et l'arrangement originaux, ce qui autorise l'exploration de variantes de production à partir d'une même structure compositionnelle. La grande nouveauté de mise en marché est l'arrivée d'une application iOS dédiée Flow Music, disponible immédiatement sur l'App Store, tandis que l'application Flow vidéo arrive d'abord sur Android en bêta réservée aux 18 ans et plus, l'inverse de la stratégie historique de Google. Gemini Omni entre directement dans Flow Music pour générer des clips vidéo à partir d'un morceau, en guidant conversationnellement le style, les sujets et les scènes pour les caler sur la narration et la cadence du titre. L'ensemble est ouvert globalement aux abonnés Google AI Plus, Pro et Ultra, ce qui en fait la première offre majeur grand-public à coupler génération musicale, édition fine et clip vidéo dans un même abonnement.

Note éditoriale

L'édition section par section est le seul vrai progrès produit sur le créneau musical IA depuis le lancement de Suno V5. Jusqu'à présent, l'intégralité du marché reposait sur la philosophie « regénère et choisis » : un prompt, dix variantes, on garde la meilleure. Lyria 3 Pro casse cette logique en ramenant la pratique vers un workflow d'arrangeur, où l'on retouche une mesure spécifique sans rejouer la roulette stochastique. C'est exactement la promesse que Suno et Udio n'ont jamais tenue malgré leurs annonces de stems séparés.

Le couplage Flow Music + Gemini Omni signe par contre la fin d'une période créative spécifique : celle où le clip musical IA était un terrain d'expérimentation artistique distinct de la composition. Avec un agent conversationnel qui dirige le clip à partir du titre, le rôle du directeur artistique vidéo dans la chaîne musicale grand-public se réduit à la rédaction d'un brief — une bascule que les studios de clip indépendants avaient anticipé l'an dernier mais qui s'industrialise ici à l'échelle du milliard d'abonnés Google.

Sources : Google — New agents, mobile apps and Gemini Omni for Google Flow and Google Flow Music — Android Central — Google finds its Flow with Flow Music app for mobile, Gemini Omni Flash — 9to5Google — Google Flow AI video editing and music tools getting dedicated apps and Omni upgrades

Anthropic livre lors de Code with Claude London ses Self-Hosted Sandboxes en bêta publique et MCP Tunnels en preview, pour faire tourner Claude Managed dans le périmètre du client

Anthropic a profité de l'événement Code with Claude London tenu les 19 et 20 mai pour livrer deux briques d'infrastructure attendues sur le créneau des agents en entreprise. Les Self-Hosted Sandboxes, désormais en bêta publique, permettent de faire tourner les Claude Managed Agents à l'intérieur d'un sandbox contrôlé par l'organisation cliente — VPC, on-premise ou cluster privé — au lieu de l'infrastructure managée d'Anthropic. Les MCP Tunnels, en research preview, étendent ce périmètre aux serveurs Model Context Protocol internes de l'entreprise, permettant à un agent Claude d'invoquer des outils privés sans que les données quittent la barrière de sécurité du client. Le keynote a également officialisé la livraison du Claude Advisor tool, des Remote Agents et de la fonction CI auto-fix, mais aucune annonce de nouveau modèle frontière n'a été faite à Londres, Anthropic répétant que Claude Opus 4.7 reste le navire amiral. Le message stratégique est explicite : à la course aux modèles que mène Google avec Gemini Omni, Anthropic oppose une course à l'infrastructure agentique compatible avec les obligations réglementaires des grandes entreprises, et notamment celles qui ne peuvent pas confier leur exécution à un tiers.

Note éditoriale

La séparation s'est clarifiée à Londres : Google bâtit pour le grand public et le créateur indépendant, Anthropic bâtit pour le DSI d'un groupe coté. Cette bifurcation n'est pas une simple stratégie commerciale, elle dit quelque chose de plus profond sur ce que réguler l'IA veut dire en pratique. Pour un atelier comme Takuya Studio, l'enjeu n'est pas direct — un studio de design ne se câblera pas sur des Self-Hosted Sandboxes — mais le signal est utile : les agents deviennent une catégorie d'outil à part entière, avec sa propre couche de gouvernance, et le créateur qui s'équipera demain devra distinguer l'agent grand-public de l'agent infrastructure.

L'absence d'annonce de modèle est l'angle qu'il faut retenir. Anthropic n'a pas répondu à Gemini Omni ni à Spark sur le terrain de la modalité ou de la persistance temporelle, et a délibérément choisi de tenir sa ligne « moins de produits, plus de raisonnement ». Le calcul est risqué dans un cycle médiatique qui valorise la nouveauté, mais il prolonge logiquement le ralliement d'Andrej Karpathy annoncé la veille et confirme une discipline scientifique que peu d'acteurs du marché conservent.

Sources : InfoQ — Anthropic Code with Claude Announces Managed Agents, Proactive Workflows, Capability Curve — DEV Community — Anthropic Launches Self-Hosted Claude Agents: What Indie Hackers Need to Know — MindStudio — Code with Claude 2026: 5 New Agent Features Anthropic Just Shipped

← Bulletin précédent Archives

Stable Audio 3.0 sort en open weights et pousse la génération musicale au-delà de six minutes /Google Flow Music ouvre l'édition section par section et débarque en application iOS /Anthropic livre Self-Hosted Sandboxes et MCP Tunnels pour ses agents Claude Managed

Stability AI publie Stable Audio 3.0, famille de quatre modèles dont trois en poids ouverts, capable de générer six minutes vingt secondes de musique structurée

Google Flow Music ouvre l'édition section par section sur Lyria 3 Pro et débarque comme application iOS pour orchestrer un clip avec Gemini Omni

Anthropic livre lors de Code with Claude London ses Self-Hosted Sandboxes en bêta publique et MCP Tunnels en preview, pour faire tourner Claude Managed dans le périmètre du client

Stable Audio 3.0 sort en open weights et pousse la génération musicale au-delà de six minutes /
Google Flow Music ouvre l'édition section par section et débarque en application iOS /
Anthropic livre Self-Hosted Sandboxes et MCP Tunnels pour ses agents Claude Managed