-
Madrid: le retour d'Arthur Fils, pile à l'heure pour Roland-Garros
-
Coup de frein pour la zone euro en avril, sous l'effet de la crise au Moyen-Orient
-
L'ex-dirigeant philippin Rodrigo Duterte sera jugé devant la CPI
-
Une collision entre deux trains fait cinq blessés graves au Danemark
-
Le prince Harry en visite surprise à Kiev
-
Top 14: multi-commotionné, Haddad (La Rochelle) regoûte au plaisir du rugby
-
Au Japon, les maîtres perruquiers donnent vie à la scène
-
La Bourse de Paris entrainée par des résultats d'entreprises salués
-
Zone euro: l'activité du secteur privé flanche en avril, freinée par le Moyen-Orient
-
Google lance deux nouvelles puces pour s'adapter à l'ère des agents IA
-
Quatre morts dans des frappes en Ukraine, deux en Russie
-
Samsung: des dizaines de milliers de salariés manifestent pour des hausses de salaire
-
Propulsé par son moteur phare, Safran démarre fort l'année malgré les incertitudes au Moyen-Orient
-
Play-offs NBA: OKC éteint Phoenix, Détroit égalise contre Orlando
-
Cyclisme: Paul Seixas, "l'élu", et alors ?
-
Bangladesh: des pirates rançonnent ceux qui s'aventurent dans la mangrove
-
Une collision entre deux trains fait plusieurs blessés au Danemark
-
À Abidjan, le difficile combat pour la propreté des rues
-
"Cendrier du Pacifique": au Fidji, un projet d'incinérateur inquiète
-
Plainte pour "traite d'êtres humains" contre Deliveroo et Uber Eats
-
A Montauban, hommage national à Florian Montorio, Casque bleu français tué au Liban
-
Cyril Féraud devient le nouvel animateur de "Fort Boyard", son "rêve d'enfant"
-
Le "made in China" rêve d'une embellie avec la visite de Trump
-
Futur chef de l'ONU: pour les quatre candidats, priorité à la paix
-
Prêt quasi débloqué, Zelensky attendu à Chypre pour un sommet européen
-
Mexique: réouverture du site de Teotihuacán après une attaque armée
-
Le Liban va demander de prolonger la trêve lors de pourparlers avec Israël à Washington
-
Les ministres du G7 à Paris pour parler d'environnement... en évitant les sujets qui fâchent
-
Pérou : démissions au sommet de l'Etat en pleine controverse sur l'achat d'avions F-16
-
Akkodis reconnu comme "leader" dans le rapport ISG Provider Lens™ 2026 consacré aux services d'ingénierie numérique
-
Traversées irrégulières de la Manche: nouvel accord franco-britannique conclu
-
Dans une prison de Guinée équatoriale, le pape, le déluge et la peinture fraîche
-
Espagne: le Barça repousse encore le Real mais perd Yamal
-
Tesla annonce des résultats en hausse au 1T, meilleurs qu'attendu
-
Coupe de France: Nice surprend Strasbourg (2-0) et rejoint Lens en finale
-
L'Iran saisit deux navires dans le détroit d'Ormuz, Washington minimise
-
Tesla dépasse les attentes au premier trimestre, l'action en hausse
-
Wall Street en forme, l'optimisme règne
-
Ligue 1: le PSG se balade contre Nantes et prend ses distances avec Lens
-
En Guinée équatoriale, le pape appelle au "respect des droits de chaque citoyen"
-
Foot: Rosenior à Chelsea, 23 matches et puis s'en va
-
Migrants expulsés des États-Unis vers la RDC: "Je ne voulais pas aller au Congo"
-
La Bourse de Paris termine dans le rouge après une salve de résultats
-
Flèche Wallonne femmes: Demi Vollering impériale au sommet du Mur de Huy
-
Boeing amoindrit sa perte nette au 1er trimestre grâce au rebond des livraisons
-
Les Bourses mondiales partagées entre risque géopolitique et résultats d'entreprises
-
Flèche Wallonne femmes: victoire de Demi Vollering
-
Rugby: Bielle-Biarrey et Jalibert nommés pour le joueur de l'année en Champions Cup
-
Flèche Wallonne: Seixas toujours plus fort
-
L'Iran annonce avoir saisi deux navires dans le détroit d'Ormuz malgré la prolongation de la trêve
Google lance deux nouvelles puces pour s'adapter à l'ère des agents IA
Google a dévoilé mercredi deux nouvelles puces pour l'intelligence artificielle (IA), l'une pour entraîner les puissants nouveaux modèles d'IA générative, l'autre pour l'usage rapide et économique du quotidien, dont la demande pourrait exploser avec le rapide déploiement mondial des agents IA autonomes.
Google rejoint ainsi Amazon, qui a adopté dès 2018 cette même stratégie de distinction d'usage des puces, et fait un pas de plus dans sa quête d'une moindre dépendance de Nvidia, qui contrôle environ 80% du marché mondial des puces pour centres de données IA.
Cette 8e génération des Tensor Processing Unit (TPU), les processeurs maisons de Google, a été présentée mercredi à Las Vegas, lors de la conférence annuelle de Google Cloud, la division des services d'informatique à distance (cloud) du géant de Mountain View (Californie).
Cette nouvelle génération est pour la première fois constituée de deux composants distincts: les TPU 8t, conçues pour l'entraînement long et coûteux des modèles d'IA générative, et les TPU 8i, destinées à l'inférence, c'est-à-dire les multiples interactions d'usage d'un utilisateur ou d'un agent IA autonome, nécessitant rapidité et sobriété énergétique donc économique.
Ces deux puces, conçues en partenariat avec le fabricant de semi-conducteurs Broadcom, "seront disponibles plus tard cette année", a indiqué Thomas Kurian, le patron de Google Cloud.
Cette distinction reflète une réalité nouvelle: un agent IA autonome enchaîne des dizaines d'actions sans intervention humaine, générant bien plus d'opérations de calcul que le dialogue humain avec les assistants comme Gemini, ChatGPT, Claude ou Le Chat.
Les nouvelles puces d'exécution TPU 8i sont donc conçues pour "assurer le débit massif et la faible latence (temps de réaction) nécessaires pour faire tourner des millions d'agents simultanément, à moindre coût", a écrit mercredi Sundar Pichai, PDG d'Alphabet, maison mère de Google, dans un billet de blog.
Google revendique des performances 2,8 fois meilleures pour l'entraînement et un coût réduit de 80% à performances équivalentes à la génération précédente.
En janvier, le leader Nvidia avait annoncé le lancement de la production de ses nouvelles puces Vera et Rubin, affichant des performances jusqu'à cinq fois supérieures à la génération précédente.
Amazon, premier acteur mondial du cloud avec sa filiale AWS, avait de son côté dévoilé en décembre sa Trainium 3, une puce conçue elle aussi pour réduire la dépendance de ses clients aux GPU (processeurs graphiques) de Nvidia, avec un coût d'entraînement et d'inférence réduit jusqu'à 50% selon le groupe.
Google, Amazon et Microsoft continuent néanmoins d'intégrer les GPU de Nvidia dans leurs infrastructures, aucun n'envisageant de s'en passer entièrement à court terme.
O.Karlsson--AMWN