Sommaire
Google vient d’annoncer Gemini Embedding 2, un nouveau modèle d’embeddings multimodal disponible dans la Gemini API et la Gemini Enterprise Agent Platform.
Notre agence d’intelligence artificielle a donc voulu faire le point sur le fonctionnement, la pertinence et les applications concrètes en SEO et GEO de ce nouveau modèle vectoriel.
Glissons ça sous la loupe… 🔍
C’est quoi un modèle d’embeddings?
Un embedding, c’est une représentation vectorielle générée pour un contenu.
Exemple simple avec une requête et une page:
- Requête: « agence audit GEO »
- Page: une page service sur l’audit GEO
- Le modèle transforme les deux en vecteurs
- L’outil compare ensuite ces vecteurs pour voir s’ils sont proches sémantiquement
C’est cette transformation en vecteurs qui permet à un système de comparer des contenus selon leur sens, pas seulement selon les mots qu’ils contiennent.
Un outil basé sur des embeddings peut, par exemple, comparer:
- Une requête avec une page
- Un mot-clé avec un paragraphe
- Deux pages entre elles
- Une question avec plusieurs documents textuels
- Un prompt avec une base de contenus internes
- etc.
L’idée? Dépasser la simple correspondance de mots-clés pour relier des contenus selon leur sens, leur contexte ou l’intention à laquelle ils répondent.
La nouveauté: un modèle d’embeddings vraiment multimodal
La nouveauté de Gemini Embedding 2, c’est que cette logique ne s’applique pas seulement au texte. Google indique que c’est le premier modèle d’embeddings dans l’API Gemini capable de mapper texte, images, vidéo, audio et documents dans un même espace sémantique (et dans plus de 100 langues).
Le modèle peut aussi analyser plusieurs formats dans une seule requête, avec des limites allant jusqu’à 8 192 tokens de texte, 6 images, 120 secondes de vidéo, 180 secondes d’audio ou 6 pages PDF.
Si on reprend la logique expliquée plus haut, Gemini Embedding 2 permet désormais à un outil de comparer:
- Une requête texte avec une image
- Une question avec un PDF
- Un prompt GEO avec une vidéo
- Une page de service avec un guide téléchargeable
- Un visuel produit avec un catalogue
- Une transcription audio avec une bibliothèque de contenus internes
Pour les développeurs, ça simplifie le marketing automation et la construction d’outils de recherche multimodale, de clustering, de classification ou de RAG.
À quoi sert le nouveau Gemini Embedding 2 exactement?
Côté usages, Google parle de cas concrets pour les développeurs: RAG multimodal, recherche visuelle, reranking, clustering, classification, similarité sémantique et détection d’anomalies.
Le modèle peut aussi être utilisé avec des préfixes de tâches comme question answering, fact checking, code retrieval ou search result, afin d’adapter les embeddings au besoin.
En SEO et GEO, l’intérêt est opérationnel: ce type de modèle peut servir à créer des outils capables d’analyser une présence organique au-delà des pages web classiques.
Un expert pourrait s’en servir pour:
- Faire une recherche de mots-clés approfondie et clusteriser les mots-clés par intention réelle
- Comparer une requête ou un prompt GEO avec les contenus d’un site
- Regrouper des pages, PDF, visuels, vidéos ou ressources internes autour d’un même sujet
- Détecter des gaps sémantiques entre les intentions recherchées et les contenus disponibles
- Repérer les sujets bien couverts en texte, mais peu soutenus par d’autres formats
- Comparer les contenus d’un client et de ses concurrents au-delà des pages web
- Chercher dans des études, PDF, briefs ou cas clients
- Reranker des sources internes avant de générer une réponse
- Construire un RAG interne basé sur les contenus propriétaires d’une marque
Autre point utile pour les gros sites: Gemini Embedding 2 permet d’ajuster la taille des vecteurs générés, de 3 072 à 1 536 ou 768 dimensions, afin de mieux équilibrer qualité, coûts de stockage et rapidité de recherche.
Exemple concret
Pour analyser un marché autour d’un sujet comme pour pour une nouvelle offre pour « audit GEO ». Une agence pourrait, dans ce cas, mapper les contenus d’un client et de ses concurrents au-delà des pages web: articles, pages de service, études, vidéos, visuels, PDF, guides ou ressources téléchargeables.
L’objectif? Voir qui occupe vraiment quels territoires sémantiques, quels formats soutiennent le mieux chaque intention et quels angles restent à couvrir.
Ce qu’il faut retenir de l’arrivée de Gemini Embedding 2
Gemini Embedding 2 ne change pas directement le SEO, mais il rend disponible une brique technique importante pour la prochaine génération d’outils SEO et GEO, d’analyse, de recherche, d’automatisation et d’agent IA.
Son intérêt n’est pas seulement de comparer des mots-clés, des pages ou des documents textuels. C’est de pouvoir analyser plus largement les contenus qui construisent la visibilité d’une marque, qu’il s’agisse de pages web, de PDF, d’images, de vidéos, d’audio ou de ressources internes.
Pour les équipes SEO/GEO, ça ouvre la porte à des analyses plus complètes des intentions, des territoires sémantiques, des gaps de contenu et des formats à renforcer dans une stratégie de communication (et de visibilité holistique!) de plus en plus multimodale.
👉 Besoin d’un coup de pouce pour structurer vos analyses SEO/GEO? Contactez-nous pour en discuter lors d’une évaluation gratuite! Nos experts en IA, Web Analytics & GA4 se feront un plaisir de vous aider à booster votre visibilité… et votre ROI! 😉