Glossaire GEO

Tous les termes du GEO,
définis en clair.

48 termes essentiels du Generative Engine Optimization, classés par catégorie. Disciplines, moteurs IA, technique on-site, données structurées, mesure, concepts. Définitions courtes, sans jargon inutile.

Catégorie · 01

Disciplines

AEO

· Answer Engine Optimization

Answer Engine Optimization. Optimisation pour les moteurs de réponse qui produisent une réponse extraite d'une page (Featured Snippets Google, AI Overviews). Antérieur au GEO, focalisé sur les réponses extractives plutôt que génératives.

AIO

· AI Optimization

AI Optimization. Terme parapluie utilisé par certains acteurs pour désigner l'optimisation pour l'ensemble des surfaces IA (génératives et extractives). Souvent synonyme de GEO + AEO combinés.

GEO

· Generative Engine Optimization

Generative Engine Optimization. Ensemble des pratiques qui optimisent la visibilité d'une marque dans les réponses générées par les IA (ChatGPT, Perplexity, Gemini, Microsoft Copilot). Le terme a été formalisé en 2023 par un article académique d'Aggarwal et al. (arXiv:2311.09735).

SEA

· Search Engine Advertising

Search Engine Advertising. Achat d'espace publicitaire sur les moteurs de recherche (Google Ads, Microsoft Advertising). Coût au clic (CPC), ciblage par requêtes.

SEO

· Search Engine Optimization

Search Engine Optimization. Optimisation pour les moteurs de recherche traditionnels (Google, Bing) qui retournent des listes de liens. Vise le classement (positions 1-10) sur des mots-clés.

Catégorie · 02

Moteurs IA

AI Overviews

Réponses générées par IA affichées en haut des résultats Google Search. Utilisent Gemini pour synthétiser une réponse à partir des pages indexées. Déployées progressivement depuis 2024.

ChatGPT

Assistant IA conversationnel développé par OpenAI, lancé en novembre 2022. Basé sur les modèles GPT-4, GPT-4o et GPT-5. Inclut une fonction recherche web (ChatGPT Search) qui ajoute des citations en temps réel via Bing.

Claude (Anthropic)

Famille de modèles IA développée par Anthropic. Claude AI dispose d'une fonction recherche web et est accessible via claude.ai et l'API. Entreprise basée à San Francisco.

Featured Snippet

Encadré de réponse en position zéro de Google, extrait d'une page indexée. Précurseur des AI Overviews, basé sur l'extraction et non la génération.

Gemini

Famille de modèles IA développée par Google, intégrée dans Gemini.app et dans les AI Overviews de Google Search. Combine corpus d'entraînement et résultats de recherche Google en temps réel.

Microsoft Copilot

Assistant IA Microsoft, anciennement Bing Chat. Utilise les modèles GPT-4 d'OpenAI couplés à la recherche Bing en temps réel. Intégré dans Windows, Microsoft 365 et la barre de tâches.

Perplexity

Moteur de recherche conversationnel lancé en 2022. Effectue une recherche web en direct à chaque requête et cite systématiquement ses sources avec liens. C'est le moteur IA le plus rapide à indexer un nouveau contenu (1-2 semaines).

SearchGPT

Moteur de recherche IA développé par OpenAI, intégré progressivement à ChatGPT. Effectue une recherche web temps réel et cite ses sources avec liens, en alternative à Google.

Catégorie · 03

Technique on-site

ClaudeBot

Crawler d'Anthropic pour l'entraînement et la recherche web de Claude. À autoriser dans robots.txt.

Cloaking IA

Pratique consistant à servir un contenu différencié pour les bots IA (page exhaustive structurée) et les humains (page UX classique), via détection User-Agent ou redirection JavaScript. Toléré tant que l'information reste cohérente.

Crawler

· ou bot, ou spider

Programme automatisé qui parcourt le web pour indexer les pages. Chaque moteur (Google, Bing, ChatGPT, Perplexity) a ses propres crawlers identifiés par leur User-Agent.

Google-Extended

User-Agent introduit par Google en 2023 pour le contrôle dédié de l'utilisation des contenus dans Bard/Gemini et VertexAI. À autoriser explicitement pour participer à Gemini.

GPTBot

Crawler officiel d'OpenAI pour la collecte de données d'entraînement. Identifié par son User-Agent GPTBot. Doit être autorisé dans le robots.txt pour participer à l'entraînement des modèles GPT.

IndexNow

Protocole d'indexation accélérée poussé par Microsoft et Yandex. Notifie immédiatement les moteurs de recherche d'un changement de contenu, sans attendre le passage du crawler.

JSON-LD

JavaScript Object Notation for Linked Data. Format recommandé par Google pour intégrer du Schema.org dans une page web, sous forme de bloc JSON encapsulé dans une balise script type=application/ld+json.

llms-full.txt

Variante étendue du llms.txt qui contient l'intégralité du contenu pertinent d'un site, concaténé en un seul fichier markdown. Utile pour les LLMs qui ingèrent un site complet.

llms.txt

Fichier texte placé à la racine d'un site, qui décrit l'entité et son contenu aux Large Language Models. Spécification créée en 2024 par Jeremy Howard (llmstxt.org). Format markdown structuré, complémentaire au robots.txt.

PerplexityBot

Crawler de Perplexity AI pour l'indexation temps réel. À autoriser dans robots.txt si vous voulez apparaître dans les réponses Perplexity.

robots.txt

Fichier à la racine d'un site qui indique aux crawlers les zones autorisées ou bloquées. Pour le GEO, on y ajoute explicitement les User-Agents des bots IA (GPTBot, PerplexityBot, ClaudeBot, etc.) avec autorisation.

Schema.org

Vocabulaire standard de balisage sémantique (Organization, Person, Article, FAQPage, etc.) maintenu par Google, Microsoft, Yahoo et Yandex. Permet de déclarer aux crawlers (et aux IA) la nature et les relations des entités présentes sur une page.

Sitemap

Fichier XML listant toutes les URLs publiques d'un site, leur date de dernière modification et leur priorité relative. Aide les crawlers (humains et IA) à découvrir l'arborescence d'un site.

Catégorie · 04

Données & sémantique

Disambiguation

Distinction d'une entité de ses homonymes. Ex : Trust-UP (cabinet GEO) vs TrustUp.fr (BTP). Se déclare via le champ disambiguatingDescription en Schema.org et via les fiches Wikidata séparées.

Embedding

Représentation vectorielle d'un texte ou d'un concept dans un espace de haute dimension. Les LLMs utilisent les embeddings pour mesurer la similarité sémantique entre une requête et un contenu.

Entité nommée

· Named Entity

Personne, organisation, lieu, produit, concept identifiable de façon unique. Les LLMs utilisent la reconnaissance d'entités (NER) pour comprendre de qui ou de quoi parle un texte.

Fan-out

Mécanisme par lequel un moteur IA décompose une requête en plusieurs sous-requêtes parallèles, agrège les résultats et synthétise une réponse. Les contenus structurés répondant à des sous-questions précises sont avantagés.

Fine-tuning

Entraînement supplémentaire d'un LLM sur un corpus spécifique pour adapter son comportement à un domaine ou un style. Distinct du RAG qui ne modifie pas le modèle.

Hallucination LLM

Production par un LLM d'une information fausse ou inventée présentée avec assurance. Le GEO réduit ce risque en fournissant des sources structurées que le modèle peut citer plutôt qu'inventer.

Knowledge Graph

Graphe de connaissances reliant entités, attributs et relations. Le Knowledge Graph de Google s'affiche dans les panneaux de droite des résultats. Sources : Wikipedia, Wikidata, sites officiels, schémas Organization.

RAG

· Retrieval-Augmented Generation

Architecture qui combine un LLM avec une recherche en base de connaissances. Le modèle génère sa réponse à partir de documents récupérés en temps réel, plutôt que depuis sa seule mémoire d'entraînement. Perplexity et ChatGPT Search reposent sur cette approche.

sameAs

Propriété Schema.org qui pointe vers d'autres représentations de la même entité (LinkedIn, Wikipedia, Wikidata). Renforce l'identification croisée par les crawlers et les LLMs.

Token

Unité de découpage du texte par un LLM. Un mot peut faire 1 à 4 tokens selon la langue. La longueur d'une fenêtre de contexte se mesure en tokens (ex : 128k, 1M).

Wikidata

Base de données collaborative liée à Wikipedia, format structuré en triplets RDF. Chaque entité dispose d'un identifiant unique (Q-number). Les LLMs y puisent massivement pour ancrer leur connaissance des entités.

Catégorie · 05

Mesure & autorité

Backlink

Lien entrant depuis un site tiers vers le vôtre. Signal d'autorité historique du SEO, encore pertinent en GEO car la majorité des LLMs s'entraînent sur des textes où les liens conditionnent la fiabilité perçue.

Citation IA

Mention explicite d'une marque dans une réponse générée par un LLM, idéalement avec lien source. C'est l'unité de mesure principale du GEO.

Domain Authority

· DA / DR

Indicateurs propriétaires (Moz DA, Ahrefs DR) qui notent l'autorité d'un domaine sur 100, principalement via le profil de backlinks. Encore utiles en GEO comme proxy d'autorité globale, sans être un signal direct des LLMs.

Prompt

Question ou instruction adressée à un LLM. En GEO, on teste un panier de prompts représentatifs de l'intention d'achat des prospects pour mesurer si la marque est citée.

Score GEO

Mesure synthétique de la visibilité d'une marque dans les réponses IA. Calculé sur des axes comme la fréquence de citation, la qualité du positionnement (mention principale vs secondaire), la cohérence multi-modèles. Trust-UP livre un score sur 100 dans son audit.

Catégorie · 06

Concepts généraux

Autorité sémantique

Capacité d'une entité à être perçue comme une référence légitime sur un sujet précis par les modèles IA. Construite via cohérence multi-canaux, mentions externes, profondeur éditoriale.

Crawl budget

Quantité de pages qu'un crawler peut indexer sur votre site en un temps donné. Optimiser son sitemap, sa vitesse et sa structure interne le maximise.

Densité factuelle

Concentration d'informations vérifiables (chiffres, dates, noms propres, définitions précises) par tranche de texte. Un contenu à haute densité factuelle est mieux absorbé et plus souvent cité par les LLMs.

Entity-based SEO

Approche SEO centrée sur les entités plutôt que les mots-clés. Travaille la cohérence de l'entité nommée à travers les schémas, Wikidata, mentions externes. Précurseur direct du GEO.

Intention de recherche

Objectif sous-jacent d'une requête : informationnel (apprendre), navigationnel (atteindre un site), transactionnel (acheter). Les LLMs servent davantage l'informationnel, où le GEO a le plus de levier.

Longue traîne

· Long-tail

Requêtes peu volumiques mais nombreuses et précises. En GEO, les prompts conversationnels naturels sont par construction de la longue traîne (formulations longues, multiples sous-questions).

Pour aller plus loin

Maintenant que les termes sont clairs, voyons votre situation.

Le simulateur évalue votre score GEO en 2 minutes. L'audit complet teste 200 prompts sur 4 IA en 5 jours.

Faire le simulateur (2 min)Voir la méthodologie

Tous les termes du GEO,définis en clair.