Comment suivre le trafic IA de ChatGPT, Perplexity et Gemini
Suivre le trafic IA des LLMs dans GA4 : signatures de referrer, groupes de canaux personnalisés, règles UTM et stack de mesure 2026 de Prompt Architect.
ChatGPT, Perplexity et Google Gemini envoient déjà du trafic de référence sur la plupart des sites B2B, mais la configuration GA4 par défaut classe presque tout cela en "Direct" ou "Unassigned". Ce guide montre comment Prompt Architect suit le trafic IA des grands modèles de langage (LLMs) en 2026 : les signatures de referrer à surveiller, le groupe de canaux personnalisé GA4 qui les capture, l'hygiène UTM qui survit à l'aller-retour par le chat, et la mesure côté citation qui comble les angles morts de GA4.
Pourquoi le trafic IA ressemble à "Direct" par défaut
Le comportement de référence des LLMs casse les hypothèses sur lesquelles GA4 a été construit. ChatGPT search ouvre les liens de citation dans un nouvel onglet et retire parfois le referrer. Perplexity préserve les referrers mais utilise un hostname (www.perplexity.ai) que le groupe de canaux par défaut de GA4 ne classe pas comme source connue. Le comportement de Gemini diffère encore selon que le lien provient d'une citation en sidebar ou d'un lien inline dans un Overview.
L'analyse des sources de référence pour le trafic IA de Sparktoro a constaté qu'une part significative de ce que GA4 appelle "Direct" sur les sites B2B est en réalité attribuable à des referrals LLM ou à du trafic de lien partagé. Tant que vous ne classez pas les referrers explicitement, vous ne pouvez pas répondre à la seule question qui compte : quelle part de votre pipeline provient des surfaces IA ?
Étape 1 : connaître les signatures de referrer
Ci-dessous la liste opérationnelle des hostnames et signatures que nous classons comme "AI Assistants" en 2026. À mettre à jour chaque trimestre à mesure que de nouveaux moteurs sortent.
| Moteur | Hostnames | Notes |
|---|---|---|
| ChatGPT | chat.openai.com, chatgpt.com | Parfois referrer retiré ; vérifier le chemin de landing pour les motifs /?ref=chatgpt.com. |
| Perplexity | www.perplexity.ai, perplexity.ai | Préserve le referrer de manière cohérente. Compatible UTM. |
| Google Gemini | gemini.google.com | Moins courant comme source sortante ; apparaît surtout depuis les intégrations Workspace. |
| Microsoft Copilot | copilot.microsoft.com, www.bing.com/chat | Basé sur Bing ; une partie du trafic passe encore par le referrer bing.com. |
| Claude (Anthropic) | claude.ai | Surfaçage de liens sortants limité aujourd'hui ; en croissance rapide. |
| You.com | you.com | Volume long-tail, ça vaut la peine de classifier. |
| Phind | www.phind.com | Focalisé développeur ; long-tail mais forte intention. |
Traitez ceci comme un ensemble de départ, pas comme une liste fermée. Ajoutez les nouveaux moteurs (Grok web, Kagi Assistant, etc.) à mesure qu'ils apparaissent dans vos logs de referrer.
Étape 2 : construire le groupe de canaux personnalisé GA4
GA4 expédie un "Default channel group" qui n'inclut pas de canal "AI Assistants". Il faut le construire. La documentation officielle de Google sur les groupes de canaux personnalisés guide à travers l'UI ; la règle que nous utilisons chez Prompt Architect est :
Nom du canal : AI Assistants
Conditions (OU) :
- Source matches regex :
^(chatgpt\.com|chat\.openai\.com|www\.perplexity\.ai|perplexity\.ai|gemini\.google\.com|copilot\.microsoft\.com|claude\.ai|you\.com|www\.phind\.com)$
Placez la règle au-dessus de "Organic Search" dans l'ordre de votre groupe de canaux pour que le trafic IA ne soit pas mal classé en Google Organic lorsque le referrer se trouve être bing.com/chat. L'ordre compte parce que GA4 évalue les règles de haut en bas et attribue la première correspondance.
Une fois le canal créé, vous obtenez la métrique qui répond vraiment à la question du board : "Quelle part de nos sessions est venue d'assistants IA cette semaine, ce mois, ce trimestre ?". La plupart des sites B2B que nous onboardons voient ce chiffre s'établir entre 2 et 8 pour cent à mi-2026, avec une croissance de 3 à 6 points par trimestre.
Étape 3 : imposer l'hygiène UTM sur les liens sortants
Les citations LLM sont imprévisibles. Vous ne pouvez pas forcer ChatGPT à ajouter un UTM. Mais vous pouvez faire en sorte que chaque lien vers lequel le LLM finit par pointer (vos articles de blog, vos landing pages, vos docs) auto-décrive son canal entrant via des UTMs par défaut, de sorte que même quand le referrer est retiré, l'URL d'atterrissage porte assez de signal.
Voici la règle que nous appliquons sur chaque lien interne depuis les surfaces PA vers les pages PA :
- Liens de nav internes : pas d'UTMs (ils polluent l'attribution interne).
- Liens sortants depuis email ou LinkedIn : tagués avec
utm_sourceetutm_campaignque nous possédons. - Citations canoniques depuis surfaces externes : se reposer sur le referrer, avec un fallback
referrer-policy: no-referrer-when-downgradepour que HTTPS-vers-HTTPS préserve la source.
Quand le referrer est retiré (ChatGPT search le fait occasionnellement), le seul signal qui reste est l'URL d'atterrissage et le user-agent. Capturez les deux dans GA4 via une dimension personnalisée sur page_location et user_agent. Plusieurs marques B2B rapportent que la chaîne user-agent de ChatGPT Operator et d'agents similaires est désormais suffisamment distincte pour être classifiée directement.
Étape 4 : mesurer le côté citation, pas seulement le côté clic
GA4 ne voit que le trafic qui a effectivement atterri sur votre site. Il ne vous dit pas que ChatGPT a cité la page de votre concurrent à la place, ni que Perplexity a mentionné votre marque dans une réponse sans qu'aucun clic ne suive. Cet écart est la différence entre mesure de trafic et mesure de visibilité, et c'est la raison pour laquelle la plupart des équipes couplent GA4 avec un tracker de citations comme Prompt Architect.
Un stack complet de mesure du trafic IA en 2026 a deux moitiés :
Côté clic (GA4) : sessions, conversions, comportement aval des utilisateurs ayant atterri depuis un referrer d'assistant IA.
Côté citation (PA ou équivalent) : échantillon hebdomadaire de 50 à 200 prompts prioritaires sur ChatGPT, Perplexity et Gemini. Quelle part des réponses cite votre marque ? Quelle part cite un concurrent ? Quelles pages de votre site sont citées et lesquelles ne le sont pas ? Lancez un audit de citations gratuit sur /diagnosis pour voir le côté citation de votre domaine en un clic.
Sans le côté citation, vous optimisez pour les 5 pour cent qui cliquent et ignorez les 95 pour cent qui ne quittent jamais le chat. Avec les deux moitiés câblées ensemble, vous pouvez connecter la hausse des citations à la hausse de trafic et mesurer honnêtement le ROI du GEO.
Erreurs courantes
Cinq erreurs que nous voyons régulièrement quand les équipes instrumentent le trafic IA pour la première fois :
- Faire confiance à "Direct" comme baseline. Une part significative de "Direct" sur la plupart des sites B2B est du trafic referrer IA mal classé. Construisez le groupe de canaux personnalisé avant de tirer des conclusions.
- Compter des impressions et non des sessions. Les réponses IA peuvent mentionner votre marque sans envoyer de clic. La part de citation, pas la part de session, est la métrique amont.
- Mélanger IA et SEO dans un même seau. AI Assistants et Organic Search se comportent différemment. Taux de conversion, chemins de page et temps passé divergent tous. Reportez-les séparément.
- Ignorer le user-agent. Les user-agents des crawlers d'OpenAI, Anthropic, Perplexity et de la surface IA de Google (distinct de Googlebot) sont de plus en plus distincts. Filtrez-les des comptes de session ou classifiez-les explicitement. La documentation Search Central de Google sur le trafic de bot explique l'approche canonique pour les crawlers non IA et s'applique proprement ici.
- Configurer une fois, puis oublier. De nouveaux moteurs sortent chaque trimestre. Auditez vos règles de groupe de canaux tous les 90 jours.
Où va la mesure du trafic IA
GA4 finira par expédier un canal AI Assistants par défaut ; en attendant, c'est un travail à construire soi-même. Les plateformes d'analytics côté serveur (PostHog, Plausible, Fathom) classifient déjà Perplexity et ChatGPT proprement via des règles personnalisées. Le glissement à plus long terme, toutefois, est de quitter le décompte de sessions pour le décompte de citations comme KPI primaire. La session est la conséquence ; la citation est la cause.
Recevoir le prochain article par e-mail
Un article ancre par semaine sur l'Answer Engine Optimization. Sans remplissage.
Related
Qu'est-ce que le GEO ? Generative Engine Optimization (2026)
Generative Engine Optimization (GEO) défini : ce que c'est, en quoi il diffère de l'AEO et du SEO, et le playbook 2026 pour gagner des citations dans les réponses IA.
bestPracticesAEO vs SEO : quelle est la différence ? (Guide 2026)
AEO vs SEO comparés : en quoi l'Answer Engine Optimization diffère du SEO en 2026 — 7 divergences clés, 4 recouvrements, matrice de décision.
bestPracticesShare of Voice dans l'IA : mesurer la visibilité de marque dans les LLM
Le Share of Voice dans l'IA est la part des réponses LLM qui citent votre marque. Voici la formule, un plan de mesure sur 30 jours et les trois pièges qui faussent le chiffre.