ChatGPT, Perplexity, Gemini AI 트래픽 추적 방법
GA4 에서 LLM AI 트래픽 추적: 리퍼러 시그니처, 커스텀 채널 그룹, UTM 규칙, 그리고 Prompt Architect 의 2026 측정 스택.
ChatGPT, Perplexity, Google Gemini 는 이미 대부분의 B2B 사이트에 추천 트래픽을 보내지만, 기본 GA4 설정은 그 거의 전부를 "Direct" 나 "Unassigned" 로 분류합니다. 이 가이드는 Prompt Architect 가 2026 년에 LLM (대형 언어 모델) 에서 오는 AI 트래픽을 추적하는 방법을 보여줍니다 — 감시할 리퍼러 시그니처, 그것들을 잡는 GA4 커스텀 채널 그룹, 챗을 통한 왕복에서 살아남는 UTM 위생, 그리고 GA4 가 볼 수 없는 부분을 채우는 인용 측면 측정입니다.
왜 AI 트래픽이 기본적으로 "Direct" 로 보이는가
LLM 의 추천 동작은 GA4 가 설계될 때 가정했던 전제를 깨뜨립니다. ChatGPT search 는 인용 링크를 새 탭에서 열고 가끔 리퍼러를 제거합니다. Perplexity 는 리퍼러를 보존하지만 GA4 기본 채널 그룹이 알려진 소스로 분류하지 않는 호스트네임 (www.perplexity.ai) 을 사용합니다. Gemini 의 동작은 사이드바 인용에서 왔는지 인라인 Overview 링크에서 왔는지에 따라 또 다릅니다.
Sparktoro 의 AI 트래픽 추천 소스 분석 에 따르면 B2B 사이트에서 GA4 가 "Direct" 로 분류하는 트래픽의 의미 있는 부분이 실제로는 LLM 추천이나 공유 링크 트래픽에 귀속됩니다. 리퍼러를 명시적으로 분류하기 전까지는 정작 중요한 질문 — "우리 파이프라인 중 얼마가 AI 표면에서 오는가?" — 에 답할 수 없습니다.
1 단계: 리퍼러 시그니처를 알아두기
다음은 2026 년에 "AI Assistants" 로 분류하는 호스트네임과 시그니처의 작업용 목록입니다. 새 엔진이 출시될 때마다 분기별로 업데이트하세요.
| 엔진 | 호스트네임 | 비고 |
|---|---|---|
| ChatGPT | chat.openai.com, chatgpt.com | 가끔 리퍼러가 제거됨; 랜딩 경로의 /?ref=chatgpt.com 패턴 확인. |
| Perplexity | www.perplexity.ai, perplexity.ai | 리퍼러를 일관되게 보존. UTM 친화적. |
| Google Gemini | gemini.google.com | 외부 소스로는 덜 흔함; 주로 Workspace 통합에서 나타남. |
| Microsoft Copilot | copilot.microsoft.com, www.bing.com/chat | Bing 기반; 일부 트래픽은 여전히 bing.com 리퍼러로 흐름. |
| Claude (Anthropic) | claude.ai | 현재 외부 링크 노출은 제한적; 빠르게 성장 중. |
| You.com | you.com | 롱테일 볼륨, 분류할 가치 있음. |
| Phind | www.phind.com | 개발자 중심; 롱테일이지만 의도 높음. |
이를 시작 세트로 다루되 닫힌 목록으로 보지 마세요. 새 엔진 (Grok 웹, Kagi Assistant 등) 이 리퍼러 로그에 들어오면 추가하세요.
2 단계: GA4 커스텀 채널 그룹 만들기
GA4 는 "AI Assistants" 채널이 없는 "Default channel group" 을 기본 제공합니다. 직접 만들어야 합니다. Google 의 커스텀 채널 그룹 공식 문서 가 UI 를 안내합니다. Prompt Architect 에서 쓰는 규칙은 다음과 같습니다.
채널 이름: AI Assistants
조건 (OR):
- Source matches regex:
^(chatgpt\.com|chat\.openai\.com|www\.perplexity\.ai|perplexity\.ai|gemini\.google\.com|copilot\.microsoft\.com|claude\.ai|you\.com|www\.phind\.com)$
채널 그룹 순서에서 이 규칙을 "Organic Search" 위에 두세요. 리퍼러가 bing.com/chat 일 때 AI 트래픽이 Google Organic 으로 잘못 분류되지 않도록 하기 위해서입니다. GA4 는 규칙을 위에서 아래로 평가하고 첫 매칭을 할당하므로 순서가 중요합니다.
채널이 생기면 임원실 질문 — "이번 주, 이번 달, 이번 분기에 AI 어시스턴트에서 온 세션 비율은?" — 에 답할 수 있는 지표가 생깁니다. Prompt Architect 가 온보딩한 대부분의 B2B 사이트에서 이 숫자는 2026 년 중반 기준 2 ~ 8% 사이에 있고, 분기마다 3 ~ 6 포인트씩 증가합니다.
3 단계: 외부 링크의 UTM 위생 강제
LLM 인용은 예측 불가능합니다. ChatGPT 가 UTM 을 붙이도록 만들 수는 없습니다. 하지만 LLM 이 결국 가리키는 모든 링크 (블로그 글, 랜딩 페이지, 문서) 가 UTM 기본값으로 자신의 인바운드 채널을 자기 기술 (self-describe) 하도록 만들 수 있습니다. 그러면 리퍼러가 제거되어도 랜딩 URL 자체가 충분한 신호를 담습니다.
PA 가 소유한 표면에서 PA 가 소유한 페이지로 가는 모든 내부 링크에 적용하는 규칙은 다음과 같습니다.
- 내부 내비 링크: UTM 없음 (내부 어트리뷰션을 오염시킴).
- 이메일 또는 LinkedIn 발신 링크: 우리가 소유한
utm_source와utm_campaign태그. - 외부 표면의 정식 인용: 리퍼러에 의존하되,
referrer-policy: no-referrer-when-downgrade를 폴백으로 두어 HTTPS-to-HTTPS 가 소스를 보존하도록.
리퍼러가 제거되면 (ChatGPT search 가 가끔 그러함), 남는 신호는 랜딩 URL 과 user-agent 뿐입니다. 두 가지 모두 page_location 과 user_agent 의 커스텀 디멘션으로 GA4 에 캡처하세요. 여러 B2B 브랜드가 ChatGPT Operator 와 유사한 에이전트의 user-agent 문자열이 이제 직접 분류할 만큼 충분히 구별된다고 보고합니다.
4 단계: 클릭 측면만이 아니라 인용 측면을 측정
GA4 는 실제로 사이트에 도착한 트래픽만 볼 수 있습니다. ChatGPT 가 대신 경쟁사 페이지를 인용했다는 사실은 알려주지 않습니다. Perplexity 가 클릭 없는 답변에서 브랜드를 언급했다는 사실도 알려주지 않습니다. 그 간격이 트래픽 측정과 가시성 측정의 차이이며, 대부분의 팀이 GA4 와 Prompt Architect 같은 인용 트래커를 함께 쓰는 이유입니다.
2026 년의 완전한 AI 트래픽 측정 스택은 두 절반으로 구성됩니다.
클릭 측면 (GA4): AI 어시스턴트 리퍼러에서 도착한 사용자의 세션, 전환, 후행 행동.
인용 측면 (PA 또는 유사): ChatGPT, Perplexity, Gemini 에 걸친 50 ~ 200 개 우선순위 프롬프트의 주간 샘플. 답변 중 몇 %가 브랜드를 인용하는가? 몇 %가 경쟁사를 인용하는가? 어떤 페이지가 인용되고 어떤 페이지가 안 되는가? 도메인에 대한 인용 측면을 한 번에 보려면 /diagnosis 무료 인용 감사 를 실행하세요.
인용 측면 없이는 클릭하는 5% 사용자에 최적화하고 챗을 떠나지 않는 95% 를 무시하게 됩니다. 두 절반을 함께 연결하면 인용률 상승과 트래픽 상승을 연결해 GEO ROI 를 정직하게 측정할 수 있습니다.
자주 보는 실수
팀이 AI 트래픽을 처음 계측할 때 반복적으로 보이는 5 가지 실수입니다.
- "Direct" 를 베이스라인으로 신뢰. 대부분의 B2B 사이트에서 "Direct" 의 의미 있는 부분은 잘못 분류된 AI 리퍼러 트래픽입니다. 결론을 내리기 전에 커스텀 채널 그룹을 먼저 만드세요.
- 세션이 아닌 노출만 집계. AI 답변은 클릭 없이도 브랜드를 언급할 수 있습니다. 세션 점유율이 아닌 인용 점유율이 상위 깔때기 지표입니다.
- AI 와 SEO 를 한 버킷에 섞기. AI Assistants 와 Organic Search 는 행동이 다릅니다. 전환율, 페이지 경로, 체류 시간 모두 갈립니다. 별도로 보고하세요.
- User-agent 무시. OpenAI, Anthropic, Perplexity, Google AI 표면 (Googlebot 과 별개) 의 크롤러 user-agent 가 점점 구별 가능해지고 있습니다. 세션 카운트에서 필터링하거나 명시적으로 분류하세요. Google 의 Search Central 봇 트래픽 문서 가 비-AI 크롤러의 정식 접근을 설명하고, 여기에도 깔끔하게 적용됩니다.
- 한 번 설정하고 잊기. 분기마다 새 엔진이 나옵니다. 90 일마다 채널 그룹 규칙을 감사하세요.
AI 트래픽 측정은 어디로 가는가
GA4 가 결국 AI Assistants 채널을 기본 제공할 것입니다. 그때까지는 직접 만드는 일입니다. 서버 측 분석 플랫폼 (PostHog, Plausible, Fathom) 은 이미 커스텀 규칙으로 Perplexity 와 ChatGPT 를 깔끔하게 분류합니다. 더 장기적인 변화는 세션 집계에서 인용 집계 중심 KPI 로의 이동입니다. 세션은 결과이고, 인용은 원인입니다.
다음 글을 이메일로 받기
Answer Engine Optimization 에 대한 주 1편 앵커 콘텐츠. 채우기 없음.
Related
GEO란? 생성형 엔진 최적화 완벽 정리 (2026)
Generative Engine Optimization (GEO) 정의: AEO 및 SEO 와의 차이, 2026 년 AI 답변 안에서 인용을 얻기 위한 실행 플레이북.
bestPracticesAEO vs SEO: 무엇이 다른가? (2026 가이드)
AEO 와 SEO 의 차이: 2026 년 답변 엔진 최적화가 SEO 와 어떻게 다른지, 7 가지 핵심 차이점과 4 가지 공통점, 의사결정 매트릭스로 정리.
bestPracticesAI 시대의 Share of Voice: LLM 안에서 브랜드 가시성을 측정하는 법
AI 시대의 SoV 는 고정 프롬프트 셋에서 브랜드가 인용된 답변의 비율입니다. 공식, 30 일 측정 플랜, 숫자를 왜곡하는 세 가지 함정을 정리했습니다.