ChatGPT, Perplexity, Gemini AI 트래픽 추적 방법

GA4 에서 LLM AI 트래픽 추적: 리퍼러 시그니처, 커스텀 채널 그룹, UTM 규칙, 그리고 Prompt Architect 의 2026 측정 스택.

Abel Ko2026년 5월 20일15 min read

ChatGPT, Perplexity, Google Gemini 는 이미 대부분의 B2B 사이트에 추천 트래픽을 보내지만, 기본 GA4 설정은 그 거의 전부를 "Direct" 나 "Unassigned" 로 분류합니다. 이 가이드는 Prompt Architect 가 2026 년에 LLM (대형 언어 모델) 에서 오는 AI 트래픽을 추적하는 방법을 보여줍니다 — 감시할 리퍼러 시그니처, 그것들을 잡는 GA4 커스텀 채널 그룹, 챗을 통한 왕복에서 살아남는 UTM 위생, 그리고 GA4 가 볼 수 없는 부분을 채우는 인용 측면 측정입니다.

왜 AI 트래픽이 기본적으로 "Direct" 로 보이는가

LLM 의 추천 동작은 GA4 가 설계될 때 가정했던 전제를 깨뜨립니다. ChatGPT search 는 인용 링크를 새 탭에서 열고 가끔 리퍼러를 제거합니다. Perplexity 는 리퍼러를 보존하지만 GA4 기본 채널 그룹이 알려진 소스로 분류하지 않는 호스트네임 (www.perplexity.ai) 을 사용합니다. Gemini 의 동작은 사이드바 인용에서 왔는지 인라인 Overview 링크에서 왔는지에 따라 또 다릅니다.

Sparktoro 의 AI 트래픽 추천 소스 분석 에 따르면 B2B 사이트에서 GA4 가 "Direct" 로 분류하는 트래픽의 의미 있는 부분이 실제로는 LLM 추천이나 공유 링크 트래픽에 귀속됩니다. 리퍼러를 명시적으로 분류하기 전까지는 정작 중요한 질문 — "우리 파이프라인 중 얼마가 AI 표면에서 오는가?" — 에 답할 수 없습니다.

6.21,000 개 상업용 프롬프트 샘플에서 Perplexity 답변당 평균 인용 수Prompt Architect 내부 패널, 2026 Q1

1 단계: 리퍼러 시그니처를 알아두기

다음은 2026 년에 "AI Assistants" 로 분류하는 호스트네임과 시그니처의 작업용 목록입니다. 새 엔진이 출시될 때마다 분기별로 업데이트하세요.

엔진	호스트네임	비고
ChatGPT	`chat.openai.com`, `chatgpt.com`	가끔 리퍼러가 제거됨; 랜딩 경로의 `/?ref=chatgpt.com` 패턴 확인.
Perplexity	`www.perplexity.ai`, `perplexity.ai`	리퍼러를 일관되게 보존. UTM 친화적.
Google Gemini	`gemini.google.com`	외부 소스로는 덜 흔함; 주로 Workspace 통합에서 나타남.
Microsoft Copilot	`copilot.microsoft.com`, `www.bing.com/chat`	Bing 기반; 일부 트래픽은 여전히 `bing.com` 리퍼러로 흐름.
Claude (Anthropic)	`claude.ai`	현재 외부 링크 노출은 제한적; 빠르게 성장 중.
You.com	`you.com`	롱테일 볼륨, 분류할 가치 있음.
Phind	`www.phind.com`	개발자 중심; 롱테일이지만 의도 높음.

이를 시작 세트로 다루되 닫힌 목록으로 보지 마세요. 새 엔진 (Grok 웹, Kagi Assistant 등) 이 리퍼러 로그에 들어오면 추가하세요.

2 단계: GA4 커스텀 채널 그룹 만들기

GA4 는 "AI Assistants" 채널이 없는 "Default channel group" 을 기본 제공합니다. 직접 만들어야 합니다. Google 의 커스텀 채널 그룹 공식 문서 가 UI 를 안내합니다. Prompt Architect 에서 쓰는 규칙은 다음과 같습니다.

채널 이름: AI Assistants

조건 (OR):

Source matches regex: ^(chatgpt\.com|chat\.openai\.com|www\.perplexity\.ai|perplexity\.ai|gemini\.google\.com|copilot\.microsoft\.com|claude\.ai|you\.com|www\.phind\.com)$

채널 그룹 순서에서 이 규칙을 "Organic Search" 위에 두세요. 리퍼러가 bing.com/chat 일 때 AI 트래픽이 Google Organic 으로 잘못 분류되지 않도록 하기 위해서입니다. GA4 는 규칙을 위에서 아래로 평가하고 첫 매칭을 할당하므로 순서가 중요합니다.

채널이 생기면 임원실 질문 — "이번 주, 이번 달, 이번 분기에 AI 어시스턴트에서 온 세션 비율은?" — 에 답할 수 있는 지표가 생깁니다. Prompt Architect 가 온보딩한 대부분의 B2B 사이트에서 이 숫자는 2026 년 중반 기준 2 ~ 8% 사이에 있고, 분기마다 3 ~ 6 포인트씩 증가합니다.

3 단계: 외부 링크의 UTM 위생 강제

LLM 인용은 예측 불가능합니다. ChatGPT 가 UTM 을 붙이도록 만들 수는 없습니다. 하지만 LLM 이 결국 가리키는 모든 링크 (블로그 글, 랜딩 페이지, 문서) 가 UTM 기본값으로 자신의 인바운드 채널을 자기 기술 (self-describe) 하도록 만들 수 있습니다. 그러면 리퍼러가 제거되어도 랜딩 URL 자체가 충분한 신호를 담습니다.

PA 가 소유한 표면에서 PA 가 소유한 페이지로 가는 모든 내부 링크에 적용하는 규칙은 다음과 같습니다.

내부 내비 링크: UTM 없음 (내부 어트리뷰션을 오염시킴).
이메일 또는 LinkedIn 발신 링크: 우리가 소유한 utm_source 와 utm_campaign 태그.
외부 표면의 정식 인용: 리퍼러에 의존하되, referrer-policy: no-referrer-when-downgrade 를 폴백으로 두어 HTTPS-to-HTTPS 가 소스를 보존하도록.

리퍼러가 제거되면 (ChatGPT search 가 가끔 그러함), 남는 신호는 랜딩 URL 과 user-agent 뿐입니다. 두 가지 모두 page_location 과 user_agent 의 커스텀 디멘션으로 GA4 에 캡처하세요. 여러 B2B 브랜드가 ChatGPT Operator 와 유사한 에이전트의 user-agent 문자열이 이제 직접 분류할 만큼 충분히 구별된다고 보고합니다.

4 단계: 클릭 측면만이 아니라 인용 측면을 측정

GA4 는 실제로 사이트에 도착한 트래픽만 볼 수 있습니다. ChatGPT 가 대신 경쟁사 페이지를 인용했다는 사실은 알려주지 않습니다. Perplexity 가 클릭 없는 답변에서 브랜드를 언급했다는 사실도 알려주지 않습니다. 그 간격이 트래픽 측정과 가시성 측정의 차이이며, 대부분의 팀이 GA4 와 Prompt Architect 같은 인용 트래커를 함께 쓰는 이유입니다.

2026 년의 완전한 AI 트래픽 측정 스택은 두 절반으로 구성됩니다.

클릭 측면 (GA4): AI 어시스턴트 리퍼러에서 도착한 사용자의 세션, 전환, 후행 행동.

인용 측면 (PA 또는 유사): ChatGPT, Perplexity, Gemini 에 걸친 50 ~ 200 개 우선순위 프롬프트의 주간 샘플. 답변 중 몇 %가 브랜드를 인용하는가? 몇 %가 경쟁사를 인용하는가? 어떤 페이지가 인용되고 어떤 페이지가 안 되는가? 도메인에 대한 인용 측면을 한 번에 보려면 /diagnosis 무료 인용 감사 를 실행하세요.

인용 측면 없이는 클릭하는 5% 사용자에 최적화하고 챗을 떠나지 않는 95% 를 무시하게 됩니다. 두 절반을 함께 연결하면 인용률 상승과 트래픽 상승을 연결해 GEO ROI 를 정직하게 측정할 수 있습니다.

자주 보는 실수

팀이 AI 트래픽을 처음 계측할 때 반복적으로 보이는 5 가지 실수입니다.

"Direct" 를 베이스라인으로 신뢰. 대부분의 B2B 사이트에서 "Direct" 의 의미 있는 부분은 잘못 분류된 AI 리퍼러 트래픽입니다. 결론을 내리기 전에 커스텀 채널 그룹을 먼저 만드세요.
세션이 아닌 노출만 집계. AI 답변은 클릭 없이도 브랜드를 언급할 수 있습니다. 세션 점유율이 아닌 인용 점유율이 상위 깔때기 지표입니다.
AI 와 SEO 를 한 버킷에 섞기. AI Assistants 와 Organic Search 는 행동이 다릅니다. 전환율, 페이지 경로, 체류 시간 모두 갈립니다. 별도로 보고하세요.
User-agent 무시. OpenAI, Anthropic, Perplexity, Google AI 표면 (Googlebot 과 별개) 의 크롤러 user-agent 가 점점 구별 가능해지고 있습니다. 세션 카운트에서 필터링하거나 명시적으로 분류하세요. Google 의 Search Central 봇 트래픽 문서 가 비-AI 크롤러의 정식 접근을 설명하고, 여기에도 깔끔하게 적용됩니다.
한 번 설정하고 잊기. 분기마다 새 엔진이 나옵니다. 90 일마다 채널 그룹 규칙을 감사하세요.

AI 트래픽 측정은 어디로 가는가

GA4 가 결국 AI Assistants 채널을 기본 제공할 것입니다. 그때까지는 직접 만드는 일입니다. 서버 측 분석 플랫폼 (PostHog, Plausible, Fathom) 은 이미 커스텀 규칙으로 Perplexity 와 ChatGPT 를 깔끔하게 분류합니다. 더 장기적인 변화는 세션 집계에서 인용 집계 중심 KPI 로의 이동입니다. 세션은 결과이고, 인용은 원인입니다.

Share on X Share on LinkedIn

Cite as

다음 글을 이메일로 받기

Answer Engine Optimization 에 대한 주 1편 앵커 콘텐츠. 채우기 없음.

bestPractices