AI 시대의 Share of Voice: LLM 안에서 브랜드 가시성을 측정하는 법

AI 시대의 SoV 는 고정 프롬프트 셋에서 브랜드가 인용된 답변의 비율입니다. 공식, 30 일 측정 플랜, 숫자를 왜곡하는 세 가지 함정을 정리했습니다.

Mark Kim2026년 5월 12일20 min read

AI 시대의 SoV (Share of Voice, 점유율) 는 고정 프롬프트 셋에 대해 LLM 답변이 브랜드를 인용하거나 언급한 비율입니다. 페이드 검색의 노출 점유율 (impression share) 과 같은 운영 지표이지만, 단위는 결과 페이지의 슬롯이 아니라 생성된 답변 안의 문장입니다. 이 글은 지표를 정의하고, 브랜드 작업에서 쓰는 공식을 제시하며, 도구 유무와 관계없이 돌릴 수 있는 30 일 측정 플랜을 정리합니다.

고전적 SoV 지표는 미디어 바잉에서 왔습니다. 카테고리 전체 대비 브랜드의 광고비 또는 노출 수였고, 노출이 청구되고 카운트되었기 때문에 분모가 깔끔했습니다. SEO 가 더 부드러운 버전을 물려받았습니다. Ahrefs 와 Semrush 같은 랭크 트래커가 미터 역할을 하는, 정의된 키워드 묶음에서의 오가닉 클릭 점유율입니다.

AI 시대의 SoV 는 세 가지 축에서 다릅니다. 단위가 노출 또는 클릭에서 인용 또는 언급으로 이동합니다. 표면이 단일 랭킹 리스트에서 엔진별 답변 포맷 여러 개로 이동합니다. 그리고 분모가 더 이상 입찰 가능한 유한한 키워드 풀이 아닙니다. 가능한 AI 쿼리의 모집단이 사실상 무한하기 때문에, 분모는 당신이 선택한 프롬프트 샘플이 됩니다.

+28.6%AI 플랫폼에서 외부 사이트로 보내는 방문의 전년 동기 대비 성장률 (미국, 2025 년 1 월 → 2026 년 1 월)Similarweb GenAI 트래픽 트래킹, 2026 년 1 월 업데이트

전략적 핵심은 이것입니다. AI SoV 는 카운팅 문제이기 전에 샘플링 문제입니다. 샘플이 틀리면 숫자에 의미가 없습니다.

공식: 실제로 어떻게 측정하는가

핵심 공식은 고전 SoV 와 같은 형태이고, 새 변수 두 개가 추가됩니다.

SoV_AI = ( 브랜드를_인용한_답변 / 전체_답변 ) over 프롬프트_샘플 P, 엔진_셋 E, 측정_윈도우 W

지표가 의미를 갖기 전에 고정해야 하는 네 가지 입력:

변수	정의	흔한 실수
프롬프트 샘플 `P`	측정 윈도우마다 다시 돌리는 고정 프롬프트 집합	주마다 샘플을 바꿔서 트렌드가 무의미해짐
엔진 셋 `E`	쿼리하는 답변 엔진 (ChatGPT, Perplexity, Gemini, Copilot, ...)	엔진별 숫자가 아닌 합산 단일 숫자만 보고
측정 윈도우 `W`	샘플이 커버하는 기간 (주, 격주, 월)	프롬프트 개수가 다른 윈도우끼리 비교
인용 규칙	"인용" 의 정의: URL 각주, 본문 브랜드 언급, 또는 둘 다	인용과 언급을 라벨 없이 섞음

SoV 와 짝을 이루는 두 번째 지표는 citation rate (인용률) 입니다. 도메인이 번호 매김 또는 각주 출처로 등장한 답변의 비율로, 단순 브랜드명 언급은 빠집니다. Stanford 의 HELM Lite 벤치마크 는 인용과 언급이 측정 가능하게 구별되는 출력임을 만드는 검색 파이프라인을 기록합니다. 모델은 URL 을 검색하지 않고도 학습 데이터에서 브랜드를 회상할 수 있고, 검색된 URL 이 브랜드 이름을 한 번도 부르지 않는 답변을 만들 수도 있습니다. 두 가지를 모두 추적하고, 따로 보고합니다.

샘플링: 새 SERP 쿼리로서의 프롬프트

프롬프트 샘플은 가장 중요한 설계 결정입니다. 세 가지 속성이 결과로 나온 SoV 숫자가 현실을 반영하는지를 결정합니다.

구매자 관련성. 샘플은 실제 독자가 AI 어시스턴트에 묻는 질문이어야 합니다. 랭크 트래커가 만드는 키워드 유니버스가 아닙니다. 영업 콜 녹취, CS 티켓, 채팅 로그에서 출발합니다. Search Engine Land 의 AI Overview 롤아웃 보도 는 질문 형태 쿼리가 헤드 키워드 쿼리보다 측정 가능하게 자주 AI 답변 표면을 트리거한다는 것을 보여줍니다. 샘플이 이를 반영해야 합니다.
의도 믹스. 카테고리 정의 질문 ("X 가 무엇인가"), 비교 질문 ("X vs Y"), 추천 질문 ("Y 용 베스트 X") 을 포함합니다. 브랜드들은 일관되게 추천 프롬프트를 과소 카운트하는데, 인용이 매출로 직결되는 것이 바로 이 카테고리입니다.
안정된 사이즈. 엔진당 50 ~ 200 프롬프트가 유용한 사이즈입니다. 50 미만은 분산이 너무 커서 움직임을 잡을 수 없고, 200 초과는 라벨링 비용이 대부분의 내부 팀을 압도합니다.

함께 일하는 대부분의 B2B 브랜드에 적정한 시작 셋은 75 프롬프트입니다. 카테고리 질문 25 개, 비교 질문 25 개, 추천 질문 25 개. 셋을 추가하거나 교체하기 전에 최소 8 주는 고정합니다.

흔한 세 가지 함정

내부 SoV 대시보드를 감사할 때마다 거의 항상 반복되는 측정 오류 세 가지입니다. 각각이 유용한 추세선을 노이즈로 바꿉니다.

함정 1: 너무 좁은 프롬프트 셋. 팀이 고가치 프롬프트 10 개를 추적하고 SoV 를 주 단위로 보고합니다. 프롬프트 두 개의 인용이 바뀌면서 숫자가 주마다 30 포인트씩 흔들리고, 팀은 대부분 분산일 뿐인 시그널에서 콘텐츠 결정을 합니다. 해결: 엔진당 최소 50 프롬프트, 최소 한 분기 고정.

함정 2: 브랜드와 엔티티의 혼동. "Stripe" 는 회사를 부른 본문 언급, stripe.com 인용, 또는 Stripe 를 스쳐 언급한 제 3 자 글에서 검색된 패시지로 등장할 수 있습니다. 셋은 다른 것으로 카운트해야 합니다. 해결: 각 등장에 mention (본문 브랜드명), citation (출처 목록의 URL), passthrough (브랜드를 언급한 제 3 자 페이지) 라벨을 답니다. 인용률을 주 지표로, 언급률을 보조 지표로 보고합니다.

함정 3: 인용과 언급의 합산. 한 답변이 푸터에서 도메인을 인용하면서 본문에서는 경쟁사를 다룰 수 있습니다. 이를 "승리" 로 카운트하면 브랜드 측 대시보드 감사에서 SoV 가 15 ~ 25% 부풀려졌습니다. 해결: "완전 인용" 등급은 URL 인용과 같은 답변 내 본문 브랜드 언급을 모두 요구하고, 부분 사례는 별도로 추적합니다. LLM 이 출처를 고르는 방식에 대한 글 이 이 두 경로가 검색 레이어에서 갈라지는 이유를 다룹니다.

실전 30 일 측정 플랜

AI SoV 계측이 없는 팀도 4 주면 변호 가능한 주 단위 숫자를 만들 수 있습니다. 아래 플랜은 새 브랜드와 함께 돌리는 그 플랜입니다.

1 주차 — 샘플과 엔진을 정의합니다. 영업 녹취와 CS 로그에서 대표 프롬프트 30 개를 뽑습니다. 비교 프롬프트 ("X vs 카테고리 리더") 20 개와 추천 프롬프트 25 개를 더합니다. 첫 분기는 엔진 셋을 ChatGPT, Perplexity, Gemini 로 고정하고, Copilot 과 수직 엔진은 이후에 추가합니다. 인용 규칙 (URL 각주 + 본문 언급) 을 문서화합니다.

2 주차 — 첫 베이스라인 런. 75 프롬프트를 각 엔진에 수동 또는 도구로 돌립니다. 프롬프트별로 세 가지 산출물을 저장합니다. 전체 답변 텍스트, 출처 목록, 타임스탬프. 각 등장을 mention, citation, passthrough 로 라벨링합니다. 첫 런은 3 엔진 75 프롬프트 기준 분석가 6 ~ 10 시간이 듭니다.

3 주차 — 케이던스를 정의합니다. 주 단위 또는 격주 중 선택합니다. 주 단위는 Perplexity 발 움직임을 잡습니다 (재랭커가 가장 빨리 업데이트되며, BrightEdge 의 2026 년 AI 검색 보고서 참고). 격주는 1 인 운영으로 더 지속 가능합니다. 요일, 프롬프트 순서, 엔진 순서를 고정하여 요일 효과 노이즈를 통제합니다.

4 주차 — 첫 추세점과 함정 감사. 샘플을 다시 돌립니다. 엔진별 SoV, 엔진별 citation rate, 임원용 합산 (사이즈 가중) 숫자를 계산합니다. 세 가지 함정에 대해 라벨을 감사합니다. 주 대비 변화가 10 포인트를 넘으면 손으로 재라벨링하여 실제인지 확인합니다.

4 주 차 이후로는 케이던스가 스스로 돌고, 75 프롬프트 기준 분석가 시간은 측정 윈도우당 3 ~ 5 시간으로 자리잡습니다.

도구와 도구 없이 하는 법

특수 도구 없이도 AI SoV 측정을 돌릴 수 있습니다. 스프레드시트, 세 엔진의 웹 인터페이스, 그리고 규율 잡힌 라벨링 프로토콜이 첫 분기까지 팀을 데려갑니다. 비용은 워크플로 정착 후 측정 윈도우당 분석가 약 하루입니다.

프롬프트 100 개와 엔진 3 개를 넘어가면 수작업이 지속 불가능해집니다. 도구는 프롬프트 실행, 인용 파싱, 런 간 유사 중복 답변 디둡을 자동화함으로써 비용을 회수합니다. Prompt Architect 를 정확히 이 워크플로를 위해 만들었지만, 가장 중요한 것은 지표 설계입니다. 올바른 SoV 정의는 어느 도구로도 이식 가능하고, 잘못된 정의는 어느 도구에서도 잘못된 채로 남습니다.

공개적으로 AI SoV 데이터를 발행하는 비-PA 레퍼런스 몇 가지:

Similarweb GenAI 트래픽 트래킹 이 카테고리별 AI 엔진 유입 점유율을 추적합니다 — 위에서 언급한 28.6% 전년비 성장 포함.
BrightEdge 의 12 개월 AI Overview 분석 이 카테고리별 가시성 변화와 인용-오가닉 중복률을 발행합니다.
HTTP Archive Web Almanac 은 스키마 기반 인용 상승을 뒷받침하는 구조화 데이터 도입 베이스라인의 표준 참조입니다.

AI SoV 를 더 넓은 가시성 분야에 연결하는 프레임워크는 AEO vs SEO 2026 프레임워크 에서 다룹니다. 답변 경제의 성공 지표 셋 안에 SoV 를 위치시키는 글입니다.

좋은 상태는 어떻게 생겼나

성숙한 AI SoV 운영은 세 가지 속성을 갖습니다. 프롬프트 샘플이 안정적이고 문서화돼 있습니다. 지표가 엔진별로 보고되고 그 위에 합산 뷰가 얹힙니다. 단일 합산 숫자가 아닙니다. 그리고 팀이 Perplexity 를 선행 지표, ChatGPT 를 확정 시그널, Gemini 를 루프를 닫는 후행 지표로 다룹니다.

이 셋 중 하나라도 빠지면 차트가 많이 움직이고, 의미는 적고, 다음 분기 리뷰에서 무시되는 결과로 이어집니다. 셋을 모두 잡는 브랜드는 2010 ~ 2013 년 초기 SEO 팀이 본 것과 같은 복리 곡선을 봅니다. 콘텐츠 포맷에 대한 작고 반복 가능한 승리가 답변 레이어 안의 카테고리 리더십으로 누적됩니다.

Share on X Share on LinkedIn

Cite as

다음 글을 이메일로 받기

Answer Engine Optimization 에 대한 주 1편 앵커 콘텐츠. 채우기 없음.

bestPractices

AI 시대의 Share of Voice: LLM 안에서 브랜드 가시성을 측정하는 법

공식: 실제로 어떻게 측정하는가

샘플링: 새 SERP 쿼리로서의 프롬프트

흔한 세 가지 함정

실전 30 일 측정 플랜

도구와 도구 없이 하는 법

좋은 상태는 어떻게 생겼나

다음 글을 이메일로 받기

Related

AEO vs SEO: 2026 년 브랜드 가시성 프레임워크

ChatGPT, Perplexity, Gemini 는 어떻게 출처를 고르는가

AI 가 인용하는 콘텐츠를 만드는 5 가지 스키마 패턴 (코드 포함)

AI 시대의 "Share of Voice" 가 의미하는 것

공식: 실제로 어떻게 측정하는가

샘플링: 새 SERP 쿼리로서의 프롬프트

흔한 세 가지 함정

실전 30 일 측정 플랜

도구와 도구 없이 하는 법

좋은 상태는 어떻게 생겼나

다음 글을 이메일로 받기

Related

AEO vs SEO: 2026 년 브랜드 가시성 프레임워크

ChatGPT, Perplexity, Gemini 는 어떻게 출처를 고르는가

AI 가 인용하는 콘텐츠를 만드는 5 가지 스키마 패턴 (코드 포함)