Methodology · v1.1

숫자는 인용 가능해야 의미가 있습니다.

238Trend의 모든 리포트는 표본 · 질의셋 · 측정 기간 · 오차 범위 · 한계를 전문 공개합니다. 이 문서는 Monthly Index 와 Quarterly Report에 공통으로 적용되는 v1.1 방법론입니다.

Version
v1.1
Effective
2026.04.28
Last Review
2026.04.28
Peer Review
박지연 · 정** 교수
Chapter · 01

Principles.

방법론은 저널의 기반입니다. 다음 다섯 원칙은 리포트 작성·검증의 우선순위입니다.

01 · Reproducibility
동일 방법론 · 동일 시점 · 동일 시드를 사용할 경우 동일 결과가 재현 가능해야 합니다.
02 · Transparency
표본 · 질의 · 시점 · 시드 · 엔진 버전 · 프롬프트를 모두 공개합니다.
03 · Independence
측정 대상 브랜드로부터 광고 · 후원을 받지 않습니다.
04 · Comparability
산업 간 · 시점 간 비교가 가능한 정규화 지표를 우선 사용합니다.
05 · Humility
측정은 현실의 근사입니다. 한계와 오차를 먼저 밝힙니다.
Chapter · 02

LLM Engines.

6종 주요 엔진을 동일 가중치로 교차 측정합니다. 글로벌 4종에 한국 시장 영향력이 있는 CLOVA X · Naver Cue 2종을 추가했습니다. 엔진별 UI · API 응답 차이를 보정하기 위해 각각의 표준 설정을 고정합니다.

Engine
Model
Version Snap
Weight
ChatGPT
GPT-5 mini
2026.01
1.0
Claude
Claude 4.7 Sonnet
2026.02
1.0
Perplexity
sonar
2026.03
1.0
Gemini
Gemini 2.5 Pro
2026.03
1.0
CLOVA X · KOREA
HCX-005
2026.03
1.0
Naver Cue · KOREA
cue-search
2026.03
1.0
엔진 버전은 월별 스냅샷으로 고정하며, 버전 전환 시 전후 30일 중첩 측정 기간을 둡니다.
Chapter · 03

Query Design.

v1.1 부터 측정 단위를 산업·쿼리에서 시술·프롬프트로 전환했습니다. 실사용 검색 로그 · 시술 전문가 인터뷰를 조합해 시술당 20 종 표준 프롬프트를 설계하고, 각 프롬프트를 100회 반복 측정하여 시술당 총 2,000 프롬프트 응답을 확보합니다. 세 유형의 질문을 정해진 비율로 혼합합니다.

추천형 (12종)
60% · "강남 울쎄라 잘하는 곳", "강남에서 슈링크 잘하는 피부과 추천" 같이 특정 의도의 추천을 요청하는 프롬프트. AI 답변 상단 1~2 클리닉에 가장 민감.
비교형 (5종)
25% · "울쎄라 vs 슈링크 강남" 형식. 상위 5~10 클리닉 간 언급 패턴과 맥락 단서 확인.
정의형 (3종)
15% · "울쎄라 시술 정보", "울쎄라 가격대" 같은 배경 · 정의 프롬프트. 토픽 권위의 기본값을 확인.

측정 주기: Issue 단위 단발 측정 (cadence 비고정). 한 Issue 는 발간 시점에 한 번 측정되고 그 데이터는 영구 스냅샷으로 보존됩니다. 같은 Issue 는 갱신하지 않으며, 다음 Issue 는 새 산업·새 측정 셋으로 시작합니다. v1.1 Issue 01 (강남 피부과) 기준 30 시술 × 20 프롬프트 × 100회 = 시술별 2,000 / Issue 별 60,000 응답.

Chapter · 04

Citation Universe.

238Trend 는 사전에 표본 클리닉을 선정하지 않습니다.GEO 측정의 본질은 "정해 놓은 50곳을 추적"하는 게 아니라,AI 응답에 등장한 모든 엔티티를 관측하는 것이기 때문입니다.

v1.1 의 측정 범위는 입력(사전 정의)과 관측 결과(사후 발생) 두 층위로 구분됩니다.

입력 · 사전 정의
측정 셋
  • 지역 한정: "강남" 키워드를 포함한 시술 쿼리만 측정. AI 응답에 등장한 클리닉의 실제 행정구역(강남구·서초구·신사·청담 등)은 측정 대상이 아님
  • 시술 셋: 30 시술 (보톡스 · 필러 · 레이저 · 리프팅 등)
  • 프롬프트 셋: 시술당 20 프롬프트 (추천형 8, 비교형 7, 가격형 5)
  • 실행: 시술별 100회 재실행 = 시술별 2,000 응답 / 분기 60,000 응답
관측 결과 · 사후 발생
인용 모집단
  • 모집단 = 60,000 응답에서 추출된 모든 클리닉 이름의 합집합
  • 크기는 사전에 정해지지 않음: Q2 2026 기준 50개 클리닉 등장 (다음 분기는 달라질 수 있음)
  • 필터링 없음: 응답에 등장한 이상 매출·규모와 무관하게 모집단에 포함 — "AI 가 호명한 모든 곳" 이 측정 단위

즉 "표본 50곳을 골라 추적했다" 가 아니라 "AI 응답에서 50곳이 등장했고, 그 분포를 측정했다" 가 정확한 표현입니다. 매 Issue 마다 모집단 크기는 변동되며, 등장한 클리닉의 합산 인용률·격차·맥락이 핵심 지표입니다.

Chapter · 05

Measurement.

각 질의에 대한 엔진 응답에서 브랜드 언급 위치, 언급 횟수, 맥락을 측정합니다. 주요 지표는 다음과 같습니다.

Metric
정의
단위
citation_share
해당 클리닉이 전체 응답에서 차지하는 언급 비중 (v1.1 단일 정렬 메트릭)
%
context_quality
언급이 긍정 · 중립 · 부정 맥락인지 분류 (3 분류)
%
engine_gap
6 LLM 간 citation_share 표준편차 — 표·차트에서 LLM 편차 로 표기 (값이 클수록 LLM 마다 다른 클리닉을 호명)
%p
Chapter · 06

Error Range.

LLM 응답은 본질적으로 확률적입니다. 동일 입력에서도 응답이 미세하게 달라질 수 있으며, 이 변동성을 측정에 포함합니다.

반복 측정
각 프롬프트당 엔진별 100 회 반복. Issue 단위 단발 측정 (cadence 비고정). 동일 입력에서도 LLM 응답이 미세하게 달라질 수 있어 100회 평균값과 표준편차를 함께 보고합니다.
Seed 고정
API 호출 시 temperature 0.3, seed 고정. UI 기반 측정은 동일 세션 내 연속 실행.
신뢰구간
Issue 단위 100 회 반복 기준 95% 신뢰구간 ± 0.8%p. 범위 벗어날 경우 재측정.
Chapter · 07

Limits.

측정은 현실의 근사입니다. 이 방법론의 명시적 한계는 다음과 같습니다.

  • v1.1 은 강남 피부과(미용피부과) 한정. 타 진료과 · 타 권역 · 타 산업은 v1.2 로 순차 확대 예정. 분기마다 1 산업씩 발간.
  • 한국어 응답에 한정. 다국어 비교는 별도 프로젝트로 분리 예정.
  • 6 엔진 외 다른 도구는 측정하지 않음. Bing Copilot · You.com · DeepSeek 등은 v2.0 에서 추가 검토.
  • 엔진 개편 시 단절. 엔진 측 개편 (예: SearchGPT 전환) 시 전후 비교가 제한됨. 이 경우 별도 표기.
  • 응답에 등장하지 않은 클리닉은 0 처리. 신생·소규모 클리닉이 AI 응답에 호명되지 않으면 모집단에 포함되지 않음 — "측정 안 됨" 이 아니라 "AI가 호명 안 함" 의 의미.
  • 응답 품질 자체를 평가하지 않음. 238Trend는 "얼마나 언급되는가"를 측정하며, "답변이 옳은가"를 판정하지 않습니다.
Chapter · 08

Changelog.

v1.1
2026.04.29
· Brand Sample → Citation Universe 모델 전환 (사전 표본 X → AI 응답 사후 모집단 O)
· 측정 메트릭 단일화: top_rank 폐기 → citation_share 단일 정렬
· 시계열 변동(▲▼) → LLM 편차(GAP) 횡단 비교로 전환
· 측정 모델: 매월 갱신 X → Issue 단위 단발 측정 (cadence 비고정)
v1.1
2026.04.28
측정 단위 변경: 산업·쿼리 → 시술·프롬프트 (시술당 20 × 100회). LLM 엔진 6종으로 확장 (CLOVA X · Naver Cue 추가). 관측 모델 재정의: 사전 표본 풀 폐기 → 응답에서 자연 발생한 인용 모집단 측정 (Q2 2026 강남 피부과 50개 클리닉 등장).
v1.0
2026.04.24
최초 발행. 4 엔진 교차 측정 · 산업당 100 쿼리 · 12주 이동평균.
v0.7
2026.02.10
비공개 파일럿 종료. context_quality 지표 추가. Seed 고정 방식 확정.
v0.5
2025.11.20
B2B SaaS 12 브랜드 대상 3개월 파일럿 개시. 내부 리뷰 중.
Roadmap

측정 확장 로드맵.

238Trend 는 한 번에 다 측정하지 않습니다. 한 산업씩, 깊이. 각 인덱스는 발간되는 순간 그 시장의 표준 GEO 인덱스가 됩니다.

Issue 01
2026 Q2 · LIVE
강남 피부과 — 30 시술 · 인용 클리닉 50 (사후 모집단) · Issue 01 발간 (2026-04). 갱신 없음 (단발 측정).
Issue 02
2026 Q3 · 측정 중
강남 성형외과 — 시술 셋 설계 중. Q3 발간 예정.
Issue 03
2026 Q4 · 설계 중
강남 치과 — 측정 셋 (시술 셋·프롬프트) 설계 중.
Issue 04+
2027 H1 · 후보
법률 · 금융 · 교육 — Audit 신청 데이터 기반 우선순위 결정.
UPDATED·의료 산업 인덱스 발간 · 8 산업 로드맵
산업 인덱스리포트 PDF