[인포그래픽] AI가 가장 많이 참고하는 웹사이트는 레딧…위키피디아·유튜브 순

2025-08-25     최영호 기자
출처 클립아트코리아

대형언어모델(LLM)인 챗GPT(ChatGPT)와 퍼플렉시티(Perplexity) 등 AI 챗봇이 가장 많이 참고하는 웹사이트는 어디일까. 데이터 시각화 전문 매체 비주얼 캐피털리스트(Visual Capitalist)가 마케팅 데이터 기업 semrush의 2025년 6월 자료를 기반으로 15만 건 이상의 AI 인용 사례를 분석한 결과, 레딧(Reddit)이 1위에 올랐다.

레딧은 전체 인용의 40.1%를 차지하며 압도적인 비중을 기록했다. 이어 위키피디아(Wikipedia·26.3%), 유튜브(YouTube·23.5%), 구글(Google·23.3%), 옐프(Yelp·21%), 페이스북(Facebook·20%) 순으로 나타났다. 아마존(Amazon·18.7%), 트립어드바이저(Tripadvisor·12.5%), 인스타그램(Instagram·10.9%) 등 전자상거래와 후기 기반 플랫폼도 상위권에 포함됐다.

이번 분석에서 공통적으로 드러난 특징은 상위 도메인의 상당수가 이용자가 직접 작성하거나 수정하는 ‘사용자 생성 콘텐츠(User-Generated Content, UGC)’라는 점이다. 이는 AI가 집단 지성을 주요 자료원으로 활용하고 있음을 보여주지만, 동시에 사실 검증이 부족한 콘텐츠에 의존한다는 위험성도 안고 있다.

전문가들은 이러한 경향이 세 가지 문제를 초래할 수 있다고 지적한다. 첫째, 전문가 검증이 부족한 커뮤니티 기반 콘텐츠는 잘못된 정보나 편향을 사실처럼 재생산하는 ‘오정보(misinformation)’ 위험이 크다. 둘째, 인기 있는 주제나 반복되는 내러티브가 지나치게 부각되면서, 신뢰할 만한 전문 출처의 정보가 묻히는 ‘에코 챔버(확증편향)’ 현상이 나타날 수 있다. 셋째, 건강·법률·금융 등 전문성이 요구되는 영역에서는 편집·검증 체계가 약한 사용자 생성 콘텐츠가 치명적 오판을 유도할 수 있다.

실제로 일부 사용자들은 챗GPT가 물 정화 방법으로 표백제와 식초를 함께 섞으라는 비상식적 답변을 내놓았다고 보고한 바 있다. 이는 독성 가스를 발생시킬 수 있는 위험한 조합으로, 잘못된 게시물이 AI 답변으로 재현된 사례다.

보고서는 “AI가 정보 접근성을 크게 넓히고 대중적 담론을 강화하는 동시에, 집단 지성의 한계 역시 함께 드러내고 있다”며 “특히 건강·정책 등 사회적 파급력이 큰 영역에서는 콘텐츠 검증 체계와 신뢰도 관리가 더욱 중요해질 것”이라고 분석했다.

출처 비주얼 캐피털리스트