[인포그래픽] AI, 인간의 사고를 넘보다…복잡한 기술 과제에서도 두각

2025-05-06     최영호 기자

최근 인공지능(AI)의 발전 속도가 상상을 초월하고 있다. 특히 복잡한 논리력과 사고가 필요한 기술 과제에서도 AI가 인간의 평균 성과를 앞지르기 시작하면서, 인간과 기계의 지능 격차는 빠르게 좁혀지고 있다.

스탠퍼드대학교가 발간한 ‘2025 AI 인덱스 보고서’에 따르면, 최신 AI 모델들은 다양한 표준화된 벤치마크 평가에서 인간의 평균 성과를 초월하고 있다. 해당 평가는 AI 시스템의 사고 능력, 언어 이해, 수학적 추론 등 기술적 과제를 중심으로 구성되어 있으며, 총 8개 분야에 걸쳐 AI와 인간의 성능을 비교했다. 비주얼 캐피털리스트는 이를 시각화해서 공유했다.

비주얼 캐피털리스트는 2025 AI 인덱스 보고서를 바탕으로 공유한 AI가 인간을 앞선 주요 분야는 다음과 같다.

이미지 분류와 시각 추론: 이미지 안의 사물이나 패턴을 인식하고, 이를 바탕으로 논리적인 판단을 내리는 과제에서 AI는 인간보다 빠르고 정확한 성능을 보이고 있다. 이는 자율주행차, 영상 분석, 보안 등 실생활에 직접적인 영향을 미칠 수 있는 분야다.

중급 독해와 영어 이해: 문장을 해석하고 맥락을 이해하는 능력에서도 AI는 인간 이상의 성능을 나타냈다. 특히 GPT 시리즈나 구글 제미나이와 같은 언어 모델은 뉴스 기사, 과학 지문 등 다양한 장르의 문서를 빠르게 해석하고 요약하는 데 강점을 보인다.

경쟁 수준의 수학 문제 해결: 복잡한 수식과 논리를 요구하는 수학 문제를 푸는 능력은 한때 인간의 영역으로 여겨졌지만, 최신 AI는 이미 수학 경시대회 수준의 문제도 해결 가능하다. 이는 과학기술, 엔지니어링, 금융 분야에서 큰 활용 가능성을 보여준다.

박사 수준의 과학 질문: 물리학, 생물학, 화학 등 고등학문을 기반으로 한 질문에 대한 이해도와 응답 정확도 역시 AI가 빠르게 향상되고 있다.

그러나 유일하게 AI가 아직 인간을 완전히 따라잡지 못한 분야는 멀티모달 이해 및 추론이다. 이 과제는 텍스트뿐 아니라 이미지, 도표, 그래프 등 다양한 형식을 동시에 이해하고 논리적으로 결합해 해석하는 능력을 요구한다. 예를 들어, 과학 논문에서 그래프를 보고 실험 결과를 유추하거나, 복잡한 기술 도면과 설명을 종합해 문제를 해결하는 수준의 사고다.

하지만 이 분야 역시 AI의 발전 속도를 고려하면 시간문제라는 평가도 많다. 실제로 OpenAI의 최신 모델 ‘o1’은 2024년 MMMU 벤치마크에서 78.2%를 기록하며 인간 평균(82.6%)과의 격차를 단 4.4%포인트로 좁혔다. 이는 불과 몇 개월 전만 해도 구글 제미나이가 같은 평가에서 59.4%를 기록했던 점과 비교하면, 놀라운 성과라 할 수 있다.

더불어 o1 모델은 AI가 자주 보이는 '환각(hallucination, 그럴듯하지만 사실이 아닌 내용을 만들어내는 오류)'의 발생률도 현저히 낮은 것으로 나타나 신뢰성 면에서도 진전을 보이고 있다.

출처 비주얼 캐피털리스트