2026.02.04 (수)

  • 구름많음동두천 -2.6℃
  • 맑음강릉 3.3℃
  • 맑음서울 1.3℃
  • 구름많음대전 -1.7℃
  • 흐림대구 -0.9℃
  • 구름많음울산 1.4℃
  • 구름많음광주 0.8℃
  • 구름많음부산 3.9℃
  • 구름많음고창 -2.2℃
  • 구름조금제주 3.3℃
  • 맑음강화 -3.6℃
  • 구름많음보은 -5.1℃
  • 구름많음금산 -3.9℃
  • 흐림강진군 -0.1℃
  • 구름많음경주시 2.4℃
  • 흐림거제 1.8℃
기상청 제공

WP "가장 정확한 답을 내놓는 AI 도구는…구글 AI 모드"

 

(조세금융신문=최주현 기자) 주요 인공지능(AI) 모델 중 검색 도구로서 가장 정확한 답을 내놓는 AI는 구글 'AI 모드'라는 테스트 결과가 나왔다.

 

워싱턴포스트(WP)는 자체적으로 미국 공공·대학 도서관 사서들과 함께 진행한 AI 검색 도구 테스트에서 구글 'AI 모드'가 가장 정확한 답변을 내놓았다고 지난 27일(현지시간) 보도했다고 연합뉴스는 전했다.

 

이번 테스트는 구글 AI 모드와 AI 오버뷰, 챗GPT(오픈AI), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트) 등 9개의 AI 도구를 대상으로 진행됐다. 챗GPT는 GPT-5와 GPT-4 터보 두 모델을 포함했다.

 

AI 모드와 AI 오버뷰는 구글의 검색 도구로 AI 모드는 웹을 깊이 검색해 여러 출처를 종합한 뒤 답변을 제공하고, AI 오버뷰는 검색 결과를 AI가 요약해준다.

 

테스트는 30개의 까다로운 질문을 던진 뒤 AI 도구가 내놓는 답변 900건을 점수화했다.

 

모든 도구는 무료 기본 버전(7∼8월 기준)으로만 테스트했고, 질문은 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지에 집중됐다.

 

테스트 결과 구글 AI 모드가 100점 만점 가운데 60.2점을 얻어 가장 높은 점수를 받았다. GPT-5 기반의 챗GPT가 55.1점으로 2위를, 퍼플렉시티가 51.3점으로 3위를 차지했다.

 

일론 머스크의 그록3는 40.1점에 그쳐 8위, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다. 그록 최신 모델인 그록4는 무료 버전이 없어 테스트 대상에 포함되지 않았다.

 

구글 AI 모드는 검색왕답게 퀴즈와 최신 사건 부문에서 가장 정확한 답을 제시했다. 전문 출처 검색에서는 빙 코파일럿, 이미지 인식에서는 퍼플렉시티가 가장 높은 점수를 받았다. GPT-4 터보는 가장 치우치지 않는 답을 제공했다.

 

GPT-5는 전반적으로 성능 개선을 보여 2위를 차지했지만 일부 영역에서는 GPT-4보다 오히려 낮은 점수를 받았다.

 

이번 테스트는 AI의 약점을 의도적으로 공략했지만 일상 질문 중 상당수에 대해 여전히 AI가 제대로 답하지 못한다는 사실이 드러났다고 WP는 분석했다.

 

AI는 정보가 최신인지 여부, 출처가 어느 정도 신뢰가 있는지를 판별하는 데 어려움을 겪고 있으며, 잘못된 답을 자신 있게 내놓기도 했다.

 

WP는 "결국 AI 답변을 그대로 믿기보다는 사서처럼 출처 확인, 최신성 검증, 비판적 사고를 거쳐야 한다는 교훈이 강조됐다"고 전했다.

 

 

[조세금융신문(tfmedia.co.kr), 무단전재 및 재배포 금지]













전문가 코너

더보기



[이명구 관세청장의 행정노트] 공정의 사닥다리
(조세금융신문=이명구 관세청장) 며칠 전, 새로 전입한 사무관들과 조용한 만남의 자리를 가졌다. 짧지 않은 시간 동안 어떤 말을 전해야 할지 잠시 생각하다가, 결국 두 가지만을 강조했다. 인사를 잘하라는 것, 그리고 돈을 멀리하라는 것이었다. 이 말은 새로 만든 조언이 아니다. 지금으로부터 30여 년 전, 내가 사무관이던 시절 같은 과에서 근무하셨던 한 선배 사무관께서 해주신 말씀이었다. 그때는 그 의미를 다 헤아리지 못했지만, 공직의 시간을 오래 지날수록 그 말은 점점 더 분명한 울림으로 다가왔다. 그래서 그날, 나는 그 말씀을 그대로 후배들에게 전했다. 인사는 결국 사람을 남기는 일이고, 돈을 멀리하라는 말은 공직자의 판단을 흐리는 유혹과 거리를 두라는 경고였다. 공직은 단거리 경주가 아니라 긴 항해이기에, 처음부터 방향을 잘 잡지 않으면 어느 순간 되돌아오기 어려운 곳으로 흘러가게 된다. 덧붙여 이런 이야기도 했다. 너무 경쟁하듯이 하나의 사다리만 오르려 하지 말고, 각자의 사닥다리를 각자의 속도로 차분히 오르기를 바란다고. 레드오션처럼 한 방향으로 몰려 달리다 보면, 사닥다리가 무너질 수도 있고 병목현상 속에서 누군가는 추락할 수도 있다. 성과와 평가
[초대석] 정재열 관세사회장 "마약· 특송·외화 밀반출 등 국경관리...관세사가 앞장"
(조세금융신문=안종명 기자) “1976년 관세사 제도가 처음 생길 때 우리나라 수출액이 80억 달러였습니다. 지금은 1조 3,000억 달러를 넘보는 세계 10위권 무역 강국이 됐죠. 지난 50년이 우리 존재를 증명한 시간이었다면, 앞으로의 50년은 국가 무역 안전망의 ‘재설계’ 기간이 될 것입니다.” 대한민국 경제의 심장부, 강남. 빌딩 숲 사이로 겨울바람이 매섭게 몰아치던 날, 기자는 한국관세사회 회장실을 찾았다. 문을 여는 순간, 바깥의 냉기와는 대조적으로 따뜻한 온기가 공간을 채우고 있었다. 지독한 독감으로 고생했다는 소식이 무색할 만큼, 정재열 회장은 밝은 미소로 기자를 맞이했다. 그 미소 뒤에는 창립 50주년이라는 거대한 역사의 변곡점을 지나온 수장으로서의 고뇌와 확신이 함께 담겨 있었다. 마주 앉은 그는 차 한 잔을 건네며 지난 반세기 동안 한국 경제와 궤를 같이해 온 한국관세사회의 발자취를 차분히 되짚었다. 그의 시선은 과거의 성과에 머물지 않았다. ‘새로운 100년’을 향한 다짐 속에서, 혁신을 향한 굳건한 의지는 또렷이 전해졌고, 그 울림은 강남의 차가운 겨울 공기마저 녹이기에 충분했다. 80억 달러 수출국에서 1.3조 달러 무역 강국으로 정