AI, 의료 진단 정확도 94.9%…인간 개입 시 정확도 ‘뚝’

748
인간이 AI를 활용해 의료 진단을 할 경우, 정확도가 크게 떨어진다는 새로운 연구 결과가 나왔다. [사진: 셔터스톡]
인간이 AI를 활용해 의료 진단을 할 경우, 정확도가 크게 떨어진다는 새로운 연구 결과가 나왔다. [사진: 셔터스톡]

[디지털투데이 AI리포터] 챗GPT와 같은 생성형 인공지능(AI)은 의사 면허 시험을 통과할 뿐 아니라, 인간 의사보다 환자들에게 선호되는 답변을 제공할 수 있다는 연구 결과도 있다. 그러나 인간이 AI를 활용해 의료 진단을 할 경우, 정확도가 크게 떨어진다는 새로운 연구가 발표됐다.

16일(현지시간) 온라인 매체 기가진에 따르면 옥스퍼드대 연구팀은 지난달 대규모언어모델(LLM)의 임상 지식이 인간 상호작용에 적용되지 않는다는 내용의 논문을 발표했다.

연구팀은 1298명의 참가자를 대상으로 폐렴부터 감기까지 다양한 질환을 시뮬레이션한 시나리오를 제시했다. 참가자들은 AI와 상호작용하며 자가 진단을 수행했고, GPT-4o, 라마 3(Llama 3), 코맨드 R+(Command R+) 등 3개의 LLM을 사용할 수 있었다.

연구진은 의사들을 통해 각 시나리오에 대한 가장 정확한 진단과 대응책을 정립하고, 참가자들이 AI와 상호작용한 결과를 분석했다. 그 결과, LLM이 단독으로 진단할 경우 94.9%의 정확도를 보였지만, 인간이 이를 활용하면 관련 질환을 특정할 확률이 34.5%에 불과했다. 반면, AI 없이 스스로 진단한 경우에는 47%로 더 높았다. 

연구진은 참가자들이 AI에 불완전한 정보를 제공하거나 AI의 권고를 따르지 않는 점이 정확도 하락의 원인이라고 분석했다. 이어 AI가 의료 진단에 유용할 수 있지만, 인간과의 상호작용을 고려한 테스트가 필요하다고 지적했다.
 

+1
0
+1
0
+1
0
+1
0
+1
0

테크 랭킹 인기글