|
비영리 단체 시큐어바이오의 바이러스학 평가 시험에서는 최신 LLM들이 단독으로 55~61점을 기록, 최고 수준 인간 바이러스학자 팀과 동등한 점수를 받았다. 전문가 약 36명의 평균 점수가 22점이었던 점을 감안하면 압도적인 결과다. 생물학 초보자가 LLM을 활용하는 경우에도 전문가들보다 높은 평균 28점을 기록했다. 이에 앤스로픽은 자사 LLM이 과학적 배경이 부족한 사람의 생물무기 개발을 도울 가능성을 더는 배제할 수 없다고 인정한 상태다.
실제 실험실에서의 위험은 아직 제한적이라는 반박도 나온다. 비영리 단체 액티브사이트가 지난 2월 발표한 무작위 대조 시험에서 생물학 경험이 거의 없는 153명에게 AI를 활용해 바이러스 생산 관련 과제를 수행하도록 한 결과, 핵심 과제를 완수한 것은 4명에 그쳤다. 인터넷만 쓴 대조군(5명)보다 오히려 적은 수준이다.
박사급 전문가가 활용할 경우 결과는 달라질 수 있다. 앤스로픽 자체 평가에서 AI 모델 미토스(Mythos)와 오푸스(Opus)가 박사급 바이러스학 전문가의 작업 속도를 크게 높이고 더 나은 실험 절차를 만들어내는 것으로 나타났다. 다만 모든 절차에 실제 실험을 실패로 이끌 치명적 오류가 포함돼 있었다.
‘환각’과 ‘과잉 확신’도 약점이다. 앤스로픽 평가에서 모델은 인간 전문가가 비현실적 아이디어를 제시할 때 다른 방안을 제안하기보다 그 아이디어를 부추기는 경향을 보였다. 한 평가자는 “미토스가 제시한 절차에는 반드시 실패하게 만드는 단계가 들어 있었다”고 지적했다.
실제로 액티브사이트가 후속 연구 결과를 발표하기까지 6개월 동안 생물학 능력이 향상된 첨단 모델이 4개나 새로 출시됐다. 안전성 평가가 모델 출시 속도를 따라잡지 못하고 있다는 의미다.
이코노미스트는 “개발사들이 신모델 출시 속도를 늦춰야 할 수도 있다”고 지적했다. 앤스로픽은 지난달 사이버 보안 분야 세계 최고 수준 자사 모델 미토스의 위험이 해결될 때까지 접근을 제한한다고 발표한 바 있다.





![[포토]인사말 전하는 구윤철 경제부총리](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051501239t.jpg)
![[포토]현세린,우승의 기쁨](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051501227t.jpg)
![[포토] 최민철, 핀하이로 날린다](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051500661t.jpg)
![[포토]'숙명 120, 지금 바로 RUN' 완주를 위해!](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051500513t.jpg)
![[포토]서교림,파이팅 출발](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051401739t.jpg)
![[포토]‘8천피’ 턱밑까지 진군한 코스피](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051401066t.jpg)
![[포토]시청 앞에서 선 오세훈 국민의힘 서울시장 후보](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051400545t.jpg)
![[포토] 서울시장 후보들은 정비사업 원점재검토하라~](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051400501t.jpg)
![[포토]서울시장 후보 초청 편집인협회 포럼, '모두발언하는 정원오'](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051400432t.jpg)
![[포토]김민솔,강하게 승리한다](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/05/PS26051301707t.jpg)


