대량의 문헌 속 '바이오 경로 그림'들도 AI로 분석한다

KAIST, 바이오 경로 정보 자동 추출 AI 기술 개발
  • 등록 2024-11-28 오전 11:32:45

    수정 2024-11-28 오전 11:32:45

[이데일리 강민구 기자] 국내 연구진이 유전자, 단백질, 대사물질 등 복잡한 정보를 표현하는 바이오 경로 이미지를 자동 추출할 수 있는 인공지능(AI) 프레임워크를 개발했다. 바이오 분야 문헌들은 새로 발견한 유전자, 효소 등 생명체의 분자적 과정을 시각적으로 표현해 제시하는데 기존에 눈으로 보고 정리해야 했던 것을 자동으로 분석할 가능성을 제시한 것이다.

한국과학기술원(KAIST)은 김현욱 생명화학공학과 교수 연구팀이 바이오 경로 이미지에서 유전자와 대사물질 정보를 자동 추출하는 ‘바이오 경로 정보 추출 프레임워크(EBPI)’를 개발했다고 28일 밝혔다.

KAIST 연구진.(왼쪽부터)권문수 생명화학공학과 박사과정, 이준규 박사과정, 김현욱 교수.(사진=KAIST)
EBPI는 문헌에서 추출한 이미지 속의 화살표와 글자를 인식하고, 바이오 경로를 편집 가능한 표 형태로 재구성한다. 객체 감지 모델 등의 기계학습을 사용해 경로 이미지 내 화살표의 위치와 방향을 감지하고, 이미지 속 텍스트를 유전자, 단백질, 대사물질로 분류한다. 추출된 정보는 통합해 경로 정보를 표 형식으로 제공한다.

연구팀은 7만 4853편의 논문에서 추출한 바이오 경로 이미지와 기존 수작업으로 작성된 경로 지도를 비교해 EBPI 성능을 검증했다. 그 결과, 높은 정확도로 바이오 경로 정보가 추출됐음을 확인했다.

또 EBPI를 사용해 대표적인 바이오 경로 데이터베이스에 포함되지 않은 생화학 반응 정보도 대량의 문헌 내 바이오 경로 이미지로부터 추출하는 데에도 성공했다.

김현욱 교수는 “EBPI는 대규모 문헌 데이터 분석에서 중요한 도구가 될 수 있다”며 “생명공학, 대사공학, 합성생물학 분야에서 바이오 경로 이미지를 AI로 분석해 관련 연구의 실험 설계와 분석 시 유용하게 활용될 수 있다”고 말했다.

연구결과는 대사공학·합성생물학 분야 국제학술지 ‘대사공학(Metabolic Engineering)’ 11월호에 게재됐다.

이데일리
추천 뉴스by Taboola

당신을 위한
맞춤 뉴스by Dable

소셜 댓글

많이 본 뉴스

바이오 투자 길라잡이 팜이데일리

왼쪽 오른쪽

스무살의 설레임 스냅타임

왼쪽 오른쪽

재미에 지식을 더하다 영상+

왼쪽 오른쪽

두근두근 핫포토

  • "으아악! 안돼! 내 신발..."
  • 이즈나, 혼신의 무대
  • 만화 찢고 나온 미모
  • 지드래곤 스카프 ‘파워’
왼쪽 오른쪽

04517 서울시 중구 통일로 92 케이지타워 18F, 19F 이데일리

대표전화 02-3772-0114 I 이메일 webmaster@edaily.co.krI 사업자번호 107-81-75795

등록번호 서울 아 00090 I 등록일자 2005.10.25 I 회장 곽재선 I 발행·편집인 이익원 I 청소년보호책임자 고규대

ⓒ 이데일리. All rights reserved