알파지놈, 딥마인드가 100만 DNA 분석 기술 공개
AI Store에서 AI코딩으로 만들어진 앱을 만나보세요!
지금 바로 방문하기

DNA 100만 개 동시 분석"…구글 딥마인드, '알파지놈' 공개

카테고리

데이터 과학/AI

서브카테고리

인공지능, 머신러닝, 데이터 분석

대상자

생물정보학자, 의학 연구자, AI 개발자 / 중급 이상의 기술 이해 필요

핵심 요약

  • 알파지놈(AlphaGenome)DNA 서열 100만 개를 동시에 분석하며, 염기 수준의 정밀 예측이 가능하다.
  • 컨볼루션 및 트랜스포머 구조를 기반으로, 24개 예측 과제 중 22개에서 기존 모델보다 우수한 성능을 보인다.
  • ENCODE, GTEx, FANTOM5대규모 유전체 데이터를 사용해 모델을 학습시켰다.

섹션별 세부 요약

1. 알파지놈 개요

  • 구글 딥마인드가 AI 기반 DNA 서열 분석 모델 '알파지놈(AlphaGenome)'을 연구용 API 형태로 공개했다.
  • 비상업적 이용이 가능하며, DNA 글자 100만 개를 한 번에 분석할 수 있다.
  • 염기 수준에서의 정밀 예측을 통해 멀리 떨어진 유전자 조절 영역까지 분석 가능하다.

2. 주요 기능 및 기술적 특징

  • 컨볼루션과 트랜스포머 구조를 결합하여, 긴 DNA 서열의 높은 해상도 분석이 가능하다.
  • 변이 서열과 원래 서열의 차이를 1초 내에 비교해 유전 변이의 영향을 분석할 수 있다.
  • RNA 접합부 예측 기능으로, 스플라이싱 오류로 인한 희귀 질환 분석에 활용 가능하다.

3. 성능 및 활용 사례

  • 24개 예측 과제 중 22개에서 기존 최고 모델보다 우수한 성능을 기록했다.
  • 조절 효과 예측 과제에서는 26개 중 24개에서 최상위 성능을 달성했다.
  • 엔포머(Enformer) 기반으로 작동하며, 알파미스센스(AlphaMissense)와 함께 사용 시 비코딩 영역까지 분석 가능하다.

4. 데이터 출처 및 학습

  • ENCODE, GTEx, FANTOM5대규모 유전체 데이터를 사용해 모델을 학습시켰다.
  • 유전체 98%를 차지하는 비코딩 영역 분석이 가능해, 희귀 질환 연구에 활용 가능하다.

결론

  • 알파지놈은 대규모 유전체 데이터 분석에 강점을 가진 AI 모델로, 생물학 및 의학 연구에 실질적인 도움이 된다.