중앙도그마 탐색기 프로젝트 요약
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
바이브코딩
대상자
- 생물정보학 개발자, AI 교육 도구 개발자, 생명과학 교육자
- 중급 이상의 Python 프로그래밍 경험과 생물학 기초 지식이 필요
핵심 요약
- Biopython을 활용한 유전자 시퀀스 처리 및 LLM 기반 생물학적 과정 설명 기능 구현
- Streamlit을 통한 사용자 인터페이스 개발로 DNA→mRNA→아미노산 전 과정 시각화
fetch_gene_sequence()
및transcribe_translate_dna()
함수를 통해 생물학적 핵심 개념(전사, 번역)을 코드화
섹션별 세부 요약
1. Biopython 통합 구현
fetch_gene_sequence(gene_symbol, organism="Homo sapiens")
함수로 유전자 시퀀스 검색transcribe_translate_dna(dna_seq)
함수로 DNA→mRNA→아미노산 시퀀스 변환- 유전자 데이터 처리 및 생물학적 과정의 기초적인 알고리즘 구현
2. LLM 기반 생물학 설명 기능
generate_explanation(dna_seq)
함수로 AI가 생물학적 과정을 초보자용으로 설명- PromptTemplate을 통해 LLM에게 명확한 입력 변수(
sequence
) 정의 - 500bp 이하의 DNA 시퀀스에 대한 설명 제한으로 성능 최적화
3. Streamlit 사용자 인터페이스
- DNA 시퀀스, mRNA 전사체, 아미노산 시퀀스의 시각적 표시
st.code()
및st.markdown()
을 활용한 코드 및 텍스트 출력- 사용자 친화적인 UI 설계로 교육적, 상호작용적 기능 구현
결론
- Biopython + AI + Streamlit의 조합으로 생물학적 개념을 교육 도구로 구현한 사례
fetch_gene_sequence()
와transcribe_translate_dna()
함수를 핵심으로 활용- 프로젝트 튜토리얼 동영상(https://youtu.be/2qi5UPiiS1Q)을 통해 구현 방법 공유 및 피드백 요청