에세이/결석에세이

결석 에세이_이유진

알 수 없는 사용자 2023. 5. 21. 16:47

저는 어릴 때부터 냄새 인식과 장기기억의 상관관계에 대해 궁금증을 갖고 있었고,

그 호기심을 가지고 생명공학과에 입학했습니다. 생리학 수업을 들으며 이 문제와 관련이 있는 변연계의 연구가 까다로운 파트라는 것을 알게 되었고, 미생물학을 들으며 냄새를 일으키는 화학 분자가 미생물로부터 많이 온다는 것을 배웠습니다. 제가 하고 싶은 연구 부분을 하나하나 원리를 이해하며 해답을 찾는 것은 어려운 일이라는 것을 학년이 올라갈수록 실감하게 됐습니다.

 

 

이렇게 해당 연구가 어렵다고 느껴져 포기할 때쯤 저는 생물정보학 수업과 기초 프로그래밍 수업을 수강하면서 이 문제에 대해 다른 생각을 하게 되었습니다. 물리학에서처럼 근본적 원리를 파악하고 이를 적용하는 연구가 아닌, 수많은 데이터를 놓고 분석하는 데에 있어 프로그래밍과 컴퓨터 자동화를 이용한다면 귀납적 탐구 방법도 효율적으로 사용할 수 있겠다라는 생각이 들었습니다. 그런 계기로 데이터사이언스 소학회 DSOB에도 가입하게 되었습니다.

 

 

 

현재 우리학교에서도 바이오인포매틱스 연계전공이 개설되어있으며 생명환경공학 학과장인

김명겸 교수님도 바이오인포매틱스에 큰 애정을 가지고 있으나, 실질적으로 학계나 산업에서 진행되는 생물정보학을 경험할 수 없어 이번 계기로 관련 논문과 바이오인포매틱스를 전업으로 삼는 회사인 3BIGS에 대해 조사해보는 시간을 가지겠습니다.

 

 

 

 

먼저, 바이오인포매틱스는 정의하기에 애매한 부분이 많습니다.

연구자들 사이에서도 용어를 혼용해서 사용하기 때문입니다.

그러나 큰 의미로 컴퓨터 운영체제나 프로그래밍을 이용하여 생명정보를 다루는 모든 연구를 생물정보(Bioinformatics)라고 합니다.

먼저 우리학교에서 진행하는 생물정보학 연구로는 세균의 계통수 분류와 신종미생물을 찾아내는 일을 하는데 생물정보학을 이용하고 있습니다.

아래의 과정으로 세균을 동정하고 계통수를 그립니다.

 

 

(미생물분류학 및 실험에서 진행한 신종세균의 파악에서 사용한 생물정보학)

 

 

 

계통 수 작성(프로그램 이용)

 

 

 

 

 

하지만 이렇듯 미생물의 데이터 분석 이외에도 현재 산업에서 가장 많이 사용되는 분야는 아무래도 사람의 유전체 분석일 것입니다.

모든 사람은 유전체가 99% 동일합니다. 1% 다른 유전자 서열을 SNP(Single Nucleotide polymorphism)라고 하는데 이러한 사람간의 차이를 분석하여 의료보건 분야에 응용할 있습니다.

만약, 항암제가 있다면 항암제가 듣는 환자도 있을 것이고 안듣는 환자도 있을 것입니다.

과거에는 모든 항암제를 환자에게 모두 사용하여 맞는 것을 찾았었다면,

이제는 해당 환자의 유전체서열에 맞춰 적합한 항암제를 투약하는 방식으로 바뀌게 되는 것입니다. 이는 맞춤의학의 도래를 의미합니다.

 

실제로 현재 개인의 유전체 전체를 분석하는데 100만원 정도 비용이 들지만 2년뒤면 가격은 2만원정도로 낮아질 것이고 의료분야에서는 맞춤의학, 의료AI 산업이 구축될 것이라고 기대합니다.

 

우리나라에서도 지난 년동안 분야에 뛰어든 많은 신생기업이 많습니다.

테라젠바이오(https://www.theragenbio.com/ ), 3BIGS(https://3bigs.com/en/drug-discovery-platform/ ) 등이 있습니다. 기업은 바이오인포매틱스를 이용하여 산업에 적용하고 있는 대표 회사입니다.

 

 

(1)테라젠 바이오

 

 

 

 

(2) 3BIGS

 

 

 

제가 생각했을 빅데이터를 이용하여 귀납적으로 질병에 접근하고 사람의 유전과 질병을 파악하는게 효율적인 이유는 생명체 자체가 끊임없이 변화하는 존재이기 때문에 절대적인 진리가 없기 때문이라고 생각합니다.

 

우리가 2003 인간게놈 프로젝트를 성공적으로 끝내서 인간의 30억쌍 염기서열 전체를 파악했지만 여전히 우리에게는 우리몸안의 작은 돌연변이들 모든 생명현상을 하나하나 밝혀낼 없습니다.

 

특히 유전자가 모든게 아니라는 현대 생물학의 epigenetics(후성유전체학) 바이오인포매틱스를 통한 연구방법에 적합한 방식이 아닐까라는 생각을 하게 합니다.

(후성유전체학 : DNA 염기서열의 변화 없이 DNA 염기나 히스톤 단백질(DNA 가닥을 감는 실패) 분자 표지를 남겨 유전자 발현을 조절해 생명현상에 영향을 미치는 과정을 연구하는 학문)

 

논문 출처 :  김하연, 배세은, & 손현석. (2011). Epigenetics 분야에서의 생명정보학보건학논집48(1), 47-54.

 

 

 

이와 같은 연구 결과들로 인해 기존에 이루어졌 던 유전학적인 연구 방법으로 설명되지 않은 많은 현상들을
epigenetic 분야의 연구로써 밝혀내 고자 다양한 노력이 이루어지고 있는데, 최근 분자생물학적 기술의 발전에 따라 epigenetic 데이터들을 대용량으로 얻을 수 있게 되면서 점차 이 분야의 연구가 활성화되고 있다.
특히, 방대한 양의 생물학적 데이터들을 다룰 수 있는 생물정보학 분야의 연구 방법이 앞으로의 epigenetic 연구를
수행하는 데 있어 많은 도움을 줄 수 있을 것이라 기대되고 있으며, 생물정 보학적 연구 방법을 활용함으로써 기존 epigenetics의 연구 방식에서 한 단계 나아간 좀 더 복잡한 수준에서의 분석이 가능하게 될 것이라 생각된다 '

아래는 후성유전체학 데이터뱅크와 분석툴에 대한 표 이다. 

epigenetic 변화들을 담아내 는 epigenome map을 구현하기 위한 프로젝트

 

 

질환에서 나타나는 epigenetic 변화를 바탕으로 밝혀지지 않은 질환 발생 메커니즘을 이해하고,
치료 방법을 찾아내기 위해 epigenetic 분석 연구들이 많이 이루어지고 있는데,
그 중에서도 암에 관한 epigenetic 연구가 가장 활발하다. 암 질환에서 발생하는 DNA methylation 패턴이
정상 조직에서 나타나는 것보다 더 많은 변이를 나타낸다는 것은 연구를 통해 많이 알려져 있다

 

 

 

이를 세부적으로 연구하기 위한 다양한 cancer epigenetic project가 진행 중이며, 대표적으로 Cancer Dip Consortium에서는 각각의 암 종류 에서의 methylation 패턴을 확인하기 위한 Methyl-DNA immunoprecipitation(MeDIP) 분석을 수행하고 있다. 그리고 암 질환에서는 CpG islands에서의 변이가 빈번하게 발생하는데, 이와 같은 특성을 통해 건강한 개인들 사이에서 나타 나는 DNA methylation 변이를 linear regression model을 이용하여 분석하고자 EpiGRAPH web service
(http://epigraph.mpi-inf.mpg.de/WebGRAPH/)가 개발되어 있다.  
또한, epigenetic markers를 기반으로 암의 subtypes을 예측하고 분류하는 연구도 수행되었는데, SVM 기법을 이용하여  급성 림프구성 백혈병과 급성 골수성 백혈병을 분류하고, Manhattan distance와 hierarchical cluster 분석을 통해 대장암의 subtypes을 분류함으로써 질환에 따라 epigenetic 특성이 다르게 나타 나며 질환의 연구에서 epigenetic 분석이 중요하 게 이용될 수 있음을 확인시켜 주었다. 

암에서뿐만 아니라 알츠하이머 질환과 같은 노화와 관련 있는 퇴행성 질환에서의 epigenetic 특성이 관찰됨에 따라 epigenetic 연구의 범위는 점차 확장되고 있다

 

 

논문 결론 

발전된 분자생물학적 기술에 의해 대용량의 생물학적 데이터들이 발생하게 되고, epigenetics 분야에서도 마찬가지로 관련된 실험 데이터들이 빠른 속도로 증가하고 있다. 이에 따라 효율적인 데이터 수집 및 가공, 해석 등을 위해서 기존 epigenetics 연구 방식에서 한 단계 나아간 computational epigenetics가 대두하게 되었다. 기본적으로 epigenetics 분야에서의 연구는 epigenetic modification에 해당하는 DNA methylation과 histone modification을 중점적으로 다루고 있는데, 현상에 대한 이해를 향상시키기 위해 좀 더 다양한 수준에서 많은 데이터를 대상으로 연구할 수 있는 computational epigenetics가 주목받기 시작하였다
앞서 본문에서도 살펴보았듯이 현재 이루어지고 있는 computational epigenetics에서는 epigenetic 분석을 위한 데이터베이스 및 분석 프로그램 등에서 다 양한 생물정보학적 기법들이 이용되고 있고, 앞 으로도 더 많은 생물정보학적 기법들이 이용될 것이라 예측된다.
이처럼 epigenetic modification에 관한 패턴을 빠르게 읽어낼 수 있는 다양한 생물정보학적 기법들을 개발하여 구축해 나간다면 현재 밝혀지지 않은 많은 생물학적 현상들을 이해하는 데 이바지할 수 있을 것이라 예측된다.

 

해당 논문과 바이오인포매틱스 회사를 조사하면서,

앞으로 단순한 생물체의 유전체 파악 뿐만 아니라 생물학, 의학연구에서 유전자 그 이상의 데이터(후성유전체)에 대한

정보까지 빅데이터를 이용하여 파악해야하고, 이러한 분석을 통하여 난치병에 대한 해결안이나 의약품 개발,

또는 생명현상에 대한 이해할 수 있다는 것을 알게 되었습니다.

이러한 점이  IT분석 전문가, 데이터애널리스트가 아닌 생물학자도 데이터과학을 공부해야하는 이유일 것입니다. 

 

'에세이 > 결석에세이' 카테고리의 다른 글

결석에세이_강구슬  (3) 2024.09.19
결석에세이_김규의  (0) 2024.07.15
결석에세이_김윤아  (0) 2024.04.12
결석에세이_허서원  (0) 2023.07.14
결석에세이_김가림  (0) 2023.05.11