확대 l 축소

[교수님 인터뷰] 서울대학교 자연과학대학 통계학과 박태성 교수님

정밀맞춤의학의 초석을 마련하다
생물학 빅데이터 분석·해석 방법론 개발
서울대학교 통계학과 박태성 교수







유전자를 분석해 개인에 맞게 치료하고, 미래에 발병할 수 있는 질환을 예측해 이에 대비하는 맞춤의학, 예측의학 시대가 현실로 다가오고 있다. 2013년 영화배우 안젤리나 졸리가 유방암 고위험유전자 ‘BRCA1’이 자신에게 있다는 사실을 알게 된 후 유방 제거 수술을 받은 것과 같이 특정 질병에 취약한 고위험군을 미리 찾아 예방할 수 있는 시대가 시작된 것이다. 맞춤의학은 개인의 유전 정보, 복잡하게 얽혀 있는 생물학적 메커니즘을 파악하는 것이 핵심이다. 따라서 생물정보 분석을 위한 많은 방법론이 제시되고 있는데, 생물학 빅데이터는 제대로 해석하는 것이 상당히 어렵다. 이러한 가운데 최근 서울대학교 박태성 교수 연구팀이 패스웨이 (pathway) 정보를 바탕으로 대용량 유전체 자료를 빠르게 분석하고 유의미한 유전자를 발굴할 수 있는 방법론을 개발해 맞춤의학의 수준을 한 단계 끌어올릴 것으로 기대를 모으고 있다.



패스웨이 기반 유전체 빅데이터 분석 방법론 개발
영화 ‘가타카’ 속에 그려진 미래 세계에서는 피 한 방울·피부 한 조각·오줌·머리카락·침 등으로 인간의 모든 유전자 정보를 파악해 각 개인별 특성을 분석할 수 있다. 즉, 아이가 태어나자마자 신경정신병, 심장질환 등에 걸릴 가능성은 물론 예상수명까지 알 수 있게 되는 것이다. 영화 속에서 그려진 가상의 미래이지만, 유전자 정보를 다루는 생물정보학이 급속히 발전하면서 질병이나 수명 등을 예측할 수 있는 시대가 현실로 다가오고 있다.


생물정보학은 생물학 연구를 통해 축적한 데이터, 정보, 지식 등을 전산, 통계, 수학 등 보다 논리적인 수단을 통해서 효율적으로 관리하고 가공해 의미 있는 결과를 도출해내는 학문이다. 1977년에 DNA염기서열 분석기술이 처음 개발된 후 1990년 인간 게놈프로젝트를 통한 대량의 염기서열 데이터들이 본격적으로 데이터가 쏟아져 나오면서 생물정보기술에 대한 필요성이 증가되기 시작했다. 과거 유전자 단위에서부터 인간 전체로 분석의 단위가 커지고, 그 대상과 방법이 진화하면서 데이터 양이 기하급수적으로 증가했는데, 이러한 방대한 생물연구정보를 처리하기 위해 생물정보학의 역할이 점점 더 중요해지고 있다.






그러나 생물학 분야의 빅데이터를 제대로 분석하고 해석하는 일은 상당히 어렵다. 최근 학자들 사이에 회자되는 ‘자료 생산비용 1천 달러, 분석 비용 10만 달러, 해석 비용 100만 달러’라는 말은 분석과 해석이 얼마나 어려운 일인지, 어느 정도로 가치 있는 일인지를 함축적으로 나타낸다. 생물학 자료는 생물학적 현상의 일부만을 간접적으로 반영하기 때문에 추가적인 검증작업이 필요하다. 최근 차세대 염기서열 분석기술에 의해 대규모 유전체 자료가 대량으로 생산되고 있지만 체계적 분석 기술 개발은 아주 느린 상태다. 따라서 분석 결과를 제대로 해석하는 것은 그보다 더 어려운 일이라고 할 수 있다.


이러한 가운데 서울대학교 통계학과 박태성 교수가 패스웨이(Pathway) 정보를 바탕으로 대용량 유전체 자료를 빠르게 분석하고 유의미한 생물학적 해석을 할 수 있는 국제적인 수준의 연구방법론을 개발해 세계 과학계의 이목을 집중시켰다. 패스웨이는 단백질, 유전자, 세포 등 생체 요소 간의 상호작용과 역학관계를 세밀하게 설명할 수 있는 생물학적 심층지식을 말한다.


“그동안 저희 연구팀에서도 수많은 자료를 분석했지만, 그 결과를 제대로 해석해서 생물학적 의미를 찾아내는 작업은 쉽지 않았습니다. 자료에 대해 단순하게 통계적인 분석방법을 적용하는 것보다는 기존에 이미 잘 알려진 생물학적 정보를 결합해 분석하는 것이 타당하다고 생각했고, 그 결합분석의 일환으로 생물학 패스웨이 정보를 활용하는 시도를 하게 되었습니다.”



연구팀은 복잡한 변수 간 연관성을 살펴볼 수 있는 구조방정식(사회과학 분야에서 널리 사용되는 통계모형으로 주로 직접 관측할 수 없는 잠재변수를 포함시켜 변수 간의 인과관계를 설명하기 위한 통계적 방법론) 모형을 응용해 생물학적 패스웨이 정보를 통계학적 구조로 변환시키는 새로운 방법론 ‘파라오(PHARAOH)’를 개발하는 데 성공했다. 이 방법론은 대규모 유전체 자료를 빠른 속도로 분석해 유의미한 유전자를 발굴할 수 있는 방법이다. 생물학적 구조 정보를 바로 활용하는 패스웨이 기반 분석 방법이기 때문에 직관적인 생물학적 해석이 바로 가능하고, 재현성 확인이 필수인 유전체 연구에서 쉽게 재현성을 도출할 수 있다.





“이 연구는 생물학 빅데이터의 분석과 해석을 위한 핵심 방법론을 개발한 것이라고 할 수 있습니다. 따라서 복잡하게 얽혀 있는 생물학적 메커니즘을 쉽게 통합해 분석하는 것이 가능합니다. 향후 질병 예측과 개인별 맞춤치료 등에 필요한 다양한 오믹스 빅데이터 분석모형으로 활용될 수 있을 것으로 기대됩니다.”
박태성 교수는 미래창조과학부와 한국연구재단으로부터 2017년 1월 ‘이달의 과학기술인상’ 수상자로 선정되며 이번 연구성과의 우수성을 인정받았다.






당뇨병 발병 관련 16개 유전요인 발굴 기여
박태성 교수는 실제 환자들의 건강에 유익하고, 나아가 정밀맞춤의학을 구현하는 데 기여할 수 있도록 생물정보학, 생물통계학 분야의 연구를 선도해 왔다.


앞서 2016년 7월에는 세계 22개국과 함께 국제 공동연구를 수행한 결과 당뇨병 발병에 직접적으로 영향을 주는 혈당, 체내 대사조절 관련 16개 신규 유전요인을 최초 발굴하는 데 기여한 바 있다. 5개 인종(유럽인, 동아시아인, 남아시아인, 아메리카인, 아프리카인) 약 12만 명을 대상으로 진행한 당뇨병 관련 세계 최대 규모의 연구로서, 국내에서는 유전체 분석 전문가 박태성 교수 연구팀을 비롯해 서울대학교병원 내분비내과 박경수 교수팀, 서울대학교 보건대학원 원성호 교수팀과 국립보건원의 유전체센터 연구팀 등 관련 분야 전문가들이 참여했다. 특히 이번 연구는 대상자 중 약 1만 명에게 최신 유전체 연구기법인 차세대염기서열분석 방법을 적용했다는 점에서 주목 받았다. 차세대염기서열분석은 수많은 염기 정보를 빠른 시간에 병렬로 분석해내는 방법으로 인간의 30억 염기 정보를 3일 내로 확인할 수 있는 획기적인 실험기법으로 알려져 있다.


연구결과 기존 연구에서는 당뇨병과 관련된 유전 부위를 발굴하는 데 그친 반면, 당뇨병에 직접 영향을 주는 것으로 알려진 혈당 및 체내 대사와 밀접하게 관련된 단백질의 기능을 변화시키는 다수의 유전요인을 발굴했다. 또한 당뇨 관련 유전요인은 대부분은 5개 인종에서 유사함을 확인했으나, 2개 유전요인(PAX4, FES 유전자)은 아시아인에서만 나타나는 것으로 확인되었다. 약 4천 명의 아시아인을 대상으로 얻은 결과이기 때문에 향후 더 많은 수의 아시아인을 대상으로 연구할 경우 추가적인 유전요인을 발굴할 가능성이 있을 것으로 예상된다.


아울러 이번 연구결과를 통해 질병에 직접적으로 영향을 주는 것으로 알려진 다수의 유전요인을 발굴함에 따라 당뇨병 맞춤치료 및 관련 약물 개발을 앞당기고, 당뇨병에 대한 정밀의료에 한걸음 더 가까워질 수 있을 것으로 전망된다. 이 국제 공동연구 결과는 세계 최고학술지인 ‘Nature(IF 38.138)’ 2016년 7월호에 게재되었다.


이 뿐 아니라 박태성 교수는 유전자 정보를 통한 유방암 예측검사 ‘온코타입 디엑스(oncotype DX)’가 2004년 논문이 처음 발표되었을 당시 공저자로 이름을 올린 바 있다. 온코타입 디엑스는 250개의 후보 중에서 암에 대한 발현량을 통계 분석해 유전자 21개(유방암 유전자 16개, 참고 유전자 5개)를 추리고, 이를 분석함으로써 유방암의 재발 가능성을 예측하는 기법으로, 미국에서만 매년 7만 명 이상이 이 검사를 받는다. 유전자 정보를 통한 맞춤치료, 예측치료 역사에 한 획을 그은 세계 최고의 사례로 꼽힌다.






창의적 두뇌집단 ‘생물정보통계연구실’
박태성 교수는 매년 20여 편 이상의 논문을 발표하며, 질적·양적으로 우수한 연구성과를 창출하고 있다. 이처럼 괄목할 만한 성과를 낼 수 있었던 데는 박태성 교수 연구의 싱크탱크라고 할 수 있는 ‘생물정보통계(BioInformatics & BioStatistics, BIBS)연구실’이 탄탄한 토대가 되어 주었기에 가능했다.


“제가 의미 있는 연구성과들을 얻을 수 있었던 것은 우리 연구실의 훌륭한 연구원과 대학원생들의 노력 덕분이라고 할 수 있습니다. 저 혼자만의 힘으로는 이 만큼 질적으로 우수하고 양적으로 많은 논문을 게재할 수 없었을 것입니다. ‘1만 스승은 있으되 아비는 많지 않다’라는 표현이 있습니다. 지식만을 전달하는 스승이 아니라 아버지 같은 마음으로 학생들을 아끼고 사랑하는 스승이 되려고 노력하고 있습니다.”


연구실은 국내 생물정보학, 생물통계학 분야의 연구를 선도하고 있으며 2005년 통계학 분야 최초로 NRL(National Research Laboratory)에 선정되어 5년 동안 유전체, 전사체 연구를 수행해 왔다. 2012년에는 NRL을 통해 축척한 연구 결과를 기반으로 통계학 분야에서는 최초로 창의연구단으로 선정되어 대규모 고차원 생물정보학 자료의 분석을 위한 연구에 집중하고 있다.


최근 새로운 유전체 기술의 발달로 인해 대용량의 유전체 데이터가 낮은 가격으로 생산되면서 개인 수준에서도 유전정보를 뽑아낼 수 있는 시대가 현실로 다가 왔다. 따라서 다양하고 방대한 자료들 중 의미 있는 정보를 효율적으로 찾아내기 위해 통계학의 필요성이 더욱 절실해지고 있으며, 통계학의 여러 가지 방법들이 이러한 대규모 오믹스 자료의 분석에 응용됨으로써 질병 연구에 크게 기여하고 있다.






이에 생물정보통계연구실에서는 마이크로어레이 기술을 이용한 유전자 발현이나 단일염기다형성(SNP)과 같은 유전체 자료, 차세대염기서열해독(NGS) 기술을 통한 유전체 및 후성유전체 자료 등 다양한 종류의 오믹스 자료를 통합 분석하기 위한 통계학 기반의 분석 방법 및 기술을 연구한다. 나아가 유전자 간의 복잡한 상호작용탐지 및 여러 수준의 오믹스 자료를 통합 분석할 수 있는 방법을 개발해 생물학적 현상의 보다 깊은 이해를 도모하고 질병이 일어나는 원인 및 기작 등을 밝혀내 인류복지 증진에 기여하는 것을 목표로 걸음을 재촉하고 있다.


평소 박태성 교수가 연구라는 여정을 함께 해주고 있는 연구원, 학생들에게 가장 강조하는 점은 연구에 대한 ‘재미’, ‘즐거움’이다. 그리고 이러한 연구관은 구성원들이 연구를 수행하면서 겪게 되는 부담감과 책임감을 덜어내고, 창의성을 키우며 앞으로 뻗어나갈 수 있는 동력이 되고 있다.


“연구는 ‘반드시 해야 한다’는 책임감이 앞서면 오래 지속할 수 없는 일입니다. 무엇보다 연구가 ‘재미’있어야 오래 할 수 있습니다. 사람마다 가지고 있는 능력의 그릇은 다를지라도 연구를 즐기면서 한다면 누구나 자신의 능력을 키우고 발전할 수 있다고 생각합니다.”






정밀맞춤의학 구현, 그 도전의 길 위에 서다
박태성 교수는 생물정보학의 불모지와 다름없었던 국내에서 지난 2000년 생물학 빅데이터 자료를 분석하기 위한 새로운 방법과 분석 프로그램 개발에 중점을 두고 생물정보학, 생물통계학 전문가로서의 길을 개척해 왔다.


“생물정보학 분야에 대한 관심은 2000년에 국내에서 최초로 생산된 3,800개의 mRNA의 발현 값을 측정한 마이크로어레이 자료를 접하면서부터 시작되었습니다. 마이크로어레이 자료의 등장은 기존 생물정보학에서의 통계학 패러다임을 전환시켰죠. 이에 고차원 빅데이터를 분석하기 위한 새로운 통계 방법론 개발에 대한 도전의식과 목표가 생겼고, 이후 관련 연구에 집중하게 되었습니다.”


순수학문이라 할 수 있는 수학적 지식이 바이오와 결합되면서 첨단산업과 응용연구가 더욱 활성화 되고 있다. 그리고 이러한 첨단 바이오 기술은 새로운 종류의 빅데이터를 생산하는데, 새로운 빅데이터는 대부분 기존의 분석방법으로 분석하기가 쉽지 않다. 따라서 ‘새로운 첨단기술-새로운 빅데이터-새로운 분석방법 개발의 연구’ 사이클은 앞으로도 지속될 전망이다. 박태성 교수는 매일 새로운 종류의 빅데이터를 접할 수 있다는 것이 생물정보학자가 가지는 가장 큰 매력이라며 앞으로도 새로운 분석방법을 개발하며 첨단 바이오 시대를 여는 데 앞장서겠다는 포부를 전했다.


박태성 교수는 현재 유전자동의보감사업과 포스트게놈사업을 수행하고 있으며, 이 사업들은 실제 연구에 관여하고 있는 임상연구자들이 환자들로부터 임상자료와 유전체 자료를 직접 생산한다. 따라서 이 자료들의 분석을 통해 실제로 환자들의 삶에 유익한 연구결과를 얻을 수 있도록 연구에 박차를 가한다는 계획이다.


“무엇보다 사람들에게 실제적이고 직접적으로 유익할 수 있는 연구를 하고 싶습니다. 그래서 최근 화두가 되고 있는 정밀맞춤의학을 구현하는 데 실질적인 기여를 하는 것이 목표입니다. 또한 현재 수행 중인 유전자동의보감사업과 췌장암, 간암, 난소암에 대한 조기진단, 맞춤치료 등에 대한 연구를 성공적으로 수행할 수 있도록 노력하겠습니다.”






미국의 시인 랠프 왈도 에머슨은 ‘성공이란 무엇인가’라는 시를 통해 ‘자기가 태어나기 전보다 세상을 조금이라도 살기 좋은 곳으로 만들어 놓고 떠나는 것/자신이 한 때 이곳에 살았음으로 인해 단 한 사람의 인생이라도 행복해지는 것’을 진정한 성공이라고 정의했다. 연구를 통해 더 나은 세상을 만들고, 사람들이 행복한 세상을 만들겠다는 박태성 교수의 꿈은 시 구절처럼 진정한 성공의 길을 올곧게 향하고 있는 듯하다. 오늘도 정밀맞춤의학 구현을 위해 한 발 한 발 깊이 있는 걸음을 내딛고 있는 박태성 교수의 열정에 응원의 박수를 보낸다.



취재기자 / 안유정(reporter1@s21.co.kr)



<이 기사는 사이언스21 매거진 2017년 8월호에 게재 되었습니다.>

이전화면맨위로

확대 l 축소