2월 18, 2022

NGS의 원리와 전염병에서 응용 방법

 

NGS의 원리와 전염병에서 응용 방법

 

Next Generation Sequencing(차세대 염기 서열 분석, NGS)는 다량의 DNA 조각을 한꺼번에 분석하는 기술이다. DNA 서열을 분석하는데 이용하는 Sanger의 방법과는 어떤 차이가 있으며, 향후 어떤 분야에 응용할 수 있을지 생각해보았다.


 

NGS의 과정과 그 원리


Nucleotide
의 중합체인 DNA의 온전한 길이는 2m에 달한다. 이렇게 긴 DNA의 서열을 온전히 분석할 수 있는 방법은 존재하지 않는다. DNA 안에는 수많은 구조적 패턴, exonintron, polymerase 부착 장소가 있고 그들 간의 상호작용을 우리는 아직 완벽히 알지 못하기 때문이다. 우리가 알고 있는 것이라고 하더라도 그 서열을 읽어낼 수 있는 장비는 존재하지 않는다. 그렇기 때문에 DNA의 서열을 분석하기 위해서는 파편화(fragmentation) 과정이 필수적이다.

DNA의 파편화는 NGS 기기가 분석 가능한 분자량 수준으로 DNA 가닥을 절단하는 과정이다. 에너지를 이용하여 DNA를 절단하는 방법이 있고(물리적 방법), 생체 촉매인 효소를 이용하여 절단하는 방법(화학적 방법)이 있다. 특정 주파수의 초음파 환경에서 DNA 가닥은 공진을 일으키다가 화학결합이 끊어진다. 이를 물리적 방법이라 한다. 물리적 방법은 초음파의 주파수, 노출 시간 등을 조절하여 DNA 가닥을 원하는 길이로 절단할 수 있게 해준다. 화학적 방법은 제한효소를 이용하여 DNA 가닥을 절단한다. 제한효소는 DNA의 특정 부위를 인식하여 절단한다.

DNA 파편들은 완전한 이중 나선구조가 아니라 한쪽 말단의 염기가 부족한 불완전한 구조다. 이를 균일하게 만들기 위해 염기서열이 긴 쪽을 잘라내거나 짧은 쪽을 상보적인 염기로 채워 넣는다. 이 과정을 말단 수리라고 부른다.

다음 단계는 말단이 수리된 DNA 가닥에 oligonucleotide를 부착하는 과정이다. OligonucleotideNGS 분석 기기에서 인식할 수 있는 바코드 정보를 지니고 있다.  Oligonucleotide 부착 이후, DNA 가닥은 대규모로 복제된다. 복제를 하기 위한 상보적인 염기에는 형광 물질(Illumina 방식)이 붙어있거나 양성자(Thermofisher 방식)가 붙어있다. A, T, C, G에는 서로 다른 파장의 형광 물질이 붙어있다. 상보적인 염기가 DNA 가닥과 결합하면 전자 오비탈의 변화가 일어나면서 형광 빛을 방출하거나 양성자를 방출한다. 형광을 인식하거나 전압차를 측정하는 방식으로 DNA 가닥의 서열을 알 수 있다.


 

Sanger법과의 차이


Sanger법은 하나의 주형 가닥을 두고 여러 분자량의 파편으로 자른 뒤, 형광 물질과 결합한 상보적인 염기를 부착한다. 그 뒤 전기영동을 통해 DNA 파편을 분자량 크기별로 정렬하고 순서대로 형광을 읽는 방식이다. 이 방식은 한 번에 하나의 DNA 가닥만을 분석할 수 있다. 반면 NGS를 이용하면 한 번에 수백만, 수천만 개의 가닥의 서열을 분석할 수 있다. 이는 연구에 들어가는 비용과 시간을 엄청나게 절약할 수 있게 해준다. 따라서 연구자들은 시간을 아껴 더 많은 분야에 도전할 수 있고, 의학 기술은 더 많이 발전할 수 있게 되었다.


전염병에서 NGS를 응용할 수 있는 예시

분자역학(molecular epidemiology)는 감염, 전파, 예방에 영향을 미치는 숙주와 병원체의 변이체를 확인하는 학문이다. 그러한 변이체를 확인하기 위해 분자역학자들은 질병의 유전적 배경을 설명해야 한다. 병원체 감염, 통제, 역학 조사를 위해서는 감염원을 결정해야 하고 전파 경로를 추적하며, 약물 내성을 담당하는 유전자를 식별하고 병원성을 결정하는 인자를 설명해야 하기 때문이다.

이를 위해 이전의 전통적인 방법은 가설을 설정하여 병원체를 식별하고 분석한다. 이 전통적인 방법은 많은 유기체를 다루는 데에는 한계가 있다. 수많은 DNA 서열을 분석하고 그들 사이의 상호작용을 알아내는 데에는 많은 시간과 연구자의 통찰이 들어가기 때문이다.

반면, NGS를 이용하면 수백, 수천만 개의 DNA 서열을 매우 정확하고 객관적으로 분석할 수 있다. NGS를 유전자 분석의 혁명이라고 부르는 이유이다.

수백, 수천만 개의 DNA 서열을 한 번에 분석할 수 있게 되면서 숙주 내에서 병원체가 어떤 변이를 일으켰는지 쉽고 빠르게 확인할 수 있게 되었다. 게다가 21세기에 들어와 생물정보학의 발전과 결합하여 그 변이가 어떻게 숙주와 상호작용할 수 있는지 전산 시뮬레이션을 이용해 확인할 수 있게 되었다. 이 과정은 기존의 방법으로는 매우 오랜 시간이 걸릴 뿐 아니라 많은 비용이 들어가는 과정이었다. 끊임없이 변화하는 전염병 병원체에 대항하는데 오랜 시간이 걸리는 것은 큰 한계점이었다.

또한 장내 미생물총을 분석하는 과정에 NGS를 이용한다. 기존의 방식으로는 장내 미생물총을 분석하려면 수많은 미생물 종을 동정하고, 각각의 종의 구조 단백질, 효소를 분석하고 그로 인한 특성을 일일이 확인해야만 했다. NGS가 개발되면서 이 과정은 혁신적으로 바뀌었다. 수백만개의 유전자 가닥의 서열을 한꺼번에 결정할 수 있기 때문이다. 게다가 생물정보학은 그들 사이의 상호작용 또한 분석할 수 있게 해주었다. 장내 미생물총을 분석하면서 우리는 동물체의 면역 과정에 대한 더 많은 지식을 알게 되었고, 그 지식을 다양한 분야에 응용할 수 있다.

NGS를 응용하는 예시는 이 말고도 무궁무진할 수 있다. 인류가 생명체의 설계도가 DNA라는 것을 알아낸 뒤, DNA를 분석하는 것이 NGS로 더 빠르고 정확해졌고 이제 인류 앞에는 정복할 수 있는 무궁무진한 분야가 남아있다.


 

참고문헌

Dale Muzzey, Understanding the Basics of NGS: From Mechanism to Variant Calling, Curr Genet Med Rep (2015) 3:158–165

Massive parallel sequencing - Wikipedia

Molecular Epidemiology | Determine infection sources and transmission routes (illumina.com)