㈜셀레믹스

Blogs

Discover our Innovative Stories

인덱스 호핑(Index Hopping)을 방지하는 방법

  • Post category:Blogs

 

 차세대 염기서열 분석기술(NGS)는 대량의 염기서열 분석 데이터를 저렴한 비용으로 생산할 수 있는 기술로 다양한 분야에서 활용되고 있습니다. 한 번의 장비 수행에서 생산되는 데이터의 양이 워낙 방대하기 때문에 여러 개의 샘플을 동시에 분석할 수 있도록 인덱스 서열을 이용하여 각 샘플의 데이터를 구분하는데 사용합니다. 그러나 일부 시퀀싱 장비에서는 샘플에 추가한 인덱스가 다른 샘플의 인덱스와 뒤바뀌어 데이터가 서로 섞이는 현상이 나타나기도 합니다. 이러한 현상을 인덱스 호핑(Index Hopping)이라고 부릅니다. 예를 들어, 일루미나(Illumina) 사의 시퀀싱 장비 중 patterned flowcell을 사용하는 장비에서는 약 0.5 – 3% 내외의 인덱스 호핑이 나타날 수 있다고 합니다.

 

인덱스 호핑(Index Hopping)은 시퀀싱 라이브러리 내에서 남아있는 잔여 어댑터( Residual adapters) 및 인덱스 프라이머 올리고로 인해 발생할 수 있습니다. 어댑터나 프라이머가 NGS 라이브러리와 결합하여 원래의 인덱스 서열을 대체하면 인덱스 호핑(Index Hopping)이 발생합니다. 실험 중에 이러한 잔여 어댑터(Residual adapters)를 최대한 제거하여 NGS 라이브러리의 순도를 높이면 인덱스 호핑(Index Hopping)을 최소화할 수 있습니다. 일반적인 NGS 라이브러리 제작의 경우 실험 중간 단계에서 많은 정제 과정을 통해 여분의 올리고가 제거될 수 있는데, 이러한 정제 과정이 생략되는 PCR-free 라이브러리 제작을 이용하는 경우 인덱스 호핑(Index Hopping) 비율이 실제로 더 높게 나타나는 것이 관찰되었습니다.

 

추가적으로, Unique Dual Index(UDI)를 사용하는 방법이 있습니다. Dual index는 NGS 라이브러리의 양 쪽에 모두 인덱스를 포함하는 형태를 말하는데, UDI는 각 샘플들이 인덱스를 서로 공유하지 않고 두 인덱스 모두 고유의 서열을 사용하는 방식입니다. 그렇기 때문에 인덱스 호핑(Index Hopping)이 발생하여 하나의 인덱스가 바뀌더라도 다른 샘플들의 인덱스 조합과 겹치지 않기 때문에 해당 데이터를 제거하여 데이터의 오염을 방지할 수 있습니다.

 

Figure – Overview of index hopping and prevention effect by UDI

Figure. Overview of index hopping and prevention effect by UDI (Index Hopping과 UDI의 효과)

 

Germline 변이 분석과 같이 분석하고자 하는 변이의 비율이 매우 큰 경우라면 인덱스 호핑이 결과에 큰 영향을 주지 않겠지만, somatic 변이 분석이나 병원체 검출과 같이 낮은 비율로 존재하는 데이터를 분석하는 경우에는 인덱스 호핑(Index Hopping)으로 인해 실제로 존재하지 않는 변이나 병원체를 보고할 위험성이 매우 높아집니다. 이러한 분석에서는 결과의 정확도를 높이기 위해서 UDI를 사용하는 것이 중요합니다.