IBS, 개인 맞춤형 정밀 의학 정확도 높일 ‘sc렌즈’ 개발

184

의생명 수학 그룹 연구

전사체 빅데이터에서 유용한 생물학적 신호 발굴

연구진은 기존 로그 정규화에 L2 정규화를 통합하면 전처리 과정에서 신호 왜곡을 방지할 수 있음을 밝혔다. 또 랜덤 행렬 이론을 이용해 사용자의 선택 없이 데이터에만 기반해 신호와 노이즈를 구별하는 임계값을 설정하는 방법을 개발했다. 이로써 scLENS가 보다 정확하고 자동화된 데이터 분석이 가능하다는 연구 결과를 도출했다(오른쪽). ⓒIBS 연구진은 기존 로그 정규화에 L2 정규화를 통합하면 전처리 과정에서 신호 왜곡을 방지할 수 있음을 밝혔다. 또 랜덤 행렬 이론을 이용해 사용자의 선택 없이 데이터에만 기반해 신호와 노이즈를 구별하는 임계값을 설정하는 방법을 개발했다. 이로써 scLENS가 보다 정확하고 자동화된 데이터 분석이 가능하다는 연구 결과를 도출했다(오른쪽). ⓒIBS

국내 연구진이 전사체 분석 빅데이터에서 유용한 생물학적 정보만 추출할 수 있는 도구를 개발했다.

기초과학연구원(IBS)은 수리와 계산 과학 연구단 의생명 수학 그룹 김재경 한국과학기술원(KAIST) 수리과학과 교수 연구팀이 이러한 기능을 가진 ‘scLENS(single-cell Low-dimension Embedding using Effective Noise Subtraction)’를 개발했다고 9일 밝혔다.

단일세포 전사체 분석은 최근 생물학과 신약 개발, 임상 연구 등 여러 분야에서 주목받고 있다. IBS는 “단일세포 전사체 분석으로 개별 세포 단위에서 유전적 변화를 확인할 수 있다”며 “해당 분석을 이용하면 암 조직 내 수십 가지 종류의 세포를 구분하고, 유전적 변이가 발생한 세포만 표적하는 정밀 치료가 가능해진다”고 설명했다.

연구진은 기존 개발된 11가지 데이터 분석 프로그램과 scLENS의 상대적 성능을 비교했다. 이를 통해 scLENS가 다른 모든 프로그램보다 우수한 성능을 보인다는 점을 확인했다. 기존에 주로 사용되는 프로그램 ‘Seurat’과 비교했을 때, scLENS는 세포 그룹화 성능이 약 10% 이상 우수하며, 데이터에 내재된 국소 구조를 43% 이상 포착하는 것으로 나타났다.

특히 scLENS는 기존 프로그램보다 많은 계산을 하지만 메모리 사용 최적화를 통해 10만 개 세포와 2만 개 유전자로 이뤄진 대규모 데이터를 3시간 만에 분석하는 경쟁력 있는 분석 속도를 보였다.

제1 저자인 김현 연구원은 “scLENS는 사용자의 선택 없이 데이터에 내재된 구조만을 이용해 자동으로 신호와 노이즈를 구별하기 때문에 사용자 편향성 문제를 원천 차단할 수 있다”며 “연구자들의 노동집약적인 신호 선택 과정을 없애면서도 분석 정확성은 높였다”고 진단했다.

김재경 교수는 “지난 십여 년간 단일세포 전사체를 분석할 수 있는 실험 기술의 비약적인 발전했지만, 데이터 분석 방법의 한계로 인해 큰 비용과 시간을 투자해 얻은 데이터를 최대한 활용하지 못하는 경우가 많았다”며 “기초 수학 이론이 생명과학 연구의 혁신을 견인하고, 감춰졌던 생명의 비밀을 빠르고 정확하게 밝히는 데 쓰일 수 있음을 보여주는 연구”라고 말했다.

연구 결과는 지난달 27일(한국시간) 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications, IF 16.6)’ 온라인판에 실렸다.

+1
0
+1
0
+1
0
+1
0
+1
0