近日,哈爾濱工業(yè)大學(xué)數(shù)學(xué)學(xué)院靳水林教授團(tuán)隊(duì)在單細(xì)胞測序數(shù)據(jù)建模與分析領(lǐng)域取得重要進(jìn)展,解決了多生物來源數(shù)據(jù)整合建模的關(guān)鍵問題。研究成果發(fā)表在《美國國家科學(xué)院院刊》(PNAS)上。
單細(xì)胞數(shù)據(jù)整合旨在通過消除數(shù)據(jù)中的批次效應(yīng),以融合不同實(shí)驗(yàn)批次的單細(xì)胞測序數(shù)據(jù),對胚胎發(fā)育、組織功能及疾病機(jī)制等研究具有重要意義。針對相關(guān)難題,靳水林教授團(tuán)隊(duì)提出了一種多源生物變異的數(shù)據(jù)整合新模型——組中心化主成分分析。該模型首次定義了多生物來源數(shù)據(jù)的組技術(shù)變異,利用生物來源的總體變異和批次內(nèi)變異估計(jì)批次效應(yīng),構(gòu)建了組技術(shù)變異最小化的優(yōu)化模型,進(jìn)而在保留多源生物變異條件下對數(shù)據(jù)進(jìn)行了整合,取得了優(yōu)良效果。該研究為多生物來源單細(xì)胞測序數(shù)據(jù)的有效整合提供了高效、可靠的數(shù)學(xué)模型。