医院动态

您的位置:首页 > 医院动态 > 新闻动态
新闻动态
金医科研 | 我院邹欣团队开发出单细胞数据分析新算法——scCODE
发布日期:2022-06-02 来源: 浏览量: 打印

E:\2 微信\【临时 定期删】网站后台\640 (1).png

2022年5月23日,复旦大学附属金山医院邹欣副研究员团队在Briefings in Bioinformatics(计算生物学一区,IF=11.6)上发表了题为:”scCODE: an R package for data-specific differentially expressed gene detection on single-cell RNA-sequencing data”的研究论文。该研究评估40余种差异表达(differentially expressed,DE)基因分析策略,并开发了scRNA-seq数据个性化最优DE基因筛选系统平台——scCODE。

E:\2 微信\【临时 定期删】网站后台\640 (1).jpg

Evaluation of DE gene detection performance and schematic of scCODE.

研究背景
差异表达(differentially expressed,DE)基因的检测和评估一直是单细胞scRNA-seq数据分析中关键的一步,准确可靠的 DE 基因结果对下游分析具有深远影响。基于自主研发的scCODE算法提出全新的单细胞scRNA-seq数据一站式个性化DE基因分析系统,通过对单细胞数据多次建模分析,自动评估最优化分析结果,为科研人员深入解析单细胞数据提供准确高效的新工具。

研究结果

在以往的研究中,过滤低表达的基因被认为有助于DE分析,但其真正影响尚未得知,基因过滤也无统一标准。本研究第一部分从FPR、TPR和AUROC等评估标准分析了不同基因过滤方法对DE结果的影响。结果发现,恰当的基因过滤和DE方法的组合可以得到更好的DE结果,而不恰当的组合却会起到相反的效果。当DE分析策略所推测的DE基因表达分布与实际的基因表达分布更接近时,才能得到更准确的DE基因结果。同时,在实际应用中,探索未知领域的scRNA-seq样本,其概率分布不同,且缺乏先验知识,无法通过已有的评估标准如AUROC去挑选最优的分析方法。在本研究中,研究者设计了新的评估参数CDO和AUCC,可以在无需先验知识的创新性研究中,获得针对不同数据的最优分析策略,更高的真正例率(TPR)和很低的假阳性率(FPR)。

E:\2 微信\【临时 定期删】网站后台\640 (2).jpg

 Investigation of DE gene distribution detected by different combinations of methods, based on simulated-EMTAB8077_heart_kidney.

该平台已经发布于GitHub。目前已收到多个用户反馈良好。在基于scCODE的另外一项工作中,邹欣副研究员团队找到了一组肾癌免疫治疗预测的基因标志物,其在包含172个肾癌病人的数据中,免疫治疗疗效预测的AUC可达到93%,大大超出了已有研究的80%左右,相关论文已经在Nature Communications投稿。

GitHub链接:https://github.com/XZouProjects/scCODE

本论文的通讯作者为复旦大学附属金山医院邹欣副研究员,复旦大学附属中山医院郝洁研究员和辰山植物园陈可副研究员。上海交通大学生命科学技术学院2019级硕士邹佳伟为论文第一作者。(原文链接:https://academic.oup.com/bib/advance-article-abstract/doi/10.1093/bib/bbac180/6590434?login=false

医学探索永远在路上,

闪光金医科研人,

快乐分享研究成果,

更多金医科研前沿,

敬请期待!