评论
分享

scRNA代谢分析软件千千万,总有一款适合您

欧易生物

2023-01-31 14:17 上海

11937 0 0


单细胞技术自2019年被Nature Methods杂志评选为年度技术以来,单细胞测序及其下游分析迅速成为生物科学研究的热点,推动了肿瘤研究、组织和器官发育以及农林遗传分析等多个领域的快速发展。

随着单细胞文章的遍地开花,单细胞的多组学联合分析也逐渐走上舞台。多维度的交叉分析有助于我们更全面地理解细胞在时间-空间的复杂生命过程,但受限于目前的高通量单细胞建库技术,我们只能从细胞中获取到一个组学的信息,得到的数据难以严格论证细胞内外的新陈代谢活动;此外,胞内和胞外体液中的代谢物也极不稳定,定性准确性和重复性难以保证。

那我们是否可以通过合适的计算模型,从单细胞数据中模拟或类比转换得到代谢物或蛋白的变化情况,进而获得多组学的研究结果呢?当然可以!目前有很多课题组/实验室已经研发并见刊了多款基于单细胞转录组数据的代谢分析软件,例如Compass,scFEA,Mebocost,scMetablism等,其原理大致可分为两类:

(1)基于已知代谢通路的富集分析;

(2)基于拓扑代谢模块的通量平衡分析。

今天我们就来一起了解几款小欧们已经“驯化”的单细胞代谢分析软件


scMetabolism 

scMetabolism是复旦大学中山医院研发的一款单细胞水平化量化代谢活性的软件,目前已有多篇文章引用。该软件基于常规单细胞表达矩阵,采用VISION算法对每个细胞进行评分,最终得到细胞在每条代谢通路的活性得分。

图1 | scMetabolism代谢分析流程

软件预置人类代谢基因集,包括85条KEGG通路和82条REACTOME条目,其他如大、小鼠等哺乳动物的scRNA数据可以同源转换human后进行分析;物种为植物或者其他非常规物种的话,也可选择合适的代谢基因集来打分。

得到每个代谢条目的打分后,可以进行多种下游分析,部分示例结果如下:

图2 | 不同分组代谢差异显著条目热图

图3 | 差异代谢条目得分feature图

相比其他软件,scMetabolism对单细胞的Seurat软件兼容极好,包含多种较完善的R语言打分算法,且在分析速度上明显优于其他软件;得分结果以热图和小提琴图展现不同分组或clusters间的代谢活性差异,也可以将代谢得分整合进seurat数据,从多个角度展示不同细胞群的代谢活性强弱,是当前单细胞代谢分析的首选之一。

scFEA 

scFEA是Chang团队基于通量平衡(Flux Balance)算法开发的代谢通量相对速率评估软件,可以通过scRNA-seq数据表达变化,结合通量平衡约束概率等模型来评估酶和转运蛋白的变化。scFEA在对数据建模时遵循以下原则:

1. 根据重组人类KEGG代谢图,获得重点代谢模块以降低计算复杂度;

2.建立通量平衡约束概率模型以及神经网络优化求解器和多层神经网络模型,获得转录组到代谢组的复杂级联信息;

3. 定义一个损失函数L来推断scRNA-seq数据的细胞代谢通量。

图4 | scFEA 代谢通量分析流程

软件在分析中,会假设每个模块的代谢通量可以建模为模块中酶表达水平的非线性函数,且中间模块的底物进出通量总体失衡为最小化。考虑到单细胞表达数据的稀疏矩阵,如果删除零表达状态相关基因的反应后模块与其他模块断开了连接,该模块会被认为是关闭模块被剔掉;但该模块只要有一个基因具有显著的非零表达,就会继续保留。

每个细胞的代谢通量可以作为raw_data进行降维聚类,也可以结合Seurat进行多种下游分析,部分示例结果如下:

图5 | scFEA代谢通量降维聚类

图6 | scFEA代谢通量显著条目热图

图7 | 差异代谢通量条目箱线小提琴图

我们也可以将scFEA 估算的细胞通量与常规流程结合,进一步分析细胞类型或评估不同组织、细胞群的代谢应激水平,单个酶/基因对整个代谢网络的敏感性,以及推测细胞-组织和细胞-细胞之间的代谢交换。

Mebocost

MEBOCOST是由Rongbin Zheng等人开发的代谢分析软件, 根据每对 细胞类型和代谢物-传感器伙伴的代谢酶和传感器的表达来计算通信分数,进而推断已知代谢物的相对丰度。软件的分析步骤如下:

  1. 整理scRNA-seq 的表达数据和细胞类型,以便识别细胞-细胞代谢物-传感器通信。代谢物酶和传感器分别在发送细胞(Sender cells)和接收细胞(Receivor cells)中高度表达,接收细胞上的感受器蛋白(sensor protein)可能是细胞表面受体、细胞表面转运蛋白和核受体; 

  2. scRNA-seq数据中提取代谢物酶和代谢物传感器的基因表达,取酶基因表达的平均值推断代谢物的存在,然后使用发送细胞中平均代谢物丰度与接收细胞中平均传感器基因表达量的乘积来计算通信分数;

  3. 对表达数据的细胞标签进行1000 次(默认)随机置换,生成1000个通信分数,获得相应的经验分布,并基于零分布置换检验计算p值,推断通路和基于代谢物的细胞间通讯之间的关联,预测重要的receiver中sensor相关的通路。

图7 | Mebocost分析流程

部分示例结果如下:

图8 | 代谢传感器通讯events条形图

图9 | 多组间代谢通讯dot图

图10 | 代谢物表达丰度提琴图

图11 | 通信网络图

相比于通量平衡分析,MEBOCOST根据基因表达情况推断配体-受体通讯,计算方式简单高效,也容易解释其生物学意义。根据代谢物和传感器在配体细胞和受体细胞中会有较高丰度表达预测代谢物介导的胞间通讯,也可以与常规细胞通讯结果进行对应。

Compass 

Compass是Wagner 团队发布的一款Python软件,基于单细胞表达数据和通量平衡分析 (FBA) ,结合代谢网络的先验知识来展现细胞代谢状态。

其分析原理如下:

1.基于代谢网络数据库Recon2,为每个代谢反应r计算它能承载的最大通量,同时只施加化学计量和质量平衡约束;

2.根据基因表达,给每个细胞中每个反应分配一个与该细胞中催化反应的酶相关的mRNA表达成反比的罚分;对于每个反应r和每个细胞找到一个通量分布(对网络中每个反应的通量值的分配),使总体惩罚最小的同时保持通过r的通量为最大通量的95%;

3.对这个惩罚分数取倒数,并相加为反应的Compass分数。

图12 | Compass分析流程 

考虑到算法运行效率及单细胞数据中可能存在的技术噪音,在分析中也可以将细胞分割成微簇并将每个簇的平均值作为下游分析中的观察值,以减少运行时间。示例结果如下:

图13 | 主成分分析结果,左图针对正反应,右图针对负反应

图14 | 差异代谢通路火山图

图15 | top5核心代谢通路差异情况

Compass使用基因组规模的代谢网络,允许整个代谢转录组影响任何特定反应的计算分数而不仅仅是催化它的酶的 mRNA 编码,这有助于减少 mRNA 表达与代谢活动不相关的情况和 scRNA-seq 丢失的影响;软件还通过K近邻的信息共享,减轻单细胞数据的稀疏效应,进一步提升了软件预测结果的准确性。

可以看出,不同代谢分析软件的分析策略虽有所差异,但最终都要回到已知代谢物或已知酶的基因在单个细胞中的表达。如果说基因表达的有无是细胞类型的特征,那么代谢物的多少就是细胞活动的展现。单细胞水平的代谢分析,有助于我们对单细胞数据更深入的分析和挖掘,进一步了解异质细胞的新陈代谢差异,在免疫和遗传发育研究中有着重要的作用。

本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
点赞
发表评论
请先 注册 / 登录后参与评论
推荐阅读