生物标志物的组学应用
生物标志物是一类可以客观评价的特征性生化指标,通过其测量可以了解生物体的生物学过程。检查疾病的特定生物标志物可以在疾病的诊断和预防中发挥关键作用。
在医学研究领域,生物标志物的研究思路一般分为三个阶段:Discovery、Verification、Validation。生物标志物的筛选通常需要利用高通量组学方法对大规模临床样本进行代谢组学或蛋白质组学测试,筛选出具有统计学意义的差异代谢物或蛋白质,再经过一系列复杂的生物信息学分析筛选出目标生物标志物。在接下来的验证阶段,需要对较小范围的生物标志物进行靶向蛋白质组学或靶向代谢组学的大样本量验证,统计分析,计算靶标标志物的特异性和敏感性。如果你想让自己的研究成果更加完整,还可以使用临床样本,结合临床数据进行补充验证,如ELISA、WB等。
2017年,德国格赖夫斯瓦尔德大学在《Gut》杂志(IF=17.016)上发表的题为“Metabolic biomarkersignaturetoDifferentpancreaticductaladenocarcinomafromchronicpancreatitis”的研究就是利用代谢组学技术确定生物标志物的典型例子。
临床上,胰腺癌是预后最差的恶性肿瘤之一。慢性胰腺炎是胰腺癌的危险因素,临床上很难区分两者,很容易导致早期胰腺癌的误诊和延误治疗。由于原始标记物效果不佳,这一系列事实促使研究人员努力寻找替代生物标记物。
在这项研究中,总共招募了914名受试者,包括胰腺导管腺癌(PDAC,271名)、慢性胰腺炎(CP,282名)、肝硬化(LC,100名)和健康献血者(BDs)以及261名对照样本术前患有非胰腺疾病的患者,利用LC-MS和GC-MS包括脂质组学(非靶向分析/类固醇/脂质)在内的多个代谢组学平台对914例样本进行了检测。采用三阶段生物标志物开发策略(探索集/训练集/测试集)总共鉴定了 477 种代谢物。
最后,根据代谢组学数据的结果发现了九种潜在的生物标志物。这9种代谢物与现有的胰腺癌诊断血液指标CA19-9结合使用,组合的标志物组甚至可以检测98%的生物标志物。胰腺癌切除准确率达90.4%。组合标志物的 AUC 显着高于 CA19-9 的 AUC(0.94 vs. 0.85,p <0.001)、敏感性(89.9% vs. 74.7%,p <0.01)和特异性(91.3% vs. 77.5%, p <0.05)也显着改善。
不仅是代谢组学,在一些疾病生物标志物的研究中,蛋白质组学的应用也越来越广泛。多组学技术的应用已是大势所趋。接下来,我们通过另一个研究实例向大家介绍多组学技术在生物标志物筛选过程中的作用。
德国格赖夫斯瓦尔德大学2017年的一项研究结果发表在《BMC Medicine》杂志上(IF=8.097)。标题为“实验性人类甲状腺毒症模型的血浆蛋白质组和代谢组特征”。研究人员旨在筛选表征人血浆促甲状腺激素(TSH)和游离甲状腺素(FT4)特征的生物标志物。利用甲状腺毒症模型进行研究,并通过随机森林的两阶段交叉程序,验证筛选的生物标志物是否可以区分甲状腺功能异常。
根据代谢组和蛋白质组数据统计,共鉴定出380种代谢物和497种人类蛋白质。为保证数据的可用性,通过过滤分析,仅选择缺失值小于40%的代谢物和蛋白质进行后续分析。也就是说,下一步将分析 349 种代谢物和 437 种蛋白质。
为了寻找新的生物标志物来对TH状态进行分类,研究人员通过两阶段交叉验证程序建立了随机森林分类器,以全面分析差异代谢物和差异蛋白。最终获得了包括代谢物和蛋白质在内的15种物质。 30次验证结果均表现出稳定且良好的分类能力,可作为潜在的Biomarker。