“阿尔茨海默病的血液检测”的宏伟构想展开
最初的想法始于研究阿尔茨海默病。
“大家都知道,阿兹海默症(痴呆症的主要类型)发病后,干预就已经晚了。我们一直想,是否可以像测量血糖一样,通过抽血早期发现阿兹海默症?” ”。
于锦泰回忆道。这位42岁的医生是复旦大学附属华山医院神经内科教授、国家神经疾病医学中心(华山)认知障碍科带头人。 33岁时,作为一个研究项目的负责人,他与众多国际专家联手,花了五年时间制定了世界上第一个循证预防阿尔茨海默病的国际指南。
今年2月,他带领团队与复旦大学类脑智能科学与技术研究院程伟研究员团队合作,发表了论文。他们利用大规模蛋白质组学数据和人工智能算法筛选和分析了近1500种血浆蛋白,发现了11种可以预测未来痴呆风险的血浆蛋白。根据这些蛋白质水平的变化,可以提前 15 年预测患痴呆症的风险。 。
这项工作被《自然》杂志作为头条新闻报道,指出这项大规模筛查研究的结果可用于开发血液测试,以在症状出现之前诊断阿尔茨海默氏症等疾病。
于金泰说,“当时还是挺震惊的,后来有企业联系我们,希望基于这项工作开发检测试剂盒。”
在做这项工作的过程中,于金泰提出了一个大胆的想法,“仅仅一种疾病,我们的相关工作可能会产生这么大的影响。如果我们绘制蛋白质图谱,分析很多疾病与蛋白质之间的关系,新标记物的鉴定和新靶点的开发肯定会有很大的帮助。”
这是一个非常雄心勃勃的想法。在这一理念下,研究人员正试图构建迄今为止最全面的蛋白质组与人类健康和疾病图谱,并将其与人工智能算法相结合,构建疾病诊断预测模型,探索药物治疗的新靶点。
时隔近一年,这项工作于11月22日发表在顶级生命科学期刊《Cell》上,文章标题为Atlas of the in and in 53,026(《 atlas of 53,026成年人健康与疾病》)。 》)。 [1]

在这项研究中,研究人员创建了健康与疾病的蛋白质图谱,涵盖了 2,920 种血浆蛋白和 406 种既往疾病、660 种后续新疾病以及 986 种与健康相关的表型,揭示了 168,100 种蛋白质。 - 疾病关联和 554,488 个蛋白质表型关联。
此外,研究人员还发现了超过650种蛋白质与至少50种疾病相关,还发现了26个新的药物治疗靶点,并建立了开放访问的蛋白质组-表型组资源数据库——Atlas()。该数据库不仅将帮助科学家更好地了解疾病的生物学机制,还将加速疾病生物标志物、预测诊断模型和治疗靶点的有效开发。

开放访问蛋白质组-现象组资源数据库
最重要的是,于锦泰告诉知识分子,他们正在尝试建立一种新的研究范式。
“过去我们希望通过基因组图谱来分析疾病,但今天我们发现很多问题并没有像之前预期的那样得到解决。要真正解释生命,或许可以在蛋白质组中找到答案。”
正如他所说,2003年,历时13年的人类基因组图谱绘制成功,但人们并不了解疾病的根源。生命科学已进入后基因组时代,人们的关注焦点从基因组的结构分析转向功能研究:遗传变异如何导致疾病?基因如何与环境相互作用以影响生命过程。
在我们所处的这个时期,包括蛋白质组学在内的多组学逐渐成为研究的热点。
如果说基因是演奏生命交响乐的乐谱,那么蛋白质更像是演奏者,管弦乐队在不同的环境和需求下调整其演奏方式。一些演奏者(关键蛋白质)可能会出现演奏错误(功能障碍)、改变音调(错误折叠),甚至停止演奏(失去表达),导致整个交响乐不再协调。
基因组学中的微小差异可以在蛋白质组学中放大一千甚至一万倍。但时至今日,对于人类来说,蛋白质与疾病的关系仍然存在许多未知。
于金泰说,“这次我们使用了来自超过50,000名参与者的血浆高通量测序蛋白质组数据。程伟老师团队将核心临床科学问题与人工智能大数据分析技术相结合,识别出患者具有潜在诊断和预测价值的生物标志物,帮助我们揭示哪些蛋白质与每种疾病相关,这些蛋白质是否可以预测疾病的发展,是否可以预测疾病的发展。这些蛋白质可以作为药物靶点等,已经得到了全面的分析。”

本研究的四位通讯作者:前排为复旦大学附属华山医院神经内科于金泰教授;左三:复旦大学脑研究所所长冯剑锋;前排右三,华山医院院长毛英;程伟,复旦大学类脑智能科学与技术研究院研究员
共同第一作者:第二排左三,复旦大学附属华山医院博士生邓月婷;后排左三,复旦大学类脑智能科学与技术研究院青年研究员尤佳
该研究的共同作者、复旦大学类脑智能科学技术研究院青年研究员尤佳告诉《知识分子》,他们收录了来自5万人的近3000个测序蛋白质,分析了1000多种疾病和近1000个健康指标。然而,模型在每一个细节上都面临着挑战。
与基因相比,蛋白质是更加复杂多变的研究对象。共同第一作者、复旦大学附属华山医院博士生邓月婷提到,与蛋白质相比,基因不受出生、疾病等因素影响,相对稳定。然而,蛋白质受到许多因素的影响。如果获得了相对稳定的疾病或健康相关蛋白质,研究人员需要进行全面的质量控制、验证,并将影响蛋白质的变量纳入相关分析中。
“这个作品可以理解为拼图作品,我们找到拼图碎片,把它们放在空白处。”尤佳说。当最后一块拼图被按下,完整的地图出现在他们面前时,整个团队都兴奋不已。为它干杯。
02
一场新的革命
科学界曾经认为绘制人类基因组图谱将有助于了解疾病的起源,但事实并非如此。
基因组学为我们提供了生命的基因蓝图。基因作为人类遗传信息的载体,是生命奥秘最原始、最基本的物质基础。但基因组序列本身并不能直接揭示生命的所有秘密。蛋白质是基因表达的产物,是细胞进行生长、发育、衰老和死亡等各种生命活动的基本单位。
生物体的生理和病理过程以及对外界刺激的反应,都依赖于蛋白质的表达、修饰和相互作用。为了真正理解生命是如何运作的,人们必须更深入地研究蛋白质组。
据了解,这项研究揭示了许多新的蛋白质与疾病的关联,其中最强的相关性主要集中在泌尿生殖系统疾病,例如NBL1与其他蛋白质与慢性肾脏病的关联。 (见下图)

于金泰说,“我们借鉴基因组研究范式,为疾病预测和诊断提供新的模型和蛋白质指标。同时,我们采用了孟德尔随机化(一种流行的遗传流行病学研究设计方法,通过利用遗传变异作为一个工具变量,我们可以探索暴露与结局之间的因果关系(编者注)、成药性、安全性等分析,为疾病提供新的治疗靶点,但目前还主要停留在理论层面,仍处于理论阶段。需要进一步的动物实验和其他验证。”
“我们对这项工作非常有信心,因为我们不仅发现了新的靶点,而且还验证了一些已经在临床使用的靶点。”于金泰说。
尤佳进一步补充说,这项研究验证了之前研究中报道的一些蛋白质与疾病之间的关联。例如,GDF15与多种疾病(如糖尿病、潜伏性败血症和贫血)的风险相关,WFDC2与流感和肺炎相关。与呼吸道疾病的风险有关。
在这些蛋白质中,GDF15被称为“明星蛋白”,包括在内的多家顶级期刊都发表了关于它的研究。复旦大学的这项研究发现,GDF15与大多数疾病有关,包括205种现有疾病和397种新疾病。 “都具有非常强的相关性,这些疾病的诊断和预测性能都比较理想。 ”
尤佳介绍,目前药企以GDF15为新治疗靶点开展的药物研究主要针对肥胖、肿瘤及相关恶病质、厌食、心力衰竭等,但在成药性方面仍存在巨大挑战。例如,野生型GDF15的半衰期很短,在小鼠和食蟹猴中为3小时;并且在几种类型的疾病状态中都发现了GDF15浓度升高,这可能意味着GDF15也具有耐药性,需要大剂量的药物治疗。
值得一提的是,这项研究发现了多种与精神障碍相关的蛋白质,展示了蛋白质组学在精神疾病预测、诊断和药物开发方面的巨大潜力。
以精神障碍的诊断为例,复旦大学类脑智能科学技术研究院程伟教授表示,“目前焦虑症、抑郁症等精神障碍大多是根据量表来诊断,不像阿尔茨海默病。对于此类疾病,临床上以Aβ PET作为金标准。因此,许多精神障碍缺乏客观的诊断方法。这张蛋白质组图谱也涵盖了大部分精神疾病,发现了大量与精神疾病相关的蛋白质,对于预测精神疾病的发病很有帮助。和诊断具有重要价值。”

研究发现多种与精神障碍有关的蛋白质
更重要的是,这项研究帮助我们重新审视疾病类别的分子亚型。
今年9月,《科学》杂志撰文指出,当前高通量蛋白质测序研究具有非凡潜力,尤其是蛋白质组学与人工智能的结合,将掀起一场革命,我们将重新认识疾病的基础。 [2]
在于锦泰看来,这也是他们的论文此次能够成功被Cell杂志接受发表的原因之一。 “现在推广精准医疗的概念有很多,比如通过人工智能结合蛋白质组学来推广精准医疗。发展是其中之一,我们的工作使这一理念得以实现。”
于金泰告诉知识分子,过去传统的疾病分类主要依靠相似的临床症状和表型特征,忽略了常见的分子病因。这项研究使用蛋白质组学特征对 660 种疾病进行聚类,并能够根据这些疾病共有的生物学特征将它们联系起来,以重新检查疾病类别和亚型。
例如,各种痴呆亚型被归入同一疾病亚组,该亚组还包括精神、内分泌、心血管和其他全身性疾病。在此基础上,这项研究工作进一步揭示了该亚群的特征性生物学功能,将生物学上相关的疾病联系起来,有助于解释为什么看似无关的症状会同时出现在患者身上,并进一步提高对疾病发病机制的认识,提高治疗的有效性。
以肿瘤治疗为例,于金泰说,“目前针对肿瘤的精准治疗,我们会做一些基因分型,针对某个基因型使用更多的靶向药物,蛋白质和表型的关系更紧密。”未来,我们会观察某种蛋白质是否存在异常,并进行针对性干预,这样会收到更好的效果。”
“这就是精准医疗,精准预测、精准诊断、精准治疗。”
03
问题是跨越学科界限的关键
整个研究过程中,两个原本来自不同背景的团队之间存在着高度的融合与合作。这也是于锦泰和程伟认为这项研究进展迅速的原因之一。
程伟和于金泰的相识始于2020年9月。程伟主要从事生物医学大数据统计方法以及神经精神疾病的应用研究。他回忆道:“我们注意到于老师有一些非常好的作品,而且和我们的兴趣也很相似,我们聊得很开心。 ,所以我们成立了这样一个医学和工程交叉的研究小组。
“我们不是某一学科的学生,而是问题的学生,这些问题可能跨越任何学科或学科的界限”,这是20世纪最伟大的哲学家之一卡尔·波普尔作为联合团队成员的一句话,游嘉很喜欢这句话。而他也见证了这次合作,双方发挥各自优势,超越单一学科的壁垒。
程维的团队在算法和算力上有很大的优势,软件和硬件都提供了很大的支持。以这项工作为例,蛋白质在个体之间受到年龄、性别、种族等多种因素的复杂调控,蛋白质之间也存在相互作用。这意味着研究团队需要从海量复杂的数据中提取对人类健康和疾病至关重要的蛋白质信息,这需要程维团队可靠的大数据分析技术方法。
数据分析得出的结论的临床验证和应用,其可靠性、解释力乃至药物靶点的潜在评价,都需要于金泰教授临床团队的深入验证和解读。
回顾早期的合作,于金泰在早前接受采访时表示,为了避免不同背景造成的“语言”差异,联合团队引入了统一的数据管理和分析平台,保证数据的标准化和一致性。 “在一次跨学科研讨会上,华山医院的学生提供了一些关于样本特征和疾病进展的数据,这些数据对于蛋白质组学分析具有重要的参考价值。基于此,脑研究所的学生开发了一套数据转换和整合工具来匹配并将临床数据与蛋白质组数据关联起来。”

双方合作已持续四年。程伟表示,如今,两支球队已经完全融合,界限不再明显。 “以前做临床工作的同学现在对算法有了很多了解,我们做算法工作的同学也学到了很多临床实践的知识。以后我们会共同努力,把问题推进得更顺利、更高效。” ”
“现在说起来容易,但成功不是随随便便就能发生的,每一步都需要投入时间和精力,还需要有天时、地利、人和。”对于合作,于锦泰有自己的方法,“我们一定要合作,首先,成为好朋友。”
据他介绍,两个团队每周定期举行会议。于锦泰和程伟都出席,团队成员私下关系也很好。近三年来,联合团队在各大期刊、主要期刊上发表论文,这对团队来说也是一个很大的激励。
回到这项研究取得成果的那一刻,两个团队合作搭建了一个数据库网站,邓跃亭在里面进行了简单的搜索查询。那是最让她感动的时刻,“我想我们可能真的为人类健康做了一些事情。贡献。”
参考文献:(上下滚动浏览)

[1]邓玉涛,游军,何玉,等。中、中图集53026[J].细胞,2024。
[2]Topol E J. 中高与AI[J]. , 2024, 385(6716): .


