每3秒,全球就会多1位痴呆患者,其中约60%~80%会被确诊为阿尔茨海默病(AD)。而在中国,AD患者已经超过1000万人,医疗费用高达每年1.6万亿元。
提高AD早期就诊率,抓住黄金干预时间窗,是业内公认的AD诊疗策略。今年7月,复旦大学附属华山医院神经内科郁金泰教授团队领衔,联合复旦大学类脑智能科学与技术研究院的冯建峰/程炜团队,在Nature Human Behavior发表论文揭开了一种新生物标志物YWHAG的面纱。
9月6日上午,在由每日经济新闻主办的见解论坛“AI医药革命:产业链创新之路”上,复旦大学类脑智能科学与技术研究院研究员程炜对相关研究进行了详尽介绍。他表示,新型标志物的挖掘和早期识别离不开大数据和AI算法的助力,“一管血测AD”的时代已经近了。
图片来源:主办方提供
大数据和算法是两块重要拼图
作为一种连续发展长达10年~20年的老年疾病,阿尔茨海默病的早期干预是治疗关键。根据2023年发表在Nature Human Behaviour的一项研究,如果在AD早期借助药物或训练调节既往病史、生活方式、身体指标等可控因素,可降低47%~72.6%的AD的发生。
但在国内,AD患者的临床早期就诊率只有14%。程炜表示,这是因为AD起病隐匿,各阶段生物学指标演化规律尚不清晰,早期风险识别模型的准确率与解释性不足,导致AD的早期识别和预测非常困难,而这也在很大程度上影响了单抗药物等AD治疗药物的疗效。
因此,获取AD患者的非临床数据,构建早期风险识别模型,是AI辅助AD早期预防和诊治的关键,其中大数据和算法是两块重要拼图。
程炜介绍,目前,国内外围绕AD建立了大量的队列数据库。例如,英国的UK Biobank是一个涵盖社区人群的大型数据库,跟踪了约50万名35岁~50岁参与者近20年的生活方式和生化指标;美国的All of Us则囊括了约100万名社区成员,通过结合体检机构和临床样本的数据,构建了一个庞大的美国人群健康队列。
参照国外的研究,中国也在衰老和痴呆社区队列上进行了大量投入。目前,由复旦大学附属华山医院神经内科郁金泰教授领导的科技创新2030——“脑科学与类脑研究”重大项目,已经依托华山医院在全国范围内建立了社区脑健康衰老队列(head队列),旨在在中国不同地区招募2万名参与者,通过长期随访进行纵向研究,描绘个体从健康状态逐渐发展到痴呆症状的全过程。
此外,AI算法在老年脑疾病智能诊疗、推动老年健康领域取得了显著进展。例如,结合AI算法和医院病例数据,可以实现对患者复发的有效预测;通过多模态数据的融合,应用深度学习算法,可以对不同AD亚型做出精准预测,精度超过临床专家。
YWHAG可作为AD早期诊断、预警指标
“有了大数据,也有了AI算法,我们做的就是通过它们发现AD诊断新型标志物。”程炜表示,AD从无症状期发展到有症状期大约需要20年,而脑脊液生物标志物在AD病程中最先发生变化,因此团队的首个研究工作是聚焦大规模人群的脑脊液蛋白质组数据,并基于这些数据开发出一种生成分析算法,识别与AD相关的蛋白质。
在这一过程中,团队从数千种脑脊液蛋白质中筛选出多个与AD显著相关的生物标志物,发现YWHAG、SMOC1、PIGR与TMOD2是AD诊断最重要的蛋白。根据四个蛋白构建的AI模型,四个蛋白在AUC(此值越接近1,模型的诊断能力越好)上达到0.987的高准确度,超过了传统的Aβ42生物标志物;即便只使用YWHAG单个蛋白,也能实现0.97的准确率。
为了验证该模型的泛化能力,研究者还将其应用到尸检病理队列和独立外部队列中,发现上述蛋白仍能以高AUC值准确判断个体是否患有AD,其中YWHAG在尸检病理队列和独立外部队列中诊断AUC达0.83和0.93,并且YWHAG能够预测从认知正常向前驱期AD的转化,以及从MCI(轻度认知障碍)向AD痴呆的转化,与AD核心病理标志物以及认知能力下降密切相关。
除了诊断,这些蛋白是否可用于AD预警呢?程炜所在的研究团队还从临床角度考察了这些蛋白质的纵向预测能力,即通过基线时蛋白质水平的高低将人群分为两组,可观察到高水平组随着时间推移,发病人群逐渐增加,从而证明了这些蛋白质可作为早期预警指标。另外,研究还探讨了这些蛋白质与β淀粉样蛋白、Tau蛋白等AD经典病理标志物的关联,发现它们高度相关。
基线与随访 图片来源:演讲者供图
血液检测能提前15年预警AD风险
“不过,这些新的生物标志物和此前的生物标志物的性能差不多,更重要的还是要看它们能不能在血液中被检测出来。”程炜说。
目前,AD早期诊断可以通过脑脊液检测或PET(正电子发射断层成像)测量进行,但前者是有创检测,后者相当昂贵。因此,程炜的团队将研究对象从脑脊液蛋白质组转到血液蛋白质组,希望找到公众更容易接受的检测方式。
好消息是,研究团队基于11种血液蛋白构建的AD风险预警模型,AUC达到0.85左右;生存分析表明GFAP、NEFL、GDF15等蛋白与各种痴呆发病相关,且这些蛋白质在AD患者发病前15年就已表现出显著差异。而且,GFAP这一蛋白质还显示出特异性,仅对AD有预测价值。
基于此,研究团队构建了基于机器学习的预测模型,通过效果值方法对蛋白质的重要性进行排序,结果与临床发现高度一致。最终,团队构建的预测模型能够提前15年预测AD发病风险,对于AD的蛋白组合,联合模型AUC可以达到0.854,对于痴呆AUC可以达到0.841,为社区筛查提供了潜在可能。
但程炜指出,蛋白质的检测成本仍然比较昂贵,为了使模型更便于推广,团队基于UK Biobank的50万人纵向随访数据,绘制了AD临床诊断前15年多维度表型的变化轨迹,并基于显著变化的指标构建了简易的AD预测模型,该模型仅依赖于血浆GFAP与简便的人口学特征,AUC就可以达到0.872。
“其实除了AD,我们还希望将模型推广到其他老年疾病的风险预警。”程炜透露,目前团队还构建了基于血液蛋白组学的多疾病早期预测模型、基于神经网络的蛋白风险预测模型,他认为未来通过数字化平台和大模型框架,可以实现更多社区人群、更多疾病的早期预警和干预。