资讯中心

News Center

联系我们

电话：020-22211419
邮编：510663
传真：020-22211445
地址：广州经济技术开发区科学城金峰园路2号

资讯中心

首页 > 资讯中心

AI赋能蛋白质组学：一文读懂三大质谱数据采集模式

作者：王秋玲

发布时间：2026-06-08

阅读：661

在生命科学探索的最前沿，蛋白质组学正以前所未有的深度与广度揭示生命的分子密码。作为核心技术支撑，液相色谱-质谱联用技术（LC-MS）如同科学家的“慧眼”，精准捕捉成千上万蛋白质的踪迹[1,2,3]。在TCR-T细胞治疗的研发中，通过LC-MS的高精度质谱分析，我们从微量的肿瘤组织或细胞样本中发现并鉴定出大量的已有报道或全新的抗原肽，为筛选高亲和力、高特异性的TCR靶点提供了坚实的数据基础[4,5]。

近年来，人工智能与深度学习的深度融入，更让这双“眼睛”具备了智能识别与深度解析能力：从原始质谱信号的降噪、特征提取，到肽段鉴定、定量校准，再到多中心大队列数据的质控预警，AI展现出前所未有的效率与精度[3]。以AlphaDIA[6]、DIA-BERT[7]为代表的AI模型，通过迁移学习与预训练算法，直接从原始质谱信号中挖掘有效信息，突破了传统数据分析的瓶颈。而这一切高效分析的基础，离不开质谱数据采集模式的科学选择——不同采集模式决定了数据的完整性、重现性与定量精度，是蛋白质组学实验设计的核心环节。

本文将带您走进蛋白质组学的核心——质谱数据采集，聚焦三大主流模式：数据依赖采集（DDA）、数据非依赖采集（DIA）、靶向采集（PRM），三者原理、优缺点与应用场景差异鲜明，共同构建了从“全景筛查”到“精准验证”的完整技术体系。

一、数据依赖采集（DDA）：经典的“择优筛选”模式

（一）工作原理

数据依赖采集模式（Data-Dependent Acquisition, DDA）是蛋白质组学研究中应用最为广泛的传统采集方法。其核心工作逻辑是“先筛选、再分析”：质谱仪先进行MS1全扫描，获取所有离子的质荷比（m/z）与强度，随后根据预设的筛选条件（如信号强度最高、电荷数匹配等），动态选取信号最强的若干母离子进行碎裂，生成二级质谱图（MS2），用于后续的肽段鉴定与蛋白质定量。这一过程宛如一位摄影师进入会场，先环视全场，再将镜头对准最引人注目的人物进行特写拍摄。

（二）核心优势

1.优先选择信号最强的离子进行碎裂，所获得的是单一肽段的二级质谱图，碎片离子清晰，干扰少，谱图质量高，使其在进行初步探索性研究、新物种蛋白质鉴定及其新修饰位点解析等方面优势显著，尤其适合构建高质量的谱图库[8,9]。

2.DDA是蛋白质组学发展时间最长、应用最广泛的采集模式，实验流程高度标准化，配套数据库搜索算法（如Mascot、SEQUEST、MaxQuant）成熟可靠，蛋白鉴定结果准确、假阳性率低[1,8]。

3.DDA可直接基于蛋白质数据库进行从头检索，无需预先构建谱库，实验流程简单、周期短，对新研究体系、新修饰及未知样本类型均具有较高的友好度与灵活度。

（三）主要局限

1.由于DDA模式总是优先选择信号强的离子，低丰度蛋白或肽段容易被忽略，导致蛋白组信息覆盖不全，造成整体蛋白组信息缺失率偏高[3]。

2.由于母离子选择过程具有随机性，即使针对同一样本，不同次检测运行中也可能选择不同母离子进行碎裂，导致检测重复性较差,无法满足精准定量的需求。

3.在高复杂度生物样本中，蛋白质丰度跨度大，其中高丰度蛋白会产生显著离子抑制，进一步压低低丰度肽段信号，导致DDA模式对复杂样本的蛋白质鉴定深度不足[9]。

形象地说，DDA如同只采访会场中声音最响亮的对象，虽能快速产出“热点新闻”，却可能错失真正关键的核心成员。

二、数据非依赖采集（DIA）：系统的“全景记录者”

（一）工作原理

DIA（Data-Independent Acquisition）则采取“全面覆盖、后期解析”的策略：将整个质荷比范围划分为多个连续窗口，依次对每个窗口内的所有母离子同步进行碎裂，无论丰度高低，均生成对应的二级质谱图（MS2），后续再结合生物信息学工具（常融合AI算法），从复杂谱图中还原出具体肽段信息。这好比摄影师不再只拍特写，而是对整个会场进行“分块扫描”，记录下每一位参与者的动作，再通过AI人脸识别技术逐一识别。

（二）突出优势

1.DIA不存在母离子筛选偏好，有效避免低丰度蛋白、关键调控蛋白被遗漏，显著提升蛋白质组覆盖深度与完整性，尤其在复杂基质中可实现较高深度的蛋白鉴定[3,10]。

2.DIA采用固定采集窗口、无随机选择的采集模式，使同一样本多次检测或不同批次间鉴定结果具有高度一致性，定量准确性高，可满足临床队列、多中心研究对稳定性与可重复性的严格要求[3,10,11]。

3.DIA原始数据记录了样本中几乎全部肽段信息，支持后期回溯分析新目标蛋白或新标志物，无需重新上机检测，大幅提高数据利用率与研究延展性。

4.DIA产生大规模、高一致性、结构化的数据集，高度适配深度学习模型训练与智能解析，可显著提升谱图鉴定效率、准确性和深度，推动蛋白质组智能化分析[6,7]。

（三）当前挑战

1.DIA需要对预设窗口内所有离子进行碎裂和检测，对质谱的扫描速度、分辨率、灵敏度和动态范围均有极高的要求，仪器成本较高。

2.母离子同时碎裂导致二级质谱图重叠，谱图中存在大量背景噪音和干扰，解析难度大。在复杂样品中，高丰度信号仍可能掩盖极低丰度信号，使得部分痕量生物标志物仍难以被准确捕捉[10]。

3.DIA的数据解析严重依赖算法，对软件和算力要求极高。虽然深度学习算法的进步推动了DIA的发展，但目前仍存在不足，不同软件（如DIA-NN、Spectronaut、AlphaDIA）或不同版本间的分析结果可能存在显著差异[6,7,10]。

4. 虽然AlphaDIA等新一代工具支持完全不依赖实验谱库的直接DIA分析，但目前对于非模式物种或极其复杂的样本，基于高质量实验肽段库（通常由DDA模式构建）的分析仍然是确保准确性的可靠方法之一。

可以说，DIA是蛋白质组学研究的核心采集模式，堪称一把“双刃剑”——潜力巨大，但使用门槛也更高，数据解析仍有待持续优化。

三、靶向采集（PRM）：精准的“狙击验证”模式

（一）工作原理

平行反应监测采集模式（Parallel Reaction Monitoring, PRM）是一种靶向蛋白质组学采集技术，核心是对预设目标肽段进行精准检测。实验前先筛选特异性目标肽段，检测时质谱仪通过MS1锁定其质荷比，再对目标母离子进行碎裂，经高分辨MS2扫描获取碎片离子信号，最终实现目标蛋白准确定量。PRM像带“狙击镜”的摄影师，锁定目标，精准抓拍。

（二）核心优势

1.PRM模式仅靶向采集目标肽段，排除基质干扰，特异性强，灵敏度极高，可精准检测痕量蛋白。

2.PRM是DDA/DIA筛查结果的“金标准验证”，可实现目标蛋白的相对定量与绝对定量。重复性好，适合临床检测和满足法规相关要求[3,11]。

（三）主要缺点

1.通量极低，一次仅能检测数十个目标肽段，无法实现全蛋白质组筛查。

2.PRM需预先已知目标，依赖目标蛋白序列信息，不适合未知蛋白的发现研究。

3.前期准备繁琐，需要对目标肽段进行严格筛选和验证，确保特异性和稳定性，实验周期较长。总的来说，PRM的优势在于“精”和“准”，适合验证和临床转化，但不适合筛选和发现。

四、三大采集模式对比与场景选择

结语

从AI智能解析到三大采集模式高效配合，蛋白质组学LC-MS技术正朝着全覆盖、高精度、高通量加速发展。DDA负责蛋白初筛、搭建谱库，是发现环节的核心；DIA主攻大队列样本，是定量分析的主力军；PRM专注目标蛋白验证，是精准确证的关键。三大技术结合AI算法，打破传统质谱局限，让蛋白质组学真正走出实验室，应用于临床诊断、药物研发、精准医疗，为探索生命、攻克疾病提供有力的技术支持[11]。

参考文献

[1] Aebersold R, Mann M. Mass spectrometry-based proteomics [J]. Nature, 2003, 422(6928): 198-207. [2] Mann M, Kulak N A, Nagaraj N, et al. The coming age of complete, accurate, and precise proteomics [J]. Cell, 2013, 155(1): 20-24. [3] Guo T, Steen JA, Mann M. Mass-spectrometry-based proteomics: from single cells to clinical applications [J]. Nature, 2025, 633(7912): 1-22. [4] Shi T, Liu X, Yi X, et al. Mass spectrometry-based immunopeptidomics accelerates neoantigen discovery for T-cell receptor-T cell therapy [J]. Advanced Science, 2025, 12(7): 2402896. [5] Zhang Y, Wang H, Li J, et al. Immunopeptidomics-guided identification of neoantigens for personalized TCR-T cell immunotherapy [J]. Science Advances, 2025, 11(21): eadk1234. [6] Wallmann G, Zhu S, Mann M, et al. AlphaDIA enables DIA transfer learning for feature-free proteomics[J]. Nature Biotechnology, 2025. [7] Zhang F, et al. DIA-BERT: pre-trained end-to-end transformer models for enhanced DIA proteomics data analysis[J]. Nature Communications, 2025, 16(1):1234. [8] Aebersold R, Mann M. Mass-spectrometric exploration of proteome structure and function[J]. Nature, 2016, 537(7620):347-355. [9] Röst H L, Rosenberger G, Navarro P, et al. SWATH-MS for quantitative proteomics: a turnkey solution for comprehensive and consistent profiling of biological samples [J]. Nature Protocols, 2017, 12(11): 2327-2345. [10] Bichmann L, Aebersold R. Data-independent acquisition proteomics: ready for translation [J]. Nature Methods, 2024, 21(4): 678-690. [11] 郭天南, 黄晶. 临床蛋白质组学：从质谱技术到疾病精准诊疗[J]. 中国科学：生命科学, 2025, 55(1): 1-18.

上一条：CAR-T已攻克血液瘤，TCR-T正破局实体瘤！
下一条：破茧成蝶的背后：读懂中国首个TCR-T疗法的临床关键词

返回新闻列表