结合前体和片段信息,以改善数据独立采集中差分丰度的检测*

  • 婷黄
    脚注
    隶属关系
    东北大学,波士顿MA 02115
    搜索本作者的文章
  • 罗兰布鲁德尔
    脚注
    隶属关系
    Biognosys,Wagistrasse 21,8952 Schlieren,瑞士
    搜索本作者的文章
  • Jan Muntel.
    隶属关系
    Biognosys,Wagistrasse 21,8952 Schlieren,瑞士
    搜索本作者的文章
  • 岳轩
    隶属关系
    Thermo Fisher Scientific,28199 Bremen,德国
    搜索本作者的文章
  • 奥尔加韦克斯
    一致
    可以解决对应的通信。电话:+41(0)44 738 20 40
    隶属关系
    东北大学,波士顿MA 02115
    搜索本作者的文章
  • 卢卡斯瑞特
    一致
    可以解决对应的通信。电话:+41(0)44 738 20 40
    隶属关系
    Biognosys,Wagistrasse 21,8952 Schlieren,瑞士
    搜索本作者的文章
  • 作者脚注
    *该项目已收到欧洲联盟地平线2020年的资金,在批准协议下,在第6862222号议定书中获得了研究和创新计划。Jan Muntel由InnoSuisse的创新项目授予(项目编号为18365.2 PFLS-LS)支持。竞争金融利益:作者R.B.,J.M.和L.R.是Biognosys AG的员工(瑞士苏黎世)。
    本文包含补充材料文件biolds-ot.xlsx,ms-methods.xlsx和统计引用 - results.zip;表S1,S2和S4;和图。 S1和S3-S7。
    **作者同等贡献。
      在自下而上,无标记的发现蛋白质组学,在数据依赖性(DDA)或与数据无关(Dia)方式中获得生物样品,肽信号在完整(MS1)和碎片(MS2)形式中。虽然DDA仅具有用于量化的MS1空间,但DIA在高定量质量下包含MS1和MS2。复杂的生物基质等诸如组织或细胞的分析型可以含有定量干扰,并且MS1和MS2信号的干扰通常是独立的。在比较生物条件时,干扰会损害差异肽或蛋白质丰度的检测,并导致假阳性或假阴性结论。
      由于最近的技术发展继续提高MS1信号的质量(例如使用BoxCar扫描模式对于orbitrap仪器),MS1和MS2信息的组合具有高潜力,可对DIA数据进行未来统计分析。

      图形概要

      液相色谱 - 质谱(LC-MS)
      使用的缩写是:
      LC-MS.
      液相色谱 - 质谱
      达达
      数据依赖性收购
      DIA
      独立数据的收购
      顺序窗口获取所有理论片段离子
      MP.
      混合蛋白质组
      SFC和LFC
      小/大折叠变化
      ot.
      orbitrap.
      TTOF.
      三重四极杆飞行时间
      简历
      变异系数
      BH.
      Benjamini-Hochberg.
      FDR.
      虚假发现率。
      1使用的缩写是:LC-MS.
      液相色谱 - 质谱
      达达
      数据依赖性收购
      DIA
      独立数据的收购
      顺序窗口获取所有理论片段离子
      MP.
      混合蛋白质组
      SFC和LFC
      小/大折叠变化
      ot.
      orbitrap.
      TTOF.
      三重四极杆飞行时间
      简历
      变异系数
      BH.
      Benjamini-Hochberg.
      FDR.
      虚假发现率。
      已被证明是一种强大而多功能的工具,可以量化蛋白质丰度的变化(
      • Aeberberold R.
      蛋白质组结构和功能的质谱探索。
      )。在自下而上的蛋白质组学中,将蛋白质消化成肽,然后进行批量分析。两种类型的光谱是独立记录的:1)完整的肽质量(更精确 m / z.)或MS1同位素封套和2)在肽片段后,片段离子谱(MS 2)。 MS1和MS2光谱中的精确质量用于识别和/或量化肽。不幸的是,MS1和MS2光谱可以包含扭曲定量信号的干扰。 MS1光谱的干扰通常由其他共面肽前体同位素包膜引起。 MS2光谱中的干扰通常由来自共腐蚀肽的片段引起,这些肽独立于MS1中的干扰发生(
      • Rardin M.J.
      • 席克宁B.
      • 郑;
      • 麦克莱恩B.X.
      • sorensen d.j.
      • Sahu A.K.
      • maccoss m.j.
      • Vitek O.
      • 吉布森B.W.
      MS2(SWATH)数据独立采集中的MS1肽离子强度色谱图。改善蛋白质组学实验的初期收购分析。
      )。
      LC-MS.在发现导向的调查中的两个主要应用是数据相关的采集(DDA)和数据无关的采集(DIA)。在DDA中,MS1前体同位素包络用于产生提取的离子电流或三维峰值重建,用于识别和量化(
      • Aeberberold R.
      基于质谱的蛋白质组学。
      )。另外,依赖于MS1扫描,分离有限数量的肽前体峰,碎裂,并进行二次批量分析。这些MS2扫描用于识别,但不包含直接定量信息。它们不会在肽前体洗脱中的定义点处触发(Fig. 1A)。在DDA具有等因素标签,只能使用MS2信息进行量化, 例如 记者离子与ITRAQ或TANDEM MASS标签标签(
      • 汤普森A.
      • SchäferJ.
      • Kuhn K.
      • Kienle S.
      • Schwarz J.
      • 施密特G.
      • Neumann T.
      • 哈蒙克
      串联质量标签:MS / MS的复合蛋白混合物比较分析的新量化策略。
      ,
      • 不胜的R.D.
      • 刺穿A.
      • Watson R.B.
      • 斯得人D.W.
      • Whetton A.D.
      使用异蛋白标签的定量蛋白质组学分析能够快速比较转化细胞中转录物和蛋白质水平的变化。
      )串联质量标签的标签残余物的片段或易于抽象的亚砜基的等管标签(
      • wührm.
      • 哈斯W.
      • Mcalister G.C.
      • Peshkin L.
      • RAD R.
      • Kirschner M.W.
      • Gygi S.P.
      使用补体报告离子簇在MS2级别的精确复用蛋白质组学。
      ,
      • Sonnett M.
      • 杨E.
      • wührm.
      使用补体报告离子簇精确,灵敏,精确的多路复用蛋白质组学。
      ,
      • 弗莱拉冬季S.
      • 梅尔F.
      • Wichmann C.
      • Cox J.
      • Meissner F.
      EASI标签可实现准确的基于多路复用和无干扰MS2的蛋白质组量化。
      )。
      图缩略图GR1.
      Fig. 1定量数据结构无标签发现蛋白质组学。 (A)常规MS1扫描的数据相关采集方法的采集布局的示意图。下面板显示MS1中提取的离子电流,其可用于量化。 (B通过常规MS1和MS2模式的数据独立获取实验采集布局的示意图。下面板显示两个提取的离子电流,其可用于量化。
      相反,在顺序窗口获取所有理论片段离子(SWATH型)DIA,MS1和MS2数据被产生并以足够高的频率和质量记录以鲁棒地对色谱峰进行采样(
      • 吉拉特L.C.
      • Navarro P.
      • 塔特S.
      • 罗斯特H.
      • selevsek n。
      • 重新勒
      • Bonner R.
      • Aeberberold R.
      由数据独立获取产生的MS / MS光谱的有针对性的数据提取:一致和准确的蛋白质组分析的新概念。
      ,
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      )。对于MS1和MS2空间中的每种肽前体存在提取的离子电流(前体同位素或片段)的峰组(Fig. 1B)。在MS1中,存在完整肽前体的同位素变体。在MS2中,前体与同位素变体分离成多个片段离子。因此,两个定量空间都是基本不同的,并且共抚养干扰不会相关。可以独立地校正对两个水平的干扰,以便将信号增加到噪声比率并改善肽片段的检测和定量。几种方法目前对DIA进行此类MS2细化。这些包括Dia-Umpire(
      • Tsou C.C.
      • Avtonomov D.
      • 拉森B.
      • Tucholska M.
      • Choi H.
      • Gingras A.c.
      • nesvizhskii a.i.
      DIA-UMPIRE:数据无关的采集蛋白质组学的综合计算框架。
      ),Spectronaut(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      ),swathprophet(
      • Zirlik A.
      • HTUN N.
      • iPhöferA.
      • jänschl.
      • Mischak H.
      使用SWATHPROCH的数据独立采集MS的靶向分析中的结果和去除片段离子干扰的自动验证。
      ),nofi(
      • 毕尔巴鄂A.
      • 张Y.
      • varesio E.
      • 鲁班J.
      • Strambio-de-castillia C.
      • Lisacek F.
      • Hopfgartner G.
      根据异常值检测排序片段离子,以改善无关地获取LC-MS / MS中的改进的无标签量化。
      ),TargetEdMSQC(
      • Toghi Eshghi S.
      • 螺旋钻
      • mathews w.r.
      采用机器学习的有针对性质谱数据的质量评估和干扰检测。
      ),百科全书(
      • Searle B.C.
      • Pino L.K.
      • Egertson J.D.
      • 婷婷。
      • 劳伦斯R.T.
      • 麦克莱恩B.X.
      • VillénJ.
      • maccoss m.j.
      色谱图文文库通过数据无关采集质谱来改善肽检测和定量。
      )和前卫(
      • Jacome A.S.v.
      • 佩克纳R.
      • 舒尔曼N.
      • 克鲁格克。
      • 德鲁夫K.C.
      • 官员A.
      • 麦克莱恩B.
      • maccoss m.j.
      • carr s.a.
      • Jaffe J.D.
      Avant-Garde:自动化数据驱动的DIA数据策良工具。
      )。干扰校正后的定量信息的提高质量可以对项目的项目相关,例如聚焦后期改性或肽族的项目(
      • Rardin M.J.
      • 席克宁B.
      • 郑;
      • 麦克莱恩B.X.
      • sorensen d.j.
      • Sahu A.K.
      • maccoss m.j.
      • Vitek O.
      • 吉布森B.W.
      MS2(SWATH)数据独立采集中的MS1肽离子强度色谱图。改善蛋白质组学实验的初期收购分析。
      )。
      传统上在Swath型DIA中,定量依赖于MS2信息。 (可选地记录的)调查扫描后跟连续的DIA段,覆盖整个 m / z. range (
      • 吉拉特L.C.
      • Navarro P.
      • 塔特S.
      • 罗斯特H.
      • selevsek n。
      • 重新勒
      • Bonner R.
      • Aeberberold R.
      由数据独立获取产生的MS / MS光谱的有针对性的数据提取:一致和准确的蛋白质组分析的新概念。
      ,
      • Ludwig C.
      • 吉拉特L.
      • Rosenberger G.
      • Amon S.
      • 柯林斯B.C.
      • Aeberberold R.
      基于数据的基于数据的获取的基于蛋白质组学的SWATH-MS:教程。
      )。这些设置是从具有适中分辨率的三联TOF仪器上的SWATH型DIA的初始开发,结合​​了所选的反应监测借入的目标数据分析策略(例如 in Spectronaut (
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      ),OpenSwath(
      • 麦克莱恩B.
      • Tomazela d.m.
      • 舒尔曼N.
      • Chambers M.
      • 芬尼G.L.
      • Frewen B.
      • 肯尼尔·
      • Tabb D.L.
      • Liebler D.C.
      • maccoss m.j.
      天际线:用于创建和分析目标蛋白质组学实验的开源文档编辑器。
      ),天际线(
      • 麦克莱恩B.
      • Tomazela d.m.
      • 舒尔曼N.
      • Chambers M.
      • 芬尼G.L.
      • Frewen B.
      • 肯尼尔·
      • Tabb D.L.
      • Liebler D.C.
      • maccoss m.j.
      天际线:用于创建和分析目标蛋白质组学实验的开源文档编辑器。
      ))并基于迈克雷特(
      • 重新勒
      • rinner o.
      • Picotti P.
      • HüttenhainR.
      • 贝克米
      • Hengartner M.O.
      • Aeberberold R.
      MP.ROCHET:用于大规模SRM实验的自动数据处理和统计验证。
      )。一些研究人员还探索了MS1级信号的值。席克宁 等等。 引入了从DIA提取的MS1数据提取,但没有实现用于表征相关FDR的过程,从而将其限制在肽数量和运行的数量足以方便,以便于促进手动检查(
      • 席克宁B.
      • Rardin M.J.
      • 麦克莱恩B.X.
      • Zawadzka上午
      • Frewen B.E.
      • Cusack M.P.
      • sorensen d.j.
      • Bereman M.S.
      • 静E.
      • 吴C.C.
      • verdin E.
      • KAHN C.R.
      • maccoss m.j.
      • 吉布森B.W.
      使用MS1提取的离子色谱图在天际线上的平台无关和无标记定量蛋白质组学数据:应用于蛋白质乙酰化和磷酸化。
      )。 rardin. 等等。 (
      • Rardin M.J.
      • 席克宁B.
      • 郑;
      • 麦克莱恩B.X.
      • sorensen d.j.
      • Sahu A.K.
      • maccoss m.j.
      • Vitek O.
      • 吉布森B.W.
      MS2(SWATH)数据独立采集中的MS1肽离子强度色谱图。改善蛋白质组学实验的初期收购分析。
      )对MS1和MS2提取的SWATH DIA数据提取的离子电流进行了探索性分析,并发现了两者之间的强量相相关。具体而言,他们发现MS1信息可以特别相关地与转化修改的研究相关。 DIA-UMPIRE(
      • Tsou C.C.
      • Avtonomov D.
      • 拉森B.
      • Tucholska M.
      • Choi H.
      • Gingras A.c.
      • nesvizhskii a.i.
      DIA-UMPIRE:数据无关的采集蛋白质组学的综合计算框架。
      )在从FASTA数据库的DIA数据的直接分析期间提取MS1和MS2信息,并使用搜索引擎将该信息与识别相关联。在Spectronaut软件套件中,MS1和MS2完全实现以识别和量化(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      )。
      由于最近的进展已经产生了具有更高分辨率的新MS仪表,速度更快,鉴定和肽中肽的定量可以受益于MS1的提高质量(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • 轩辕
      • Sondermann J.
      • Schmidt M.
      在无关的数据质谱中的实验参数优化显着提高了结果的深度和再现性。
      ,
      • muntel J.
      • Gandhi T.
      • verbebere l.
      • 伯恩哈德特O.M.
      • Treiber T.
      • 布鲁德尔R.
      • 重新勒
      通过优化当前LC-MS仪器和数据分析策略,在一次运行中超过10,000次鉴定和定量的蛋白质。
      )。特别地,高质量和定量的MS1和MS2数据现在能够使差异肽和蛋白质丰富的统计推断。虽然这可以单独为MS1或MS2进行(如 例如 当前在Spectronaut中完成),通过将MS1和MS2定量信号同时观察它们可能是有利的,因为与来自相同的生物样本的技术复制(Fig. 2A)。迄今为止,未经系统地尝试并评估了用于检测差分丰富蛋白的MS1和MS2信息的直接连接统计建模的值。这部分是由于MS1和MS2定量信息的缺乏可控的DIA数据集。
      图缩略图GR2.
      Fig. 2MS1和DIA中的MS2量化特性 (A)可以将MS1和MS2定量信号视为来自相同生物样本的技术复制。 (B)从样品1,3和5的穗状体上蛋白质蛋白酶衍生自穗蛋白的两种肽的离子电流。手动鉴定干扰,不遵循差分丰度的预定图案。 (C)针对MS1和MS2分别分别计算条件水平的所有前体的CVS,并单独计算每个条件。该图显示低于20%的CV的前兆数。 (D)在受控数据集中的MS1和MS2空间中的前体丰富之间的Pearson相关性。中位数由红色虚线表示。
      该稿件有助于检测系统地利用MS1和MS2信息的差异丰富蛋白的统计方法。我们将此过程应用于六组受控混合物。这包括具有现实生物背景变化的混合物,并记录在各种仪器上。比较MS1-MS2组合方法对个体MS1或MS2的方法的性能,发现我们检测差异丰富蛋白质的能力一致改进,根据候选名单的质量判断。 MS1数据的质量的影响是显而易见的,使得能够产生用于组合使用MS1和MS2的最佳DIA方法。最后,我们将MS1-MS2组合方法应用于临床研究,并证明了MS1-MS2组合方法增加了已知活化途径的覆盖率。

      实验步骤

       概述

      我们使用多个数据集评估了在Dia中使用MS1和MS2定量信息的影响。为确保评估的一般性,我们依靠六种不同的受控混合物,具有已知的地面真理以及对肺癌的临床调查。具体地,一组受控混合物在恒定背景下定义了几种蛋白质的峰值(Spike-In-HEK293-OT数据集)。另外,一组受控混合物在具有现实生物变异的背景下定义了几种蛋白质的峰值(尖峰 - viol-var-ot)(
      • muntel J.
      • Kirkpatrick J.
      • 布鲁德尔R.
      • 黄T.
      • Vitek O.
      • ori a。
      • 重新勒
      用固定仪器时间对复杂背景中蛋白质定量的比较。
      )。第三种类型由定义比率(MP-LFC-OT,MP-SFC-OT,MP-LFC-TTOF和MP-LFC-MS1VAR-OT)组成的第三种类型。最后,我们在临床研究中评估了MS1-MS2组合方法,将健康组织与肺癌(Biolds-OT)的组织进行比较。来自这些实验的数据是在两个主要类别的不同仪器上获得(飞行时间和orbitrap)。由统计测试产生的候选列表的质量被用作绩效评估的标准。

       受控数据集的样品制备具有生物背景变化/尖峰 - in-Biol-var-ot

      为了产生具有生物背景变异的受控混合物的样品(尖峰 - in-BiOl-var-OT),从AMS生物技术(英国Abingdon)排序了25个小鼠小脑样品。对于组织裂解,在还原裂解缓冲液中裂解一半的小脑细胞(8 m 尿素,0.1 m 碳酸氢铵,10米m TCEP)在珠磨机中(每秒3×30次,30秒,Tissuiceser II,Qiagen,Hilden,德国)。为了将DNA剪切,裂解物在高强度(30秒,30秒上)的生物突发体(成岩,血管,比利时)中以5个循环超声处理。通过离心清除裂解物(20分钟,16,000× g)。将60μl裂解物用于消化。用于样品的烷基化,60μl烷基化缓冲液(8 m 尿素,0.1 m 碳酸氢铵,40米m 加入CAA),将样品在37℃下温育1小时。随后,用600μL稀释样品0.1 m 碳酸氢铵缓冲液,包括5μg胰蛋白酶。在37℃下进行消化过夜,并在500rpm处恒定摇动。为了停止消化,用20%TFA酸化样品。使用沿制造商协议之后的96孔板清理板(Nest Group,Southborough,MA)纯化肽混合物。将样品通过真空离心完全干燥,并重悬于包含IRT肽(Biognosys,Schlieren,瑞士)的溶剂A(1%乙腈,0.1%甲酸)中。使用相同的方案分别消化UPS2标准(Sigma,ST路易斯,Mo),但微孔柱用于清理(巢组)。
      将细胞样品的浓度调节至1μg/μl。接下来,将样品掺入五种不同浓度的UPS2标准标准,每种不同的5种不同的小脑样品(总共25个)。基于最低丰富的UPS2蛋白质,穗状花序浓度(假设在UPS2样品制备期间没有损失):S1:0.75 AMOL /μL,S2:0.83 AMOL /μL,S3:1.07 AMOL /μL,S4:2.04 AMOL / μl和s5:7.54 amol /μl。
      对于图书馆生成,将来自所有尖刺样品的等分试样合并并碱化氢氧化铵。使用30分钟的非线性梯度,通过高pH反相色谱法通过高pH反相色谱法分离2.1 * 150mm Acquisce CSH 1.7-μm柱(Watro Scientific,Sunnyvale,CA)。从1%缓冲液B(100%乙腈)/ 99%缓冲液A(20米m 铵甲酸酯,pH10)至40%缓冲B.每45秒取级分并合并成10个最终级分。

       具有不同MS1分辨率/ MP-LFC-MS1VAR-OT的受控数据集的样本的准备

      以不同的MS1分辨率(MP-LFC-MS1VAR-OT),Hela生成受控混合物, Caenorhabditis elegans.酿酒酵母酿酒酵母 如前所述制备消化(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • 轩辕
      • Sondermann J.
      • Schmidt M.
      在无关的数据质谱中的实验参数优化显着提高了结果的深度和再现性。
      )。随后,用Hela常数产生两个样品, C. Elegans. 30%的变化和 S. Cerevisiae. 100%的变化以生成带有不同MS1分辨率(MP-LFC-OT)的受控数据集的样本。

       肺癌样品的制备/ Biolds-OT

      对于临床癌症数据集(Biolds-OT),从Proteogenex(Culver City,CA)购买了12个Nonsmall细胞肺癌和12种匹配的正常相邻组织。在裂解缓冲液中切割并裂解约30mg(8 m 尿素,0.1 m 碳酸氢铵)在珠磨机中(每秒3×30次,30秒,Tissuiceser II,Qiagen,Hilden,德国)。根据制造商的说明,通过苯并酶(Sigma-Aldrich,St.Louis,Mo)处理DNA。通过离心清除裂解物(20分钟,16,000× g)。 80μl裂解物用于消化。用于还原和烷基化样品,80μl还原/烷基化缓冲液(8 m 尿素,0.1 m 碳酸氢铵,10米m TCEP, 40 mm 加入CAA),将样品在37℃下温育1小时。随后,用500μl0101稀释样品 m 碳酸氢铵缓冲液,包括10μg胰蛋白酶。在37℃下进行消化过夜,并在500rpm处恒定摇动。为了停止消化,用20%TFA酸化样品。使用在制造商的协议之后使用96孔板清洁板(Nest Group)纯化肽混合物。将样品完全通过真空离心干燥,并重新悬浮在包含IRT肽(Biognosys)中的溶剂A(1%乙腈,0.1%甲酸)中。将先前的LC-MS分析肽浓度调节至1μg/μl。对于图书馆产生,将来自所有样品的等分试样合并(总共200μg)并碱化使用氢氧化铵。如上所述,通过高pH反相色谱分离肽池。将汇集级分通过真空离心完全干燥,并重悬于包含IRT肽(Biognosys)的溶剂A(1%乙腈,0.1%甲酸)中。

       LC / MS采集穗状状in-BiOl-var-OT,MP-LFC-MS1VAR-OT和BIOLDS-OT

      对于DDA和DIA,使用自填充的分析Picofrit柱(75μm×50cm长)(新目的,Woburn,MA)分离2μg每个样品(新物镜,Woburn,MA),填充Reprosil-PUR 120A C18-AQ1.9μm(博士) Maisch GmbH,Ammerbuch,德国)使用Easy-NLC 1200(Thermo Scientific),具有2小时分段梯度。数据集以块随机方式获取。在Q辐射的HF质谱仪(Thermo Sciencific)上获得穗子里的BiOl-var-OT和MP-LFC-MS1VAR-OT,其中(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • 轩辕
      • Sondermann J.
      • Schmidt M.
      在无关的数据质谱中的实验参数优化显着提高了结果的深度和再现性。
      )。在Q辐射HF-X质谱仪上获得Biolds-OT数据集。 DIA方法包含33个分辨率的43个分辨率,喷射时间设置为自动和自动增益控制为3 * 106 和调查扫描120,000分辨率,60毫秒最大喷射时间和3 * 10的自动增益控制 6。质量范围设定为350-1650 m / z.。默认充电状态设置为3.循环计数1和归一化碰撞能量在25.5,27和30处阶跃阶跃。对于具有不同MS1分辨率的数据集,应适于保持恒定方法循环时间。为了采集图书馆的分级样品,施加DDA方法。 TOP15方法从(
      • Kelstrup C.D.
      • 年轻的C.
      • Lavallee R.
      • Nielsen M.L.
      • 奥尔森J.V.
      高压孔射出质谱仪对霰弹枪蛋白质组学的优化快速敏感方法。
      )(ms-methods.xlsx.)。

       穗状体上的质谱数据分析,MP-LFC-MS1VAR-OT和BIOLDS-OT

      用Spectronaut pulsar x 12.0.20491.6分析DIA数据(Biognosys(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      )))。默认设置用于定位分析Spectronaut中的DIA数据。 MS1和MS2的初始质量耐受性为15ppm。使用高精度IRT校准(
      • 布鲁德尔R.
      • 伯恩哈特o.o.m.
      • Gandhi T.
      • 重新勒
      高精度IRT预测数据独立采集的目标分析及其对识别和定量的影响。
      )。使用内置干扰校正进行分析(
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      )。根据(
      • 重新勒
      • rinner o.
      • Picotti P.
      • HüttenhainR.
      • 贝克米
      • Hengartner M.O.
      • Aeberberold R.
      MP.ROCHET:用于大规模SRM实验的自动数据处理和统计验证。
      )。用MaxQuant(1.5.6.5)分析软件()分析DDA光谱(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ,
      • Cox J.
      • Neuhauser N.
      • Michalski A.
      • 施泰米r.a.
      • 奥尔森J.V.
      和romeda:肽搜索引擎集成到最大环境中。
      )使用默认设置(Trypsin / P,两个错过的裂缝)。搜索标准包括半胱氨酸的氨基甲酰基化,作为甲硫氨酸和乙酰基(蛋白N末端)的固定改性和氧化,作为可变改性。前体的初始质量耐受性为4.5ppm,对于片段离子为20ppm。搜索尖峰 - in-var-OT DDA,用于鼠标同种型Uniprot Fasta数据库(状态11.12.2014,24,723条目)和Biognosys Irt Peptides Fasta数据库(上传到公共存储库)。来自Biolds-OT数据集的DDA针对UniProt Fasta数据库(第11.12.2014,20,215个条目)和IRT Fasta。通过使用默认设置导入MaxQuant搜索结果,在Spectronaut中生成库。 补充表S1 显示库中的条目数。

       分析Biol-Var-OT数据集的峰值

      数据集通过默认的归一化选项在Spectronaut Pulsar x中归一化。由于尖刺蛋白与背景蛋白质之间的干扰,血液蛋白阿尔布_Mouse,Albu_human,TRFE_Mouse和TRFE_HUMAN被移除。前体和蛋白质FDR设定为1%。由于MS1信号的检测限约为100,因此归一化MS1强度低于100被认为是缺失值。滤除输出任何缺少MS1强度或MS2的MS2强度的前兆。

       Spike-In-HEK293-OT数据集的分析

      来自Buderer的已发布的受控数据集 等等。 (
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Miladinovićć
      • 郑;
      • Messner S.
      • Ehrenberger T.
      • Zanotelli V.
      • Butscheid Y.
      • eScher C.
      • Vitek O.
      • rinner o.
      • 重新勒
      将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
      使用已发布的库使用Spectronaut Pulsar X进行分析。数据集通过默认的归一化选项在Spectronaut Pulsar x中归一化。除去具有人类背景的穗状花序蛋白的共享肽。由于尖刺蛋白与人蛋白质背景之间的干扰,术后四种蛋白质P07724,Q921I1,P02768和P02787被除去。来自组S8的三个重复不用于统计测试(
      • Suomi T.
      • elo l.l.
      增强数据无关的采集蛋白质组学的差异表达统计数据。
      )。接下来,通过FDR和强度阈值滤除数据,如峰值-INICK-in-Var-OT数据集。

       MP.-LFC-OT,MP-SFC-OT,MP-LFC-TTOF,MP-LFC-MS1VAR-OT和BIOLDS-OT数据集的分析

      公布的混合蛋白质组控制数据集MP-LFC-OT和来自布鲁德尔的MP-SFC-OT 等等。 (
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • 轩辕
      • Sondermann J.
      • Schmidt M.
      在无关的数据质谱中的实验参数优化显着提高了结果的深度和再现性。
      来自Navarro的MP-LFC-TTOF 等等。 (
      • Navarro P.
      • Kuharev J.
      • 吉拉特L.C.
      • 伯恩哈德特O.M.
      • 麦克莱恩B.
      • rost h.l.
      • tate s.a.
      • tsou c.-c。
      • 重新勒
      • 遥远的美国。
      • Rosenberger G.
      • Perez-Riverol Y.
      • nesvizhskii a.i.
      • Aeberberold R.
      • Tenzer S.
      一种多中心研究基准测试软件工具,用于无标记蛋白质组量化。
      使用Spectronaut Pulsar X使用默认设置分析)。使用Fruderer的光谱库使用Spectronaut Pulsar X分析MP-LFC-MS1VAR-OT数据集 等等。 (
      • 布鲁德尔R.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • 轩辕
      • Sondermann J.
      • Schmidt M.
      在无关的数据质谱中的实验参数优化显着提高了结果的深度和再现性。
      )。使用默认设置使用上述项目光谱库使用Spectronaut Pulsar X分析Biolds-OT数据集。所有使用全球MS1和MS2的全球中位方法,所有数据集(MP-LFC-OT,MP-SFC-OT,MP-LFC-TTOF,MP-LFC-MS1VAR-OT和BIOLS-OT)都是标准化的分别地 (
      • 她X.
      • rohl c.a.
      • Castle J.C.
      • Kulkarni A.v.
      • 约翰逊准噶逊
      • 陈R.
      家务和组织富集基因的定义,保护和表观遗传学。
      )(补充表S2)。除去蛋白质片之间的共用肽。接下来,通过FDR和强度阈值过滤数据,如峰值 - in-var-var-OT数据集中。

       统计建模

      对于给定的蛋白质,让 XIPRG.日志2 肽前体离子的强度 p 重复 r 来自组 g, 在哪里 iε{1,2}, pε{1,..., P}, rε{1,..., R}, 和 gϵ {1,......, G}。 索引 i = 1表示 X1PRG. 估计来自MS1信号,和 i = 2表示 X2PRG. 估计来自MS2信号。
      统计分析方法总结在 补充图。S1。当分别分析基于MS1的量化时,我们首先通过计算所有匹配的肽离子的中值MS1强度来汇总LC-MS中的蛋白质丰度。换句话说,一种蛋白质的总结MS1强度是 Z1rg. = medianp{X1prg},所有的中位数 X1PRG. 穿过所有肽离子 p,重复 r 来自组 G。 接下来,由于本手稿中的所有实验都有多组设计,我们符合方差(ANOVA)模型的单向分析:
      Z1rg=μ+Group1g+ε1rgg=1GGroup1g=0ε1rgN(0,σ12)
      (1)


      在这个符号中, 团体1g 描述了基于MS1的预期蛋白质丰度在组中的偏差 g 从所有组中的平均预期蛋白质丰富。该术语是基于MS1的量化的主要兴趣。术语ε.1rg. 是具有平均值0的随机实验误差和恒定方差。基于该模型进行差分丰度的假设检测。 P通过本杰明尼和Hochberg的方法调整所有蛋白质的高等蛋白质进行多次测试(
      • Hochberg Y.
      • Benjamini Y.
      更强大的多种意义测试程序。
      )。
      我们使用相同的方法分析了基于MS2的量化(补充图。S1)。
      Z2rg=μ+Group2g+ε2rgg=1GGroup2g=0ε2rgN(0,σ22)
      (2)


      这里 Z2rg. 是同一蛋白质的总结MS2强度, 即Z.2rg. = medianp{X2PRG.},所有的中位数 X2prg 穿过所有肽离子 p,重复 r 来自组 G。团体2g 描述基于MS2的预期蛋白质丰度在组中的偏差 g 从所有组中的平均预期蛋白质丰富。该术语是基于MS2的量化的主要兴趣。术语ε.2rg. 是具有平均值0的随机实验误差和恒定方差。 p还通过本Jamini和Hochberg的方法调整所有蛋白质的高等蛋白。
      为了共同分析统计模型中的MS1和MS2前体强度,我们首先将每个肽前体离子的MS1和MS2强度分别归一化MS1和MS2在所有重复上具有零中值。那是, x'iprg. = XIPRG. − medianrg.{XIPRG.是标准化的 日志2 肽前体离子的强度 p 重复 r 来自组 G。 然后归一化蛋白强度 z'irg. = medianp{x'iprg.},所有的中位数 x'iprg. 穿过所有肽离子 p,重复 r 来自组 g。接下来,我们扩展了ANOVA模型 方程式(1) 和 (2)以上,以表达MS1和MS2信号。
      Zirg+μ+MSi+Groupg+关于plicater(g)+εirgi=12MSi=0g=1GGroupg=0关于plicater(g)N(0,σR2)εirgN(0,σ2)
      (3)


      在这个符号中 MSI 是MS1信号和MS2信号对蛋白质丰度的估计的贡献 z'irg。集团 描述了预期蛋白质丰度在组中的偏差 g 从所有组中的平均预期蛋白质丰富,平均过度超过MS1和MS2信号。该术语是基于联合MS1和MS2的量化的主要兴趣。 复制品(g) 表达蛋白质丰度的复制变异 r 内部 k。 ε.Irg. 是具有平均值0的随机实验误差和恒定方差。如上所述,基于该模型执行对差分丰度的假设测试。重要的是,MS1和MS2信号的组合使我们能够区分生物学和技术变化的来源(补充图。S1)。 p - 通过本Jamini和Hochberg的方法调整所有蛋白质的高等蛋白质。
      我们通过对候选列表进行分类来评估六个受控混合物中的统计方法的性能 p - value并作为候选列表长度的函数检查真正的阳性。另外,为了更简单可视化,在固定的候选人列表长度(Top200用于峰值和Top2000的Top200进行蛋白质组混合物)。最后,根据基于地面真理确定的真实阳性数量和误报的数量分析候选列表。通过将候选名单与对肺中同一癌症的独立研究进行比较来评估Biolds-OT评估
      • Tenzer S.
      • Leidinger P.
      • 返回C.
      • Huwer H.
      • 希尔德布兰特A.
      • Lenhof H.-P.
      • Wesse T.
      • 弗兰克A.
      • Meese E.
      • 凯勒阿。
      肺肿瘤和对照组织的综合定量蛋白质组学及转录组分析:肺癌展示。
      )。分析的R脚本被上传到Proteomexchange存储库。

      结果

       分别表征DIA中的MS1和MS2量化

      在将MS1和MS2集成到统计建模之前,我们寻求单独表征MS1和MS2的定量信息的强度和缺点。在每个数据集中,我们目视检查真正差异丰富的蛋白质的肽前体和片段信号。我们比较了所有蛋白质的MS1和MS2通过MS1和MS2的精度,准确性和相关性。
      使用Spectronaut对Dia数据的目视检查显示MS1和MS2干扰独立发生。在受控混合物中,可以清楚地发现肽前体具有差异丰度的干扰,因为它们不遵循条件之间的预期丰富的预期模式。在具有干扰MS1的示例中,共腐蚀肽是相同的 m / z. (Fig. 2B, 上部面板)在具有干扰MS 2的一个例子中,共抑制和成分肽前体的片段具有相同的质量(Fig. 2B, 较低的面板)。
      为了全球评估MS1和MS2量化的精度,我们计算了在条件下控制混合物的前体级别上的CV。对于所有测试的数据集,MS2量化的精度高于MS1的精度,当计算具有CV的前体<20%。低于20%(在MS2上)的前体的数量在11至61%之间高于MS1(Fig. 2B)。一致地,MS2量化的CV的中位数始终低于MS1(补充图S3A)。 MS1上的前体的CV在MS 2上的9%和25%之间的中值之间的中值介于7%和15%之间。
      在基于在轨道仪器上获取的混合蛋白质体的受控混合物中,MS1和MS2之间的折叠变化估计的准确性相似(补充图。S3B)。在记录在飞行仪器时的MP-LFC-TTOF数据集中,MS1空间中的折叠变化比MS2更压缩,而组合MS1和MS2信息的折叠变化估计在个人的估计之间(补充图。S3B)。 MS1和M2量化之间的Pearson相关性具有0.5的中值值(Fig. 2C)。这些分析证明,尽管MS1和MS2通常具有高质量,但它们可以具有特定分析物的可变质量。

       组合MS1和MS2中的定量信息

      我们的下一步是评估所提出的MS1-MS2组合方法在受控混合物中统计上检测差异丰富的蛋白质的能力。首先,我们比较了由MS2单独检测的MS1检测的真正阳性和假阳性差异丰富的蛋白质(如原始实际定义),并通过MS2和MS1-MS2组合方法检测。 MS1-MS2组合方法始终优于各个测试(Fig. 3A, 补充图S4a, 补充表S4, 和 统计 - inference-results.zip.)。在具有尖峰蛋白质的受控混合物中,顶部差异丰富的蛋白质主要是真正的阳性(前200个差异丰富的蛋白质中的真实阳性的数量如下。Spike-In-Hek293-OT,MS1:129, MS2:160,和MS1-MS2:164;峰值 - BiOl-Var-OT,MS1:72,MS2:111和MS1-MS2:113)。在蛋白质组混合物中,MS1-MS2组合方法的性能相似或优于个体(Fig. 3B, 补充图S4B, 补充表S4, 和 统计 - inference-results.zip.)。
      图缩略图GR3.
      Fig. 3MS1-MS2组合方法的基准测试 (A)对峰值在数据集进行差异丰度的统计推理。 200蛋白有最小的调整 p 价值观由他们排序 p 价值。接下来,将真正的正差异丰富的蛋白质的数量作为候选列表的函数显示,其包含真实和误报。虚线表示仅包含真正的阳性(斜率= 1)的完美候选列表。 插入:具有最小调整的200个蛋白质列表中的真实阳性数量 p values. (B)如(A),但对于混合蛋白质组数据集(A)。 (C通过选择数据集的子集,如上所述,如上所述,如上所述,如上所述进行差异丰富的蛋白质的统计检测,以减少最大真实折叠变化。左侧的第一曲线基于样品1至5,左侧的第二到4,从左边的第三个,右侧绘图显示1到2.得到的候选列表被分析如上。 ( D)如上所述,以上述用于峰值 - Biol-Var-OT数据集的子集进行差异丰富的蛋白质的统计检测,随着重复的数量而下降。得到的候选名单如上所述分析。
      为了区分增加重复的作用,从减少MS1或MS2信号中的干扰的不良影响,我们重新分析了具有和在光谱中实现的干扰校正的数据集。干扰校正改善了所有数据集中的统计功率(补充图S5A)。 MS1和MS2信息的组合可以减轻干扰的负面影响。没有干扰校正的组合方法的性能与MS2单独具有干扰校正的MS2,除了一组控制的混合物(补充图S5B)。
      接下来,我们分析了折叠变化对统计模型的性能的影响。我们将Spike-In-in-Viol-Var-OT的成对比较分成亚群,从900%到10%的最大折叠变化会降低(Fig. 3C)。此外,对于受控混合物尖峰内,HEK293-OT和MP-SFC-OT(补充图S6),MS1-MS2组合方法更好地执行比各个MS1或MS2的量化更好的变化。检测小折叠变化被证明是具有挑战性的,因为在所有三种方法中观察到的最大阳性的最大值更慢。这一挑战也表现出从完美候选名单的前偏差表现出来。
      我们进一步评估了复制对统计分析结果的影响。我们使用了三种统计方法来分析了峰值in-in-var-ot dataet,随着重复数量的减少。 MS1-MS2组合方法比单个测试保持更高的统计功率(Fig. 3D)。在最低数量的重复(两)中,与MS1和MS2相比,MS1-MS2组合方法与MS1和17%相比具有13%的灵敏度。
      Dia的一个重要参数分别分配给MS1和MS2的时间(从而影响Orbitrap Instruments的分辨率)。因为目前的DIA方法主要针对基于MS2的量化优化,所以我们评估了实验MS1分辨率对MS1-MS2组合统计程序对侧面谱仪的影响。受控混合物MP-LFC-MS1VAR-OT用DIALED,同时改变MS1分辨率(30,000至240,000)并平衡MS2时间(以30,000的恒定分辨率),以保持方法的循环时间常数。然后,我们以定量精度为特征,以及在这些设置中检测差异丰富的蛋白质(补充文件mp-lfc-ms1var-ot.zip.)。具有120,000 MS1分辨率的DIA方法一致地为MS1和MS2()一致产生低于20%的CVS(补充图S7A)。这可以通过以下事实来解释:Spectronaut中的峰值拣选和集成取决于MS1和MS2。对于所有三种统计模型,在120,000 MS1分辨率下获得了最佳候选列表。 MS1-MS2组合方法显示出最佳的整体性能,可能是由于MS1解析功率足够的MS1分辨率和MS2段数量的平衡(补充图S7B和S7C)。这是实用的,因为它对应于广泛使用的DIA方法。

       用肺癌的临床样本集差异丰度测试蛋白质

      最后,我们评估了MS1-MS2组合方法在12个健康肺和12个癌症样品(六种腺癌和六种鳞状细胞癌)的临床调查中的性能。我们使用MS1或基于MS2的方法或MS1-MS2组合方法进行了探索性分析,对差分丰度的统计分析(补充文件Biolds-Ot.xlsx)和使用熟智能途径分析(IPA)的生物途径分析(
      • KrämerA.
      • 绿色J.
      • Pollard Jr,J.
      • Tugendreich S.
      思想途径分析中的因果分析方法。
      )。基于组分分析的聚合物揭示了健康和肿瘤样品的清晰分离,表明两个样品套之间的生物分离( Fig. 4A)。 MS1-MS2组合方法产生了差异丰富的蛋白质最大列表(多次测试校正BH,FDR<1%)。三种方法共有65%的差异丰富的蛋白质联合(Fig. 4B)。基于MS2和MS1-MS2组合方法显示出大部分独特的候选者(union的7.5%和5.8%)。 MS1-MS2组合方法的结果与MS1接近具有更大的重叠,缺少79个候选。基于MS2的方法错过了MS1报告的238个差异丰富的蛋白质。
      图缩略图GR4.
      Fig. 4基于MS1-MS2组合的临床样本中的差分丰度测试 (A)通过质谱法分析了12种健康的肺和12个癌症(六个腺癌和六种鳞状细胞癌)。得到的数据经受主成分分析。 (B)用MS1-,MS2和MS1-MS2组合方法进行差异丰富的蛋白质的统计检测。差异丰富的蛋白质重叠(FDR<在蛋白质水平上计算0.05)。 (C)将测试方法的候选名单与Tenzer的独立肺癌研究的候选名单进行比较 等等。 (
      • Tenzer S.
      • Leidinger P.
      • 返回C.
      • Huwer H.
      • 希尔德布兰特A.
      • Lenhof H.-P.
      • Wesse T.
      • 弗兰克A.
      • Meese E.
      • 凯勒阿。
      肺肿瘤和对照组织的综合定量蛋白质组学及转录组分析:肺癌展示。
      )。 (D)通过使用IPA来产生功能分析(
      • KrämerA.
      • 绿色J.
      • Pollard Jr,J.
      • Tugendreich S.
      思想途径分析中的因果分析方法。
      )。该图根据IPA绘制通路的激活状态。
      由于真正的差异丰富的蛋白质未知,我们将结果与基于同一癌症类型的独立研究的结果进行了比较 等等。 (
      • Tenzer S.
      • Leidinger P.
      • 返回C.
      • Huwer H.
      • 希尔德布兰特A.
      • Lenhof H.-P.
      • Wesse T.
      • 弗兰克A.
      • Meese E.
      • 凯勒阿。
      肺肿瘤和对照组织的综合定量蛋白质组学及转录组分析:肺癌展示。
      )。 MS1-MS2组合方法的结果具有最大的与Tenzer重叠 等等。 重叠具有70个蛋白质,而不是基于MS2方法的重叠(比MS1为基于MS1的79)(Fig. 4C)。在调查候选名单中的途径浓缩后,我们发现在64个最丰富的途径中,所有三种不同的方法之间存在高度重叠。途径一致地被激活或停用(Fig. 4D)。由MS1-MS2组合方法唯一识别的蛋白质属于相同的途径,例如共用蛋白的途径,表明更全面的描述(补充图S8)。

      讨论

      在复杂的混合物中,相同质量的肽可以共色,并且共抑制肽可以共享相同质量的碎片。现代DIA实验使我们能够表征这两个独立的定量空间。 MS1和MS2级信息的组合使用增加了技术复制的数量,因此增加了测量的精度。改进的精度,结合了通过统计建模分离生物学和技术变化来源的能力,又改善了检测差异丰富的蛋白质的力量。
      此外,由于MS1和MS2中的干扰通常不相关,所以MS1和MS2的组合使用的另一强度是在下游统计分析上的一个定量空间中的干扰的负面影响(补充图S5)。
      为了利用这两层量化,我们开发了一种结合MS1和MS2的使用的统计模型。我们展示了这种方法在多型仪器平台上的多组控制混合物上的优势。我们注意到检测差异丰富的最大改善,以进行小折叠变化,该发现特别相关,与血浆研究以及少数重复(
      • Moreno S.O.
      • Cominetti O.
      • Galindo A.N.
      • iRINCHEEVA I.
      • CorthésyJ.
      • Astrup A.
      • Saris W.H.M.
      • Hager J.
      • Kussmann M.
      • 天顿L.
      肥胖血浆蛋白质蛋白质组和超重个体正在进行营养减肥和维护干预。
      ,
      • Geyer P.E.
      • Wewer Albrechtsen N.J.
      • Tyanova S.
      • BASSL N.
      • Iepsen e.w.
      • Lundgren J.
      • Madsbad S.
      • HOLST J.J.
      • Torekov S.S.
      蛋白质组学揭示了持续减肥对人血浆蛋白质组的影响。
      ,
      • 布鲁德尔R.
      • muntel J.
      • MüllerS.
      • 伯恩哈德特O.M.
      • Gandhi T.
      • Cominetti O.
      • Macron C.
      • Carayol J.
      • rinner o.
      • Astrup A.
      • Saris W.H.M.
      • Hager J.
      • valsesia A.
      • 天顿L.
      • 重新勒
      用毛细管流动数据无关的采集谱分析1508等离子体样品的体重减轻和维护蛋白质组学。
      )。在肺癌的临床调查中,通过MS1-MS2组合方法唯一鉴定的蛋白质增加了MS1和MS2基数富集的途径的覆盖率。尽管有这种改进,但MS1-MS2合并方法不是充分的生物复制的替代品。
      我们认为,由于技术的发展,所提出的方法可能会在未来具有很高的潜力。例如,BoxCar MS1采集的最近开发(
      • 梅尔F.
      • Geyer P.E.
      • 弗莱拉冬季S.
      • Cox J.
      BoxCar采集方法使单次蛋白质组学能够在100分钟内以10,000个蛋白的深度。
      )改善了IntaMancan动态范围,这导致更好的MS1量化。因此,可以想到这里呈现的方法将变得更加强大,并且在组合Boxcar MS1和Dia时会导致敏感和鲁棒的统计。

      数据可用性

      原始质谱数据,光谱库和定量数据表已通过自豪伙伴存储库(
      • VizCaino J.A.
      • Csordas A.
      • Del-Toro N.
      • 戴安斯J.A.
      • 怜悯J.
      • Lavidas I.
      • Mayer G.
      • Perez-Riverol Y.
      • 关于inger F.
      • Ternent T.
      • 徐Q.W.
      • 王R.
      • Hermjakob H.
      2016年更新自豪数据库及其相关工具。
      )使用DataSet标识符PXD016647。来自Spectronaut的已保存项目可以使用Spectronaut查看器进行审核(www.biognosys.com/spectronaut-viewer.)。

      致谢

      我们要感谢Nigel Beaton进行校对。

      补充材料

      参考

        • Aeberberold R.
        蛋白质组结构和功能的质谱探索。
        自然。 2016; 537: 347-355
        • Rardin M.J.
        • 席克宁B.
        • 郑;
        • 麦克莱恩B.X.
        • sorensen d.j.
        • Sahu A.K.
        • maccoss m.j.
        • Vitek O.
        • 吉布森B.W.
        MS2(SWATH)数据独立采集中的MS1肽离子强度色谱图。改善蛋白质组学实验的初期收购分析。
        摩尔。细胞蛋白质组学。 2015; 14: 2405-2419
        • Aeberberold R.
        基于质谱的蛋白质组学。
        自然。 2003; 422: 198-207
        • 汤普森A.
        • SchäferJ.
        • Kuhn K.
        • Kienle S.
        • Schwarz J.
        • 施密特G.
        • Neumann T.
        • 哈蒙克
        串联质量标签:MS / MS的复合蛋白混合物比较分析的新量化策略。
        肛门。化学。 2003; 75: 1895-1904
        • 不胜的R.D.
        • 刺穿A.
        • Watson R.B.
        • 斯得人D.W.
        • Whetton A.D.
        使用异蛋白标签的定量蛋白质组学分析能够快速比较转化细胞中转录物和蛋白质水平的变化。
        摩尔。细胞蛋白质组学。 2005; 4: 924-935
        • wührm.
        • 哈斯W.
        • Mcalister G.C.
        • Peshkin L.
        • RAD R.
        • Kirschner M.W.
        • Gygi S.P.
        使用补体报告离子簇在MS2级别的精确复用蛋白质组学。
        肛门。化学。 2012; 84: 9214-9221
        • Sonnett M.
        • 杨E.
        • wührm.
        使用补体报告离子簇精确,灵敏,精确的多路复用蛋白质组学。
        肛门。化学。 2018; 90: 5032-5039
        • 弗莱拉冬季S.
        • 梅尔F.
        • Wichmann C.
        • Cox J.
        • Meissner F.
        EASI标签可实现准确的基于多路复用和无干扰MS2的蛋白质组量化。
        NAT。方法。 2018; 15: 527-530
        • 吉拉特L.C.
        • Navarro P.
        • 塔特S.
        • 罗斯特H.
        • selevsek n。
        • 重新勒
        • Bonner R.
        • Aeberberold R.
        由数据独立获取产生的MS / MS光谱的有针对性的数据提取:一致和准确的蛋白质组分析的新概念。
        摩尔。细胞蛋白质组学。 2012; 11 (o111.016717)
        • 布鲁德尔R.
        • 伯恩哈德特O.M.
        • Gandhi T.
        • Miladinovićć
        • 郑;
        • Messner S.
        • Ehrenberger T.
        • Zanotelli V.
        • Butscheid Y.
        • eScher C.
        • Vitek O.
        • rinner o.
        • 重新勒
        将定量蛋白质组分析的限制与乙酰氨基酚处理的三维肝脏微发布延伸到对乙酰氨基酚处理的三维肝脏微发布。
        摩尔。细胞蛋白质组学。 2015; 14: 1400-1410
        • Tsou C.C.
        • Avtonomov D.
        • 拉森B.
        • Tucholska M.
        • Choi H.
        • Gingras A.c.
        • nesvizhskii a.i.
        DIA-UMPIRE:数据无关的采集蛋白质组学的综合计算框架。
        NAT。方法。 2015; 12: 1-14
        • Zirlik A.
        • HTUN N.
        • iPhöferA.
        • jänschl.
        • Mischak H.
        使用SWATHPROCH的数据独立采集MS的靶向分析中的结果和去除片段离子干扰的自动验证。
        摩尔。细胞蛋白质组学。 2015; 14: 1411-1418
        • 毕尔巴鄂A.
        • 张Y.
        • varesio E.
        • 鲁班J.
        • Strambio-de-castillia C.
        • Lisacek F.
        • Hopfgartner G.
        根据异常值检测排序片段离子,以改善无关地获取LC-MS / MS中的改进的无标签量化。
        J.蛋白质组。 2015; 14: 4581-4593
        • Toghi Eshghi S.
        • 螺旋钻
        • mathews w.r.
        采用机器学习的有针对性质谱数据的质量评估和干扰检测。
        临床。蛋白质组学。 2018; 15: 33
        • Searle B.C.
        • Pino L.K.
        • Egertson J.D.
        • 婷婷。
        • 劳伦斯R.T.
        • 麦克莱恩B.X.
        • VillénJ.
        • maccoss m.j.
        色谱图文文库通过数据无关采集质谱来改善肽检测和定量。
        NAT。安排。 2018; 9: 5128
        • Jacome A.S.v.
        • 佩克纳R.
        • 舒尔曼N.
        • 克鲁格克。
        • 德鲁夫K.C.
        • 官员A.
        • 麦克莱恩B.
        • maccoss m.j.
        • carr s.a.
        • Jaffe J.D.
        Avant-Garde:自动化数据驱动的DIA数据策良工具。
        生物XIV。 2019; : 565523
        • Ludwig C.
        • 吉拉特L.
        • Rosenberger G.
        • Amon S.
        • 柯林斯B.C.
        • Aeberberold R.
        基于数据的基于数据的获取的基于蛋白质组学的SWATH-MS:教程。
        摩尔。系统。 BIOL。 2018; 14: e8126
        • 麦克莱恩B.
        • Tomazela d.m.
        • 舒尔曼N.
        • Chambers M.
        • 芬尼G.L.
        • Frewen B.
        • 肯尼尔·
        • Tabb D.L.
        • Liebler D.C.
        • maccoss m.j.
        天际线:用于创建和分析目标蛋白质组学实验的开源文档编辑器。
        生物信息学。 2010; 26: 966-968
        • 重新勒
        • rinner o.
        • Picotti P.
        • HüttenhainR.
        • 贝克米
        • Hengartner M.O.
        • Aeberberold R.
        MP.ROCHET:用于大规模SRM实验的自动数据处理和统计验证。
        NAT。方法。 2011; 8: 430-435
        • 席克宁B.
        • Rardin M.J.
        • 麦克莱恩B.X.
        • Zawadzka上午
        • Frewen B.E.
        • Cusack M.P.
        • sorensen d.j.
        • Bereman M.S.
        • 静E.
        • 吴C.C.
        • verdin E.
        • KAHN C.R.
        • maccoss m.j.
        • 吉布森B.W.
        使用MS1提取的离子色谱图在天际线上的平台无关和无标记定量蛋白质组学数据:应用于蛋白质乙酰化和磷酸化。
        摩尔。细胞蛋白质组学。 2012; 11: 202-214
        • 布鲁德尔R.
        • 伯恩哈德特O.M.
        • Gandhi T.
        • 轩辕
        • Sondermann J.
        • Schmidt M.
        在无关的数据质谱中的实验参数优化显着提高了结果的深度和再现性。
        摩尔。细胞蛋白质组学。 2017; 16: 2296-2309
        • muntel J.
        • Gandhi T.
        • verbebere l.
        • 伯恩哈德特O.M.
        • Treiber T.
        • 布鲁德尔R.
        • 重新勒
        通过优化当前LC-MS仪器和数据分析策略,在一次运行中超过10,000次鉴定和定量的蛋白质。
        分子Omics. 2019; 15: 348-360
        • muntel J.
        • Kirkpatrick J.
        • 布鲁德尔R.
        • 黄T.
        • Vitek O.
        • ori a。
        • 重新勒
        用固定仪器时间对复杂背景中蛋白质定量的比较。
        J.蛋白质组。 2019; 18: 1340-1351
        • Kelstrup C.D.
        • 年轻的C.
        • Lavallee R.
        • Nielsen M.L.
        • 奥尔森J.V.
        高压孔射出质谱仪对霰弹枪蛋白质组学的优化快速敏感方法。
        J.蛋白质组。 2012; 11: 3487-3497
        • 布鲁德尔R.
        • 伯恩哈特o.o.m.
        • Gandhi T.
        • 重新勒
        高精度IRT预测数据独立采集的目标分析及其对识别和定量的影响。
        蛋白质组学。 2016; 16: 1-20
        • Cox J.
        MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
        NAT。 Biotechnol。 2008; 26: 1367-1372
        • Cox J.
        • Neuhauser N.
        • Michalski A.
        • 施泰米r.a.
        • 奥尔森J.V.
        和romeda:肽搜索引擎集成到最大环境中。
        J.蛋白质组。 2011; 10: 1794-1805
        • Suomi T.
        • elo l.l.
        增强数据无关的采集蛋白质组学的差异表达统计数据。
        SCI。代表。 2017; : 1-8
        • Navarro P.
        • Kuharev J.
        • 吉拉特L.C.
        • 伯恩哈德特O.M.
        • 麦克莱恩B.
        • rost h.l.
        • tate s.a.
        • tsou c.-c。
        • 重新勒
        • 遥远的美国。
        • Rosenberger G.
        • Perez-Riverol Y.
        • nesvizhskii a.i.
        • Aeberberold R.
        • Tenzer S.
        一种多中心研究基准测试软件工具,用于无标记蛋白质组量化。
        NAT。 Biotechnol。 2016; 34: 1130-1136
        • 她X.
        • rohl c.a.
        • Castle J.C.
        • Kulkarni A.v.
        • 约翰逊准噶逊
        • 陈R.
        家务和组织富集基因的定义,保护和表观遗传学。
        BMC基因组学。 2009; 10: 269
        • Hochberg Y.
        • Benjamini Y.
        更强大的多种意义测试程序。
        统计。 Med。 1990; 9: 811-818
        • Tenzer S.
        • Leidinger P.
        • 返回C.
        • Huwer H.
        • 希尔德布兰特A.
        • Lenhof H.-P.
        • Wesse T.
        • 弗兰克A.
        • Meese E.
        • 凯勒阿。
        肺肿瘤和对照组织的综合定量蛋白质组学及转录组分析:肺癌展示。
        oncotarget。 2016; 7: 14857-14870
        • KrämerA.
        • 绿色J.
        • Pollard Jr,J.
        • Tugendreich S.
        思想途径分析中的因果分析方法。
        生物信息学。 2014; 30: 523-530
        • Moreno S.O.
        • Cominetti O.
        • Galindo A.N.
        • iRINCHEEVA I.
        • CorthésyJ.
        • Astrup A.
        • Saris W.H.M.
        • Hager J.
        • Kussmann M.
        • 天顿L.
        肥胖血浆蛋白质蛋白质组和超重个体正在进行营养减肥和维护干预。
        蛋白质组学临床。苹果。 2017; 12: 160015
        • Geyer P.E.
        • Wewer Albrechtsen N.J.
        • Tyanova S.
        • BASSL N.
        • Iepsen e.w.
        • Lundgren J.
        • Madsbad S.
        • HOLST J.J.
        • Torekov S.S.
        蛋白质组学揭示了持续减肥对人血浆蛋白质组的影响。
        摩尔。系统。 BIOL。 2016; 12: 901
        • 布鲁德尔R.
        • muntel J.
        • MüllerS.
        • 伯恩哈德特O.M.
        • Gandhi T.
        • Cominetti O.
        • Macron C.
        • Carayol J.
        • rinner o.
        • Astrup A.
        • Saris W.H.M.
        • Hager J.
        • valsesia A.
        • 天顿L.
        • 重新勒
        用毛细管流动数据无关的采集谱分析1508等离子体样品的体重减轻和维护蛋白质组学。
        摩尔。细胞蛋白质组学。 2019; 18: 1242-1254
        • 梅尔F.
        • Geyer P.E.
        • 弗莱拉冬季S.
        • Cox J.
        BoxCar采集方法使单次蛋白质组学能够在100分钟内以10,000个蛋白的深度。
        NAT。方法。 2018; 15: 440-448
        • VizCaino J.A.
        • Csordas A.
        • Del-Toro N.
        • 戴安斯J.A.
        • 怜悯J.
        • Lavidas I.
        • Mayer G.
        • Perez-Riverol Y.
        • 关于inger F.
        • Ternent T.
        • 徐Q.W.
        • 王R.
        • Hermjakob H.
        2016年更新自豪数据库及其相关工具。
        核酸RES。 2016; 44: 447-456