广告

无标记肽量化的工具*

      数量蛋白质组学的规模和复杂性越来越多,复杂地对所获得的数据进行后续分析。基于特征强度或频谱计数的无标签的无标签量化是一种方法,它特别符合样本数量。因此,它是标记技术的优异替代方案。然而,为了从这种可扩展性中获益,数据分析必须应对大量数据,自动处理它们,并进行全面的统计分析,以获得可靠的结果。我们在未确定的蛋白质组学中的无标记量化的计算工具审查了本领域的状态。两种基于基于特征的量化,依赖于肽的总和质谱强度和光谱计数,依赖于为某些蛋白质获得的MS / MS光谱的数量。我们审查了当前算法的基础,一些广泛使用的软件包,并简要讨论了分析数据的统计策略。
      近几十年来,质谱已经成为大多数蛋白质组学研究中的分析方法( 例如 参考。
      • Bantscheff M.
      • Eberhard D.
      • 亚伯拉罕Y.
      • 巴斯克S.
      • Boesche M.
      • 霍布森S.
      • Mathieson T.
      • Perrin J.
      • Raida M.
      • RAU C.
      • 读者v.r.
      • 甜蜜曼G.
      • 鲍尔A.
      • bouwmeester t.
      • HOPF C.
      • 克鲁斯U.
      • Neubauer G.
      • ramsden n。
      • 瑞克J.
      • Kuster B.
      • 德鲁斯G.
      定量化学蛋白质组学显示出临床ABL激酶抑制剂的作用机制。
      ,
      • yates j.r.
      • Gilchrist A.
      • Howell K.E.
      • Bergeron J.j.m.
      细胞器和大细胞结构的蛋白质组学。
      ,
      • 奥尔森J.V.
      • Blagoev B.
      • GNAD F.
      • MACEK B.
      • Kumar C.
      • Mortensen P.
      全球性,体内和现场特异性磷酸化动力学中的信令网络。
      ,
      • Guruharsha K.G.
      • 有害J.-F.O.
      • 翟德
      • Mintseris J.
      • Vaidya P.
      • Vaidya N.
      • Beekman C.
      • 黄C.
      • Rhee D.Y.
      • CenaJ O.
      • McKillip E.
      • 莎娜。
      • Stapleton M.
      • WAN K.H.
      • yu c.
      • Parsa B.
      • 卡尔森J.W.
      • 陈X.
      • Kapadia B.
      • Vijayraghavan K.
      • Gygi S.P.
      • Celniker S.E.
      • OBAR R.A.
      • Artavanis-Tsakonas S.
      果蝇黑素蛋白酶蛋白复杂网络。
      )。标准质谱工作流程允许蛋白质鉴定和蛋白质量化(
      • Aeberberold R.
      基于质谱的蛋白质组学。
      )以某种形式。长期以来,该技术主要用于蛋白质混合物的定性评估,即评估特定蛋白是否在样品中。但是,对于大多数有趣的研究问题,特别是在系统生物学领域,这个二进制信息(目前与否)是不够的(
      • Cox J.
      用于数据驱动系统生物学的定量,高分辨率蛋白质组学。
      )。关于蛋白质表达水平更详细信息的必要性驱动了定量蛋白质组学的领域(
      • ong s. -e.
      基于质谱的蛋白质组学转变定量。
      ,
      • Schulze W.X.
      • USADEL B.
      基于质谱的蛋白质组学的定量。
      ),它能够与其他数据源集成蛋白质组学数据并允许在REF中审查的网络中心研究。
      • Gstaiger M.
      • Aeberberold R.
      将质谱基蛋白质组学应用于遗传学,基因组学与网络生物学。
      。最近的研究表明,基于质谱的定量蛋白质组学实验可以为表达蛋白质的大部分(如果不是整组)提供定量信息(相对或绝对)(
      • 慕尼宫
      • 低T.Y.
      • Kok Y.J.
      • 中国。
      • 弗雷泽C.K.
      • 丁V.
      • Choo A.
      • heck a.j.r.
      人诱导的多能干细胞和胚胎干细胞的定量蛋白质组。
      ,
      • Nagaraj N.
      • wisniewski J.R.
      • 盖尔特T.
      • Cox J.
      • Kircher M.
      • Kelso J.
      • PääboS.
      人癌细胞系的深层蛋白质组和转录组映射。
      ,
      • 贝克米
      • 施密特A.
      • Malmstroem J.
      • Claassen M.
      • ori A.
      • Szymborska A.
      • 赫罗特F.
      • rinner o.
      • Ellenberg J.
      • Aeberberold R.
      人细胞系的定量蛋白质组。
      )。
      由于同位素编码的亲和标签协议于1999年首次发布(
      • Gygi S.P.
      • rist b.
      • 格柏S.A.
      • Turecek F.
      • 凝胶M.H.
      • Aeberberold R.
      使用同位素编码亲和标记的复合蛋白混合物的定量分析。
      ),众多标签策略已经发现了进入定量蛋白质组学的领域(
      • Bantscheff M.
      • Schirle M.
      • 甜蜜曼G.
      • 瑞克J.
      • Kuster B.
      蛋白质组学中的定量质谱:批判性综述。
      )。这些包括同位素编码蛋白标记(
      • 施密特A.
      • Kellermann J.
      • Lottspeich F.
      同位素编码蛋白标记的定量蛋白质组学的一种新策略。
      ),代谢标签(
      • ong s. -e.
      • Blagoev B.
      • Kratchmarova I.
      • 克里斯滕森D.B.
      • 斯丁H.
      • Pandey A.
      细胞培养物中氨基酸的稳定同位素标记,硅胶,作为表达蛋白质组学的简单且准确的方法。
      ,
      • Krijgsveld J.
      • Ketting R.F.
      • Mahmoudi T.
      • 约翰森J.
      • Artal-Sanz M.
      • Verrijzer C.P.
      • Plasterk r.h.a.
      • heck a.j.r.
      C. elegans和D. melanogaster的代谢标记为定量蛋白质组学。
      )和等因素标签(
      • 罗斯P.L.
      • 黄玉。
      • Marchese J.N.
      • 威廉姆斯B.
      • 帕克克。
      • 哈桑斯。
      • Khainovski N.
      • Pillai S.
      • 丹尼尔斯S.
      • Purkayastha S.
      • Juhasz P.
      • 马丁斯。
      • Bartlet-Jones M.
      • 雅各布森A.
      • Pappin D.J.
      使用胺 - 反应性的异常标记试剂在酿酒酵母中的多重蛋白质定量。
      ,
      • 汤普森A.
      • SchäferJ.U.
      • Kuhn K.
      • Kienle S.
      • Schwarz J.
      • 施密特G.U.
      • Neumann T.
      • 约翰斯通r.
      • 穆罕默德A.K.A.
      • 哈蒙克
      串联质量标签:MS / MS的复合蛋白混合物比较分析的新量化策略。
      )。综合概述不同量化策略可以在refs中找到。
      • 穆勒L.N.
      • Brusniak M.Y.
      • MANI D.R.
      • Aeberberold R.
      基于质量光谱法分析的软件解决方案评估。
      • Mallick P.
      • Kuster B.
      蛋白质组学:一种务实的观点。
      。由于标签策略的缺点,无标签的方法越来越多地获得蛋白质组学研究人员的利益(
      • Daigo K.
      • yamaguchi n。
      • Kawamura T.
      • Matsubara K.
      • 姜S.
      • ohashi R.
      • Sudou Y.
      • Kodama T.
      • Naito M.
      • k.
      • 哈库普岛T.
      在败血症中循环五花素3(PTX3)复合物的蛋白质组学谱证明了与硫酸细胞外疏水阀的与硫酸脲1和其他组分相互作用。
      ,
      • 曼B.F.
      • Goetz J.A.
      • 房子M.G.
      • Schmidt C.M.
      • 不 votny M.v.
      胰腺囊肿流体的糖类和蛋白质组学分析识别过表达糖蛋白的N-连接的聚糖上的硫氧化物化乳糖胺。
      )。在无标签量化中,没有将标签引入任何一种样本。在单独的LC / MS实验中分析所有样品,然后比较单个测量的个体肽特性。无论定量策略如何,数据分析的计算方法都成为蛋白质组学工作流程的关键最终步骤。参考文献提供了蛋白质组学中现有的计算方法的概述。
      • Kumar C.
      基于质谱的蛋白质组学数据集的生物信息分析。
      • KällL.
      • Vitek O.
      基于计算质谱的蛋白质组学。
      。可视化的无可计算标签的量化工作流程 Fig. 1。使用质谱法比较肽量仍然是困难的任务,因为质谱仪对不同化学实体具有不同的响应值,因此不可能进行不同肽的直接比较。无标签定量数据集的计算分析包括几个主要分为原始数据信号处理和量化的步骤。信号处理步骤包括数据减少程序,例如基线移除,去噪和刻心。
      图缩略图GR1.
      Fig. 1可以通过无标记蛋白质组学分析的样品群体不受尺寸的限制。 每个样品通过样品制备和数据采集管道单独处理。对于数据分析,组合来自不同LC / MS运行的数据。
      这些步骤可以在模块化构建块中完成,或者可以使用单片分析软件进行整个分析。最近,已经表明,将模块化块与不同的软件工具组合到共识管道是有益的(
      • HOEKMAN B.
      • 百年灵r.
      • 适合F.
      • Bischoff R.
      • Horvatovich P.
      MSCompare:一种定量分析对比较生物标志物研究的无标签LCMS数据的框架。
      )。同一研究还示出了由不同软件工具模块化的方法的多样性。在最近的另一个出版物中,比较单片软件包(
      • 张R.
      • 巴顿A.
      • 布里坦丁J.
      • huang j.t.-j.
      • 克林瑟D.
      基于LS-MS的无标签定量蛋白质组学的计算平台评估:全球视野。
      )。在该研究中,作者标识了一组七个度量:检测灵敏度,检测一致性,强度一致性,强度精度,检测准确度,统计能力和量化精度。尽管这些指标的独立性缺失和软件参数设置的松散报告,但这种比较研究对定量蛋白质组学领域具有很大的兴趣。这些研究的一般结论是,软件的选择可能在一定程度上影响研究的最终结果。
      如果使用标准添加,可以使用基于强度的无标记方法的绝对定量使用基于强度的无标记方法的肽和蛋白质。借助已知的浓度,可以绘制校准线,并且可以从这些校准测量中直接推断出绝对蛋白质量(
      • Mayr下午
      • Kohlbacher O.
      • Reinert K.
      • STURM M.
      • GRÖPLC.
      • Lange E.
      • Klein C.
      • HUBER C.G.
      通过组合二维液相色谱 - 电喷雾电离质谱和新型数据分析算法,通过组合血清中的绝对肌球蛋白定量。
      )。此外,已经提出可以预测肽峰值强度,并且可以从这些预测中导出绝对量(
      • 蒂姆W.
      • Scherbart A.
      • Bocker S.
      • Kohlbacher O.
      • Nattkemper T.W.
      马尔迪-TOF质谱中的峰强度预测:一种支持定量蛋白质组学的机器学习研究。
      )。然而,预测的有限精度或已知浓度的肽的需要限制了这些方法,仅限于所选蛋白质/肽,并防止它们在蛋白质组中使用的用途。
      光谱计数方法还被用于估计全球规模的绝对浓度(
      • SchwanhäusserB.R.
      • 巴士D.
      • 李恩
      • Dittmar G.
      • Schuchhardt J.
      • 狼J.
      • 陈W.
      • Selbach M.
      哺乳动物基因表达控制的全局量化。
      ),尽管具有相对于基于强度的方法的急性降低的精度。在一项研究中,作者使用了具有已知浓度的48个蛋白质的混合物,并在该混合物上预测了成千上万的蛋白质的绝对拷贝数量。尽管大大的蛋白质组数据集会稀释不同肽遗传性对个体蛋白质水平的影响,但这些方法总是限于它们的定量准确性。
      无标记量化的通用性质不限于任何模型系统,也可以使用组织或体液(
      • Krishnamurthy D.
      • Levin Y.
      • 哈里斯L.W.
      • umrania y.
      • 鲍恩斯。
      • 客人P.C.
      通过数据独立的无标记液相色谱串联质谱分析人脑垂体蛋白质。
      ,
      • hyung s. -w。
      • Lee M.Y.
      • yu J.-H.
      • 胫骨
      • Jung H.-J.
      • 公园J.-M.
      • 汉W.
      • Lee K.-M.
      • 月亮H.-G.
      • 张H.
      • Aeberberold R.
      • Hwang D.
      • 李S. -W.
      • yu m.-h.
      • 诺夫D.-Y.
      血清蛋白质简介预测先进乳腺癌对新辅助化疗的抗性。
      )。然而,无标签方法对LC / MS之间的技术偏差更敏感,因为信息在不同的测量之间比较。因此,分析平台的再现性对于成功的无标记量化至关重要。最近的无标签量化成功只能通过算法的显着改进来实现(
      • COX J.U.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ,
      • STURM M.
      • 伯克沙A.
      • GRÖPLC.
      • 希尔德布兰特A.
      • Hussong R.
      • Lange E.
      • pfeifer n。
      • Schulz-Trieglacaff O.
      • Zerck A.
      • Reinert K.
      • Kohlbacher O.
      OpenMS-质谱谱图的开源软件框架。
      ,
      • Pluskal T.A.
      • 卡斯蒂略S.
      • Villar-Briones A.
      • 或者 esic m.
      MZMINE 2:用于处理,可视化和分析基于质谱的分子谱数据的模块化框架。
      ,
      • Colaert N.
      • Gevaert K.
      • 玛特L.
      ribar和Xribar:用于可再现的相对MS / MS的无标记蛋白质量化的方法。
      )。越来越大的无标签蛋白质组学的软件工具集合作为开源应用程序,或已作为市售包装进入市场。此评论旨在概述这些软件工具通常实现的计算方法。此外,我们说明了不同工具的优势和弱点。审查提供了广泛的蛋白质组学观众的信息资源,并且没有说明各个工具的所有算法细节。

      材料和方法

       LC-MS / MS数据的性质

      来自LC / MS和/或LC-MS / MS实验的定量蛋白质组学数据通常具有大数据量(数百至数百千兆字节,每个样本并不罕见),并且数据相当复杂。通常,消化蛋白质( IE。 复杂的肽样品)在液相色谱柱上分离并电离,得到的MS光谱由质谱仪记录。对于MS / MS实验,选择肽离子(基于它们的强度或通过包含列表)进行碎片,并记录片段离子光谱。这些MS / MS光谱通常构成识别的基础(我们在这里不考虑),但它们也可用于光谱计数。
      取决于质量分析仪的分辨率,并且因为电离是随机过程,即使是相同的离子也不会以完全相同测量 m/z;相反,它们在真实周围形成了测量的分布 m/z 价值。该分布称为(RAW)峰值,可以通过数学模型来描述(正常分布是良好的近似,但不足以足够)。这个过程 巅峰拣选 或者 以诚信为中心 旨在估算峰值模型的参数,例如 封面, 强度, 宽度 , 和 歪斜 。绝中心将原始测量数据降低到每个化合物的少数参数,并且最重要的是,为此产生单一值 m/z 离子。质心 m/z 可以报​​告为最大强度的位置,或通过平均 m/z (由强度加权的原始数据点)。同样,可以将峰值的强度作为从原始数据的最大高度读数( 峰顶)或者可以计算曲线下的区域( IE。 峰值体积)。重要的是要知道数据是否被厘定,因为某些软件只能处理一种类型的输入数据。
      Fig. 1 示出了使用HPLC-MS生物样本生成的典型数据集,并示出了其多维性质。在从柱中洗脱后,分析物连续注入质谱仪,其在高速记录质谱(扫描)。堆叠单个光谱产生三维数据集,即所谓的地图。当肽质谱比例在液相色谱分馏之前时,对应于肽的单电荷状态的观察到的信号实际上是保留时间的二维强度分布,并且属于该分布的数据点被称为a 特征 ( 例如 二维信号 Fig. 1 )。

       计算方法

      可以分为基于特征强度的方法和光谱计数方法的量化方法。在前者中,一个人试图考虑对应于MS水平的特定带电肽的所有信号;在后者中,一个人试图从MS / MS识别的数量推断肽的表达水平。地图对齐对于基于特征强度的量化尤其重要,而在光谱计数中,可以使用肽的识别来在地图上分配相应的数量。只有映射的准确对齐,可以正确比较定量属性。在下文中,我们描述了无标签数据处理所需的主要步骤。

       信号处理

      根据仪器类型,原始数据的处理可能不同。然而,信号处理中存在某些通用步骤,其适用于大多数乐器以及基于强度的方法和光谱计数。这些都是 基线过滤, 噪声过滤, 以诚信为中心 , 和 收费估计.
      在MALDI光谱中,在某种程度上在ESI光谱中,基线显而易见,其增加了分析物引起的信号。在马尔迪光谱中,基线可以在低位占主导地位 m = z 地区并随着越来越多消失 m = z。它通常形状类似于指数衰减分布,并且可以归因于矩阵材料。由于相邻峰之间的基线分离损失,基线导致峰形状不良。因此,基线干扰强度估计,并且必须计算地去除。诸如顶帽滤波器的形态过滤器可用于此任务。
      除了基线信号之外,每个质谱仪还患有高频噪声(通常归因于检测器的电子噪声,以及通常归因于溶剂,缓冲液和污染物的化学噪声),因此预期的峰值是高斯的峰值形状可能不再凸出。这是依赖于局部最小值的算法才能分离同位素峰值的潜在缺陷。噪声滤波器将通过删除高频噪声来平滑数据 - 例如,Savitzky-Golay滤波器将运行良好。
      最后,经过一直是基线校正和平滑的信号受到精心。计算问题在这里几乎微不足道( 例如 对于高分辨率光谱,例如,在高度充电的离子阱信号的情况下重叠(偏斜)高斯的拟合。通常,该配件与获得(最初)肽的未知电荷状态的问题交织在一起,作为充电状态 z 确定同位素峰的距离,即1 = z。得到的模型配合可用于分析确定峰值和峰的高度。通常,峰值体积是作为澄清峰的强度,因为它直接对应于离子计数。然而,对于高分辨率光谱,峰值的高度(更容易确定)同样好。

       基于功能的量化

      算法地,基于特征的量化的主要步骤可以分为(i)信号处理,(ii)特征发现,(iii)地图对齐。高分辨率质谱仪的出现使得信号处理和峰值拾取任务更简单,而不是在低分辨率仪器上。然而,量化方法是复杂的,良好的量化仍然是一个挑战。
      在质谱数据处理中的中央任务是检测从液相色谱柱洗脱的所有离子的肽特征。肽从液相色谱柱洗脱时间随时间洗脱,得到电离,并注射到质谱仪中。质谱仪以规则的小的时间间隔进行新测量,从而从时间上采样洗脱离子的量,从而导致 洗脱概况。在每次测量中,离子产生典型的 同位素模式,这是由原子组成引起的(见 Fig. 2 用于洗脱轮廓和同位素图案的示例)。通过整合在洗脱曲线和同位素模式上,可以确定肽特征强度。通常,人们可以假设二维分布是两个独立分布的乘积。因此,为了边缘分布 m/z,类似的推理适用于个体光谱。自动检测这些特征可以在不同的实验中进行比较。分析物的定量比较的基础是电喷雾电离强度与某个动态范围内的离子浓度的线性相关性。大多数算法尝试通过将适当的分发模型拟合到数据来启发式确定特征的程度和强度。这是在高信号强度的区域完成的( 例如 通过研究强度排序的峰值列表)。然后可以通过使用模型参数或简单地概括特征区域中的所有峰强度来确定特征的强度。
      图缩略图GR2.
      Fig. 2无标记的LC / MS数据包括累积(保留)时间的单个MS光谱。 并排堆叠,这些光谱形成二维图。在这些地图中,从柱洗脱的个体肽产生多个光谱的峰集。特征发现算法可以识别特征,其可以定义为由相同肽引起的所有质谱信号(峰值)。洗脱型材具有理想的是高斯形状,但它们可以显着扭曲。沿着的特征的投影 m/z 相应地对应于肽的同位素轮廓。

       光谱计数

      除了基于特征强度的量化方法之外,光谱计数方法还用于差分量化。尽管谱计数通常用于在蛋白质水平衍生定量信息,但肽的差异量化建立了这一概念的基础。在下文中,我们讨论光谱计数(SC)
      使用的缩写是:
      女士/女士
      串联质谱
      SC.
      光谱计数
      TopP.
      Openms蛋白质组学管道。
      概念和说明这些概念如何参与差异肽量化。 SC以其最简单的形式计数分配给相同蛋白质的串联光谱的数量。使用SC有许多研究,以推动无标签的霰弹枪蛋白质组学数据中的定量信息。最近审查了一系列方法(
      • Lundgren D.H.
      • Hwang S.-i.
      • 吴L.
      • 韩D.K.
      光谱计数在定量蛋白质组学中的作用。
      )。肽光谱匹配可用于推断肽的差分比,但这些方法也是差异蛋白质定量的普及。将简单SC扩展到差分蛋白质定量的方法包括蛋白质丰度指数(
      • Rappsilber J.
      • ryder u.
      • Lamond A.I.
      人脾脏的大规模蛋白质组学分析。
      );其扩展版本,指数改性蛋白质丰富指数(
      • Ishihama Y.
      • 奥达Y.
      • Tabata T.
      • 撒托T.
      • nagasu t.
      • Rappsilber J.
      指数改性蛋白质丰度指数(EMPAA),用于通过每种蛋白质的测序肽数估计蛋白质组学中的绝对蛋白质量。
      );标准化的光谱丰度因子(
      • Zybailov B.
      • 莫斯利A.L.
      • Sardiu M.E.
      • 科尔曼M.K.
      • Florens L.
      • Washburn M.P.
      酿酒酵母膜蛋白质表达变化的统计分析。
      );和绝对的蛋白质表达(
      • 鲁P.
      • Vogel C.
      • 王R.
      • 姚X.
      • Marcotte e.m.
      绝对蛋白表达分析估计转录和翻译规则的相对贡献。
      )。基于强度的基于强度的平均比率(Ribar)及其扩展版Xribar是Colaert最近方法的一部分 等等。 (
      • Colaert N.
      • Gevaert K.
      • 玛特L.
      ribar和Xribar:用于可再现的相对MS / MS的无标记蛋白质量化的方法。
      (将相应的片段光谱的总和在两个实验中相关,并且已经显示出优于其他基于SC的方法,例如指数改性的蛋白质丰度指数和归一化光谱丰度因子。尽管在MS / MS光谱上计算了蛋白质丰度的新方法,但由于数据相关的离子采样和动态排除列表设置,任何方法都会努力达到高量化精度。
      最近,比较了不同的无标签丰富度量,结果与RNA表达数据相结合(
      • 宁克。
      • 费尔明D.
      • nesvizhskii a.i.
      不同标签质谱基蛋白丰度估计的对比分析及其与RNA-SEQ基因表达数据的相关性。
      )。虽然基于特征的措施更准确,但作者发现,如果归一化到转录性丰度,频谱计数和基于特征的方法同样也很好地执行。 Hoekman. 等等。 (
      • HOEKMAN B.
      • 百年灵r.
      • 适合F.
      • Bischoff R.
      • Horvatovich P.
      MSCompare:一种定量分析对比较生物标志物研究的无标签LCMS数据的框架。
      )实施了允许组合不同量化方法的框架。

       地图对齐

      地图对齐的目的是在地图之间分配相同的肽特征以进行比较。这是使用肽的色谱洗脱时间以及其电离行为的假设来完成的假设,并且在测量之间保持相对恒定并测量 m/z 没有差异。虽然差异 m/z 是相当边缘的,RT维度的变化会变得非常大,并且经常显示一些非线性。
      已经使用了几种算法方法来调整这些扭曲。 Lange和Coauthors(
      • Lange E.
      • GRÖPLC.
      • Schulz-Trieglacaff O.
      • Leinenbach A.
      • Huber C.
      • Reinert K.
      液相色谱 - 质谱数据对准的几何方法。
      )使用姿势聚类技术来找到仿射变换的最佳参数。该方法是简单且稳健的,但它无法处理非线性转换。在refs中可以找到类似的,更新的方法。
      • Ballardini R.
      • 贝涅门店
      • Arrigoni G.
      • Pattini L.
      • 罗达A.
      Massuntangler:一种新型对准工具,用于无标记液相色谱谱分光谱蛋白质组物数据。
      • 张Z.
      通过划分和征管算法保持LC / MS数据的保留时间对齐。
      。参考中讨论的方法。
      • Vandenbogaert M.
      • Thiao-tés。
      • Kaltenbach H.-M。
      • 张R.
      • Aittokallio T.
      • Schwikowski B.
      LC-MS图像的对准,具有应用于生物标志物发现和蛋白质鉴定的应用。
      使用单个扫描的相似性来计算扫描方向对齐,而其他方法使用非线性函数来模拟保留时间的偏移。
      除了两张地图的成对对齐之外,另一个重要方面是在许多地图上将正确的特征分组在一起。关于地图对齐度的讨论,以及对不同方法的概述和评估,可以在参考中找到。
      • Lange E.
      • Tautenhahn R.
      • Neumann S.
      • GRÖPLC.
      LC-MS蛋白质组学和代谢组学测量对准程序的批判性评估。
      .

       正常化

      一旦在地图对准之后彼此分配不同地图的肽特征,就需要校正测量的强度中的系统偏差。这通常被称为“强度标准化”。归一化是无标签计算蛋白质组学管道的关键步骤。有必要考虑强度信号的可变性( 例如 实验,样品制备,色谱和质谱中的系统误差(
      • 调用S.J.
      • 巴里·克里。
      • Adkins J.N.
      • 约翰逊e.t.
      • 钱W.-J.
      • Webb-Robertson B.-J.M.
      • 史密斯r.d.
      • Lipton M.S.
      用于去除与质谱和无标记蛋白质组学相关的系统偏差的标准化方法。
      )))。微阵列社区在规范化程序中已经进行了广泛的研究。在参考中。
      • 调用S.J.
      • 巴里·克里。
      • Adkins J.N.
      • 约翰逊e.t.
      • 钱W.-J.
      • Webb-Robertson B.-J.M.
      • 史密斯r.d.
      • Lipton M.S.
      用于去除与质谱和无标记蛋白质组学相关的系统偏差的标准化方法。
      ,召唤 等等。 比较四种不同标准化策略的性能,以获得无标签的蛋白质组学数据。它们包括全局标准化,线性回归,本地回归和定量标准化。作者发现,需要根据数据集进行调整规范化度量。他们得出结论,定量标准化与其他技术具有一些优点,因为不需要迭代,并且不会强制将平均值为零(以日志刻度),因为数据(定量数)的连续部分均匀地从运行均衡。然而,在他们的研究中,线性回归模型在大多数情况下显示了最佳性能(
      • Kultima K.
      • 尼尔森A.
      • Scholz B.
      • rossbach u.l.
      • FälthM.
      • AndrénP.E.
      无标记肽的无标记相对定量标准化方法的开发与评价。
      )。全局正常化方法使用来自每种光谱的所有峰强度或运行的信息,以便缩放单个强度。 kultima 等等。 (
      • Kultima K.
      • 尼尔森A.
      • Scholz B.
      • rossbach u.l.
      • FälthM.
      • AndrénP.E.
      无标记肽的无标记相对定量标准化方法的开发与评价。
      )10种不同的标准化度量并显示了在三个独立的肽组学(内源肽的分析)数据集中最佳地表明考虑分析顺序的线性回归。王 等等。 (
      • 王P.
      • 唐H.
      • 张H.
      • Whiteaker J.
      • Paulovich A.G.
      • McIntosh M.
      关于高吞吐量质谱数据中的非随机缺失值的归一化。
      )争辩说,通过恒定因素的全局归一化是可行的,但是如果由于仪器检测限制的非随机缺失数据是一个问题,则注意到,如果由于仪器检测限而言,则只有常数数量的最强烈信号应用于归一化。
      除了Kultima的出版物 等等。 (
      • Kultima K.
      • 尼尔森A.
      • Scholz B.
      • rossbach u.l.
      • FälthM.
      • AndrénP.E.
      无标记肽的无标记相对定量标准化方法的开发与评价。
      )和呼叫 等等。 (
      • 调用S.J.
      • 巴里·克里。
      • Adkins J.N.
      • 约翰逊e.t.
      • 钱W.-J.
      • Webb-Robertson B.-J.M.
      • 史密斯r.d.
      • Lipton M.S.
      用于去除与质谱和无标记蛋白质组学相关的系统偏差的标准化方法。
      ),其他审查文章讨论了无标签蛋白质组学数据的正常化问题(
      • 美国A.H.P.
      • Cordewener J.H.G.
      比较LC-MS:山峰和山谷的景观。
      ,
      • listgarten J.
      • Emili A.
      使用液相色谱 - 串联质谱法对比较蛋白质组学分析的统计和计算方法。
      )。
      无标签量化的软件包涵盖了广泛的归一化技术,但每个包装只提供有限的方法。各个地图上的一些使用归一化(Mzmine2,Corra),大多数使用匹配的肽强度对列表进行标准化,有些根本不提供任何信息。 MZMine2在单张地图上工作,提供多种归一化方案( 例如 平均强度和最大强度标准化)。此外,可能存在于所有地图中必须存在的内部标准的归一化。 CORRA还在单一原始地图中运行,并在峰值拾取之前使用Limma包进行标准化。 Maxquant和Openms的蛋白质Quantifier都确保肽比率的中位数为零(在日志空间中)。 Pview2使用“中位数的中位数”标准化。吉祥物蒸馏器提供肽比例的平均值,总和和中位数。代理使用参考图采用迭代中值的比例方法。 MSINSPECT使用基于多个运行之间的最高强度肽的线性模型。最涉及的技术在Superhirn中实现:地图被分成保留时间段,其单独归一化。标准化本身基于类似地图中的匹配对进行分层地执行。

      软件包

      有一种越来越多的用于无标签量化的工具,实现前一节中讨论的一个或几种技术。出于可用的软件工具中,我们选择了几种广泛知名的商业和学术套餐,(在某种程度上)维持。 表I. 概述了计算工具,以及有关其许可证,发布日期和输入格式的信息。
      表I.无标签量化软件包概述
      名称 平台
      a 粗体和带下划线的文本表示二进制包的可用性; W = Windows OS,L = Linux OS,M = Mac OS。
      最新版本输入格式图形用户界面 cmd. 开源
      b +许可证如果适用; al = Apache许可证。
      解析度
      c 分辨率:H =高,L = LOW(根据文档)。
      量子。 统计分析
      学术/自由
      maxquant(
      • Cox B.
      • kislinger t.
      • Wigle D.A.
      • 坎南A.
      • 棕色K.
      • 好的 ubo T.
      • Hogan B.
      • jurisica I.
      • 弗雷B.
      • rossant J.
      • Emili A.
      小鼠肺部发育和NMYC靶基因的综合蛋白质组学和转录组分析。
      )
      W1.2.2.5(2011)Thermo .raw.+HMS1
      OpenMS / TOPP(
      • STURM M.
      • 伯克沙A.
      • GRÖPLC.
      • 希尔德布兰特A.
      • Hussong R.
      • Lange E.
      • pfeifer n。
      • Schulz-Trieglacaff O.
      • Zerck A.
      • Reinert K.
      • Kohlbacher O.
      OpenMS-质谱谱图的开源软件框架。
      ,
      • Kohlbacher O.
      • Reinert K.
      • GRÖPLC.
      • Lange E.
      • pfeifer n。
      • Schulz-Trieglacaff O.
      • STURM M.
      TopP. - OpenMS蛋白质组学管道。
      )
      W, L, M1.9(2012年2月)MZ(ml | XML |数据)+++(LGPL) LH. MS1
      pview 2(
      • 汗Z.
      • 绽放J.S.
      • 加西亚B.A.
      • Singh M.
      • Kruglyak L.
      蛋白质量化数百种实验条件。
      )
      W ,l,m 2.0(2011年7月)mzxml,pepxml.++(BSD)HMS1+
      mzmine 2(
      • Pluskal T.A.
      • 卡斯蒂略S.
      • Villar-Briones A.
      • 或者 esic m.
      MZMINE 2:用于处理,可视化和分析基于质谱的分子谱数据的模块化框架。
      )
      W, L, M2.6(2012年2月)MZ(ml | XML |数据),Thermoraw,NetCDF++(GPL 2.0) LH. MS1+
      超级(
      • 穆勒L.N.
      • rinner o.
      • 施密特A.
      • Letarte S.
      • Bodenmiller B.
      • Brusniak m.y.
      • Vitek O.
      • Aeberberold R.
      • Muller M.
      超空心 - 一种高分辨率LC-MS基肽/蛋白质分析的新型工具。
      )
      L, M0.3(2009年1月)mzxml,pepxml.++(al 2.0)HMS1
      Msinspect(
      • Bellew M.
      • Coram M.
      • FitzGibbon M.
      • IGRA M.
      • 兰多夫T.
      • 王P.
      • 5月D.
      • ENG J.
      • 方罗。
      • 林C.
      • 陈杰。
      • Goodlett D.
      • Whiteaker J.
      • Paulovich A.
      • McIntosh M.
      用高分辨率LC-MS综合分析复杂蛋白质混合物的综合算法。
      )
      W, L, M2.3(2010年1月)mzxml,mzml(头部)+++(al 2.0) LH. MS1
      VIPER(
      • Monroe M.E.
      • tolic n.
      • jaitly n ..
      • Shaw J.L.
      • Adkins J.N.
      • 史密斯r.d.
      VIPER:一种先进的软件包,可支持高通量LC-MS肽识别。
      )
      W3.48(2011年9月)PEK,CSV(Decon2LS),MZ(XML |数据)++(al 2.0)HMS1
      ribar / Xribar(
      • Colaert N.
      • Gevaert K.
      • 玛特L.
      ribar和Xribar:用于可再现的相对MS / MS的无标记蛋白质量化的方法。
      )
      W, L, M1.1(2011年5月)MS_LIMS,.DAT(吉祥物)++(al 2.0) SC.
      人口普查(
      • 公园S.K.
      • venable J.D.
      • XU T.
      • yates j.r.
      基于质谱的蛋白质组学的定量分析软件工具。
      )
      W, L, M1.72(2010年3月)MZXML,MS1,MS2,PEPXML,DTASelect++ LH. SC,MS1
      corra(
      • Brusniak m.y.
      • Bodenmiller B.
      • 坎贝尔D.
      • Cooke K.
      • eddes J.
      • Garbutt A.
      • 刘海。
      • Letarte S.
      • 穆勒L.N.
      • 沙姆达五。
      • Vitek O.
      • 张恩。
      • Aeberberold R.
      • 瓦特J.D.
      CORRA:用于LC-MS发现和基于目标质谱的蛋白质组学的计算框架和工具。
      )
      L3.1(2010年11月)mzxml,pepxml.+++(al 2.0) LH. MS1+
      商业的
      吉祥物蒸馏器
      d 矩阵科学。
      W2.4.2(2011年10月)MZ(ML | XML),主要供应商++ LH. SC,MS1
      e Thermo Scientific。
      W?Thermo .raw.+ LH. MS1+
      后代LC-MS
      f 非线性动力学有限公司
      W4.0(2011年9月)MZ(ML | XML),主要供应商+ LH. MS1?
      脚手架
      g Proteome Software,Inc。
      W, L, M3.3.3主要搜索引擎++
      h 通过脚手架。
      SC. +
      光谱仪
      i medicwave ab。
      W1.0MZ(ML | XML |数据),主要供应商+ LH. MS1+
      a 粗体和带下划线的文本表示二进制包的可用性; W = Windows OS,L = Linux OS,M = Mac OS。
      b +许可证如果适用; al = Apache许可证。
      c 分辨率:H =高,L = LOW(根据文档)。
      d 矩阵科学。
      e Thermo Scientific。
      f 非线性动力学有限公司
      g Proteome Software,Inc。
      h 通过脚手架。
      i medicwave ab。
      一些商业包(如筛子)仅限于本机供应商格式,无法读取像MZML,MZDATA或MZXML等开放的社区格式,这可以很容易地转换为与另一个( 例如 via OpenMS/TOPP (
      • STURM M.
      • 伯克沙A.
      • GRÖPLC.
      • 希尔德布兰特A.
      • Hussong R.
      • Lange E.
      • pfeifer n。
      • Schulz-Trieglacaff O.
      • Zerck A.
      • Reinert K.
      • Kohlbacher O.
      OpenMS-质谱谱图的开源软件框架。
      ,
      • Kohlbacher O.
      • Reinert K.
      • GRÖPLC.
      • Lange E.
      • pfeifer n。
      • Schulz-Trieglacaff O.
      • STURM M.
      TopP. - OpenMS蛋白质组学管道。
      )或proteowizard(
      • Kessner D.
      • Chambers M.
      • Burke R.
      • agus d。
      • Mallick P.
      Proteowizard:开源软件,用于快速蛋白质组学工具开发。
      )))。吉祥物蒸馏器(Matrix Science),SpectroLatezer(Medicwave AB),后代(非线性动态有限公司)和脚手架(Proteome Software,Inc。)除了像MZML这样的打开格式之外,还支持各种供应商格式。基于特征的方法在原始数据上工作,并应用内部刻心算法,或者可以直接使用以Centroided数据使用。一个例外是超级空中(
      • 穆勒L.N.
      • rinner o.
      • 施密特A.
      • Letarte S.
      • Bodenmiller B.
      • Brusniak m.y.
      • Vitek O.
      • Aeberberold R.
      • Muller M.
      超空心 - 一种高分辨率LC-MS基肽/蛋白质分析的新型工具。
      ),需要原始LC / MS数据。所有软件包都可以处理高分辨率数据,但只有一些可以使用低分辨率数据。 maxquant(
      • Cox B.
      • kislinger t.
      • Wigle D.A.
      • 坎南A.
      • 棕色K.
      • 好的 ubo T.
      • Hogan B.
      • jurisica I.
      • 弗雷B.
      • rossant J.
      • Emili A.
      小鼠肺部发育和NMYC靶基因的综合蛋白质组学和转录组分析。
      例如,超空国专业从事高分辨率,而Openms / TopP和人口普查(
      • 公园S.K.
      • venable J.D.
      • XU T.
      • yates j.r.
      基于质谱的蛋白质组学的定量分析软件工具。
      )可以处理两者。大多数工具支持SC或基于功能的量化,人口普查和吉祥物蒸馏器是我们阵容支持的唯一例外。
      SC. 通过Ribar / Xribar(
      • Colaert N.
      • Gevaert K.
      • 玛特L.
      ribar和Xribar:用于可再现的相对MS / MS的无标记蛋白质量化的方法。
      )和人口普查,两者都自由地提供。人口普查的内在细节是未知的,但它们涉及蛋白质长度和变异性的标准化。吉祥物蒸馏器和脚手架是商业替代品,后者还支持基因本体论术语注释。吉祥物蒸馏器支持指数修饰的蛋白质丰富指数值,并且脚手架标准化通过样品中的总计数进行计数,可以访问相对和绝对计数,并允许过滤规则。
      特征的方法通常跟随生物数据与蛋白质表达表相似的步骤(纤维,特征发现,映射对准,以及常规化以及蛋白质推断),但在实施细节中不同,这并不总是出版,即使是非商业工具。基于低分辨率数据的后代和OpenMS / TOPP提供小波的峰值拣选,而MaxQuant适合高斯曲线和超级空中曲线使用简单的本地最大值启发式。 MaxQuant中的特征在MaxQuant中使用基于图形的方法进行了完成,使用最佳的子图表由Authagine模型预测。 OpenMS / TOPP使用基于Avergine模型的小波方法或基于模型的方法,并在包含RT形状的识别数据和Acveragine模型上 m/z 尺寸。对于地图对准,SuperHirn使用Lowess Fit,OpenMS / TopP使用由姿势聚类或MS2识别地标驱动的线性(仿射)模型或B样条相对于参考图。同样,MSINSPECT(
      • Bellew M.
      • Coram M.
      • FitzGibbon M.
      • IGRA M.
      • 兰多夫T.
      • 王P.
      • 5月D.
      • ENG J.
      • 方罗。
      • 林C.
      • 陈杰。
      • Goodlett D.
      • Whiteaker J.
      • Paulovich A.
      • McIntosh M.
      用高分辨率LC-MS综合分析复杂蛋白质混合物的综合算法。
      )采用平滑花键的回归。 后代 使用不同的方法使用地图对齐的基于识别的数据,由(用户定义)的地标引导。一旦创建了所有映射的所有峰值信息的主地图,就使用同位素拟合程序来识别功能。蛋白质水平的统计后处理或可视化(其中推理方法广泛不同)不支持所有工具,并且在这种情况下,必须转移到专用统计工具,例如R.Pview(
      • 汗Z.
      • 绽放J.S.
      • 加西亚B.A.
      • Singh M.
      • Kruglyak L.
      蛋白质量化数百种实验条件。
      )有一个紧密的集成,corra(
      • Brusniak m.y.
      • Bodenmiller B.
      • 坎贝尔D.
      • Cooke K.
      • eddes J.
      • Garbutt A.
      • 刘海。
      • Letarte S.
      • 穆勒L.N.
      • 沙姆达五。
      • Vitek O.
      • 张恩。
      • Aeberberold R.
      • 瓦特J.D.
      CORRA:用于LC-MS发现和基于目标质谱的蛋白质组学的计算框架和工具。
      )特征图和mzmine2(
      • Pluskal T.A.
      • 卡斯蒂略S.
      • Villar-Briones A.
      • 或者 esic m.
      MZMINE 2:用于处理,可视化和分析基于质谱的分子谱数据的模块化框架。
      )允许基本分析程序( 例如 PCA)。 SpectroLoodzer具有有效的可视化功能和内置分类和回归功能。
      几乎所有包都在Windows上运行,除了Corra和Superhirn之外。不是每个包都提供二进制安装程序,因此可能需要手动编译。商业包往往是窗户;所有非商业包支持Linux(Viper除外)(
      • Monroe M.E.
      • tolic n.
      • jaitly n ..
      • Shaw J.L.
      • Adkins J.N.
      • 史密斯r.d.
      VIPER:一种先进的软件包,可支持高通量LC-MS肽识别。
      )) (看 表I. for details).

      结论

      定量蛋白质组学对系统生物学,生物标志物发现和许多其他生物医学应用具有高度相关性。在鉴别肽量化的所有方法中,无标签方法提供最高的灵活性,并且由于最近的软件和硬件进展,它们的动态范围和准确性是不断改进的。已经显示SC和基于强度的措施来提供良好的量化结果。基于强度的措施避免了离子采样中随机效应,因此稍微更准确,并且它们可能提供更高的再现性。 SC很容易实现和快速。
      有大量的软件解决方案目前用于无标记的肽量化,每个软件肽量化都具有不同的优点和缺点。对于打算使用标准工作流的用户并且不需要开发算法和管道本身,诸如后代或MaxQuant等单片解决方案是非常合适的快速数据分析的工具。如果需要更大的灵活性或者需要对底层算法理解,开源包具有它们的优势。大型蛋白质组学实验室和核心设施很可能会欣赏管道工具提供的模块化和自动化。
      目前的挑战是从越来越复杂的蛋白质组学研究中的越来越多的样品增加,特别是在临床蛋白质组学中。虽然没有标签技术刻度一般,但许多软件工具都有这些大规模研究的问题。仅仅涉及的数据量(数百个LC / MS运行,导致数百千兆字节的数据)肯定会导致问题,但在这些映射需要对齐和链接时,还算法存在可伸缩性问题。虽然小分析可以在笔记本电脑上运行,但需要超过十几个地图的研究通常需要更强大的硬件。对于这些更大的研究,建议使用具有大量随机存取存储器(64+ GB)和慷慨硬盘空间的多核中央处理单元。
      虽然仍有改进的空间,但无标签量化的软件工具已达到复杂程度,这使其使用方便可靠地为大多数目的。在许多情况下,无标记的定量是对定量蛋白质组学中标记技术的良好替代方案。

      参考

        • Bantscheff M.
        • Eberhard D.
        • 亚伯拉罕Y.
        • 巴斯克S.
        • Boesche M.
        • 霍布森S.
        • Mathieson T.
        • Perrin J.
        • Raida M.
        • RAU C.
        • 读者v.r.
        • 甜蜜曼G.
        • 鲍尔A.
        • bouwmeester t.
        • HOPF C.
        • 克鲁斯U.
        • Neubauer G.
        • ramsden n。
        • 瑞克J.
        • Kuster B.
        • 德鲁斯G.
        定量化学蛋白质组学显示出临床ABL激酶抑制剂的作用机制。
        NAT。 Biotechnol。 2007; 25: 1035-1044
        • yates j.r.
        • Gilchrist A.
        • Howell K.E.
        • Bergeron J.j.m.
        细胞器和大细胞结构的蛋白质组学。
        NAT。 Rev. mol。细胞生物。 2005; 6: 702-714
        • 奥尔森J.V.
        • Blagoev B.
        • GNAD F.
        • MACEK B.
        • Kumar C.
        • Mortensen P.
        全球性,体内和现场特异性磷酸化动力学中的信令网络。
        细胞。 2006; 127: 635-648
        • Guruharsha K.G.
        • 有害J.-F.O.
        • 翟德
        • Mintseris J.
        • Vaidya P.
        • Vaidya N.
        • Beekman C.
        • 黄C.
        • Rhee D.Y.
        • CenaJ O.
        • McKillip E.
        • 莎娜。
        • Stapleton M.
        • WAN K.H.
        • yu c.
        • Parsa B.
        • 卡尔森J.W.
        • 陈X.
        • Kapadia B.
        • Vijayraghavan K.
        • Gygi S.P.
        • Celniker S.E.
        • OBAR R.A.
        • Artavanis-Tsakonas S.
        果蝇黑素蛋白酶蛋白复杂网络。
        细胞。 2011; 147: 690-703
        • Aeberberold R.
        基于质谱的蛋白质组学。
        自然。 2003; 422: 198-207
        • Cox J.
        用于数据驱动系统生物学的定量,高分辨率蛋白质组学。
        安努。 Rev. Biochem。 2011; 80: 273-299
        • ong s. -e.
        基于质谱的蛋白质组学转变定量。
        NAT。化学。 BIOL。 2005; 1: 252-262
        • Schulze W.X.
        • USADEL B.
        基于质谱的蛋白质组学的定量。
        安努。植物BIOL。 2010; 61: 491-516
        • Gstaiger M.
        • Aeberberold R.
        将质谱基蛋白质组学应用于遗传学,基因组学与网络生物学。
        NAT。 Rev. Genetics。 2009; 10: 617-627
        • 慕尼宫
        • 低T.Y.
        • Kok Y.J.
        • 中国。
        • 弗雷泽C.K.
        • 丁V.
        • Choo A.
        • heck a.j.r.
        人诱导的多能干细胞和胚胎干细胞的定量蛋白质组。
        摩尔。系统。 BIOL。 2011; 7: 550
        • Nagaraj N.
        • wisniewski J.R.
        • 盖尔特T.
        • Cox J.
        • Kircher M.
        • Kelso J.
        • PääboS.
        人癌细胞系的深层蛋白质组和转录组映射。
        分子systems biology. 2011; 7: 548
        • 贝克米
        • 施密特A.
        • Malmstroem J.
        • Claassen M.
        • ori A.
        • Szymborska A.
        • 赫罗特F.
        • rinner o.
        • Ellenberg J.
        • Aeberberold R.
        人细胞系的定量蛋白质组。
        摩尔。系统。 BIOL。 2011; 7: 549
        • Gygi S.P.
        • rist b.
        • 格柏S.A.
        • Turecek F.
        • 凝胶M.H.
        • Aeberberold R.
        使用同位素编码亲和标记的复合蛋白混合物的定量分析。
        自然生物技术。 1999; 17: 994-999
        • Bantscheff M.
        • Schirle M.
        • 甜蜜曼G.
        • 瑞克J.
        • Kuster B.
        蛋白质组学中的定量质谱:批判性综述。
        肛门。生物丹纳尔。化学。 2007; 389: 1017-1031
        • 施密特A.
        • Kellermann J.
        • Lottspeich F.
        同位素编码蛋白标记的定量蛋白质组学的一种新策略。
        蛋白质组学。 2005; 5: 4-15
        • ong s. -e.
        • Blagoev B.
        • Kratchmarova I.
        • 克里斯滕森D.B.
        • 斯丁H.
        • Pandey A.
        细胞培养物中氨基酸的稳定同位素标记,硅胶,作为表达蛋白质组学的简单且准确的方法。
        摩尔。细胞。蛋白质组学。 2002; 1: 376-386
        • Krijgsveld J.
        • Ketting R.F.
        • Mahmoudi T.
        • 约翰森J.
        • Artal-Sanz M.
        • Verrijzer C.P.
        • Plasterk r.h.a.
        • heck a.j.r.
        C. elegans和D. melanogaster的代谢标记为定量蛋白质组学。
        NAT。 Biotechnol。 2003; 21: 927-931
        • 罗斯P.L.
        • 黄玉。
        • Marchese J.N.
        • 威廉姆斯B.
        • 帕克克。
        • 哈桑斯。
        • Khainovski N.
        • Pillai S.
        • 丹尼尔斯S.
        • Purkayastha S.
        • Juhasz P.
        • 马丁斯。
        • Bartlet-Jones M.
        • 雅各布森A.
        • Pappin D.J.
        使用胺 - 反应性的异常标记试剂在酿酒酵母中的多重蛋白质定量。
        摩尔。细胞。蛋白质组学。 2004; 3: 1154-1169
        • 汤普森A.
        • SchäferJ.U.
        • Kuhn K.
        • Kienle S.
        • Schwarz J.
        • 施密特G.U.
        • Neumann T.
        • 约翰斯通r.
        • 穆罕默德A.K.A.
        • 哈蒙克
        串联质量标签:MS / MS的复合蛋白混合物比较分析的新量化策略。
        分析化学。 2003; 75: 1895-1904
        • 穆勒L.N.
        • Brusniak M.Y.
        • MANI D.R.
        • Aeberberold R.
        基于质量光谱法分析的软件解决方案评估。
        J.蛋白质组。 2008; 7: 51-61
        • Mallick P.
        • Kuster B.
        蛋白质组学:一种务实的观点。
        NAT。 Biotechnol。 2010; 28: 695-709
        • Daigo K.
        • yamaguchi n。
        • Kawamura T.
        • Matsubara K.
        • 姜S.
        • ohashi R.
        • Sudou Y.
        • Kodama T.
        • Naito M.
        • k.
        • 哈库普岛T.
        在败血症中循环五花素3(PTX3)复合物的蛋白质组学谱证明了与硫酸细胞外疏水阀的与硫酸脲1和其他组分相互作用。
        摩尔。细胞。蛋白质组学。 2012;
        • 曼B.F.
        • Goetz J.A.
        • 房子M.G.
        • Schmidt C.M.
        • 不 votny M.v.
        胰腺囊肿流体的糖类和蛋白质组学分析识别过表达糖蛋白的N-连接的聚糖上的硫氧化物化乳糖胺。
        摩尔。细胞。蛋白质组学。 2012;
        • Kumar C.
        基于质谱的蛋白质组学数据集的生物信息分析。
        费用。 2009; 583: 1703-1712
        • KällL.
        • Vitek O.
        基于计算质谱的蛋白质组学。
        PLO计算BIOL。 2011; 7: E1002277.
        • HOEKMAN B.
        • 百年灵r.
        • 适合F.
        • Bischoff R.
        • Horvatovich P.
        MSCompare:一种定量分析对比较生物标志物研究的无标签LCMS数据的框架。
        摩尔。细胞。蛋白质组学。 2012;
        • 张R.
        • 巴顿A.
        • 布里坦丁J.
        • huang j.t.-j.
        • 克林瑟D.
        基于LS-MS的无标签定量蛋白质组学的计算平台评估:全球视野。
        J.蛋白质组学生物素。 2010; 3: 260-265
        • Mayr下午
        • Kohlbacher O.
        • Reinert K.
        • STURM M.
        • GRÖPLC.
        • Lange E.
        • Klein C.
        • HUBER C.G.
        通过组合二维液相色谱 - 电喷雾电离质谱和新型数据分析算法,通过组合血清中的绝对肌球蛋白定量。
        J.蛋白质组。 2006; 5: 414-421
        • 蒂姆W.
        • Scherbart A.
        • Bocker S.
        • Kohlbacher O.
        • Nattkemper T.W.
        马尔迪-TOF质谱中的峰强度预测:一种支持定量蛋白质组学的机器学习研究。
        BMC生物信息学。 2008; 9: 443
        • SchwanhäusserB.R.
        • 巴士D.
        • 李恩
        • Dittmar G.
        • Schuchhardt J.
        • 狼J.
        • 陈W.
        • Selbach M.
        哺乳动物基因表达控制的全局量化。
        自然。 2011; 473: 337-342
        • Krishnamurthy D.
        • Levin Y.
        • 哈里斯L.W.
        • umrania y.
        • 鲍恩斯。
        • 客人P.C.
        通过数据独立的无标记液相色谱串联质谱分析人脑垂体蛋白质。
        蛋白质组学。 2011; 11: 495-500
        • hyung s. -w。
        • Lee M.Y.
        • yu J.-H.
        • 胫骨
        • Jung H.-J.
        • 公园J.-M.
        • 汉W.
        • Lee K.-M.
        • 月亮H.-G.
        • 张H.
        • Aeberberold R.
        • Hwang D.
        • 李S. -W.
        • yu m.-h.
        • 诺夫D.-Y.
        血清蛋白质简介预测先进乳腺癌对新辅助化疗的抗性。
        摩尔。细胞。蛋白质组学。 2011; 10M111.011023
        • COX J.U.
        MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
        NAT。 Biotechnol。 2008; 26: 1367-1372
        • STURM M.
        • 伯克沙A.
        • GRÖPLC.
        • 希尔德布兰特A.
        • Hussong R.
        • Lange E.
        • pfeifer n。
        • Schulz-Trieglacaff O.
        • Zerck A.
        • Reinert K.
        • Kohlbacher O.
        OpenMS-质谱谱图的开源软件框架。
        BMC生物信息学。 2008; 9: 163
        • Pluskal T.A.
        • 卡斯蒂略S.
        • Villar-Briones A.
        • 或者 esic m.
        MZMINE 2:用于处理,可视化和分析基于质谱的分子谱数据的模块化框架。
        BMC生物信息学。 2010; 11: 395
        • Colaert N.
        • Gevaert K.
        • 玛特L.
        ribar和Xribar:用于可再现的相对MS / MS的无标记蛋白质量化的方法。
        J.蛋白质组。 2011; (110512053707083)
        • Lundgren D.H.
        • Hwang S.-i.
        • 吴L.
        • 韩D.K.
        光谱计数在定量蛋白质组学中的作用。
        专家Rev.蛋白质组学。 2010; 7: 39-53
        • Rappsilber J.
        • ryder u.
        • Lamond A.I.
        人脾脏的大规模蛋白质组学分析。
        Genome Res。 2002; 12: 1231-1245
        • Ishihama Y.
        • 奥达Y.
        • Tabata T.
        • 撒托T.
        • nagasu t.
        • Rappsilber J.
        指数改性蛋白质丰度指数(EMPAA),用于通过每种蛋白质的测序肽数估计蛋白质组学中的绝对蛋白质量。
        摩尔。细胞。蛋白质组学。 2005; 4: 1265-1272
        • Zybailov B.
        • 莫斯利A.L.
        • Sardiu M.E.
        • 科尔曼M.K.
        • Florens L.
        • Washburn M.P.
        酿酒酵母膜蛋白质表达变化的统计分析。
        J.蛋白质组。 2006; 5: 2339-2347
        • 鲁P.
        • Vogel C.
        • 王R.
        • 姚X.
        • Marcotte e.m.
        绝对蛋白表达分析估计转录和翻译规则的相对贡献。
        NAT。 Biotechnol。 2007; 25: 117-124
        • 宁克。
        • 费尔明D.
        • nesvizhskii a.i.
        不同标签质谱基蛋白丰度估计的对比分析及其与RNA-SEQ基因表达数据的相关性。
        J.蛋白质组。 2012;
        • Lange E.
        • GRÖPLC.
        • Schulz-Trieglacaff O.
        • Leinenbach A.
        • Huber C.
        • Reinert K.
        液相色谱 - 质谱数据对准的几何方法。
        生物信息学。 2007; 23: I273-I281
        • Ballardini R.
        • 贝涅门店
        • Arrigoni G.
        • Pattini L.
        • 罗达A.
        Massuntangler:一种新型对准工具,用于无标记液相色谱谱分光谱蛋白质组物数据。
        J.Chromatogr。一种。 2011; 1218: 8859-8868
        • 张Z.
        通过划分和征管算法保持LC / MS数据的保留时间对齐。
        J.IM。 SOC。质谱。 2012;
        • Vandenbogaert M.
        • Thiao-tés。
        • Kaltenbach H.-M。
        • 张R.
        • Aittokallio T.
        • Schwikowski B.
        LC-MS图像的对准,具有应用于生物标志物发现和蛋白质鉴定的应用。
        蛋白质组学。 2008; 8: 650-672
        • Lange E.
        • Tautenhahn R.
        • Neumann S.
        • GRÖPLC.
        LC-MS蛋白质组学和代谢组学测量对准程序的批判性评估。
        BMC生物信息学。 2008; 9: 375
        • 调用S.J.
        • 巴里·克里。
        • Adkins J.N.
        • 约翰逊e.t.
        • 钱W.-J.
        • Webb-Robertson B.-J.M.
        • 史密斯r.d.
        • Lipton M.S.
        用于去除与质谱和无标记蛋白质组学相关的系统偏差的标准化方法。
        J.蛋白质组。 2006; 5: 277-286
        • Kultima K.
        • 尼尔森A.
        • Scholz B.
        • rossbach u.l.
        • FälthM.
        • AndrénP.E.
        无标记肽的无标记相对定量标准化方法的开发与评价。
        摩尔。细胞。蛋白质组学。 2009; 8: 2285-2295
        • 王P.
        • 唐H.
        • 张H.
        • Whiteaker J.
        • Paulovich A.G.
        • McIntosh M.
        关于高吞吐量质谱数据中的非随机缺失值的归一化。
        PAC。 Symp。生物矿产。 2006; : 315-326
        • 美国A.H.P.
        • Cordewener J.H.G.
        比较LC-MS:山峰和山谷的景观。
        蛋白质组学。 2008; 8: 731-749
        • listgarten J.
        • Emili A.
        使用液相色谱 - 串联质谱法对比较蛋白质组学分析的统计和计算方法。
        摩尔。细胞。蛋白质组学。 2005; 4: 419-434
        • Kohlbacher O.
        • Reinert K.
        • GRÖPLC.
        • Lange E.
        • pfeifer n。
        • Schulz-Trieglacaff O.
        • STURM M.
        TopP. - OpenMS蛋白质组学管道。
        生物信息学(牛津,英格兰)。 2007; 23: E191-E197
        • Kessner D.
        • Chambers M.
        • Burke R.
        • agus d。
        • Mallick P.
        Proteowizard:开源软件,用于快速蛋白质组学工具开发。
        生物信息学(牛津,英格兰)。 2008; 24: 2534-2536
        • 穆勒L.N.
        • rinner o.
        • 施密特A.
        • Letarte S.
        • Bodenmiller B.
        • Brusniak m.y.
        • Vitek O.
        • Aeberberold R.
        • Muller M.
        超空心 - 一种高分辨率LC-MS基肽/蛋白质分析的新型工具。
        蛋白质组学。 2007; 7: 3470-3480
        • Cox B.
        • kislinger t.
        • Wigle D.A.
        • 坎南A.
        • 棕色K.
        • 好的 ubo T.
        • Hogan B.
        • jurisica I.
        • 弗雷B.
        • rossant J.
        • Emili A.
        小鼠肺部发育和NMYC靶基因的综合蛋白质组学和转录组分析。
        摩尔。系统。 BIOL。 2007; 3: 109
        • 公园S.K.
        • venable J.D.
        • XU T.
        • yates j.r.
        基于质谱的蛋白质组学的定量分析软件工具。
        NAT。方法。 2008; 5: 319-322
        • Bellew M.
        • Coram M.
        • FitzGibbon M.
        • IGRA M.
        • 兰多夫T.
        • 王P.
        • 5月D.
        • ENG J.
        • 方罗。
        • 林C.
        • 陈杰。
        • Goodlett D.
        • Whiteaker J.
        • Paulovich A.
        • McIntosh M.
        用高分辨率LC-MS综合分析复杂蛋白质混合物的综合算法。
        生物信息学(牛津,英格兰)。 2006; 22: 1902-1909
        • 汗Z.
        • 绽放J.S.
        • 加西亚B.A.
        • Singh M.
        • Kruglyak L.
        蛋白质量化数百种实验条件。
        Proc。 Natl。阿卡。 SCI。美国。 2009; 106: 15544-15548
        • Brusniak m.y.
        • Bodenmiller B.
        • 坎贝尔D.
        • Cooke K.
        • eddes J.
        • Garbutt A.
        • 刘海。
        • Letarte S.
        • 穆勒L.N.
        • 沙姆达五。
        • Vitek O.
        • 张恩。
        • Aeberberold R.
        • 瓦特J.D.
        CORRA:用于LC-MS发现和基于目标质谱的蛋白质组学的计算框架和工具。
        BMC Bioinf。 2008; 9: 542
        • Monroe M.E.
        • tolic n.
        • jaitly n ..
        • Shaw J.L.
        • Adkins J.N.
        • 史密斯r.d.
        VIPER:一种先进的软件包,可支持高通量LC-MS肽识别。
        生物信息学(牛津,英格兰)。 2007; 23: 2021-2023