PTM.INER:在开放式搜索中检测到蛋白质修改的本地化和质量控制及其在人类蛋白质组中全面翻译后修饰表征的应用*[S]

  • Zhiwu An.
    脚注
    隶属关系
    国家数学与跨学科科学中心,中国科学院数学与系统科学院随机复杂结构与数据科学的重点实验室,北京100190;

    中国科学院大学数学科学学院,北京100049
    搜索本作者的文章
  • 林汇翟
    脚注
    隶属关系
    中国科学院上海原产治研究所药物研究国家重点实验室,上海201203;
    搜索本作者的文章
  • WANTAO Ying.
    隶属关系
    北京北京蛋白质科学中心国家科学研究中心国家重点实验室,北京蛋白质蛋白质工程研究中心,北京102206,中国北京救命研究所,北京100850;
    搜索本作者的文章
  • 小东倩
    隶属关系
    北京北京蛋白质科学中心国家科学研究中心国家重点实验室,北京蛋白质蛋白质工程研究中心,北京102206,中国北京救命研究所,北京100850;
    搜索本作者的文章
  • 福州公
    一致
    可以解决谁对应的通信:
    隶属关系
    国家数学与跨学科科学中心,中国科学院数学与系统科学院随机复杂结构与数据科学的重点实验室,北京100190;

    中国科学院大学数学科学学院,北京100049
    搜索本作者的文章
  • Minjia Tan.
    一致
    可以解决谁对应的通信:
    隶属关系
    中国科学院上海原产治研究所药物研究国家重点实验室,上海201203;
    搜索本作者的文章
  • 闫福
    一致
    可以解决谁对应的通信:
    隶属关系
    国家数学与跨学科科学中心,中国科学院数学与系统科学院随机复杂结构与数据科学的重点实验室,北京100190;

    中国科学院大学数学科学学院,北京100049
    搜索本作者的文章
  • 作者脚注
    *这项工作得到了中国国家重点基础研究计划的补助金(2017YFC0908400,2017YFC0906600和2015CB554406),中国自然科学基金(81872888,31670066,31700724和91630314),中国学院的战略优先考察研究计划科学(XDB13010600),国际S&中国(2014DFB30010)和NCMIS CAS的合作计划。
    [S] 本文含有补充材料。我们声明没有利益冲突。
    ‡‡ 这些作者同等贡献这项工作。
      肽串联质谱的开放(大众耐受)在捕丸蛋白质组学中的翻译后修饰(PTM)综合检测方面存在巨大潜力。然而,该搜索策略尚未被社区广泛使用,并且它的一个瓶颈是缺乏适当的自动化和可靠性处理的适当算法粗略和易于易于搜索结果。在这里,我们呈现PTMINER,用于在开放搜索中检测到的自信过滤和定位的软件工具(质量换档)。在肽谱匹配(PSM)的大规模转移分组的错误发现率(FDR)控制后,PTMiner使用经验贝叶斯方法通过迭代学习在不同氨基酸上发生的每种类型的修饰的现有概率来定位修饰。在三种数据集中评估pTminer的性能,包括模拟数据,化学合成的肽库数据和改性肽掺入蛋白质组数据。结果表明,PTMiner可以有效地控制PSM FDR,并准确地定位修改位点。以1%的真实虚假定位速率(FLR),PTMINER分别在三个数据集中定位的93%,84和83%的修改站点,远远高于我们使用的两个开放搜索引擎以及升起版本的ASCORE本地化算法。然后我们使用PTMiner分析含有2500万光谱的人蛋白质组的草稿,并自信地鉴定了1%FDR和1%FLR的超过170万元的PSM,这提供了已知和未知PTM的系统视图。在人类蛋白质组中。

      图形概要

      在霰弹枪蛋白质组学的常见做法中,串联质谱(MS / MS)
      使用的缩写是:
      女士/女士
      串联质谱
      PTM.
      翻译后修改
      FDR.
      假发现率
      弗拉
      虚假本地化率
      PSM
      肽谱匹配
      MSFS.
      样本的修改特异性频率
      GMM.
      高斯混合模型
      LC-MS.
      液相色谱质谱法
      c
      碰撞诱导的解离
      HCD.
      较高能源碰撞解离
      SDS-PAGE.
      SDS-聚丙烯酰胺凝胶电泳
      BRP.
      基本反相液相色谱
      SNP.
      单核苷酸多态性
      夺取
      单酸变异
      PPM.
      百万分之一。
      1使用的缩写是:女士/女士
      串联质谱
      PTM.
      翻译后修改
      FDR.
      假发现率
      弗拉
      虚假本地化率
      PSM
      肽谱匹配
      MSFS.
      样本的修改特异性频率
      GMM.
      高斯混合模型
      LC-MS.
      液相色谱质谱法
      c
      碰撞诱导的解离
      HCD.
      较高能源碰撞解离
      SDS-PAGE.
      SDS-聚丙烯酰胺凝胶电泳
      BRP.
      基本反相液相色谱
      SNP.
      单核苷酸多态性
      夺取
      单酸变异
      PPM.
      百万分之一。
      数据用于通过使用某个算法匹配序列匹配来识别肽序列和翻译后修改(PTMS)。最常用的肽鉴定方法是限制性蛋白质序列数据库搜索,其中使用肽前体质量的紧密耐受性,并且考虑了几种修改类型(
      • yates 3rd,J.R.
      • ENG J.K.
      • mccormack a.l.
      • Schieltz D.
      将改性肽的串联质谱与蛋白质数据库中氨基酸序列相关联的方法。
      )。然而,这种方法未能检测已显示在蛋白质组数据中广泛存在的未指定或未知类型的修改(
      • nesvizhskii a.i.
      • Roos f.f.
      • 格罗斯曼J.
      • Vogelzang M.
      • eddes J.S.
      • Gruissem W.
      • Baginsky S.
      • Aeberberold R.
      霰弹枪蛋白质组学数据的动态谱质量评估和迭代计算分析:更有效地识别翻译后修饰,序列多态性和新型肽。
      ,
      • Chalkley R.J.
      • 贝克P.R.
      • Medzihradszky K.F.
      • 林恩A.J.
      • 伯灵名A.L.
      深入分析不同仪器类型的串联质谱数据。
      ,
      • 怜悯J.
      • Perez-Riverol Y.
      • 刘易斯S.
      • Tabb D.L.
      • 戴安斯J.A.
      • Del-Toro N.
      • RURIK M.
      • Walzer M.W.
      • Kohlbacher O.
      • Hermjakob H.
      • 王R.
      • VizcaínoJ.A.
      识别数百万持续的未识别的光谱,跨越数百个霰弹枪蛋白质组学数据集。
      ,
      • 你elsen M.L.
      • Savitski m.m.
      • Zubarev R.A.
      人蛋白质组织样本的修饰程度及其对霰弹枪蛋白质组学中的分析动态范围的影响。
      )。为了检测已知和未知类型的修饰,近年来提出了肽鉴定的各种不可破坏性的方法(
      • 傅y.
      蛋白质修饰鉴定的数据分析策略。
      ),包括打开(容许)数据库搜索(
      • 坦纳S.
      • Zandi E.
      • BAFNA V.
      • PEVZNER P.A.
      通过盲目搜索质谱来识别翻译后修改。
      ,
      • Chalkley R.J.
      • 贝克P.R.
      • 汉森K.C.
      • Medzihradszky K.F.
      • Allen N.P.
      • Rexach M.
      • 伯灵名A.L.
      综合分析在四极孔选择,四极碰撞细胞,飞行时间质谱仪I中获取的多维液相色谱质谱数据集。通过搜索引擎理论上可解释多少数据?
      ,
      • 汉森B.T.
      • Davey S.W.
      • 火腿A.J.
      • 李ebler D.C.
      P-MOD:使用串联MS数据将修改映射到肽序列的算法和软件。
      ,
      • 唐W.H.
      • Halpern B.R.
      • Shilov I.v.
      • Seymour S.L.
      • Keating S.P.
      • Loboda A.
      • Patel A.A.
      • Schaeffer D.A.
      • Nuwaysir L.M.
      使用MS / MS数据库搜索发现已知和意外的蛋白质修改。
      ,
      • Havilio M.
      • 羊毛A.
      使用串联质谱法大规模无限制地识别后翻版修改。
      ,
      • Baumgartner C.
      • Rejtar T.
      • kullolli m.
      • 阿克拉L.M.
      • karger b.l.
      SEMOP:使用LC-MS / MS数据的未受限制搜索修改肽的新计算策略。
      ,
      • 陈Y.
      • 陈W.
      • cobb m.h.
      • 赵玉。
      PTM.AP-A序列对齐软件,用于翻译后修改站点的不受限制,准确,全频谱识别。
      ,
      • 你D.
      • 傅y.
      • 太阳r.x.
      • 王H.P.
      • 袁Z.F.
      • Chi H.
      • 他是的
      打开MS / MS光谱库搜索,以识别意外的翻译后修改并提高光谱识别率。
      ,
      • Ahrne E.
      • 你kitin F.
      • 李sacek F.
      • Muller M.
      QuickMod:用于打开修改频谱库搜索的工具。
      ,
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      ,
      • 马C.W.
      • 林H.
      通过频谱库搜索思维库的意外翻译后修改狩猎。
      ,
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      ,
      • yu f.
      • 李恩
      • yu w.
      PIPI:使用编码方法的PTM-不变肽鉴定。
      ,
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      MSFRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      ), 这 德诺维 sequencing (
      • Searle B.C.
      • Dasari S.
      • 特纳米
      • reddy a.p.
      • Choi D.
      • Wilmarth P.A.
      • mccormack a.l.
      • David L.L.
      • Nagalla S.R.
      使用基于质量的对准算法进行MS / MS De Novo测序结果的蛋白质和意外序列修饰的高通量鉴定。
      ,
      • 韩义。
      • 张克。
      蜘蛛:从序列标签与DE Novo测序误差的序列标签软件。
      ,
      • 沉Y.
      • 托里·托尔
      • 赫克森k.k.
      • Purvine S.O.
      • 安德森G.A.
      • 史密斯r.d.
      De Novo测序唯一序列标签,用于发现蛋白质的翻译后修饰。
      ),光谱聚类(
      • Bandeira N.
      • 弗兰克A.
      • PEVZNER P.A.
      通过光谱网络分析蛋白质识别。
      ,
      • Falkner J.A.
      • Falkner J.W.
      • yocum a.k.
      • 安德鲁斯P.C.
      一种光谱聚类方法,用于翻译后修改的MS / MS识别。
      ,
      • 傅y.
      • XIU L.Y.
      • 贾W.
      • 你D.
      • 太阳r.x。
      • 钱X.H.
      • 他是的
      DELTAMT:用于快速检测LC-MS / MS数据蛋白质修改的统计算法。
      ),策划修改搜索(
      • 短red m.r.
      • 短red m.r.
      • 温格C.D.
      • Frey B.L.
      • Schaffer L.v.
      • Scalf M.
      • 史密斯l.m.
      全球识别蛋白质翻译后的翻译后修改在一次通过数据库搜索中。
      ,
      • 李问:
      • 等等。
      全球翻译后修改发现。
      ),以及综合变性修改,并使用精细搜索或离子索引等加速技术进行搜索(
      • 克雷格r.
      • Beavis R.C.
      串联:匹配具有串联质谱的蛋白质。
      ,
      • 皱褶D.M.
      • Cottrell J.s.
      易于禁止未解释的串联质谱数据的搜索。
      ,
      • 汉X.
      • Xin L.
      • 山B.
      峰ptm:基于质谱的肽鉴定,具有未指定的修饰。
      ,
      • Chi H.
      • 他k。
      • 杨B.
      • 陈祖
      • 太阳r.x.
      • 风扇S.B.
      • 张克。
      • 刘C.
      • 袁Z.F.
      • 王Q.H.
      • 刘S.Q.
      • 董M.Q.
      • 他是的
      Pfind-Alioth:一种新颖的不受限制数据库搜索算法,可以提高高分辨率MS / MS数据的解释。
      )。其中,最典型的方式是开放数据库搜索策略,其中肽前体质量容差非常大, 例如 允许500A,并且数据库中候选肽的实验光谱与理论偏移之间的前体质量偏移被认为是潜在的意外修饰。
      然而,由于两个主要瓶颈,开放的搜索策略尚未在当前的蛋白质组学群体中被广泛采用。第一个是因为大大扩展的搜索空间而显着降低的搜索速度。最近由MSFRFRAGRES软件解决了这个问题,它使用片段离子索引技术来加快数据库搜索(
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      MSFRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      )。留下待克服的另一个瓶颈是缺乏适当的算法,用于自动化易于易于搜索结果,例如错误识别的肽序列或错位修饰位。首先,共同的目标 - 诱饵方法(
      • eliasj.e.
      • Gygi S.P.
      目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
      )为了估计肽谱匹配(PSM)的FDR,如果直接用于改进识别的质量控制,可以是有问题的。这主要是因为在候选肽中的光谱和搜索空间中的不同丰富的修饰肽,如限制性搜索策略所示(
      • 傅y.
      • 钱X.
      转移亚组错误发现率进行质谱法检测的罕见翻译修改。
      ,
      • Vaudel M.
      • 伯克哈特准
      • Zahedi R.P.
      • oveland E.
      • 鲍伦森
      • 生病员..
      • 玛特L.
      • Barsnes H.
      Peptideshaker可以实现MS衍生的蛋白质组学数据集的再分析。
      ,
      • 傅y.
      翻译后修饰蛋白质组学的贝叶斯虚假发现率。
      )。在开放搜索中,搜索空间中具有不同质量偏移的肽的丰度是相似的,但它们在光谱中的丰度可以显着不同,导致不同质量换档的FDR的异质性。孔 等等。 (
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      MSFRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      )试图通过在肽前算法中延伸质量模型来解决这个问题,其中首先将质量偏移分成1da的垃圾箱,然后模拟它们的分布以估计观察正确的可能性 相对 属于垃圾箱的所有PSM之间的识别不正确。然而,在开放搜索结果中,通常在非常少量的光谱中检测到许多修改,并且它们的准确FDR估计非常具有挑战性并且仍未解决。需要适用于各种搜索引擎的有效解决方案。
      更重要的是,即使PSM的FDR可以正确控制,确定肽上哪个残留位点承受大规模偏移是一个更具挑战性的任务(
      • na s.
      • PAEK E.
      软件眼睛的蛋白质翻译后修饰。
      ,
      • Chalkley R.J.
      • 克劳瑟K.R.
      修改网站本地化评分:策略和性能。
      )。一些开放搜索引擎简单地将大众转移本地化到站点,产生最高的PSM分数, 例如 PTMap (
      • 陈Y.
      • 陈W.
      • cobb m.h.
      • 赵玉。
      PTM.AP-A序列对齐软件,用于翻译后修改站点的不受限制,准确,全频谱识别。
      )和moda(
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      ),而其他人则根本不会本地化大众班次, 例如 SEQUEST (
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      )和msfragger(
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      MSFRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      )。例如,当评分候选肽时,MSFRagger不会寻找修改的碎片,这是其快速搜索速度的主要原因,但也留下了未局限性的修改。因此,专用的大规模移位定位算法实际上需要提高开放搜索结果的可靠性和可解释性。现有的修改定位算法主要设计用于特定类型的修改, 例如 磷酸化,由传统的限制性搜索鉴定(
      • 奥尔森J.V.
      • Blagoev B.
      • GNAD F.
      • MACEK B.
      • Kumar C.
      • Mortensen P.
      全球体内和现场特定的信令网络中的磷酸化动力学。
      ,
      • Beausoleil S.A.
      • Villen J.
      • 格柏S.A.
      • 赶紧J.
      • Gygi S.P.
      基于概率的高通量蛋白磷酸化分析和现场定位方法。
      ,
      • albuquerque c.p.
      • Smolka M.B.
      • Payne S.H.
      • BAFNA V.
      • ENG J.
      • 周H.
      深入磷脂蛋白酶体分析的多维色谱技术。
      ,
      • 万王。
      • CRIPPS D.
      • 托马斯S.
      • 坎贝尔P.
      • Ambulos N.
      • 陈T.
      • 杨阿。
      磷斯坦:使用MS2 / MS3对信息的磷酸化站点预测的基于概率的方法。
      ,
      • 罗滕贝格B.E.
      • Pisitkun T.
      • Knepper M.A.
      • Hoffert J.D.
      磷源:用于MSN数据的开源磷酸化站点分配工具。
      ,
      • Bailey C.M.
      • 甜蜜的三个
      • Cunningham D.L.
      • Zeller M.
      • Heath J.K.
      • Cooper H.J.
      SLOMO:从ETD / ECD质谱的自动化网站定位修改。
      ,
      • 爱德华兹N.
      • 吴X.
      • tseng c. -w。
      一种无监督,无模型,机器学习组合器,用于来自串联质谱的肽标识。
      ,
      • Phanstiel D.H.
      • Brubaugh J.
      • 温格C.D.
      • 田S.
      • PR.obasco M.D.
      • Bailey D.J.
      • Swaney D.L.
      • Tervo M.A.
      • Bolin J.M.
      • Ruotti V.
      • 斯图尔特R.
      • Thomson J.A.
      • Coon J.J.
      人ES和IPS细胞的蛋白质组学和磷蛋白蛋白酶比较。
      ,
      • Taus T.
      • KöcherT.
      • Pichler P.
      • Paschke C.
      • 施密特A.
      • Henrich C.
      • Mechtler K.
      使用磷光体的普遍和自信的磷酸化位点定位。
      ,
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      ,
      • Lemeer S.
      • kunly E.
      • Klaeger S.
      • rabe m.
      • 塔M.W.
      • Claudes E.
      • arrey t.n.
      • strupat K.
      • Urlaub H.
      • Kuster B.
      MALDI MS / MS和吉祥物DELTA评分磷酸化位点定位。
      ,
      • 费尔明D.
      • Walmsley S.J.
      • Gingras A.c.
      • Choi H.
      • nesvizhskii a.i.
      Luciphor:使用改进的目标诱饵方法具有假定位速率估计的磷酸化站点定位算法。
      ,
      • 费尔明D.
      • Avtonomov D.
      • Choi H.
      • nesvizhskii a.i.
      Luciphor2:从串联质谱数据数据的通用翻译后修改的站点定位。
      ,
      • Vaudel M.
      • 布雷特D.
      • 贝克F.
      • RahnenführerJ.
      • 玛特L.
      • Zahedi R.P.
      D-score:搜索引擎独立的MD分数。
      ,
      • 赛德F.
      • Pisitkun T.
      • Hoffert J.D.
      • 拉什迪肯S.
      • 王G.
      • Gucek M.
      • Knepper M.A.
      PHOSEA:质谱数据的快速准确磷酸化站点分配算法。
      ),但很少有算法可用于开放搜索结果。
      开放搜索结果的修改本地化比限制性搜索结果更具有挑战性(
      • na s.
      • PAEK E.
      软件眼睛的蛋白质翻译后修饰。
      ,
      • Chalkley R.J.
      • 克劳瑟K.R.
      修改网站本地化评分:策略和性能。
      )。在开放搜索中,肽上的每个残留位点可能负责质量偏移,并且在两个相邻部位之间只有一个识别的B型或Y离子。由于常见的某些片段离子和频谱中的噪声峰存在的存在,因此在许多情况下,修改位点的确定可能是非常困难和易于出错的。实际上,片段离子峰的强度信息非常有用,以区分实际和随机峰值匹配,但很少被现有的本地化算法(
      • 费尔明D.
      • Walmsley S.J.
      • Gingras A.c.
      • Choi H.
      • nesvizhskii a.i.
      Luciphor:使用改进的目标诱饵方法具有假定位速率估计的磷酸化站点定位算法。
      ,
      • 费尔明D.
      • Avtonomov D.
      • Choi H.
      • nesvizhskii a.i.
      Luciphor2:从串联质谱数据数据的通用翻译后修改的站点定位。
      )。例如,aschore的扩展版本,其允许通过任何质量修改的所有氨基酸,是基于匹配峰的数量的简单概率模型,并且不充分利用峰值强度信息(
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      )。在蛋白质修饰的化学基础上,对修改特异性的知识是歧视暧昧地点的另一个重要信息来源(
      • na s.
      • PAEK E.
      软件眼睛的蛋白质翻译后修饰。
      )。这种先验知识通常在实践中缺席,但可以从大规模的数据中潜在地学习。例如,Open Search algorithms MS对齐(
      • 坦纳S.
      • Zandi E.
      • BAFNA V.
      • PEVZNER P.A.
      通过盲目搜索质谱来识别翻译后修改。
      )和moda(
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      )使用“强度”策略,从很少局部化氨基酸移动一些修饰,对富含局部的氨基酸。同样,另一种算法ptmclust(
      • Chung C.
      • 刘杰。
      • Emili A.
      • 弗雷B.J.
      从串联质谱预测的翻译后修改的计算改进。
      )通过正式考虑通过每种类型的修饰来修复每个氨基酸的经验概率来校正修饰位置。但是,PTMClust取决于所存在的搜索引擎的本地化结果,并且不利用频谱信息。 PTMFinder算法(
      • 坦纳S.
      • Payne S.H.
      • Dasari S.
      • Wilmarth P.A.
      • David L.L.
      • Loomis W.f.
      • Briggs S.P.
      • BAFNA V.
      通过不受限制的数据库搜索准确注释肽修改。
      )使用肽级方法通过分组部分重​​叠的修饰肽序列来重新定位修饰,以评估修改位点的准确性。因此,它限于在相同数据集中发生多次发生的修饰肽。总之,一种修改定位算法,专门用于开放搜索结果并构建在灵活的数学模型上,以充分利用多种类型的信息,仍然缺乏。
      在本文中,我们开发了一个名为PTMiner的软件工具,用于开放搜索结果的智能后处理,以产生可靠,本地化和注释的PTM标识。 PTMiner主要包括传输FDR方法的扩展版本(
      • 傅y.
      • 钱X.
      转移亚组错误发现率进行质谱法检测的罕见翻译修改。
      )对于准确分组的FDR估计,以及使用贝叶斯模型的不可破坏性修改定位算法提供特定于站点的概率分数,以测量定位确定性。模拟和实线的验证实验表明,PTMINER可以有效地控制不同类型的修改的FDR,并可靠地本地化其网站,性能超优于两个使用的开放搜索引擎(PFIND(
      • 傅y.
      • 杨Q.
      • 太阳r.
      • 李德。
      • 曾R.
      • 凌c.x.
      • 高W.
      利用核心串联通过串联质谱来将肽鉴定的片段离子相关联。
      ,
      • 王L.H.
      • 李D ..
      • 傅y.
      • 王H.P.
      • 张J.F.
      • 袁Z.F.
      • 太阳r.x.
      • 曾R.
      • 他是的
      • 高W.
      PFIND 2.0:通过串联质谱法的肽和蛋白质鉴定的软件包。
      ,
      • 李德。
      • 傅y.
      • 太阳r.
      • 凌c.x.
      • 魏Y.
      • 周H.
      • 曾R.
      • 杨Q.
      • 他是。
      • 高W.
      PFIND:一种新的数据库搜索软件系统,用于通过串联质谱法自动肽和蛋白质鉴定。
      )和moda(
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      ))和流行的本地化算法ascore(
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      )。我们将PTMINER应用于含有来自30人组织的2500万光谱的人蛋白质组草稿(
      • 金马
      • Pinto S.M.
      • GetNet D.
      • 你rujogi R.S.
      • 曼达S.S.
      • Chaerkady R.
      • Madugundu A.K.
      • Kelkar D.S.
      • Isserlin R.
      • 耆那教
      • 托马斯J.K.
      • Muthusamy B.
      • Leal-Rojas P.
      • Kumar P.
      • sahasrabuddhe n.a.
      • Balakrishnan L.
      • Advani J.
      • 乔治B.
      • Renuse S.
      • Selvan L.D.
      • Patil A.H.
      • 南jappa五。
      • radhakrishnan A.
      • PR.asad S.
      • 分组ayt.
      • Raju R.
      • Kumar M.
      • sreenivasamurthy s.k.
      • Marimuthu A.
      • sathe g.j.
      • Chawan S.
      • datta k.k.
      • SubBannayya Y.
      • Sahu A.
      • yelamanchi s.d.
      • JAYARAM S.
      • Rajagopalan P.
      • Sharma J.
      • Murthy K.r.
      • Syed N.
      • Goel R.
      • Khan A.A.
      • Ahmad S.
      • de
      • Mudgal K.
      • Chatterjee A.
      • 黄T.C.
      • 钟杰。
      • 吴X.
      • Shaw P.G.
      • 释放D.
      • Zahari M.S.
      • Mukherjee K.K.
      • Shankar S.
      • Mahadevan A.
      • 林H.
      • 米切尔C.J.
      • Shankar S.K.
      • Satishchandra P.
      • 施罗德J.T.
      • sardeshmukh r.
      • Maitra A.
      • LEACH S.D.
      • 德雷克C.G.
      • Halushka M.K.
      • PR.asad T.S.
      • Hruban R.H.
      • Kerr C.L.
      • 糟糕的G.D.
      • IACOBUZIO-DONAHUE C.A.
      • Gowda H.
      • Pandey A.
      人蛋白质组的草稿。
      )。在1%FDR中鉴定了超过300万元的改性PSM,超过170万PSM的大规模转移在1%FLR定位,在人类蛋白质组中提供了全面的综合修改。

      实验步骤

       PTM.INER算法概述

      如图所示 Fig. 1如果从开放搜索到PSM,PTMiner首先执行PSM过滤和FDR估计。转移FDR的修改版本(
      • 傅y.
      • 钱X.
      转移亚组错误发现率进行质谱法检测的罕见翻译修改。
      )用于分组的FDR估计。然后,对于过滤的PSM,PTminer进行前体质量换档的聚类,并将每个簇视为一种类型的修改。接下来,通过估计作为修改位置的肽上每个部位的后验概率来定位每个聚类的质量偏移。后部概率从两部分计算, IE。 现有概率和条件概率。前者来自MSFS向量(在质量移位定位部分中定义),其测量修改在不同氨基酸上发生的概率,并且从数据中迭代地学习。后者从强度分布模型计算,该模型从未修饰的PSM的匹配峰配合。最后,根据本地化结果,PTMiner根据UNIMOD修改数据库注释了调制类型的质量换档(
      • 皱褶D.M.
      • Cottrell J.s.
      UNIMOD:质谱法的蛋白质修饰。
      )。请注意,PTMiner在本地化质量换档时不使用UniMod数据库的任何信息。下面给出每个步骤的细节。
      图缩略图GR1.
      Fig. 1PTM.INER的算法工作流程。 红色块中的进程是本地化算法,而在其中的红色箭头表示迭代更新概率。

       PSM FDR估计

      未修饰和不同修饰的肽的FDR在相同的分数阈值下可能是不同的(补充说明S1,补充图。S1)。我们呼吁所有PSM全局FDR估计的FDR,并且FDR分别为一组PSMS组FDR估计。 PTMINER使用的转移FDR的基本思想是从全球FDR计算FDR的FDR,易于估计。在这里,我们将质量转换成1-da大小的箱子,并以整数值为中心, 例如 [15.5,16.5] da,并按照我们以前的工作相同的框架(
      • 傅y.
      • 钱X.
      转移亚组错误发现率进行质谱法检测的罕见翻译修改。
      )建立组和全球FDR之间的定量关系,如下所示,
      FDRi(x)^=N(x)Ni(x)γi(x)FDR(x)
      (eq。1)


      符号在哪里 i 表示这一点 i - 大规模班次的垃圾箱, N(x)是所有目标PSM的数量大于 x, (x)是目标PSM的数量 i-th bin的分数大于 x, FDR.(x)是全球FDR在得分阈值下 x和γ.i(xpsm属于的概率是 i - 鉴于PSM是随机的,得分比 x.
      在我们以前的工作之后(
      • 傅y.
      • 钱X.
      转移亚组错误发现率进行质谱法检测的罕见翻译修改。
      ),γi(x)通过线性函数近似 x
      γi(x)=ax+b
      (eq。2)


      因为对诱饵序列的匹配绝对是虚假标识,所以我们利用诱饵PSM来估计两个系数 ab。具体而言,我们计算丢弃队伍的比例 i-th箱子以不同的分数阈值,并使用比例作为训练样本以适合上述线性函数(所示的示例 补充图S2)。简而言之,转让FDR方法背后的原理是因为在箱中观察到的诱饵PSM可能往往是太少的直接进行准确的FDR估计,因此转移FDR使用拟合功能来推断诱饵PSM的数量(比例) FDR控制的有效评分阈值。

       质量换档聚类

      可能存在多种类型的修改落入1-da大规模换档箱中, 例如 乙酰化(42.010565A)和三甲基化(42.046950Da)在[41.5,42.5] da的箱中。为了区分来自不同类型的修改的质量换档,PTMiner使用高斯混合模型(GMM)来对每个箱内的质量移位进行聚类分析,并将每个簇视为本地化算法中的一个修改类型。首先,发明了一种离散的卷积算法来学习GMM的初始参数, IE。 组件号码 K,初始手段(多发性硬化症)和差异(vs.)(补充说明S2)。接下来,GMM用于使用初始参数拟合质量偏移。一个组件,其方差小于系统测量方差的1.5倍 var. (大规模转移的差异落入[ - T,T.])并大于用户指定的数量(默认值为5),将被视为一个修改类型。这些群集质量偏移将使用迭代更新的先前概率本地化,而未群集不会。

       配送拟合匹配高峰强度

      在质量移位定位之前,每个光谱都是如下预处理的。首先,所有峰强度都被该频谱中的最大强度除以产生相对强度,然后除去具有小于0.01的相对强度的峰,最后通过采用平方根重新分配剩余峰的相对强度。匹配峰值的强度分布基于假设分布形式是逻辑的未修饰PSM的匹配峰值(示例所示) 补充图S3)。

       大规模转移本地化

      我们假设一个集群中的质量偏移来自相同类型的修改,并组合这些质量转变进行修改定位。如下所述,对于聚类质量偏移PTMINER迭代地更新其在不同氨基酸上的现有概率,但是对于未聚类的质量偏移,PTMINER不使用先前概率并将条件概率作为最终的后验概率。
      以一个大规模转换簇为例,我们假设总共有 N PSM在此集群中,标记为 PSMI., 和 i ε{1,..., N}。 PSMI. 由频谱组成 规格 和匹配的肽序列 Pepi. 长度 。让 Pepi.(j)表示位于适当位置的氨基酸 jPepi., 和 j ε{0,1,..., + 1}在哪里 Pepi.(0)和 Pepi.( + 1)代表N-末端和C末端 Pepi.分别和 Pepi.j. 表示具有改性的改性肽序列 Pepi.(j)。 PTMINER使用贝叶斯模型来计算修改发生的后验概率 第j-th. 网站上 Pepi. as follows,
      PR.(Pepij|Speci)=PR.(Pepij)PR.(Speci|Pepij)k=0Li+1PR.(Pepik)PR.(Speci|Pepik)
      (eq。3)


      在哪里 PR.(Pepi.j.)表示此修改发生的现有概率 Pepi.(j) 和 PR.(规格|Pepi.j.)表示条件概率 规格 是生成的 Pepi.j..
      为了计算后验概率,我们需要两种类型的概率, IE。 条件概率 PR.(规格|Pepi.j.)和现有概率 PR.(Pepi.j.)。评估条件概率 PR.(规格|Pepi.j.),我们首先匹配实验峰 规格 具有未修改的所有理论峰和所有修饰形式的片段离子 Pepi.。匹配后,我们得到相应的匹配峰值 规格,形成峰集 i*。我们假设匹配的峰是独立的,其产生,
      PR.(Speci|Pepij)=PeakϵPeaksi*PR.(Peak|Pepij)
      (eq。4)


      F(x)表示来自未修饰的肽的匹配峰强度的累积分布函数。我们定义
      PR.(Peak|pepij)={F(I),如果 peakpepij持续的1F(I),除此以外
      (eq.5)


      在哪里 I 是强度 顶峰和峰值和峰值 Pepi.j. 如果峰值匹配的理论峰之一是一致的 Pepi.j..
      接下来,我们说明了如何计算现有概率 PR.(Pepi.j.)。众所周知,每种修饰都有其氨基酸特异性。例如,磷酸化主要发生在Ser,Thr和Tyr上。我们将一个修饰的氨基酸特异性定义为改性特异性频率(MSF)的比例,其由A表示 K-dimensional vectorφ→=(π1,π2......,πK)T 由...组成的 K (= 104)网站可能的组合(IE。 20种氨基酸和N- / C-末端)和位置(IE。 肽/蛋白的N- / C-末端,或肽的任何地方)。例如,MSF矢量φ→磷酸化的φ→可以同样地设置为1/3,分别为其他人,任何地方'和Zeros。对于不同的蛋白质样本,频率可能非常不同, 例如 原核 相对 真核样品或丰富的 相对 非富集的样品(
      • Villen J.
      • Beausoleil S.A.
      • 格柏S.A.
      • Gygi S.P.
      小鼠肝的大规模磷酸化分析。
      )。要考虑样本依赖性,我们介绍了样本(MSFS)的术语修改特异性频率,我们将使用类似EM样算法从数据学习(稍后给出的详细信息)。我们派生了现有概率 PR.(Pepi.j.)来自MSFS如下,
      PR.(Pepij)=PR.(Pepi(j))=πh(Pepi(j))qπh(Pepi(q))
      (eq。6)


      在哪里 h 是从所有修改特异性的集合到MSFS向量φ→的相应索引的映射, 即H.:xy, x ϵ {所有修改特异性} 和 y ε{1,2,..., K}。
      我们认为具有最大后概率的网站,由此表示 p*,作为修改的位置。最后,我们通过平均其后部误差概率来估计一组局部质量偏移的FLR
      FLR=1ni=1n(1pi*)
      (eq。7)


      在哪里 n 是集合的大小。

       用于先前概率更新的EM样算法

      我们使用类似EM样算法来估计MSFS向量φ→如下所述,
      • (0)设置初始值φ→(0) 和集合 t = 0.每个元素都设置为1 /K by default;
      • (1)产生每种氨基酸的现有概率 Pepi. from Φ→(t), 那是
        (πh(Pepi(0))(t)qπh(Pepi(q))(t)),......,πh(Pepi(Li+1))(t)qπh(Pepi(q))(t)


        , 为了 i ϵ {1,2,…,N}。
      • (2)计算所有网站的后验概率 Eq. 3;
      • (3)更新φ→(t + 1) using πk(t + 1) =
        1Ni=1Nj{j:h(pepi(j))=k,0jLi+1}


        PR.(Pepi.j.|规格), 在哪里 k ε{1,2,..., K};
      • (4)计算MSFS的变化,Δπ=
        k=1K|πk(t+1)πk(t)|


        . IFΔπ小于给定阈值(我们的研究中0.01),停止和输出;否则,集合 t = t+1并返回步骤(1)。

       修改注释

      为了确定质量移位的标识,PTMiner将本地化质量转移与UNIMOD数据库中的每个修改进行比较。如果质量偏移与质谱仪的前体质量容差内的一些修饰的质量匹配,则PTminer进一步检查了质量转变的定位是否与修改特异性定义一致。如果质量和特异性都符合修改,则将质量换档视为完全注释。如果只有质量匹配但特异性不是,则大规模偏移被视为部分注释。否则,大规模转变被视为未注释。
      由于在源自源片段化,非特异性消化或错过的裂解中可能已经诱导了一些大规模偏移,因此PTMiner对所有PSM进行检查程序。 Ptminer将氨基酸逐一(最多5)〜肽N-或C-末端添加,并检查是否可以完全注释改变的质量偏移。注意,添加的氨基酸来自数据库中的相应蛋白质序列。同时,PTminer还从肽N-或C-末端逐一(最多5)逐一删除氨基酸,并检查改变的质量偏移。

      结果

      我们使用了三个数据集来评估PTMiner,包括计算机程序生成的模拟数据,化学合成的肽数据(
      • ZOLG D.P.
      • Wilhelm M.
      • 施密特T.
      • MédardG.
      • Zerweck J.
      • knaute t.
      • 文字H.
      • reimer u.
      • Schnatbaum K.
      • Kuster B.
      蛋白质池:使用合成肽的LC-MS / MS系统表征21个翻译后蛋白质修饰。
      )和具有尖刺改性肽的复杂蛋白质组数据。此外,人类蛋白质组的草稿地图(
      • 金马
      • Pinto S.M.
      • GetNet D.
      • 你rujogi R.S.
      • 曼达S.S.
      • Chaerkady R.
      • Madugundu A.K.
      • Kelkar D.S.
      • Isserlin R.
      • 耆那教
      • 托马斯J.K.
      • Muthusamy B.
      • Leal-Rojas P.
      • Kumar P.
      • sahasrabuddhe n.a.
      • Balakrishnan L.
      • Advani J.
      • 乔治B.
      • Renuse S.
      • Selvan L.D.
      • Patil A.H.
      • 南jappa五。
      • radhakrishnan A.
      • PR.asad S.
      • 分组ayt.
      • Raju R.
      • Kumar M.
      • sreenivasamurthy s.k.
      • Marimuthu A.
      • sathe g.j.
      • Chawan S.
      • datta k.k.
      • SubBannayya Y.
      • Sahu A.
      • yelamanchi s.d.
      • JAYARAM S.
      • Rajagopalan P.
      • Sharma J.
      • Murthy K.r.
      • Syed N.
      • Goel R.
      • Khan A.A.
      • Ahmad S.
      • de
      • Mudgal K.
      • Chatterjee A.
      • 黄T.C.
      • 钟杰。
      • 吴X.
      • Shaw P.G.
      • 释放D.
      • Zahari M.S.
      • Mukherjee K.K.
      • Shankar S.
      • Mahadevan A.
      • 林H.
      • 米切尔C.J.
      • Shankar S.K.
      • Satishchandra P.
      • 施罗德J.T.
      • sardeshmukh r.
      • Maitra A.
      • LEACH S.D.
      • 德雷克C.G.
      • Halushka M.K.
      • PR.asad T.S.
      • Hruban R.H.
      • Kerr C.L.
      • 糟糕的G.D.
      • IACOBUZIO-DONAHUE C.A.
      • Gowda H.
      • Pandey A.
      人蛋白质组的草稿。
      )用于证明PTMiner效用。

       模拟数据

      为了评估PTMiner在修改本地化中的准确性,需要一些具有标准答案的测试数据。为此目的,我们产生了一种大数据集,其具有来自随机肽序列的956,550个模拟光谱,每个模拟光谱均无论是否没有修饰或九种设计类型的修饰,包括氧化(m),脱染(n),甲基化(k ),磷酸化等(补充说明S3)。将模拟光谱分成11个亚群,包括九个修改子集,一个未修改子集和一个污染子集(补充表S1)。为了评估这些模拟光谱的逼真,我们在模拟和真实光谱之间进行了比较(补充图S4)。

       化学合成肽库数据

      该数据集中的实验MS / MS光谱来自Proteometools项目的一部分(
      • ZOLG D.P.
      • Wilhelm M.
      • 施密特T.
      • MédardG.
      • Zerweck J.
      • knaute t.
      • 文字H.
      • reimer u.
      • Schnatbaum K.
      • Kuster B.
      蛋白质池:使用合成肽的LC-MS / MS系统表征21个翻译后蛋白质修饰。
      ,
      • ZOLG D.P.
      • Wilhelm M.
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • Delanghe B.
      • Bailey D.J.
      • Gessulat S.
      • Ehrlich H.C.
      • Weininger M.
      • 是的。
      • Schlegl J.
      • Kramer K.
      • 施密特T.
      • Kusebauch U.
      • 德意曲e.w.
      • Aeberberold R.
      • 莫里茨R.L.
      • 文字H.
      • Moehring T.
      • Aiche S.
      • Huhmer A.
      • reimer u.
      • Kuster B.
      基于完整的合成人群构建蛋白质池。
      )。简要说话,通过质谱法分析了大约5,000种不同的修饰,包括若干类型的赖氨酸酰化,赖氨酸和精氨酸甲基化,酪氨酸磷酸化和硝基和脯氨酸羟基化。从骄傲数据存储库中下载了总共25个原始文件(包括4种类型的未修饰的肽)(//www.ebi.ac.uk/pride/,数据集标识符PXD009449),并使用Proteowizard的Msconvert.exe工具转换为MGF格式(3.0.7069 64位版本)(
      • Chambers M.C.
      • 麦克莱恩B.
      • Burke R.
      • Amodei D.
      • Ruderman D.L.
      • Neumann S.
      • Gatto L.
      • Fischer B.
      • 普拉特B.
      • Egertson J.
      • 霍夫克
      • Kessner D.
      • 塔斯曼N.
      • 舒尔曼N.
      • Frewen B.
      • 贝克T.A.
      • Brusniak M.Y.
      • 保罗C.
      • 皱纹D.
      • 闪光灯L.
      • Kani K.
      • 成型C.
      • Seymour S.L.
      • Nuwaysir L.M.
      • Lefebvre B.
      • Kuhlmann F.
      • 罗克J.
      • rainer p.
      • Detlev S.
      • Hemenway T.
      • Huhmer A.
      • Langridge J.
      • Connolly B.
      • Chadick T.
      • 霍莉K.
      • eCkels J.
      • 德意曲e.w.
      • 莫里茨R.L.
      • 凯茨J.E.
      • agus d.b.
      • Maccoss M.
      • Tabb D.L.
      • Mallick P.
      用于质谱和蛋白质组学的跨平台工具包。
      )。使用供应商提供的封面和默认参数进行转换。该数据集包含1,023,540质量谱。

       改性肽掺入复合蛋白质组数据

      化学合成六种改性肽,每个修饰肽含有一个改性位点(补充表S2)。将合成肽混合物(每一个50pmol)与1μg胰蛋白酶消化的Hela混合或 大肠杆菌 全细胞蛋白分别。在HCD模式下通过Q辐射质谱仪获得质谱数据。看 补充说明S4 有关LC-MS / MS分析的详细信息。

       人蛋白质组草稿地图

      该数据集中的MS / MS光谱来自Kim中描述的人蛋白质组的地图草稿 等等。 (
      • 金马
      • Pinto S.M.
      • GetNet D.
      • 你rujogi R.S.
      • 曼达S.S.
      • Chaerkady R.
      • Madugundu A.K.
      • Kelkar D.S.
      • Isserlin R.
      • 耆那教
      • 托马斯J.K.
      • Muthusamy B.
      • Leal-Rojas P.
      • Kumar P.
      • sahasrabuddhe n.a.
      • Balakrishnan L.
      • Advani J.
      • 乔治B.
      • Renuse S.
      • Selvan L.D.
      • Patil A.H.
      • 南jappa五。
      • radhakrishnan A.
      • PR.asad S.
      • 分组ayt.
      • Raju R.
      • Kumar M.
      • sreenivasamurthy s.k.
      • Marimuthu A.
      • sathe g.j.
      • Chawan S.
      • datta k.k.
      • SubBannayya Y.
      • Sahu A.
      • yelamanchi s.d.
      • JAYARAM S.
      • Rajagopalan P.
      • Sharma J.
      • Murthy K.r.
      • Syed N.
      • Goel R.
      • Khan A.A.
      • Ahmad S.
      • de
      • Mudgal K.
      • Chatterjee A.
      • 黄T.C.
      • 钟杰。
      • 吴X.
      • Shaw P.G.
      • 释放D.
      • Zahari M.S.
      • Mukherjee K.K.
      • Shankar S.
      • Mahadevan A.
      • 林H.
      • 米切尔C.J.
      • Shankar S.K.
      • Satishchandra P.
      • 施罗德J.T.
      • sardeshmukh r.
      • Maitra A.
      • LEACH S.D.
      • 德雷克C.G.
      • Halushka M.K.
      • PR.asad T.S.
      • Hruban R.H.
      • Kerr C.L.
      • 糟糕的G.D.
      • IACOBUZIO-DONAHUE C.A.
      • Gowda H.
      • Pandey A.
      人蛋白质组的草稿。
      )并从骄傲的数据存储库下载(//www.ebi.ac.uk/pride/,数据集标识符pxd000561)。简而言之,通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)或通过基本反相,在蛋白质水平中分离来自30个人组织的样品,包括17个成人组织,7种胎儿组织和6种造血细胞类型。液相色谱(BRP),然后使用HCD碎片分析在高分辨率傅里叶变换质谱仪(LTQ-甲座精英和LTQ-orbitrap Velos)上,总共24,954,916ms / MS光谱(
      • 金马
      • Pinto S.M.
      • GetNet D.
      • 你rujogi R.S.
      • 曼达S.S.
      • Chaerkady R.
      • Madugundu A.K.
      • Kelkar D.S.
      • Isserlin R.
      • 耆那教
      • 托马斯J.K.
      • Muthusamy B.
      • Leal-Rojas P.
      • Kumar P.
      • sahasrabuddhe n.a.
      • Balakrishnan L.
      • Advani J.
      • 乔治B.
      • Renuse S.
      • Selvan L.D.
      • Patil A.H.
      • 南jappa五。
      • radhakrishnan A.
      • PR.asad S.
      • 分组ayt.
      • Raju R.
      • Kumar M.
      • sreenivasamurthy s.k.
      • Marimuthu A.
      • sathe g.j.
      • Chawan S.
      • datta k.k.
      • SubBannayya Y.
      • Sahu A.
      • yelamanchi s.d.
      • JAYARAM S.
      • Rajagopalan P.
      • Sharma J.
      • Murthy K.r.
      • Syed N.
      • Goel R.
      • Khan A.A.
      • Ahmad S.
      • de
      • Mudgal K.
      • Chatterjee A.
      • 黄T.C.
      • 钟杰。
      • 吴X.
      • Shaw P.G.
      • 释放D.
      • Zahari M.S.
      • Mukherjee K.K.
      • Shankar S.
      • Mahadevan A.
      • 林H.
      • 米切尔C.J.
      • Shankar S.K.
      • Satishchandra P.
      • 施罗德J.T.
      • sardeshmukh r.
      • Maitra A.
      • LEACH S.D.
      • 德雷克C.G.
      • Halushka M.K.
      • PR.asad T.S.
      • Hruban R.H.
      • Kerr C.L.
      • 糟糕的G.D.
      • IACOBUZIO-DONAHUE C.A.
      • Gowda H.
      • Pandey A.
      人蛋白质组的草稿。
      )。本文分析了所有这些光谱。使用PPARSE工具将Thermo RAW文件转换为MGF格式(
      • 袁Z.F.
      • 刘C.
      • 王H.P.
      • 太阳r.x.
      • 傅y.
      • 张J.F.
      • 王L.H.
      • Chi H.
      • 李Y.
      • XIU L.Y.
      • 王W.P.
      • 他是的
      PPARSE:一种精确测定高分辨率质谱中单同位素峰的方法。
      )默认参数除了 共用 option was set to 0.

       Pfind搜索引擎

      使用PFIND进行搜索MS / MS光谱(版本2.8.5)(
      • 傅y.
      • 杨Q.
      • 太阳r.
      • 李德。
      • 曾R.
      • 凌c.x.
      • 高W.
      利用核心串联通过串联质谱来将肽鉴定的片段离子相关联。
      ,
      • 王L.H.
      • 李D ..
      • 傅y.
      • 王H.P.
      • 张J.F.
      • 袁Z.F.
      • 太阳r.x.
      • 曾R.
      • 他是的
      • 高W.
      PFIND 2.0:通过串联质谱法的肽和蛋白质鉴定的软件包。
      ,
      • 李德。
      • 傅y.
      • 太阳r.
      • 凌c.x.
      • 魏Y.
      • 周H.
      • 曾R.
      • 杨Q.
      • 他是。
      • 高W.
      PFIND:一种新的数据库搜索软件系统,用于通过串联质谱法自动肽和蛋白质鉴定。
      )在开放的搜索模式(选择Open_ksDP分数)。 Open_ksdp将前体质量转变视为潜在的修饰,并将其定位在产生最高肽评分的位置。将模拟的合成肽文库和人蛋白质组地图数据进行了随机蛋白质序列,化学合成肽的序列和Swiss-Prot人蛋白序列(2015年10月28日下载)。对于改性肽掺入蛋白质组数据,瑞士 - Prot人的组合序列或 大肠杆菌 蛋白质(2018年6月27日下载)和尖刺肽所属的蛋白质被搜查。所有序列与其反向蛋白质序列的所有序列均连接,用于基于目标诱饵的FDR估计。对于模拟数据,化学合成的肽数据,改性肽掺入蛋白质组数据和人蛋白质组地图数据,前体质量公差都设定为500Da,片段质量公差设定为0.05Da,20ppm,20ppm分别为0.05 da。对于所有数据集,候选肽是完全胰蛋白酶,最多2个允许的未命发性裂解,除了模拟数据外,Cys上的尸体甲基化被认为是固定修改。对于模拟数据和人蛋白质组地图数据没有考虑可变修饰,并且将氧化设置为化学合成的肽数据和改性肽掺入的可变改性 大肠杆菌 蛋白质组数据。对于改性肽掺入的HeLa蛋白质组数据,将蛋白质N-末端的氧化和乙酰化的氧化设定为可变的修饰。

       摩擦a Search引擎

      moda(v1.23)(
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      )以单盲模式运行,最大修改尺寸为500D,用于模拟和化学合成的肽数据。质谱仪的母体大众公差分别设定为模拟和化学合成的肽数据的10ppm和20ppm。片段质量公差均设定为0.05Da。对于模拟数据集没有指定固定修改,并且Cys上的氨基甲酰化被指定为化学合成肽数据的固定改性。启用高分辨率MS / MS搜索,并为两个数据集的大多数未错过的裂缝指定完全胰蛋白消化。其他参数被设置为默认值。使用Moda软件捆绑的“anal_moda.jar”程序用于估算PSM的全局FDR。为了分开和转移FDR估计,我们首先使用“anal_moda.jar”来通过设置错误的诱饵蛋白的前缀来导出所有PSM的Moda,然后估计在不同得分阈值下的出口PSM的单独和传输FDR。

       扩展乘坐

      ascore算法最初设计用于磷酸化到氨基酸丝氨酸,苏氨酸或酪氨酸的定位(
      • Beausoleil S.A.
      • Villen J.
      • 格柏S.A.
      • 赶紧J.
      • Gygi S.P.
      基于概率的高通量蛋白磷酸化分析和现场定位方法。
      )。要将其与PTMINER进行比较,我们将其扩展为允许将任何改性物质定位到由小鸡完成的任何类型的氨基酸 等等。 recently (
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      )。为了验证我们的实施,我们在磷酸化肽上测试了扩展宿主,并与原始Ascore软件进行比较。磷酸化的肽和原始升天本地化结果来自原始的Ascore网站(http://ascore.med.harvard.edu/ascore.php)。比较结果表明,我们的扩展ascore几乎相当于原始的Ascore软件(补充图S5, 补充表S3)。

       肽鉴定和修改定位的正确性判断

      (a)模拟数据。如果它符合以下三种情况之一,则判断肽鉴定为真,(1)所识别的序列与真实的序列相同; (2)所识别的序列是真实的序列; (3)所识别的序列覆盖真实的序列。对于修改定位,有四个标准如下,(1)如果所识别的肽序列与真实的肽序列相同,则当位置与所设计的位置相同时,我们考虑本地化是正确的; (2)如果鉴定的肽是一部分或覆盖真正的肽序列,我们还考虑当局部氨基酸是设计的改性位点时,本地化是正确的。例如,如果真正的肽序列是RM(氧化)dsssslraysk和所鉴定的肽是MDSssslraysk,则考虑当大规模转移(氧化+ arg)本地化到第一次满足时,我们认为定位是正确的; (3)如果肽鉴定是假的,则本地化肯定是假的; (4)如果有多个位置(具有相同的概率),即使在包含真实的位置,我们也要将所有这些视为错误。 (b)化学合成的肽数据和改性肽掺入蛋白质组数据。我们仅考虑与合成肽序列相匹配的PSM,具有预期的相应质量偏移以评估PTMINER定位精度。如果一个大规模转变在设计的场地定位,那么我们认为本地化是正确的。

       验证结果对模拟数据

      因为已知对应的肽序列和这些模拟光谱的修饰位置,所以可以评估PTMINER在FDR估计和修改定位中的精度。我们使用两个搜索引擎Pfind搜索这些模拟光谱(
      • 傅y.
      • 杨Q.
      • 太阳r.
      • 李德。
      • 曾R.
      • 凌c.x.
      • 高W.
      利用核心串联通过串联质谱来将肽鉴定的片段离子相关联。
      ,
      • 王L.H.
      • 李D ..
      • 傅y.
      • 王H.P.
      • 张J.F.
      • 袁Z.F.
      • 太阳r.x.
      • 曾R.
      • 他是的
      • 高W.
      PFIND 2.0:通过串联质谱法的肽和蛋白质鉴定的软件包。
      )和moda(
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      )在开放的搜索模式下,然后使用PTMINER和ASCORE分析他们的搜索结果(
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      )。在FDR分析中,我们将转移FDR与全局FDR进行比较(在整套PSM上执行的传统目标 - 诱饵的FDR估计)和单独的FDR(在子集/组上执行的传统目标 - 诱饵基于FDR估计单个修改类型)。在修改本地化中,我们将PTMINER与搜索引擎本身进行比较,以及扩展的ascore算法。

       转移,全局和单独FDR的性能比较

      我们将传输,全球和单独的FDR与PFIND和MODA的开放搜索结果进行了比较(表格1, 补充表S4, 和 补充图。S1)。首先,我们评估了全球FDR的表现。我们的分析结果表明,尽管全球FDR被准确地估计了整套PSM(未改性和各种修饰的肽),但对于每个设计的修改的每个子集来说,这太保守了。例如,在pfind的搜索结果上( 表I.),真正的全球FDR为0.97%,非常接近对照级别1%,但具有设计改进类型的未修饰和改性肽识别的真实组FDR几乎为零。这种过于保守的FDR估计导致了相当低的光谱识别率, IE。 总共只有14.6%。请注意,0.97%的全球FDR来自PSM,带有大规模转移的设计集。
      表I.真实的FDRS和使用三个FDR估计方法(全局,分开和传输FDR)获得的频谱识别数在模拟光谱的PFIND搜索结果上以1%FDR控制级别为1%的FDR控制级别。 “次正确”是指所鉴定的肽是或覆盖真正的肽序列的一部分。
      总光谱真正的FDR.识别号码
      全球的分离转移全球的分离转移
      未修饰800,000.0.00%0.29%0.29%127,148601,375601,375
      氧化30,0000.02%0.84%0.86%6,34323,26523,369
      脱染15,0000.00%0.86%0.56%2,2409,5068,940
      三甲基& Acetyl10,0000.00%1.06%1.08%1,5135,0725,166
      甲基1,0000.00%2.30%0.45%133305222
      二甲基5000.00%1.44%1.63%70139123
      500.00%4.55%0.00%132217
      次正确0.00%0.00%0.00%9561,152681
      其他修改100%100%100%1,358951372
      856,550.139,744641,787640,265
      接下来,我们比较了两组FDR方法, IE。 单独的FDR和我们的转让FDR。结果表明,单独的FDR可以控制大型群体的FDR但小组失败(表I., 补充表S4)。例如,在PFIND的搜索结果,磷酸化组的真正FDR在1%估计的全球FDR下高达4.55%。另一方面,我们的转让FDR可以有效地控制所有设计的修改组的FDR,因此更好地选择了开放搜索结果的FDR控制方法,其中小组非常常见。

       大规模移位定位结果

      在1%转移FDR过滤的PSM上,我们将不同方法的质量移位定位结果进行了比较,包括搜索引擎本身(PFIND和MODA),扩展ASCORE算法和我们的PTMINER。我们通过其本地化分数按降序对每个方法的本地化结果进行排序, 例如 PTMINER中的后验概率,并评估了实际FLR和在不同得分阈值下的局部质量偏移的比例。对于搜索引擎,我们使用PSM得分作为本地化分数,因为它们没有特定的本地化分数来测量本地化可靠性。对于PFIND和MODA,我们分别使用了电子值和概率分数。
      Fig. 2A2B 为不同方法绘制真实FLR的定位比例。结果表明,在本地化质量偏移时,这两个搜索引擎在定位大众化时,PTMINER和ASCORE都会大大提高了本地化精度,PTMINER非常优于坐骑。例如,在1%真实FLR处,PFIND和MODA的定位比例仅为0.07%和0.13%。升升将定位比例提高至0.52%和17.43%,而Ptminer则分别达到93.06%和79.18%。这些结果表明,搜索引擎的PSM分数不适合测量本地化置信度,并且简单地扩展限​​制定位算法以打开搜索结果是有帮助的,但不能提供令人满意的灵敏度。相比之下,通过全面考虑开放搜索策略的特征,PTMiner显示出显着的优势。
      图缩略图GR2.
      Fig. 2PTM.iner自信地本地化了模拟数据上的质量偏移。 A-B.,PTMINER与搜索引擎相比增加了本地化比例(A 对于Pfind和 B 对于Moda)和相同真实FLR阈值的扩展址。 光盘,使用线性回归拟合真实和估计的FLR(C 对于Pfind和 D for MODa).
      此外,PTMiner还可以根据本地化概率估算FLR。对于PFIND和MODA的开放搜索结果,估计的FLR与真实FLRS显示出良好的线性关系(Fig. 2C2D)。 1%真实FLR PFIND和MODA搜索结果的概率阈值分别为0.837和0.775。 PFIND和MODA结果的1%真实FLR的ASCORE阈值分别为60和27(补充图S6)。

       验证结果来自蛋白质池项目的化学合成肽库数据

      我们使用Pfind搜索这些合成肽光谱(
      • 傅y.
      • 杨Q.
      • 太阳r.
      • 李德。
      • 曾R.
      • 凌c.x.
      • 高W.
      利用核心串联通过串联质谱来将肽鉴定的片段离子相关联。
      ,
      • 王L.H.
      • 李D ..
      • 傅y.
      • 王H.P.
      • 张J.F.
      • 袁Z.F.
      • 太阳r.x.
      • 曾R.
      • 他是的
      • 高W.
      PFIND 2.0:通过串联质谱法的肽和蛋白质鉴定的软件包。
      )和moda(
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      )在打开的搜索模式下,使用PTMINER和ASCORE分析搜索结果(
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      )。

       FDR.估计

      与模拟数据不同,我们并不完全了解光谱的肽序列,因此我们无法计算精确的真实FDR。 PSM的正确性的金色标准是肽是化学合成肽之一,并在蛋白质池项目中承受给定的修饰。然而,通过使用该标准,我们发现不能准确计算FDR,因为在该数据集中存在一些质量控制肽和杂质(副产品)。其中一些人可以被搜索引擎自信地识别, 例如 尖刺的质量控制肽(补充图S7A)和副产品LQK生物素来自预期产品TLQK的QSVVYGGK生物素qsvvyggk(补充图S7B)。
      在PQUIND搜索结果中,全局,独立和转移FDR接近分别以1%FDR实现949619,1003346和998114 PSM。在Moda搜索结果中,800534,805484和796297 PSM分别接受了1%FDR的三个FDR接近。我们发现,三个FDR方法的过滤PSM的数量几乎是相同的,这主要是因为光谱中未修饰和不同修饰肽的相似丰富。

       大规模移位定位结果

      对于以1%FDR过滤的PSM,我们首先使用PTMINER本地化这些质量偏移。我们选择了与合成肽序列的结果和预期修改的质量换档,以将PTMiner与搜索引擎(PFIND和MODA)和扩展ascore算法进行比较。与模拟数据一样类似地,我们使用了对Moda的PFIND,概率分数的电子值,用于对PTMINER进行分类定位的升级算法和后验概率,以计算真实的FLR和局部质量偏移的比例在不同的分数阈值。在1%真实FLR处,PFIND和MODA的定位比例几乎为零。升起的比例增加了PFIND的结果,但为MODA的结果保持约为零,而PTMINER分别将比例增加到84%和71%的比例,用于PFIND和MODA的结果( Fig. 3)。因此,对化学合成的肽数据的定位也表明,PTMiner在本地化开放搜索结果中的质量偏移方面表现得更好,而不是搜索引擎(PFIND和MODA)和乘坐。
      图缩略图GR3.
      Fig. 3PTM.iner自信地局限地对化学合成的肽数据进行质量偏移。 A-B.,PTMINER与搜索引擎相比增加了本地化比例(A 对于Pfind和 B 对于Moda)和相同真实FLR阈值的扩展址。

       验证结果对复合蛋白质组数据的修饰肽掺入

      我们使用pfind搜索两种修改的肽spiked-in数据集(
      • 傅y.
      • 杨Q.
      • 太阳r.
      • 李德。
      • 曾R.
      • 凌c.x.
      • 高W.
      利用核心串联通过串联质谱来将肽鉴定的片段离子相关联。
      ,
      • 王L.H.
      • 李D ..
      • 傅y.
      • 王H.P.
      • 张J.F.
      • 袁Z.F.
      • 太阳r.x.
      • 曾R.
      • 他是的
      • 高W.
      PFIND 2.0:通过串联质谱法的肽和蛋白质鉴定的软件包。
      )在开放搜索模式下,使用三种FDR估计方法分析搜索结果。对于HeLa数据集,获得了总共267名设计的PSM(设计了序列和质量偏移),通过全球,分开和转移FDR方法保留104,117和175普利,以1%FDR水平,分别。为了 大肠杆菌 数据集,总共获得了260个设计的PSM,从中,分别以1%FDR级别的全局,分开和转移FDR接近保留126,142和163 PSM(桌子。 2)。这些结果表明,转移FDR在三种FDR估算方法中表现最佳。然后,我们使用PTMINER和ASCORE来定位这些大众班次。在1%真实的FLR,PTMINER,乘坐和PFIND中,分别从175个设计PSM的175设计的PSMS正确定位的146,46和3质量移位。从163个设计的PSM 大肠杆菌 数据集,PTMINER,ASCORE和PFIND分别正确定位91,35和18个质量换档(Fig. 4)。该结果再次表明,PTMINER在本地化质量偏移中的PFIND和乘坐显着更准确。
      表二具有三种FDR方法的改性肽掺入蛋白质组数据的化学合成肽的鉴定次数(全球,分开和转移FDRS)为1%FDR。 “PSMS”是不使用过滤时的数字。这里“pH”,“Me,”Ac“和”Pr“分别代表磷酸化,甲基化,乙酰化和丙酰基。
      单独的fdr(1%)P62805P0A870P0A7K2P62807A4FNV9A4FBI4
      物种同性恋者大肠杆菌大肠杆菌同性恋者S. erythraea.S. erythraea.
      顺序dniqgitkpair.Eyapaedpgvvsvsvseiyqyk.GATGLGLKEAK.Keskysvyvyk.tyklyvggk.hgggafsgkdpsk.
      摩擦7,T(pH)7,D(我)9,e(我)4,K(AC)3,k(公关)9,k(公关)
      赫拉
      PSM218619684132
      全球FDR(1%)548033414
      单独的fdr(1%)06783309
      转移FDR(1%)21611194132
      大肠杆菌
      PSM247722693731
      全球FDR(1%)9520331715
      单独的fdr(1%)96310172617
      转移FDR(1%)0561692215
      图缩略图GR4.
      Fig. 4PTM.INER在改性肽掺入蛋白组数据上的PFIND和ascore的比较。 “all”表示在1%转移FDR下获得的正确PSM(肽序列和正质量偏移都是正确的)。 “PTMINER”,“ASCORE,”和“PFIND”表示PTMINER,升址和PFIND在1%FLR处给出的正确定位结果。

       在人蛋白质组的地图中申请

      我们接下来使用了大规模公共可访问的数据集,人类蛋白质组的草稿地图(
      • 金马
      • Pinto S.M.
      • GetNet D.
      • 你rujogi R.S.
      • 曼达S.S.
      • Chaerkady R.
      • Madugundu A.K.
      • Kelkar D.S.
      • Isserlin R.
      • 耆那教
      • 托马斯J.K.
      • Muthusamy B.
      • Leal-Rojas P.
      • Kumar P.
      • sahasrabuddhe n.a.
      • Balakrishnan L.
      • Advani J.
      • 乔治B.
      • Renuse S.
      • Selvan L.D.
      • Patil A.H.
      • 南jappa五。
      • radhakrishnan A.
      • PR.asad S.
      • 分组ayt.
      • Raju R.
      • Kumar M.
      • sreenivasamurthy s.k.
      • Marimuthu A.
      • sathe g.j.
      • Chawan S.
      • datta k.k.
      • SubBannayya Y.
      • Sahu A.
      • yelamanchi s.d.
      • JAYARAM S.
      • Rajagopalan P.
      • Sharma J.
      • Murthy K.r.
      • Syed N.
      • Goel R.
      • Khan A.A.
      • Ahmad S.
      • de
      • Mudgal K.
      • Chatterjee A.
      • 黄T.C.
      • 钟杰。
      • 吴X.
      • Shaw P.G.
      • 释放D.
      • Zahari M.S.
      • Mukherjee K.K.
      • Shankar S.
      • Mahadevan A.
      • 林H.
      • 米切尔C.J.
      • Shankar S.K.
      • Satishchandra P.
      • 施罗德J.T.
      • sardeshmukh r.
      • Maitra A.
      • LEACH S.D.
      • 德雷克C.G.
      • Halushka M.K.
      • PR.asad T.S.
      • Hruban R.H.
      • Kerr C.L.
      • 糟糕的G.D.
      • IACOBUZIO-DONAHUE C.A.
      • Gowda H.
      • Pandey A.
      人蛋白质组的草稿。
      )测试PTMINER的性能。该数据集包含从30个人组织产生的~250万MS / MS光谱,在使用500 -DA前体窗口中使用PFIND搜索。根据模拟数据的调查结果,我们观察到不同修改类型之间的大型FDR异质性(示例所示 补充图8),表示单独的全局FDR控制对于不受限制的PTM分析来说是不可靠的。我们使用PTMiner分析搜索结果。使用转移FDR方法,PSM的FDR在每个1-DA质量换档箱内以1%控制。这导致总共9,272,908 psms,在1%fdr处接受,其中3,347,581(36.10%)在[-0.5,0.5] da之外的质量偏移,并且是潜在的修饰肽( Fig. 5A)。然后将这些质量转移通过PTMINer定位于肽上的特定氨基酸,并且估计FLR。在改良的PSM中,将1,755,278(52.43%)保持在1%估计的FLR。这些PSM的质量偏移的直方图显示了重簇(Fig. 5B)。例如,它们的502,315(28.62%)为15.996Da,非常接近氧化改性的质量。
      图缩略图GR5.
      Fig. 5PTM.INER用于人蛋白质组草稿地图的开放式搜索和修改定位中未破坏性修改识别的结果概述。 A,总MS / MS光谱的数量,PSM,其中包含1%FDR,改性PSM,以及具有1%FLR的修改PSM,以及完全注释(通过质量和位置特异性)的比例(通过仅限质量)和未经讨犯的PSM。 B,直方图为1,755,278质量转移,1%FDR和1%FLR。
      接下来与UniMod数据库中的修改进行了局部大规模偏移。共有83.51%(1,465,908 / 1,755,278)的自信地局部大规模转移通过其质量值和氨基酸特异性完全注释。如果通过多种修改注释一个大规模转换,我们手动确定哪个是最可能的,然后增加其计数(补充表S5)。其中38种修改有38种修改>1000 psm,包括常见的氧化在满足肽,肽n-末端的甲酰化,在Asn上的脱染,蛋白质N-末端乙酰化等(补充表S6)。他们的本地化网站与期望一致。例如,97.59%的氧化被定位,达到89.21%的脱胺局限于ASP(Fig. 6A)。此外,总共148,583(8.46%)质量偏移仅被其质量值注释,而其局部氨基酸不包括在UNIMOD数据库中,其中21种改性>1,000 PSMs (补充表S7)。剩下的140,787(8.02%)大规模偏移不能通过植物来注释,其中28个1-da箱>1,000 PSMs (补充表S8)。
      图缩略图GR6.
      Fig. 6人蛋白质组数据的修改分析。 A,用于氨基酸和蛋白质/肽末端的修饰特异性分布,用于完全注释的含有1%FDR和1%FLR的完全注释的修饰。进行归一化以使每个修改的修改特异性等于1.仅显示超过1000psms的完全注释的修改。 B,穿过30个人组织的修改分布。对于每种修改,将来自每个组织的修饰PSM的数量除以来自该组织的光谱的总数,然后在所有组织中归一化衍生的比例,使得该改性的总和为1.这些修改的总和在这个数字中显示了超过1000 psm。 光盘,Kegg富集分析结果在组织中差异观察到脱染和琥珀酰化修饰的结果。

       完全注释修改分析

      除了在样品加工过程中可能引入的常见人造修改(如氧化时),我们还检测到许多记录良好但较少的研究,如诸如普遍的氧化,在满足的二氧化氧化,氨基中脱染,伴随着Lys,等等 (补充图S9, 补充图S10)。我们展示了组织特异性,以满足1000多个PSM的完全注释修改 Fig. 6B。这些修改中的一些可能是样品处理引入的伪像,例如氨基甲酰化和脱水。有趣的是,我们发现一些PTMS表现出对特定组织的强烈偏好,可能在生物学上有意义。值得注意的是,在arg上脱染力(补充图S10A)主要是在成年脊髓和成人视网膜中检测,这些脊髓和成人视网膜在中枢神经系统中报道并与许多神经疾病有关(
      • 金Z.
      • 傅Z.
      • 杨杰。
      • Troncosco J.
      • 埃弗雷特A.D.
      • 范艾克J.E.
      通过组合HCD和CID碎裂来鉴定瓜氨酸改性脑蛋白的鉴定与表征。
      )和琥珀酰化上的琥珀酰胺化(补充图。S10B)主要在成人前皮质和成人肝脏中观察到。为了了解这些PTM的可能作用,它使用基因和基因组(Kegg)数据库(KyoTo)数据库(Fig. 6C6D)。例如,在Kegg代谢途径分析中,在成人视网膜中的光电展开中显着富集精氨酸脱胺蛋白。光电扫描对视觉系统很重要,这可能将光线转换为眼睛视网膜中的电信号(
      • yau k.w.
      • Hardie R.C.
      光电扫描图案和变化。
      )。至于成人的脊髓,精氨酸 - 脱染改性蛋白质主要富含神经元细胞相关生物处理,例如间隙连接,紧密结和轴突引导(
      • 刘N.K.
      • 徐X.M.
      神经保护和脊髓损伤后的分子机制。
      )。对于赖氨酸 - 琥珀酰化,改性蛋白在成人额叶皮质中的慢性神经变性疾病中显着富集,例如帕金森病(
      • Moya-Alvarado G.
      • Gershoni-Emek N.
      • Perlson E.
      • Bronfman F.C.
      神经变性和阿尔茨海默病(AD)。蛋白质组学可以告诉我们Alzheimer的大脑吗?
      )。然而,在成人的肝脏中,琥珀酰化改性蛋白质主要富含细胞色素P450涉及的代谢途径,表明琥珀酰化可能与肝脏的异蛋白代谢作用密切相关。因此,Kegg途径浓缩分析表明,这两个修改与组织特异性功能密切相关(
      • Uhlen M.
      • Fagerberg L.
      • Hallström下午
      • 李ndskog C.
      • oksvold p.
      • Mardinoglu A.
      • sivertssonÅ。
      • Kampf C.
      • sjöstedte。
      • Asplund A.
      • 奥尔森一世。
      • Edlund K.
      • Lundberg E.
      • 纳瓦尼S.
      • Szigyarto C.A.
      • Odeberg J.
      • Djureinovic D.
      • Takanen J.O.
      • 回暖
      • ALM T.
      • Edqvist P.H.
      • 佩林H.
      • Tegel H.
      • Mulder J.
      • 罗伯格J.
      • 你lsson P.
      • Schwenk J.m.
      • 哈斯滕米
      • von feilitzen k。
      • Forsberg M.
      • 佩尔森L.
      • 约翰逊F.
      • Zwahlen M.
      • von heijne g.
      • 尼尔森J.
      • Ponténf。
      蛋白质组学的人蛋白质组织基于组织的地图。
      )。
      我们观察到总共1,968个质量偏移作为琥珀酰基:2H(4),琥珀酰基:13C(4)或苯甲酰基,其中已知从化学标记试剂中衍生(400psms具有电子值分数<1E-30,所示的一个例子 补充图。S11)。然而,这些样品中没有使用同位素标记试剂。最近的一项研究报告称赖氨酸苯甲酰化是一种新型蛋白质PTMS(
      • 黄鹤
      • 张D.
      • 王Y.
      • 佩雷斯 - 中学M.
      • 汉诗。
      • 郑y.g.
      • 郝Q.
      • 赵玉。
      赖氨酸苯甲酰化是由SIRT2调节的组蛋白标记。
      ),与我们在此观察到的这种质量换档的情况完全匹配。因此,可能是这种大规模转变的一些PSM可能是 体内 苯甲酰化。这种情况进一​​步建议作为伪影或化学标签被注释的一些质量换档可以是未报告的生物蛋白质修饰。
      除了修饰外,还通过PTMINer检测到一些单一氨基酸变化(SAVS)。为了确保它们真正由单核苷酸多态性(SNPS)引起的,我们进一步将我们的结果与Uniprot数据库进行了比较,并且发现了检测到的SAVS的3874个具有SNP注释。一些Savs是组织特定的。例如,局部化为蛋白质肌素-11(V1289A)的RS16967510主要发现在成人结肠和成人尿膀胱中,RS6085324本地化为蛋白质分泌蛋白-1(S93T),主要是成年肾上腺。肽的光谱与这些Savs的光谱显示出与相应的非变异肽(没有SELS)的那些良好的一致性,证明PTMINER的置信性识别(补充图。S12, 补充表S9)。
      此外,我们观察到,一些修饰在两个样品制备方法之间显示出强烈差异, IE。 BRP. and SDS-PAGE (补充图。S13)。这些质量偏移可能是特定方法 体外 修改。例如,在SDS-PAGE样本中主要观察到Glu的甲基化,而在BRP样品中脱水。因此,如果在未来的实验中被认为是内源性PTMS,则应额外地注意,需要更多的证据。

       分析部分和未注释的修改

      我们注意到,在开放的搜索结果中,“质量换档”也可能由其他事件导致,而不是修改,例如源自裂缝,非特异性消化和错过的裂缝。 PTMiner具有检测到无法完全注释的某些此类事件的检测。简而言之,Ptminer试图考虑鉴定的肽序列的N-或C-末端的一些氨基酸,或者从N-或C-末端删除一些氨基酸,检查是否可以逻辑地解释这些质量偏移。从289,370部分和未注释的PSM,PTMiner以这种方式回收116,057(40.11%)新的肽序列。例如,在[240.5,241.5] da的箱中的4528(〜76%)质量偏移被解释为Ile / Leu和Lys的两个氨基酸的损失(所示的样品 补充表S10)。
      我们还发现,由UniMod无法注释或解释的一些质量偏移显示氨基酸特异性偏好。例如,落入[11.99,12.01] da的质量偏移,它与噻唑烷改性的质量一致,主要是肽n-末端(99.39%,12104/12178)(Fig. 7, 补充图S14)。除甲醛处理的样品外,不能在肽N-末端添加这种修饰,但没有提到这种治疗(
      • 金马
      • Pinto S.M.
      • GetNet D.
      • 你rujogi R.S.
      • 曼达S.S.
      • Chaerkady R.
      • Madugundu A.K.
      • Kelkar D.S.
      • Isserlin R.
      • 耆那教
      • 托马斯J.K.
      • Muthusamy B.
      • Leal-Rojas P.
      • Kumar P.
      • sahasrabuddhe n.a.
      • Balakrishnan L.
      • Advani J.
      • 乔治B.
      • Renuse S.
      • Selvan L.D.
      • Patil A.H.
      • 南jappa五。
      • radhakrishnan A.
      • PR.asad S.
      • 分组ayt.
      • Raju R.
      • Kumar M.
      • sreenivasamurthy s.k.
      • Marimuthu A.
      • sathe g.j.
      • Chawan S.
      • datta k.k.
      • SubBannayya Y.
      • Sahu A.
      • yelamanchi s.d.
      • JAYARAM S.
      • Rajagopalan P.
      • Sharma J.
      • Murthy K.r.
      • Syed N.
      • Goel R.
      • Khan A.A.
      • Ahmad S.
      • de
      • Mudgal K.
      • Chatterjee A.
      • 黄T.C.
      • 钟杰。
      • 吴X.
      • Shaw P.G.
      • 释放D.
      • Zahari M.S.
      • Mukherjee K.K.
      • Shankar S.
      • Mahadevan A.
      • 林H.
      • 米切尔C.J.
      • Shankar S.K.
      • Satishchandra P.
      • 施罗德J.T.
      • sardeshmukh r.
      • Maitra A.
      • LEACH S.D.
      • 德雷克C.G.
      • Halushka M.K.
      • PR.asad T.S.
      • Hruban R.H.
      • Kerr C.L.
      • 糟糕的G.D.
      • IACOBUZIO-DONAHUE C.A.
      • Gowda H.
      • Pandey A.
      人蛋白质组的草稿。
      )。另一个例子是落入[33.993,34.013] da的149次大规模转变,主要是他的(90%,133/149)。但是,它们无法通过任何类型的UNIMOD修改注释(Fig. 8, 补充图。S15)。它们可能来自一些未知类型的修改,但致力于未经讨犯的大规模班次的身份超过计算问题,并且已经超出了本文的范围。
      图缩略图GR7.
      Fig. 712.0054Da的质量偏移是肽n-末端的局部化。 显示并比较了肽的改性(顶部)和未改性(底部)形式的MS / MS光谱。两个光谱之间的红色箭头表示片段离子峰的偏移。可以看出,在它们的肽碎片模式方面,两个光谱彼此非常相似,证明了识别和定位的可靠性。
      图缩略图GR8.
      Fig. 834.0061 da的大规模班次本地化为他。 显示并比较了肽的改性(顶部)和未改性(底部)形式的MS / MS光谱。两个光谱之间的红色箭头表示片段离子峰的偏移。可以看出,在它们的肽碎片模式方面,两个光谱彼此非常相似,证明了识别和定位的可靠性。

      讨论

      我们在本文中提出了一个名为PTMiner的软件工具,用于准确估计修改特定的FDR和基于概率的修改本地化,以支持在开放搜索中的更可靠的PTM检测。我们使用广泛的数据集验证了我们的方法,包括模拟数据,化学合成的肽数据和改性肽掺入复合蛋白质组数据。我们还搜索并分析了人蛋白质组的草稿,以全面地表征人蛋白质组中的PTM。 PTMiner旨在减少在开放搜索中产生的数据中的巨大不确定性,这对蛋白质组学的领域变得越来越受欢迎。
      特别地,检测到的质量偏移的可靠定位可以提供很大的帮助来验证其正确性并确定其身份,这对于蛋白质PTM分析至关重要。例如,一些具有相同或非常相似的肿块的修饰,但在不同的氨基酸上发生, 例如 氨基酸突变Ala->Ser和氧化改性(其群体均为15.994915DA),不能在没有本地化信息的情况下区分。另一方面,由于PTMS在蜂窝蛋白质组中的内在复杂性和开放搜索引擎的简单实施,并且我们无法解决每个问题,因此开放搜索结果非常复杂。例如,PTMiner目前无法处理肽上存在的多个修改。此外,PTMINER在某种程度上取决于UNIMOD修改数据库,目前可能无法完整和无错误。然而,由于未来对蛋白质修改的知识增加,我们的方法的准确性也将得到改善。总之,我们预计PTMINER作为开放数据库搜索结果的第一个统计分析工具,将促进蛋白质组学中更可靠的发现导向的PTM研究。

       数据和软件可用性

      从Proteomexchange联盟下载了化学合成的肽数据和人蛋白质组的地图(http://proteomecentral.proteomexchange.org)数据集标识符分别为PXD009449和PXD000561。已经沉积了修饰的肽掺入蛋白质组数据(Proteomexchange Consortium的全部成员, http://www.iprox.org)使用DataSet标识符IPX0001318000。已识别为修饰肽的所有光谱已经上传到MS-Viewer数据集(
      • 贝克P.R.
      • Chalkley R.J.
      MS-Viewer:用于蛋白质组学结果的基于Web的光谱观看者。
      )(模拟数据的搜索键,化学合成的肽库数据,改性肽掺入复合蛋白质组数据和人蛋白质组的草稿,分别为9年9月,QJGPJPGWSG,NSDXLSV1QU和JR8WRHWAR6)。PTMINER软件和使用MATLAB编码的扩展ASCORE算法可用于 http://fugroup.amss.ac.cn/software/ptminer/ptminer.html.
      PTM.iner现在支持使用碰撞诱导的解离(CID)或HCD以“MGF”格式为数据输入生成的光谱,以及作为搜索结果输入的PFIND,续集或MSFRAGRE的输出。此外,PTMiner还可以阅读从任何搜索引擎传输的选​​项卡分隔文件中。

      补充材料

      参考

        • yates 3rd,J.R.
        • ENG J.K.
        • mccormack a.l.
        • Schieltz D.
        将改性肽的串联质谱与蛋白质数据库中氨基酸序列相关联的方法。
        肛门。化学。 1995; 67: 1426-1436
        • nesvizhskii a.i.
        • Roos f.f.
        • 格罗斯曼J.
        • Vogelzang M.
        • eddes J.S.
        • Gruissem W.
        • Baginsky S.
        • Aeberberold R.
        霰弹枪蛋白质组学数据的动态谱质量评估和迭代计算分析:更有效地识别翻译后修饰,序列多态性和新型肽。
        摩尔。细胞蛋白质组学。 2006; 5: 652-670
        • Chalkley R.J.
        • 贝克P.R.
        • Medzihradszky K.F.
        • 林恩A.J.
        • 伯灵名A.L.
        深入分析不同仪器类型的串联质谱数据。
        摩尔。细胞。蛋白质组学。 2008; 7: 2386-2398
        • 怜悯J.
        • Perez-Riverol Y.
        • 刘易斯S.
        • Tabb D.L.
        • 戴安斯J.A.
        • Del-Toro N.
        • RURIK M.
        • Walzer M.W.
        • Kohlbacher O.
        • Hermjakob H.
        • 王R.
        • VizcaínoJ.A.
        识别数百万持续的未识别的光谱,跨越数百个霰弹枪蛋白质组学数据集。
        NAT。方法。 2016; 13: 651-656
        • 你elsen M.L.
        • Savitski m.m.
        • Zubarev R.A.
        人蛋白质组织样本的修饰程度及其对霰弹枪蛋白质组学中的分析动态范围的影响。
        摩尔。细胞。蛋白质组学。 2006; 5: 2384-2391
        • 傅y.
        蛋白质修饰鉴定的数据分析策略。
        方法mol。 BIOL。 2016; 1362: 265-275
        • 坦纳S.
        • Zandi E.
        • BAFNA V.
        • PEVZNER P.A.
        通过盲目搜索质谱来识别翻译后修改。
        NAT。 Biotechnol。 2005; 23: 1562-1567
        • Chalkley R.J.
        • 贝克P.R.
        • 汉森K.C.
        • Medzihradszky K.F.
        • Allen N.P.
        • Rexach M.
        • 伯灵名A.L.
        综合分析在四极孔选择,四极碰撞细胞,飞行时间质谱仪I中获取的多维液相色谱质谱数据集。通过搜索引擎理论上可解释多少数据?
        摩尔。细胞。蛋白质组学。 2005; 4: 1189-1193
        • 汉森B.T.
        • Davey S.W.
        • 火腿A.J.
        • 李ebler D.C.
        P-MOD:使用串联MS数据将修改映射到肽序列的算法和软件。
        J.蛋白质组。 2005; 4: 358-368
        • 唐W.H.
        • Halpern B.R.
        • Shilov I.v.
        • Seymour S.L.
        • Keating S.P.
        • Loboda A.
        • Patel A.A.
        • Schaeffer D.A.
        • Nuwaysir L.M.
        使用MS / MS数据库搜索发现已知和意外的蛋白质修改。
        肛门。化学。 2005; 77: 3931-3946
        • Havilio M.
        • 羊毛A.
        使用串联质谱法大规模无限制地识别后翻版修改。
        肛门。化学。 2007; 79: 1362-1368
        • Baumgartner C.
        • Rejtar T.
        • kullolli m.
        • 阿克拉L.M.
        • karger b.l.
        SEMOP:使用LC-MS / MS数据的未受限制搜索修改肽的新计算策略。
        J.蛋白质组。 2008; 7: 4199-4208
        • 陈Y.
        • 陈W.
        • cobb m.h.
        • 赵玉。
        PTM.AP-A序列对齐软件,用于翻译后修改站点的不受限制,准确,全频谱识别。
        PR.oc。 Natl。阿卡。 SCI。美国。 2009; 106: 761-766
        • 你D.
        • 傅y.
        • 太阳r.x.
        • 王H.P.
        • 袁Z.F.
        • Chi H.
        • 他是的
        打开MS / MS光谱库搜索,以识别意外的翻译后修改并提高光谱识别率。
        生物信息学。 2010; 26: I399-406
        • Ahrne E.
        • 你kitin F.
        • 李sacek F.
        • Muller M.
        QuickMod:用于打开修改频谱库搜索的工具。
        J.蛋白质组。 2011; 10: 2913-2921
        • na s.
        • Bandeira N.
        • PAEK E.
        快速多盲修改通过串联质谱进行搜索。
        摩尔。细胞。蛋白质组学。 2012; 11 (M111 010199。)
        • 马C.W.
        • 林H.
        通过频谱库搜索思维库的意外翻译后修改狩猎。
        J.蛋白质组。 2014; 13: 2262-2271
        • 鸡爪。
        • Kolippakkam D.
        • Nusinow D.P.
        • 翟德
        • RAD R.
        • Huttlin E.L.
        • Gygi S.P.
        容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
        NAT。 Biotechnol。 2015; 33: 743-749
        • yu f.
        • 李恩
        • yu w.
        PIPI:使用编码方法的PTM-不变肽鉴定。
        J.蛋白质组。 2016; 15: 4423-4435
        • 孔A.T.
        • Leprevost F.v.
        • avtonomov d.m.
        • Mellacheruvu D.
        • nesvizhskii a.i.
        MSFRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
        NAT。方法。 2017; 14: 513-520
        • Searle B.C.
        • Dasari S.
        • 特纳米
        • reddy a.p.
        • Choi D.
        • Wilmarth P.A.
        • mccormack a.l.
        • David L.L.
        • Nagalla S.R.
        使用基于质量的对准算法进行MS / MS De Novo测序结果的蛋白质和意外序列修饰的高通量鉴定。
        肛门。化学。 2004; 76: 2220-2230
        • 韩义。
        • 张克。
        蜘蛛:从序列标签与DE Novo测序误差的序列标签软件。
        J. Bioinform Comput Biol。 2005; 3: 697-716
        • 沉Y.
        • 托里·托尔
        • 赫克森k.k.
        • Purvine S.O.
        • 安德森G.A.
        • 史密斯r.d.
        De Novo测序唯一序列标签,用于发现蛋白质的翻译后修饰。
        肛门。化学。 2008; 80: 7742-7754
        • Bandeira N.
        • 弗兰克A.
        • PEVZNER P.A.
        通过光谱网络分析蛋白质识别。
        PR.oc。 Natl。阿卡。 SCI。美国。 2007; 104: 6140-6145
        • Falkner J.A.
        • Falkner J.W.
        • yocum a.k.
        • 安德鲁斯P.C.
        一种光谱聚类方法,用于翻译后修改的MS / MS识别。
        J.蛋白质组。 2008; 7: 4614-4622
        • 傅y.
        • XIU L.Y.
        • 贾W.
        • 你D.
        • 太阳r.x。
        • 钱X.H.
        • 他是的
        DELTAMT:用于快速检测LC-MS / MS数据蛋白质修改的统计算法。
        摩尔。细胞蛋白质组学。 2011; 10 (M110 000455。)
        • 短red m.r.
        • 短red m.r.
        • 温格C.D.
        • Frey B.L.
        • Schaffer L.v.
        • Scalf M.
        • 史密斯l.m.
        全球识别蛋白质翻译后的翻译后修改在一次通过数据库搜索中。
        J.蛋白质组。 2015; 14: 4714-4720
        • 李问:
        • 等等。
        全球翻译后修改发现。
        J.蛋白质组。 2017; 16: 1383-1390
        • 克雷格r.
        • Beavis R.C.
        串联:匹配具有串联质谱的蛋白质。
        生物信息学。 2004; 20: 1466-1467
        • 皱褶D.M.
        • Cottrell J.s.
        易于禁止未解释的串联质谱数据的搜索。
        蛋白质组学。 2002; 2: 1426-1434
        • 汉X.
        • Xin L.
        • 山B.
        峰ptm:基于质谱的肽鉴定,具有未指定的修饰。
        J.蛋白质组。 2011; 10: 2930-2936
        • Chi H.
        • 他k。
        • 杨B.
        • 陈祖
        • 太阳r.x.
        • 风扇S.B.
        • 张克。
        • 刘C.
        • 袁Z.F.
        • 王Q.H.
        • 刘S.Q.
        • 董M.Q.
        • 他是的
        Pfind-Alioth:一种新颖的不受限制数据库搜索算法,可以提高高分辨率MS / MS数据的解释。
        J.蛋白质组学。 2015; 125: 89-97
        • eliasj.e.
        • Gygi S.P.
        目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
        NAT。方法。 2007; 4: 207-214
        • 傅y.
        • 钱X.
        转移亚组错误发现率进行质谱法检测的罕见翻译修改。
        摩尔。细胞。蛋白质组学。 2014; 13: 1359-1368
        • Vaudel M.
        • 伯克哈特准
        • Zahedi R.P.
        • oveland E.
        • 鲍伦森
        • 生病员..
        • 玛特L.
        • Barsnes H.
        Peptideshaker可以实现MS衍生的蛋白质组学数据集的再分析。
        NAT。 Biotechnol。 2015; 33: 22-24
        • 傅y.
        翻译后修饰蛋白质组学的贝叶斯虚假发现率。
        统计及其界面。 2012; 5: 47-59
        • na s.
        • PAEK E.
        软件眼睛的蛋白质翻译后修饰。
        质谱rev. 2015; 34: 133-147
        • Chalkley R.J.
        • 克劳瑟K.R.
        修改网站本地化评分:策略和性能。
        摩尔。细胞。蛋白质组学。 2012; 11: 3-14
        • 奥尔森J.V.
        • Blagoev B.
        • GNAD F.
        • MACEK B.
        • Kumar C.
        • Mortensen P.
        全球体内和现场特定的信令网络中的磷酸化动力学。
        细胞。 2006; 127: 635-648
        • Beausoleil S.A.
        • Villen J.
        • 格柏S.A.
        • 赶紧J.
        • Gygi S.P.
        基于概率的高通量蛋白磷酸化分析和现场定位方法。
        NAT。 Biotechnol。 2006; 24: 1285-1292
        • albuquerque c.p.
        • Smolka M.B.
        • Payne S.H.
        • BAFNA V.
        • ENG J.
        • 周H.
        深入磷脂蛋白酶体分析的多维色谱技术。
        摩尔。细胞。蛋白质组学。 2008; 7: 1389-1396
        • 万王。
        • CRIPPS D.
        • 托马斯S.
        • 坎贝尔P.
        • Ambulos N.
        • 陈T.
        • 杨阿。
        磷斯坦:使用MS2 / MS3对信息的磷酸化站点预测的基于概率的方法。
        J.蛋白质组。 2008; 7: 2803-2811
        • 罗滕贝格B.E.
        • Pisitkun T.
        • Knepper M.A.
        • Hoffert J.D.
        磷源:用于MSN数据的开源磷酸化站点分配工具。
        J.蛋白质组。 2008; 7: 3054-3059
        • Bailey C.M.
        • 甜蜜的三个
        • Cunningham D.L.
        • Zeller M.
        • Heath J.K.
        • Cooper H.J.
        SLOMO:从ETD / ECD质谱的自动化网站定位修改。
        J.蛋白质组。 2009; 8: 1965-1971
        • 爱德华兹N.
        • 吴X.
        • tseng c. -w。
        一种无监督,无模型,机器学习组合器,用于来自串联质谱的肽标识。
        临床蛋白质组学。 2009; 5: 23
        • Phanstiel D.H.
        • Brubaugh J.
        • 温格C.D.
        • 田S.
        • PR.obasco M.D.
        • Bailey D.J.
        • Swaney D.L.
        • Tervo M.A.
        • Bolin J.M.
        • Ruotti V.
        • 斯图尔特R.
        • Thomson J.A.
        • Coon J.J.
        人ES和IPS细胞的蛋白质组学和磷蛋白蛋白酶比较。
        NAT。方法。 2011; 8: 821-827
        • Taus T.
        • KöcherT.
        • Pichler P.
        • Paschke C.
        • 施密特A.
        • Henrich C.
        • Mechtler K.
        使用磷光体的普遍和自信的磷酸化位点定位。
        J.蛋白质组。 2011; 10: 5354-5362
        • 贝克P.R.
        • 特立尼达J.C.
        • Chalkley R.J.
        修改站点本地化评分集成到搜索引擎中。
        摩尔。细胞。蛋白质组学。 2011; 10 (M111 008078。)
        • Lemeer S.
        • kunly E.
        • Klaeger S.
        • rabe m.
        • 塔M.W.
        • Claudes E.
        • arrey t.n.
        • strupat K.
        • Urlaub H.
        • Kuster B.
        MALDI MS / MS和吉祥物DELTA评分磷酸化位点定位。
        肛门。生物山化学。 2012; 402: 249-260
        • 费尔明D.
        • Walmsley S.J.
        • Gingras A.c.
        • Choi H.
        • nesvizhskii a.i.
        Luciphor:使用改进的目标诱饵方法具有假定位速率估计的磷酸化站点定位算法。
        摩尔。细胞。蛋白质组学。 2013; 12: 3409-3419
        • 费尔明D.
        • Avtonomov D.
        • Choi H.
        • nesvizhskii a.i.
        Luciphor2:从串联质谱数据数据的通用翻译后修改的站点定位。
        生物信息学。 2015; 31: 1141-1143
        • Vaudel M.
        • 布雷特D.
        • 贝克F.
        • RahnenführerJ.
        • 玛特L.
        • Zahedi R.P.
        D-score:搜索引擎独立的MD分数。
        蛋白质组学。 2013; 13: 1036-1041
        • 赛德F.
        • Pisitkun T.
        • Hoffert J.D.
        • 拉什迪肯S.
        • 王G.
        • Gucek M.
        • Knepper M.A.
        PHOSEA:质谱数据的快速准确磷酸化站点分配算法。
        蛋白质组SCI。 2013; 11: S14
        • Chung C.
        • 刘杰。
        • Emili A.
        • 弗雷B.J.
        从串联质谱预测的翻译后修改的计算改进。
        生物信息学。 2011; 27: 797-806
        • 坦纳S.
        • Payne S.H.
        • Dasari S.
        • Wilmarth P.A.
        • David L.L.
        • Loomis W.f.
        • Briggs S.P.
        • BAFNA V.
        通过不受限制的数据库搜索准确注释肽修改。
        J.蛋白质组。 2008; 7: 170-181
        • 傅y.
        • 杨Q.
        • 太阳r.
        • 李德。
        • 曾R.
        • 凌c.x.
        • 高W.
        利用核心串联通过串联质谱来将肽鉴定的片段离子相关联。
        生物信息学。 2004; 20: 1948-1954
        • 王L.H.
        • 李D ..
        • 傅y.
        • 王H.P.
        • 张J.F.
        • 袁Z.F.
        • 太阳r.x.
        • 曾R.
        • 他是的
        • 高W.
        PFIND 2.0:通过串联质谱法的肽和蛋白质鉴定的软件包。
        快速交流质谱。 2005; 21: 2985-2991
        • 李德。
        • 傅y.
        • 太阳r.
        • 凌c.x.
        • 魏Y.
        • 周H.
        • 曾R.
        • 杨Q.
        • 他是。
        • 高W.
        PFIND:一种新的数据库搜索软件系统,用于通过串联质谱法自动肽和蛋白质鉴定。
        生物信息学。 2005; 21: 3049-3050
        • 金马
        • Pinto S.M.
        • GetNet D.
        • 你rujogi R.S.
        • 曼达S.S.
        • Chaerkady R.
        • Madugundu A.K.
        • Kelkar D.S.
        • Isserlin R.
        • 耆那教
        • 托马斯J.K.
        • Muthusamy B.
        • Leal-Rojas P.
        • Kumar P.
        • sahasrabuddhe n.a.
        • Balakrishnan L.
        • Advani J.
        • 乔治B.
        • Renuse S.
        • Selvan L.D.
        • Patil A.H.
        • 南jappa五。
        • radhakrishnan A.
        • PR.asad S.
        • 分组ayt.
        • Raju R.
        • Kumar M.
        • sreenivasamurthy s.k.
        • Marimuthu A.
        • sathe g.j.
        • Chawan S.
        • datta k.k.
        • SubBannayya Y.
        • Sahu A.
        • yelamanchi s.d.
        • JAYARAM S.
        • Rajagopalan P.
        • Sharma J.
        • Murthy K.r.
        • Syed N.
        • Goel R.
        • Khan A.A.
        • Ahmad S.
        • de
        • Mudgal K.
        • Chatterjee A.
        • 黄T.C.
        • 钟杰。
        • 吴X.
        • Shaw P.G.
        • 释放D.
        • Zahari M.S.
        • Mukherjee K.K.
        • Shankar S.
        • Mahadevan A.
        • 林H.
        • 米切尔C.J.
        • Shankar S.K.
        • Satishchandra P.
        • 施罗德J.T.
        • sardeshmukh r.
        • Maitra A.
        • LEACH S.D.
        • 德雷克C.G.
        • Halushka M.K.
        • PR.asad T.S.
        • Hruban R.H.
        • Kerr C.L.
        • 糟糕的G.D.
        • IACOBUZIO-DONAHUE C.A.
        • Gowda H.
        • Pandey A.
        人蛋白质组的草稿。
        自然。 2014; 509: 575-581
        • 皱褶D.M.
        • Cottrell J.s.
        UNIMOD:质谱法的蛋白质修饰。
        蛋白质组学。 2004; 4: 1534-1536
        • Villen J.
        • Beausoleil S.A.
        • 格柏S.A.
        • Gygi S.P.
        小鼠肝的大规模磷酸化分析。
        PR.oc。 Natl。阿卡。 SCI。美国。 2007; 104: 1488-1493
        • ZOLG D.P.
        • Wilhelm M.
        • 施密特T.
        • MédardG.
        • Zerweck J.
        • knaute t.
        • 文字H.
        • reimer u.
        • Schnatbaum K.
        • Kuster B.
        蛋白质池:使用合成肽的LC-MS / MS系统表征21个翻译后蛋白质修饰。
        摩尔。细胞蛋白质组学。 2018;
        • ZOLG D.P.
        • Wilhelm M.
        • Schnatbaum K.
        • Zerweck J.
        • knaute t.
        • Delanghe B.
        • Bailey D.J.
        • Gessulat S.
        • Ehrlich H.C.
        • Weininger M.
        • 是的。
        • Schlegl J.
        • Kramer K.
        • 施密特T.
        • Kusebauch U.
        • 德意曲e.w.
        • Aeberberold R.
        • 莫里茨R.L.
        • 文字H.
        • Moehring T.
        • Aiche S.
        • Huhmer A.
        • reimer u.
        • Kuster B.
        基于完整的合成人群构建蛋白质池。
        NAT。方法。 2017; 14: 259-262
        • Chambers M.C.
        • 麦克莱恩B.
        • Burke R.
        • Amodei D.
        • Ruderman D.L.
        • Neumann S.
        • Gatto L.
        • Fischer B.
        • 普拉特B.
        • Egertson J.
        • 霍夫克
        • Kessner D.
        • 塔斯曼N.
        • 舒尔曼N.
        • Frewen B.
        • 贝克T.A.
        • Brusniak M.Y.
        • 保罗C.
        • 皱纹D.
        • 闪光灯L.
        • Kani K.
        • 成型C.
        • Seymour S.L.
        • Nuwaysir L.M.
        • Lefebvre B.
        • Kuhlmann F.
        • 罗克J.
        • rainer p.
        • Detlev S.
        • Hemenway T.
        • Huhmer A.
        • Langridge J.
        • Connolly B.
        • Chadick T.
        • 霍莉K.
        • eCkels J.
        • 德意曲e.w.
        • 莫里茨R.L.
        • 凯茨J.E.
        • agus d.b.
        • Maccoss M.
        • Tabb D.L.
        • Mallick P.
        用于质谱和蛋白质组学的跨平台工具包。
        NAT。 Biotechnol。 2012; 30: 918-920
        • 袁Z.F.
        • 刘C.
        • 王H.P.
        • 太阳r.x.
        • 傅y.
        • 张J.F.
        • 王L.H.
        • Chi H.
        • 李Y.
        • XIU L.Y.
        • 王W.P.
        • 他是的
        PPARSE:一种精确测定高分辨率质谱中单同位素峰的方法。
        蛋白质组学。 2012; 12: 226-235
        • 金Z.
        • 傅Z.
        • 杨杰。
        • Troncosco J.
        • 埃弗雷特A.D.
        • 范艾克J.E.
        通过组合HCD和CID碎裂来鉴定瓜氨酸改性脑蛋白的鉴定与表征。
        蛋白质组学。 2013; 13: 2682-2691
        • yau k.w.
        • Hardie R.C.
        光电扫描图案和变化。
        细胞。 2009; 139: 246-264
        • 刘N.K.
        • 徐X.M.
        神经保护和脊髓损伤后的分子机制。
        神经矫正。 res。 2012; 7: 2051-2062
        • Moya-Alvarado G.
        • Gershoni-Emek N.
        • Perlson E.
        • Bronfman F.C.
        神经变性和阿尔茨海默病(AD)。蛋白质组学可以告诉我们Alzheimer的大脑吗?
        摩尔。细胞。蛋白质组学。 2016; 15: 409-425
        • Uhlen M.
        • Fagerberg L.
        • Hallström下午
        • 李ndskog C.
        • oksvold p.
        • Mardinoglu A.
        • sivertssonÅ。
        • Kampf C.
        • sjöstedte。
        • Asplund A.
        • 奥尔森一世。
        • Edlund K.
        • Lundberg E.
        • 纳瓦尼S.
        • Szigyarto C.A.
        • Odeberg J.
        • Djureinovic D.
        • Takanen J.O.
        • 回暖
        • ALM T.
        • Edqvist P.H.
        • 佩林H.
        • Tegel H.
        • Mulder J.
        • 罗伯格J.
        • 你lsson P.
        • Schwenk J.m.
        • 哈斯滕米
        • von feilitzen k。
        • Forsberg M.
        • 佩尔森L.
        • 约翰逊F.
        • Zwahlen M.
        • von heijne g.
        • 尼尔森J.
        • Ponténf。
        蛋白质组学的人蛋白质组织基于组织的地图。
        科学。 2015; 347: 1260419
        • 黄鹤
        • 张D.
        • 王Y.
        • 佩雷斯 - 中学M.
        • 汉诗。
        • 郑y.g.
        • 郝Q.
        • 赵玉。
        赖氨酸苯甲酰化是由SIRT2调节的组蛋白标记。
        自然通信。 2018; 9: 3374
        • 贝克P.R.
        • Chalkley R.J.
        MS-Viewer:用于蛋白质组学结果的基于Web的光谱观看者。
        摩尔。细胞。蛋白质组学。 2014; 13: 1392-1396