广告

修改网站本地化评分:策略和性能

  • 罗伯特J.Chalkley
    一致
    应当解决谁的通信:加州大学旧金山,600 16th Street,Genentech Hall N-474a,加利福尼亚州旧金山94158。电话。:415-476-5189;传真:415-502-1655.
    隶属关系
    加州大学旧金山,600 16街,Genentech Hall N-474a,旧金山,加利福尼亚州94158
    搜索本作者的文章
  • Karl R. Clauser.
    隶属关系
    广泛的MIT和Harvard,7剑桥中心,剑桥,马萨诸塞州02142
    搜索本作者的文章
      使用浓缩策略,许多研究组通常使用串联质谱法常规地生产用于蛋白质组学分析的翻译后修饰肽的大数据集。虽然搜索引擎在用定义的可靠性识别这些肽识别这些肽时,但它们对修改的网站定位通常是任意的并且不可靠的。该领域继续需要广泛接受的度量标准,以便精确地描述出版数据集中的站点本地化的确定性,并允许一致地测量新兴评分算法的性能差异。在本文中,讨论了软件用于修改站点本地化的主要策略以及评估这些不同工具性能的方式。审查了代表歧义的方法,并讨论了如何转移到不同数据类型和修改的方法。
      细胞通过各种信号机构响应其细胞外环境中的元素,这可以响应环境提示,电刺激或化学信使而产生。主要是通过添加翻译后修改(PTM)来通过改变预先存在的蛋白质来繁殖信号
      使用的缩写是:
      PTM.
      翻译后修改
      FDR.
      假发现率
      弗拉
      虚假本地化率
      阿布鲁夫
      生物分子资源设施协会
      IPRG.
      蛋白质组信息研究组
      滑坡得分
      肽分数的网站本地化
      c
      碰撞诱导解离
      ecd.
      电子捕获解离
      ETD.
      电子转移解离。
      1使用的缩写是: PTM.
      翻译后修改
      FDR.
      假发现率
      弗拉
      虚假本地化率
      阿布鲁夫
      生物分子资源设施协会
      IPRG.
      蛋白质组信息研究组
      滑坡得分
      肽分数的网站本地化
      c
      碰撞诱导解离
      ecd.
      电子捕获解离
      ETD.
      电子转移解离。
      关键残留物改变其结构和活动。然后将这些信号转发和扩增,直至其最终表现出蛋白质表达的变化。越来越清楚的是,PTMS的错误调节是疾病的主要基础,它是否导致癌症中的异常信号传导,或神经变性疾病中的细胞毒性蛋白质聚集。因此,翻译后修饰的蛋白质的研究对于了解生物调节至关重要(
      • Pawson T.
      • 斯科特J.D.
      信号传导50岁和计数中的蛋白质磷酸化。
      )。
      基于质谱的蛋白质组学的蛋白质组学已经彻底改变了蛋白质PTM的表征,因为它创造了第一种无偏异的策略,以确定哪种蛋白质正在修饰哪种蛋白质,以及特定的残留物。在所用的许多类型的PTMS中,蛋白质磷酸化具有最大的关注(
      • Boersema P.J.
      • 穆罕默德S.
      • Heck A.J.
      质谱分段和分析质谱法。
      ,
      • Grimsrud p.a.
      • Swaney D.L.
      • 温格C.D.
      • Beauchene N.A.
      • Coon J.J.
      群体的磷蛋白质。
      )。然而,有许多其他调节修改,如丝氨酸和苏氨酸 O-glcnacylation(
      • 哈特G.W.
      • Housley M.P.
      • Slawson C.
      O-连接的β-N-乙酰淀粉胺在核细胞质蛋白上循环。
      ),赖氨酸或精氨酸甲基化(
      • 相反p.
      • Dhayalan A.
      • 马蹄
      • jeltsch a。
      蛋白质赖氨酸甲基转移酶的特异性及其检测非组蛋白赖氨酸甲基化的方法。
      ),乙酰化赖氨酸侧链(
      • 赵某。
      • 徐W.
      • 江W.
      • yu w.
      • 林Y.
      • 张T.
      • 姚杰。
      • 周L.
      • 曾Y.
      • 李H.
      • 李Y.
      • 施J.
      • W.
      • 汉考克三。
      • 秦立
      • Chin J.
      • 杨P.
      • 陈X.
      • 雷Q.
      • 熊Y.
      • 关卡。
      蛋白质赖氨酸乙酰化对细胞代谢的调节。
      )或赖氨酸泛素(
      • Kirkpatrick D.S.
      • 丹尼斯C.
      • Gygi S.P.
      泛素称重:基于质谱的蛋白质组学的扩张作用。
      )研究和理解是所有瞬态和重要的。细胞使用许多其他PTM,瞬态和稳定,影响蛋白质活性。实际上,不同的PTM不会彼此独立地操作,因此通过仅研究单一的修改类型,无法对信号传导机制和细胞响应进行解作其贡献(
      • Strahl B.D.
      • Allis C.D.
      共价组蛋白修饰的语言。
      ,
      • Zeidan Q.
      • 哈特G.W.
      O-Glcnacylation和磷酸化之间的交叉点:多信号途径的影响。
      )。
      所有这些修饰的大规模分析遵循类似的策略,其中富集步骤(抗体亲和力,金属亲和力,凝集素亲和性,凝集素亲和性),然后串联质谱分析得到所得混合物(
      • 赵玉。
      • Jensen O.N.
      修饰特异性蛋白质组学:使用富集技术表征翻译后修改的策略。
      )。在这些研究中可以可靠地鉴定成千上万的修饰肽,但是在这些肽中确定修饰位点局部的挑战较小。
      MS / MS光谱使得通过在一个或多个离子型离子类型的一个或多个离子类型的光谱中存在修饰现场定位,其衍生自可以承受改性的肽中的两个氨基酸之间的碎片。当不存在这样的离子时,或者不能容易地与噪声区分离,因此无法自信地将其定位于任一位点。当肽中只有一个氨基酸可以承受修改时,可以对本地化没有模糊。 Fig. 1 说明了磷酸肽的两种光谱;其中站点分配是明确的,其中没有证据区分两个潜在地点的一个。
      图缩略图GR1.
      Fig. 1在MS / MS频谱修改中,通过存在一个或多个无明确可分配的离子类型的存在,使得能够衍生自肽中的两个氨基酸之间的碎片的一个或多个离子的存在定位。 A,Y5和Y6离子使磷酸盐能够定位于Ser-3而不是Thr-5。 B,SER-1和SER-2之间的碎片不存在,防止磷酸盐定位,但是Y13 ++离子表明没有定位到SER-3。在肽序列中,红色斜杠表明Y离子的观察,蓝色反向架表示B离子的观察和品红色垂直条表示B和Y离子的观察。
      上述规则对网站本地化可靠性进行评估看起来很直接,实际上它是一些光谱,但通过决定什么是真正的巅峰以及噪音是复杂的;是否暗示修改位点的峰值( 例如 可以对应于来自未改性的改性片段或水损失的磷酸盐损失的峰值:前者更常见的是,应该给予任何加权;并确定肽中的哪些残留物应被认为是可能承载给定的修改; 例如 对于甲基化也考虑将导致相同质量变化的潜在氨基酸取代。
      对于肽鉴定,常规确定两种可靠性的统计测量结果。其中的第一个是个体肽识别的可靠性的衡量标识,并且通常是衡量匹配质量如何实现的衡量标准的衡量标准。 IE。 该数字越小(概率或期望值)越可靠的识别。第二个可靠性测量,假发现速率(FDR)处于数据集级别,并估计报告的不正确结果的总数。 FDR通常由目标诱饵数据库搜索策略计算,其中假设与普通数据库和诱饵数据库匹配的频率是相同的(
      • eliasj.e.
      • Gygi S.P.
      目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
      )。不幸的是,没有等效的可靠性措施; IE。 可以轻松计算出修改站点定位结果的错误定位率(FLR),尽管已经采用了估计这一点的方法,并在后面的部分中讨论。可以测量真正FLR的唯一情况是当已知正确的修改站点本地化时。最明显的情况是通过使用合成肽(
      • Savitski m.m.
      • Lemeer S.
      • Boesche M.
      • 朗米
      • Mathieson T.
      • Bantscheff M.
      • Kuster B.
      使用吉祥物三角洲评分的自信磷酸化站点定位。
      )但是已经采用的另一种策略是评估磷酸肽的诱饵残留位点局部,其中只有每种肽存在一只丝氨酸,苏氨酸或酪氨酸(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。
      虽然所有搜索引擎都有一个评分措施肽识别的确定性,但目前只有少数几个额外的分数来衡量修改站点定位的可靠性(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      ,
      • Cox J.
      • Neuhauser N.
      • Michalski A.
      • 施泰米r.a.
      • 奥尔森J.V.
      andromeda:肽搜索引擎集成到最大环境中。
      ,
      • albuquerque c.p.
      • Smolka M.B.
      • Payne S.H.
      • BAFNA V.
      • ENG J.
      • 周H.
      深入磷脂蛋白酶体分析的多维色谱技术。
      , )。与此同时,出现了各种不同的搜索后引擎工具来解决修改站点本地化(
      • Savitski m.m.
      • Lemeer S.
      • Boesche M.
      • 朗米
      • Mathieson T.
      • Bantscheff M.
      • Kuster B.
      使用吉祥物三角洲评分的自信磷酸化站点定位。
      ,
      • Beausoleil S.A.
      • VillénJ.
      • 格柏S.A.
      • 赶紧J.
      • Gygi S.P.
      基于概率的高通量蛋白磷酸化分析和现场定位方法。
      ,
      • 奥尔森J.V.
      • Blagoev B.
      • GNAD F.
      • MACEK B.
      • Kumar C.
      • Mortensen P.
      全球性,体内和现场特异性磷酸化动力学中的信令网络。
      ,
      • 罗滕贝格B.E.
      • Pisitkun T.
      • Knepper M.A.
      • Hoffert J.D.
      磷源:用于MSN数据的开源磷酸化站点分配工具。
      ,
      • Bailey C.M.
      • 甜蜜的三个
      • Cunningham D.L.
      • Zeller M.
      • Heath J.K.
      • Cooper H.J.
      SLOMO:从ETD / ECD质谱的自动化网站定位修改。
      ,
      • Swaney D.L.
      • 温格C.D.
      • Thomson J.A.
      • Coon J.J.
      人胚胎干细胞磷脂蛋白酶通过电子转移解离串联质谱法揭示。
      ,
      • Taus T.
      • KöcherT.
      • Pichler P.
      • Paschke C.
      • 施密特A.
      • Henrich C.
      • Mechtler K.
      使用磷光体的普遍和自信的磷酸化位点定位。
      ,
      • 爱德华兹N.
      • 吴X.
      • tseng c.w.
      一种无监督,无模型,机器学习组合器,用于来自串联质谱的肽标识。
      )。在出售网站本地化评分计划之前,评估网站本地化的唯一选择是“手动验证”; IE。 研究人员依次看每个频谱并对他们是否认为是可靠的网站定位进行判断。这显然是一个主观的过程,严重依赖研究人员的专业知识(以及他们耐心地彻底评估多达千光谱)。事实上,在刊物的出版指南之前,强迫研究人员评估网站本地化可靠性(
      • Bradshaw R.A.
      • 伯灵名A.L.
      • 卡车。
      • Aeberberold R.
      报告蛋白质识别数据:下一代指南。
      )出版了许多PTM研究,其中这个问题甚至没有解决; IE。 他们报告了相关搜索引擎返回的结果,没有进一步的分析。这是一些网站本地化的效果,不应报告仔细检查数据后。这本身就足够了,但PTM数据库已经提取了这些结果来填充其资源,并且从这些数据库中没有立即显而易见,该数据库基于这些通常更少严格的标准确定了站点本地化。这在本手稿的后续部分中更详细地讨论。
      当生物分子资源设施协会(ABRF)的蛋白质组信息研究组(IBRG)在2010年进行了一项研究,在鉴定磷酸肽和本地化磷酸化位点,试图评估修改现场定位的22名参与者报告使用九个命名软件和另外六种定制或内部工具。 (

      Rudnick, P. A., Askenazi, M., Clauser, K. R., Lane, W. S., Martens, L., McDonald, W. H., Mertins, P., Meyer-Arendt, K., Searle, B. C., Kowalak, J. A., Proteome Informatics Research Group 2010 Study. Available from: http://www.abrf.org/index.cfm/group.show/ProteomicsInformaticsResearchGroup.53.htm

      )尽管部署了一系列工具,但大多数实现了两个基本策略中的一个。这两个主要用于评分网站定位可靠性的主要策略尝试评估给定峰值的机会,允许在随机匹配的现场确定,或者计算具有不同站点本地化的肽识别之间的搜索引擎得分差异。雇用前策略的工具是评分(
      • Beausoleil S.A.
      • VillénJ.
      • 格柏S.A.
      • 赶紧J.
      • Gygi S.P.
      基于概率的高通量蛋白磷酸化分析和现场定位方法。
      ),PTM得分(Maxquant / Andromeda)(
      • 奥尔森J.V.
      • Blagoev B.
      • GNAD F.
      • MACEK B.
      • Kumar C.
      • Mortensen P.
      全球性,体内和现场特异性磷酸化动力学中的信令网络。
      ),检查中磷酸化定位评分(PL)(
      • albuquerque c.p.
      • Smolka M.B.
      • Payne S.H.
      • BAFNA V.
      • ENG J.
      • 周H.
      深入磷脂蛋白酶体分析的多维色谱技术。
      ),slomo(
      • Bailey C.M.
      • 甜蜜的三个
      • Cunningham D.L.
      • Zeller M.
      • Heath J.K.
      • Cooper H.J.
      SLOMO:从ETD / ECD质谱的自动化网站定位修改。
      ),膦素(
      • Phanstiel D.H.
      • Brubaugh J.
      • 温格C.D.
      • 田S.
      • Probasco M.D.
      • Bailey D.J.
      • Swaney D.L.
      • Tervo M.A.
      • Bolin J.M.
      • Ruotti V.
      • 斯图尔特R.
      • Thomson J.A.
      • Coon J.J.
      人ES和IPS细胞的蛋白质组学和磷蛋白蛋白酶比较。
      ),磷光体(
      • Taus T.
      • KöcherT.
      • Pichler P.
      • Paschke C.
      • 施密特A.
      • Henrich C.
      • Mechtler K.
      使用磷光体的普遍和自信的磷酸化位点定位。
      ),而后一种策略的例子包括吉祥物δ得分(
      • Savitski m.m.
      • Lemeer S.
      • Boesche M.
      • 朗米
      • Mathieson T.
      • Bantscheff M.
      • Kuster B.
      使用吉祥物三角洲评分的自信磷酸化站点定位。
      ),蛋白质探测器的滑坡得分(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )和频谱磨机中的可变修改定位(VML)得分[Agilent]。 Paparml()通过与后一种策略相关的方法提供实验现场定位分数,其中通过将其肽鉴定的置信分数求和并通过总数归一成,计算在肽上观察到的每个翻译后修饰的现场定位评分。 Paparml与肽相关的置信度(类似于PTM得分如何将其概率估计转换为现场分数)(N.Edwards,个人通信)。 表I. 总结了一些这些工具的功能,本文的其余部分将对比这些不同的网站本地化策略,比较它们的性能并讨论其对在低分辨率离子陷阱中获取的磷酸化数据之外的数据类型的适用性,这是主要数据到目前为止使用这些工具进行评估类型。
      表I. 一些领先的修改网站定位评分工具的比较
      软件巅峰拣选评分:峰值概率(PP)或差异分数(DS)分数使用高质量准确度?分数具有相同的含义,可高达质量准确性数据?代表歧义
      分数 每100峰峰值 PP. NY报告最佳得分网站;不表示下一个最佳替代品
      PTM. 得分Andromeda.每100峰峰值 PP. NY报告所有网站的概率分数
      吉祥物三角洲得分每110岁峰值 DS. N对于更高的质量准确性数据,给定分数变得更加可靠报告最佳得分网站;不表示下一个最佳替代品
      滑坡蛋白质探索器在观察到的M / Z范围的每一半中最强烈的峰值 DS. Y 相似的 在分数范围内列出所有潜在站点
      VML评分谱轧机除去同位素,前兆和噪声后,25个具有最高信号/噪音的峰值 DS. Y 相似的 在分数范围内列出所有潜在站点

       巅峰拣选

      肽识别和修改站点定位的经常被不受欢迎的关键步骤正在决定峰列表文件中的哪些群众用于分析。在峰值列表中,将存在来自感兴趣的肽的片段离子的质量混合物,以及通过化学或电噪声产生的其他质量。由于噪声峰通常具有较低强度,因此通常基于强度的峰值的决定。大多数工具采用强度阈值,其中仅考虑上述峰值,尽管也采用了类似于搜索引擎续集的强度的互相关方法(
      • 罗滕贝格B.E.
      • Pisitkun T.
      • Knepper M.A.
      • Hoffert J.D.
      磷源:用于MSN数据的开源磷酸化站点分配工具。
      )。工具用于阈值的工具采用不同的方法。最简单的方法是在整个频谱上采用通用强度阈值。然而,并非所有片段离子峰都编码相同的信息量。序列离子(对于CID,B和Y离子)比内部离子或甲基离子更丰富,并且通过碎裂形成的离子更接近肽中间的更富有的信息,因为它们定义了更长的质量延伸氨基酸。出于这些原因,峰值阈值策略可确保宽的峰值表示 m / z. 范围可导致肽鉴定和现场定位的更好敏感性。蛋白质探测器中的批量标签分裂观察到的 m / z. 范围为一半,以创建用于搜索的PeakList,以搜索每一半的相同数量的峰值 m / z. 范围(通常每周20个最强烈的峰值,以创建40 m / z. 峰值列表)。第三次策略是将频谱分成 m / z. 然后,每个垃圾箱内使用“n”最强烈的峰值来搜索。这是评分(100箱),PTM得分(100箱)和吉祥物(110箱)所采用的策略。该策略保证了在整个M / Z范围内的峰值表示,但会导致光谱的“安静”部分中使用的低强度峰值。这是举例说明的 Fig. 2,该绘制峰列表使用每100 + 20和4策略产生的磷酸肽RGT(磷酸)VEGSVQEVQEEK的光谱产生的峰值列表。在每个策略中,列表中存在类似数量的峰值(40峰 相对 42峰值)。然而,每种方法有几个峰,包括一些对应于正确肽鉴定的B和Y离子的一些。在该实施例中,每个峰列表包含一个峰,其可用于将磷酸化定位为苏氨酸残基,尽管在每个实施例中是不同的峰值; B4离子20 + 20峰值列表和Y10在每100峰列表中的4个。
      图缩略图GR2.
      Fig. 2不同峰列表生成方法的比较。 使用20 + 20接近的磷酸肽RGT(磷光)VEGSVQEVQeek的峰值列表和每100℃的4个峰值进行比较。以蓝色和红色表示的峰值是B和Y离子仅包括在一个峰值列表或另一个峰值列表中。在20 + 20峰值列表中,修改的B4离子定位了修改位点;在每100个峰值的4个峰值中,改性的Y10离子(与未修饰的Y7离子组合)定位了修改现场。
      与相同数据集的100个融合策略进行了比较了蛋白质verpector峰值列表创建策略(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。与每100次策略的4个峰值相比,差异是适度的,但是20 + 20峰值列表导致稍微更正,略微较少,不正确的网站本地化,从而在较低的FLR处返回更正确的结果。考虑更多的峰(每100峰的5峰)产生了可测量的更高的FLR,主要是因为报告了使用其他峰值列表生成策略的光谱的错误站点本地化,所以站点本地化被视为模糊不清。

       网站本地化评分:随机峰匹配的概率

      前两个重要网站本地化评分工具,评分和PTM评分,使用类似的方法来分配分配。在这两种情况下,该工具是用于评估低质量准确性离子陷阱CID数据中的磷酸化位点识别。这两种工具都将观察到的峰作为整数肿块,因为这种类型的数据通常用一个 m / z. 精度约为±0.5 th不是一个不合理的步骤。然后,他们假设如果在随机观察到每个峰值质量,那么如果 例如 每100秒考虑四个峰,随机匹配这些峰之一的机会是4个。在计算概率之后,它们都将值转换为-10log10(p)得分。
      评分和PTM分数之间的差异是PTM分数使用这种方法来计算每个可能的站点本地化的整体肽识别的概率分数,然后通过制造所有的总和将这些分数转换为每个潜在站点本地化的概率分数等于100%的概率(肽绝对地修饰某个地方)并在该归一化概率刻度上分配给肽中的每个部位的概率(
      • 奥尔森J.V.
      • Blagoev B.
      • GNAD F.
      • MACEK B.
      • Kumar C.
      • Mortensen P.
      全球性,体内和现场特异性磷酸化动力学中的信令网络。
      )。
      相比之下,A分数仅基于匹配潜在“站点确定”B和Y离子来计算其概率得分; IE。 忽略所有网站本地化的峰值是相同的。为所有站点报告网站本地化分数而不是报告网站本地化分数,而是仅向最佳站点本地化报告分数,这是该站点本地化和下一个最佳可能性之间的差异分数(
      • Beausoleil S.A.
      • VillénJ.
      • 格柏S.A.
      • 赶紧J.
      • Gygi S.P.
      基于概率的高通量蛋白磷酸化分析和现场定位方法。
      )。在Ascore的原始出版物中,使用阈值分数为19的作者,其数学上对应于~0.01的概率p或者在99%确定的网站(
      • Beausoleil S.A.
      • VillénJ.
      • 格柏S.A.
      • 赶紧J.
      • Gygi S.P.
      基于概率的高通量蛋白磷酸化分析和现场定位方法。
      )。后来来自作者的实验室的磷蛋白质论文通常使用更自由的门槛(p < 0.05, AScore > 13) (
      • Huttlin E.L.
      • Jedrychowski M.P.
      • eliasj.e.
      • Goswami T.
      • RAD R.
      • Beausoleil S.A.
      • VillénJ.
      • 哈斯W.
      • Sowa M.E.
      • Gygi S.P.
      小鼠蛋白磷酸化和表达的组织特异性地图。
      )。如果将一系列值测试到Ascore概率方程中,则清楚地实现得分>图13需要最佳定位,以具有在MS / MS谱中匹配的至少两个网站确定离子,无论分离两个候选局部化位点的氨基酸数量。
      通过这些方法计算的概率的准确性取决于用于将MS / MS数据拟合到二项式概率模型的假设。其中一个不切实际的假设是所有质量都同样可能随机观察。氨基酸使用有限范围的元素,几个仅通过彼此不同的甲基不同,因此一些质量在实践中比其他物质更容易观察到。例如,质量201的峰可以是通过组合氨基酸EA,LS或TV形成的B2离子。另一方面,M / Z 206的峰不能通过任何氨基酸组合形成。但是,如在每种情况下,他们都会比较或归一化到其他网站本地化分数,这可能会减轻这个问题。尽管如此,而不是将这些基于概率的分数视为准确的站点定位确定性,他们应该更加简单地认为,只要仅仅是由用户确定的阈值来适应个人确定性目标的分数。
      相比之下,磷光体中的得分试图通过替换核心概率计算来克服跨越频谱质量范围的峰值分布问题 N 每100个山峰(N x d / w , 在哪里 N 是提取的峰的总数, d 是指定的片段离子质量耐受性,以及 w 是MS / MS谱的全质量范围(
      • Taus T.
      • KöcherT.
      • Pichler P.
      • Paschke C.
      • 施密特A.
      • Henrich C.
      • Mechtler K.
      使用磷光体的普遍和自信的磷酸化位点定位。
      )。此概率调整不仅允许MS / MS频谱的不同区域,以含有不同数量的峰,具有不同的最佳峰值深度 m / z. Windows,还可以直接允许使用适合于高分辨率仪器产生的数据的窄质量公差。

       网站本地化评分:搜索引擎差分评分

      在进行肽识别时,数据库搜索引擎将考虑肽中的所有潜在位点定位。因此,在搜索结果中存在信息,其可以通过提取具有不同站点本地化的肽识别的分数/期望值的差异来提供站点定位可靠性的量度。这是吉祥物三角洲得分雇用的校长(
      • Savitski m.m.
      • Lemeer S.
      • Boesche M.
      • 朗米
      • Mathieson T.
      • Bantscheff M.
      • Kuster B.
      使用吉祥物三角洲评分的自信磷酸化站点定位。
      ),在蛋白质探测器中滑动得分(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )和光谱磨机中的可变修改定位评分()。在日志上报告了前两个报告评分,这些分数是概率或期望值分数的差异(两个措施的差异相同)10 规模; IE。 一个数量级的期望值的差异将得分10;两个数量级将得分20.在光谱磨机中,识别分数不是概率,而是基于匹配峰的数量,它们的离子类型分配和无与伦比的峰的相对高度。自信网站本地化的分数阈值(前两个本地化之间的分数差异>1.1)对应于位于具有峰值高度的两个候选位点之间的至少1b或Y离子>最高的片段离子的10%(来自前体和相关离子的磷酸盐的中性损耗被排除在相对高度计算之外)。这些工具之间存在两个显着差异。批量标签(滑动评分)和光谱轧机主要使用相同数量的每光谱数量(通常为40个峰值标签,通常在光谱磨机中,在去除同位素和噪音后,具有最高信号/噪音的25峰),然而,吉祥物(吉祥物Δ评分)使用的峰值数量从频谱变为频谱(通常低于批次标签使用的数量),因为搜索引擎改变该值以获得肽识别的最佳置信度。其次,滑移评分直接集成到批次标签中,作为频谱磨机中的可变修改定位评分,而吉祥物Delta评分是通过使用Mascot.dat结果文件作为输入的单独软件来计算。除了在蛋白质探测器和频谱磨机中自动报告的分数的便利性之外,它意味着对搜索引擎的所有结果评估站点定位,而对于其他搜索结果软件,将结果转移到第二个程序中所涉及的额外努力对于额外分析,意味着现场本地化可靠性不会常规评估。大多数搜索引擎需要略微调整,以便能够为所有结果计算站点本地化差异分数。吉祥物存储每种光谱的十大搜索结果。然而,有时是具有不同现场定位的相同肽的情况在十大结果中不得分; 例如 如果观察到只与一个站点本地化匹配的长串Y离子。在这种情况下,可以报告任何网站本地化分数。因此,批次标签和频谱磨机被改变,以便始终存储下一个最佳站点本地化的分数以允许报告所有站点本地化的分数。

       目前本地化评分工具的表现

      2010年,ABRF-IPRG进行了协作LC-MS / MS数据分析研究,其专注于评估蛋白质组学实验室在鉴定磷酸肽和定位磷酸化位点(

      Rudnick, P. A., Askenazi, M., Clauser, K. R., Lane, W. S., Martens, L., McDonald, W. H., Mertins, P., Meyer-Arendt, K., Searle, B. C., Kowalak, J. A., Proteome Informatics Research Group 2010 Study. Available from: http://www.abrf.org/index.cfm/group.show/ProteomicsInformaticsResearchGroup.53.htm

      )。在强阳离子交换(SCX)和固定的金属亲和层析(IMAC)磷肽富集,具有从人K562细胞的裂解物的裂解物的胰酸裂解物中产生的相同磷蛋白酶LC-MS / MS数据集。在SCX梯度上收集的12个级分,对该研究的数据集仅构成部分3,4和12.要求参与者鉴定样品中存在的磷酸肽,≤1%错误发现率(FDR),并评估将磷酸化位点定位为特定氨基酸残基的确定性或歧义。由于FDR的传统目标 - 诱饵测量(
      • eliasj.e.
      • Gygi S.P.
      目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
      )该研究的识别部分可以保存在水平播放场上。但是,由于缺少错误的定位率(FLR),参与者无法对本地化确定性的阈值衡量标准进行具体指导。相反,它们被要求为每个肽谱匹配对是/否定位决策,并提供他们得分机制和阈值的描述。然后根据关于本地化的共识协议评估评估现场定位的22名参与者的结果。 图。 3. A, 3B 显示参与者在本地化网站(3136 PSM的2487人)中一致约会的79%。这仅反映了可能是歧义的案例( IE。 number of STY >检测到的磷酸化数量),其中至少两个参与者愿意将该识别宣布为自信( IE。 ~1%fdr)。在剩下的21%的病例中,如图所示 Fig. 3C 而D,未发现分歧将仅限于单一或选择少数参与者。相反,观察到最有可能使本地化决策的参与者(而不是宣布歧义)更有可能不同意共识视图(最遗弃的参与者)。因此,与共识的大部分分歧都可能归因于自由阈值,基于MS / MS光谱中存在的边际定位证据制定的决定。可以看到一个例子 Fig. 4。虽然79%一致的协议非常有前途,但它也强调了对更一般的报告标准的需求。
      图缩略图GR3.
      Fig. 32010年ABRF-IPRG研究中SCX IMAC分数4的磷化本地化协议鉴定磷酸肽和定位磷酸化位点的研究。 A,对于3932个光谱,识别被指定为≥2/22参与者的某些。其中,3136个光谱在网站本地化方面具有可能的模糊性,其指定为某一; 457光谱没有网站定位模糊的可能性(#Phosphosites等于肽中的#sty残留物); 119 Spectra对本地化的一致意见是模棱两可的;使用220个光谱,仅1名参与者指定了某种网站本地化。 B,对于3136个光谱 >2/22参与者愿意指定本地化,一致他们一致地就磷酸水本地化达到79%的光谱。 C,在剩下的21%的病例(649个谱)中,未发现分歧限于单一或选择少数参与者。 D,最有可能使本地化决策(而不是宣布歧义)的参与者更有可能不同意共识看法。这 x axis of (C ) 和 ( D)以#本地化/#的降序排序。
      图缩略图GR4.
      Fig. 4在2010年ABRF IPRG学习14/21参与者可明智地将磷酸盐位点定位指定为该肽光谱匹配的含糊不清。 在七个侵略性的参与者中,本地化被分裂,4例SER-8()和thr-10( 降低 )。光谱仅具有低强度离子 m / z. 1055.4和M / z 879的离子,其可以根据磷酸盐的定位分配为不同的片段离子类型,这对于Ser-8或Thr-10。

       虚假本地化率(FLR)

      现在通过对使用目标诱饵数据库搜索策略计算的每个工具来进行不同软件工具的肽识别结果的比较现在是通过对伪发现率(FDR)的通用度量来实现的。使用适当的构造诱饵,这将所有工具放在水平竞争场上,因为对目标肽和诱饵肽的随机匹配的频率是相同的(
      • eliasj.e.
      • Gygi S.P.
      目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
      )。关于测量肽和蛋白质鉴定的可靠性的更多细节可以在最近通过Nesvizhskii(
      • nesvizhskii a.i.
      霰弹枪蛋白质组学中肽和蛋白质鉴定的计算方法和误差率估算程序调查。
      )。不幸的是,对于修改网站本地化没有等效的可靠性测量; IE。 目前可以容易地计算FLR。部分原因是,使用错误的站点本地化的肽标识不是随机匹配的;它们与正确的答案非常相似,因此诱饵序列不提供误差估计。目前的主要候选候选FLR方法涉及计算上,允许改性生物学不能承受改性的氨基酸残基(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。理想情况下,诱饵位点定位步骤应与诱饵肽鉴定无关,因为包含额外的可修饰残留物会影响肽识别步骤,产生更多的误报或假阴性(取决于接受阈值的位置)(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。对于基于诱饵定位的FLR是准确的,诱饵残留物的频率需要与目标相同,并且诱饵残留物与正确部位定位的接近也必须遵循类似的模式以靶标残留物:残留物越接近修改的正确部位,越有可能被错误地解释为修改位置。
      尽管生物磷酸化残基S,T和Y的组合密码子频率是〜20%,但在UniProt人序列数据库中的频率在需要8-40个残基的胰蛋白酶肽时,允许未错过的切割允许的17.2%。通过允许E,V和N(17.1%)或D,E和I(16.5%)的诱饵残留组合可以实现Uniprot人体数据库中的类似残留频率。然而,对于个体胰蛋白肽,使用这种恒定的诱饵残留物很少匹配相对频率。 AA频率可以针对几个数据库计算 http://proteomics.broadinstitute.org/millhtml/faindexframe.htm 通过选择计算统计实用程序。
      除了在UniProt人体数据库中具有14.1%的相比具有14.1%的相比的综合频率(14.5%),脯氨酸(P)和谷氨酸(E)是诱饵氨基酸定位评分的有趣候选者,因为它们都被发现在许多激酶的共识典型中(与其他丝氨酸和苏氨酸一样)。因此,可以预期它们可以提供最佳的邻近依赖磷酸化位点。两种研究用作诱饵时,这两个残留物都产生了类似的FLR结果(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。如果靶标和诱饵残留物都在一起进行测试( IE。 任何s,t,y,p,允许在单个肽谱匹配中承受磷酸化的残留物),然后这必须导致数据集中的更加模糊的本地化决策,因为可修改的残留物的数量增加大约两个 - 第三(从3到5种残留物)。考虑一次只考虑一个诱饵残留类型,但执行多个搜索,将减少此问题。然而,这些类型的FLR测量可能会高估实际FLR。另一种替代方案是分别允许对特定肽光谱匹配的目标残留物和诱饵残留物之间的位点定位,然后比较前两种分数。
      虽然频率和接近问题可以防止对单个肽谱匹配的错误定位状态的准确评估,但是在整个数据集中计算诱饵残留定位的数量可以产生近似的全局FLR,即使不准确,也可能是足够的作为算法性能的普遍测量差异,并允许将与特定算法一起使用的单独评分阈值分类为比其他算法更自由或保守。由于在高吞吐量LC-MS / MS PTM报告中所谓的据称的本地化的可靠性,因此可能导致持续的FLR度量的缺失持续的令人困惑和杂散声称,并且对所谓的本地化的可靠性产生不确定性。
      由Nuno Bandeira和同事提出了一种更复杂的尝试为观察特定站点确定离子的重要性的方法(个人沟通;准备稿件)。通过测定相同肽的未改性光谱中等效骨干裂解离子的强度,可以求求宽容给定的位点确定离子是否应该观察到。这种方法的潜在限制是需要观察未修饰的肽,如果在样品分析之前使用改性富集步骤,则不太可能是这种情况。但是,随着公共光谱库的快速群体(
      • 德意曲e.w.
      串联质谱谱库和库搜索。
      ),如果在这些资源中存放等同的碎片数据,则它们可用于提取峰值强度信息。将其与诱饵残留搜索结合起来可以提供更准确的FLR测量。
      在FLR度量计算领域的更多研究对该领域至关重要。

       从文献中收集基于MS / MS的修改本地化

      近年来,一些知识库网站已经出现了收获对同行评审杂志文章的补充表中列出的数以千计的修改网站本地化关于由LC-MS / MS驱动的磷蛋白酶研究。这些网站的最良好开发的包括磷酸化多样(www.phosphosite.org. )(
      • 哈贝克P.V.
      • Kornhauser J.M.
      • TKachev S.
      • 张B.
      • Skrzypek E.
      • 默里B.
      • Latham V.
      • Sullivan M.
      磷化普普斯:一种综合资源,用于研究实验确定人和小鼠的翻译后修饰的结构和功能。
      )和磷脂。(Phospho.elm.eu.org)(
      • Dinkel H.
      • Chica C.
      • 通过A.
      • gould c.m.
      • Jensen L.J.
      • 吉布森T.J.
      • Diella F.
      Phospho.elm:磷酸化站点的数据库 - 更新2011。
      )。这些网站目前依赖于收获的论文的作者,使本地化正确。然后,网站的用户通过依赖于多篇论文中的证实站点观测或完全排除高吞吐量数据来筛选结果的能力有限。 Phosida(www.phosida.com.)传播在Matthias Mann实验室的研究中出现并局限于出版物的修饰网站(
      • GNAD F.
      • Gunawardena J.
      Phosida 2011:后期修改数据库。
      )。结果,通过公共软件平台分析了对所识别的站点的所有MS / MS谱都是通过共同的软件平台进行分析的,并进行一致的评分阈值。因为LC-MS / MS生成的发布修改本地化被知识库所收获和潜在错误阻碍其他研究人员的下游使用这些信息,如果产生和分析LC-MS / MS数据的研究人员将更好地关闭err在设定识别/定位阈值时在保守侧。因此,对于特定肽谱匹配的模糊修改定位决定是更优选的,以使其错误。随着来自PTM研究的更多原始LC-MS / MS数据被存放在公共领域,无论是作者的要求还是自愿行动,知识库都越来越多地进行努力将数据重新处理数据与最近的算法和评分指标进行重新处理数据并对他们传播的信息执行统一的质量标准。

       网站评分工具的基准和比较

      如前所述,基准测试站点本地化软件性能的唯一可靠方法是通过分析答案所知的数据集。通过对180个合成磷酸肽的分析产生这种数据集,其中获取每种肽的许多MS / MS光谱以产生大的光谱数据集(
      • Savitski m.m.
      • Lemeer S.
      • Boesche M.
      • 朗米
      • Mathieson T.
      • Bantscheff M.
      • Kuster B.
      使用吉祥物三角洲评分的自信磷酸化站点定位。
      )。在这项研究中,他们将吉祥物Delta评分与A分数进行比较,以分析在Q-TOF微质谱仪上获取的数据,其产生低质量精度(±0.4DA)四极型CID数据。在随后的研究单反评分中,也在同一数据集上进行评估(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。比较表明,在将分数分配到网站本地化的方面,评分是最保守的(它报告了73%的肽ID的网站定位评分,而吉祥物δ分数和88%的滑坡分数为85%) 。然而,报告的网站,SLIP评分具有最低的FLR(6.3%,与8.7%使用A-Score和10.9%使用Mascot Delta得分)。
      应该注意的是,这些值表示具有任何得分的结果,而在实践研究人员通常会对这些工具中的每一个采用分数阈值,因此结果的可靠性将高于这些值(以及报告网站定位的肽的百分比会降低)。然而,这些数字可能代表了这些工具的相对性能的趋势。 a-score(和ptm-score)仅考虑B和Y离子,假设修改将存在于碎片上。滑动评分和吉祥物三角洲评分也可能考虑其他离子类型(取决于指定的仪器类型); 例如 滑动评分和吉祥物三角洲评分将为水或磷酸盐损失峰提供一些重量。这可能是为什么吉祥物Delta评分和滑移评分报告网站本地提出的解释,所述磷酸肽光谱比较比评分比得分更高。至少在滑动评分的情况下放心,使用这些额外的峰值似乎没有对网站本地化的整体可靠性产生不利影响。
      在最近的一篇文章中,描述了磷光体的发展并与其他磷化物本地化方案进行基准测试,作者试图将各种程序放在同一播放领域,以检查各种解离方法产生的数据,包括CID,HCD和ETD(
      • Taus T.
      • KöcherT.
      • Pichler P.
      • Paschke C.
      • 施密特A.
      • Henrich C.
      • Mechtler K.
      使用磷光体的普遍和自信的磷酸化位点定位。
      )。从179个合成磷酸肽产生的数据集用于建立达到特定FLR值所需的得分阈值。然后将这些得分阈值施加到基本上更大的数据集(数千种肽)源自HeLa细胞裂解物的磷酸肽富集,以表明磷光体通过定位多达〜7%的磷酸岩磷来表明磷光体优于其他程序。虽然人们通过表明合成肽数据集可能太小并且可能无法充分代表生物模型系统中的序列的分集,但是在没有广泛接受的度量计算每个实验数据集的情况下,可以批评这种比较。这些作者明确试图以合理的方式进行公平比较。此外,在阅读描述新评分算法的论文时,难以在没有某种与现有算法的情况下进行某种比较。

       高质量准确性数据的性能

      需要更高的质量光谱来识别多种肽鉴定所需的修饰位点。提高数据质量的一种方法是测量具有较高质量准确度的片段质量。较高的质量精度可以从噪声峰值中更好地分化真实峰值; IE。 噪声峰值的可能性不太可能被分配为片段离子。它还允许充电状态确定,这进一步减少了假正峰值匹配。
      显然,用于评分和PTM分数的单位质量分辨率模型不太适合这种数据类型。可以增加100个箱内的质量箱数并相应地调节概率。这基本上是膦师的作用(
      • Phanstiel D.H.
      • Brubaugh J.
      • 温格C.D.
      • 田S.
      • Probasco M.D.
      • Bailey D.J.
      • Swaney D.L.
      • Tervo M.A.
      • Bolin J.M.
      • Ruotti V.
      • 斯图尔特R.
      • Thomson J.A.
      • Coon J.J.
      人ES和IPS细胞的蛋白质组学和磷蛋白蛋白酶比较。
      )。然而,当您缩小质量箱的大小时,可以观察到所有质量箱的假设变得越来越缺陷。如果箱的粒度增加,则给定分数的重要性也将大幅度地变化,以便高分辨率数据(识别相同数量的峰值产生更高的分数)。如果假设单元质量分辨率的模型未被改变,则分数可能具有相同的含义,但您将抛弃对现场定位的质量准确性的所有好处。
      由于搜索引擎可以在其得分中隐含地使用质量准确性,因此对搜索引擎差分评分的影响更加复杂。如果他们在得分中完全使用大规模准确性,那么E值差异应该具有相同的可靠性衡量所有数据类型的可靠性。通过比较HCD的±0.5Da至±0.02DA(以下)将本主题部分评估了吉祥物δ评分。
      • Savitski m.m.
      • Lemeer S.
      • Boesche M.
      • 朗米
      • Mathieson T.
      • Bantscheff M.
      • Kuster B.
      使用吉祥物三角洲评分的自信磷酸化站点定位。
      )。发现可以采用较低的吉祥物Δ得分阈值来用于较高的质量准确性搜索(并且可以可靠地识别出更多的网站)。在我们自己的手中,我们发现滑移得分阈值比吉祥物Delta得分结果更高,较低的质量准确性数据更为相似;较高的质量准确度数据通常导致更大的滑移分数,因为匹配给定峰值以更高的质量精度具有更高的统计学意义,但是给定分数的可靠性似乎相对相似。
      有一点值得注意的是,具有更高的质量准确性数据,使用较低的阈值/更大的峰值列表进行搜索可能更安全,因为噪音峰值不太可能成为假正峰匹配中的问题。

       不同PTM的性能

      已经使用现场定位软件的大部分结果是磷酸肽数据集。当分析其他PTM时,这些软件的性能可能会有所差异吗?由于分数基于观察到的峰值的数量,因此答案取决于修改是否会产生额外的离子类型。如果评分系统重量 例如 磷酸盐损失峰,当用于不产生损失离子的改性时,分数可能具有略微不同的含义。不幸的是,难以测试这一点,因为目前没有大规模的合成肽与磷酸化以外的PTMS的大数据组。
      如前所述,创建已知修改站点的数据集的另一种策略是过滤到仅包含一个可修改残留物的肽的PTM数据,然后执行允许改变诱饵残留物的搜索。这是在内部尝试的 O-GLCNAC修改数据集识别超过六千多种修改的光谱(描述了描述此数据集的稿件正在审查)。然而,当仅在含有单个可变性残基(丝氨酸或苏氨酸)的那些Spectra中提取时,只有170个光谱,其中六个报告的诱饵残留物与滑坡得分相匹配,这显然不足以来自来自的任何有意义的统计数据。这个问题的一个重要因素是周围的序列偏好 O-glcnacylation。虽然O-GlcNAc转移酶没有明确定义的基序,但修饰位的两侧上发现的最常见的氨基酸是其他丝氨酸和苏氨酸。 (
      • Chalkley R.J.
      • Thalhammer A.
      • Schoepfer R.
      • 伯灵名A.L.
      用电子转移解离质谱法在天然肽上鉴定蛋白质O-甘露苯基化位点。
      )在该数据集中仅3.1%的GlcNAc修饰肽含有单一可改性的残余物,而当使用该策略的磷酸肽数据时,含有7.5%的磷酸肽序列含有单一丝氨酸,苏氨酸或酪氨酸(
      • 贝克P.R.
      • 特立尼达J.C.
      • Chalkley R.J.
      修改站点本地化评分集成到搜索引擎中。
      )。这突出显示修改的序列图案可以对定位修改位点的能力产生显着差异。
      那么哪些类型的修改会产生最大的挑战?当网站本地化的最小信息通常存在以下内容时:(1)质谱仪中非常不稳定的修改,通常是糖基化和硫化等O版本(尽管这些在ECD和ETD数据中的问题较少); (2)在许多常见氨基酸上可能发生的修饰; 例如 磷酸化; (3)肽末端和氨基酸侧链上可以发生的修饰; 例如 乙酰化可以在蛋白质和肽N末端以及赖氨酸侧链上发生:由于低质量区域缺失,在离子捕集CID碎片光谱中特别有问题。关于这些修改定位工具的一个重要点是用户表明哪种氨基酸类型可以承受特定的修饰,因此如果改性是在没有表明的残留物中; 例如 如果用户正在寻找赖氨酸甲基化,但不允许精氨酸,天冬氨酸或谷氨酸甲基化,然后结果可能是不可靠的。

       代表歧义

      对于某些光谱,不可能可靠地确定修改的部位,采用不同的策略来报告这种结果。在PTM评分和磷光体的情况下,针对每个潜在站点报告置信度量,并且它被向用户留给用户,以确定他们希望接受的可靠性阈值。在滑动评分的情况下,列出了作为可接受的分数阈值集的所有潜在站点本地化,而不指示其中哪一个比其他方式更可能。在评分或吉祥物Delta评分的情况下,最可能的本地化被标记为低分,而不会指示下一个最佳站点本地化是什么。
      蛋白质探测器输出的独特特征是,如果用户点击肽序列,则对于具有模糊站点本地化的光谱,它将自动将不同的站点本地提出绘制到相同的频谱上,从而允许结果的视觉比较并突出显示任何歧视性峰值(参见 Fig. 5)。这允许轻松评估模糊频谱,尽管如果允许用户干预作为验收标准的一部分,它将为报告的结果引入不一致的可靠性措施。
      图缩略图GR5.
      Fig. 5修改网站本地化替代品的视觉比较。 蛋白质proSpector自动显示所采用的滑动得分阈值内所有潜在站点本地化的注释。在此,指示不同站点本地化之间的鉴别峰值。以红色标记的峰是通过两个解释解释的,但是仅显示离子本地化以用于辨别峰值。在该实施例中,磷酸化对残基12或苏氨酸14的丝氨酸的本地化在光谱中的40个峰值中解释出26个。对于对应于频谱中存在的两种解释的Y7离子,这可能是在两个不同位点上修饰的肽的混合谱。

      结论

      修改站点评分软件的可用性大大提高了发布的网站的一致性和可靠性。在计算这些措施的两个最常见类型的策略中,基于搜索引擎的方法应该更好地利用质量准确性和不同修改的不同碎片行为,因此应该更敏感。但是,使用这些策略的给定分数的含义更有可能与数据集的数据不同。在所有情况下,由于目前没有用于测量结果的FLR的简单方法,必须假设从标准数据传输到实验数据时得分具有一致含义。
      希望在不久的将来,更多标准的PTM数据集将变为可用,以便为其他类型的数据和PTMS提供更多严格的网站本地化工具基准。这些工具的集成到数据库中搜索引擎结果是一个重要的提前,因为大多数已经写入此任务的其他工具都使用类似于本文中描述的策略,因此软件重新实现策略经常重新实现策略是为了从替代搜索引擎或碎片类型处理不同的文件格式而开发。如果提出的标准文件格式为搜索引擎结果(
      • 艾森凯母线
      mzidentml:开放的社区内置标准格式,用于蛋白质组学谱识别算法的结果。
      )变得更广泛地使用,这也将允许整合工具,并将使所有研究人员更轻松地报告其修改结果的可靠性措施。

      致谢

      我们要感谢Paul Rudnick,Katalin Medzihradszky和Peter Baker进行有用的讨论。

      参考

        • Pawson T.
        • 斯科特J.D.
        信号传导50岁和计数中的蛋白质磷酸化。
        趋势生物化学。 SCI。 2005; 30: 286-290
        • Boersema P.J.
        • 穆罕默德S.
        • Heck A.J.
        质谱分段和分析质谱法。
        J.质谱。 2009; 44: 861-878
        • Grimsrud p.a.
        • Swaney D.L.
        • 温格C.D.
        • Beauchene N.A.
        • Coon J.J.
        群体的磷蛋白质。
        ACS Chem。 BIOL。 2010; 5: 105-119
        • 哈特G.W.
        • Housley M.P.
        • Slawson C.
        O-连接的β-N-乙酰淀粉胺在核细胞质蛋白上循环。
        自然。 2007; 446: 1017-1022
        • 相反p.
        • Dhayalan A.
        • 马蹄
        • jeltsch a。
        蛋白质赖氨酸甲基转移酶的特异性及其检测非组蛋白赖氨酸甲基化的方法。
        摩尔。 Biosyst。 2008; 4: 1186-1190
        • 赵某。
        • 徐W.
        • 江W.
        • yu w.
        • 林Y.
        • 张T.
        • 姚杰。
        • 周L.
        • 曾Y.
        • 李H.
        • 李Y.
        • 施J.
        • W.
        • 汉考克三。
        • 秦立
        • Chin J.
        • 杨P.
        • 陈X.
        • 雷Q.
        • 熊Y.
        • 关卡。
        蛋白质赖氨酸乙酰化对细胞代谢的调节。
        科学。 2010; 327: 1000-1004
        • Kirkpatrick D.S.
        • 丹尼斯C.
        • Gygi S.P.
        泛素称重:基于质谱的蛋白质组学的扩张作用。
        NAT。细胞生物。 2005; 7: 750-757
        • Strahl B.D.
        • Allis C.D.
        共价组蛋白修饰的语言。
        自然。 2000; 403: 41-45
        • Zeidan Q.
        • 哈特G.W.
        O-Glcnacylation和磷酸化之间的交叉点:多信号途径的影响。
        J. Cell SCI。 2010; 123: 13-22
        • 赵玉。
        • Jensen O.N.
        修饰特异性蛋白质组学:使用富集技术表征翻译后修改的策略。
        蛋白质组学。 2009; 9: 4632-4641
        • eliasj.e.
        • Gygi S.P.
        目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
        NAT。方法。 2007; 4: 207-214
        • Savitski m.m.
        • Lemeer S.
        • Boesche M.
        • 朗米
        • Mathieson T.
        • Bantscheff M.
        • Kuster B.
        使用吉祥物三角洲评分的自信磷酸化站点定位。
        摩尔。细胞蛋白质组学。 2011;
        • 贝克P.R.
        • 特立尼达J.C.
        • Chalkley R.J.
        修改站点本地化评分集成到搜索引擎中。
        摩尔。细胞蛋白质组学。 2011; (M111.008078.)
        • Cox J.
        • Neuhauser N.
        • Michalski A.
        • 施泰米r.a.
        • 奥尔森J.V.
        andromeda:肽搜索引擎集成到最大环境中。
        J.蛋白质组。 2011; 10: 1794-1805
        • albuquerque c.p.
        • Smolka M.B.
        • Payne S.H.
        • BAFNA V.
        • ENG J.
        • 周H.
        深入磷脂蛋白酶体分析的多维色谱技术。
        摩尔。细胞蛋白质组学。 2008; 7: 1389-1396
      1. Spectrum Mill - Agilent Technologies Inc .;可从: http://www.chem.agilent.com/en-US/Products/software/chromatography/ms/spectrummillformasshunterworkstation/pages/default.aspx

        • Beausoleil S.A.
        • VillénJ.
        • 格柏S.A.
        • 赶紧J.
        • Gygi S.P.
        基于概率的高通量蛋白磷酸化分析和现场定位方法。
        NAT。 Biotechnol。 2006; 24: 1285-1292
        • 奥尔森J.V.
        • Blagoev B.
        • GNAD F.
        • MACEK B.
        • Kumar C.
        • Mortensen P.
        全球性,体内和现场特异性磷酸化动力学中的信令网络。
        细胞。 2006; 127: 635-648
        • 罗滕贝格B.E.
        • Pisitkun T.
        • Knepper M.A.
        • Hoffert J.D.
        磷源:用于MSN数据的开源磷酸化站点分配工具。
        J.蛋白质组。 2008; 7: 3054-3059
        • Bailey C.M.
        • 甜蜜的三个
        • Cunningham D.L.
        • Zeller M.
        • Heath J.K.
        • Cooper H.J.
        SLOMO:从ETD / ECD质谱的自动化网站定位修改。
        J.蛋白质组。 2009; 8: 1965-1971
        • Swaney D.L.
        • 温格C.D.
        • Thomson J.A.
        • Coon J.J.
        人胚胎干细胞磷脂蛋白酶通过电子转移解离串联质谱法揭示。
        Proc。 Natl。阿卡。 SCI。美国。 2009; 106: 995-1000
        • Taus T.
        • KöcherT.
        • Pichler P.
        • Paschke C.
        • 施密特A.
        • Henrich C.
        • Mechtler K.
        使用磷光体的普遍和自信的磷酸化位点定位。
        J.蛋白质组。 2011; 10: 5354-5362
        • 爱德华兹N.
        • 吴X.
        • tseng c.w.
        一种无监督,无模型,机器学习组合器,用于来自串联质谱的肽标识。
        临床。蛋白质组学。 2009; 5: 23-36
        • Bradshaw R.A.
        • 伯灵名A.L.
        • 卡车。
        • Aeberberold R.
        报告蛋白质识别数据:下一代指南。
        摩尔。细胞蛋白质组学。 2006; 5: 787-788
      2. Rudnick, P. A., Askenazi, M., Clauser, K. R., Lane, W. S., Martens, L., McDonald, W. H., Mertins, P., Meyer-Arendt, K., Searle, B. C., Kowalak, J. A., Proteome Informatics Research Group 2010 Study. Available from: http://www.abrf.org/index.cfm/group.show/ProteomicsInformaticsResearchGroup.53.htm

        • Phanstiel D.H.
        • Brubaugh J.
        • 温格C.D.
        • 田S.
        • Probasco M.D.
        • Bailey D.J.
        • Swaney D.L.
        • Tervo M.A.
        • Bolin J.M.
        • Ruotti V.
        • 斯图尔特R.
        • Thomson J.A.
        • Coon J.J.
        人ES和IPS细胞的蛋白质组学和磷蛋白蛋白酶比较。
        NAT。方法。 2011; 8: 821-827
      3. Paparml。可从: //edwardslab.bmcb.georgetown.edu/pymsio/.

        • Huttlin E.L.
        • Jedrychowski M.P.
        • eliasj.e.
        • Goswami T.
        • RAD R.
        • Beausoleil S.A.
        • VillénJ.
        • 哈斯W.
        • Sowa M.E.
        • Gygi S.P.
        小鼠蛋白磷酸化和表达的组织特异性地图。
        细胞。 2010; 143: 1174-1189
        • nesvizhskii a.i.
        霰弹枪蛋白质组学中肽和蛋白质鉴定的计算方法和误差率估算程序调查。
        J.蛋白质组学。 2010; 73: 2092-2123
        • 德意曲e.w.
        串联质谱谱库和库搜索。
        方法mol。 BIOL。 2011; 696: 225-232
        • 哈贝克P.V.
        • Kornhauser J.M.
        • TKachev S.
        • 张B.
        • Skrzypek E.
        • 默里B.
        • Latham V.
        • Sullivan M.
        磷化普普斯:一种综合资源,用于研究实验确定人和小鼠的翻译后修饰的结构和功能。
        核酸RES。 2012; 40 (数据库问题): D261-D270
        • Dinkel H.
        • Chica C.
        • 通过A.
        • gould c.m.
        • Jensen L.J.
        • 吉布森T.J.
        • Diella F.
        Phospho.elm:磷酸化站点的数据库 - 更新2011。
        核酸RES。 2011; 39 (数据库问题): D261-D267
        • GNAD F.
        • Gunawardena J.
        Phosida 2011:后期修改数据库。
        核酸RES。 2011; 39 (数据库问题): D253-D260
        • Chalkley R.J.
        • Thalhammer A.
        • Schoepfer R.
        • 伯灵名A.L.
        用电子转移解离质谱法在天然肽上鉴定蛋白质O-甘露苯基化位点。
        Proc。 Natl。阿卡。 SCI。美国。 2009; 106: 8894-8899
        • 艾森凯母线
        mzidentml:开放的社区内置标准格式,用于蛋白质组学谱识别算法的结果。
        方法Mol Biol。 2011; 696: 161-177