寻找嵌合体:一种生物信息学策略,用于鉴定交联肽*

  • 飞克西亚楚
    脚注
    隶属关系
    大众光谱设施,加利福尼亚州旧金山加州大学药学化学系94143
    搜索本作者的文章
  • Peter R. Baker.
    隶属关系
    大众光谱设施,加利福尼亚州旧金山加州大学药学化学系94143
    搜索本作者的文章
  • Alma L. Burlingame.
    隶属关系
    大众光谱设施,加利福尼亚州旧金山加州大学药学化学系94143
    搜索本作者的文章
  • 罗伯特J.Chalkley
    一致
    应解决对应的通信:大众光谱设施,加利福尼亚大学药物化学部门,箱2240,600第16次圣,RM。 GH-N474A,San Francisco,CA 94143-2240。电话:415-476-5189;传真:415-502-1655;
    隶属关系
    大众光谱设施,加利福尼亚州旧金山加州大学药学化学系94143
    搜索本作者的文章
  • 作者脚注
    *全国卫生研究院全体健康机构NCRR 01614,NCRR 12961和NCRR 15804(全部至A. L.B.)的支持,来自国家的研究资源中心。
    本文的在线版本(可提供 http://www.mcponline.org)含有补充图1和表1和2。
    ‡现代地址:达姆姆大学,达勒姆,NH 03824新罕布什尔大学分子,蜂窝和生物医学科学部。
      化学交联,随后鉴定交联残留物,是探测蛋白质组件的拓扑和相互作用表面的强大方法。在这项工作中,我们展示了一种新的生物信息学方法,使用软件包“蛋白质探测器”中的多个程序模块,极大地促进了化学交联研究中的交联肽的发现。给出了这种方法如何用于定义异二聚体和同型蛋白质复合物中的界面的方法,这两者都提供了与晶体结构密切一致的结果,验证了该方法的可靠性。
      蛋白质在动态蛋白质复合物和互动网络的背景下起作用(
      • Gavin A.c.
      • aloy p.
      • Grandi P.
      • krause r.
      • Boesche M.
      • Marzioch M.
      • RAU C.
      • Jensen L.J.
      • 巴斯克S.
      • 杜马菲尔德B.
      • Edelmann A.
      • Heurtier M.A.
      • 霍夫曼五
      • Hoefert C.
      • Klein K.
      • 哈德克姆
      • Michon A.M.
      • 赫尔德姆
      • Schirle M.
      • remor M.
      • 鲁迪T.
      • 帽子S.
      • 鲍尔A.
      • bouwmeester t.
      • Casari G.
      • 德鲁斯G.
      • Neubauer G.
      • 瑞克准噶。
      • Kuster B.
      • Bork P.
      • 罗素r.b.
      • Superti-Furga G.
      蛋白质组调查显示酵母细胞机械的模块化。
      ,
      • krogan n.j.
      • Cagney G.
      • yu h.
      • 钟德
      • 郭X.
      • Ignatchenko A.
      • 李杰。
      • PU S.
      • Datta N.
      • Tikuisis A.P.
      • 普通T.
      • Peregrín-Alvarez J.M.
      • Shales M.
      • 张X.
      • 戴夫米
      • 罗宾逊M.D.
      • Paccanaro A.
      • 布雷德J.E.
      • 上A.
      • Beattie B.
      • 理查兹D.P.
      • CANADIEN V.
      • Lalev A.
      • 梅纳F.
      • 黄P.
      • Starostine A.
      • Canete M.M.
      • vlasblom J.
      • 吴S.
      • orsi c.
      • 柯林斯S.R.
      • 克兰德兰州
      • haw
      • Rilstone J.J.
      • 甘美k。
      • 汤普森N.J.
      • 穆斯索G.
      • ST Onge P.
      • 纪念圣
      • 林M.H.
      • 堡垒G.
      • Altaf-ul上午
      • Kanaya S.
      • Shilatifard A.
      • o'sheae。
      • Weissman J.s.
      • ingles c.j.
      • 休斯。
      • 帕金森J.
      • Gerstein M.
      • 威达特S.J.
      • Emili A.
      • Greenblatt J.f.
      酵母酿酒酵母中蛋白质复合物的全球风景。
      )。为了获得各种细胞过程的机械洞察力,重要的是设计蛋白质相互作用表面的映射的能力。化学交联是几十年学习蛋白质互动伙伴的既定方法(
      • 黄S.S.
      )最近被联合链接反应产物的结合质谱分析恢复(
      • SINZ A.
      化学交联和质谱法映射三维蛋白质结构和蛋白质 - 蛋白质相互作用。
      )。交联残留物的质谱识别在定义蛋白质相互作用表面时提供了有价值的空间限制。然而,对交联蛋白质组件的蛋白水解消化综合分析是挑战性的。难度主要是由于大多数通用交联试剂与多个残基反应并同时经历竞争的副反应(例如,溶剂),使其失活。这意味着主要反应产物是只有试剂的一端与肽反应的一端,这些反应产物被称为死端改性肽(
      • 席克宁B.
      • 行R.H.
      • 吉布森B.W.
      • 郭X.
      • 年轻米。
      化学交联肽的MS2Assign,自动分配和串联质谱的命名。
      )。为了促进交联物种的检测和分离,已经将各种部分引入包括荧光团的交联试剂中(
      • SINZ A.
      • 王克。
      用荧光交联剂和质谱法测定蛋白质嵌段:在甘氨酸蛋白 - 钙调蛋白复合物中施用。
      ),同位素标签(
      • Müllerd.r.
      • Schindler P.
      • 拖布H.
      • WIRTH U.
      • 弗科霍尔赫。
      • 霍宁S.
      • Steinmetz M.O.
      同位素标记的交联试剂。质谱蛋白相互作用分析中的一种新工具。
      ,
      • Pearson K.M.
      • Pannell L.K.
      • Fales H.M.
      使用同位素多功能法对细胞色素C和核糖核酸酶A的分子内交联实验。
      ),可切割的位点(
      • Bennett K.L.
      • Kussmann M.
      • BjörkP.
      • Godzwon M.
      • Mikkelsen M.
      • SørensenP.
      • Roepstorff P.
      与硫醇可切割的试剂结合差分质谱肽测绘 - 一种评估分子间蛋白质接触的新方法。
      ),亲和力手柄(
      • 胡同S.C.
      • Ishmael F.T.
      • 琼斯D.
      • Benkovic S.J.
      使用新的三官能光交联和亲和试剂在噬菌体T4 DNA聚合酶全酶中进行映射蛋白质 - 蛋白质相互作用。
      ,
      • 赫斯特G.B.
      • Lankford T.K.
      • 肯尼斯S.J.
      具有亲和纯化交联肽的质谱检测。
      ,
      • Trester-Zedlitz M.
      • kamada k。
      • 伯利S.K.
      • Fenyöd。
      • Chait B.T.
      • muir t.w.
      一种探索蛋白质相互作用的模块化交联方法。
      ,
      • itoh Y.
      • CAI K.
      • khorana h.g.
      通过共价交联在光活化的杂皮蛋白和转霉蛋白之间复杂形成的接触位点的映射:使用化学预活性的试剂。
      ,
      • CAI K.
      • itoh Y.
      • khorana h.g.
      通过共价交联在旋转琥珀酸和光活性杂色蛋白之间复杂形成的接触位点的映射:使用可光活性试剂。
      )和串联质谱分析的苄基标记物(
      • 回J.W.
      • 哈特格A.F.
      • Dekker H.L.
      • muijsers a.o.
      • de Koning L.J.
      • de Jong L.
      一种新的交联剂,用于质谱分析蛋白质复合物的季结构。
      )。然而,仅仅掺入这些部分不能区分从掺杂 - 末端改性产品的交联肽(
      • 楚F.
      • 马尔斯斯。
      • Craik C.S.
      • 伯灵名A.L.
      同位素编码和亲和标记的交联(ICATXL):探测蛋白质相互作用表面的有效策略。
      )。
      这些样品的高复杂性需要串联质谱分段数据,以确信交联肽的识别。虽然非常理想的是,用于自动分析交联样品的碎片光谱的可用生物信息学工具远非稳健,主要受到识别来自交联肽物种的组分的碎片的困难。到目前为止,大多数报告的软件都依赖于其不同的同位素图案依赖于含有交联剂的肽的预筛选(
      • rinner o.
      • Seebacher J.
      • Walzthoeni T.
      • 穆勒L.N.
      • 贝克米
      • 施密特A.
      • 穆勒M.
      • Aeberberold R.
      鉴定大序列数据库的交联肽。
      ,
      • 高Q.
      • 薛斯。
      • Doneanu C.E.
      • Shaffer S.A.
      • Goodlett D.R.
      • 纳尔逊S.D.
      pro-crosslink。蛋白质交联和质谱的软件工具。
      ,
      • Maiolica A.
      • Cittaro D.
      • 博尔斯蒂蒂D.
      • Sennels L.
      • Ciferri C.
      • 丁酮C.
      • 穆斯基奥A.
      • Rappsilber J.
      交联,质谱和数据库搜索多素复合物的结构分析。
      )或需要手动输入每个预定的交联肽候选者的峰列表(
      • 席克宁B.
      • 行R.H.
      • 吉布森B.W.
      • 郭X.
      • 年轻米。
      化学交联肽的MS2Assign,自动分配和串联质谱的命名。
      )。刚刚报告了另一种策略,其中批量修改搜索允许识别交联候选人(
      • 辛格P.
      • Shaffer S.A.
      • Scherl A.
      • 霍尔曼C.
      • pfuetzner r.a.
      • Larson Freeman T.J.
      • 米勒S.I.
      • Hernandez P.
      • Appel R.D.
      • Goodlett D.R.
      通过质谱和开放修改搜索策略的蛋白质交联的表征。
      )。它基于选择四向电荷的前体,潜在地是交联肽,然后一次搜索所获得的光谱,以试图确定它们是否是交联肽并鉴定所涉及的序列。在这里,我们在BioInformatics软件包“蛋白质prospector”中使用可用程序提供另一种方法(
      • Chalkley R.J.
      • 贝克P.R.
      • 黄兰
      • 汉森K.C.
      • Allen N.P.
      • Rexach M.
      • 伯灵名A.L.
      综合分析在四极孔选择,四极碰撞细胞,飞行时间质谱仪中获取的多维液相色谱质谱数据集:II。蛋白质探测器的新开发允许对大型数据集进行可靠和全面的自动分析。
      ,
      • Chalkley R.J.
      • 贝克P.R.
      • Medzihradszky K.F.
      • 林恩A.J.
      • 伯灵名A.L.
      深入分析不同仪器类型的串联质谱数据。
      ),允许分析在一个分析中在数据集中获取的所有MS / MS光谱。因此,可以在单一的搜索结果中一起识别未修饰和交联的肽。在所有交联的蛋白质复合物中,我们的新策略导致不仅通过手动分析所识别的所有交联肽,而且也导致了新的交联肽。这些综合结果以更高的吞吐量实现,展示了阐明蛋白质组件结构信息的稳健和综合适用性。

      实验步骤

      连接到FFH-FTSY复合体的研究的所有方法都描述于先前的出版物(
      • 楚F.
      • 山S.O.
      • 猛禽D.T.
      • Alber F.
      • EGEA P.F.
      • stroud r.m.
      • 沃尔特P.
      • 伯灵名A.L.
      通过使用化学交联和串联质谱法解开信号识别颗粒及其受体的界面。
      )。

       材料

      四琥珀酰亚胺(DSS)
      使用的缩写是:
      DSS.
      四琥珀酰亚胺酰亚胺。
      是从皮尔斯购买的。测序级改性猪胰蛋白酶来自Promega。蛋白酶缺陷 大肠杆菌 如前所述,菌株27C7用于表达Gly-Gly-His(GGH)N-末端标记的生态蛋白D137Y(
      • 人M.D.
      • 棕色K.C.
      • 马尔斯斯。
      • Craik C.S.
      • 伯灵名A.L.
      GGH-生态素D137Y二聚体中鉴定的新型蛋白质交联链路。
      )。

       交联反应和质谱分析

      如前所述进行交联反应,SDS-PAGE分离,凝胶凝胶消化和LC-MS / MS分析(
      • 楚F.
      • Maynard J.C.
      • chiosis g。
      • Nicchitta C.v.
      • 伯灵名A.L.
      HSP90伴随HP94的新型季域间相互作用的鉴定。
      )。基本上,在交联复合物的SDS-PAGE分离之后,将二聚体和单体带切片和消化。提取肽,将萃取液干燥至10μL。对于差异LC-MS分析,通过FAMOS自动进样器(LC Packings,Sunnyvale,CA)将1μl等分试样的消化混合物注入最终毛细管LC系统中,并分开75μm×15cm C.18 反相毛细管柱以〜300nl / min的流速。 HPLC洗脱液直接连接到QSTAR Pulsar QQTOF质谱仪的显微电泵源(Applied Biosystem / MDS Sciex,Foster City,CA)。

       使用批处理标签和MS桥的质谱数据分析

      使用分析师QS软件(应用生物系统,福斯特城,加利福尼亚州)获取LC-MS数据。使用Mascot.dll(1.6b20)创建峰值列表,然后在蛋白质勘探器中使用批次标签搜索。最初将数据搜索全文瑞士 - PROD数据库(2008年4月24日,320,363个条目),添加了标记的生态素,FFH和FTSY的序列。需要完全胰蛋白酶肽,允许最多三种错过的切割。使用50和300ppm的前体和片段质量公差,并且认为唯一认为的修饰是甲硫氨酸氧化,蛋白质N-末端乙酰化和肽N-末端谷氨酰胺转化为焦蛋白。蛋白质探测器评分以前发表(
      • Chalkley R.J.
      • 贝克P.R.
      • 黄兰
      • 汉森K.C.
      • Allen N.P.
      • Rexach M.
      • 伯灵名A.L.
      综合分析在四极孔选择,四极碰撞细胞,飞行时间质谱仪中获取的多维液相色谱质谱数据集:II。蛋白质探测器的新开发允许对大型数据集进行可靠和全面的自动分析。
      )如果给定的分数归功于与匹配的离子类型相匹配的分数加权匹配; 例如 Y离子比内部离子多得分。然后如前所述将这些分数转换为期望值(
      • Chalkley R.J.
      • 贝克P.R.
      • Medzihradszky K.F.
      • 林恩A.J.
      • 伯灵名A.L.
      深入分析不同仪器类型的串联质谱数据。
      )通过确定随机答案的分数和计算概率,然后在该分发中计算给定分数的预期值。然后使用样本中所有已识别的蛋白质的登录号列表进行第二个搜索。在该搜索中,还考虑了对赖氨酸和蛋白质n末端的DSS(或双磺基琥珀酰亚胺酰亚胺酰亚胺酰亚胺基)改性。由于自动峰列表生成中的误差,允许在任何片段离子上考虑的+1da的质量偏移,以允许第二同位素被错误地分配为单同步率峰的光谱匹配。除了这些定义的可变修改之外,该搜索还允许允许-100和+4000Da至赖氨酸残基或肽n末端的单个质量修改。片段质量耐受增加至0.25DA,因为平均质量必须用于预测质量修改,因为缺乏对未知修改的元素组成的知识。其他搜索参数与初始搜索相同。初始验收标准要求报告的期望值小于0.1。然后手动验证所有结果。
      然后使用MS-Bridge询问与具有大量质量修饰的肽相当匹配的光谱,蛋白质勘探器中的另一个程序验证。对MS桥的输入包括观察到的交联肽的质量,交联蛋白质的序列,消化中使用的酶,参与交联反应的氨基酸,元素组成链接器桥和要考虑的任何可变修改。该程序返回对应于实验观察到的质量输入的潜在未经修改,修改或交联肽组合的列表。已经鉴定了来自批量标签搜索的交联肽之一,该步骤将提示第二交联肽的标识,并且可以输入第二序列的批次标签结果的MS-产品显示器。将峰值与同一光谱中的两种肽显示峰值(参见 补充图1 例如)。没有与该第二肽的匹配相关的评分,因此用户必须对基于由MS-Bridge返回的第二肽的身份的可能性的可能性相信第二肽分配以及多少从第一个肽的分配的原因峰值现在将解释为来自第二肽的片段。

      结果

      最近,我们在批量标签中开发了一个未指明的质量修改搜索算法,蛋白质探测器包装中的程序,以识别小意外的肽改性(
      • Chalkley R.J.
      • 贝克P.R.
      • Medzihradszky K.F.
      • 林恩A.J.
      • 伯灵名A.L.
      深入分析不同仪器类型的串联质谱数据。
      )。我们认为它也可以是通过将交联的肽部分作为单一肽用大改性的未指定质量的改性来识别交联肽的强大工具(
      • Chalkley R.J.
      • 贝克P.R.
      • Medzihradszky K.F.
      • 伯灵名A.L.
      )(示意图工作流程 Fig. 1)。在蛋白水解消解后,通过LC-MS / MS分析交联蛋白质复合物的肽。首先通过常规蛋白质数据库搜索方法基于未修饰的肽来鉴定蛋白质复合物的组分。然后将该蛋白质清单用作限制数据库,用于未指定的质量修改搜索,寻找具有大修饰的肽,这是可能交联肽产物的肽。可以针对目标诱饵数据库执行搜索以获得可靠性的测量,例如通过针对目标数据库的连接数据库和同一数据库的序列式随机版本(序列反转数据库也可以是)使用蛋白质探测器(
      • eliasj.e.
      • Gygi S.P.
      目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
      )))。在鉴定第一肽部分(Fig. 1,肽a)在交联复合物中,蛋白质促员程序MS-Bridge(
      • 楚F.
      • 山S.O.
      • 猛禽D.T.
      • Alber F.
      • EGEA P.F.
      • stroud r.m.
      • 沃尔特P.
      • 伯灵名A.L.
      通过使用化学交联和串联质谱法解开信号识别颗粒及其受体的界面。
      ,
      • 楚F.
      • Maynard J.C.
      • chiosis g。
      • Nicchitta C.v.
      • 伯灵名A.L.
      HSP90伴随HP94的新型季域间相互作用的鉴定。
      )能够从产生正确的分子量产物的受限制数据库中的蛋白质中报告所有可能的交联肽组合。另一个交联肽组分(Fig. 1,肽B)基于知道第一肽部分的序列来确定(Fig. 1,从批量标签搜索识别的肽A)。然后将交联物种的碎裂光谱匹配 在Silico. 使用MS-Mapice的肽组分的碎片化,这允许显示与多个序列的匹配(见 补充图1 例如)。这允许确认交联产品的识别。
      图缩略图GR1.
      Fig. 1用于鉴定交联肽的示意性工作流程。
      评估灵敏度(能够识别尽可能多的组件)和特异性(尽可能高的替代答案的百分比,因为答案是正确的)的这种新策略,我们首先将其应用于以前特征的系统,异二聚体复合物FFH-FTSY。 FFH和FTSY之间的具体相互作用介导细菌分泌物和膜蛋白的共转化蛋白靶向血浆膜(
      • EGEA P.F.
      • stroud r.m.
      • 沃尔特P.
      将蛋白质靶向膜:信号识别粒子的结构。
      )。我们之前对FFH-FTSY复合物和手动鉴定的交联肽进行了化学交联研究,其仅存在于交联复合物的消化中(
      • 楚F.
      • 山S.O.
      • 猛禽D.T.
      • Alber F.
      • EGEA P.F.
      • stroud r.m.
      • 沃尔特P.
      • 伯灵名A.L.
      通过使用化学交联和串联质谱法解开信号识别颗粒及其受体的界面。
      )。我们特此重新分裂了 Thermus Aquaticus. 使用新的生物信息学方法设置FFH-FTSY数据。在未指定的质量修改搜索中,我们鉴定了22个肽,其具有对应于由交联连接的第二肽(补充表1)。搜索级联数据库的诱饵部分没有匹配。然后使用MS桥阐明其他交联肽组分的同一性。
      在这22种交联物种中,其中七个是梭织的交联,揭示了复合物的相互作用表面,而其他物种是来自FFH或FTSY的intrasubunit交联。在几个小时的数据分析中,所有交联肽都在 T. Aquaticus. 使用新的蛋白质探测器工具也检测到先前通过手动光谱解释识别的FFH-FTSY数据集。此外,报告并通过手动检测报告并确认了新的intrasubunit交联。额外的胃窦内交联的发现并不令人惊讶,因为之前的数据分析重点是仅存在于交联复合物中的肽。然而,它证明了我们的方法的全面性,这具有优于对比较方法的优点,用于较大的多组分蛋白质组件,其中单个蛋白质组分的交联对照将是费力的,有时难以单独获得。
      许多蛋白质组件是同源寡聚物。同源寡聚复合物的化学交联研究遭遇额外的挑战,因为与其序列难以区分。在以前的研究中,我们开发了一种差分LC-MS策略,它使用交叉链接处理但不作为对照的交联亚基,以允许分化interlasubinit交联(
      • 楚F.
      • Maynard J.C.
      • chiosis g。
      • Nicchitta C.v.
      • 伯灵名A.L.
      HSP90伴随HP94的新型季域间相互作用的鉴定。
      )。
      由于蛋白质探测器中的搜索比较程序允许比较不同分析中鉴定的肽的比较,它可用于表征同种寡聚蛋白组件。为了证明这一点,我们进行了同型二聚体“折叠特异性”蛋白酶抑制剂的交联研究Ecotin(
      • 人M.D.
      • 棕色K.C.
      • 马尔斯斯。
      • Craik C.S.
      • 伯灵名A.L.
      GGH-生态素D137Y二聚体中鉴定的新型蛋白质交联链路。
      ),使用DSS,胺反应性交联剂。用N-末端Gly-Gly-His延伸和ASP的生态蛋白突变体(GGH- ecotin D137Y)137 Tyr突变用于本研究。通过SDS-PAGE将交联的同源二聚体与未链接的单体分离,并通过相同的分析方法处理,包括凝胶消化和LC-MS / MS分析,然后进行质量修改和MS桥接分析。在批量标签中进行质量修改后检索多种交联物种;然而,难以在该阶段将IntersubUnit区分开。因此,我们将鉴定的肽与搜索比较中的二聚体和单体样品的分析之间的鉴定肽进行了比较,这导致了五个intersubunit交联的识别( 补充表1)。
      作为示例,批量标签质量修改搜索报告了物种(m/z 670.854+)作为肽Ala132 - arg.142 在lys上大规模增加1387 amu135。然后MS-BRICK然后产生来自与这种交联物种的质量匹配的蛋白质的所有可能的交联肽组合的列表。了解一个组分是肽ALA132 - arg.142,在批量标签质量修改搜索中识别,允许N-末端肽(−3)而且9 (蛋白质具有甘氨酸N-末端标签 - 他附着的甘氨酸,因此第一个甘氨酸在数据库中蛋白质序列开始之前是3个残基,GLY(−3))不确定地鉴定为第二肽组分。通过从vly的片段离子进一步证实该鉴定(−3)而且9 peptide moiety (Fig. 2a)。除了正常的交叉链路之外,我们观察到物种56 Amu含量低于交联的含量(−3)而且9 and Ala132 - arg.142 二肽。 Batch-Tag通过肽部分识别出广泛的碎片离子。含有交联剂部分的片段离子(667.322+ and 708.892+; Fig. 2a)比相应离子低56 amu(695.342+ and 736.882+; Fig. 2b)在正常的交联肽。因此,质量差可能是由于交联剂本身(Fig. 2b)。可以想象,丁酸丁酸酯(代替由Suberate)接头的低水平污染导致形成这种交联物种。虽然该结果没有提供关于生态素二聚体的额外信息,但它举例说明了这种无偏质量修改搜索策略的功率。人们可以预测,可以存在由该丁酸酯接头形成的其他交联产物的低水平。但是,在数据库搜索中没有识别其他人,尽管无法保证为MS / MS分析选择了这些组件。 intersubunit交联映射到野生型生态素的X射线结构上 Fig. 2c。交联结果与晶体结构吻合良好,并在此突变体上进行先前的研究(
      • 人M.D.
      • 棕色K.C.
      • 马尔斯斯。
      • Craik C.S.
      • 伯灵名A.L.
      GGH-生态素D137Y二聚体中鉴定的新型蛋白质交联链路。
      )。
      图缩略图GR2.
      Fig. 2a,交联物种的结构和低能量CID光谱 m/z value of 670.854+ 来自交联的生态素二聚体摘要。包含交联网桥的碎片是着色的 绿色. b,交联物种的结构和低能量CID光谱 m/z value of 656.844+ 来自交联的生态素二聚体摘要。包含交联网桥的碎片是着色的 绿色. c,生态素的晶体结构。 intersubunit交联残留物代表为 品红 (在第1期)或 红色的 (在第2期) stick交联残留物之间的距离显示为 虚线.
      揭示蛋白质相互作用表面的化学交联研究最常对诸如本研究中的二元络合物进行的。然而,这里证明的方法应适用于对较大复合物和更复杂的混合物的分析。为了了解这种生物信息学方法在更复杂的样本背景下的方法,来自FFH-FTSY复杂数据集的峰值列表与来自公共可用的标准蛋白质混合数据集的峰列表(
      • klimek J.
      • eddes J.S.
      • HOHMANN L.
      • 杰克逊J.
      • 彼得森A.
      • Letarte S.
      • Gafken P.R.
      • 凯茨J.E.
      • Mallick P.
      • 李H.
      • 施密特A.
      • Ossola R.
      • ENG J.K.
      • Aeberberold R.
      • 马丁D.B.
      标准蛋白质混合数据库:多样化的数据集,以帮助生产改进的肽和蛋白质识别软件工具。
      ),也在QSTAR质谱仪上获得(QS20060131_S_18MIX_02)。该样品仅含有40个蛋白质,因此组合数据集的分析提供了对这种生物信息学方法在许多非交联蛋白质和肽存在下准确识别交联物种的能力的评估。在不考虑质量修改的情况下对该数据集的初始搜索返回了39个识别的蛋白质的列表,包括FFH和FTSY。然后在批量标签中搜索大量质量修改,然后对针对每种39个蛋白质和随机版的级联数据库进行的组合数据。
      结果分析表明,在先前的分析中鉴定为对仅用于FFH和FTSY的交联物种的光谱几乎均鉴定到相同的肽和质量修饰。然而,所指定的期望值在更保守的范围内为10-30倍。因此,一些报告的预期值为正确的结果大于1.然而,即使在非常高的期望值下,误阳率也很低。例如,在20处设定的最大期望值阈值阈值,报告了总共57个具有大于500da的质量修改的光谱(参见 补充表2)。其中,49与FFH或FTSY匹配,并且所有这些匹配都是在交联数据集中的光谱,而不是标准蛋白质混合物的光谱,尽管标准数据集中有两倍多的光谱作为交联数据(1721 相对 916)。在接近分析后,对于除FFH或FTSY之外的蛋白中的这三种匹配中的三种,报道了一部分正确的肽,但向搜索引擎提供了错误的单同位素峰和/或充电:在碱性磷酸酶和当给定正确的信息时,肌球蛋白肽匹配,这些光谱均与含有相同序列相同序列的未修改版本,以及频谱 m/z 927.733+ 实际上是一种6+前体,如在质量修改搜索中所报告的那样匹配相同胰蛋白酶的延长版本,但也含有单甲基化和二甲基化赖氨酸残基(引入胰蛋白酶中的化学修饰以尝试减少自溶解)。这些结果表明,该软件在从随机结果中分离实际命中仍然相当有效,但预期值计算的绝对值变得毫无意义。该问题是由将概率转换为通过乘以具有正确前体质量的数据库中的肽的数量来进行的预期通过乘以正确的质量的前兆的概率来引起的预期值。如果考虑过大质量范围的任何修改,则与实际可能性的数量相比,考虑的理论肽的数量过于大,因此期望值估计变得不必要地保守。例如,在识别译文交联产品时 m/z 554.304+当仅针对仅考虑的两种交联蛋白序列的批次标签进行批量修饰时,在39蛋白数据库搜索中,考虑了56,948个前体,其实际上比数量更高的值4倍未经修改了整个Swiss-Prot数据库中正确质量的胰蛋白酶肽。然而,对于所有光谱,所考虑的前体数量相同的爆炸是相同的,所以它代表了所有结果的期望值中的相当恒定的转变。因此,使用目标 - 诱饵数据库搜索策略,然后基于这些结果选择合适的期望值阈值,仍然是有效的策略。
      具有鉴定的交联肽光谱,工作流程中的下一步骤是使用MS桥试图预测交联复合物中存在的第二肽。额外蛋白质的存在仅对鉴定第二肽的能力进行了边际效应:对于鉴定的六个诠释蛋白交联肽,对于其中的三个MS桥报报道,仍然只有一个可能的正确分子的第二肽可以从受限制数据库中的39个蛋白形成的重量,两个有两种肽可能性,并且对于现在有三种可能需要考虑的可能性。

      讨论

      在此,我们开发了一种用于对交联蛋白质复合物进行深入分析的生物信息学方法。批次标签未指定的质量修改搜索步骤是全面且不偏见的,并考虑存在的所有类型的肽,包括未修饰的肽,死末修饰的肽和脑内肽和孔肽交联产物。另外,在识别交联肽组分的同时越含有交联侧链的片段离子。因此,我们的方法检索具有较高敏感性和特异性的“嵌合”交联肽,而不是仅考虑未改性的片段离子的电流方法。然而,它目前不考虑含有交联剂的片段离子,但包括肽链的片段(
      • 席克宁B.
      • 行R.H.
      • 吉布森B.W.
      • 郭X.
      • 年轻米。
      化学交联肽的MS2Assign,自动分配和串联质谱的命名。
      )。这些离子类型的分配将是软件的未来发展。
      该策略允许鉴定到目前为止我们已经测试过的所有蛋白质组件的大量交联肽。这种数据分析级别的全面性是重要的,因为复合物内的多个交联的识别提供了用于蛋白质相互作用表面的下游计算建模的有价值的距离约束。此外,批量标签质量修改搜索适用于任何交联剂,包括对本着二硫键连接肽的研究,消除对同位素编码的交联剂的依赖性以及由这些交联剂引入的另外的样品复杂性。这里呈现的两项研究是纯化的二元蛋白质复合物,但我们还模拟了更复杂的混合物,并显示生物信息学策略仍然识别在更复杂的背景中的交联产品。这种方法与复杂程度良好衡量的主要原因是因为,尽管潜在的交联组合的数量随着越来越多的蛋白质呈指数呈指数增长,但我们的策略一次识别复杂的一半,因此增加每个步骤的可能性只是线性增加。蛋白质候选物的增加具有最有害效果的场合是交联复合物中的一种肽是非常短的(2-4个氨基酸)。这种长度的序列可以发生在许多蛋白质中,因此即使可以确定交联肽的序列,也可能将其分配给特定的蛋白质。因为提高了交联肽的测量的质量准确性与MS桥中报道的可能交联组合的减少,高分辨率和质量准确性数据具有有益的大蛋白质复合物。
      所提出的策略目前尚未将匹配与第二肽进行得分,这对于产生可靠性的衡量标准是非常有益的。然而,利用我们的质量修改策略,可以执行随后的搜索,其中鉴定了肽之一我们指定恰好对应于第一肽的质量的修饰,然后将第二肽识别在数据库中搜索策略。这是我们正在寻求在软件的未来版本中开发的功能。
      所有交联研究的挑战是,感兴趣的产品是高度倒数级的。这里呈现的结果,如大多数生物信息学方法,依赖于选择用于碎片的感兴趣的前体。在我们对更复杂的数据集的模拟中,我们增加了非交联肽光谱的数量,但我们没有模拟问题,如果混合物中有更具未修饰的肽,则交联肽的可能性被选择用于碎片分析的兴趣。通过仅通过较高电荷状态的片段化前体(大多数交联的胰蛋白肽产物将具有两个游离氨基和每种肽中的基本残留物,可以偏向交联产物的碎片选择的前体的选择。它们将最多通常被充电,而未经修饰的胰蛋白肽很少有这种高电荷状态)。然而,通过将标签掺入交联剂中,改性肽的富集策略是最有效的方法(
      • 胡同S.C.
      • Ishmael F.T.
      • 琼斯D.
      • Benkovic S.J.
      使用新的三官能光交联和亲和试剂在噬菌体T4 DNA聚合酶全酶中进行映射蛋白质 - 蛋白质相互作用。
      ,
      • 赫斯特G.B.
      • Lankford T.K.
      • 肯尼斯S.J.
      具有亲和纯化交联肽的质谱检测。
      ,
      • Trester-Zedlitz M.
      • kamada k。
      • 伯利S.K.
      • Fenyöd。
      • Chait B.T.
      • muir t.w.
      一种探索蛋白质相互作用的模块化交联方法。
      ,
      • itoh Y.
      • CAI K.
      • khorana h.g.
      通过共价交联在光活化的杂皮蛋白和转霉蛋白之间复杂形成的接触位点的映射:使用化学预活性的试剂。
      ,
      • CAI K.
      • itoh Y.
      • khorana h.g.
      通过共价交联在旋转琥珀酸和光活性杂色蛋白之间复杂形成的接触位点的映射:使用可光活性试剂。
      )。
      总之,我们的新生物信息学方法和软件工具代表了从化学交联研究中提取最大信息的能力方面的重要一步,并希望促进更广泛地使用这种类型的蛋白质复合结构的策略。这里展示的蛋白质探测器软件在网上公开提供 http://prospector.ucsf.edu.

      致谢

      我们感谢Sami Mahrus和Charles S. Craik在加州大学旧金山提供了Ecotin突变体,GGH- Ecotin D137Y,为这项研究。

      补充材料

      参考

        • Gavin A.c.
        • aloy p.
        • Grandi P.
        • krause r.
        • Boesche M.
        • Marzioch M.
        • RAU C.
        • Jensen L.J.
        • 巴斯克S.
        • 杜马菲尔德B.
        • Edelmann A.
        • Heurtier M.A.
        • 霍夫曼五
        • Hoefert C.
        • Klein K.
        • 哈德克姆
        • Michon A.M.
        • 赫尔德姆
        • Schirle M.
        • remor M.
        • 鲁迪T.
        • 帽子S.
        • 鲍尔A.
        • bouwmeester t.
        • Casari G.
        • 德鲁斯G.
        • Neubauer G.
        • 瑞克准噶。
        • Kuster B.
        • Bork P.
        • 罗素r.b.
        • Superti-Furga G.
        蛋白质组调查显示酵母细胞机械的模块化。
        自然。 2006; 440: 631-636
        • krogan n.j.
        • Cagney G.
        • yu h.
        • 钟德
        • 郭X.
        • Ignatchenko A.
        • 李杰。
        • PU S.
        • Datta N.
        • Tikuisis A.P.
        • 普通T.
        • Peregrín-Alvarez J.M.
        • Shales M.
        • 张X.
        • 戴夫米
        • 罗宾逊M.D.
        • Paccanaro A.
        • 布雷德J.E.
        • 上A.
        • Beattie B.
        • 理查兹D.P.
        • CANADIEN V.
        • Lalev A.
        • 梅纳F.
        • 黄P.
        • Starostine A.
        • Canete M.M.
        • vlasblom J.
        • 吴S.
        • orsi c.
        • 柯林斯S.R.
        • 克兰德兰州
        • haw
        • Rilstone J.J.
        • 甘美k。
        • 汤普森N.J.
        • 穆斯索G.
        • ST Onge P.
        • 纪念圣
        • 林M.H.
        • 堡垒G.
        • Altaf-ul上午
        • Kanaya S.
        • Shilatifard A.
        • o'sheae。
        • Weissman J.s.
        • ingles c.j.
        • 休斯。
        • 帕金森J.
        • Gerstein M.
        • 威达特S.J.
        • Emili A.
        • Greenblatt J.f.
        酵母酿酒酵母中蛋白质复合物的全球风景。
        自然。 2006; 440: 637-643
        • 黄S.S.
        蛋白质共轭和交联化学。 CRC出版社, Boca Raton,FL1991
        • SINZ A.
        化学交联和质谱法映射三维蛋白质结构和蛋白质 - 蛋白质相互作用。
        质谱。录 2006; 25: 663-682
        • 席克宁B.
        • 行R.H.
        • 吉布森B.W.
        • 郭X.
        • 年轻米。
        化学交联肽的MS2Assign,自动分配和串联质谱的命名。
        J.IM。 SOC。质谱。 2003; 14: 834-850
        • SINZ A.
        • 王克。
        用荧光交联剂和质谱法测定蛋白质嵌段:在甘氨酸蛋白 - 钙调蛋白复合物中施用。
        生物化学。 2001; 40: 7903-7913
        • Müllerd.r.
        • Schindler P.
        • 拖布H.
        • WIRTH U.
        • 弗科霍尔赫。
        • 霍宁S.
        • Steinmetz M.O.
        同位素标记的交联试剂。质谱蛋白相互作用分析中的一种新工具。
        肛门。化学。 2001; 73: 1927-1934
        • Pearson K.M.
        • Pannell L.K.
        • Fales H.M.
        使用同位素多功能法对细胞色素C和核糖核酸酶A的分子内交联实验。
        迅速交流。质谱。 2002; 16: 149-159
        • Bennett K.L.
        • Kussmann M.
        • BjörkP.
        • Godzwon M.
        • Mikkelsen M.
        • SørensenP.
        • Roepstorff P.
        与硫醇可切割的试剂结合差分质谱肽测绘 - 一种评估分子间蛋白质接触的新方法。
        蛋白质SCI。 2000; 9: 1503-1518
        • 胡同S.C.
        • Ishmael F.T.
        • 琼斯D.
        • Benkovic S.J.
        使用新的三官能光交联和亲和试剂在噬菌体T4 DNA聚合酶全酶中进行映射蛋白质 - 蛋白质相互作用。
        J.IM。化学。 SOC。 2000; 122: 6126-6127
        • 赫斯特G.B.
        • Lankford T.K.
        • 肯尼斯S.J.
        具有亲和纯化交联肽的质谱检测。
        J.IM。 SOC。质谱。 2004; 15: 832-839
        • Trester-Zedlitz M.
        • kamada k。
        • 伯利S.K.
        • Fenyöd。
        • Chait B.T.
        • muir t.w.
        一种探索蛋白质相互作用的模块化交联方法。
        J.IM。化学。 SOC。 2003; 125: 2416-2425
        • itoh Y.
        • CAI K.
        • khorana h.g.
        通过共价交联在光活化的杂皮蛋白和转霉蛋白之间复杂形成的接触位点的映射:使用化学预活性的试剂。
        Proc。 Natl。阿卡。 SCI。美国。 2001; 98: 4883-4887
        • CAI K.
        • itoh Y.
        • khorana h.g.
        通过共价交联在旋转琥珀酸和光活性杂色蛋白之间复杂形成的接触位点的映射:使用可光活性试剂。
        Proc。 Natl。阿卡。 SCI。美国。 2001; 98: 4877-4882
        • 回J.W.
        • 哈特格A.F.
        • Dekker H.L.
        • muijsers a.o.
        • de Koning L.J.
        • de Jong L.
        一种新的交联剂,用于质谱分析蛋白质复合物的季结构。
        J.IM。 SOC。质谱。 2001; 12: 222-227
        • 楚F.
        • 马尔斯斯。
        • Craik C.S.
        • 伯灵名A.L.
        同位素编码和亲和标记的交联(ICATXL):探测蛋白质相互作用表面的有效策略。
        J.IM。化学。 SOC。 2006; 128: 10362-10363
        • rinner o.
        • Seebacher J.
        • Walzthoeni T.
        • 穆勒L.N.
        • 贝克米
        • 施密特A.
        • 穆勒M.
        • Aeberberold R.
        鉴定大序列数据库的交联肽。
        NAT。方法。 2008; 5: 315-318
        • 高Q.
        • 薛斯。
        • Doneanu C.E.
        • Shaffer S.A.
        • Goodlett D.R.
        • 纳尔逊S.D.
        pro-crosslink。蛋白质交联和质谱的软件工具。
        肛门。化学。 2006; 78: 2145-2149
        • Maiolica A.
        • Cittaro D.
        • 博尔斯蒂蒂D.
        • Sennels L.
        • Ciferri C.
        • 丁酮C.
        • 穆斯基奥A.
        • Rappsilber J.
        交联,质谱和数据库搜索多素复合物的结构分析。
        摩尔。细胞。蛋白质组学。 2007; 6: 2200-2211
        • 辛格P.
        • Shaffer S.A.
        • Scherl A.
        • 霍尔曼C.
        • pfuetzner r.a.
        • Larson Freeman T.J.
        • 米勒S.I.
        • Hernandez P.
        • Appel R.D.
        • Goodlett D.R.
        通过质谱和开放修改搜索策略的蛋白质交联的表征。
        肛门。化学。 2008; 80: 8799-8806
        • Chalkley R.J.
        • 贝克P.R.
        • 黄兰
        • 汉森K.C.
        • Allen N.P.
        • Rexach M.
        • 伯灵名A.L.
        综合分析在四极孔选择,四极碰撞细胞,飞行时间质谱仪中获取的多维液相色谱质谱数据集:II。蛋白质探测器的新开发允许对大型数据集进行可靠和全面的自动分析。
        摩尔。细胞。蛋白质组学。 2005; 4: 1194-1204
        • Chalkley R.J.
        • 贝克P.R.
        • Medzihradszky K.F.
        • 林恩A.J.
        • 伯灵名A.L.
        深入分析不同仪器类型的串联质谱数据。
        摩尔。细胞。蛋白质组学。 2008; 7: 2386-2398
        • 楚F.
        • 山S.O.
        • 猛禽D.T.
        • Alber F.
        • EGEA P.F.
        • stroud r.m.
        • 沃尔特P.
        • 伯灵名A.L.
        通过使用化学交联和串联质谱法解开信号识别颗粒及其受体的界面。
        Proc。 Natl。阿卡。 SCI。美国。 2004; 101: 16454-16459
        • 人M.D.
        • 棕色K.C.
        • 马尔斯斯。
        • Craik C.S.
        • 伯灵名A.L.
        GGH-生态素D137Y二聚体中鉴定的新型蛋白质交联链路。
        蛋白质SCI。 2001; 10: 1549-1562
        • 楚F.
        • Maynard J.C.
        • chiosis g。
        • Nicchitta C.v.
        • 伯灵名A.L.
        HSP90伴随HP94的新型季域间相互作用的鉴定。
        蛋白质SCI。 2006; 15: 1260-1269
        • klimek J.
        • eddes J.S.
        • HOHMANN L.
        • 杰克逊J.
        • 彼得森A.
        • Letarte S.
        • Gafken P.R.
        • 凯茨J.E.
        • Mallick P.
        • 李H.
        • 施密特A.
        • Ossola R.
        • ENG J.K.
        • Aeberberold R.
        • 马丁D.B.
        标准蛋白质混合数据库:多样化的数据集,以帮助生产改进的肽和蛋白质识别软件工具。
        J.蛋白质组。 2008; 7: 96-103
        • Chalkley R.J.
        • 贝克P.R.
        • Medzihradszky K.F.
        • 伯灵名A.L.
        第55届ASMS大众群众会议综合议题和盟国主题,印第安纳波利斯诉讼。 美国质谱协会, 圣达菲,纳米2007 (2007年6月3日至7日摘要189)
        • eliasj.e.
        • Gygi S.P.
        目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
        NAT。方法。 2007; 4: 207-214
        • EGEA P.F.
        • stroud r.m.
        • 沃尔特P.
        将蛋白质靶向膜:信号识别粒子的结构。
        Curr。拍摄。结构。 BIOL。 2005; 15: 213-220