全局膜蛋白蛋白蛋白蛋白酶分析使用 体内 交联和质谱基蛋白质相关性分析*

  • 克服
    脚注
    隶属关系
    基因调节中心,邓迪大学生命科学学院,英国邓迪
    搜索本作者的文章
  • Kathryn J. Kirkwood.
    脚注
    隶属关系
    基因调节中心,邓迪大学生命科学学院,英国邓迪
    搜索本作者的文章
  • 米歇尔廷蒂
    脚注
    隶属关系
    联合王国邓迪大学生命科学生物化学与药物发现司
    搜索本作者的文章
  • Alejandro Brenes Murillo
    隶属关系
    基因调节中心,邓迪大学生命科学学院,英国邓迪
    搜索本作者的文章
  • Michael A.J.弗格森
    隶属关系
    联合王国邓迪大学生命科学生物化学与药物发现司
    搜索本作者的文章
  • Angus I. Lamond.
    一致
    应解决对应的谁:基因调控中心,生命科学学院,邓迪大学,邓德,邓迪,英国。 Tel.:Port.44-01382385473;
    隶属关系
    基因调节中心,邓迪大学生命科学学院,英国邓迪
    搜索本作者的文章
  • 作者脚注
    *这项工作得到了来自惠康信托的补助金(Grant No.083524 / Z / 07 / z,097945 / B / 07 / Z,073980 / Z / 03 / Z,08136 / Z / 03 / Z,0909444 / Z. / 09 / z和090944 / z / 09 / z)和惠康信托授权097045 / b / 11 / z提供基础设施支持。 M.L.是爱丁堡和苏格兰政府个人研究员的皇家学会。
    本文含有补充材料。
    1所用的缩写是:LC-MS / MSLIQUIC色谱 - 串联质谱分析排除色谱法特性Trna LigasexPnPep1XAA-Pro氨肽酶。
    ¶ 这些作者同等贡献这项工作。
      我们使用方法使用体内交联结合HPLC-MS进行全局蛋白质相关性分析对内源蛋白复合物的全局分析。使用变性缓冲剂在色谱分离期间保持复合溶解度的变性缓冲液,用高产率萃取甲醛交联蛋白复合物。除了可溶性配合物之外,我们展示了其有效地检测整体膜和膜相关蛋白质复合物,允许在天然提取物中识别和分析无法接近的络合物。我们将通过HPLC-MS蛋白质相关性分析中检测到的蛋白质复合物与天然和甲醛交联的U2OS细胞提取物进行比较。这些蛋白质组的数据集体内 来自U2OS细胞的交联和天然蛋白质复合物通过可搜索的在线数据库自由获取(www.peptracker.com/epd.)。原始数据也可通过Proteomexchange(标识符PXD003754)获得。
      蛋白质很少用作单体,以进行细胞功能所需的所有生物学方法。基于目前可用的数据集的人蛋白质组内蛋白质 - 蛋白质相互作用总数为~650,000(
      • stumpf m.p.h.
      • Thorne T.
      • de Silva E.
      • 斯图尔特R.
      • 一个H.J.
      • Lappe M.
      • WIUF C.
      估计人类偶联的大小。
      )。考虑到许多蛋白质形成瞬态,或者在可能尚未检测到的完整细胞内的弱相互作用,这可能是低估的。这表明大多数人类蛋白质可以至少在某些条件下参与蛋白质复合物形成。这包括细胞质中的许多良好的可溶性蛋白质复合物,其例示于蛋白酶体,核糖体和细胞骨架网络。它还包括许多膜相关复合物,例如受体酪氨酸激酶信号配合物,整联网网络和跨膜转运蛋白(
      • Schey K.L.
      • 灰色A.C.
      • Nicldayt J.J.
      膜蛋白质的质谱:对水通道蛋白的关注。
      )。为了表征多蛋白复合物在生物调节机制中的许多作用,重要的是具有方便的方法,可以快速有效地分析它们的组成和动力学(
      • 在努力硕士
      • Lamond A.I.
      细胞生物学的多维蛋白质组学。
      )。理想情况下,这些方法应该适用于系统范围的研究,并允许分析内源性蛋白质,而不是专门使用标记和/或过度表达的诱饵。
      可用于蛋白质互动蛋白质相互作用分析的方法已经在过去十年中迅速发展。该字段由基于亲和力的富集的方法,使用标记的构造或特异性蛋白质特异的抗体来支配。另一种方法是 体内 邻近标记,例如,在感兴趣的蛋白质的外源表达上,融合到混杂的生物素 - 连接酶(BioID)(
      • roux k.j.
      • 金D.I.
      • Raida M.
      • 伯克B.
      一种混杂的生物素连接酶融合蛋白鉴定哺乳动物细胞中的近端和相互作用蛋白。
      ),或激活生物素 - 苯酚(顶点)的过氧化物酶(
      • Rhee H.W.
      • 邹诗
      • Udeshi N.D.
      • 马马特J.D.
      • Mootha V.K.
      • carr s.a.
      • ting a.y.
      通过空间限制酶标造影活细胞的线粒体蛋白质组学映射。
      )。虽然这些数据集已经证明非常有用,但有一些缺点。例如,在时间和金钱方面,为产生全球相互作用分析所需的数千个单独的“诱饵”蛋白的巨大费用。此外,这些亲和力富集中的每一个只能以一种类型的缓冲系统进行,这不太可能与维持所有蛋白质蛋白质相互作用相容。分析问题的另一个维度是许多蛋白质表示为不同尺寸的同种型和/或以不同的翻译后修饰的形式,导致形成多个相关但功能明显的复合物,具有不同的互动伙伴组合(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )。单独使用亲和力/下拉方法使得难以解决这种不同形式的相关蛋白质复合物的混合物,使对生物响应机制的详细了解。
      另一种策略涉及蛋白质相关性分布-sms, IE。 用谱法检测的蛋白质分馏谱的相关性,假设常见的络合物中的蛋白质将共用。此方法预先应用于亚细胞细胞器蛋白质蛋白酶的分析(
      • 安德森J.S.
      • Wilkinson C.J.
      • 市长T.
      • Mortensen P.
      • nigg e.a.
      蛋白质相关性分析蛋白质组学表征人中子组。
      ,
      • dunkley t.p.j.
      • Watson R.
      • 格里芬J.L.
      • Dupree P.
      • Lilley K.S.
      通过同位素标记(LOPIT)通过细胞器蛋白的定位。
      ),随后扩展以分析可溶性蛋白质复合物。因此,最近的研究表明,基于色谱的可溶性蛋白质复合物的分离,与馏分收集和高通量液相色谱 - 串联质谱(LC-MS / MS)联合
      使用的缩写是:
      LC-MS / MS
      液相色谱 - 串联质谱法
      尺寸排除色谱法
      焦油
      苏氨酸TRNA连接酶
      xpnpep1.
      XAA-Pro氨肽酶。
      ,促进从单一实验中分析数百种可溶性复合物(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      ,
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      ,
      • 克里斯滕森A.R.
      • Gsponer J.
      • 福斯特L.J.
      一种测量互联术中时间变化的高通量方法。
      )。然而,所有这些研究的限制是用于保护蛋白质 - 蛋白质相互作用的天然萃取条件主要是稳定的可溶性复合物。例如,没有回收与膜中一体的蛋白质(
      • 汉普里斯J.D.
      • 拜伦A.
      • 低音M.D.
      • 克雷格S.E.
      • Pinney J.W.
      • 骑士D.
      • 汉弗里斯M.J.
      整合素相关复合物的蛋白质组学分析将RCC2鉴定为RAC1和ARF6的双调节器。
      )。类似地,具有弱结合蛋白质亚基的可溶性蛋白质复合物可以在细胞裂解时解散和与提取相关的不可避免的稀释度。因此,这种方法对蛋白质复合物的系统范围分析的潜在值受到限制而没有共价系绳以在提取和随后的色谱分离期间保持蛋白质 - 蛋白质相互作用(
      • 金D。 -
      • Sarbassov D.D.
      • 阿里三。
      • 国王J.E.
      • 乳房r.r.
      • Erdjument-Bromage H.
      • Tempst P.
      • Sabatini D.M.
      MTOR与猛禽相互作用以形成向细胞增长机械发出信号的营养敏感复合物。
      )。
      共价蛋白交联已广泛使用以稳定蛋白质复合物,培养的细胞和组织,以便通过显微镜,核苷酸测序或质谱法进行后续分析。用于彼此交联蛋白质的试剂包括能够与氨基酸,核苷酸,碳水化合物或脂质的侧链反应的各种化学基团(
      • SINZ A.
      化学交联和质谱法映射三维蛋白质结构和蛋白质 - 蛋白质相互作用。
      )。这些交联剂的效率随着它们灌注到不间断的细胞/组织和反应的速度时变化,当近于合适的化学基团时。最广泛使用的交联剂之一是甲醛,可逆地形成共价交联以稳定蛋白质 - 蛋白质和蛋白质 - 核苷酸相互作用(
      • 白y.
      • Markham K.
      • 陈F.
      • Weerasekera R.
      • 瓦特J.
      • 霍恩佩
      • Wakutani Y.
      • Bagshaw R.
      • 马修斯下午
      • 弗雷泽P.E.
      • Westaway D.
      • 圣乔治 - 霍尔斯普普P.
      • Schmitt-Ulms G.
      体内 淀粉样蛋白前体蛋白的脑蛋白酶。
      ,
      • Guerrero C.
      • Tagwerker C.
      • Kaiser P.
      • 黄兰
      基于综合的质谱蛋白质组学方法:体内交联蛋白质复合物(Qtax)中串联纯化的定量分析以破译26s蛋白酶体相互作用网络。
      ,
      • kuo m.-h.
      • Allis C.D.
      用于研究动态蛋白的体内交联和免疫沉淀:染色质环境中的DNA缔合。
      ,
      • 奥兰多五。
      通过甲醛交联 - 染色质免疫沉淀映射体内染色体蛋白。
      ,
      • Schmitt-Ulms G.
      • 汉森K.
      • 刘杰。
      • Cowdrey C.
      • 杨杰。
      • 亲爱的S.J.
      • 科恩F.E.
      • Prusiner S.B.
      • Baldwin M.A.
      时间控制的转磁灌注交联用于研究复杂组织中蛋白质相互作用的研究。
      ,
      • Tagwerker C.
      • 轻弹K.
      • 崔米
      • Guerrero C.
      • 窦啊。
      • 奥尔B.
      • Baldi P.
      • 黄兰
      • Kaiser P.
      在完全变性条件下进行两步纯化的串联亲和标签:在泛素分析和蛋白质复合物鉴定中的应用与在VivoCross联系中。
      ,
      • vasilescu J.
      • 郭X.
      • 卡斯特J.
      体内交联和质谱法鉴定蛋白质 - 蛋白质相互作用。
      )。使用甲醛的主要益处之一是由于其尺寸小,它易于渗透完整细胞和组织。使用甲醛的另一个益处是通过加热和随后与基于质谱的蛋白质组分析的相容性和随后的相容性轻松反转交联。
      在此,我们描述了一种基于质谱的蛋白质组学方法,用于高效全局分析蛋白质复合物,包括膜蛋白,使用 体内 蛋白质交联结合变性萃取。使用高分辨率尺寸排阻色谱(SEC)以在变性条件下分离交联复合物和分级蛋白的MS分析,我们可以鉴定膜结合和在天然提取物中无法获得的膜相关复合物。我们介绍了可以使用蛋白质相关性分析MS分析鉴定的蛋白质复合物的详细比较,与U2OS细胞的甲醛交联和天然提取物结合。我们提供对两者的整个蛋白质组数据集的访问 体内 通过可搜索的在线数据库交联和天然U2OSCELL蛋白复合物(http://www.peptracker.com/epd/)。

      实验步骤

       材料

      U2OS细胞购自美国型文化收集(ATCC,Rockville,MD)。 Dulbecco的改良鹰培养基(DMEM),抗生素,抗生素,凝胶,LDS样品缓冲液,MES SDS-PAGE运行缓冲液,硝化纤维素纤维堆,SYPROULESELOT堆栈,SYPRO RUBY,Alexa Fluor 680缀合的二抗,Dulbeccos的磷酸盐从寿命技术(Carlsbad,CA)中获得缓冲盐水(PBS),EZQ蛋白质定量试剂和CBQCA测定试剂盒。 IRDYE 800缀合的二抗是从洛兰免疫化学(Gilbertsville,PA)获得的。 HRP缀合的次生二粒细胞来自细胞信号技术(Danvers,MA)。甲醛Ampules(10mL,甲醇,BCA)测定试剂,Coomassie Plus(Bradford)试剂,洗涤剂去除板,适度的Pepmap C18柱和捕获盒和三锡苄乙基膦(TCEP)(粘结断路器中性pH溶液)来自Thermo Scientific(Waltham,MA)。胰蛋白酶黄金来自Promega。 SEP-PAK TC18 96-WOLE U-PELUTING板来自水域(MILFORD,MA)。 GAPDH初级抗体,完全蛋白酶抑制剂混合物片和奇异磷酸酶抑制剂片来自罗氏(巴塞尔,瑞士)。奥德赛硝酸纤维素膜来自Li-Cor Biosciences(林肯,Ne)。 UltraFree-MC 0.5 mL,0.45μm离心过滤器单元来自Millipore(Billerica,MA)。所有其他材料均可从Sigma(圣路易斯,MO)获得。

       细胞培养

      简而言之,在补充有10%Fcs,100u / l青霉素和100μg/ L链霉素的DMEM中生长U2OS细胞,在37℃下在10%CO中的CO2,并在〜80%的汇合中传代。

       体内交联和变性萃取尺寸排阻色谱

      将粘附的U2OS细胞的每15厘米含量(80%汇合)用冰冷的PBS在冰上洗涤三次,每次洗涤使用20ml。将平板排出,将20ml新鲜制成的PBS中的6%甲醛加入交联蛋白中,并在室温下缓慢混合30分钟。排水后,用20mL 0.1淬灭交联细胞 m Tris-HCl pH 8.0,150米m 在室温下达到10分钟。在完全排出盘子后,将细胞刮在500μl新鲜制备的裂解缓冲液中(4%SDS,100米m NaCl, 10 mm 磷酸钠pH6.0,25米m TCEP, 50 mm N-乙基马来酰亚胺)在室温下。细胞裂解物在室温下以10%的功率分别超声处理30秒,以10%的功率为10%。在17,000×以17,000×离心之前将裂解物加热至37℃。 g 在室温下10分钟。将样品过滤通过0.45μm超薄离心过滤器单元。

       SDS-PAGE和免疫印迹

      对于免疫印迹的零凝集样品,对级分进行Bradford蛋白质定量测定。将20%SDS加入每馏分至2%的终浓度,并加热至65℃,10分钟。组合100μL连续级分,进行氯仿甲醇沉淀(
      • Cox J.
      • 嘿m.y.
      • Luber C.A.
      • Paron I.
      • Nagaraj N.
      通过延迟标准化和最大肽比例提取的精确的蛋白质组无标记量化,称为MAXLFQ。
      )。然后重新悬浮在1×LDS的相等体积中,25米重新悬浮m TCEP使最浓缩级分的最大浓度为1mg / ml,并加热至65℃10分钟。通过EZQ定量测定分析了组合的级分。每条车道为SDS-PAGE加载10μl每馏分。对变性样品进行BCA蛋白质定量。合并相等体积的连续样品(14μL)连续样品,在1×LDS / TCEP中最大为0.1mg / ml。每个车道为SDS-PAGE加载20μl样品。使用MES运行缓冲器的4-12%(W ​​/ V)BIS-TRIS NUPAGE GELS执行SDS-PAGE根据制造商的指示,但添加了25米m TCEP,在LDS样本缓冲液中。根据制造商的说明进行了Sypro Ruby染色。对于蛋白质印迹,分离的蛋白质被电泳转移到IBlot硝酸纤维素膜,或奥氏硝化纤维素膜中,在TBS(TBST)中以0.1%TWEEN-20中的3%非脱脂牛奶封闭,并在TBST中与5%BSA中的原代抗体孵育在4°C下过夜。孵育后,在TBST中洗涤膜三次,并用标记的HRP孵育,或在TBST中的3%非比特脱脂乳中标记的二抗的HRP或alexa Fluor 680 / Irdye 800。使用Immobillon化学发光底物(Millipore)和对HRP标记的二抗的冷却CCD相机(FUJI)进行成像,或者对αFlow680 / IRDYE 800标记的二抗的荷兰犬CLX成像器进行了成像。

       变性尺寸排除色谱,蛋白质消化和肽清理

      使用Dionex Ultimate 3000 Bio-RS UHPLC系统(Thermo Sciencific),将裂解物注入(每次注射100μl)上的生物血糖Sec1000柱(300×7.8mm,5μm,1000孔),与0.2%SDS,100米平衡m NaCl and 10 mm NaPO4 30°C的pH 6.0。 pH 6.0处的缓冲器用于延长柱寿命。流速为0.2毫升分钟−1 对于每个样品,进行两次注射。对于每次注射,使用96孔薄壁的PCR板(Eppendorf)分别收集48×125μL级分,并在PCR机器中加热至95℃,使用加热的盖子将30分钟内加热至95℃,以破坏所有交联。在交联的热反转后,将样品转移至96孔低蛋白质结合深孔板(EPPendorf)和Tris-HCl(1 m 将pH 8.0)加入每馏分至最终浓度为0.1 m 将pH调整为8.0。使用Lysc(注射1)或LysC和胰蛋白酶(注射2)消化每个级分中的蛋白质以肽消化,或者在0.1中稀释 m 基于级分的EZQ蛋白质测定,Tris-HCl并以1:50重量的比例加入,然后在37℃下温育18小时。

       肽清理和定量

      使用96孔洗涤剂去除板(Thermo Sciencific)(Thermo Sciencific)除去肽样品中的SDS,并根据制造商的说明离心。简而言之,将每个孔中的树脂用300μl室温PBS洗涤三次,以1000×离心 g 每次洗涤后除去溶液。将肽样品施加到每个孔中的树脂上,并在室温下通过将滤液(含有清洁肽)在室温下以1,000g离心2分钟,进入96孔低蛋白质结合Depelind板(Eppendorf)之前在室温下孵育2分钟)。然后在将三氟乙酸(TFA)加入到1%(v / v)之后脱盐肽,终浓度,使用SEP-PAK TC18 96-井U-洗脱板(水)纯化肽。在200μl50%(v / v)乙腈0.1%TFA中在200μl50%(v / v)乙腈中洗脱,并在重新悬浮在5%(v / v)甲酸中的旋转蒸发器中蒸发至干。使用CBQCA测定(Thermo Sciencific)和衍生自BSA消化的肽标准物测定肽浓度,在0.1中的肽样品中25倍的稀释后 m 硼酸盐缓冲pH9.3。

       LC-MS / MS和光谱分析

      使用Thermo Fisher Scientific 3000 Rslcnano UHPLC,将5%(v / v)甲酸(最终体积〜10μl)中的肽注射到适当的Pepmap C18纳米捕集柱上。用2%(v / v)乙腈后,0.1%(v / v)甲酸,肽在50cm×75μmc18easyspray逆相分析柱上分解,用梯度从2%乙腈到35 %乙腈超过220分钟,流速为200 nL min-1。通过电喷雾电离在+ 2.0kV下电离肽。使用HCD碎片在Q-辐射质谱仪(Thermo Fisher Scientific)上进行串联质谱分析。数据相关的采集方法在梯度期间在任何一个点处的前30个最丰富的离子上使用了所获取的MS / MS光谱。所有原始MS数据都已沉积在Proteomexchange联盟(http://proteomecentral.proteomexchange.org)通过具有数据集标识符PXD003754的自豪伙伴存储库。使用MaxQuant定量蛋白质组学软件包分析由质谱仪产生的原料数据(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      )(http://www.maxquant.org,1.5.1.3版)。在上面给出的相同标识符下,MaxQuant输出也已上传到Proteomexchange联盟。此版本的MaxQuant包括一个集成的搜索引擎,Andromeda(
      • COX J.R.
      • Neuhauser N.
      • Michalski A.
      • 施泰米r.a.
      • 奥尔森J.V.
      和romeda:肽搜索引擎集成到最大环境中。
      )。使用目标诱饵的策略,肽和蛋白质水平鉴定均设定为1%的假发现率。提供给肽识别的搜索引擎的数据库是在2015年4月17日下载的人类Swissprot数据库,其中包含20,197个蛋白质序列条目。将质量耐受性设定为4.5ppm的前体离子,MS / MS质量耐受设定为20ppm。将酶被设置为LysC(切割C-末端至赖氨酸)或胰蛋白酶(切割C-末端至赖氨酸和精氨酸),最多2个错过的切割。设定为Asn和Gln,Met,Pyro-glu(用肽N-术语Gln),Ser / Thr / Tyr的磷酸化以及蛋白质N-末端乙酰化的脱染,被设定为可变修饰。 Cys上的N-乙基马来酰亚胺被搜索为固定修改。 MaxQuant的输出提供了肽水平数据以及蛋白质组级数据。我们使用了MaxQuant包定义的蛋白质组(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      )。

       实验设计与统计理由

      为此进行了三种生物复制 体内 基于使用基于SEC的分析的先前实验中检测到的差异来选择交联和变性秒分析和这种复制水平(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )。实现对原生的无偏见分析 相对 交联分数,我们从我们以前的U2OS本地证券分析进行了对原始文件的组合MaxQuant分析(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )和这里描述的PFA交联U2OS秒分析。为了在每个实验类型(天然或PFA交联)中的三种生物学重复中的每一个中为单个蛋白质组创建洗脱曲线,我们使用了MaxQuant标签免费定量(LFQ)算法(
      • Cox J.
      • 嘿m.y.
      • Luber C.A.
      • Paron I.
      • Nagaraj N.
      通过延迟标准化和最大肽比例提取的精确的蛋白质组无标记量化,称为MAXLFQ。
      )。

       初始数据处理和基本聚类分析

      使用R语言(3.2.2)执行这些步骤。每个复制的LFQ强度分布使用三个分数滑动平均值平滑,并且每个轮廓的最小值和最大值分别在限制0和1内归一化。每种实验类型中每种蛋白质的平均值和标准偏差( IE。 计算三种生物复制的本机或交联)用于使用GGPLOT2封装进行后续绘制(http://ggplot2.org/),相关性分析,基础聚类和基于机器学习的蛋白质复杂预测。从三个生物重复中,需要在三个重复中至少两种重复中鉴定蛋白质,每次至少有两种肽。从分析中取出标记为污染物或反向击中的蛋白质。每个蛋白质的平均曲线在每个实验型(天然或PFA交联)内分层聚集。使用欧几里德距离测量和“完整”集聚方法,单独执行基本分层聚类,用于分别执行各自的本机和交联数据集。切割针对每个数据集计算的树以产生具有〜0.95的平均Pearson相关系数的簇。

       原生和交联提取物之间已知复合物的比较

      我们将先前注释的蛋白质复合物与珊瑚(
      • Ruepp A.
      • Waegele B.
      • Lechner M.
      • 祝福尔B.
      • Dunger-Kaltenbach I.
      • Fobo G.
      • 弗里什曼G.
      • 蒙特隆C.
      • Mewes H.-w.
      珊瑚:哺乳动物蛋白质复合物的综合资源-2009。
      )或者从基于PCP的分析的对人体细胞的最新分析(
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      ),我们的本地和甲醛交联的U2OS细胞蛋白数据集。对于每种蛋白质复合物,我们确定了我们本地或交联数据集中鉴定的成员蛋白的数量。分析蛋白质复合物,如果鉴定的蛋白质亚基的数量大于或者在天然或交联的数据集中的数量或等于2。对于这些选定的蛋白质复合物,我们确定了复合物中独特蛋白对的所有可能组合之间的中值Pearson相关系数。

       基于机器学习的蛋白质复杂预测

      我们应用了类似于先前用于PCP分析的管道(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )从交联数据集预测蛋白质复合物。首先,我们编译了一个自定义Python脚本来从LFQ强度配置文件中提取峰值。我们使用了scipy包(
      • oliphant t.e.
      Python为科学计算。
      )以适应包含2至8分数的Ricker小波。使用小波的两个最小点来定义峰值范围。此范围之外的任何其他配置文件值设置为0.我们在考虑峰值之前应用了几个过滤器。首先,我们为配置文件的最大信号强度的15%以15%的每个峰设置任意噪声阈值。其次,我们丢弃垂直于与预测分子量值相对应的分馏分布的区域中的峰值近似等于或更低,蛋白质二聚体分子量。第三,我们丢弃空隙区域中存在的峰值(馏分1至4)。第四,我们仅考虑了最大值分离的峰值至少3分数。
      得到的峰型型材用于使用机器学习方法鉴定蛋白质复合物(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )。我们使用了用Scikit-Learn Python包实现的逻辑回归(
      • Pedregosa F.
      • varoquaux g。
      • Gramfort A.
      • Michel V.
      • 硫叶B.
      • Grisel O.
      • Blondel M.
      • Prettenhofer P.
      • Weiss R.
      • Dubourg V.
      • vanderplas j.
      • Passos A.
      • Cournapeau D.
      • 布鲁克米
      • Perrot M.
      • Duchesnay E.
      Scikit-Learn:Python的机器学习。
      )根据6个特征进行峰值对,即:Coopex,标准化的交叉相关(NCC),Pearson相关系数(PCC),字符串分数,嬉皮士分数和Mentha得分。前三个特征纯粹基于峰值轮廓。海普西克被海岸使用 等等。 (
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      )并且基于实验的数量(交联数据集中的重复),其中峰对在相同的峰值级分中显示出最大丰度。对于我们的3个生物学的数据集,可能的Coapex评分为:1(3个重复中的3个),0.6(3个重复),0.3(3个重复中的3个)和0(没有重复)。 NCC衍生成2个步骤。首先,我们计算了两个峰值对p之间的最大交叉相关性1–2CC。然后我们计算了第一峰的最大自交联(P1CC)和第二峰的最大自交联(P2CC)。 NCC最终衍生成P.1–2cc / max(p1CC,P.2CC)。 NCC假设0和1之间的值在两个峰值和从-1到1的值之间计算PCC作为Pearson相关评分,如-1到1的值。另外3个特征来自蛋白质交互数据库,如前所述(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )。这些特征的基本原理是尝试从先前据报道的蛋白质中促进蛋白质在文献中互动的峰对。通过这种情况,我们试图通过机会从可能具有相似的洗脱配置文件的峰值噪音。字符串分数来自字符串数据库(版本10)(
      • Szklarczyk D.
      • Franceschini A.
      • 蜡厂
      • Forslund K.
      • Heller D.
      • Huerta-Cepas J.
      • Simonovic M.
      • 罗斯A.
      • Santos A.
      • Tsafou K.P.
      • Kuhn M.
      • Bork P.
      • Jensen L.J.
      • von mering c.
      字符串v10:蛋白质 - 蛋白质相互作用网络,整合在生命之树上。
      )并标准化为从0到1的值。磁性地区评分来自Mentha数据库(版本06-12-2015)(
      • 坎德隆A.
      • Castagnoli L.
      • Cesareni G.
      Mentha:用于浏览集成蛋白质交互网络的资源。
      )来自Hippie数据库的Hippie评分(版本09-01-15)。 Menthe和Hippie评分的重量从0到1.我们计算出6个特征,用于峰对的所有可能排列,所述峰对在相同的分数±1中显示出最大丰度,创造了1,394,292峰的矩阵(测试组)每对有六个功能。
      对于机器学习,我们首先组装了“金标准”真正的正峰对(GD)的数据集。为了获得这些成对,我们使用了策粒蛋白复合物的Corum数据库,并提取了属于90个络合物的所有峰对,创造了551个独特真实峰对的矩阵。通过551真正峰对的随机抽样提取真正的阴性数据集,在属于不同复合物中的蛋白质的所有可能组合之间的所有可能组合之间。由于可以在这一步骤中引入错误的负相互作用,我们重复了随机抽样100次。最后,使用这些真正的正极和真正的负测试对我们基于相同的真正对成对组装了100个逻辑回归分类器,但是每个使用不同的真正负集合。检查所有分类器以确定10倍交叉验证中ROC曲线的AUC值。 100分类器的概率分数输出的中值值被用作测试集的最终得分。我们选择了0.75的分数截止值,我们导入了这个阈值以上的52,048峰值对,以实现群集算法(
      • nepusz t.
      • yu h.y.
      • Paccanaro A.
      检测蛋白质 - 蛋白质相互作用网络中的重叠蛋白复合物。
      )。我们为具有参数d的群集程序创建了一个搜索矩阵(0.1到1,步骤0.1),发型(0.1到1,步骤0.1)和s固定到2。解析输出以导出最佳获得的参数组合在一起的GD真正正峰的最大数量。

      结果

      为了提高基于蛋白质复合物的全局分析的色谱 - MS的效率,并避免膜复合物的欠料和复合物紧密结合细胞亚结构,我们开发了一种结合的方法 体内 用随后的秒分馏和MS分析之前细胞裂解之前的蛋白质交联(Fig. 1A)。通过首先共价锁定蛋白质 - 蛋白质相互作用 体内,可以使用高度变性缓冲条件最大化蛋白质回收的效率,以基本上溶解细胞提取物中的所有复合物。我们使用人U2OS骨肉瘤细胞系评估了这种方法,该方法被细胞生物学家广泛用于研究细胞响应机制。
      图缩略图GR1.
      Fig. 1蛋白质相互作用的稳定性 体内 交联能够分离蛋白质复合物。 A,用于蜂窝交联,复杂提取和LC-MS / MS方法的工作流程。 B,滴定交联剂浓度施加到U2OS细胞和总细胞裂解物的免疫斑分析,以确定最佳的交联条件。使用具有已知亚单元结构的复合物,每个带的右侧指示每个频带的已知多端结构(n = 3). C,通过Denaturing-Sec分离的交联U2OS细胞的SDS-PAGE分析表明,与用于SDS-PAGE的线性标准(显示在凝胶图像的左侧)(n = 3).
      我们雇用甲醛作为 体内 交联剂,利用其已知的快速高效的细胞渗透和以前的成功应用作为免疫荧光显微镜和染色质免疫沉淀方法的交联剂。为了确定适用于U2OS细胞的甲醛,首先滴定施用粘附的U2OS细胞的浓度,旨在赋予甲醛浓度,导致管蛋白分离为主要的多米 IE。 大于二聚体,同时同时恢复GAPDH,其在不大于四聚体的复合物中(Fig. 1B)。在与TRIS缓冲液中淬灭反应后,在SDS变性缓冲液中萃取细胞蛋白,用于免疫印迹。交联裂解物的这种分析表明,6%甲醛分别给出了最高比例的大量多米和四聚体的回收率,用于标记蛋白微管蛋白-A1和GAPDH(Fig. 1B)。
      为了大规模分离交联蛋白质复合物,使用HPLC尺寸排阻色谱(SEC)。为了最大化蛋白质萃取,在还原条件下,用4%SDS进行变性细胞裂解。将澄清的裂解物注入高分辨率,基于二氧化硅的SEC柱,1000Ångstrom孔隙,允许分离复合物>2MDA。 SEC分离在0.2%SDS的存在下进行,其低于洗涤剂的临界胶束浓度并在分离过程中保持蛋白质溶解度。 48秒馏分的SDS-PAGE分析收集的48秒馏分与标志物复合物的分析一起,表明这实现了跨越平均分子量的有效分离范围>1.8MDA,下降到〜8kda(Fig. 1C)。我们还证实交联在SDS变性萃取和SEC工作流过程中保持了更高分子量复合物的完整性,如通过将衍生自细胞的SEC色谱图和SCS类分析与6%甲醛交联的SEC馏分和SDS-PAGE分析所示。交联(补充图。S1)。
      在这些优化的条件下,在交联后,对U2OS细胞蛋白复合物进行系统分析进行了三种生物重复 体内 6%甲醛(Fig. 1A)。在SDS存在下消化每个级分,用LysC单独使用,或者溶液和胰蛋白酶的组合,以改善序列覆盖率(
      • Swaney D.L.
      • 温格C.D.
      • Coon J.J.
      使用多种蛋白酶对大规模质谱的蛋白质组学的价值。
      )。清洁来自每个秒部分的肽,以在LC-MS / MS分析上除去QexActive质谱仪之前的SDS和盐。为了便于与来自相同U2OS细胞系的基于交联的工作流程与本地复合物的分析的比较,我们同时使用MaxQuant交联的SEC数据集和用于本地蛋白质复合物产生的SEC数据集(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )。这些数据在一起,产生了这些数据>在所有三个复制中检测到120,000种独特的肽(补充表S1)。这些被聚集形成蛋白质组(补充表S2),随后过滤到>4600个蛋白质组,在每个数据集中至少有两个生物重复中检测到至少两个肽(补充表S2)。在每个实验型(天然或交联)中,每个蛋白质组单独计算归一化的LFQ强度。
      比较这种分析方法的效率与我们先前的U2OS可溶性蛋白质复合物分析(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      ),我们首先确定了天然和交联工作流程之间的每种蛋白质的相对丰富。为了确保我们仅分析良好分辨的蛋白质,而不是从SEC柱中的未解决空隙级分中的蛋白质,从分析中除去空隙级分,对交联和天然数据集。通过将每种蛋白质的单独的IBAQ强度除以相同数据集中的所有蛋白质的所有蛋白质的IBAQ强度之和来计算每种蛋白质的分数IBAQ强度。此外,蛋白质分为两组, IE。 那些包含预测的透明度螺旋的人,如使用TMHMM包判断(
      • Krogh A.
      • 拉斯森B.
      • von heijne g.
      • Sonnhammer e.l.l.
      用隐马尔可夫模型预测跨膜蛋白拓扑:完成基因组的应用。
      那些没有的人。然后将这些分数IBAQ值与两个数据集之间进行比较,显示出强相关(>0.8)对于那些没有预测的跨膜螺旋的蛋白质(Fig. 2A)。然而,仅在交联的样品中检测到含有跨膜螺旋的大多数(〜600)蛋白质(Fig. 2A,跨膜蛋白质以红色突出显示)。此外,与天然提取物相比,在交联样品中,在两个数据集中检测到的那些具有跨膜螺旋的蛋白质在交联样品中更大。基因本体细胞组分富集分析显示,专门在交联数据集中检测的〜1000蛋白主要来自细胞器膜,线粒体,内质网,质膜和不溶性级分( Fig. 2B)。令人惊讶的是,进一步的分析表明,大多数具有多个跨膜螺旋的蛋白质仅在交联样品中检测到(Fig. 2C)。
      图缩略图GR2.
      Fig. 2通过整体膜蛋白质检测使能 体内 交联和变性提取。 A,检测到每种蛋白质的分数强度(数据集中的每种蛋白质/所有强度的总和),在天然蛋白质复合物提取(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      ), 或者 体内 从该研究中绘制交联和变性提取物。还示出了仅在天然提取物(虚盒)或仅交联和变性提取物(虚线盒)中检测到的蛋白质。没有预测跨膜(TM)螺旋的蛋白质显示为绿点。具有一个或多个TM螺旋的蛋白质显示为红色圆圈,每个圆的尺寸与每种蛋白质中的TM螺旋的数量成比例。对角线表示数据集之间的等于的分数强度。显示了代表性实验(n = 3). B,仅通过交联和变性提取物检测的蛋白质内富集的GO术语(细胞组分)分析。这 y 轴表示易于分数(-log10 转换为每个GO蜂窝组件术语富集数据集 相对 整个人类蛋白质组,所有术语都有一个 p < 0.001. The x 轴显示仅与每个GO术语相关的交联和变性提取物仅检测到的蛋白质数量。代表每个去术语的圆的尺寸随着仅由交联和变性提取物检测的蛋白质的子集而增加。颜色是随机选择的。显示了代表性实验(n = 3). C,堆叠的直方图显示,在本地蛋白质复合物提取的分数强度范围内,从无到12(在彩色图例中表示)蛋白质的分布,从无到12(以彩色图例表示)。
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )。还示出了仅在交联和变性提取物(虚线盒)中仅检测到的蛋白质的数据。显示了代表性实验(n = 3).
      为了更直接地分析整个交联秒工作流程的性能与本地提取物中鉴定的复合物的先前蛋白质相关性分析相比,我们绘制了一系列众所周知的复合物的洗脱曲线。最初,我们专注于四个整体膜复合物,可能难以使用基于非计的方法来分析。首先,我们检查了血浆膜局部整合蛋白α3-β1异二聚体复合物(Fig 3A),用含有跨膜结构域的这些蛋白质中的每一个,一系列N-聚糖修饰和α3也是棕榈酰胺(
      • 福岛J.
      • makagiansar i.t.
      • stallcup w.b.
      NG2蛋白多糖通过Galectin-3和Alpha3beta1整联蛋白的接合促进内皮细胞运动和血管生成。
      ,
      • 坎贝尔I.D.
      • 汉弗里斯M.J.
      整合素结构,激活和相互作用。
      ,
      • 穆勒S.C.
      • Ghersi G.
      • Akiyama S.K.
      • 唱Q.X.
      • 霍华德L.
      • Pineiro-Sanchez M.
      • Nakahara H.
      • YEH Y.
      • 陈W.T.
      Invidopodia整合素的一种新型蛋白酶对接功能。
      ,
      • 杨X.
      • Kovalenko O.v.
      • 唐W.
      • CLAAS C.
      • 斯蒂普C.S.
      • 升身升降器M.E.
      棕榈酰化支持整合素 - 四胞苷复合物的组装和功能。
      )。这些蛋白质中的每一个仅在天然条件下在空隙级分中检测。然而,在交联数据集中,同一蛋白质的峰被分离并重叠,并且β1整合蛋白还显示出不与α3共面的较小峰。二,线粒体内膜局部米多络合物(
      • Harner M.
      • Korner C.
      • Walther D.
      • Mokranjac D.
      • Kaesmacher J.
      • 威尔彻美国。
      • 格里菲斯J.
      • Reggiori F.
      • Neupert W.
      线粒体接触位点复合体,是线粒体架构的决定因素。
      )在天然条件下未解决,但用交联的方法在〜2 MDA下检测透明的共抑制峰(Fig 3B)。第三,我们检查了群体贩运血浆膜的圈套蛋白质(
      • 庞巴迪J.P.
      • 蒙德森M.
      前进三个步骤,两个步骤:机械洞察组装和拆卸圈套复合物。
      ),具有Vamp2和STx4的含有跨膜结构域和具有C-末端脂质改性的SNAP23,以允许膜关联(Fig 3C)。在天然条件下,VAMP2和STX4仅在空隙分数中检测到并且不良好分辨,只有SNAP23表示清晰的分辨率。相比之下,使用交联工作流程,我们观察到STX4和SNAP23的透明共培养峰,在〜10kDa下,仅在较小的级分中检测到Vamp2,这与先前的数据一致,显示STX4和SNAP23在瞬态三元复杂地层之前形成稳定的复合物。用Vamp2促进膜融合。第四,我们检查了由α,β和γ亚基组成的杂三聚体G-蛋白复合物(Fig 3D)(
      • stryer l.
      • Bourne H.R.
      G蛋白:一系列信号传感器。
      )。使用本机工作流程仅解决了β亚基,其作为单体MW的单个峰被洗脱。相反,使用交联方法在〜200kDa的透明峰中共轭α和β亚基,γ亚基还显示该尺寸区域中的峰。
      图缩略图GR3.
      Fig. 3对膜蛋白复合物分析的天然和交联秒工作流程的比较。 A,血浆膜整合蛋白alpha3-beta1复合物, B,线粒体内膜Micos复合物, C,外毒性stx4-snap23-vamp2 snare复合物, D,血浆膜GNai2-GNB2L1-GNG12 G-蛋白复合物。对于每个复合物,上灰色面板显示来自前一个天然的SEC方法的蛋白质谱(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )40分级分,较低的灰色面板显示来自的曲线 体内 通过该研究的交联和变性提取物,总共48个级分。这 x 轴显示分数数和 y 轴显示标准化的LFQ强度。该线是平均轮廓,周围的功能区显示了三个生物复制的标准偏差(n = 3)。分子量标准的洗脱点显示在KDA中的每个轴下的红色文本中。
      我们观察到许多复合物,可以在天然和交联工作流中被解析为不同的峰值。大多数这些配合物是可溶性细胞溶质复合物,例如包括缩合复合物(Fig 4A),prefoldin复合物(Fig 4B),T-复合物(Fig 4C)和eif3复合物(Fig 4D)。对于这些复合物中的每种复合物之间的天然和交联曲线之间存在一些差异。例如,在交联条件下用多个峰检测为在天然条件下作为单一峰进行分解的伴侣T-复合物。这包括一个主峰>1.8 MDA和900-200 KDA之间的几个较小的峰值。
      图缩略图GR4.
      Fig. 4可溶性蛋白质复合分析的天然和交联秒工作流程的比较。 A,外胚囊泡系骨, B,预介质伴侣络合物, C,tric / cct伴侣复合物, D,EIF3翻译启动因子复杂。对于每个复合物,上灰色面板显示来自前一个天然的SEC方法的蛋白质谱(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )40分级分,较低的灰色面板显示来自的曲线 体内 通过该研究的交联和变性提取物,总共48个级分。这 x 轴显示分数数和 y 轴显示标准化的LFQ强度。该线是平均轮廓,周围的功能区显示了三个生物复制的标准偏差(n = 3)。分子量标准的洗脱点显示在KDA中的每个轴下的红色文本中。
      还有几个复合物在本地条件下似乎很好地解决,但是具有复杂的洗脱曲线,或者没有作为与交联的方法作为完整复合物的洗脱。首先,在天然条件下观察到DNA复制和许可MCM复合物作为单一的峰,但是用交联方法显示多个重叠的峰,可能是因为该络合物与不同尺寸的DNA和染色质复合物的交联(补充图。S2A)。对于U2-SNRNP,观察到类似的结果,其是RNA剪接机械的亚基(补充图。S2B)。在天然条件下观察到HSP90伴侣络合物作为在约500kDa下的单峰,并且还通过交联的方法观察到相似尺寸的峰值。然而,在交联数据集中,在较大尺寸的广泛洗脱模式中,也观察到HSP90复合物,其可能代表与不同基板相互作用的伴随该伴侣(补充图。S2C)。有趣的是,线粒体核糖体28s亚基在天然条件下很好地分解,但仅通过交联的方法在其单体分子量下检测组分蛋白(补充图S2D)。类似地,属于呼吸链的线粒体复合物I的蛋白质仅在其单体分子量与交联方法(补充图S3 )。这表明在线粒体基质中存在的这些复合物在裂解裂解和这里使用的SEC条件下解离,可能是因为它们不充分与所用交联剂浓度/类型充分交联。
      为了开始鉴定先前未知的蛋白质 - 蛋白质相互作用,如前所述(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      ),在不同蛋白质组之间识别高度相似的整个SEC曲线(Pearson相关〜0.95)(补充表S2)。该聚类分析提供了蛋白质可以在整个轮廓上的涂层中相互作用以形成共同复合物的预测。它还显示在U2OS细胞中未检测到先前提出的相互作用的位置, IE。 当它们各自的洗脱轮廓中没有重叠时。使用这些群集以及手动策款,我们观察了许多高度相似的轮廓对。首先,我们观察了天冬氨酸β-羟化酶(Asph)和中胚层显影候选2(MESDC2),两者都是ER-驻留的蛋白质,其功能域位于ER腔中,在交联数据集中的COCLUMERING(Fig 5A)(
      • Hsieh J.C.
      • Lee L.
      • 张L.
      • Weber S.
      • 棕色K.
      • Derossi C.
      • 葡萄酒M.E.
      • Rosenquist T.
      • Holdener B.C.
      MESD编码了LRP5 / 6伴侣,对于小鼠胚胎极性的规范是必不可少的。
      ,
      • Culi J.
      • Springer T.A.
      • 曼R.S.
      低密度脂蛋白受体蛋白中β-螺旋桨/ EGF模块的Boca依赖性成熟。
      ,
      • Dinchuk J.E.
      • focht r.j.
      • Kelley J.A.
      • 亨德森N.L.
      • zolotarjova n.i.
      • Wynn R.
      • neff n.t.
      • 链接J.
      • Huber r.m.
      • 烧伤。
      • 鲁佩达M.J.
      • Cunningham M.R.
      • 卖b.h.
      • 马杰。
      • 斯特恩A.A.
      • 霍利斯G.F.
      • 斯坦·克拉
      • 弗里德曼P.A.
      小鼠表皮生长因子结构域的翻译后阿巴冬酰β-羟基化导致发育缺陷和肠道瘤的发生率增加。
      ,
      • Stenflo J.
      • ohlin a.k.
      • 欧文w.g.
      • 施耐德W.J.
      β-羟基海藻酸或β-羟基己酰胺在牛低密度脂蛋白受体和牛血栓调节蛋白中。
      )。这两种蛋白质对于特异性所需的折叠是少数人类蛋白质中存在的折叠(
      • Hsieh J.C.
      • Lee L.
      • 张L.
      • Weber S.
      • 棕色K.
      • Derossi C.
      • 葡萄酒M.E.
      • Rosenquist T.
      • Holdener B.C.
      MESD编码了LRP5 / 6伴侣,对于小鼠胚胎极性的规范是必不可少的。
      ,
      • Culi J.
      • Springer T.A.
      • 曼R.S.
      低密度脂蛋白受体蛋白中β-螺旋桨/ EGF模块的Boca依赖性成熟。
      ,
      • Dinchuk J.E.
      • focht r.j.
      • Kelley J.A.
      • 亨德森N.L.
      • zolotarjova n.i.
      • Wynn R.
      • neff n.t.
      • 链接J.
      • Huber r.m.
      • 烧伤。
      • 鲁佩达M.J.
      • Cunningham M.R.
      • 卖b.h.
      • 马杰。
      • 斯特恩A.A.
      • 霍利斯G.F.
      • 斯坦·克拉
      • 弗里德曼P.A.
      小鼠表皮生长因子结构域的翻译后阿巴冬酰β-羟基化导致发育缺陷和肠道瘤的发生率增加。
      ,
      • Stenflo J.
      • ohlin a.k.
      • 欧文w.g.
      • 施耐德W.J.
      β-羟基海藻酸或β-羟基己酰胺在牛低密度脂蛋白受体和牛血栓调节蛋白中。
      ),包括一些细胞表面受体的细胞外区域。在未观察到两种蛋白质的天然数据组中,只有在空隙级分中仅检测到,可能因为它含有跨膜结构域,并且在其单体尺寸下检测可溶性MESDC2蛋白。这表明ASPH和MESDC2之间的相互作用较弱,并且需要通过交联稳定才能观察到。对于苏氨酸-TRNA连接酶(TARS)和XAA-PRO氨肽酶1(XPNPEP1)观察到类似的图案,其在交联数据集中是茧状物,但在天然数据集中没有COELUTE(Fig 5B)。先前的研究确定了XPNPEP1和其他几个TRNA连接酶之间的相互作用(
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )。但是,根据我们的知识,此前尚未报告TARS和XPNPEP1之间的互动。
      图缩略图GR5.
      Fig. 5新型膜蛋白相互作用本地与交联秒工作流程的比较。 A,内质网慢慢性网状蛋白酶偶联域伴侣络合物, B,tars-xpnpep1复杂, C,线粒体外膜Tomm70a-Rhot2复合物, D,溶酶体/血浆膜ASAH1-SMPDL3B鞘磷脂素降解复合物。对于每个复合物,上灰色面板显示来自前一个天然的SEC方法的蛋白质谱(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )40分级分,较低的灰色面板显示来自的曲线 体内 通过该研究的交联和变性提取物,总共48个级分。这 x 轴显示分数数和 y 轴显示标准化的LFQ强度。该线是平均轮廓,周围的功能区显示了三个生物复制的标准偏差(n = 3)。如果通过基本的整个轮廓聚类分析进行了Cocluster,则表示群集号。分子量标准的洗脱点显示在KDA中的每个轴下的红色文本中。
      突出了通过在交联数据集的多峰谱内的单峰孔中观察到的新型蛋白质 - 蛋白质相互作用的另外两个实施例。首先,线粒体Rho GTPase 2(Rhot2)和线粒体进口受体亚基(Tomm70A)在〜250kDa的交联数据中共选择(Fig 5C),用这些蛋白质中的每个蛋白质存在于线粒体外膜的外叶上(
      • 面包师M.J.
      • Frazier a.e.
      • Gulbis J.M.
      • Ryan M.T.
      线粒体蛋白质进口机械:与功能相关结构。
      ,
      • 瑞斯克。
      • Fransson A.
      • aspenstrom p.
      miro gtpases:在线粒体运输机械的核心。
      )。仅在天然分离中的空隙分数中仅观察到Rhot2和Tomm70A。二,酸陶瓷酶(ASAH1)和酸 - 鞘磷脂酶样磷酸二酯酶3B(SMPDL3B),在〜50kDa的交联数据中共选择(Fig 5D),许多已知的这些蛋白质中已知在溶酶体内腔或血浆膜中并催化在鞘磷脂转化为鞘氨醇中的连续步骤(
      • Heinz L.X.
      • Baumann C.L.
      • Koberlin M.S.
      • Snijder B.
      • 呕吐。
      • Sharif O.
      • Apalter I.M.
      • Muller A.c.
      • kandasamy r.k.
      • Breitwieser F.P.
      • Pichlmair A.
      • 布鲁克纳M.
      • rebsamen m.
      • Bluml S.
      • Karonitsch T.
      • Fauster A.
      • 大歌j.
      • Bennett K.L.
      • Knapp S.
      • Wenk M.R.
      • Superti-Furga G.
      脂质改性酶SMPDL3B负调节先天免疫。
      ,
      • Koch J.
      • Gartner S.
      • 李下午
      • Quintern L.E.
      • Bernardo K.
      • Levran O.
      • Schnabel D.
      • desnick r.j.
      • Schuchman E.H.
      • Sandhoff K.
      一种编码人酸陶瓷酶的全长互补DNA的分子克隆与表征。鉴定第一个分子病变引起的口岸疾病。
      )。通过先前报道的SMPDL3B-PALALOG鞘磷脂蛋白磷酸二酯酶1(SMPD1)和ASAH1(
      • 他X.
      • okino n。
      • Dhami R.
      • 达坎A.
      • Schulze H.
      • Sandhoff K.
      • Schuchman E.H.
      重组,人酸陶瓷酶的纯化与表征。催化反应和与酸鞘磷脂酶的相互作用。
      )。在本机数据集中检测到ASAH1,也不检测到SMPDL3B。
      为了促进天然和交联数据集之间的更系统的比较,我们使用珊瑚蛋白复合数据库,并鉴定了天然或交联数据集中的两个或更多个蛋白质组分检测的所有珊瑚复合物。这些分析基于来自所有级分的鉴定的蛋白质,并且对于这些复合物中的每一个(康兰数据库中的2,867个络合物中的每一个),所以在每个数据集中的所有可能的蛋白质组件之间计算中值Pearson相关系数。对于每个复杂的复杂,绘制了中值相关性(Fig. 6A补充表S3)揭示了U2OS细胞中的大多数检测到的复合物在两个数据集中具有中值相关性>0.5。另外,仅在交联数据集中检测到甘油复合物的子集(Fig. 6A,红色圆圈)。使用David分析仅交联复合物中的蛋白质进行基因本体细胞组分富集(
      • 黄D.W.
      • 谢尔曼B.T.
      • LEMPICKI R.A.
      用大卫生物信息学资源对大型基因清单的系统和综合分析。
      )使用Revigo工具绘制(
      • Supek F.
      • Bosnjak M.
      • Skunca N.
      • Smuc T.
      Revigo总结并可视化了基因本体论术语的长列表。
      ),我们观察到整体膜和膜相关局部化的清晰富集(Fig. 6B)。我们还使用最近PCP研究预测的复合物进行相同的相关性分析(
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      ),它产生了类似的基于康兰的分析结果(补充表S4)。
      图缩略图GR6.
      Fig. 6基于甘露糖类和交联的蛋白质复杂分析的交联秒工作流程的系统比较。 如果在天然或交联数据集中检测到超过2种蛋白质组分或交联的数据集,则包括在分析中包括甘蔗络合物。 A,从先前的天然蛋白质复合物提取中的单糖复合物的所有蛋白质剖面对计算的中值Pearson相关性(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      ), 或者 体内 来自该研究的交联和变性提取物,被绘制为蓝色圆圈。仅显示仅在交联和变性提取物(虚线内的红色圆圈)中检测到的珊瑚络合物。 B,分析属于来自交联和变性提取物的复合物中的蛋白质内的富集术语(细胞组分)。简化分数的意义阈值<使用了David数据库的0.05(
      • 黄D.W.
      • 谢尔曼B.T.
      • LEMPICKI R.A.
      用大卫生物信息学资源对大型基因清单的系统和综合分析。
      )。使用Revigo Suite绘制丰富的GO术语(
      • Supek F.
      • Bosnjak M.
      • Skunca N.
      • Smuc T.
      Revigo总结并可视化了基因本体论术语的长列表。
      )。 x和y轴表示用于分组相关蜂窝分量的术语的语义空间,更近的气泡更加相关。每个气泡的颜色表示每个GO术语的易分数(LOG10变换) 相对 整个人类蛋白质组。随着与该术语相关的蛋白质数量的越来越多的蛋白质,大小增加,并且随着LOG10的增加,颜色从红色变为蓝色(p value).
      鉴于我们观察到许多显示多个峰的交联蛋白质谱,我们还进行了类似于先前描述的蛋白质 - 蛋白质相互作用预测分析(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )。该分析中的第一步是从交联数据集中的每个轮廓内挑选单个峰,其产生8,620个单独的蛋白质峰(补充表S5)。过滤这些峰值(有关示例,请参阅 补充图S4)除去在空隙级分和蛋白质的单体或二聚体,分子量(补充表S6)。将这些峰作为热图绘制,以提供概述(Fig. 7A)。
      图缩略图GR7.
      Fig. 7基于机器学习的蛋白质复杂预测 体内 交联数据集。 A,Heatmap显示在过滤后从交联数据设定曲线检测到的5,336蛋白峰的平均归一化LFQ强度分布,以除去空隙,二聚体和单体峰。分子量标准的洗脱点显示(在kda中)在图的顶部的红色文本中。相似树被示出为对可视化进行类似的峰。 B,机器学习交互从Corum数据库的所有551真正的正交相互作用峰对的分数分布。红线显示25之间的分数分配TH. 和 75TH. 百分位数。黑点标记95%的置信区间。绘图横跨绘图的垂直绿色线标记为0.75交互预测值得分阈值,这是随后的群集分析中的整个数据所允许的最小分数。 C,由ClarestOne预测的蛋白质复合物,使用Visant可视化为网络地图(
      • 胡Z.
      使用Visant分析网络。
      )。针对每个复合物随机选择颜色。一些已知的蛋白质复合簇用它们的名称或缩写注释。 40s,小核糖体亚基; 60s大核糖体亚基; APC / C,促进复合物的后期; BRISC,BRCC36的异肽酶复合物; CNOT,CCR4 - 不是转录复合物; EIF3,真核翻译开始系数3复合物; EIF4,真核翻译启动因子4复合物; FAK,焦点粘附复合物; GPCR,G蛋白偶联受体; MCM,美学核糖组蛋白复合物; MICOS,线粒体接触位点复合物; PAPSS,双官能3'-磷甲酸甜5'-磷硫酸盐合成酶;猪,GPI酞氢酶复合物; PLC,磷脂酶C; PP1,蛋白质磷酸酶1; PVR,脊髓灰质炎病毒受体; RFC,复制因子C复合体; RNMT,mRNA帽鸟嘌呤-N7甲基转移酶; RAM,RNMT激活迷你蛋白; SMARC,SWI / SNF复合体; Snares,可溶性NSF(N-乙基马来酰亚胺敏感因子)附着蛋白受体; Strn,striatiss; VPS,空间蛋白质分选蛋白。
      在下一步中,我们使用了类似于先前描述的机器学习方法(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )生成单个交互预测评分,其组合多个蛋白质峰值属性与从蛋白质交互数据库检索的信息。使用预测系统(方法中描述)使用>来自Corum数据库的90个金标配合物,其分为551真正的阳性交互对(补充表S7)。在培训预测器之后,这些真正的正对平均得分分配>0.75。因此,我们在整个交联数据集中使用了预测得分阈值以进行正交相互作用>0.75 (补充表S8)。我们向群集算法提供了这些积极的相互作用(
      • nepusz t.
      • yu h.y.
      • Paccanaro A.
      检测蛋白质 - 蛋白质相互作用网络中的重叠蛋白复合物。
      )如前所述(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      ),将这些相互作用对聚集成多蛋白质复合物。这导致预测475个蛋白质复合物(Fig. 7C),包括63个膜复合物和许多其他先前已知的复合物,但也具有多种新的蛋白质相互作用预测(补充表S9)。
      为了便于将这些数据与生物医学研究界共享,除了通过蛋白质组交换存入原始MS数据文件之外,我们还为我们的环保数据库(Peptracker.com/epd)设计了基于Web的界面(
      • 在努力硕士
      • Ahmad Y.
      • Kirkwood K.J.
      • LY T.
      • Lamond A.I.
      使用定量蛋白质组学的蛋白质降解的全局亚细胞表征。
      ),它可以显示来自不同蛋白质基团的SEC洗脱曲线的直接比较。此外,来自我们分析的基本聚类数据以热图形式显示,这些茧颗粒蛋白质可以容易地用作比较SEC洗脱轮廓中的重叠的建议。我们还包括一个方便的链接到String数据库,使得与字符串蛋白质链接的任何节点都可以容易地覆盖。还示出了利益蛋白质的单体的预测分子量,以允许与SEC轮廓图上所示的近似尺寸进行比较。这些工具在一起允许任何研究人员的开放访问,以比较当前U2OS细胞数据集中检测到的任何蛋白质的秒钟洗脱轮廓。

      讨论

      在这项研究中,我们已经表明通过组合 体内 使用甲醛的蛋白质交联,具有变性萃取条件,可以显着改善MS基蛋白质相关性分析的全局分析方法的方法。特别地,这种方法大大提高了整体膜和膜相关蛋白质复合物的回收和检测,以及其他形式的蛋白质复合物,其结合其他细胞亚结构,因此在天然细胞提取物中表示差不多。因此,我们展示了使用该的人U2OS细胞的分析 体内 交联方法现在可以解决和表征许多形式的内源性蛋白质复合物,当分析了天然U2OS细胞提取物的可溶性复合物时未检测到(
      • Kirkwood K.J.
      • Ahmad Y.
      • 在努力硕士
      • Lamond A.I.
      基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
      )。
      我们已将整个U2OS细胞数据集的内源性蛋白复合体集成到方便,可搜索的在线数据库,“蛋白质组动态的百科全书”(http://www.peptracker.com/epd/),提供开放访问来探索并显示任何感兴趣的蛋白质的数据。数据以基于Web的图形界面提供,允许绘制的数千种蛋白质中的每一个,显示三组生物复制的平均值和标准偏差。剖面可以覆盖显示的茧肿大的蛋白质,或者在数据集中检测到的任何其他蛋白质。这提供了一种强大的工具,可以与其他互补信息相结合,例如来自亲和纯化实验的数据,提供潜在的蛋白质 - 蛋白质相互作用的有用预测,以帮助优先考虑进一步的功能研究。此外,用于生成本研究中呈现的PCP数据的所有原始MS文件已寄存在Proteomexchange联盟( http://proteomecentral.proteomexchange.org)通过骄傲的合作伙伴存储库,可用于下载(请参阅方法)。
      膜相关蛋白质复合物和膜蛋白相互作用的分析,通过基于亲和基础的方法,例如免疫沉淀/亲和标签下拉,或使用蛋白质相关性分析方法,如本研究,这一直是提取的需要复杂化来自脂质双层的蛋白质以可溶形式,优选地没有大胶束形成。虽然已经开发了专门的洗涤剂以促进这种提取,但是每种蛋白质复合物将具有不同的提取效率和脆弱性,用于破坏其与每个洗涤剂类型的相互作用。此外,许多膜蛋白质要么是大糖基化,或者有很少的区域能够产生LC-MS相容肽,这两者都有助于它们的分析。
      为了减轻这些问题,同时瞄准蛋白质组覆盖,我们使用了在细胞裂解之前共价锁定在一起相互作用的蛋白质的方法 体内 用甲醛交联。这允许在SDS中使用变性萃取,这有效地溶解了大多数复合物并在分析期间保持溶液中的溶液中。还可以将其掺入工作流中不同的交联剂,例如含有NHS-酯(赖氨酸反应性)和二氮杂胺基团的杂双官能试剂(光活化,与任何氨基酸反应),以增强膜蛋白交联。例如,二嗪交联剂可以与在膜蛋白复合物中普遍存在的许多疏水性氨基酸反应。通过优化交联剂浓度和/或类型,我们认为可以使用这里描述的交联方法分析任何类型的复合物和/或细胞类型。
      然而,使用SDS进行提取的一种结果是,每个复合物内的蛋白质变为变性,从而增加了结构的整体尺寸(横截面积)。对于尺寸排阻色谱,这限制了可用于给定的SEC柱的最大蛋白质复合尺寸,具有较大的络合物进入空隙体积。这种方法的另一个可能结果是产生具有变性的不同范围的复合物,或交联,这将导致峰值扩大。为了最大限度地覆盖蛋白质复合物,对此问题的一种解决方案是使用具有较大孔径的SEC柱,从而可以根据能够解决更大的复合物。替代方案是使用诸如CHAP的洗涤剂,这些洗涤剂在溶解膜蛋白复合物中有效,但没有完全降解所有组分蛋白质(
      • Hjelmeland L.M.
      对膜生物化学的一种裸露的两性离子洗涤剂:设计和合成。
      ),从而有效地减少复杂尺寸和峰值宽度。
      使用本地方法的蛋白质复合物的全局分析仍然具有其益处,包括易于分析可溶性蛋白质复合物的分析以及利用酶促或基于亲和的分离的能力。然而,正如我们这里所示的那样,许多膜蛋白复合物和弱结合的复合物不能检测到,或者需要专门优化的条件以允许从天然提取物检测。相反,这里描述的交联和变性提取方法更有效并且在很大程度上消除了专业优化的需要,除了选择交叉连接器类型和浓度。然而,当我们观察到某些类型的复合物的基于秒的分离时,交联方法可能导致更广泛的峰型。这些包括与RNA / DNA或底物蛋白(例如核糖体/组蛋白和伴侣)结合的复合物。出现这种情况,因为这些配合物将与大尺寸范围的各种混合结构共价交联。在本地条件下,许多这些复合物可以解离或降解,因此产生可能更好聚类的较窄峰。
      这里使用的策略(聚类和机器学习)以分析蛋白质的凝固谱导致蛋白质可以在细胞内普通复合物中存在的预测,但不证明在共递质蛋白之间发生直接相互作用。在这方面,可以将来可以将蛋白质相关性分析方法与使用交联策略结合,以便通过在每个秒分数中通过MS分析进行蛋白质 - 蛋白质交联的直接映射。否则,可以使用其他信息来确认由SEC分析预测的蛋白质复合物的身份,例如,来自现有的文献和数据库(如EPD中提供的链路促进),或通过进一步的实验分析,或两者。
      使用组合 体内 交叉链接-SEC-MS方法,允许在细胞和组织中系统分析大量内源性,未标记的蛋白质,为未来的内源蛋白复合物和对生物刺激和调节机制的差异反应开辟了许多机会。我们在此显示通过使用甲醛交联 体内,现在可以扩展用于表征蛋白质 - 蛋白质相互作用的基于蛋白质 - 蛋白质相互作用的方法,以调节更全面的细胞复合物。特别地,使用交联有助于避免限制未在可溶性的天然提取物中有效地提取和/或分解的复合物检测的偏差。交联还允许检测蛋白质亚基,否则过于弱且从细胞提取物中回收。虽然我们对本发明的人U2OS细胞分析进行了重点,但该方法可以容易地应用于其他细胞系,模型生物和组织样品。例如, 体内 通过将甲醛灌注到小鼠组织中,交联可以与整个生物中蛋白质复合物的研究相结合(
      • Schmitt-Ulms G.
      • 汉森K.
      • 刘杰。
      • Cowdrey C.
      • 杨杰。
      • 亲爱的S.J.
      • 科恩F.E.
      • Prusiner S.B.
      • Baldwin M.A.
      时间控制的转磁灌注交联用于研究复杂组织中蛋白质相互作用的研究。
      )。还可以进一步扩展方法,例如通过使用替代交联剂和/或通过使用与秒正交的替代色谱分离方法(
      • Havugimana Pierre C.
      • 哈特G.T.
      • nepusz t.
      • 杨H.
      • 浮村andrei l.
      • 李Z.
      • 王,佩吉我。
      • Boutz Daniel R.
      • Fong V.
      • Phanse S.
      • Babu M.
      • 克雷格斯蒂芬妮A.
      • 胡诗
      • 万C.
      • vlasblom J.
      • dar v.-u.-n.
      • Bezginov A.
      • 克拉克格雷戈里W.
      • 吴加布里埃尔C.
      • 沃基克·斯科纳J.
      • 耕鹰伊丽莎白r.m.
      • Paccanaro A.
      • Marcotte Edward M.
      • Emili A.
      人类可溶性蛋白质复合物的人口普查。
      ,
      • 万C.
      • Borgerson B.
      • Phanse S.
      • 涂F.
      • 画作家
      • 克拉克G.
      • 熊X.
      • kagan o.
      • kwan J.
      • Bezginov A.
      • Chessman K.
      • PAL S.
      • Croomar G.
      • Papoulas O.
      • ni z.
      • boutz d.r.
      • Stoilova S.
      • Havugimana P.C.
      • 郭X.
      • 麦芽r.h.
      • Sarov M.
      • Greenblatt J.
      • Babu M.
      • 德里W.B.
      • 耕地e.r.
      • 沃林福德J.B.
      • 帕金森J.
      • Marcotte e.m.
      • Emili A.
      古代美佐妥南大分子复合物全景。
      )。
      随着所有这些变化,我们预计 体内 交联色谱 - MS方法可以具有广泛的未来应用,用于蛋白质复合物的全球特征和机械研究及其整个细胞生物学的动力学。

      补充材料

      参考

        • stumpf m.p.h.
        • Thorne T.
        • de Silva E.
        • 斯图尔特R.
        • 一个H.J.
        • Lappe M.
        • WIUF C.
        估计人类偶联的大小。
        Proc。 Natl。阿卡。 SCI。美国。 2008; 105: 6959-6964
        • Schey K.L.
        • 灰色A.C.
        • Nicldayt J.J.
        膜蛋白质的质谱:对水通道蛋白的关注。
        生物化学。 2013; 52: 3807-3817
        • 在努力硕士
        • Lamond A.I.
        细胞生物学的多维蛋白质组学。
        NAT。 Rev. mol。细胞生物。 2015; 16: 269-280
        • roux k.j.
        • 金D.I.
        • Raida M.
        • 伯克B.
        一种混杂的生物素连接酶融合蛋白鉴定哺乳动物细胞中的近端和相互作用蛋白。
        J.细胞Biol。 2012; 196: 801-810
        • Rhee H.W.
        • 邹诗
        • Udeshi N.D.
        • 马马特J.D.
        • Mootha V.K.
        • carr s.a.
        • ting a.y.
        通过空间限制酶标造影活细胞的线粒体蛋白质组学映射。
        科学。 2013; 339: 1328-1331
        • Kirkwood K.J.
        • Ahmad Y.
        • 在努力硕士
        • Lamond A.I.
        基于尺寸 - 分馏的定量蛋白质组学的原生蛋白复合物和蛋白质同种型变异的表征。
        摩尔。细胞。蛋白质组学。 2013; 12: 3851-3873
        • 安德森J.S.
        • Wilkinson C.J.
        • 市长T.
        • Mortensen P.
        • nigg e.a.
        蛋白质相关性分析蛋白质组学表征人中子组。
        自然。 2003; 426: 570-574
        • dunkley t.p.j.
        • Watson R.
        • 格里芬J.L.
        • Dupree P.
        • Lilley K.S.
        通过同位素标记(LOPIT)通过细胞器蛋白的定位。
        摩尔。细胞。蛋白质组学。 2004; 3: 1128-1134
        • Havugimana Pierre C.
        • 哈特G.T.
        • nepusz t.
        • 杨H.
        • 浮村andrei l.
        • 李Z.
        • 王,佩吉我。
        • Boutz Daniel R.
        • Fong V.
        • Phanse S.
        • Babu M.
        • 克雷格斯蒂芬妮A.
        • 胡诗
        • 万C.
        • vlasblom J.
        • dar v.-u.-n.
        • Bezginov A.
        • 克拉克格雷戈里W.
        • 吴加布里埃尔C.
        • 沃基克·斯科纳J.
        • 耕鹰伊丽莎白r.m.
        • Paccanaro A.
        • Marcotte Edward M.
        • Emili A.
        人类可溶性蛋白质复合物的人口普查。
        细胞。 2012; 150: 1068-1081
        • 万C.
        • Borgerson B.
        • Phanse S.
        • 涂F.
        • 画作家
        • 克拉克G.
        • 熊X.
        • kagan o.
        • kwan J.
        • Bezginov A.
        • Chessman K.
        • PAL S.
        • Croomar G.
        • Papoulas O.
        • ni z.
        • boutz d.r.
        • Stoilova S.
        • Havugimana P.C.
        • 郭X.
        • 麦芽r.h.
        • Sarov M.
        • Greenblatt J.
        • Babu M.
        • 德里W.B.
        • 耕地e.r.
        • 沃林福德J.B.
        • 帕金森J.
        • Marcotte e.m.
        • Emili A.
        古代美佐妥南大分子复合物全景。
        自然。 2015; 525: 339-344
        • 克里斯滕森A.R.
        • Gsponer J.
        • 福斯特L.J.
        一种测量互联术中时间变化的高通量方法。
        NAT。 meth。 2012; 9: 907-909
        • 汉普里斯J.D.
        • 拜伦A.
        • 低音M.D.
        • 克雷格S.E.
        • Pinney J.W.
        • 骑士D.
        • 汉弗里斯M.J.
        整合素相关复合物的蛋白质组学分析将RCC2鉴定为RAC1和ARF6的双调节器。
        SCI信号。 2009; 2: ra51
        • 金D。 -
        • Sarbassov D.D.
        • 阿里三。
        • 国王J.E.
        • 乳房r.r.
        • Erdjument-Bromage H.
        • Tempst P.
        • Sabatini D.M.
        MTOR与猛禽相互作用以形成向细胞增长机械发出信号的营养敏感复合物。
        细胞。 2002; 110: 163-175
        • SINZ A.
        化学交联和质谱法映射三维蛋白质结构和蛋白质 - 蛋白质相互作用。
        质谱。录 2006; 25: 663-682
        • 白y.
        • Markham K.
        • 陈F.
        • Weerasekera R.
        • 瓦特J.
        • 霍恩佩
        • Wakutani Y.
        • Bagshaw R.
        • 马修斯下午
        • 弗雷泽P.E.
        • Westaway D.
        • 圣乔治 - 霍尔斯普普P.
        • Schmitt-Ulms G.
        体内 淀粉样蛋白前体蛋白的脑蛋白酶。
        摩尔。细胞。蛋白质组学。 2008; 7: 15-34
        • Guerrero C.
        • Tagwerker C.
        • Kaiser P.
        • 黄兰
        基于综合的质谱蛋白质组学方法:体内交联蛋白质复合物(Qtax)中串联纯化的定量分析以破译26s蛋白酶体相互作用网络。
        摩尔。细胞。蛋白质组学。 2006; 5: 366-378
        • kuo m.-h.
        • Allis C.D.
        用于研究动态蛋白的体内交联和免疫沉淀:染色质环境中的DNA缔合。
        方法。 1999; 19: 425-433
        • 奥兰多五。
        通过甲醛交联 - 染色质免疫沉淀映射体内染色体蛋白。
        趋势生物化学。 SCI。 2000; 25: 99-104
        • Schmitt-Ulms G.
        • 汉森K.
        • 刘杰。
        • Cowdrey C.
        • 杨杰。
        • 亲爱的S.J.
        • 科恩F.E.
        • Prusiner S.B.
        • Baldwin M.A.
        时间控制的转磁灌注交联用于研究复杂组织中蛋白质相互作用的研究。
        NAT。生物技术。 2004; 22: 724-731
        • Tagwerker C.
        • 轻弹K.
        • 崔米
        • Guerrero C.
        • 窦啊。
        • 奥尔B.
        • Baldi P.
        • 黄兰
        • Kaiser P.
        在完全变性条件下进行两步纯化的串联亲和标签:在泛素分析和蛋白质复合物鉴定中的应用与在VivoCross联系中。
        摩尔。细胞。蛋白质组学。 2006; 5: 737-748
        • vasilescu J.
        • 郭X.
        • 卡斯特J.
        体内交联和质谱法鉴定蛋白质 - 蛋白质相互作用。
        蛋白质组学。 2004; 4: 3845-3854
        • Cox J.
        MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
        NAT。生物技术。 2008; 26: 1367-1372
        • COX J.R.
        • Neuhauser N.
        • Michalski A.
        • 施泰米r.a.
        • 奥尔森J.V.
        和romeda:肽搜索引擎集成到最大环境中。
        J蛋白质组。 2011; 10: 1794-1805
        • Cox J.
        • 嘿m.y.
        • Luber C.A.
        • Paron I.
        • Nagaraj N.
        通过延迟标准化和最大肽比例提取的精确的蛋白质组无标记量化,称为MAXLFQ。
        摩尔。细胞。蛋白质组学。 2014; 13: 2513-2526
        • Ruepp A.
        • Waegele B.
        • Lechner M.
        • 祝福尔B.
        • Dunger-Kaltenbach I.
        • Fobo G.
        • 弗里什曼G.
        • 蒙特隆C.
        • Mewes H.-w.
        珊瑚:哺乳动物蛋白质复合物的综合资源-2009。
        核酸RES。 2010; 38: D497-D501.
        • oliphant t.e.
        Python为科学计算。
        计算。 SCI。 eng。 2007; 9: 10-20
        • Pedregosa F.
        • varoquaux g。
        • Gramfort A.
        • Michel V.
        • 硫叶B.
        • Grisel O.
        • Blondel M.
        • Prettenhofer P.
        • Weiss R.
        • Dubourg V.
        • vanderplas j.
        • Passos A.
        • Cournapeau D.
        • 布鲁克米
        • Perrot M.
        • Duchesnay E.
        Scikit-Learn:Python的机器学习。
        J. Mach。学。 res。 2011; 12: 2825-2830
        • Szklarczyk D.
        • Franceschini A.
        • 蜡厂
        • Forslund K.
        • Heller D.
        • Huerta-Cepas J.
        • Simonovic M.
        • 罗斯A.
        • Santos A.
        • Tsafou K.P.
        • Kuhn M.
        • Bork P.
        • Jensen L.J.
        • von mering c.
        字符串v10:蛋白质 - 蛋白质相互作用网络,整合在生命之树上。
        核酸RES。 2015; 43: D447-D452
        • 坎德隆A.
        • Castagnoli L.
        • Cesareni G.
        Mentha:用于浏览集成蛋白质交互网络的资源。
        NAT。方法。 2013; 10: 690-691
        • nepusz t.
        • yu h.y.
        • Paccanaro A.
        检测蛋白质 - 蛋白质相互作用网络中的重叠蛋白复合物。
        NAT方法。 2012; 9: 471-U481
        • Swaney D.L.
        • 温格C.D.
        • Coon J.J.
        使用多种蛋白酶对大规模质谱的蛋白质组学的价值。
        J.蛋白质组。 2010; 9: 1323-1329
        • Krogh A.
        • 拉斯森B.
        • von heijne g.
        • Sonnhammer e.l.l.
        用隐马尔可夫模型预测跨膜蛋白拓扑:完成基因组的应用。
        J.Mol。 BIOL。 2001; 305: 567-580
        • 福岛J.
        • makagiansar i.t.
        • stallcup w.b.
        NG2蛋白多糖通过Galectin-3和Alpha3beta1整联蛋白的接合促进内皮细胞运动和血管生成。
        摩尔。 BIOL。细胞。 2004; 15: 3580-3590
        • 坎贝尔I.D.
        • 汉弗里斯M.J.
        整合素结构,激活和相互作用。
        冷泉harb持猪肉。 2011; 3
        • 穆勒S.C.
        • Ghersi G.
        • Akiyama S.K.
        • 唱Q.X.
        • 霍华德L.
        • Pineiro-Sanchez M.
        • Nakahara H.
        • YEH Y.
        • 陈W.T.
        Invidopodia整合素的一种新型蛋白酶对接功能。
        J. Biol。化学。 1999; 274: 24947-24952
        • 杨X.
        • Kovalenko O.v.
        • 唐W.
        • CLAAS C.
        • 斯蒂普C.S.
        • 升身升降器M.E.
        棕榈酰化支持整合素 - 四胞苷复合物的组装和功能。
        J.细胞Biol。 2004; 167: 1231-1240
        • Harner M.
        • Korner C.
        • Walther D.
        • Mokranjac D.
        • Kaesmacher J.
        • 威尔彻美国。
        • 格里菲斯J.
        • Reggiori F.
        • Neupert W.
        线粒体接触位点复合体,是线粒体架构的决定因素。
        Embo J. 2011; 30: 4356-4370
        • 庞巴迪J.P.
        • 蒙德森M.
        前进三个步骤,两个步骤:机械洞察组装和拆卸圈套复合物。
        Curr。拍摄。化学。 BIOL。 2015; 29: 66-71
        • stryer l.
        • Bourne H.R.
        G蛋白:一系列信号传感器。
        安努。 rev.细胞生物。 1986; 2: 391-419
        • Hsieh J.C.
        • Lee L.
        • 张L.
        • Weber S.
        • 棕色K.
        • Derossi C.
        • 葡萄酒M.E.
        • Rosenquist T.
        • Holdener B.C.
        MESD编码了LRP5 / 6伴侣,对于小鼠胚胎极性的规范是必不可少的。
        细胞。 2003; 112: 355-367
        • Culi J.
        • Springer T.A.
        • 曼R.S.
        低密度脂蛋白受体蛋白中β-螺旋桨/ EGF模块的Boca依赖性成熟。
        Embo J. 2004; 23: 1372-1380
        • Dinchuk J.E.
        • focht r.j.
        • Kelley J.A.
        • 亨德森N.L.
        • zolotarjova n.i.
        • Wynn R.
        • neff n.t.
        • 链接J.
        • Huber r.m.
        • 烧伤。
        • 鲁佩达M.J.
        • Cunningham M.R.
        • 卖b.h.
        • 马杰。
        • 斯特恩A.A.
        • 霍利斯G.F.
        • 斯坦·克拉
        • 弗里德曼P.A.
        小鼠表皮生长因子结构域的翻译后阿巴冬酰β-羟基化导致发育缺陷和肠道瘤的发生率增加。
        J. Biol。化学。 2002; 277: 12970-12977
        • Stenflo J.
        • ohlin a.k.
        • 欧文w.g.
        • 施耐德W.J.
        β-羟基海藻酸或β-羟基己酰胺在牛低密度脂蛋白受体和牛血栓调节蛋白中。
        J. Biol。化学。 1988; 263: 21-24
        • 面包师M.J.
        • Frazier a.e.
        • Gulbis J.M.
        • Ryan M.T.
        线粒体蛋白质进口机械:与功能相关结构。
        趋势细胞BIOL。 2007; 17: 456-464
        • 瑞斯克。
        • Fransson A.
        • aspenstrom p.
        miro gtpases:在线粒体运输机械的核心。
        费用。 2009; 583: 1391-1398
        • Heinz L.X.
        • Baumann C.L.
        • Koberlin M.S.
        • Snijder B.
        • 呕吐。
        • Sharif O.
        • Apalter I.M.
        • Muller A.c.
        • kandasamy r.k.
        • Breitwieser F.P.
        • Pichlmair A.
        • 布鲁克纳M.
        • rebsamen m.
        • Bluml S.
        • Karonitsch T.
        • Fauster A.
        • 大歌j.
        • Bennett K.L.
        • Knapp S.
        • Wenk M.R.
        • Superti-Furga G.
        脂质改性酶SMPDL3B负调节先天免疫。
        细胞报告。 2015; 11: 1919-1928
        • Koch J.
        • Gartner S.
        • 李下午
        • Quintern L.E.
        • Bernardo K.
        • Levran O.
        • Schnabel D.
        • desnick r.j.
        • Schuchman E.H.
        • Sandhoff K.
        一种编码人酸陶瓷酶的全长互补DNA的分子克隆与表征。鉴定第一个分子病变引起的口岸疾病。
        J. Biol。化学。 1996; 271: 33110-33115
        • 他X.
        • okino n。
        • Dhami R.
        • 达坎A.
        • Schulze H.
        • Sandhoff K.
        • Schuchman E.H.
        重组,人酸陶瓷酶的纯化与表征。催化反应和与酸鞘磷脂酶的相互作用。
        J. Biol。化学。 2003; 278: 32978-32986
        • 黄D.W.
        • 谢尔曼B.T.
        • LEMPICKI R.A.
        用大卫生物信息学资源对大型基因清单的系统和综合分析。
        NAT。协议。 2008; 4: 44-57
        • Supek F.
        • Bosnjak M.
        • Skunca N.
        • Smuc T.
        Revigo总结并可视化了基因本体论术语的长列表。
        Plos一个。 2011; 6: e21800
        • 在努力硕士
        • Ahmad Y.
        • Kirkwood K.J.
        • LY T.
        • Lamond A.I.
        使用定量蛋白质组学的蛋白质降解的全局亚细胞表征。
        摩尔。细胞。蛋白质组学。 2013; 12: 638-650
        • Hjelmeland L.M.
        对膜生物化学的一种裸露的两性离子洗涤剂:设计和合成。
        Proc。 Natl。阿卡。 SCI。美国。 1980; 77: 6368-6370
        • 胡Z.
        使用Visant分析网络。
        Curr。 protoc。生物信息学。 2014; 8: 8.8.1-8.8.39