PTM-Shepherd:从开放搜索结果分析和概括后翻译后和化学修改

开放访问发布:2020年12月10日DOI://doi.org/10.1074/mcp.TIR120.002216

      强调

      • 全面的开放搜索注释。
      • 敏感修改检测。
      • 识别批量效应。
      • 新颖后翻译后修改发现。
      开放搜索已被证明是识别霰弹枪蛋白质组学实验中已知和未知修改的有效策略。不仅限于一小一度的用户指定的修改,而是打开搜索识别具有可以对应于单个修改或多个修改的组合的任何质量偏移的肽。在这里,我们呈现PTM-Shepherd,一种生物信息化工具,其基于氨基酸定位,碎片光谱相似度,保留时间偏移和相对修改率,自动化在开放搜索中检测到的翻译后修改曲线的表征。 PTM-Shepherd还可以对研究修改型材的变化进行多种性比较,例如,在不同实验室或在不同条件下产生的数据。我们展示了PTM-Shepherd如何改善来自福尔马林固定和石蜡包埋的样品的数据分析,检测在一些数据集中的半胱氨酸的极端甲基化,发现在肽合成期间引入的艺术改性,并在样品制备伪影中揭开特异性偏差在多中心蛋白质组学分析研究中。

      图形概要

      关键词

      缩写:

      (广泛的研究所), CAA (氯乙酰胺), CCRCC. (透明细胞肾细胞癌), CPTAC. (临床蛋白质组学肿瘤分析联盟), egs. (乙二醇(琥珀酰亚胺琥珀酸)), FDR. (假发现率), FFPE. (福尔马林固定和石蜡嵌入), IAA. (碘乙酰胺), ju. (约翰霍普金斯大学), 拉德 (肺腺癌), 小姐 (质谱), PNNL. (太平洋西北国家实验室), PTMS. (翻译后修改), PSM (肽谱匹配), QC. (质量控制), RT. (保留时间), SNR. (信号对噪声余量), SS. (光谱相似性), TMT. (串联大规模标签), Ucec. (子宫毒物子宫内膜癌)
      数据库搜索霰弹枪蛋白质组学数据是一种常用的策略,用于鉴定来自复杂蛋白质混合物的肽和蛋白质(
      • ENG J.K.
      • Searle B.C.
      • 克劳瑟K.R.
      • Tabb D.L.
      人群中的一张脸:通过数据库搜索识别肽。
      ,
      • nesvizhskii a.i.
      霰弹枪蛋白质组学中肽和蛋白质鉴定的计算方法和误差率估算程序调查。
      )。在该策略中的肽鉴定最常依赖于使用MS / MS数据库搜索工具匹配串联质谱(MS / MS)的肽光谱到其理论对应物,这需要先前了解可能存在于样本中的潜在修改。这是有问题的,因为蛋白质可以以典型序列之外的无数形式存在。例如,蛋白质功能通常通过翻译后修饰(PTM)来调节,并且来自样品处理的额外化学修饰可以妨碍识别。由于包括其修改的所有潜在肽的搜索空间如此大,因为在使用传统数据库搜索策略时,研究人员被迫限制他们搜索所考虑的修改,导致大量无法解释的光谱(
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      ,
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      小姐 FRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      ,
      • nesvizhskii a.i.
      • Roos f.f.
      • 格罗斯曼J.
      • Vogelzang M.
      • eddes J.s.
      • Gruissem W.
      • Baginsky S.
      • Aeberberold R.
      霰弹枪蛋白质组学数据的动态谱质量评估和迭代计算分析:更有效地识别翻译后修饰,序列多态性和新型肽。
      ,
      • 宁克。
      • 费尔明D.
      • nesvizhskii a.i.
      蛋白质组学数据集未分配的高质量MS / MS光谱的计算分析。
      )。
      开放搜索或批量搜索是一种策略,允许研究人员扩展其搜索空间并减少未解释的MS / MS光谱的数量。已证明是识别霰弹枪蛋白质组学实验中已知和未知修改的有效策略(
      • 鸡爪。
      • Kolippakkam D.
      • Nusinow D.P.
      • 翟德
      • RAD R.
      • Huttlin E.L.
      • Gygi S.P.
      容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
      ,
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      小姐 FRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      ,
      • Chi H.
      • 刘C.
      • 杨H.
      • 曾W.-f.
      • 吴L.
      • 周W.-J.
      • 王r.-m.
      • niu x.-n.
      • 丁Y.-h.
      • 张Y.
      高效开放搜索引擎综合鉴定串联质谱中的肽。
      ,
      • solntsev s.k.
      • 短red m.r.
      • Frey B.L.
      • 史密斯l.m.
      通过Metamorpheus增强全球翻译后修改发现。
      ,
      • na s.
      • Bandeira N.
      • PAEK E.
      快速多盲修改通过串联质谱进行搜索。
      )。不限于用户指定的修改,打开搜索识别具有对应于潜在修改或序列变体的质量偏移的肽。然而,这些质量偏移不包含在闭合搜索中存在的相同信息,最重要的是修饰的身份以及肽序列内的氨基酸可以含有它。解密打开搜索结果因此需要随后的计算表征来恢复此信息(
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      小姐 FRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      ,
      • Dasari S.
      • Chambers M.C.
      • Slebos R.J.
      • Zimmerman L.J.
      • 火腿A.-J.L.
      • Tabb D.L.
      Tagrecon:通过序列标记识别高吞吐量突变识别。
      ,
      • avtonomov d.m.
      • 孔子A.
      • nesvizhskii a.i.
      DELTAMASS:蛋白质组学开放搜索结果中的自动检测和可视化。
      ,
      • Z.
      • 翟尔。
      • ying w.
      • 钱X.
      • 锣F.
      • 棕褐色
      • 傅y.
      PTMINER:在开放式搜索中检测到蛋白质修饰的本地化和质量控制及其在人类蛋白质组中综合翻译后修饰表征的应用。
      )。
      用于开放搜索的现有工具后处理在频谱级别的基础上执行有限的分析。 PTM-PRELHET(
      • Shteynberg D.D.
      • 德意曲e.w.
      • 坎贝尔D.S.
      • Hooopmann M.R.
      • Kusebauch U.
      • 李德。
      • 门多萨L.
      • Midha M.K.
      • 太阳Z.
      • Whetton A.D.
      PTMPROCH:用于转蛋白管道的快速准确的质量修改定位。
      ), 例如,仅限于每个肽频谱匹配(PSM)的定位质量差异,但也没有提供可以通知后续搜索的数据摘要,也不提供它提供质量差异的标识。哲学家(
      • da Veiga Leprevost F.
      • Haynes S.E.
      • avtonomov d.m.
      • 常熟。
      • Shanmugam A.K.
      • Mellacheruvu D.
      • 孔A.T.
      • nesvizhskii a.i.
      哲学家:霰弹枪蛋白质组学数据分析的多功能工具包。
      )仅提供与UNIMOD的质量差异的映射,并产生基本的质量移位直方图。在这里,我们呈现PTM-Shepherd,这是一种自动化工具,该工具从开放搜索PSM列表中调用修改,并根据属性表征它们,例如氨基酸定位,碎片光谱相似性,对RT的影响以及相对修改率。 PTM-Shepherd还可以进行多种分析比较,用于研究不同条件下改性型材的变化。我们在各种情况下使用这些配置文件来展示如何在PTM分析中有所帮助的额外指标,理想性比较和批量分析型材。总的来说,我们预计PTM-Shepherd生产的PTM配置文件将大大提高对质量控制(QC)和微水位的宏观水平的对数据的理解。

      实验步骤

       PTM-Shepherd:大规模移位直方图建设

      通过MSFragger /哲学家管道生成的PSM.TSV文件(或多种分析的多个PSM.TSV文件)使用所有PSM构建识别的质量移位的直方图Fig. 1)。这些PSM.TSV文件通常(默认情况下)使用PhiloSopher滤波器命令确定的目标 - 诱饵计数滤除为1%PSM级别和1%蛋白质水平假发现率(FDR)。直方图中的每个箱的宽度为0.0002 da(默认情况下)。该直方图在最极端值的任一侧延伸到5Da,以防止直方图的最大值和最小值的峰值在平滑之后被截断。添加到-0.005和0.005 da之间的随机噪声以在箱边界和质量偏移之间发生断裂。在BIN分配之后,直方图被平滑,使峰值更加单调。箱重量分布在五个垃圾箱(默认情况下)分布,分配给每个垃圾箱的权重由以垃圾箱为中心的高斯分布确定,以平滑,使得在它们之间分配95%的箱的重量。从该直方图调用代表观察到的修改的质量偏移的峰值。
      图缩略图GR1.
      Fig. 1PTM-Shepherd工作流程。 数据处理通过将所有数据集中的质量移位聚合到公共直方图中。峰是根据他们的突出来确定的。然后为每个数据集量化聚合中最强烈的500个最强烈的峰值并归一化为大小。具有每个质量偏移的肽在每个位置的修饰中迭代地试探,产生每种肽的定位分数和每个质量偏移的聚集部定位富集。最后,分析修饰的肽及其未修饰的对应物以具有其成对余弦光谱相似性和计算时间的变化。

       PTM-Shepherd:峰值拣选

      PTM-Shepherd分别基于峰值突出和信噪比余量(SNR)的混合物作为质量和量化的衡量来选择峰值。峰值的突出被计算为其顶点与其左肩或右肩更强烈的比率,发现通过单调下调峰值(Fig. 1)。为了提高该过程的单调性,相邻的直方图箱被临时分组成小组并扁平到集合内的最小箱高度,具有基于直方图箱的总数内部计算的集大小。当它们的突出时间超过0.3(默认)时,峰值被调用。峰值的SNR通过0.004Da滑动窗口(默认)在任一侧的0.005da的背景下计算(用峰值拾取宽度缩放)。针对信号和噪声区域计算每个直方图箱的平均高度,然后通过减去噪声来计算信号余数。从此峰列表中,SNR(默认情况下)的前500个被发送到下游处理。峰边界被认为是观察到的峰值边界或定义的前体公差,以靠近顶点的方式。如果它们的质量偏移落在报告的峰值边界内,则PSM被分配给峰值。

       PTM-Shepherd:大规模转移注释

      检测到的峰值使用来自Unimod的条目来迭代地注释(检索:2019年10月2日)(
      • 皱褶D.M.
      • Cottrell J.s.
      UNIMOD:质谱法的蛋白质修饰。
      )修改数据库(包括单残基插入和缺失和删除和同位素误差峰值),其补充有用户指定的质量换档列表。允许每个峰值分解成最多两种修改。一些特别罕见或基于协议的修改(例如,o18标记,n15标记)定期混淆注释被删除。将立即注释已知质量换档的0.01 da(默认)内的质量差异。如果质量换档不符合这种情况,则在检查前一步骤中识别的两个修改的组合之前测试用户定义质量换档和已知注释的组合。失败这两个分配,质量差异被标记为“未经发布”并附加到潜在修改组合列表。

       PTM-Shepherd:质量换档定位

      PTM-Shepherd为每个质量换档峰构造定位型材。为每个实验构建定位型材,报告N-末端定位率和每个峰的归一化氨基酸倾斜。通过将每个氨基酸的质量偏移依次将质量偏移放置并使用与Msfragger中的相同的评分功能一起使用相同的评分功能来对每个PSM进行定位步骤。如果在肽序列中存在肽序列内的位置,PSM被认为是可定位的,即,当将质量偏移放置在那里时,将导致更匹配的片段离子,而不是仅使用未示出的片段离子(IE。,在不添加大众移位的情况下)。聚合对应于质量移位直方图中相同峰值的可定位PSM,并分析其特性。通过计数质量偏移定位于特定氨基酸的情况,计算峰的定位速率。如果本地化是暧昧的(IE。,几个站点均得分高),本地化的重量分布在所有局部残留物中。计数被标准化为定位对给定残留物的定位速率,然后除以每个残留物的背景内容。背景技术通过在整个数据集中的每个可本地化的PSM中计数每个残差的发生次数来计算残差内容(默认情况下)。还提供了在唯一肽水平和PSM和独特肽水平的独特肽水平和宾语归一化的实验级标准化的选择。

       修改 - 未修改的比较

      改性和未改性肽之间的余弦Ss用于确定大规模变化如何影响MS / MS光谱。未经修改的PSM, IE。,具有小于0.001Da(默认)的质量移位的PSM基于其鉴定的肽序列和电荷状态聚集。如果肽存在超过50个未修饰的光谱,则为下游比较随机选择50个。然后,对于在给定电荷状态下的每个大规模移位的PSM,记录该PSM之间的平均余弦相似度得分及其在相同电荷状态下的相应未修饰的PSM。对于每个质量移位峰值的所有PSM,这些相似度分数被聚合,然后对该峰值的SS简档进行平均并报告。还检查了RT效果。肽RTS从哲学家的PSM.TSV输出中提取。对于具有质量换档的每个PSM,计算PSM与其所有相应的未修饰的PSM之间的RT之间的平均差异。对于每个质量换峰峰值聚集这些平均RT差异,然后在该峰的所有肽中平均值并报告为该峰值的RT差异轮廓。

       实验数据集

      四个福尔马林固定和石蜡嵌入式(FFPE)数据集用于识别与Tabb所选择的固定过程和存储相关联的修改 等等。 (
      • Tabb D.L.
      • Murugan B.D.
      • okendo J.
      • Nair O.
      • 布莱克本准噶。
      • Buthelezi S.G.
      • 斯托赫夫S.
      开放式搜索揭示福尔马林固定,石蜡包埋的热HCD和SCIEX TriLletof霰弹枪蛋白质组的修改模式。
      )为了他们的学习。在SCIEX Tripletofs上获得了两个标题为“Nielsen”(PXD000743)和“Buthelezi”(PXD013107)的两个数据集(PXD013107)(
      • Nielsen N.S.
      • Poulsen e.t.
      • Klintworth G.K.
      • Enghild J.J.
      深入了解眼睑,轨道和结膜淀粉样蛋白的免疫球蛋白轻链沉积物的蛋白质组成。
      )。在TripletOf 5600+上获取了Nielsen数据集,并包含218,449次跨越20个SCIEX.WIFF文件的扫描,并且在Triplet 6600上获取了Buthelezi数据集,并包含474,726次跨越12 Sciex.WIFF文件的扫描。在Thermo Q-Factive Instruments上获得另外两个标题为“Zimmerman”(PXD001651)和“Nair”(PXD013528)(PXD013528)(
      • Nair O.
      在南非小儿队队列中的分析髓质母细胞瘤和少年皮霉菌星形细胞瘤脑肿瘤。
      )。 Zimmerman数据集包含在五个.RAW文件中的79,803扫描组成,Nair数据集包含在10。牵引文件中的245,589次扫描。文件被获取为.RAW或.WIFF文件并使用Proteowizard的MSCOnvert转换为MZML版本3.0.18208。
      合成肽数据集以MZML格式从Proteomexchange(PXD004732)获得(
      • ZOLG D.P.
      • Wilhelm M.
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • Delanghe B.
      • Bailey D.J.
      • Gessulat S.
      • ehrlich h.-c.
      • Weininger M.
      • 是的。
      • Schlegl J.
      • Kramer K.
      • 施密特T.
      • Kusebauch U.
      • 等等。
      基于完整的合成人群构建蛋白质池。
      )。我们的分析中只包含带有3xHCD标签的MS运行。标记为SRM的肽池也被排除在外。该合成肽数据集由未经修改的蛋白质人肽组成,在Thermo Fisher orbitrap Fusion Lumos仪器上裂片。在合成期间掺入半胱氨酸作为烷基化囊肿。
      本工作中使用的其他数据集是从MZML格式的临床蛋白质组学肿瘤分析联盟(CPTAC)数据门户中获得的(
      • 爱德华兹N.J.
      • 令人渊m
      • thangudu r.r.
      • CAI S.
      • 麦加维P.B.
      • 雅各布S.
      • Madhavan S.
      • Ketchum K.A.
      CPTAC.数据门户:癌症蛋白质组学研究的资源。
      )。这些仅限于由组合样品产生的MS,使用乳腺癌异种移植池产生的CPTAC参考材料,用于QC和数据协调目的。使用串联质量标签10(TMT-10)标记的技术进行分析样品。六个实验(10-Plex TMTs)的第一个队列由三个地点(来自每个地点的两个实验)加工的样品 - 广泛的研究所(BI),约翰霍普金斯大学(jhu),和太平洋西北国家实验室(PNNL) - 在侧面融合迷泥中获得作为CPTAC协调研究的一部分(
      • Mertins P.
      • 唐人
      • 克鲁格克。
      • 克拉克D.J.
      • 格里尼科米。
      • 陈L.
      • 克劳瑟K.R.
      • Clauss T.R.
      • 莎第P.
      • Gillette M.A.
      • petyuk v.a.
      • 托马斯S.N.
      • MANI D.R.
      • Mundt F.
      • 摩尔r.j.
      • 等等。
      液相色谱 - 质谱法的多重深度蛋白质组和肿瘤组织磷脂蛋白酶体分析的可重复工作流程。
      )。第二个群组由作为三个CPTAC数据集的一部分加工为纵向QC样本的相同的组合样本:在JHU(三个实验)中产生的透明细胞肾细胞癌数据集,在BI(四个实验)中产生的肺腺癌数据集,和在PNN1(四个实验)产生的子宫内膜子宫内膜癌数据集。所有这些数据在所有站点都使用CPPAC谐波数据生成协议(
      • Mertins P.
      • 唐人
      • 克鲁格克。
      • 克拉克D.J.
      • 格里尼科米。
      • 陈L.
      • 克劳瑟K.R.
      • Clauss T.R.
      • 莎第P.
      • Gillette M.A.
      • petyuk v.a.
      • 托马斯S.N.
      • MANI D.R.
      • Mundt F.
      • 摩尔r.j.
      • 等等。
      液相色谱 - 质谱法的多重深度蛋白质组和肿瘤组织磷脂蛋白酶体分析的可重复工作流程。
      )。使用PTM-Shepherd的MultiExperiment设置处理这些数据以生成单个报告。

       数据库搜索和统计验证

      使用从Uniprotkb蛋白质数据库(2016年7月29日检索)构建的数据库进行了所有分析。加入逆转蛋白质序列作为诱饵,并附上常见的污染物(总靶标和诱饵:141,585)。除非另有说明,否则将使用以下参数处理所有数据集。使用MSFRAGGERS,版本2.1(4)搜索数据,其前体质量公差为±500A。同位素误差校正被禁用,允许一个错过的胰蛋白酶切割,其长度为7至50个残基的肽。将甲硫氨酸的氧化作为可变改性,并将半胱氨酸氨基甲酰化作为固定改性。为所有数据集执行MSFRAGRAGRAMAS校准和参数优化(
      • yu f.
      • TEO G.C.
      • 孔A.T.
      • Haynes S.E.
      • avtonomov d.m.
      • Geiszler D.J.
      • nesvizhskii a.i.
      使用本地化感知开放搜索识别修饰的肽。
      ),包括片段离子容差。移位离子不用于得分。
      使用-200至500 da质量范围处理FFPE数据,以匹配原始出版物中使用的
      • Tabb D.L.
      • Murugan B.D.
      • okendo J.
      • Nair O.
      • 布莱克本准噶。
      • Buthelezi S.G.
      • 斯托赫夫S.
      开放式搜索揭示福尔马林固定,石蜡包埋的热HCD和SCIEX TriLletof霰弹枪蛋白质组的修改模式。
      )。用蛋白质N-末端乙酰化和肽N-末端TMT质量为229.1629Da的CPTAC数据,因为可变修饰(TMT也被指定为LYS固定改性)。此外,CPPTAC数据被搜查针对联合的UniprotkB鼠标加人蛋白数据库(2020年2月10日),其各自的逆转诱饵附加到数据库,导致252,401个总目标和诱饵蛋白。
      使用Peptipeprophet处理使用MSFRAGRER识别的PSM(
      • 凯勒阿。
      • nesvizhskii a.i.
      • Kolker E.
      • Aeberberold R.
      经验统计模型来估计MS / MS和数据库搜索的肽识别的准确性。
      ) 通过 哲学家v2.0.0工具包(
      • da Veiga Leprevost F.
      • Haynes S.E.
      • avtonomov d.m.
      • 常熟。
      • Shanmugam A.K.
      • Mellacheruvu D.
      • 孔A.T.
      • nesvizhskii a.i.
      哲学家:霰弹枪蛋白质组学数据分析的多功能工具包。
      )。所有处理和滤波均按实验基础进行。四个FFPE数据集被处理为四个实验。将氯乙酰胺(CAA) - 标记的HELA细胞数据集被加工为含有所有39个级分的实验。 CPTAC样品被分组实验明智,每个实验含有所有24个级分。由于大尺寸,蛋白质池合成肽数据集被处理为基于每个文件名开头的五位标识符的11个子集。所有分析的Peptipeprophet参数是默认开放式搜索参数:半扫描型建模,CLEVEL值设置为-2,高精度质量模式禁用,质量宽度为1000,并使用期望值进行建模。在哲学家滤波器命令的帮助下,使用目标诱饵策略将结果PSM匹配过滤到1%FDR。

      结果与讨论

       PTM-Shepherd概述

      PTM-Shepherd计算工作流程的概述显示在 图1。该过程从PTM-Shepherd读取FDR过滤的PSM列表(由Msfragger和哲学家制作,可选地使用Crystal-C删除的开放搜索工件(
      • 常熟。
      • 孔A.T.
      • da Veiga Leprevost F.
      • avtonomov d.m.
      • Haynes S.E.
      • nesvizhskii a.i.
      Crysty-C:用于改进开放搜索结果的计算工具。
      ))和每个PSM的质量偏移,构建质量换档直方图(
      • avtonomov d.m.
      • 孔子A.
      • nesvizhskii a.i.
      DELTAMASS:蛋白质组学开放搜索结果中的自动检测和可视化。
      )。在平滑直方图之后,PTM-Shepherd基于峰值突出和信噪比的混合物挑选峰。从此检测到的峰列表中,选择顶部500(默认情况下)用于下游处理。然后针对此检测到的峰列表计算基本丰富统计。如果它们的质量偏移落在报告的峰值边界内,则PSM被分配给特定峰值,并且基于光谱计数计算峰的丰度。 PTM-Shepherd还可以以多管方式运行。在这种模式中,在来自所有实验的聚集体质量移位直方图上执行峰值检测,根据它们包括总PSM的总PSM的比例从每个实验的大规模换档产生。用于峰值检测的组合直方图可以大大简化在不同条件和实验中检测到的修改之间的比较。在该多见点模式中,为每个实验分开生成每个检测到的峰值的摘要属性,并为所有数据组合。
      一旦调用了质量换档直方图中的峰,PTM-Shepherd试图确定其身份。迭代转换使用来自Unimod的条目进行迭代地注释(
      • 皱褶D.M.
      • Cottrell J.s.
      UNIMOD:质谱法的蛋白质修饰。
      )修改数据库,同位素误差峰值和用户指定的质量偏移,允许质量差异分解为大多数两个修改。 PTM-Shepherd还为每个峰值构造定位型材。为每个实验构建定位型材,报告N末端定位率和用于每种改性的归一化氨基酸倾向。通过将每个氨基酸的质量移位依次放置在每个氨基酸处的质量偏移并使用Msfragger中呈现的评分功能(参见)来对每个PSM进行该分析(参见 方法 section).
      PTM-Shepherd还计算了几项指标,可用于更好地了解检测到的质量偏移的性质。对于每个峰值,如果存在于同一运行内,则将包含该质量转变的PSM与其未修饰的对应物进行比较。首先,计算改性和未改性肽之间的余弦Ss,这对于确定修改如何影响光谱是有用的。然后,报道了RT效果,并且报道了具有和不含修饰之间的肽之间的RT的平均差异。

       PTM-PAPETTE发现:FFPE样品的分析

      了解样品处理和储存如何影响蛋白质是如何最大限度地提高其识别的关键。使用FFPE技术保留的组织样品的分析值得包含额外的修饰来反映福尔马林固定后蛋白质的变化。 FFPE样品通常在长期储存后分析,在此期间它们可以暴露在高温和阳光下(
      • 张Y.
      • Muller M.
      • 徐B.
      • Yoshida Y.
      • Horlacher O.
      • Nikitin F.
      • Garessus S.
      • Magdeldin S.
      • Kinoshita N.
      • Fujinaka H.
      • Yaoita E.
      • Hafegawa M.
      • Lisacek F.
      • Yamamoto T.
      不受限制的修改搜索显示赖氨酸甲基化作为组织福尔马林固定和石蜡嵌入的主要改性。
      )。虽然之前的研究已经检查了来自FFPE样品的蛋白质时应包括哪种修改(
      • 张Y.
      • Muller M.
      • 徐B.
      • Yoshida Y.
      • Horlacher O.
      • Nikitin F.
      • Garessus S.
      • Magdeldin S.
      • Kinoshita N.
      • Fujinaka H.
      • Yaoita E.
      • Hafegawa M.
      • Lisacek F.
      • Yamamoto T.
      不受限制的修改搜索显示赖氨酸甲基化作为组织福尔马林固定和石蜡嵌入的主要改性。
      ),这是最近通过Tabb重新预订的 等等。 (
      • Tabb D.L.
      • Murugan B.D.
      • okendo J.
      • Nair O.
      • 布莱克本准噶。
      • Buthelezi S.G.
      • 斯托赫夫S.
      开放式搜索揭示福尔马林固定,石蜡包埋的热HCD和SCIEX TriLletof霰弹枪蛋白质组的修改模式。
      )使用双通搜索。首先,使用开放搜索来识别普遍的质量偏移。其次,他们进行了传统的搜索,并通过化学知识了解他们的质量转变的本地化。我们试图调查PTM-Shepherd如何用于验证其发现,并简化此分析的其他数据集和样品准备方案。
      首次开放搜索后,Tabb 等等。 (
      • Tabb D.L.
      • Murugan B.D.
      • okendo J.
      • Nair O.
      • 布莱克本准噶。
      • Buthelezi S.G.
      • 斯托赫夫S.
      开放式搜索揭示福尔马林固定,石蜡包埋的热HCD和SCIEX TriLletof霰弹枪蛋白质组的修改模式。
      )发现,在分析的四种数据集中始终存在五种修饰:甲基化,二甲基化,单氧化,双氧化和可变碳氮化甲基化。具有PTM-Shepherd的自动化处理重复了大多数这些发现。基于PSM计数和使用相同的标准,我们发现每种数据集的前10个质量换档(不包括同位素误差峰值)内的甲基化,单氧化和脱氧的质量偏移(补充表S1A)。有趣的是,PTM-Shepherd还发现了相对于二甲基化水平的显着差异。 PTM-Shepherd识别近距离接近的两个峰:27.9954Da(对应于甲酰化)和28.0320(对应于二甲基化)。二甲基化仅在一个数据集中高于甲酰化(Nielsen; Fig. 2A),而其他人在比二甲基化高度和高9倍之间具有甲型化。为了确认这不是PTM-Shepherd的噪音峰值拾取的工件,我们通过实现替代(高斯混合建模)策略的Deltamass软件来重新分析这些结果,用于峰值挑选(
      • avtonomov d.m.
      • 孔子A.
      • nesvizhskii a.i.
      DELTAMASS:蛋白质组学开放搜索结果中的自动检测和可视化。
      )。对于所有这四个数据集,Deltamass发现大众移位区域为27.90至28.10含有两个峰(补充图。S1)。对于Nielsen,Nair和Zimmerman,这些易于看见。甚至是Buthelezi数据集,虽然没有表现出作为其他分离的分离,但将更丰富的峰顶较近与甲酰化相对应的质量换档值。考虑到保存方法的性质,在大多数丰富的PTMS列表中存在甲酰化的存在也使逻辑感。
      图缩略图GR2.
      Fig. 2基本PTM-Shepherd应用。 A,PTM-Shepherd在Tabb的四个数据集附近识别两个峰值 等等。 所有四个数据集(Zimmerman,Nair,Nielsen和Buthelezi)显示了两个高斯峰约28 da的混合。始终如一更强烈的峰值是27.9949丁醇化。只有在尼尔森数据集中,Dimethylation(28.0313)接近甲酰化的强度。 B,PTM-Shepherd识别比其他常见修饰更失败的烷基化,例如脱胺和不适合氧化。 C,PTM-echepherd修饰分解鉴定六倍的烷基化六倍,因为基于单独的-57da大规模偏移,总核算是含有所有CYS的肽的四分之一。 PSM,翻译后修改。
      Tabb和同事依靠化学知识和其他工具(
      • Chi H.
      • 刘C.
      • 杨H.
      • 曾W.-f.
      • 吴L.
      • 周W.-J.
      • 王r.-m.
      • niu x.-n.
      • 丁Y.-h.
      • 张Y.
      高效开放搜索引擎综合鉴定串联质谱中的肽。
      ,
      • Dasari S.
      • Chambers M.C.
      • Slebos R.J.
      • Zimmerman L.J.
      • 火腿A.-J.L.
      • Tabb D.L.
      Tagrecon:通过序列标记识别高吞吐量突变识别。
      )到达包括对甲硫氨酸砜的氧化的最终搜索配置。我们选择使用PTM-Shepherd进一步调查这一点。由于在我们的开放搜索中已经包括单个氧化在我们的开放搜索中作为可变修改,所以对甲硫氨酸砜的氧化氧化可能看起来是可变的改性和+15.9949Da质量移位,局限于达到或+31.9898Da质量换档见面。但是,我们不观察到欧元的丰富(补充表S1A)这些实例中的任何一个。相比之下,Pro的富集评分分别为单氧化和二氧化分别为9.3和5.6。在搜索中添加核酸砜和二氢克利专业的PSM数量的塔巴和同事可以通过氧化的漫反射性来解释。使用具有动态+31.9898 DA MOT的闭面搜索策略时,任何两种+15.9949 DA事件发生 - 例如,在两个替代的氧化位点上 - 可以解释为达到砜,因为肽离子会聚在理论和实验氧化位点的下游。羟脯氨酸的多种情况可能发生相同的现象。已知胶原蛋白含有大量的羟脯氨酸,因此可能产生具有多个羟脯氨酸的肽(
      • Etherington D.J.
      • SIMS T.J.
      胶原蛋白的检测和估计。
      )。为了确定+31.9898DA大规模转变是否归因于同一肽上的多种羟脯氨酸,我们检查是否含有它比非胶原蛋白更容易映射到胶原蛋白的PSM。在胶原蛋白(差距= 43.5)上发生这种质量变化更容易发生。 p < 10−5 通过Fisher的确切试验),证实它是多种羟脯氨酸的组合,可以通过包括PTM调色板中的羟脯氨酸捕获。总体而言,在我们在这方面的经验和其他数据集中,PTM-Shepherd提供了非常合理的估计,对于特定的质量转变,对最可能的修改位点提供了非常合理的估计。
      “甲醛加合物”(+30.0106Da,作为甲醇在甲基醇中的甲基醇)是从FFPE样品的肽观察到的已知改性,并且在Nair和Zimmerman数据集中的高水平(在前10中)检测到它。根据PTM-Shepherd分析,这种大规模移位缺乏任何显着的本地化特性(局部化小于10%),这表明非价值加合物。通常,不稳定修改的识别是使用Msfragger与Msfragger相比,与其他PTM的工具或具有可变修改的闭合搜索相比,所有这些都在查找无法定位的不稳定修改时,所有这些都是识别的。总结我们的观察结果,PTM-Shepherd建议从Tabb提出的FFPE样本中略微修改的PTM调色板版本 等等。:相遇氧化(+15.9949A),羟脯氨酸(+15.9949Da,仅适用于胶原蛋白),Lys和N Termini(+27.9949Da)的甲酰化和N末端(+14.0157DA) 。包含甲醇(+30.0106)加合物也可能是有益的,但是使用MSFRAGGER的质量偏移搜索选项,其允许偏移和非流动的片段离子在得分中而不是可变改性(
      • yu f.
      • TEO G.C.
      • 孔A.T.
      • Haynes S.E.
      • avtonomov d.m.
      • Geiszler D.J.
      • nesvizhskii a.i.
      使用本地化感知开放搜索识别修饰的肽。
      ,
      • plasky d.a.
      • yu f.
      • TEO G.C.
      • nesvizhskii a.i.
      使用Msfrgager-Glyco快速综合的N-和O-糖蛋白酶分析。
      )。

       检测在甲基化之后的半胱氨酸伪影

      半胱氨酸是一种极其反应性的氨基酸,在暴露时经常拾取一系列化学修饰(
      • Chung H.S.
      • 王S.-B.
      • Venkatraman V.
      • 默里C.I.
      • 范艾克J.E.
      半胱氨酸氧化后期改性:心血管系统中的新兴调节。
      )。未指定的质量换档,例如由Cys的化学修饰产生的那些,混淆肽鉴定并导致较低的恢复率。 Cys烷基化限制了它可以形成的化学衍生物的数量并防止二硫键干扰,因此已经是数十年的蛋白质组学加工的主要原体(
      • SECHI S.
      • Chait B.T.
      通过烷基化改变半胱氨酸残基。肽映射和蛋白质鉴定的工具。
      )。 CAA和碘乙酰胺(IAA)是蛋白质组学工作流中使用的两种最常见的烷基化试剂。这些试剂的先前比较发现,当以相同的浓度施用时,IAA通常具有比CAA更高的半胱氨酸烷基化率,但随着偏离目标效果的较高速率的警告(
      • Schnatbaum K.
      • ZOLG D.
      • 文字H.
      • reimer u.
      快速准确地测定蛋白质组学工作流中的半胱氨酸还原和烷基化效果。
      )。在这里,我们已经测试了PTM-Shepherd在蛋白质组学数据集中发现半胱氨酸伪影的能力。 Bekker -Jensen. 等等。 (
      • Bekker -Jensen D.B.
      • Kelstrup C.D.
      • Batth T.S.
      • Larsen S.C.
      • 脱落C.
      • Bramsen J.B.
      • SørensenK.D.
      • Høyers。
      • Ørntoftt.f.
      • 安德森C.L.
      • 其他
      综合人类蛋白质群快速产生的优化霰弹枪战略。
      )严格测试的霰弹枪蛋白质组学协议,以确定快速生成人类蛋白质综合概况的最佳策略,最终产生高质量和深蛋白质组学数据的有价值的储存库。它们的方案还包括用烷基化剂CAA处理10mM处理,其每种Schnatbaum 等等。 (
      • Schnatbaum K.
      • ZOLG D.
      • 文字H.
      • reimer u.
      快速准确地测定蛋白质组学工作流中的半胱氨酸还原和烷基化效果。
      ),仅在复杂的混合物中实现了三分之二的10mM IAA的烷基化效率。与我们分析本文分析的其他样品不同,该方案在加入烷基化剂之前也没有变性蛋白质样品。这可能很大程度上促成了甲倒立剂。因此,它提出了一种卓越的检查这些半胱氨酸伪影。
      开放式搜索分析,然后是PTM-Shepherd显示了许多富集的富普通件偏移,与我们所期望的样品一致。因此,因为搜索了Cys烷基化作为固定的改性,以阐明在非烷基化的Cys残基上发生的修饰的身份,因此必须将质量偏移分解成两种组分:从鉴定的理论物质(ΔM= -57.0215da)中失效肽)和修改本身。考虑在此数据集中检测到的质量移位-9.03680Da。 PTM-叶将该质量移入失败的烷基化事件(-57.0215Da)和Cys的三重氧化到囊无奇酸(ΔM= + 47.9847A)。当试图直接评估样品中的失败烷基的数量时,这变得特别重要。严格计算-57.0215DA质量换档的数量将严重抑制它们的总发生,因为它忽略了与另一个修改结合的案例,这很可能给出Cys的反应性。我们在PTM-Shepherd中实现了一个附加参数,以解释为此确定用户定义的修改,并允许它们识别不直接对应于UniMod中的条目的质量班次(
      • 皱褶D.M.
      • Cottrell J.s.
      UNIMOD:质谱法的蛋白质修饰。
      )。在其自身,失败的烷基化是第六个最丰富的大规模转变,比其他常见事件更普遍,这些常见事件通常占杂皮蛋白形成的封闭搜索,占89,281个总Cys的3.9%(3450 psms) - 包含PSMS(补充表S2A)。然而,因为它经常发生在如前所述的其他质量偏移中,所以我们还汇集了其作为肽上的两个质量偏移中的一种的实例。值得注意的是,在考虑失败的烷基化注释的所有情况时,失败的烷基化事件的总数跳至20.5%(18,343 psm)(Fig. 2C)。当考虑分解的质量偏移时,失败的烷基化几乎是脱染的两倍,与非满足氧化事件一样是常见的四倍(Fig. 2B补充表S2B)。
      在占据总光谱的0.01%的丰度截止后,我们检测到呈现强大的CYS定位的10个质量震动(>十倍富集),但也用Cys的烷基化烷基化失败。这些是样品中富集的大部分富含Cys的PTMS(补充表S2A)。最丰富的这些修饰与预期的烷基化样品中的预期相关性相关。与非烷基化的Cys相结合的+1和+2同位素误差特别丰富,占1601种组合光谱。在没有烷基化的情况下,上述-9.0368Da-Triple氧化 - 除了它们之外的最普遍。它对Cys(48.5倍)的大量浓缩的本地化为这种复合鉴定的信用值归因于其他注释工具,因此,总失败的烷基化事件的计数。令人惊讶的是,与甲醛加合物(+12.0000DA)相结合的烷基化也常见。 -45.0216da的组合质量偏移大量定位于Cys,并具有96%的N末端定位率,指向潜在的噻唑胺形成 通过 N末端Cys环化。已知这些是在甲醛处理的数据中发生的,但作者没有报告使用甲醛(
      • 梅茨B.
      • 克斯滕G.F.A.
      • HOOGERHOUT P.
      • Brugghe H.F.
      • Timmermans H.A.M.
      • de Jong A.D.
      • 梅林H.
      • 十个霍夫J.
      • Hennink W.E.
      • crommelin d.j.a.
      • 其他
      用模型肽鉴定甲醛诱导的蛋白质反应中的修饰。
      )。然而,在数据集中也检测到储存甲醛加合物占305psm并严重定位于TRP(42.5倍富集)的甲醛加合物换算。总之,这些表明噻唑啉可能是甲醛暴露的伪像而不是甲醛化,尽管后者可能是Cys与甲醛反应的必要条件。 Cys的烷基化和随后的三倍和双氧化的烷基化未达成我们对Cys伪影的化学知识,以及谷胱甘肽作为生物改性的谷胱甘肽,包含8.7%的含Cys的PSM。包括这些修饰应该增加甲基化样品中的Cys-Peptide回收率。

       PTM-Shepherd计算指标有助于粒度PTM识别

      开放搜索在其提供的信息中本质上是有限的,只提供肽列表及其相关的质量换档(
      • 孔A.T.
      • Leprevost F.v.
      • avtonomov d.m.
      • Mellacheruvu D.
      • nesvizhskii a.i.
      小姐 FRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
      )。数据解释努力因大规模偏移的歧义而进一步复杂化。例如,两个甲基化事件和乙基化事件将基于质量彼此无法区分。但是,通过结合额外的指标,可以辨别出更多的粒度标识:RT,SS和本地化的变化。为了证明这些额外的指标改善了开放的搜索结果理解,我们分析了作为Proteometools项目的一部分产生的合成未经修改的胰蛋白酶组(
      • ZOLG D.P.
      • Wilhelm M.
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • Delanghe B.
      • Bailey D.J.
      • Gessulat S.
      • ehrlich h.-c.
      • Weininger M.
      • 是的。
      • Schlegl J.
      • Kramer K.
      • 施密特T.
      • Kusebauch U.
      • 等等。
      基于完整的合成人群构建蛋白质池。
      )。除了混杂的生物因素之外,该数据集允许我们检查和表征仪器伪影。
      来自肽的源损失是由低能碎片途径产生的,可以在串联MS和电离和透射期间发生,导致观察到的前体质量的艺术变化(
      • cordero m.m.
      • 别墅J.J.
      • WeSdemiotis C.
      在串联质谱中的质子化肽的骨干碎片期间形成的中性产物。
      )。由于柱洗脱后源损失和随后的RT记录发生,因此它们对肽RT没有影响。此属性可用于将它们与样本修改区分开(
      • Savitski m.m.
      • Kjeldsen F.
      • Nielsen M.L.
      • Zubarev R.A.
      碰撞活化解离的骨架片段中水和氨损失的相对特异性。
      )。我们使用PTM-Shepherd来阐明这两个数据集的起源,这两个数据集是源损失和实际修改的最常见的质量换档:H的损失2o丢失了nh3 (补充表S3)。具有对应于每个损失的多个光谱的肽使其RT转变汇总并折叠到它们的中位数。
      有趣的是,H的损失2o和nh.3 在RT中表现出双峰变化(Fig. 3)。对于培养损失的肽2O(ΔM= -18.0104DA; 2961肽),复合RT分布均近似高斯,近似手段为0和450秒。如预期的那样,许多肽(16.7%)落在平均零分布内,表明它们尽管损失高极性组,但它们不会在列RT增加。这是源自源损失的特征,并表明该分布中的肽正在表现出H源极损失2在前体选择之前在质谱仪中。肽呈现NH的损失3 (ΔM= -17.0270Da; n = 1094)显示了类似的模式。注意H.2o和nh.3 只是源丢失的两个例子,在某些情况下,整个残留物可能会丢失 通过 这种机制。作为乐器偏差的重要来源,重要的是能够正确分类源自源损耗并将其从实验样品池中取出。事实上,对于研究这些质量偏移的异常生物学形式的研究人员来说,排除这些是至关重要的。
      图缩略图GR3.
      Fig. 3保留时间(RT)肽与H损失的肽曲线2o和nh.3. 将改性肽与其同源未改性的肽进行比较,具有多个RT变化将其塌陷至其中值。对R的损失对H的影响2o(最佳)和NH.3 (底部)被双眼分布。已知这些质量偏移对应于源极损耗和自发转化。在源极损失不应对RT产生效果,因此怀疑落在以零为中心的高斯分布内。
      第二次肽与h2o和nh.3 损失表现出与预洗涤改性一致的RT转移 - 极性群体的损失较高,平均为450秒。 H2o已知损失表现为从glu转换为焦蛋白酸(
      • Kumar A.
      • Bachhawat A.K.
      焦蛋白酸:在轻微研究的代谢物上投掷光。
      )以及ASN,GLN,Ser,Thr,Tyr,ASP和Cys作为样品衍生的修改(
      • 皱褶D.M.
      • Cottrell J.s.
      UNIMOD:质谱法的蛋白质修饰。
      )。 NH.3 已知损失表现为转换为焦蛋白酸,但从gln而不是glu(
      • Dick Jr.,L.W.
      • 金C.
      • 邱D.
      • 程K.-c.
      用模型肽测定单克隆抗体的N-末端热谷氨酸变化的起源。
      )。其他损失NH3 众所周知,在Thr,Ser和Cys和任何ASN占据的某些N Termini上发生(
      • 皱褶D.M.
      • Cottrell J.s.
      UNIMOD:质谱法的蛋白质修饰。
      )。当单独转移不包含足够的信息以完全识别这些修改,通过PTM-Shepherd-Locialization倾向计算的附加度量和改性到未修饰的肽相似性 - 使我们能够描绘这些质量偏移的主要来源。
      在失去NH的情况下3,鉴定了两个主要来源(除了源源损失之外):GLN与焦蛋白的自发转化为吡息酸酯和CYS的环化。 Cys环化预计将存在于用碳酰胺甲基化的Cys合成的肽中,因为已知在烷基化后发生反应(
      • reimer J.
      • Shamshurin D.
      • 更难的米
      • Yamchuk A.
      • Spicer V.
      • krokhin o.v.
      N-末端谷氨酰胺和氨基甲酰半胱氨酸(残基)环化对反相色谱中肽色谱行为的影响。
      )。本地化分析表明,CYS(浓缩评分= 10.4)和GLN(浓缩得分= 4.7)是这种大规模转变的两个最丰富的残留物(Fig. 4A)。本地化为CYS的源源损失是罕见的,本地化为GLN的源源损失相对普遍(
      • 太阳S.
      • yu c.
      • 乔Y.
      • 林Y.
      • 董G.
      • 刘C.
      • 张继夫
      • 张Z.
      • CAI J.
      • 张H.
      • 埠D.
      衍生来自串联质谱的氨基酸的水分损失和氨损失的概率。
      ),其反映在每个残留物的肽数量中,每次残留物产生Δrt= 0.为了说明,Cys具有与聚集体中其他残基不同的Rt曲线,而Gln具有类似的分布(Fig. 4C);没有那些含有Cys的人局限性NH3 损失是源源损失,与19.6%的其他残留物中的汇总相比。
      图缩略图GR4.
      Fig. 4H的分析曲线2o和nh.3. AB,本地化型材揭示了具有特定残留物的非均匀景观,显示富集。 CD,选择修改可区分从它们对保留时间的效果的背景中的源极衰减。 EF,相似性分数显示Lys对C末端修饰的较低曲线,而N末端修改Glu,Cys和Gln具有更高的相似性。
      与NH.3,我们预计H的损失2o只富含谷氨酸富含富含谷氨酸。众所周知,谷氨酸有两个损失的源2O;已知是水中源损失的源,但也可以自发地经历N末端环化 体外 产生相同的大规模偏移(
      • Chelius D.
      • j
      • Lueras A.
      • rehder d.s.
      • 狄龙三。
      • vizel A.
      • Rajan R.S.
      • 李T.
      • treuheit m.j.
      • Bondarenko P.V.
      从免疫球蛋白γ抗体中的N-末端谷氨酸形成焦蛋白酸。
      )。损失H的本地化浓缩概况2o(Fig. 4B然而,揭示了两种残留物是PTM患病率的特殊贡献者:Glu(富集得分= 2.2)和Lys(富集得分= 7.6)。我们确定了H损失H的肽群体2o对应于如前所述的基于ΔRT的这些群体(Fig. 4B, 红色的)。 ΔRt= 0 s附近的强峰表明许多独特的肽能够产生H的源极损耗 2o(22.8%)Glu,符合太阳的结论 等等。 (
      • 太阳S.
      • yu c.
      • 乔Y.
      • 林Y.
      • 董G.
      • 刘C.
      • 张继夫
      • 张Z.
      • CAI J.
      • 张H.
      • 埠D.
      衍生来自串联质谱的氨基酸的水分损失和氨损失的概率。
      )。 ΔRt= 300秒附近的另一个峰表明肽的其余部分丧失H.2o在柱洗脱之前存在,因此可能是谷氨酸发生的N-末端环化 体外.
      甚至比谷氨酸更多,赖氨酸是H的最大贡献者2o(示例频谱 补充图S2)。困扰地,赖氨酸的侧链没有羟基,它可以容易地失去,并且如此2o由于赖氨酸的损失必须来自胰蛋白酶肽的C-末端羟基。值得注意的是,这种现象对赖氨酸是独一无二的,因为arg具有所有20个残留物的最低定位浓缩评分(0.2)(Fig. 4B)。基于RTS,也没有明显的h2o源于赖氨酸 - 与以前的发现一致的源损失(
      • 太阳S.
      • yu c.
      • 乔Y.
      • 林Y.
      • 董G.
      • 刘C.
      • 张继夫
      • 张Z.
      • CAI J.
      • 张H.
      • 埠D.
      衍生来自串联质谱的氨基酸的水分损失和氨损失的概率。
      ) - 在洗脱之前脱水(Fig. 4D)。我们认为这是因为C末端赖氨酸环化事件最有可能。虽然在蛋白质组学中没有被描述的蛋白质组学,但赖氨酸衍生物环化已在其他环境中诱导(
      • 他w。
      • 陶y
      • 王X.
      功能性聚酰胺:通过赖氨酸环化和有机催化开环聚合的可持续进入。
      )。肽之间的SS计算支持该理论,其中肽与没有这种赖氨酸局部大规模偏移(Fig. 4F)。在改性和​​未修饰的肽的光谱之间存在异常低SS。含有在C末端附近的非相位修改和修饰的肽导致低SS;非倾向于修改可能保留在MS / MS光谱中,而不是在MS1分析期间被移除,并且C末端修改换档激烈的Y离子系列。肽C Termini上的共价结合的赖氨酸环结构拟合这些标准,并且可能是低SS的潜在原因。
      Glu,Cys和Gln损失的相似性谱不同于Lys,因为它们未富集MS / MS的肽,其显示与其未修饰的对应物的低相似性。这可能是由于Glu环化,如Cys和Gln,在N末端发生;移位B离子系列对MS / MS光谱的影响较小而不是移位Y离子系列。不出所料,所有这三个具有相似性曲线大致对应于其谱的比例体验 体外 修改,这是我们肯定的唯一修改就在n末端发生。
      总体而言,通过在PTM识别中包括超越质量转变的指标,我们表明可以推导出超出大规模转变的化学成分的更多信息。 RTS可用于区分源源损耗和采样修改,可以使用本地化配置文件来推导生物或化学起源,SS提供额外的本地化和衡量指标。我们发现所有这些,我们知道我们的知识,在深度后果合成肽库中先前未知或至少持久过量的修饰(C末端赖氨酸环化)。

       PTM-Shepherd在多分体设置

      PTM-Shepherd可以在多因素模式下运行,以分析大量实验的修改谱。可以对这种有趣的生物趋势的可视化和寻求实验的生物修饰来进行这种分析。它对QC和批量效应的检测也是有用的 - 高吞吐量数据的常见变化源(
      • 韭菜J.T.
      • Scharpf R.B.
      • Bravo H.C.
      • Simcha D.
      • Langmead B.
      • 约翰逊W.E.
      • Geman D.
      • 袋手K.
      • Irtizarry R.A.
      解决批量效应对高吞吐量数据的广泛和关键影响。
      )。以前的努力识别MS性能指标(
      • Rudnick p.a.
      • 克劳瑟K.R.
      • kilpatrick l.e.
      • tchekhovskoi d.v.
      • Neta P.
      • Blonder N.
      • Billheimer D.D.
      • 黑人r.k.
      • 双打下午。
      • Cardasis H.L.
      • 火腿A.-J.L.
      • Jaffe J.D.
      • kinsinger c.r.
      • Mesri M.
      • neubert t.a.
      • 等等。
      蛋白质组学分析中液相色谱 - 串联质谱系统的性能度量。
      ),有些群体已经显示了如何利用这些QC问题(
      • 王X.
      • Chambers M.C.
      • Vega-Montoto L.J.
      • 双打下午。
      • Stein S.E.
      • Tabb D.L.
      来自CPTAC原始LC-MS / MS数据的QC指标通过多变量统计来解释。
      )更好地了解intralaboratory和Interlaboratory可变性(
      • Paulovich A.G.
      • Billheimer D.
      • 火腿A.-J.L.
      • Vega-Montoto L.
      • Rudnick p.a.
      • Tabb D.L.
      • 王P.
      • 黑人r.k.
      • 双打下午。
      • Cardasis H.L.
      • 其他
      用于基准测试LC-MS平台性能的酵母性能标准的互借性研究。
      ,
      • Tabb D.L.
      • Vega-Montoto L.
      • Rudnick p.a.
      • variyath上午
      • 火腿A.-J.L.
      • 双打下午。
      • kilpatrick l.e.
      • Billheimer D.D.
      • 黑人r.k.
      • Cardasis H.L.
      • 其他
      液相色谱 - 串联质谱法通过蛋白质组学鉴定的可重复性和再现性。
      )。我们假设开放搜索派生的修改配置文件可用于确定意图变化,同时提供进入其起源的洞察力。
      为了评估Multipperiment设置中的PTM分析,我们使用了CPTAC组成的参考材料数据(汇集肿瘤异种移植物,所述肿瘤异种移植物包含10种不同的乳腺癌亚型,低温覆盖和运输到不同的处理位置)(参见 方法 部分)。将样品在三个不同的位置(PNN1,JHU和BI)处理,并使用TMT 10-Plex标记技术分析,作为CPTAC3协调研究的一部分(
      • Mertins P.
      • 唐人
      • 克鲁格克。
      • 克拉克D.J.
      • 格里尼科米。
      • 陈L.
      • 克劳瑟K.R.
      • Clauss T.R.
      • 莎第P.
      • Gillette M.A.
      • petyuk v.a.
      • 托马斯S.N.
      • MANI D.R.
      • Mundt F.
      • 摩尔r.j.
      • 等等。
      液相色谱 - 质谱法的多重深度蛋白质组和肿瘤组织磷脂蛋白酶体分析的可重复工作流程。
      )。作为三种大型癌症分析研究的一部分,还分析了相同的组合样品作为纵向QC样本,透明细胞肾细胞癌(
      • 克拉克D.J.
      • Dhanasekaran S.M.
      • Petralia F.
      • 潘J.
      • 歌曲X.
      • 胡Y.
      • da Veiga Leprevost F.
      • Reva B.
      • LIH T.M.
      • 常熟。
      • 马W.
      • 黄C.
      • Ricketts C.J.
      • 陈L.
      • Krek A.
      • 等等。
      透明细胞肾细胞癌的综合突果表征。
      )(在jhu收集的MS数据;子宫内膜子宫内膜癌(
      • 窦啊。
      • kawaler e.a.
      • 崔周D.
      • 格里尼科米。
      • 黄C.
      • Blumenberg L.
      • karpova a。
      • petyuk v.a.
      • 野蛮的S.R.
      • Satpathy S.
      • 刘W.
      • 吴y.
      • Tsai c.f.
      • 温B.
      • 李Z.
      • 等等。
      子宫内膜癌的蛋白质表征。
      )(在PNN1收集的MS数据)和肺腺癌(
      • Gillette M.A.
      • Satpathy S.
      • Cao S.
      • Dhanasekaran S.M.
      • Vasaikar S.v.
      • 克鲁格克。
      • Petralia F.
      • 李Y.
      • 梁W.W.
      • Reva B.
      • Krek A.
      • 吉杰。
      • 歌曲X.
      • 刘W.
      • 洪R.
      • 等等。
      蛋白质表征揭示了肺腺癌中的治疗性脆弱性。
      )(在BI)收集的MS数据)。
      我们首先在这些数据中调查了Msfragger和PTM-Shepherd的最丰富的质量换档(表格1;看 补充表S4A 对于完整列表),揭示了几个有趣的观察。通常,PTM-Shepherd精确地重建了预期的趋势,包括最丰富的修改的本地化配置文件。例如,在N末端,SER上的磷酸化和TRP氧化最高度富集氨基甲酰化和甲酰化。不考虑同位素误差,229.1629Da(TMT综合标记)的质量偏移是最常见的修饰,主要是SER(富集因子为5.6)。值得注意的是,在未修饰的形式中也只发现了在SER上的TMT发现的74.5%的肽(IE。,未标记的Ser)。相反,在几乎所有情况下,在改性和未改性的形式中发现了许多其他丰富的修饰,例如甲酰化和氨基甲酸酯。有趣的是,第二个最丰富的修改是15.0107的大规模偏移,主要是达到满足的(从氧化的组合和-0.9842 DA损失,Msfragger输出的Msfragger输出)。这种质量偏移可以代表由于暴露于羟胺而达到NH基团的添加,该试剂在TMT标记中使用。目前,UNIMOD数据库仅作为羧酸转化为羧酸至羟肟酸的15.0107Da质量转移,仅用ASP和Glu作为可能的位点(在这些数据中观察到,但在较低的频率下比在满足时,请参阅 表格1)。
      表格1来自CPTAC QC样品的顶部质量偏移
      大规模转移PSM分配修改未修饰的%相似Delta RT.n末端率(%)AA_1AA_2
      0.0004,372,080没有100.000.9800
      1.002913,405+1同位素错误79.430.8153
      229.163312,295TMT.74.520.38−706s(5.6)T(2.4)
      2.005177,121+2同位素错误75.950.7441
      -0.984(15.011 *)156,315除了m *90.250.71−1731M(15.8)
      230.166141,498+1同位素误差+ TMT72.510.42−1536s(3.8)
      0.017117,922+1同位素误差+ nh除了m *69.970.7811M(5.8)
      0.984110,967脱染68.840.68536n(12.7)r(5.3)
      17.02692,862氘代甲酯94.960.76−501
      15.01187,013将羧酸转化为羟肟酸95.220.54−4344E(5.5)d(3.5)
      −1.00272,465-1同位素误差/ +1同位素误差+二硫化物桥的一半*81.400.78161C(4.8)w(4.5)
      15.99559,846氧化 91.190.49−34221w(24.0)M(11.7)
      100.01659,070琥珀酸酐标记试剂 95.760.5559677p(3.6)s(2.1)
      27.99552,323素化93.220.6126561s(2.7)
      79.96748,379磷酸化55.300.645694S(6.2)
      21.98147,471加合物加合物98.720.25−1482
      115.02747,022羟胺的EGS蛋白交联的切割产物97.810.5861086H(2.5)
      43.01045,450胭脂酸97.100.6464070
      -18.01045,445来自e的脱水/烫发 - glu97.480.64−17512d(3.2)T(2.5)
      1.98742,988+1同位素误差+脱胺69.080.66454n(11.9)r(3.0)
      CPTAC.,临床蛋白质组学肿瘤分析联盟; EGS,乙二醇纤维(琥珀酰亚胺琥珀酸盐); PSM,肽谱匹配; QC,质量控制; Rt,保留时间; TMT,串联质量标签。
      分配的修改对应于自动化的Unimod匹配,其中*表示部分手动速度的质量偏移。这 未修饰的% 列对应于在未修饰的箱中具有匹配的未修改的PSM的PSM的百分比。顶层两种富集的氨基酸本地化显示为表示AA的柱子。
      提出了由PTM-Shepherd分析这些数据产生的PTM配置文件 图5.。样本明智的K-Meantoring集群显示出不同的样品簇,并且质量换档聚类在柱(转置PTM-Shepherd输出)之间的相关性上显示出一些高度相似的修改。样本聚类精确地重建样品处理位置。例如,群集4中 图5. 显示了与TMT综合标记或TMT标记相关的一系列质量换档,其未通过固定序列膨胀对肽N Termini上的Lys和动态序列膨胀的固定序列扩展捕获。 PNNL数据始终如一地显示比BI和JHU更低的TMT综合标记,对于该簇中的每个大规模转移,对应于单个额外TMT的PSM比在其他两个位置低5到8倍。 BI和JHU还显示SER上的TMT标签的浓缩,并在较小程度上,THR。
      图缩略图GR5.
      Fig. 5聚集的热图表示CPTAC3质量控制样品从PTM牧羊犬输出输出。 所示值是柱谱Z分数的频谱计数。列聚类显示高度相关的修改,行群集通过处理位置显示实验聚类。文本中讨论的质量换档簇被编号,并且它们的相应质量偏移显示在图底部左右。使用肿瘤型标记(Luad,UCEC或CCRCC)来指示纵向在其各自研究中处理的样品。没有肿瘤型标记的样品作为CPTAC协调研究的一部分加工。簇2中的质量偏移对应于负质量偏移。 *此注释是手动构建的。 ** - 14DA可以对应于大量修改和单余残留突变。 BI,Broad Institute; CCRCC,透明细胞肾细胞癌; Jhu,约翰霍普金斯大学;路德,肺腺癌; PNNL,太平洋西北国家实验室; TMT,串联质量标签; UCEC,子宫毒物子宫内膜癌。
      虽然我们希望看到TMT标签保真度的差异,但PTM-Shepherd还允许我们探索意外的批量效果。 Lenčo. 等等。 (
      • LenčoJ.
      • Khalikova M.A.
      • ŠvecF.
      溶解0.1%甲酸中的肽带来人工甲型化的风险。
      )最近提出了关于在样品制备中使用甲酸的担忧,具体说明在与其重构的样品中存在过量的Ser,Thr和N-末端甲型化事件。在CPTAC协调研究中,本地化配置文件确实与Lenčo描述的匹配 等等。:Ser富集为2.7,Thr富集为1.9,潜在的N末期率为61%(补充表S4A)。有趣的是,这种甲蛋白化峰值在两个双BI的第一个从协调研究中重复时似乎不成比例地高(Fig. 5,群集5)。 Bi01复制的甲酰化10至20倍高于JHU01或PNNL01,甚至高于BI02的四倍。 Ser和Thr还表现出膨胀的甲型本地化的该样品,与Lenčo的结果一致 等等。 (补充表S4, BC)。总的来说,在未来的研究中可能需要更深入的分析,以减少甲酸使用造成的批量效应。这些分析可以扩展到其他样本处理伪影, 例如,钾加合物(簇1)和钠加合物(簇6),也表现出明显的纵向变异性。
      PTM-Shepherd还揭示了仪器参数可能在实验室特定的批量效果中发挥作用。我们注意到跨实验室差异识别的四种大量负面偏移量(Fig. 5,群集2)。 RT分析表明,这些质量偏移可能是源极损失(补充图S3)。它们的型材与氨的损失相似,源自源损失和与甲酰化不同,一种已知的预洗涤改性(补充图S3)。序列分析有助于手动分解,揭示三种质量偏移由疏水残余物(ISO,Leu,Pro或Gly),C末端Lys,TMT标签和水组成。最终的质量转变是C末端Lys,TMT标签和水的损失。实验室之间的碎片或电离能量的微小差异可能表现为前体充电状态和质子迁移率的差异;然而,确定这些正在发生的机制超出了这项工作的范围。
      除了分析样本集群的方式如何聚集在一起,还可以收集有用的信息,从分析大规模转移集群将如何聚集在一起。我们预计相关的修改应该在实验之间具有高度相关的丰富,同位素误差峰值是最明显的例子(例如,钾和钠加合物及其相关的+1同位素误差峰; Fig. 5,簇1和6)。使用A. z - 刻录到跨越相关源的PTM跨越与群集的相关源的PTM进行统治,并在列之间的相关性上进行聚类,我们能够根据与其他(已知的)修改的群体识别一些未知的质量换档。在以前注意的TMT相关的群集中(Fig. 5,集群4),我们观察了错过了02by自动注释的三个质量换档。在被注释的六个中,五种质量偏移是直接归因于TMT综合标记,并且在肽序列的一端进行错过的胰蛋白酶切割或另外的Arg。这些知识使我们能够解释一个未错过的裂缝和TMT标签的组合之一。一个修改(+ 357.2584Da)正是TMT标记的Lys残基的质量。这是由自动注释错过的,因为在PTM-Shepherd分析期间,添加了Lys和TMT10 Plex的增加比两者的组合更加丰富。其他不明原因的质量转移(+213.1680Da)可以通过TMT综合标记和脱水事件的组合来解释,包括作为可变改性的脱水事件或误判式氧化。总体而言,该分析表明,使用PTM-Shepherd来说,多探测性分析的效用,以更好地确定质量偏移不适合自动注释。
      最后,尽管我们的上述分析主要集中在由于标签和其他样品处理步骤而引入的修改,但质量换档的聚类也可用于揭示相关的生物修改。值得注意的是,PTM-Shepherd结果的聚类表明,磷酸化(+79.9663Da)与六十一(+203.0794DA)最相关(Fig. 5,群集3)。有趣的是,最近在实验富集磷酸肽的数据集中观察到糖肽的共生肽(
      • Palmisano G.
      • Parker B.L.
      • Engholm-Keller K.
      • 恒星
      • Kulej K.
      • Schulz M.
      • SchwämmleV。
      • 格雷厄姆M.E.
      • Saxtorph H.
      • Cordwell S.J.
      一种新的富集,鉴定和定量磷酸肽和唾液酸化糖肽的富集,鉴定和定量应用于小鼠脑发育的时间剖面。
      );然而,没有应用磷肽富集步骤以产生本工作中使用的数据。

      结论

      尽管计算蛋白质组学中的进步,但许多MS / MS光谱仍然是未解释的。使用MSFRAGGER等工具的开放搜索已被证明是一种有效的方法来克服传统数据库搜索的局限,通过去除先前了解样品中存在的肽修饰的要求。然而,开放式搜索所阐明的修改缺乏许多对其身份和起源的正确确定所需的许多指标。我们在PTM-Shepherd中解决了这些挑战,它为开放搜索派生的质量转移产生了全面的PTM配置文件,包括多个UNIMOD注释,RT更改,SS和本地化配置文件。
      我们展示了PTM-Shepherd在四个例子中的效用,为其他人提供了一个广泛应用的其他人在自己的研究中进行PTM分析的广泛应用指南。首先,在开发FFPE治疗PTM调色板时,我们展示了PTM-Shepherd如何消化两种重叠峰:甲酰化和去甲基化。我们还证明了如何为其他样品制备方法轻松构建PTM调色板而无需广泛的后处理。其次,我们展示了PTM-Shepherd如何将质量分解成多种UniMod修改的独特能力,使我们能够识别和量化失败的烷基化程度,尽管这很容易与其他情况会扩张, 例如,识别对应于不存在的可变修改和另一个共同发生的修改的质量换档。我们还证明了将额外指标的额外指标纳入PTM识别,为研究人员提供了更粒度和高置信度PTM身份的研究人员,包括区分样品衍生和仪器衍生的伪像的能力。最后,当应用于来自大型多中心蛋白质组学研究的数据时,PTM-Shepherd帮助我们可视化批量效应和样品处理位置的效果,以及阐明未经发布的质量偏移的身份。我们认为PTM-Shepherd将成为我们的MSFRGRAGER的管道中广泛使用的组成部分,以综合分析翻译后和化学修改,包括在各种生物应用中进行罕见甚至新颖的修改。

      数据和软件可用性

      可以使用在文本中引用的特定数据集标识符,从PROTEMOMEXCHANGE联盟中使用文章中使用的所有原始MS数据从PPTAC数据门户中找到。可以访问PSM列表 //doi.org/10.5281/zenodo.4042962。 PTM-Shepherd可作为独立罐子可执行(//github.com/Nesvilab/PTM-Shepherd)并完全集成到Fragpipe图形用户界面( http://fragpipe.nesvilab.org/)。

      利益冲突

      作者声明没有竞争利益。

      致谢

      作者感谢我们的工具的用户提供反馈。

      作者捐款

      A. I. N.和A.T. K.构思了该项目; A.T. K.开发了软件的第一个版本,后来被D. J.G扩展和改进。 D. J.G.进行了所有分析; D. M. A.,F. Y.和F. L.促成了软件开发; D. J.G和A. I. N.将文章与来自所有作者的投入写作,A. I. N.监督整个项目。

      资金和其他信息

      这项工作部分由国家卫生研究院资助R01-GM-094231,R01-GM-135504和U24-CA210967。 D.J.G。部分受癌症训练计划的突果区(T32-CA140044)的支持。内容完全是作者的责任,不一定代表国家卫生研究院的官方意见。

      补充数据

      参考

        • ENG J.K.
        • Searle B.C.
        • 克劳瑟K.R.
        • Tabb D.L.
        人群中的一张脸:通过数据库搜索识别肽。
        摩尔。细胞。蛋白质组学。 2011; 10 (R111-009522)
        • nesvizhskii a.i.
        霰弹枪蛋白质组学中肽和蛋白质鉴定的计算方法和误差率估算程序调查。
        J.蛋白质组学。 2010; 73: 2092-2123
        • 鸡爪。
        • Kolippakkam D.
        • Nusinow D.P.
        • 翟德
        • RAD R.
        • Huttlin E.L.
        • Gygi S.P.
        容许数据库搜索识别霰弹枪蛋白质组学中的大部分未分配的光谱作为改性肽。
        NAT。 Biotechnol。 2015; 33: 743-749
        • 孔A.T.
        • Leprevost F.v.
        • avtonomov d.m.
        • Mellacheruvu D.
        • nesvizhskii a.i.
        小姐 FRAGRE:基于质谱的蛋白质组学中的超快和综合肽鉴定。
        NAT。方法。 2017; 14: 513-520
        • nesvizhskii a.i.
        • Roos f.f.
        • 格罗斯曼J.
        • Vogelzang M.
        • eddes J.s.
        • Gruissem W.
        • Baginsky S.
        • Aeberberold R.
        霰弹枪蛋白质组学数据的动态谱质量评估和迭代计算分析:更有效地识别翻译后修饰,序列多态性和新型肽。
        摩尔。细胞。蛋白质组学。 2006; 5: 652-670
        • 宁克。
        • 费尔明D.
        • nesvizhskii a.i.
        蛋白质组学数据集未分配的高质量MS / MS光谱的计算分析。
        蛋白质组学。 2010; 10: 2712-2718
        • Chi H.
        • 刘C.
        • 杨H.
        • 曾W.-f.
        • 吴L.
        • 周W.-J.
        • 王r.-m.
        • niu x.-n.
        • 丁Y.-h.
        • 张Y.
        高效开放搜索引擎综合鉴定串联质谱中的肽。
        NAT。 Biotechnol。 2018; 36: 1059-1061
        • solntsev s.k.
        • 短red m.r.
        • Frey B.L.
        • 史密斯l.m.
        通过Metamorpheus增强全球翻译后修改发现。
        J.蛋白质组。 2018; 17: 1844-1851
        • na s.
        • Bandeira N.
        • PAEK E.
        快速多盲修改通过串联质谱进行搜索。
        摩尔。细胞蛋白质组学。 2012; 11 (M111.010199)
        • Dasari S.
        • Chambers M.C.
        • Slebos R.J.
        • Zimmerman L.J.
        • 火腿A.-J.L.
        • Tabb D.L.
        Tagrecon:通过序列标记识别高吞吐量突变识别。
        J.蛋白质组。 2010; 9: 1716-1726
        • avtonomov d.m.
        • 孔子A.
        • nesvizhskii a.i.
        DELTAMASS:蛋白质组学开放搜索结果中的自动检测和可视化。
        J.蛋白质组。 2018; 18: 715-720
        • Z.
        • 翟尔。
        • ying w.
        • 钱X.
        • 锣F.
        • 棕褐色
        • 傅y.
        PTMINER:在开放式搜索中检测到蛋白质修饰的本地化和质量控制及其在人类蛋白质组中综合翻译后修饰表征的应用。
        摩尔。细胞。蛋白质组学。 2019; 18: 391-405
        • Shteynberg D.D.
        • 德意曲e.w.
        • 坎贝尔D.S.
        • Hooopmann M.R.
        • Kusebauch U.
        • 李德。
        • 门多萨L.
        • Midha M.K.
        • 太阳Z.
        • Whetton A.D.
        PTMPROCH:用于转蛋白管道的快速准确的质量修改定位。
        J.蛋白质组。 2019; 18: 4262-4272
        • da Veiga Leprevost F.
        • Haynes S.E.
        • avtonomov d.m.
        • 常熟。
        • Shanmugam A.K.
        • Mellacheruvu D.
        • 孔A.T.
        • nesvizhskii a.i.
        哲学家:霰弹枪蛋白质组学数据分析的多功能工具包。
        NAT。方法。 2020; 17: 869-870
        • 皱褶D.M.
        • Cottrell J.s.
        UNIMOD:质谱法的蛋白质修饰。
        蛋白质组学。 2004; 4: 1534-1536
        • Tabb D.L.
        • Murugan B.D.
        • okendo J.
        • Nair O.
        • 布莱克本准噶。
        • Buthelezi S.G.
        • 斯托赫夫S.
        开放式搜索揭示福尔马林固定,石蜡包埋的热HCD和SCIEX TriLletof霰弹枪蛋白质组的修改模式。
        int。 J.质谱。 2019; 448: 116266
        • Nielsen N.S.
        • Poulsen e.t.
        • Klintworth G.K.
        • Enghild J.J.
        深入了解眼睑,轨道和结膜淀粉样蛋白的免疫球蛋白轻链沉积物的蛋白质组成。
        J.蛋白质组学生物素。 2014; 提供8.002
        • Nair O.
        在南非小儿队队列中的分析髓质母细胞瘤和少年皮霉菌星形细胞瘤脑肿瘤。
        南非开普敦开普敦大学, 2017
        • ZOLG D.P.
        • Wilhelm M.
        • Schnatbaum K.
        • Zerweck J.
        • knaute t.
        • Delanghe B.
        • Bailey D.J.
        • Gessulat S.
        • ehrlich h.-c.
        • Weininger M.
        • 是的。
        • Schlegl J.
        • Kramer K.
        • 施密特T.
        • Kusebauch U.
        • 等等。
        基于完整的合成人群构建蛋白质池。
        NAT。方法。 2017; 14: 259-262
        • 爱德华兹N.J.
        • 令人渊m
        • thangudu r.r.
        • CAI S.
        • 麦加维P.B.
        • 雅各布S.
        • Madhavan S.
        • Ketchum K.A.
        CPTAC.数据门户:癌症蛋白质组学研究的资源。
        J.蛋白质组。 2015; 14: 2707-2713
        • Mertins P.
        • 唐人
        • 克鲁格克。
        • 克拉克D.J.
        • 格里尼科米。
        • 陈L.
        • 克劳瑟K.R.
        • Clauss T.R.
        • 莎第P.
        • Gillette M.A.
        • petyuk v.a.
        • 托马斯S.N.
        • MANI D.R.
        • Mundt F.
        • 摩尔r.j.
        • 等等。
        液相色谱 - 质谱法的多重深度蛋白质组和肿瘤组织磷脂蛋白酶体分析的可重复工作流程。
        NAT。 protoc。 2018; 13: 1632-1661
        • yu f.
        • TEO G.C.
        • 孔A.T.
        • Haynes S.E.
        • avtonomov d.m.
        • Geiszler D.J.
        • nesvizhskii a.i.
        使用本地化感知开放搜索识别修饰的肽。
        NAT。安排。 2020; 11: 4065
        • 凯勒阿。
        • nesvizhskii a.i.
        • Kolker E.
        • Aeberberold R.
        经验统计模型来估计MS / MS和数据库搜索的肽识别的准确性。
        肛门。化学。 2002; 74: 5383-5392
        • 常熟。
        • 孔A.T.
        • da Veiga Leprevost F.
        • avtonomov d.m.
        • Haynes S.E.
        • nesvizhskii a.i.
        Crysty-C:用于改进开放搜索结果的计算工具。
        J.蛋白质组。 2020; 19: 2511-2515
        • 张Y.
        • Muller M.
        • 徐B.
        • Yoshida Y.
        • Horlacher O.
        • Nikitin F.
        • Garessus S.
        • Magdeldin S.
        • Kinoshita N.
        • Fujinaka H.
        • Yaoita E.
        • Hafegawa M.
        • Lisacek F.
        • Yamamoto T.
        不受限制的修改搜索显示赖氨酸甲基化作为组织福尔马林固定和石蜡嵌入的主要改性。
        蛋白质组学。 2015; 15: 2568-2579
        • Etherington D.J.
        • SIMS T.J.
        胶原蛋白的检测和估计。
        J. SCI。食物农业。 1981; 32: 539-546
        • plasky d.a.
        • yu f.
        • TEO G.C.
        • nesvizhskii a.i.
        使用Msfrgager-Glyco快速综合的N-和O-糖蛋白酶分析。
        NAT。方法。 2020; 17: 1125-1132
        • Chung H.S.
        • 王S.-B.
        • Venkatraman V.
        • 默里C.I.
        • 范艾克J.E.
        半胱氨酸氧化后期改性:心血管系统中的新兴调节。
        CIRC。 res。 2013; 112: 382-392
        • SECHI S.
        • Chait B.T.
        通过烷基化改变半胱氨酸残基。肽映射和蛋白质鉴定的工具。
        肛门。化学。 1998; 70: 5150-5158
        • Schnatbaum K.
        • ZOLG D.
        • 文字H.
        • reimer u.
        快速准确地测定蛋白质组学工作流中的半胱氨酸还原和烷基化效果。
        2016 (JPT应用笔记,柏林,德国)
        • Bekker -Jensen D.B.
        • Kelstrup C.D.
        • Batth T.S.
        • Larsen S.C.
        • 脱落C.
        • Bramsen J.B.
        • SørensenK.D.
        • Høyers。
        • Ørntoftt.f.
        • 安德森C.L.
        • 其他
        综合人类蛋白质群快速产生的优化霰弹枪战略。
        细胞系统。 2017; 4: 587-599
        • 梅茨B.
        • 克斯滕G.F.A.
        • HOOGERHOUT P.
        • Brugghe H.F.
        • Timmermans H.A.M.
        • de Jong A.D.
        • 梅林H.
        • 十个霍夫J.
        • Hennink W.E.
        • crommelin d.j.a.
        • 其他
        用模型肽鉴定甲醛诱导的蛋白质反应中的修饰。
        J. Biol。化学。 2004; 279: 6235-6243
        • cordero m.m.
        • 别墅J.J.
        • WeSdemiotis C.
        在串联质谱中的质子化肽的骨干碎片期间形成的中性产物。
        肛门。化学。 1993; 65: 1594-1601
        • Savitski m.m.
        • Kjeldsen F.
        • Nielsen M.L.
        • Zubarev R.A.
        碰撞活化解离的骨架片段中水和氨损失的相对特异性。
        J.蛋白质组。 2007; 6: 2669-2673
        • Kumar A.
        • Bachhawat A.K.
        焦蛋白酸:在轻微研究的代谢物上投掷光。
        Curr。 SCI。 2012; 102: 288-297
        • Dick Jr.,L.W.
        • 金C.
        • 邱D.
        • 程K.-c.
        用模型肽测定单克隆抗体的N-末端热谷氨酸变化的起源。
        Biotechnol。生物。 2007; 97: 544-553
        • reimer J.
        • Shamshurin D.
        • 更难的米
        • Yamchuk A.
        • Spicer V.
        • krokhin o.v.
        N-末端谷氨酰胺和氨基甲酰半胱氨酸(残基)环化对反相色谱中肽色谱行为的影响。
        J.Chromatogr。一种。 2011; 1218: 5101-5107
        • 太阳S.
        • yu c.
        • 乔Y.
        • 林Y.
        • 董G.
        • 刘C.
        • 张继夫
        • 张Z.
        • CAI J.
        • 张H.
        • 埠D.
        衍生来自串联质谱的氨基酸的水分损失和氨损失的概率。
        J.蛋白质组。 2008; 7: 202-208
        • Chelius D.
        • j
        • Lueras A.
        • rehder d.s.
        • 狄龙三。
        • vizel A.
        • Rajan R.S.
        • 李T.
        • treuheit m.j.
        • Bondarenko P.V.
        从免疫球蛋白γ抗体中的N-末端谷氨酸形成焦蛋白酸。
        肛门。化学。 2006; 78: 2370-2376
        • 他w。
        • 陶y
        • 王X.
        功能性聚酰胺:通过赖氨酸环化和有机催化开环聚合的可持续进入。
        大分子。 2018; 51: 8248-8257
        • 韭菜J.T.
        • Scharpf R.B.
        • Bravo H.C.
        • Simcha D.
        • Langmead B.
        • 约翰逊W.E.
        • Geman D.
        • 袋手K.
        • Irtizarry R.A.
        解决批量效应对高吞吐量数据的广泛和关键影响。
        NAT。 Rev. Genet。 2010; 11: 733-739
        • Rudnick p.a.
        • 克劳瑟K.R.
        • kilpatrick l.e.
        • tchekhovskoi d.v.
        • Neta P.
        • Blonder N.
        • Billheimer D.D.
        • 黑人r.k.
        • 双打下午。
        • Cardasis H.L.
        • 火腿A.-J.L.
        • Jaffe J.D.
        • kinsinger c.r.
        • Mesri M.
        • neubert t.a.
        • 等等。
        蛋白质组学分析中液相色谱 - 串联质谱系统的性能度量。
        摩尔。细胞。蛋白质组学。 2010; 9: 225-241
        • 王X.
        • Chambers M.C.
        • Vega-Montoto L.J.
        • 双打下午。
        • Stein S.E.
        • Tabb D.L.
        来自CPTAC原始LC-MS / MS数据的QC指标通过多变量统计来解释。
        肛门。化学。 2014; 86: 2497-2509
        • Paulovich A.G.
        • Billheimer D.
        • 火腿A.-J.L.
        • Vega-Montoto L.
        • Rudnick p.a.
        • Tabb D.L.
        • 王P.
        • 黑人r.k.
        • 双打下午。
        • Cardasis H.L.
        • 其他
        用于基准测试LC-MS平台性能的酵母性能标准的互借性研究。
        摩尔。细胞。蛋白质组学。 2010; 9: 242-254
        • Tabb D.L.
        • Vega-Montoto L.
        • Rudnick p.a.
        • variyath上午
        • 火腿A.-J.L.
        • 双打下午。
        • kilpatrick l.e.
        • Billheimer D.D.
        • 黑人r.k.
        • Cardasis H.L.
        • 其他
        液相色谱 - 串联质谱法通过蛋白质组学鉴定的可重复性和再现性。
        J.蛋白质组。 2009; 9: 761-776
        • 克拉克D.J.
        • Dhanasekaran S.M.
        • Petralia F.
        • 潘J.
        • 歌曲X.
        • 胡Y.
        • da Veiga Leprevost F.
        • Reva B.
        • LIH T.M.
        • 常熟。
        • 马W.
        • 黄C.
        • Ricketts C.J.
        • 陈L.
        • Krek A.
        • 等等。
        透明细胞肾细胞癌的综合突果表征。
        细胞。 2019; 179: 964-983.E931.
        • 窦啊。
        • kawaler e.a.
        • 崔周D.
        • 格里尼科米。
        • 黄C.
        • Blumenberg L.
        • karpova a。
        • petyuk v.a.
        • 野蛮的S.R.
        • Satpathy S.
        • 刘W.
        • 吴y.
        • Tsai c.f.
        • 温B.
        • 李Z.
        • 等等。
        子宫内膜癌的蛋白质表征。
        细胞。 2020; 180: 729-748.E726
        • Gillette M.A.
        • Satpathy S.
        • Cao S.
        • Dhanasekaran S.M.
        • Vasaikar S.v.
        • 克鲁格克。
        • Petralia F.
        • 李Y.
        • 梁W.W.
        • Reva B.
        • Krek A.
        • 吉杰。
        • 歌曲X.
        • 刘W.
        • 洪R.
        • 等等。
        蛋白质表征揭示了肺腺癌中的治疗性脆弱性。
        细胞。 2020; 182: 200-225.E235.
        • LenčoJ.
        • Khalikova M.A.
        • ŠvecF.
        溶解0.1%甲酸中的肽带来人工甲型化的风险。
        J.蛋白质组。 2020; 19: 993-999
        • Palmisano G.
        • Parker B.L.
        • Engholm-Keller K.
        • 恒星
        • Kulej K.
        • Schulz M.
        • SchwämmleV。
        • 格雷厄姆M.E.
        • Saxtorph H.
        • Cordwell S.J.
        一种新的富集,鉴定和定量磷酸肽和唾液酸化糖肽的富集,鉴定和定量应用于小鼠脑发育的时间剖面。
        摩尔。细胞。蛋白质组学。 2012; 11: 1191-1202

      广告