蛋白质order 2.0:核糖体仿形辅助蛋白叶MOMIC寻找新型蛋白质ord的进一步发展*

  • 史蒂文·韦尔格星
    一致
    可以解决对应的通信。电话:+32 9/264 99 22;
    隶属关系
    Biobix,生物信息学和计算基因组学实验室,数学建模,统计和生物信息学,根特大学,根特,比利时
    搜索本作者的文章
  • Elvis Ndah.
    隶属关系
    Biobix,生物信息学和计算基因组学实验室,数学建模,统计和生物信息学,根特大学,根特,比利时

    Vib-Ugent医疗生物技术中心,比利时根特
    搜索本作者的文章
  • Wim Van Criekinge.
    隶属关系
    Biobix,生物信息学和计算基因组学实验室,数学建模,统计和生物信息学,根特大学,根特,比利时
    搜索本作者的文章
  • Siegfried Gessulat.
    隶属关系
    德国慕尼黑慕尼黑技术大学蛋白质组学与生物分析课

    SAP SE,Potsdam,德国
    搜索本作者的文章
  • Bernhard Kuster.
    隶属关系
    德国慕尼黑慕尼黑技术大学蛋白质组学与生物分析课
    搜索本作者的文章
  • Mathias Wilhelm.
    隶属关系
    德国慕尼黑慕尼黑技术大学蛋白质组学与生物分析课
    搜索本作者的文章
  • Petra Van Damme.
    隶属关系
    Vib-Ugent医疗生物技术中心,比利时根特

    格伦茨大学科学院生物化学与微生物学系,格伦,格伦
    搜索本作者的文章
  • Gerben Menschaert.
    一致
    可以解决对应的通信。
    隶属关系
    Biobix,生物信息学和计算基因组学实验室,数学建模,统计和生物信息学,根特大学,根特,比利时
    搜索本作者的文章
  • 作者脚注
    *根特大学的特殊研究基金(BOF)[01D20615]到S.V.研究基金会 - 佛兰德斯(FWO-Vlaanderen)[12a7813n]的博士后奖学金[12a7813n]。 P.V.D.承认欧洲联盟Horizo​​ n 2020研究和创新计划下的欧洲研究理事会(ERC)的资金(预言授予协议NO 803972)。
    本文含有补充材料。利益冲突:M. W.和B.K.是Omicscouts,德国弗雷斯的创始人和股东。他们在公司没有业务作用。 S.G.是SAP SE,德国波茨坦的员工。
      Proteoformer是一种管道,使得能够自动处理来自核糖体分析的数据(Ribo-SEQ, IE。 核糖体保护的mRNA片段的测序)。因此,基因组核糖体占据导致数据特异性翻译产品候选物的描绘,这些核糖率可以改善基于质谱的鉴定。由于它的第一次出版物,初始升级,新功能和扩展,因此已添加到蛋白质形制中。一些最重要的升级包括在映射过程中的P-Site偏移量计算,全面的数据预测,引入了两个替代的蛋白质调用策略和扩展流水线输出功能。通过分析人HCT116和Jurkat数据的核糖体分析数据来说明这些Noveltizes。不同的蛋白质呼唤策略与另一个彼此一起使用,并与Uniprot的参考序列一起使用。与MaxQuant的扩展搜索空间搜索匹配质谱数据。总的来说,除了带注释的蛋白质形式,该管道可以识别和验证不同类别的新型蛋白质常规,包括上游开放式读数框架的翻译产品,5'和3'延伸和截断的蛋白质常规,单氨基酸变体,剪接变体和翻译产品所谓的非码区。此外,据报道,通过包括价格计算的深度神经网络策略来提高概念验证,该策略为分析增加了额外的碎片频谱强度特征。鉴于核糖体的分析驱动的突出结果,表明这允许通过升高的严格性验证新鉴定的蛋白质常规的谱比匹配。这些更新和新的结论为基于核糖体的突发性蛋白质研究领域提供了新的见解和课程。关于管道,原始代码,用户手册(README)和对不同可用模式的解释的更多实用信息,可以在PROFEOFORMER的Github存储库中找到: //github.com/Biobix/proteoformer.

      图形概要

      蛋白质组学描述了基于质谱(MS)的蛋白质组学研究与下一代测序(NGS)结合的领域
      使用的缩写是:NGS,下一代测序; CE,碰撞能量; CHX,环己酰亚胺; FDR,虚假发现率; FPKM,每千百万片碎片; GUI,图形用户界面;哈林顿顿哈里宁; LTM,乳酰亚胺霉素; MS,质谱; MS / MS,串联质谱; ORF,开放阅读框架; PEFF,PSI扩展Fasta格式; PSI,蛋白质组学标准倡议; PSM,蛋白质到光谱匹配; RPF,核糖体保护片段; SAV,单氨基酸变体; SNP,单核苷酸多态性; TIS,翻译启动网站。
      1使用的缩写是:NGS,下一代测序; CE,碰撞能量; CHX,环己酰亚胺; FDR,虚假发现率; FPKM,每千百万片碎片; GUI,图形用户界面;哈林顿顿哈里宁; LTM,乳酰亚胺霉素; MS,质谱; MS / MS,串联质谱; ORF,开放阅读框架; PEFF,PSI扩展Fasta格式; PSI,蛋白质组学标准倡议; PSM,蛋白质到光谱匹配; RPF,核糖体保护片段; SAV,单氨基酸变体; SNP,单核苷酸多态性; TIS,翻译启动网站。
      基于基于基因组学,转录组织和翻译(
      • nesvizhskii a.i.
      蛋白质组:概念,应用和计算策略。
      )。这是一个不断发展的领域,在不断提出新工具,以及关于其社区仍在讨论关于最佳实践的讨论(http://psidev.info/proteomics-informatics-standards-working-group-charter)。该研究的主要目的是改善基因注释和蛋白质组复杂性的分析(
      • Menschaert G.
      • Fenyöd。
      来自生物信息学角度的蛋白素学元学:一种生长田。
      )。
      为了扩展我们关于蛋白质组复杂性的知识,可以使用来自排序技术的数据来构建用于后续MS搜索的自定义数据库。例如,将RNA-SEQ导出在识别拼接变体中辅助搜索空间(
      • 李H.D.
      • Menon R.
      • OPENN G.S.
      • 关扬
      通过整合功能基因组学和蛋白质组学证据,重新探讨典型均匀性同种型。
      )蛋白质组学水平的单氨基酸变体(SEVS)(
      • 公园H.
      • BAE J.
      • 金H.
      • 金斯。
      • 金H.
      • MUN D.G.
      • 约亚
      • 李W.
      • Chae S.
      • 李斯。
      • 金H.K.
      • Hwang D.
      • 李S.W.
      • PAEK E.
      紧凑型富有的定制序列数据库和快速和敏感的数据库搜索有效的蛋白质分析。
      )。核糖体分析(
      • Ingolia N.T.
      • ghaemmaghami s。
      • 纽曼J.R.S.
      • Weissman J.s.
      用核糖体分析与核苷酸分辨率的语言范围分析。
      ,
      • Ingolia N.T.
      • 布鲁尔G.A.
      • Rouskin S.
      • McGeachy A.M.
      • Weissman J.s.
      通过核糖体保护的mRNA片段的深度测序来监测体内平移的核糖体分析策略。
      )即使进一步采用这种方法。通过这种最近的技术,用NGS分析核糖体保护的mRNA片段,导致翻译景观的基因组测量。通常,通过使用抗生素将MRNA平移的位置停止核糖体。在真核生物中,抗生素环己酰亚胺(CHX)稳定在mRNA序列上的核糖体并防止进一步的核糖体易位,从而允许延长核糖体谱的研究。其他抗生素如哈林顿顿(HARR)或乳酰胺霉素(LTM),每个菌丝(LTM)都具有其特征作用模式,具有独特的仅稳定启动核糖体的能力,开辟了可视化翻译启动的机会(
      • 李斯。
      • 刘B.
      • 李斯。
      • 黄S.-X.
      • 沉B.
      • 钱S.-B.
      单核苷酸分辨率下哺乳动物细胞翻译起始位点的全局映射。
      )。在抗生素处理后,将用核酸酶处理样品,使核糖体保护的片段(RPF)保持并可以用NGS分析(
      • Ingolia N.T.
      • ghaemmaghami s。
      • 纽曼J.R.S.
      • Weissman J.s.
      用核糖体分析与核苷酸分辨率的语言范围分析。
      ,
      • Ingolia N.T.
      • 布鲁尔G.A.
      • Rouskin S.
      • McGeachy A.M.
      • Weissman J.s.
      通过核糖体保护的mRNA片段的深度测序来监测体内平移的核糖体分析策略。
      )。将测序的片段映射到参考基因组后,特定的偏移允许将对齐定位到p-site上(IE。 核糖体将mRNA平移到肽产物中的确切碱位置。读取的5'末端之间的偏移量和p-site之间的偏移量取决于RPF的长度。利用正确的P-Site偏移集,可以正确公开核糖体分析的子电压分辨率,如三重态周期性和翻译模式,可以推出。
      核糖体的分析收集更接近最终蛋白质产物的阶段的数据而不是RNA-SEQ,因此它用作更好的蛋白表达代理,用于扩展MS搜索空间,其具有特定的样品测序结果。借助核糖体分析扩展的搜索空间,可以使用匹配的MS数据验证替代启动事件(
      • Menschaert G.
      • van criekinge w。
      • 孔冠皆宜
      • koch a。
      • 克拉皮j.
      • Gevaert K.
      • van damme p.
      基于核糖体分析的深度蛋白质组覆盖艾滋病质谱蛋白和肽发现,提供替代翻译产品和近同源翻译起始事件的证据。
      ,
      • koch a。
      • Gawron D.
      • Steyaert S.
      • ndah E.
      • 克拉皮j.
      • de Keulenaer S.
      • 德梅斯特E.
      • 马米
      • 沉B.
      • Gevaert K.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      将蛋白质组学和核糖体分析整合的蛋白质组织方法提高了蛋白质识别的效率,并能够发现替代翻译开始点。
      ,
      • van damme p.
      • Gawron D.
      • van criekinge w。
      • Menschaert G.
      N-末端蛋白质组学和核糖体分析提供了小鼠和男性替代翻译启动景观的综合图。
      )。几年前,我们设计了蛋白质形制(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      ),一个完整的管道,用于将核糖体分析信息处理成基于MS的验证的序列数据库。这允许鉴定新的蛋白质形式(蛋白质ortmorms)并帮助重新注释基因组。
      其他几种预测工具(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      ,
      • 春S.Y.
      • Rodriguez C.M.
      • 托德P.K.
      • 磨坊R.E.
      幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
      ,
      • 字段A.P.
      • Rodriguez e.h.
      • Jovanovic M.
      • 斯特恩吉扎尔N.
      • Haas B.J.
      • Mertins P.
      • Raychowdhury R.
      • Hacohen N.
      • carr s.a.
      • Ingolia N.T.
      • Regev A.
      • Weissman J.s.
      基于回归的核糖体分析数据分析揭示了哺乳动物翻译的守恒复杂性。
      ,
      • Calviello L.
      • Mukherjee N.
      • Wyler E.
      • Zauber H.
      • Hirsekorn A.
      • Selbach M.
      • 陆地店M.
      • obermayer b.
      • 霍姆勒U.
      在核糖体分析数据中检测积极翻译的开放阅读框架。
      ,
      • 咀嚼g.-l.
      • Pauli A.
      • rinn J.L.
      • Regev A.
      • Schier A F.
      • 瓦伦E.
      核糖体谱揭示了编码RNA的长期非编码RNA和5'领导者之间的相似之处。
      ,
      • 姬Z.
      Riborf:使用核糖体分析识别基因组宽的翻译开放阅读框架。
      )在过去几年中设计,其中两者特别对此稿件感兴趣。第一个是价格(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      )通过建模实验噪声和Ribo-SEQ所涉及的随机过程来推送开放阅读框架(ORF)。从该模型中,确定产生具有最大可能性的观察到的读取的转换密码子。这反过来又为ORF候选人组装的基础。另一个新的有趣工具是幽灵(
      • 春S.Y.
      • Rodriguez C.M.
      • 托德P.K.
      • 磨坊R.E.
      幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
      )。它侧重于使用光谱相干分类器建模核糖体信号的三重态周期性。值得注意的是,这两种新技术可以在不使用并行启动简档样本的情况下起作用,这是一个缺少前植物管道管道缺乏的标志(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )。
      不同的搜索引擎可用于匹配串联质谱(MS / MS)碎片光谱到序列数据库中的不同肽。 searchgui(
      • Barsnes H.
      • Vaudel M.
      搜索Gui:蛋白质组学搜索和De Novo发动机的高度适应性公共界面。
      )提供用于组合不同搜索引擎的用户界面。 maxquant工具(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ),包括Andromeda搜索引擎(
      • Cox J.
      • Neuhauser N.
      • Michalski A.
      • 施泰米r.a.
      • 奥尔森J.V.
      和romeda:肽搜索引擎集成到最大环境中。
      ),另外包括一次性分析多个样品。
      对于大多数MS搜索引擎,在比较理论和实验光谱时,仅考虑片段离子匹配的数量。然而,已证明将强度添加到匹配算法(基于MS / MS强度的蛋白质组学)增强了识别率(
      • Narasimhan C.
      • Tabb D.L.
      • verberkmoes n.c.
      • Thompson M.R.
      • Hettich R.L.
      • uberbacher e.c.
      摩刺:基于强度的串联质谱评分方案,可提高高信心的肽鉴定。
      ,
      • Sadygov R.
      • Wohlschlegel J.
      • 公园S.K.
      • XU T.
      • yates j.r.
      中央限制定理作为基于强度的评分功能的近似值。
      ,
      • Tabb D.L.
      • 费尔南多C.G.
      • Chambers M.C.
      myRimatch:多变量超细分析高度准确的串联质谱肽鉴定。
      )。最近,允许基于在蛋白质 - 谱比赛(PSM)上的深度学习的应用来提高识别率(
      • Gessulat S.
      • 施密特T.
      • ZOLG D.P.
      • 萨马拉斯诗
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • rechenberger J.
      • Delanghe B.
      • Huhmer A.
      • reimer u.
      • ehrlich h.-c.
      • Aiche S.
      • Kuster B.
      • Wilhelm M.
      priosh。
      )。通过预测候选PSM的片段强度来开始PRITIS。基于这些预测,可以派生额外的PSM功能。过滤器(
      • KällL.
      • 坎特伯雷J.D.
      • 韦斯顿J.
      • 贵族W.S.
      • maccoss m.j.
      霰弹枪蛋白质组学数据集的半监督学习肽鉴定。
      ,
      • 他们。
      • maccoss m.j.
      • 贵族W.S.
      • KällL.
      具有渗滤器3.0的大型蛋白质组学数据集的快速准确的蛋白质假发现速率。
      另一方面,另一方面是一个MS后处理器工具,使得能够组合不同的MS分析工具的功能和分数。基于具有支持向量机的半监督学习方法,它提供了解释组合结果的统计框架。因此,渗滤器能够通过规范搜索引擎的结果加入估价的附加功能。
      在这里,我们提出了自第一个出版物以来添加到植物管道管道中的所有新功能。核糖体分析映射,数据预探测,蛋白质呼唤策略和输出功能已经过度改善和扩展。基于HCT116和Jurkat人体细胞系的MS / MS数据的多个高深样本,以MaxQuant搜索基于核糖体的分析序列数据库。在古典MS / MS搜索引擎的顶部,PRITITES与渗滤器组合应用,以增强肽识别率,并为(新)蛋白质事件和基因组重新注释提供额外的信心。
      我们首先在确定HCT116和Jurkat案例研究的结果之前,在实验程序中提供新功能的简短技术概述。之后,我们讨论了这些新特征的含义和结果对普通蛋白质组织研究领域。

      实验步骤

       蛋白质形制管道

      自首次出版物以来(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      ),蛋白质形态管道已经大大重新设计,并添加了多种新颖功能(Fig. 1)。
      图缩略图GR1.
      图。1。蛋白质形制的最重​​要的部位流水流工作流程。 管道从核糖体分析实验中的原始读数开始,以FASTQ格式提供。使用FASTQC检查这些原始读取的质量(
      • 安德鲁斯S.
      FASTQC:高吞吐量序列数据的质量控制工具。
      )。接下来,读取被预处理,过滤并映射到参考基因组。通过使用p-site偏移(用plastid计算(
      • DUNN J.G.
      • Weissman J.s.
      塑体:下一代测序和基因组学数据的核苷酸分辨率分析分辨率分辨率分析。
      )),这些对准可以在基础级别定位。将在FASTQC的帮助下检查对齐质量和一般数据Outlook(
      • 安德鲁斯S.
      FASTQC:高吞吐量序列数据的质量控制工具。
      )和MQC(
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      )。如果用户对输出满意,则可以继续使用管道。蛋白质形态将搜索具有翻译证据的转录物同种型。基于这些,可以推导出翻译的蛋白质ort。以前的植物ordormer使用的工作流程(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )可以应用版本(TIS呼叫,SNP呼叫和蛋白质文件组件)或可以使用价格(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      或幽灵(
      • 春S.Y.
      • Rodriguez C.M.
      • 托德P.K.
      • 磨坊R.E.
      幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
      )确定这些蛋白质Oforms。这些早期步骤的所有结果都保存在SQLite结果数据库中。对于基于MS的验证,可以将结果导出,组合,甚至与Uniprot的规范信息合并。最终结果是FASTA文件,可用于数据库搜索MS / MS Spectra,工具(如MaxQuant))
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ),searchgui-peptideshaker(
      • Vaudel M.
      • Barsnes H.
      • 鲍伦森
      • 镰刀A.
      搜索Gui:同时OMSSA和X的开源图形用户界面!串联搜索。
      ,
      • Vaudel M.
      • 伯克哈特准
      • Zahedi R.P.
      • oveland E.
      • 鲍伦森
      • 镰刀A.
      • 玛特L.
      • Barsnes H.
      Peptideshaker可以实现MS衍生的蛋白质组学数据集的再分析。
      或prositut(
      • Gessulat S.
      • 施密特T.
      • ZOLG D.P.
      • 萨马拉斯诗
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • rechenberger J.
      • Delanghe B.
      • Huhmer A.
      • reimer u.
      • ehrlich h.-c.
      • Aiche S.
      • Kuster B.
      • Wilhelm M.
      priosh。
      )与渗滤器结合(
      • KällL.
      • 坎特伯雷J.D.
      • 韦斯顿J.
      • 贵族W.S.
      • maccoss m.j.
      霰弹枪蛋白质组学数据集的半监督学习肽鉴定。
      )。在管道中添加了几种新颖脚本,以利用这些搜索结果以半自动方式计算数据库命中和分类新的蛋白质常规和新颖的翻译事件。也可以在核糖体上手动检查标识(例如 通过在基因组浏览器环境中浏览蛋白质形制的托盘文件,MS级别(MS软件界面或以验证格式转换MS识别文件(
      • Menschaert G.
      • 王X.
      • 琼斯A.R.
      • Ghali F.
      • Fenyöd。
      • Olexiouk V.
      • 张B.
      • 德意曲e.w.
      • Ternent T.
      • VizcaínoJ.A.
      验证和探测标准格式:可以无缝集成基因组学和蛋白质组学数据。
      ,
      • Olexiouk V.
      • Menschaert G.
      ProbamConvert:验证/探测器的转换工具。
      )在与纬板织带相同的基因组浏览器会话中)。
      首先,现在可以使用Conda(
      • Grüningb.
      • 戴尔R.
      • SjödinA.
      • 查普曼B.A.
      • Rowe J.
      • Tomkins-Tinch C.H.
      • valieris r.
      • KösterJ.
      Bioconda:为生命科学的可持续和综合软件分销。
      )包含所有依赖的环境,促进用户更容易的安装过程。此外,还包括新模块,使得下载参考信息更加简化。
      另一组重要的更新与质量和初步数据可视化有关,在早期版本中是绩效的。这包括使用PlastID的精确p-site偏移的特定于数据集特定计算(
      • DUNN J.G.
      • Weissman J.s.
      塑体:下一代测序和基因组学数据的核苷酸分辨率分析分辨率分辨率分析。
      ),一种对对准的正确基础分配很重要的特征,因此对于揭示像三联周期性的核髓核糖体分析标志(
      • DUNN J.G.
      • Weissman J.s.
      塑体:下一代测序和基因组学数据的核苷酸分辨率分析分辨率分辨率分析。
      ,
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      )。早期版本的蛋白质形制只能使用固定的默认偏移量。此外,用户现在可以更彻底地验证其映射的Ribo-SEQ数据的质量和一般前景,如MQC(
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      )直接嵌入到蛋白质形制中。 FASTQC更加突出的位置(
      • 安德鲁斯S.
      FASTQC:高吞吐量序列数据的质量控制工具。
      )在一般分析中,工作流程也是预见的。
      前一种版本的缺点是管道总是需要伸长核糖体曲线(未处理样品或用CHX处理的样品)的组合和引发核糖体曲线(用HARR或LTM处理的样品)。几项研究仅包含伸长的型材,因此,两种新的蛋白质调用技术是额外的实施中的管道,从而不需要这种启动配置文件:价格(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      )和幽灵(
      • 春S.Y.
      • Rodriguez C.M.
      • 托德P.K.
      • 磨坊R.E.
      幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
      )。同时,已经存在的蛋白质Oform调用翻译起始位点(TIS)和单核苷酸多态性(SNP)测定的组合(也表示为“TIS和SNP呼叫”)和蛋白质组装(用于本手稿,简称为“经典植物呼叫”))也更新。如果可用的启动分析,则额外的优点是可以比较三种方法,并用来互相补充。如果缺少初始概况,仍然可以组合价格和幽灵。
      努力结合不同分析的结果。因此,蛋白质形态现在能够例如合并由三种不同的蛋白质调用技术识别的翻译产品,最终删除序列冗余。此外,还包括工具,以进一步合并来自Uniprot的序列的结果(
      • Uniprot财团
      UNIPROT:通用蛋白质知识库。
      )。代码系统(在补充方法中更详细地解释)被添加到所产生的总快速文件中的载体中,允许跟踪哪些源(蛋白质ordor或Uniprot)以及哪种方法或TIS ID(s)序列源自。
      Proteoformer管道现在还导出新的PSI扩展Fasta格式(PEFF)(http://www.psidev.info/peff)。此格式提供标签以更具结构方式存储SNP和蛋白质OFORM变化。
      通过在人HCT116结肠癌细胞上运行蛋白质order管道来说明新功能(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )和人类Jurkat T淋巴细胞细胞(
      • Gawron D.
      • ndah E.
      • Gevaert K.
      • van damme p.
      位置蛋白质组学揭示了N-末端蛋白质常规稳定性的差异。
      )。应用了三种不同的蛋白质形式呼叫技术(经典,价格和幽灵),结果组合成一个快速文件。然后将后者与Uniprot的参考信息合并,以获得一个综合数据库,其中规范产品是新的植物候选者。
      在补充实验方案中可以在本研究中对管道进行更详细的解释及其使用情况。 GitHub上提供蛋白质形制管道的一般手册(//github.com/Biobix/proteoformer/blob/master/README.md)。我们还包括我们用于生成数据的所有命令的概述(example_commands.md)。

       匹配质谱分析

      使用Q辐射HF仪器在HCT116和Jurkat细胞中生成匹配的LC-MS / MS数据。获得的蛋白质组学数据与使用MaxQuant图形用户界面(GUI)从蛋白质形制中与综合数据库相匹配(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      )。额外的脚本将添加到植物形式中以解析这些MaxQuant结果以及添加到Fasta文件介绍的代码系统。因此,评定了最终蛋白质组学识别结果中的每个蛋白质呼唤方法的份额。此外,该跟踪系统还允许确定标识的起源。蛋白质形态提供但尚未包含在Uniprot中的序列的标识为新的蛋白质ort提供了证据。另一个新脚本根据其变化的性质对新的蛋白质ort进行分类。因此,这个新颖的特征是半自动允许确定新颖的翻译事件的性质,这主要是蛋白质组织策略的目标。
      用prositure(
      • Gessulat S.
      • 施密特T.
      • ZOLG D.P.
      • 萨马拉斯诗
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • rechenberger J.
      • Delanghe B.
      • Huhmer A.
      • reimer u.
      • ehrlich h.-c.
      • Aiche S.
      • Kuster B.
      • Wilhelm M.
      priosh。
      )应用于PSM。这允许计算额外的光谱特征。过滤器(
      • KällL.
      • 坎特伯雷J.D.
      • 韦斯顿J.
      • 贵族W.S.
      • maccoss m.j.
      霰弹枪蛋白质组学数据集的半监督学习肽鉴定。
      ,
      • 他们。
      • maccoss m.j.
      • 贵族W.S.
      • KällL.
      具有渗滤器3.0的大型蛋白质组学数据集的快速准确的蛋白质假发现速率。
      然后用于将不同的评分和特征组合起来,从标本和最小值组合。将所有功能的Q值与仅最大特征的Q值(Andromeda得分和Delta得分)进行比较。

       补充实验程序

      可以在补充材料中找到广泛的实验程序。

      结果

       核糖体谱分析用蛋白质形制

       数据质量评估,阅读预处理,对齐和翻译成绩单呼叫

      更新的蛋白质形制管道(Fig. 1)应用于匹配的Ribo-SEQ和霰弹枪蛋白质组学数据,来自两种细胞系,人HCT116(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )和jurkat t细胞(
      • Gawron D.
      • ndah E.
      • Gevaert K.
      • van damme p.
      位置蛋白质组学揭示了N-末端蛋白质常规稳定性的差异。
      )。对于两种细胞系,用FASTQC检查CHX处理(延长核糖体剖面)和LTM处理的(引发核糖体剖面)样品。原始HCT116 CHX-和LTM处理的质量报告以及JURKAT CHX-和LTM处理的读样品分别用于 补充文件S1和S2和S3和S4。基于几个地块(IE。 GC含量,适配器内容,复制级别)预处理和滤波是可读取的。因此,原始读数是质量修剪的,夹持适配器。连续地,读取被预热,用于含有RRNA,TRNA,Sn(-O-)RNA序列和PHIX噬菌体基因组的数据库。最后,预处理的读数与人类基因组对齐。为了比较目的,只有允许Jurkat对齐,如果它们映射到基因组中的一个独特位置,而HCT116对齐可以映射到最多16个位置。可以找到预热和基因组对齐的映射统计数据 补充表S1。然后使用FASTQC再次检查获得的对齐SAM文件。对准HCT116 CHX-和LTM处理的结果和LECKAT CHX-和LTM处理的样品分别给出 补充文件S5,S6,S7和S8。一般质量急剧和总体,污染物和湿式实验室相关工件(例如 翻译抑制剂使用(
      • Gerashchenko M.V.
      • Gladyshev V.N.
      翻译抑制剂导致核糖体分析实验异常。
      ),核糖核酸酶处理(
      • Gerashchenko M.V.
      • Gladyshev V.N.
      核糖核酸酶选择对核糖体分析。
      ),裂解缓冲液的组成(
      • BartholomäusA.
      • Del Campo C.
      • Ignatova Z.
      绘制核糖体分析的非标准化偏差。
      ))似乎被删除了。这种质量增强是由适配器剪辑,质量修剪和滤波的应用引起的,在映射到基因组之前(
      • Ingolia N.T.
      • 布鲁尔G.A.
      • Rouskin S.
      • McGeachy A.M.
      • Weissman J.s.
      通过核糖体保护的mRNA片段的深度测序来监测体内平移的核糖体分析策略。
      )。我们建议使用FASTQC直观地检查这些步骤的影响,如植物造型器。此外,可视化质量和偏见特征在我们看来,在继续与其余分析继续之前对数据内容的一般性理解有一般性的做法。
      此外,FASTQC向Jurkat报告了比HCT116略有更好的质量,但必须记住Jurkat的阅读覆盖率率高约为2,5倍。
      用MQC完成核糖体分析特异性数据探索。 CHX-和LTM处理的HCT116样品的结果分别给出 补充文件S9和S10。对于Jurkat的CHX-和LTM处理的样本,图标分别可用 补充文件S11和S12。在这些文件中,也显示了塑体P-Site偏移量计算的结果。总体而言,P-Site测定LTM比CHX剧本。此外,Jurkat的较高覆盖范围允许更精确的偏移量计算。在HCT116的梅戈尼克注释图中,由于非唯一映射,对比的相当显着的比赛百分比位于加工后的假生原位中(当在唯一映射HCT116数据上施加MQC时,该百分比大幅减少(结果未示出)。一般来说,MQC的结果符合可以预期的内容(
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      )和两种细胞系都可以观察到良好的三联周期性。
      现在可以通过将生成的托格图文件加载到基因组浏览器中,以更新的浏览器进行可视化,并使用新的选项生成RPF特定的托格图文件。
      基于规则的转录呼叫用于所有分析。在此呼叫期间,如果其外显子的至少85%具有高于预定阈值的细长核糖体剖面覆盖率,则识别成绩单如图所示,那么核糖体剖面覆盖率高(概述)(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )))。在HCT116中,它产生了655353个翻译的转录同种型。对于jurkat,调用82 065翻译成分异构型。

       Proteoform呼叫

      在这项研究中,比较了三种蛋白质呼唤方法:(a)随后的TIS呼叫,最终SNP呼叫和蛋白质Oform组装(这种组合被称为“来自此”的经典蛋白质调用“来自于此”),(B)通过价格算法(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      )和(c)通过使用幽灵算法(
      • 春S.Y.
      • Rodriguez C.M.
      • 托德P.K.
      • 磨坊R.E.
      幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
      )。两种后一种方法是管道的新型介绍,并且具有它们不需要启动核糖体谱的大优势。这与近期核糖体剖析研究缺乏这个翻译启动重点实验(
      • Michel A.M.
      • Kiniry S.J.
      • O'Connor P.B.F.
      • Mullan J.P.
      • 巴兰诺夫P.V.
      GWIPS-ZIZ:2018更新。
      )。幽灵方法使用GTF文件中的引用注释作为其分析的基础,因此无法找到完全新的蛋白质orts是没有用的。然而,检查哪种规范序列显示出翻译是有用的。然而,这种方法的大缺点是它的运行时间(149小时),这显着长于其他两种方法(2-4小时)。这些运行时间是在运行Fedora Core 23的Linux服务器上以350GB的RAM运行的Linux服务器上的20 2.3GHz AMD Opteron™处理器。价格,另一种新方法是由基于核糖体分析的基础寻找新的翻译序列。因此,需要使用分数模型。开发人员选择了10%的默认FDR。这意味着它需要允许相当一些误报以找到其候选人(更多细节可以在线方法中找到(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      )))。对于该管道的不严格的FDR,较少的疑虑尤为疑虑,因为这里使用核糖体分析来获得ORF候选者。使用MS / MS数据,在管道中之后更强大的验证。 Looser默认FDR阈值意味着错过了很多规范序列,这就是为什么与其他两种技术(尤其与幽灵)重叠相对较小的原因( Fig. 2A补充图。S1)。该观察可扩展到MS电平(Fig. 2C补充图S4),因为价格也缺乏这一级别的序列的相当大部分,其他两种技术确实捕获。 MS识别的序列的主要部分被价格错过,但通过经典的蛋白质调用和幽灵拾取,从注释毒组织开始。然而,在没有MS验证和无核糖体启动分析的情况下,幽灵和价格的组合应基于伸长的Ribo-SEQ型材基于完整的所有翻译的蛋白质ort。
      图缩略图GR2.
      图2。植物分析的概述和法律数据的分析和Maxquant识别结果。 在蛋白质形式运行时间内进行测试并组合在一个Fasta文件中并组合不同的蛋白质Oform调用方法,并在不去除冗余。在面板A中示出了序列计数和方法之间的重叠。然后,此组合的FASTA文件是用UNIPROT(由SWISSPROT和TREMBL组成)合并,并且在面板B中给出了重叠。分别A和B的搜索空间在后方搜索MaxQuant,导致分别显示的结果分别显示为C和D.每个蛋白质调用技术的蛋白质水平的MS / MS标识的量在C中给出了蛋白质形制和UNIPROT之间的MS / MS标识的分布在D中。子文件C和D中的Venn图表的区域是日志10 (x + 1)转换为更好的视觉表示。给出所有其他分析的Venn图表 .
      多年来,经典的蛋白质调用(TIS呼叫和蛋白质组装组合)已经升级。此方法不适用于分数模型,但是基于规则的。因此,它不太严格,因此旨在随后的MS验证来排除来自该阶段的误报。在 Fig. 2A补充图。S1如图所示,经典的蛋白质形式呼叫给出了三种技术的最完整的搜索空间,其中包括规范序列和新变种。该策略还增加了归因于一个不同的植物呼叫技术(Fig. 2A补充图S4)。
      在不同的蛋白质调用算法中引入了硒细胞。在经典的蛋白质调用中,分别为134(0.057%)和258(0.053%)的候选翻译产品分别在HCT116和Jurkat数据中含有一个或多个硒细胞。利用幽灵算法,分别47(0,127%)和43(0,11%)的候选产品含有硒细胞。内部价格算法不考虑Selenocysteines,只需将“UGA”密码子作为停止信号进行分类。然而,不可能验证MS / MS中的含硒酰基细胞肽。由于这些序列仅构成了很少的搜索空间,并且据报道硒蛋白仅在特定条件下发生(专门的MS策略甚至开发用于挑选它们(
      • 郭L.
      • 杨W.
      • 黄Q.
      • 强J.
      • 哈特J.R.
      • 王W.
      • 胡锦涛
      • 朱茹
      • 刘恩
      • 张Y.
      Selenocysteine特异性质谱仪揭示了组织明显的硒蛋白和候选硒蛋白。
      ))和组织(
      • Labunskyy v.M.
      • Hatfield D.L.
      • Gladyshev V.N.
      硒蛋白:分子途径和生理作用。
      ),这是以某种方式预期。
      对于Jurkat数据,SNP也包括在经典的蛋白质调用期间。与参考序列相比,7,15%的候选产品含有一个或多个SNP。实施了蛋白质形制的试用版,也考虑了Indels。随后的MS验证无法通过Indel添加(未发布)确认任何新的蛋白质变体,因此目前,Indel感知蛋白质调用不包括在管道中。

       FASTA文件导出和数据库组合

      为HCT116和Jurkat数据的三种不同应用的植物调用方法生成了Fasta文件。生成这些文件时可以删除冗余,因此所有方法都会导出包含和不具有剩余冗余的文件。之后,三种不同方法的Fasta文件被合并为一个综合的FastA数据集,以便其冗余或非冗余形式。在此合并期间发现的方法之间的重叠显示在 Fig. 2A补充图。S1.
      通常,不同方法之间的重叠非常低,但是,一旦应用了MS / MS验证,这种重叠会放大Fig 2C补充图S4)。因此,必须记住,核糖体分析可以导致候选蛋白质数据库,但不适用于肯定存在的蛋白质的数据库。因此,与MS / MS水平相比,核糖体分析水平不一定期望高重叠。
      如果在初始数据库导出中未删除冗余,则尤其是经典型蛋白质调用方法数据库大小有点较大。冗余数据库(119,716序列)比在HCT116中呼叫的经典蛋白质形式的非还原(76,945序列)大于55,58%。相比之下,在保持冗余序列时,价格和幽灵数据库仅在4.33%(14 077个非重定序列)和13.59%(26,383个非重定序列)上升。
      蛋白质血面型的经典蛋白质形式呼叫设计为包括不同的蛋白质变异,也包括来自不同的组织(IE。 之后可能是MS验证的N-末端蛋白质Oforms。因此,它最初包含大量重叠序列(例如 扩展,截断,剪接变体......)。另一方面,幽灵从规范的参考注释开始,导致几乎所有已识别的候选产品从一个规范的TIS位置开始,几乎没有新的变体。当未删除冗余时,由经典的蛋白质Oform调用方法产生的序列留在其规范和变体形式中的数据库中。因此,观察幽灵与经典方法之间的更高重叠。此外,详细分析表明,没有任何价格 - 独特的翻译产品候选人从一个规范的TIS开始。通过价格确定的所有规范的TIS启动候选者都是在重叠区域中,另外两种方法( Fig. 2A补充图。S1)。
      在这些地块中看到的另一个显着的特征是,价格与其他两种方法之间的重叠远不那么重叠,而不是经典植物调用方法和幽灵。对价格的假发现率(FDR)不同(0.01以上)没有导致与其他两种方法(结果未显示)重叠增加。具体而言,价格 - 独特变体的数量受到改变的FDR,随着严格的FDR而增加。相反,重叠部分(具有经典和幽灵)中的规范序列不会显着改变。
      接下来,将三种方法的组合结果与UniProt的所有蛋白质信息合并(由Swissprot和Trembl组成)。由于MS分析程序可以通过应用蛋白推断算法来解决不同的冗余表格,因此选择了与Uniprot的融合的组合的冗余FASTA文件。此外,数据库尺寸仅在保持冗余序列时仅增加0.43倍。由于这远非指数增加,对肽和蛋白质评分的负面影响有限。提出了由蛋白质常规管道产生的序列之间的重叠和Uniprot中可用的序列之间的重叠 Fig. 2B补充图S2。对于HCT116,检查了与没有剪接变体的Uniprot版本的版本。剪接变体包含扩大了Uniprot和蛋白质常规之间的重叠。此外,与TREMBROT的SWISSPROT部分的重叠与蛋白质形态相比,与TREMBL相比,并且通过包括剪接变体,这种效果甚至更明显。对于Jurkat数据,与HCT116相比,重叠没有显着增加,但由于该数据集中的覆盖率较高,因此由蛋白质形制传递的新变体扩展。详细的调查(基于底层SQLite数据库)揭示所有价格 - 独特的候选者是新的变体,这些变体与UniProt重叠。另一方面,经典的蛋白质Orm调用方法给出了Uniprot已知序列和新变种的组合。幽灵 - 独特的序列主要发现与TREMBL重叠,而幽灵和经典蛋白质调用之间共享的序列通常会发现与Swissprot重叠。
      在HUPO PSI的定义下,对流水线的另一个新有用的补充是新的PEFF格式。此FastA派生格式允许将公共SNP和植物常规变体进行分组为一个条目。给出了人体转录物ENST0000000000412的不同蛋白质ord的一个例子 补充图S3。这些蛋白质型可以以PEFF格式导出,如可以看到的 补充文件S13,这是用蛋白质形制生成的完整PEFF文件的片段。

       基于MAS的MS / MS为MAXQUANT的验证

      使用MaxQuant GUI搜索匹配的高深LC-MS / MS数据超过4个重复。这些搜索的完整结果与峰值和原始数据一起通过骄傲沉积在Proteomexchange联盟上(
      • VizcaínoJ.A.
      • Csordas A.
      • Del-Toro N.
      • 戴安斯J.A.
      • 怜悯J.
      • Lavidas I.
      • Mayer G.
      • Perez-Riverol Y.
      • Reinger F.
      • Ternent T.
      • 徐Q.W.
      • 王R.
      • Hermjakob H.
      2016年更新自豪数据库及其相关工具。
      )与DataSet标识符PXD011353的合作伙伴存储库。还提供蛋白质和肽水平的搜索结果 补充文件S14-S19.
      首先,针对三种组合的蛋白质调用技术的FASTA文件搜索数据,以了解每个方法在MS级别的一般识别率增加。对于HCT116,测试了具有和不冗余的冗余除去的组合过程;对于Jurkat,仅分析了冗余选项。可以找到不同搜索空间和样品的蛋白质组,肽和PSM水平的鉴定率表 补充表S2。在该表中,MS / MS数据的高覆盖率在鉴定的大量蛋白质基团中可见。出来的结果可以用于确定MS / MS验证蛋白池中每个蛋白质调用策略的份额,如图所示 Fig. 2C补充图S4。可以观察到,保留Fasta级冗余,倾向于减少仅验证的斑点验证序列的数量。与核糖体分析阶段一样,保持冗余导致更早的经典蛋白质调用方法更重叠,如前所述。 Jurkat核糖体分析数据的较高覆盖率提高了价格和其他两个蛋白质调用方法(基于经典和幽灵)之间的重叠,导致居住在三种方法的整体联盟中的最大验证数量(补充图。S4G)。较高的覆盖范围也导致更具经典的蛋白质形式,称为验证。
      相反,肽与硒细胞有相反的肽,不能用maxquant鉴定。有一些论点,虽然解释了为什么在MS / MS数据中无法拾取Selenocysteine。首先,硒细胞在核糖体分析数据中存在于非常低的丰度:43 ORF与42,452态ORF的硒细胞总量(〜0.1%)。其次,已知硒蛋白是特异性的组织,并且由于老化等方法而易于表达变化(
      • 郭L.
      • 杨W.
      • 黄Q.
      • 强J.
      • 哈特J.R.
      • 王W.
      • 胡锦涛
      • 朱茹
      • 刘恩
      • 张Y.
      Selenocysteine特异性质谱仪揭示了组织明显的硒蛋白和候选硒蛋白。
      )。最后,开发了非常具体的方法以丰富和拾取硒蛋白(
      • 郭L.
      • 杨W.
      • 黄Q.
      • 强J.
      • 哈特J.R.
      • 王W.
      • 胡锦涛
      • 朱茹
      • 刘恩
      • 张Y.
      Selenocysteine特异性质谱仪揭示了组织明显的硒蛋白和候选硒蛋白。
      ,
      • Kryukov G.v.
      • Kryukov v.M.
      • Gladyshev V.N.
      含有新的哺乳动物硒的蛋白质,其鉴定用算法搜索硒细胞插入序列元件。
      )。根据这些具体的浓缩条件,郭 等等。 (
      • 郭L.
      • 杨W.
      • 黄Q.
      • 强J.
      • 哈特J.R.
      • 王W.
      • 胡锦涛
      • 朱茹
      • 刘恩
      • 张Y.
      Selenocysteine特异性质谱仪揭示了组织明显的硒蛋白和候选硒蛋白。
      )只能在MS / MS数据中拿起22个已知的硒蛋白和5个新候选者。因此,对于此处分析的MS / MS进行分析,没有专门设计用于拾取含硒酰氨氨酸的肽,而不令人惊讶地检测到这些。
      在第二轮中,现在将先前提到的蛋白质常规流水线生成的序列与UniProt序列合并,并且该组合数据库用于MAXQUANT的MS / MS验证。识别率显示在 补充表S2。在这些MS搜索中的蛋白质形制管道和UNIPROT的股票显示在 补充图S5。大多数验证都是共享的,但大多数有趣的验证当然可以在没有与Uniprot重叠的蛋白质形态部分中找到,因为这些验证了MS / MS Spectra验证了新的植物谱和新颖的翻译事件。如果包括UNIPROT剪接变体,则可以通过扩展UNIPROT数据库中的添加的剪接变体来解释早期的蛋白质常规验证中的大约50%。它说明了包括搜索空间中的替代剪接同种型的益处。 Jurkat数据的核糖体分析覆盖率较高允许识别验证的蛋白质常规的两倍,而共享鉴定的序列的数量仍然是相同的。在Swissprot和Trembl之间进一步分裂了Uniprot序列的分布 Fig. 2D补充图S6。这里,具有TREMBL的蛋白质形态的重叠远小于具有Swissprot的重叠,并且也小于所有三个集合之间的重叠。
      使用新的蛋白质形态模块,MS / MS验证的序列组由蛋白质形制管道发现,但尚未存在于UniProt中(IE。 新鉴定的蛋白质ort)基于其变化的性质更详细地细分。在HCT116中,分别在典型的蛋白质和剪接同种型的Uniprot信息外分别发现此类蛋白质的109和52。在Jurkat,发现拼接外的107个新型蛋白质orts参考。这些新验证的蛋白质ort的分类如图所示 Fig. 3, 补充图。S7-S8 和在 补充文件S20。可以验证不同的蛋白质变异来源:n-和c终端扩展和截断,新的剪接变体,在以前考虑的非编码区域中的帧外ORF和翻译事件。剪接变体和非编码区域蛋白质常规可以在子类别中进一步分类。对于HCT116,MS / MS与CONONICAL(补充图S7)和拼接版本(补充图S8)进行Uniprot进行。比较两个实验的分类指向拼接变体,C末端延伸和N末端延伸的减少和拼接的情况下的截断。因此,UNIPROT中的添加拼接信息能够解释与规范UNIPROT分析相比发现的某些蛋白质变量类别的部分。接下来,HCT116的分类(补充图S8)和Jurkat数据(Fig. 3)可以比较。在HCT116数据分析中存在的不同类别也存在于Jurkat数据,但一些总体差异是明显的。对于Jurkat数据,观察到仅具有SHAV的蛋白质形式的增加,因为SNP呼叫另外在Jurkat执行,而不是HCT116。其中一些被称为SNPS导致单氨基酸取代(SAVS),可以在MS / MS分析期间在肽中验证。此外,虽然对于HCT116,对于Jurkat,验证的蛋白质常规存在于伪原中,但该子类别不存在。在早期提到的MQC报告的选定地块中(补充文件S9)发现,在HCT116中施加的非独特映射允许富集伪遗传区域中的读数。另一方面,在Jurkat,执行了独特的映射。很明显,对于非独特映射实验的假膜区域中的核糖体信号也以验证的假性肽在MS水平的形式中观察到。可以看到新的MS / MS验证的蛋白质形式的示例 图。 4.A4B,而其核糖体分析水平上的蛋白质形式证明可以在基因组浏览器上可视化,如图所示 Fig. 4C.
      图缩略图GR3.
      图3。在蛋白质形态中发现的MS验证的蛋白质形式的分类,但不在拼接到Jurkat数据的拼接内数据库。 蛋白质Oforms基于其变化的性质进行分类。对于源自预先考虑的非编码区的新的剪接变体和蛋白质形式,增加了更详细的分类。有关不同分类的更多信息 .
      图缩略图GR4.
      图4。使用蛋白质形态找到并用MS / MS数据验证的N末端延伸。 A,与规范蛋白相比,延伸的蛋白质具有额外的肽映射。该额外的肽覆盖规范起始位点并验证该N末端延伸蛋白质的外观与MS / MS。用4个可比质量的4个碎片光谱证实肽。 B,将这4个光谱中的一种作为示例给出。 C,对UCSC基因组浏览器中核糖体分析水平的N-末端延伸的视图。 N末端延伸的替代接近同源TIS(“ACG”)在LTM数据中清楚地标记。使用以下内容将CHX数据信号进行转换 y = ln(x+1)。三重态周期性清晰地弹出,无论是在规范部分还是在CHX处理数据的N末端扩展中。阅读框架位于反义链上。

       使用PRITHTOR的概念验证蛋白蛋白酶实验

      对于这个实验,目的是尝试与利用工具中的其他特征延伸andromeda的额外值,是一种用于片段强度预测的神经网络方法。过滤器用于将Andromeda评分与来自PRISTIT的新功能结合起来。
      第一个实验包括比较较早的MaxQuant识别PSM的Q值,只有Andromeda得分与第二次运行,以及从andromeda的分数和来自价格的新功能的组合。这是针对HCT116数据执行的,其中包含与UniProt的规范版本合并的组合冗余型射型数据运行数据的搜索空间(Fig. 5)。识别的PSM的数量随着更严格的Q值滤波而减小。通过不仅包括Andromeda的得分,而且包括通过价格计算的特征,可以在较低的Q值下滤波。这样,包括所包括的分析,可以在较高的严格程度上执行,同时仍然保持在搜索空间在搜索空间趋于增加的突果设置中所需的可验证的PSM的相当数量的验证的PSM。
      图缩略图GR5.
      图5。Q值与Andromeda分数仅用Andromeda和Prosit的组合特征运行的Q值的比较。 针对与Uniprot的Canonical版本合并的冗余型射频数据库进行搜索的HCT116 MS数据执行此分析。 A,以最大值标识的所有PSM分析。 B,由于搜索空间中的序列完全从蛋白质形制管道(而导致),以maxquant识别的psms的分析IE。 新颖的蛋白质形式事件)。

      讨论

      自第一释放以来(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      ),在蛋白质形制管道中添加了许多新的实现(Fig. 1)。我们的管道与高覆盖MS / MS数据的用途一起,导致验证新型蛋白质血管系列。我们在这里想讨论这些Novelties对蛋白质组织研究领域的总体影响。此外,我们要指出,从我们的方法中可以从我们的未来蛋白质ommorms和核糖体分析辅助再注释的方法中学到什么。

       蛋白质形制

       数据质量评估,读取预处理和对齐

      数据质量检查和初步数据探索在新的植物管道中保持一个非常重要的位置。 FASTQC(
      • 安德鲁斯S.
      FASTQC:高吞吐量序列数据的质量控制工具。
      )提供了一种非常好的方法来可视化预映射数据清理的效果,并同时给出数据的Metagenomic概述。这些方面对于下游工作流程是必不可少的。
      塑植的引入(
      • DUNN J.G.
      • Weissman J.s.
      塑体:下一代测序和基因组学数据的核苷酸分辨率分析分辨率分辨率分析。
      )通过基于样本数据计算RPF长度特定的偏移来改善对对对对的校准的基础分辨率。样品特异性偏移是在蛋白质组织中,当然是固定偏移的优选,如(
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      )。
      此外,引入MQC(
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      )能够可视化对准数据的更多核糖体分析特征。这将质量控制和一般前景可视化的集合添加到蛋白质形制的管道中,并打开了类似于三联周期性和密码子使用等核糖体特征特征的新方法。用于核糖体剖面的新品质工具开始找到地面(
      • verbruggen s.
      • Menschaert G.
      MQC:用于核糖体分析的映射后数据探索工具。
      ,
      • Michel A.M.
      • Kiniry S.J.
      • O'Connor P.B.F.
      • Mullan J.P.
      • 巴兰诺夫P.V.
      GWIPS-ZIZ:2018更新。
      ,
      • O'Connor P.B.
      • 和reev d.e.
      • 巴兰诺夫P.V.
      mRNA特征对局部核糖体分析读密度的相对影响的比较调查。
      ,
      • chung b.y.
      • Hardcastle T.J.
      • 琼斯J.D.
      • Irigoyen N.
      • FIRTH A.E.
      • Baulcombe D.C.
      • 布里尔利I.
      使用双链体核酸酶在核糖体分析和用于Ribo-SEQ数据分析的用户友好的软件包中。
      ,
      • Carja O.
      • 邢T.
      • 华莱士e.w.j.
      • Plotkin J.B.
      • 莎第P.
      Riboviz:核糖体分析数据集的分析和可视化。
      )和蛋白质研究应该毫不犹豫地使用它们。
      占据,突畴方法应佩戴高优先级的质量检查,数据探索和特定于样本的P-exfset。

       Proteoform呼叫

      如结果部分所示,三种蛋白质调用方法中的每一个都有自己的优点和缺点。根据分析的目标,一种特定方法或组合可能更合适。在后续MS验证的情况下,所有三种实现方法的组合使得能够良好地努力来丰富搜索空间。如果您必须依赖一种技术,则经典的蛋白质调用之后仍然是随后的MS验证的眼睛,在发起核糖体分析数据的前提下。这不是完全意外的,因为经典方法开发以与后续MS一起使用(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      ),与价格相比(
      • erhard f.
      • Halenius A.
      • Zimmermann C.
      • 宽风A.
      • Kowalewski D.
      • 周为M.P.
      • 甜菜鼬S.
      • Zimmer R.
      • Lars D.
      改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
      )和幽灵(
      • 春S.Y.
      • Rodriguez C.M.
      • 托德P.K.
      • 磨坊R.E.
      幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
      )。虽然,如果没有发起概性(
      • Calviello L.
      • Mukherjee N.
      • Wyler E.
      • Zauber H.
      • Hirsekorn A.
      • Selbach M.
      • 陆地店M.
      • obermayer b.
      • 霍姆勒U.
      在核糖体分析数据中检测积极翻译的开放阅读框架。
      ,
      • Fritsch C.
      • Herrmann A.
      • nothnagel m.
      • Szafranski K.
      • Huse K.
      • 舒曼F.
      • 舍瑞贝尔斯。
      • Platzer M.
      • Krawczak M.
      • 汉普J.
      • 麸皮
      基因组搜索使用核糖体脚印的新型人uorF和N末端蛋白延长。
      ,
      • Hussmann J.A.
      • Patchett S.
      • 约翰逊A.
      • Sawyer S.
      • 按W.H.
      理解核糖体分析实验中的偏见显示酵母中翻译动态的签名。
      ,
      • McGlincy N.J.
      • Ingolia N.T.
      通过核糖体分析转录的翻译转录测量。
      ),价格和幽灵可以进来帮助。在未来,甚至其他方法(
      • 字段A.P.
      • Rodriguez e.h.
      • Jovanovic M.
      • 斯特恩吉扎尔N.
      • Haas B.J.
      • Mertins P.
      • Raychowdhury R.
      • Hacohen N.
      • carr s.a.
      • Ingolia N.T.
      • Regev A.
      • Weissman J.s.
      基于回归的核糖体分析数据分析揭示了哺乳动物翻译的守恒复杂性。
      ,
      • Calviello L.
      • Mukherjee N.
      • Wyler E.
      • Zauber H.
      • Hirsekorn A.
      • Selbach M.
      • 陆地店M.
      • obermayer b.
      • 霍姆勒U.
      在核糖体分析数据中检测积极翻译的开放阅读框架。
      ,
      • 咀嚼g.-l.
      • Pauli A.
      • rinn J.L.
      • Regev A.
      • Schier A F.
      • 瓦伦E.
      核糖体谱揭示了编码RNA的长期非编码RNA和5'领导者之间的相似之处。
      ,
      • 姬Z.
      Riborf:使用核糖体分析识别基因组宽的翻译开放阅读框架。
      ,
      • Bazzini A.A.
      • 约翰斯通T.G.
      • Christiano R.
      • Mackowiak S.D.
      • obermayer b.
      • 弗莱明的E.S.
      • Vejnar C.E.
      • 李米。
      • Rajewsky N.
      • Walther T.C.
      • giraldez a.j.
      利用核糖体脚印和进化守恒鉴定脊椎动物中的小ORF。
      )可以在蛋白质形制中引入。
      有很多关于RPF信号的假阳性率以及如何影响核糖体剖面预测的组织和ORF的可靠性和意义(
      • Guttman M.
      • 罗素P.
      • Ingolia N.T.
      • Weissman J.s.
      • 着陆器E.S.
      核糖体分析提供了大量非编码RNA不编码蛋白质。
      ,
      • Ingolia N.T.
      • 布鲁尔G.A.
      • 斯特恩吉扎尔N.
      • 哈里斯M.S.
      • Talhhouarne G.J.S.
      • 杰克逊S.E.
      • 遗嘱M.R.
      • Weissman J.s.
      核糖体分析显示出普遍的翻译在注释的蛋白质编码基因之外。
      ),即使在严格的设置下。因此,蛋白质形态器使用MS / MS作为一个重要的独立金标准技术,以验证核糖体谱提出的新候选者。关于核糖体分析的假阳性率的讨论表明了该后续MS / MS验证步骤的必要性。
      值得一提的另一点是可以在蛋白质常规管道中考虑来自其他转录组和翻译测序源的信息。随着RNA-SEQ序列已经可以用蛋白质形制映射,基础石头已经铺设了转录组映射。像RNC-SEQ等其他翻译序列技术(
      • 钟杰。
      • 崔Y.
      • 郭杰。
      • 陈祖
      • 杨L.
      • 他Q.Y.
      • 张G.
      • 王T.
      用翻译MRNA分析解决中心染色体的人蛋白质:战略示范。
      )和陷阱-SEQ(
      • inada t.
      • Winstall E.
      • tarun s.z.
      • yates j.r.
      • Schieltz D.
      • 萨克斯A.B.
      酵母核糖体及其相关蛋白质和MRNA的一步亲和纯化。
      还可以在未来包括在蛋白质形制中,一旦这些技术常用为核糖体分析。这将允许构建来自不同的翻译技术角度的候选蛋白质仿死搜索空间。此外,随着这些额外的一些测序技术中的一些读取长度而不是核糖体分析(
      • 钟杰。
      • 崔Y.
      • 郭杰。
      • 陈祖
      • 杨L.
      • 他Q.Y.
      • 张G.
      • 王T.
      用翻译MRNA分析解决中心染色体的人蛋白质:战略示范。
      )这将开辟有趣的机会,用于开发流水线模块来发现新的拼接变体。

       FASTA文件导出和数据库组合

      开发了不同的选择,以结合不同蛋白质常规分析策略的Fasta出口以及与Uniprot的参考序列合并。蛋白质形态的第一个释放不允许使用这些合并和用户在自定义植物常规数据库中首先和之后,先后和之后的UNIPROT搜索频谱数据(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )。现在,通过将Uniprot和蛋白质形态的序列合并到一个数据库中,蛋白质组学匹配是在一个搜索中运行的所有序列的所有序列都以设定的搜索空间大小完成。这消除了由于搜索空间尺寸不同的识别偏差,从而促进了整体评估和解释。我们相信,这种策略在许多其他突育研究案例中有用。此外,设计的组合选项还可用于比较除本手稿中执行的蛋白质形式调用方法的比较以外的其他策略集(例如 不同的成绩单呼叫方法,不同的蛋白质常规参数集...)。在缺点中,组合数据库导致更大的搜索空间尺寸,这对蛋白质组学FDR有一种温和但负面影响。因此,可以应用新的MS / MS识别策略来克服这个问题(见 诺布拉)。
      作为一些搜索引擎(例如 Comet (
      • ENG J.K.
      • Hooopmann M.R.
      • jahan t.a.
      • Egertson J.D.
      • 贵族W.S.
      • maccoss m.j.
      深入了解彗星 - 实现和功能。
      ),proteomapper(
      • 门多萨L.
      • 德意曲e.w.
      • 太阳Z.
      • 坎贝尔D.S.
      • Shteynberg D.D.
      • 莫里茨R.L.
      肽的柔性和快速映射到具有蛋白质斑仔族蛋白质的蛋白质组。
      )),phpms(
      • 柯林斯A.
      • 琼斯A.R.
      PHPMS:基于PHP的质谱实用程序库。
      ))开始接受PEFF格式(http://www.psidev.info/peff),Promeoformer中包含的另一个新选项允许以此新格式导出结果。丰富和严格定义的PEFF报头信息,包括有关序列变体的详细信息,承诺是一个有用的工具,以在不同突源工具之间更容易地传达精确的结果(
      • 德意曲e.w.
      常用于质谱蛋白质组学中的文件格式。
      )。编程为处理此格式的工具越多,本新颖格式的适用性更广泛。

       MAS / MS的MS / MS基于MAXQUANT的验证

      首先,我们描述了基于MS / MS的验证实验,重点是结合不同的植物呼叫策略。在与搜索空间冗余删除的组合之间观察到MS / MS识别数量的数量并不多。这主要是因为maxquant的蛋白推断算法(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ,
      • Cox J.
      • Neuhauser N.
      • Michalski A.
      • 施泰米r.a.
      • 奥尔森J.V.
      和romeda:肽搜索引擎集成到最大环境中。
      )(或其他MS / MS识别工具)捆绑蛋白质组中的冗余序列。然而,如果之后有利用Uniprot的合并,则保持冗余是有用的,因为目的序列不会通过它们最终更长的扩展变体去除。保持这种冗余并不意味着数据库大小在RNA-SEQ辅助蛋白素学研究中所见(
      • 李H.D.
      • Menon R.
      • OPENN G.S.
      • 关扬
      通过整合功能基因组学和蛋白质组学证据,重新探讨典型均匀性同种型。
      ,
      • 公园H.
      • BAE J.
      • 金H.
      • 金斯。
      • 金H.
      • MUN D.G.
      • 约亚
      • 李W.
      • Chae S.
      • 李斯。
      • 金H.K.
      • Hwang D.
      • 李S.W.
      • PAEK E.
      紧凑型富有的定制序列数据库和快速和敏感的数据库搜索有效的蛋白质分析。
      )。核糖体分析仍然认为与RNA-SEQ所需的3-或6帧分析相比,仅考虑一个阅读框的信息(
      • 克拉皮j.
      • ndah E.
      • koch a。
      • Steyaert S.
      • Gawron D.
      • de Keulenaer S.
      • 德梅斯特E.
      • de Meyer T.
      • van criekinge w。
      • van damme p.
      • Menschaert G.
      蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
      )。因此,对MS / MS搜索FDR的影响有限。进一步,在 补充表S2 很明显,在针对冗余和非还原搜索空间的搜索之间的识别数量没有显着差异(4 330识别的蛋白质组用于冗余 相对 4 322非还原)。因此,与RNA-SEQ负载的蛋白质组织形成鲜明对比,对于核糖体分析辅助实验,可以将合理的冗余整体呈现给蛋白质推理机制而没有主要影响。因此,蛋白质推理可用作在MS / MS搜索的后期蛋白质组中纳入蛋白质组中的冗余鉴定的资产。
      对于蛋白质形制和Uniprot之间的合并,大多数标识乍一看,在重叠中发现。然而,MaxQuant蛋白推理算法允许通过单独搜索UniProt数据库无法解释的组合搜索空间中拾取新的蛋白质ord。从算法的性质预期,这些新识别的蛋白质形式被经典的蛋白质呼唤和价格方法添加到数据库中,而不是由幽灵,因为它对参考注释的依赖性,使其不适合检测新的蛋白质综合作用。此外,与HCT116相比,Jurkat数据的核糖体分析水平的较高覆盖率确实导致总搜索空间中更多的翻译产品候选,但它没有显着增加MS / MS标识的数量(补充表S2)。然而,新型蛋白质常规的量大致增加了两倍(补充图S5:小组S5g与 S5D)因此,可以得出结论,核糖体的分析覆盖率更高(以及更全面的搜索空间)导致更多的新蛋白质变体,而不会增加规范蛋白质鉴定的量。此外,更多的测序深度增强了核糖体分析分析的质量和力量(
      • 糖果A.
      • Tuller T.
      估计各种分辨率水平的核糖体分析性能和再现性。
      )。
      接下来,在 Fig. 2D,仅仅为单位(Swissprot + Trembl)鉴定了4477个(1,05%)中的47个蛋白质。这提出了参考信息仍然有用的程度,最终可以完全替换通用蛋白质组学实验中的定制搜索空间。值得讨论,但是必须记住,从排序信息生成这些自定义数据库需要一段时间,而可以直接从其存储库下载参考数据库。显然,这是依赖于研究的,并且在这里,核糖体分析的搜索空间和参考的组合是从已知病例中分离新的蛋白质常规所必需的。对于没有或不足的蛋白质参考信息的样品和物种,这次讨论具有完全不同的光线。在这种情况下,基于核有体分析生成的自定义数据库是非常高的值,因为此自定义数据库可以满足缺陷参考的角色。
      进一步的分析基于以半自动方式的变化性质对蛋白质形式进行分类。因此,在MS / MS之后验证了不同类别的蛋白质型。比较数据集之间的这些分类结果表明,分析策略倾向于对特定植物类别的丰富有影响。因此,重要的是在评估突介质实验的结果时,请记住所有数据源的起源和特异性。
      也可以手动和单独检查不同的新型蛋白质orts。在MS / MS级别,可以在MaxQuant界面和核糖体分析水平上检查示例,可以将这些相同示例的证据加载到使用蛋白质形态托纸巾纸巾文件中选择的基因组浏览器中。这样,可以在不同层次的证据中详细研究和观看蛋白质Oform。最近,通过两种突出组件的格式的定义,可以获得更直观的组合不同的视觉信息层的方式:验证和探测器(
      • Menschaert G.
      • 王X.
      • 琼斯A.R.
      • Ghali F.
      • Fenyöd。
      • Olexiouk V.
      • 张B.
      • 德意曲e.w.
      • Ternent T.
      • VizcaínoJ.A.
      验证和探测标准格式:可以无缝集成基因组学和蛋白质组学数据。
      )。利用这些格式,蛋白质组学分析的结果可以显示在基因组和转录组水平上,因为蛋白质组学识别现在可以存储在适应的SAM / BAM或床文件中,广泛使用并能够被基因组浏览器可视化。但是,MaxQuant目前输出不可转换为验证和探测器的格式(
      • Olexiouk V.
      • Menschaert G.
      ProbamConvert:验证/探测器的转换工具。
      )。
      所应用的方法,其中从分析匹配核糖体分析与蛋白质形态的分析来获得定制搜索空间,使得能够识别和验证新的蛋白质ortm。与此同时,这会打开基因组重新注释的机会,此手稿的结果可以返回到Ensembl等主动(
      • Zerbino D.R.
      • ACHUTHAN P.
      • Akanni W.
      • Amode M.R.
      • 巴克尔D.
      • Bhai J.
      • Billis K.
      • 康明斯C.
      • 甘阿
      • GirónC.G.
      • 吉尔L.
      • 戈登L.
      • Haggerty L.
      • Haskell E.
      • Hourlier T.
      • izuogu o.g.
      • Janacek S.H.
      • Juettemann T.
      • 到J.K.
      • Laird M.R.
      • Lavidas I.
      • 刘Z.
      • Loveland J.E.
      • Maurel T.
      • 迈凯轮W.
      • 摩尔B.
      • 泥格J.
      • 墨菲D.N.
      • 纽曼五。
      • Nuhn M.
      • OGEH D.
      • ong c.k.
      • 帕克A.
      • Patricio M.
      • Rat H.S.
      • 施林堡H.
      • 谢泼德D.
      • 麻雀H.
      • 泰勒K.
      • Thormann A.
      • vullo A.
      • 威尔特B.
      • ZADISSA A.
      • Frankish A.
      • 狩猎s.e.
      • 科斯塔迪玛M.
      • Langridge N.
      • 马丁F.J.
      • Muffato M.
      • 佩里E.
      • ruffier m.
      • 污渍D.M.
      • Tevanion S.J.
      • Aken B.L.
      • Cunningham F.
      • yates a。
      • flicek p.
      Ensembl 2018。
      )和Uniprot(
      • Uniprot财团
      UNIPROT:通用蛋白质知识库。
      )手工策施后(
      • Menschaert G.
      • Fenyöd。
      来自生物信息学角度的蛋白素学元学:一种生长田。
      )。以这种方式,反馈回路将被关闭,因为最初使用的本研究的参考信息可以补充和调整。此外,我们的方法可以扩展到来自其他研究的数据。骄傲的所有蛋白质组学数据(
      • VizcaínoJ.A.
      • Csordas A.
      • Del-Toro N.
      • 戴安斯J.A.
      • 怜悯J.
      • Lavidas I.
      • Mayer G.
      • Perez-Riverol Y.
      • Reinger F.
      • Ternent T.
      • 徐Q.W.
      • 王R.
      • Hermjakob H.
      2016年更新自豪数据库及其相关工具。
      )可以基于匹配的核经元分析数据来重新扫描自定义搜索空间。最近,RPFDB的最新更新(
      • 王H.
      • 杨L.
      • 王Y.
      • 陈L.
      • 李H.
      • 谢Z.
      RPFDB v2.0:从核糖体分析产生的转化mRNA的基因组信息的更新数据库。
      )报道其数据库现在包含2884个核糖体分析数据集的数据,覆盖29种。这允许在骄傲中查找不同蛋白质组学样本的匹配核糖体分析数据。因此,甚至可以根据自定义核糖体分析驱动的信息来设置具有随后的MS / MS搜索的蛋白质常规器的自动蛋白素学液管线,其可以基于自定义核糖体分析驱动的信息。在HEK293单元格(SRA Project SRP014629)的在线RPFDB数据上运行该半自动设置的示例。匹配的N级轨染MS / MS数据(PRIDE DataSet PXD005583)的分析导致了不同类别的蛋白质型,但特别是UORF和N末端变化,预期蛋白质组学数据类型( 补充图S10)。该示例展示了蛋白质形制的管道的可用性及其对更广泛的蛋白质组学和基因组学社区的结果。

       使用PRITHTOR的概念验证蛋白蛋白酶实验

      基于估价的概念的第一个证明(
      • Gessulat S.
      • 施密特T.
      • ZOLG D.P.
      • 萨马拉斯诗
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • rechenberger J.
      • Delanghe B.
      • Huhmer A.
      • reimer u.
      • ehrlich h.-c.
      • Aiche S.
      • Kuster B.
      • Wilhelm M.
      priosh。
      )发出了在碎片谱识别过程中包括MS / MS强度,已发出。 MaxQuant仅使用Andromeda得分和Delta得分(
      • Cox J.
      • Neuhauser N.
      • Michalski A.
      • 施泰米r.a.
      • 奥尔森J.V.
      和romeda:肽搜索引擎集成到最大环境中。
      )评价PSM。因此,很多信息被忽视了。通过使用深度学习,PRITITS构建了PSM的附加功能和渗滤器(
      • KällL.
      • 坎特伯雷J.D.
      • 韦斯顿J.
      • 贵族W.S.
      • maccoss m.j.
      霰弹枪蛋白质组学数据集的半监督学习肽鉴定。
      ,
      • 他们。
      • maccoss m.j.
      • 贵族W.S.
      • KällL.
      具有渗滤器3.0的大型蛋白质组学数据集的快速准确的蛋白质假发现速率。
      )一切都在一个统计框架中占据了一切。结果表明,这些额外的功能允许更严格地过滤,而不会降低经过验证的PSM量。另一方面,普利特(
      • Gessulat S.
      • 施密特T.
      • ZOLG D.P.
      • 萨马拉斯诗
      • Schnatbaum K.
      • Zerweck J.
      • knaute t.
      • rechenberger J.
      • Delanghe B.
      • Huhmer A.
      • reimer u.
      • ehrlich h.-c.
      • Aiche S.
      • Kuster B.
      • Wilhelm M.
      priosh。
      )和渗滤器(
      • KällL.
      • 坎特伯雷J.D.
      • 韦斯顿J.
      • 贵族W.S.
      • maccoss m.j.
      霰弹枪蛋白质组学数据集的半监督学习肽鉴定。
      ,
      • 他们。
      • maccoss m.j.
      • 贵族W.S.
      • KällL.
      具有渗滤器3.0的大型蛋白质组学数据集的快速准确的蛋白质假发现速率。
      )避免过度装满。此外,通过将这两种工具组合起作用时,不添加额外的过度装备,因为它们用作连续步骤。总的来说,这一审判案件表明,在PSM验证框架中添加这些附加功能存在有希望的优势,这可以帮助营养验证策略。
      该有前途技术的下一步是包括蛋白质推理算法中的应用程序(
      • 他们。
      • maccoss m.j.
      • 贵族W.S.
      • KällL.
      具有渗滤器3.0的大型蛋白质组学数据集的快速准确的蛋白质假发现速率。
      )渗透器以验证这是否导致额外的蛋白质标识与仅具有最大分数的运行相比。然后,这些额外的蛋白质标识可以导致额外的蛋白质仿验证。以及prosit,其他工具包括在他们的搜索算法中的片段强度,如ms2PIP(
      • Degoeve S.
      • 玛特L.
      • jurisica I.
      MS2PIP:用于MS / MS峰值强度预测的工具。
      )和棱镜(//github.com/verilylifesciences/deepmass),可以在蛋白质核ocment中进行测试,并最终加入通用蛋白质组织工作流程(
      • Willems P.
      • ndah E.
      • Jonckheere V.
      • Stael S.
      • 贴纸A.
      • 玛特L.
      • van Breusegem F.
      • Gevaert K.
      • van damme p.
      N-末端蛋白质组学辅助拟南芥拟南芥的翻译翻译景观探讨。
      )。此外,一旦测试了这些下一代MS / MS搜索引擎,它们就可以封装在包装纸中,允许运行总射精管道。目前,管道可以连续运行直到FastA搜索空间,但MaxQuant搜索引擎仍然取决于GUI。这些第一次结果明确证明(Fig. 5),我们认为,基于MS / MS强度的识别策略,所有基于机器学习,都是蛋白质组织中前进的一部分,因为FDR计算因延长搜索空间大小而遇到该字段中的挑战。由于核糖体分析,与来自RNA-SEQ的3或6帧ORF翻译数据库相比,这种搜索空间尺寸爆炸是以某种方式磨损(
      • 李H.D.
      • Menon R.
      • OPENN G.S.
      • 关扬
      通过整合功能基因组学和蛋白质组学证据,重新探讨典型均匀性同种型。
      ,
      • 公园H.
      • BAE J.
      • 金H.
      • 金斯。
      • 金H.
      • MUN D.G.
      • 约亚
      • 李W.
      • Chae S.
      • 李斯。
      • 金H.K.
      • Hwang D.
      • 李S.W.
      • PAEK E.
      紧凑型富有的定制序列数据库和快速和敏感的数据库搜索有效的蛋白质分析。
      )但是,降低FDR的新方法允许更加严格地工作,并更有信心验证蛋白素质结果。

      结论

      我们报告了蛋白质形制的流水线的完整改造,其中所有新实施的管道特征都急剧扩大其可能性。不同的蛋白质调用方法的组合最佳地允许扩展基于核经元分析的MS / MS验证的搜索空间。这些努力显示了识别MS / MS验证的新型蛋白质常规的集合的能力,分布在不同可能的蛋白质变体类型上。此外,将第一步包括在蛋白质组织设置中包括基于MS / MS强度的方法。所有这些结果都在一起为核糖体易辅助的蛋白质组织研究提供了新颖的见解。

      数据可用性

      在该稿件中使用的原始核糖体分析读数可以在基因表达式综合征中找到(数据集GSE58207和GSE74279)。有关这些数据的更多细节可以在补充实验方案中找到。
      MS / MS蛋白质组学数据已经通过PRIDE(38)伙伴存储库与DataSet标识符PXD011353(http://central.proteomexchange.org/cgi/GetDataset?ID=PXD011353)。

      补充材料

      参考

        • nesvizhskii a.i.
        蛋白质组:概念,应用和计算策略。
        NAT。方法。 2014; 11: 1114-1125
        • Menschaert G.
        • Fenyöd。
        来自生物信息学角度的蛋白素学元学:一种生长田。
        质谱。录 2015; 9999: 1-16
        • 李H.D.
        • Menon R.
        • OPENN G.S.
        • 关扬
        通过整合功能基因组学和蛋白质组学证据,重新探讨典型均匀性同种型。
        蛋白质组学。 2014; 14: 2709-2718
        • 公园H.
        • BAE J.
        • 金H.
        • 金斯。
        • 金H.
        • MUN D.G.
        • 约亚
        • 李W.
        • Chae S.
        • 李斯。
        • 金H.K.
        • Hwang D.
        • 李S.W.
        • PAEK E.
        紧凑型富有的定制序列数据库和快速和敏感的数据库搜索有效的蛋白质分析。
        蛋白质组学。 2014; 14: 2742-2749
        • Ingolia N.T.
        • ghaemmaghami s。
        • 纽曼J.R.S.
        • Weissman J.s.
        用核糖体分析与核苷酸分辨率的语言范围分析。
        科学。 2009; 324: 218-223
        • Ingolia N.T.
        • 布鲁尔G.A.
        • Rouskin S.
        • McGeachy A.M.
        • Weissman J.s.
        通过核糖体保护的mRNA片段的深度测序来监测体内平移的核糖体分析策略。
        NAT。 protoc。 2012; 7: 1534-1550
        • 李斯。
        • 刘B.
        • 李斯。
        • 黄S.-X.
        • 沉B.
        • 钱S.-B.
        单核苷酸分辨率下哺乳动物细胞翻译起始位点的全局映射。
        Proc。 Natl。阿卡。 SCI。 2012; 109: E2424-E2432
        • Menschaert G.
        • van criekinge w。
        • 孔冠皆宜
        • koch a。
        • 克拉皮j.
        • Gevaert K.
        • van damme p.
        基于核糖体分析的深度蛋白质组覆盖艾滋病质谱蛋白和肽发现,提供替代翻译产品和近同源翻译起始事件的证据。
        摩尔。细胞蛋白质组学。 2013; 12: 1780-1790
        • koch a。
        • Gawron D.
        • Steyaert S.
        • ndah E.
        • 克拉皮j.
        • de Keulenaer S.
        • 德梅斯特E.
        • 马米
        • 沉B.
        • Gevaert K.
        • van criekinge w。
        • van damme p.
        • Menschaert G.
        将蛋白质组学和核糖体分析整合的蛋白质组织方法提高了蛋白质识别的效率,并能够发现替代翻译开始点。
        蛋白质组学。 2014; 14: 2688-2698
        • van damme p.
        • Gawron D.
        • van criekinge w。
        • Menschaert G.
        N-末端蛋白质组学和核糖体分析提供了小鼠和男性替代翻译启动景观的综合图。
        摩尔。细胞蛋白质组学。 2014; 13: 1245-1261
        • 克拉皮j.
        • ndah E.
        • koch a。
        • Steyaert S.
        • Gawron D.
        • de Keulenaer S.
        • 德梅斯特E.
        • de Meyer T.
        • van criekinge w。
        • van damme p.
        • Menschaert G.
        蛋白质形态:通过核糖体分析和MS集成的深度蛋白质组覆盖。
        核酸RES。 2014; 43: e29
        • erhard f.
        • Halenius A.
        • Zimmermann C.
        • 宽风A.
        • Kowalewski D.
        • 周为M.P.
        • 甜菜鼬S.
        • Zimmer R.
        • Lars D.
        改进的Ribo-SEQ可以准确和验证隐藏翻译事件的识别。
        NAT。方法。 2018; 15: 363-366
        • 春S.Y.
        • Rodriguez C.M.
        • 托德P.K.
        • 磨坊R.E.
        幽灵:一种基于核糖体分析序列数据的积极翻译成绩单的基于光谱相干性分类器。
        BMC生物信息学。 2016; 17: 482
        • 字段A.P.
        • Rodriguez e.h.
        • Jovanovic M.
        • 斯特恩吉扎尔N.
        • Haas B.J.
        • Mertins P.
        • Raychowdhury R.
        • Hacohen N.
        • carr s.a.
        • Ingolia N.T.
        • Regev A.
        • Weissman J.s.
        基于回归的核糖体分析数据分析揭示了哺乳动物翻译的守恒复杂性。
        摩尔。细胞。 2015; 60: 816-827
        • Calviello L.
        • Mukherjee N.
        • Wyler E.
        • Zauber H.
        • Hirsekorn A.
        • Selbach M.
        • 陆地店M.
        • obermayer b.
        • 霍姆勒U.
        在核糖体分析数据中检测积极翻译的开放阅读框架。
        NAT。方法。 2015; 13: 165-170
        • 咀嚼g.-l.
        • Pauli A.
        • rinn J.L.
        • Regev A.
        • Schier A F.
        • 瓦伦E.
        核糖体谱揭示了编码RNA的长期非编码RNA和5'领导者之间的相似之处。
        发展。 2013; 140: 2828-2834
        • 姬Z.
        Riborf:使用核糖体分析识别基因组宽的翻译开放阅读框架。
        Curr。 protoc。摩尔。 BIOL。 2018; : e67
        • Barsnes H.
        • Vaudel M.
        搜索Gui:蛋白质组学搜索和De Novo发动机的高度适应性公共界面。
        J.蛋白质组。 2018; 17: 2552-2555
        • Cox J.
        MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
        NAT。 Biotechnol。 2008; 26: 1367-1373
        • Cox J.
        • Neuhauser N.
        • Michalski A.
        • 施泰米r.a.
        • 奥尔森J.V.
        和romeda:肽搜索引擎集成到最大环境中。
        J.蛋白质组。 2011; 10: 1794-1805
        • Narasimhan C.
        • Tabb D.L.
        • verberkmoes n.c.
        • Thompson M.R.
        • Hettich R.L.
        • uberbacher e.c.
        摩刺:基于强度的串联质谱评分方案,可提高高信心的肽鉴定。
        肛门。化学。 2005; 77: 7581-7593
        • Sadygov R.
        • Wohlschlegel J.
        • 公园S.K.
        • XU T.
        • yates j.r.
        中央限制定理作为基于强度的评分功能的近似值。
        肛门。化学。 2006; 78: 89-95
        • Tabb D.L.
        • 费尔南多C.G.
        • Chambers M.C.
        myRimatch:多变量超细分析高度准确的串联质谱肽鉴定。
        J.蛋白质组。 2007; 6: 654-661
        • Gessulat S.
        • 施密特T.
        • ZOLG D.P.
        • 萨马拉斯诗
        • Schnatbaum K.
        • Zerweck J.
        • knaute t.
        • rechenberger J.
        • Delanghe B.
        • Huhmer A.
        • reimer u.
        • ehrlich h.-c.
        • Aiche S.
        • Kuster B.
        • Wilhelm M.
        priosh。
        公认。 2019;
        • KällL.
        • 坎特伯雷J.D.
        • 韦斯顿J.
        • 贵族W.S.
        • maccoss m.j.
        霰弹枪蛋白质组学数据集的半监督学习肽鉴定。
        NAT。方法。 2007; 4: 923-925
        • 他们。
        • maccoss m.j.
        • 贵族W.S.
        • KällL.
        具有渗滤器3.0的大型蛋白质组学数据集的快速准确的蛋白质假发现速率。
        J.IM。 SOC。质谱。 2016; 27: 1719-1727
        • Grüningb.
        • 戴尔R.
        • SjödinA.
        • 查普曼B.A.
        • Rowe J.
        • Tomkins-Tinch C.H.
        • valieris r.
        • KösterJ.
        Bioconda:为生命科学的可持续和综合软件分销。
        NAT。方法。 2018; 15: 475-476
        • DUNN J.G.
        • Weissman J.s.
        塑体:下一代测序和基因组学数据的核苷酸分辨率分析分辨率分辨率分析。
        BMC基因组学。 2016; 17: 958
        • verbruggen s.
        • Menschaert G.
        MQC:用于核糖体分析的映射后数据探索工具。
        计算。方法生物化程序。,在新闻中。 2018;
        • Uniprot财团
        UNIPROT:通用蛋白质知识库。
        核酸RES。 2017; 45: D158-D169
        • Gawron D.
        • ndah E.
        • Gevaert K.
        • van damme p.
        位置蛋白质组学揭示了N-末端蛋白质常规稳定性的差异。
        摩尔。系统。 BIOL。 2016; 12: 858
        • Gerashchenko M.V.
        • Gladyshev V.N.
        翻译抑制剂导致核糖体分析实验异常。
        核酸RES。 2014; 42: e134
        • Gerashchenko M.V.
        • Gladyshev V.N.
        核糖核酸酶选择对核糖体分析。
        核酸RES。 2017; 45: e6
        • BartholomäusA.
        • Del Campo C.
        • Ignatova Z.
        绘制核糖体分析的非标准化偏差。
        BIOL。化学。 2015; 397: 23-35
        • Michel A.M.
        • Kiniry S.J.
        • O'Connor P.B.F.
        • Mullan J.P.
        • 巴兰诺夫P.V.
        GWIPS-ZIZ:2018更新。
        核酸RES。 2018; 46: D823-D830
        • 郭L.
        • 杨W.
        • 黄Q.
        • 强J.
        • 哈特J.R.
        • 王W.
        • 胡锦涛
        • 朱茹
        • 刘恩
        • 张Y.
        Selenocysteine特异性质谱仪揭示了组织明显的硒蛋白和候选硒蛋白。
        细胞化学。 BIOL。 2018; 25: 1380-1388
        • Labunskyy v.M.
        • Hatfield D.L.
        • Gladyshev V.N.
        硒蛋白:分子途径和生理作用。
        physiol。录 2014; 94: 739-777
        • VizcaínoJ.A.
        • Csordas A.
        • Del-Toro N.
        • 戴安斯J.A.
        • 怜悯J.
        • Lavidas I.
        • Mayer G.
        • Perez-Riverol Y.
        • Reinger F.
        • Ternent T.
        • 徐Q.W.
        • 王R.
        • Hermjakob H.
        2016年更新自豪数据库及其相关工具。
        核酸RES。 2016; 44: D447-D456
        • Kryukov G.v.
        • Kryukov v.M.
        • Gladyshev V.N.
        含有新的哺乳动物硒的蛋白质,其鉴定用算法搜索硒细胞插入序列元件。
        J. Biol。化学。 1999; 274: 33888-33897
        • 安德鲁斯S.
        FASTQC:高吞吐量序列数据的质量控制工具。
        未发表的。 2010;
        • O'Connor P.B.
        • 和reev d.e.
        • 巴兰诺夫P.V.
        mRNA特征对局部核糖体分析读密度的相对影响的比较调查。
        NAT。安排。 2016; 7: 12915
        • chung b.y.
        • Hardcastle T.J.
        • 琼斯J.D.
        • Irigoyen N.
        • FIRTH A.E.
        • Baulcombe D.C.
        • 布里尔利I.
        使用双链体核酸酶在核糖体分析和用于Ribo-SEQ数据分析的用户友好的软件包中。
        RNA。 2015; 21: 1731-1745
        • Carja O.
        • 邢T.
        • 华莱士e.w.j.
        • Plotkin J.B.
        • 莎第P.
        Riboviz:核糖体分析数据集的分析和可视化。
        BMC生物信息学。 2017; 18: 461
        • Fritsch C.
        • Herrmann A.
        • nothnagel m.
        • Szafranski K.
        • Huse K.
        • 舒曼F.
        • 舍瑞贝尔斯。
        • Platzer M.
        • Krawczak M.
        • 汉普J.
        • 麸皮
        基因组搜索使用核糖体脚印的新型人uorF和N末端蛋白延长。
        Genome Res。 2012; 22: 2208-2218
        • Hussmann J.A.
        • Patchett S.
        • 约翰逊A.
        • Sawyer S.
        • 按W.H.
        理解核糖体分析实验中的偏见显示酵母中翻译动态的签名。
        Plos Genet。 2015; 11: 1-25
        • McGlincy N.J.
        • Ingolia N.T.
        通过核糖体分析转录的翻译转录测量。
        方法。 2017; 126: 112-129
        • Bazzini A.A.
        • 约翰斯通T.G.
        • Christiano R.
        • Mackowiak S.D.
        • obermayer b.
        • 弗莱明的E.S.
        • Vejnar C.E.
        • 李米。
        • Rajewsky N.
        • Walther T.C.
        • giraldez a.j.
        利用核糖体脚印和进化守恒鉴定脊椎动物中的小ORF。
        Embo J. 2014; 33: 981-993
        • Guttman M.
        • 罗素P.
        • Ingolia N.T.
        • Weissman J.s.
        • 着陆器E.S.
        核糖体分析提供了大量非编码RNA不编码蛋白质。
        细胞。 2013; 154: 240-251
        • Ingolia N.T.
        • 布鲁尔G.A.
        • 斯特恩吉扎尔N.
        • 哈里斯M.S.
        • Talhhouarne G.J.S.
        • 杰克逊S.E.
        • 遗嘱M.R.
        • Weissman J.s.
        核糖体分析显示出普遍的翻译在注释的蛋白质编码基因之外。
        细胞代表。 2014; 8: 1365-1379
        • 钟杰。
        • 崔Y.
        • 郭杰。
        • 陈祖
        • 杨L.
        • 他Q.Y.
        • 张G.
        • 王T.
        用翻译MRNA分析解决中心染色体的人蛋白质:战略示范。
        J.蛋白质组。 2014; 13: 50-59
        • inada t.
        • Winstall E.
        • tarun s.z.
        • yates j.r.
        • Schieltz D.
        • 萨克斯A.B.
        酵母核糖体及其相关蛋白质和MRNA的一步亲和纯化。
        RNA。 2002; 8: 948-958
        • ENG J.K.
        • Hooopmann M.R.
        • jahan t.a.
        • Egertson J.D.
        • 贵族W.S.
        • maccoss m.j.
        深入了解彗星 - 实现和功能。
        J.IM。 SOC。质谱。 2015; 26: 1865-1874
        • 门多萨L.
        • 德意曲e.w.
        • 太阳Z.
        • 坎贝尔D.S.
        • Shteynberg D.D.
        • 莫里茨R.L.
        肽的柔性和快速映射到具有蛋白质斑仔族蛋白质的蛋白质组。
        J.蛋白质组。 2018; 17: 4337-4344
        • 柯林斯A.
        • 琼斯A.R.
        PHPMS:基于PHP的质谱实用程序库。
        J. Pr。 2018; 17: 1309-1313
        • 德意曲e.w.
        常用于质谱蛋白质组学中的文件格式。
        摩尔。细胞。蛋白质组学。 2012; 11: 1612-1621
        • 糖果A.
        • Tuller T.
        估计各种分辨率水平的核糖体分析性能和再现性。
        BIOL。直接的。 2016; 11: 24
        • Menschaert G.
        • 王X.
        • 琼斯A.R.
        • Ghali F.
        • Fenyöd。
        • Olexiouk V.
        • 张B.
        • 德意曲e.w.
        • Ternent T.
        • VizcaínoJ.A.
        验证和探测标准格式:可以无缝集成基因组学和蛋白质组学数据。
        基因组Biol。 2018; 19: 12
        • Olexiouk V.
        • Menschaert G.
        ProbamConvert:验证/探测器的转换工具。
        J.蛋白质组。 2017; 16: 2639-2644
        • Zerbino D.R.
        • ACHUTHAN P.
        • Akanni W.
        • Amode M.R.
        • 巴克尔D.
        • Bhai J.
        • Billis K.
        • 康明斯C.
        • 甘阿
        • GirónC.G.
        • 吉尔L.
        • 戈登L.
        • Haggerty L.
        • Haskell E.
        • Hourlier T.
        • izuogu o.g.
        • Janacek S.H.
        • Juettemann T.
        • 到J.K.
        • Laird M.R.
        • Lavidas I.
        • 刘Z.
        • Loveland J.E.
        • Maurel T.
        • 迈凯轮W.
        • 摩尔B.
        • 泥格J.
        • 墨菲D.N.
        • 纽曼五。
        • Nuhn M.
        • OGEH D.
        • ong c.k.
        • 帕克A.
        • Patricio M.
        • Rat H.S.
        • 施林堡H.
        • 谢泼德D.
        • 麻雀H.
        • 泰勒K.
        • Thormann A.
        • vullo A.
        • 威尔特B.
        • ZADISSA A.
        • Frankish A.
        • 狩猎s.e.
        • 科斯塔迪玛M.
        • Langridge N.
        • 马丁F.J.
        • Muffato M.
        • 佩里E.
        • ruffier m.
        • 污渍D.M.
        • Tevanion S.J.
        • Aken B.L.
        • Cunningham F.
        • yates a。
        • flicek p.
        Ensembl 2018。
        核酸RES。 2018; 46: D754-D761
        • 王H.
        • 杨L.
        • 王Y.
        • 陈L.
        • 李H.
        • 谢Z.
        RPFDB v2.0:从核糖体分析产生的转化mRNA的基因组信息的更新数据库。
        核酸RES。 2019; 47: D230-D234
        • Degoeve S.
        • 玛特L.
        • jurisica I.
        MS2PIP:用于MS / MS峰值强度预测的工具。
        生物信息学。 2013; 29: 3199-3203
        • Willems P.
        • ndah E.
        • Jonckheere V.
        • Stael S.
        • 贴纸A.
        • 玛特L.
        • van Breusegem F.
        • Gevaert K.
        • van damme p.
        N-末端蛋白质组学辅助拟南芥拟南芥的翻译翻译景观探讨。
        摩尔。细胞蛋白质组学。 2017; 16: 1064-1080
        • Vaudel M.
        • Barsnes H.
        • 鲍伦森
        • 镰刀A.
        搜索Gui:同时OMSSA和X的开源图形用户界面!串联搜索。
        蛋白质组学。 2011; 11: 996-999
        • Vaudel M.
        • 伯克哈特准
        • Zahedi R.P.
        • oveland E.
        • 鲍伦森
        • 镰刀A.
        • 玛特L.
        • Barsnes H.
        Peptideshaker可以实现MS衍生的蛋白质组学数据集的再分析。
        NAT。 Biotechnol。 2015; 33: 22-24