广告

准确地估计自上而下蛋白质组学中的上下文依赖性假发现率*[S]

  • 理查德D. Leduc
    一致
    可以解决对应的通信:电话:217-493-9885;传真:847-467-3276
    隶属关系
    来自伊利诺伊州埃文斯顿埃文斯顿的‡蛋白质组学卓越中心;
    搜索本作者的文章
  • ryan t. fellers.
    隶属关系
    来自伊利诺伊州埃文斯顿埃文斯顿的‡蛋白质组学卓越中心;
    搜索本作者的文章
  • 布莱恩P.早期
    隶属关系
    来自伊利诺伊州埃文斯顿埃文斯顿的‡蛋白质组学卓越中心;

    §伊利诺伊州埃文斯顿西北大学分子生物科学;
    搜索本作者的文章
  • Joseph B. Greer
    隶属关系
    来自伊利诺伊州埃文斯顿埃文斯顿的‡蛋白质组学卓越中心;
    搜索本作者的文章
  • Daniel P. Shams.
    隶属关系
    - 伊利诺伊州西北大学,西北大学生物科学;
    搜索本作者的文章
  • Paul M. Thomas.
    隶属关系
    来自伊利诺伊州埃文斯顿埃文斯顿的‡蛋白质组学卓越中心;

    §伊利诺伊州埃文斯顿西北大学分子生物科学;
    搜索本作者的文章
  • Neil L. Kelleher.
    一致
    可以解决对应的通信:电话:847-467-4362;传真:847-467-3276
    隶属关系
    来自伊利诺伊州埃文斯顿埃文斯顿的‡蛋白质组学卓越中心;

    §伊利诺伊州埃文斯顿西北大学分子生物科学;

    西北大学化学与Feinberg医学院,伊利诺伊州埃文斯顿
    搜索本作者的文章
  • 作者脚注
    *该研究得到了NIDA P30DA018310和Paul G. Allen Family Foundation(奖项#11715)。该工作也得到了Sherman Fairchild基金会的支持,并与国家卫生学院国家一般医学院授予P41 Gm108569的转化和发展蛋白质组学家的国家资源合作。
    [S] 本文含有补充材料。
      在过去的几年内,自上而下的蛋白质组学已经成为高吞吐量 蛋白质和蛋白质型识别技术。这种技术有潜力 在一项研究中识别和表征成千上万的蛋白质ort,但是 没有准确的假发现率(FDR)估计可能阻碍采用 未来自上而下蛋白质组学的一致性。在自动识别中 蛋白质ort的表征,FDR计算强烈取决于上下文 搜索。上下文包括MS数据质量,数据库正在询问, 搜索引擎和搜索的参数。特别是自上而下的蛋白质组学 - 那里 是四个分子水平的研究:蛋白质谱匹配(PRSM),蛋白质,同种型, 和proteoform。这里,用于计算准确的FDR的上下文相关框架 在每个级别的设计,实施,并针对手动策划验证 训练设置有546个确认的蛋白质Oforms。我们检查了几个搜索上下文 发现,在PRSM水平下计算的FDR在报道的真实FDR下 蛋白质水平平均为24倍。我们介绍了一个新的开源工具,tdcd_fdr_calculator, 提供可扩展,上下文相关的FDR计算,可以在搜索后应用 从任何搜索引擎提高自上而下蛋白质组学的结果质量。

      图形概要

      参考

        • Ntai I.
        • Toby T.K.
        • LEDUC R.D.
        • Kelleher N.L.
        一种无标记,差分自上而下的蛋白质组学的方法。
        方法mol。 BIOL。 2016; 1410: 121-133
        • Ntai I.
        • LEDUC R.D.
        • 倒立者R.T.
        • erdmann-gilmore p.
        • 戴维斯S.R.
        • Rumsey J.
        • 早期B.。
        • 托马斯下午
        • 李S.
        • 康普顿P.D.
        • 埃利斯M.J.
        • Ruggles K.v.
        • Fenyo D.
        • Boja E.S.
        • Rodriguez H.
        • Townsend R.R.
        • Kelleher N.L.
        综合患者衍生的乳腺肿瘤异种移植物的自下而上的蛋白质组学。
        摩尔。细胞。蛋白质组学。 2016; 15: 45-56
        • Senang O.
        • Kall L.
        蛋白质组学中的统计挑战的解决方案更具统计数据,而不是较少。
        J.蛋白质组。 2015; 14: 4099-4103
        • Wilhelm M.
        • Schlegl J.
        • Hahne H.
        • Moghaddas Golemi A.
        • Lieberenz M.
        • Savitski m.m.
        • Ziegler E.
        • Butzmann L.
        • Gessulat S.
        • 马克思H.
        • Mathieson T.
        • Lemeer S.
        • Schnatbaum K.
        • reimer u.
        • 文字H.
        • Mollenhauer M.
        • Slotta-huspenina J.
        • Boese J.H.
        • Bantscheff M.
        • Gerstmair A.
        • FAERBER F.
        • Kuster B..
        群体蛋白质组的质谱。
        自然。 2014; 509: 582-587
        • Savitski m.m.
        • Wilhelm M.
        • Hahne H.
        • Kuster B..
        • Bantscheff M.
        大蛋白质组学集中的蛋白质假发现速率估计的可扩展方法。
        摩尔。细胞。蛋白质组学。 2015; 14: 2394-2404
        • 汉堡T.
        定量蛋白质组学中虚假发现率统计基础的温和介绍。
        J.蛋白质组。 2018; 17: 12-22
        • 贵族W.S.
        • maccoss m.j.
        蛋白质质谱数据的计算与统计分析。
        Plos计算。 BIOL。 2012; 8: E1002296.
        • Benjamini Y.
        • Hochberg Y.
        控制虚假发现率:多次测试的实用和强大的方法。
        J. Roy。统计SOC。 1995; 57: 289-300
        • Hather G.
        • 希登R.
        • 鲍曼A.
        • von haller p.d.
        • Kolker E.
        使用随机数据库估算肽和蛋白质鉴定的假发现率。
        蛋白质组学。 2010; 10: 2369-2376
        • 希登R.
        • Hogan J.M.
        • Kolker N.
        • van Belle G.
        • Kolker E.
        使用随机数据库的肽识别概率的实验估计。
        omics。 2007; 11: 351-365
        • LEDUC R.D.
        • 泰勒G.K.
        • kim y.b.
        • Januszyk T.E.
        • 拜纳姆L.H.
        • Sola J.v.
        • Garavelli J.s.
        • Kelleher N.L.
        波动PTM:通过自上而下的质谱,蛋白质鉴定和表征的综合环境。
        核酸RES。 2004; 32 (Web服务器问题): W340-W345
        • 孟F.
        • Cargile B.J.
        • 米勒l.m.
        • Forbes A.J.
        • 约翰逊J.R.
        • Kelleher N.L.
        细菌和古代完整蛋白质鉴定的信息和复用。
        NAT。 Biotechnol。 2001; 19: 952-957
        • LEDUC R.D.
        • Kelleher N.L.
        利用高度质量精度串联MS数据的靶向蛋白质识别和表征的用于针对性PTM和相关工具。
        当前协议生物信息学。 2007; (第13章,单位13.6)
        • 弗兰克上午
        • Pesavento J.J.
        • mizzen c.a.
        • Kelleher N.L.
        • PEVZNER P.A.
        解释自上而下的质量。光谱使用光谱对齐。
        肛门。化学。 2008; 80: 2499-2505
        • 喇叭d.m.
        • Zubarev R.A.
        • MLEFFERTY F.W.
        大分子高分辨率电喷雾质谱的自动减小和解释。
        J.IM。 SOC。对于质谱。 2000; 11: 320-332
        • 寇Q.
        • Xun L.
        • 刘X.
        最佳Pic:基于自上而下的质谱的蛋白质形式识别和表征的软件工具。
        生物信息学。 2016; 32: 3495-3497
        • 刘X.
        • Sirotkin Y.
        • 沉Y.
        • 安德森G.
        • Tsai Y.S.
        • 婷婷。
        • Goodlett D.R.
        • 史密斯r.d.
        • BAFNA V.
        • PEVZNER P.A.
        使用自上而下光谱蛋白质识别。
        摩尔。细胞。蛋白质组学。 2012; 11 (M111.008524 )
        • 史密斯l.m.
        • Kelleher N.L.
        蛋白质Oform:一个描述蛋白质复杂性的单一术语。
        NAT。方法。 2013; 10: 186-187
        • 杨X.
        • 库仑亨廷顿J.
        • 康S.
        • Sheynkman G.M.
        • 郝T.
        • Richardson A.
        • 太阳S.
        • 杨F.
        • 沉Y.A.
        • 默里r.r.
        • spirohn k。
        • 乞讨B.E.
        • Duran-Frigola M.
        • MacWilliams A.
        • PEVZNER S.J.
        • 钟Q.
        • Trigg S.A.
        • Ghamsari L.
        • 撒拉尼N.
        • Rodriguez M.D.
        • Balcha D.
        • 唐。
        • Costanzo M.
        • 安德鲁斯B.
        • Boone C.
        • 周X.J.
        • Salehi-ashtiani K.
        • Charloteaux B.
        • 陈A.A.
        • Calderwood M.A.
        • aloy p.
        • 罗斯f.p.
        • 山D.E.
        • iakoucheva l.m.
        • 夏Y.
        • vidal m.
        通过替代剪接广泛扩增蛋白质相互作用能力。
        细胞。 2016; 164: 805-817
        • 短red m.r.
        • Frey B.L.
        • Scalf M.
        • Knoener R.A.
        • Cesnik A.J.
        • 史密斯l.m.
        阐明蛋白质Oform。来自蛋白质ort的家庭完整和赖氨酸计数测量。
        J.蛋白质组。 2016; 15: 1213-1221
        • Tran J.C.
        • Zamdborg L.
        • ahlf d.r.
        • 李准
        • 凯瑟曼A.D.
        • durbin k.r.
        • Tipton J.D.
        • Vellaichamy A.
        • Kellie J.F.
        • 李米
        • 吴C.
        • 甜蜜的三个
        • 早期B.。
        • Siuti N.
        • LEDUC R.D.
        • 康普顿P.D.
        • 托马斯下午
        • Kelleher N.L.
        使用自上而下的蛋白质组学在发现模式下映射完整的蛋白质同种型。
        自然。 2011; 480: 254-258
        • Uniprot财团
        UNIPROT:通用蛋白质知识库。
        核酸RES。 2017; 45 (数据库问题): D158-D169
        • 瘾君子V.L.
        • APWEILER R.
        • Bairoch A.
        瑞士 - PROM数据库中功能信息的表示。
        生物信息学。 1999; 15: 1066-1067
      1. 。蛋白质组学,C.F。 T.-D. topdownpropeomics.org。 (访问12/6/2017)。

        • LEDUC R.D.
        • 倒立者R.T.
        • 早期B.。
        • Greer J.B.
        • 托马斯下午
        • Kelleher N.L.
        C-Score:贝叶斯框架,以急剧改善高通量顶部下落蛋白​​质组学的蛋白质综合评分。
        J.蛋白质组。 2014; 13: 3231-3240
        • 公园J.
        • piehowski p.d.
        • 威尔金斯C.
        • 周米
        • 门多萨J.
        • Fujimoto G.M.
        • Gibbons B.C.
        • Shaw J.B.
        • 沉Y.
        • Shukla A.K.
        • 摩尔r.j.
        • 刘涛。
        • petyuk v.a.
        • tolic n.
        • PASA-TOLIC L.
        • 史密斯r.d.
        • Payne S.H.
        • 金斯。
        知情蛋白质组学:用于自上而下蛋白质组学的开源软件包。
        NAT。方法。 2017; 14: 909-914
        • Toby T.K.
        • Abecassis M.
        • 金库克。
        • 托马斯下午
        • 倒立者R.T.
        • LEDUC R.D.
        • Kelleher N.L.
        • Demetris J.
        • 莱维茨基J.
        外周血单核细胞中的蛋白质Oforms作为肝移植受者的新型排斥生物标志物。
        是。 J.移植。 2017; 17: 2458-2467
        • 戴维斯r.g.
        • 公园H.-M.
        • 金库克。
        • Greer J.B.
        • 倒立者R.T.
        • LEDUC R.D.
        • 罗马诺瓦e.v.
        • Rubakhin S.S.
        • Zombeck J.A.
        • 吴C.
        • yau p.m.
        • 高P.
        • 范尼斯本A.J.
        • Patrie S.M.
        • 托马斯下午
        • Sweedler J.v.
        • 罗德J.S.
        • Kelleher N.L.
        自上而下的蛋白质组学使小鼠菌株之间的脑蛋白质仿死能够进行比较分析。
        肛门。化学。 2018; 90: 3802-3810
        • Aggarwal S.
        • Yadav A.K.
        蛋白质组学中的假发现率估算。
        在: jung k. 蛋白质组学中的统计学分析。 春家纽约, 纽约,纽约2016: 119-128
        • 北B.V.
        • 柯蒂斯D.
        • 假P.C.
        关于从蒙特卡罗程序计算经验P值的说明。
        是。 J. HUM。遗传。 2002; 71: 439-441
        • Tran J.C.
        • Zamdborg L.
        • ahlf d.r.
        • 李准
        • 凯瑟曼A.D.
        • durbin k.r.
        • Tipton J.D.
        • Vellaichamy A.
        • Kellie J.F.
        • 李米
        • 吴C.
        • 甜蜜的s.m.m.
        • 早期B.。
        • Siuti N.
        • LEDUC R.D.
        • 康普顿P.D.
        • 托马斯下午
        Kelleher,N.L。,使用顶部下落蛋白​​质组学在发现模式下映射完整的蛋白质同种型。
        自然。 2011; 480: 254-258
        • 凯瑟曼A.D.
        • durbin k.r.
        • ahlf d.r.
        • 早期B.。
        • 倒立者R.T.
        • Tran J.C.
        • 托马斯下午
        • Kelleher N.L.
        人类蛋白质组大规模自上而下的蛋白质组学:膜蛋白,线粒体和衰老。
        摩尔。细胞。蛋白质组学。 2013; 12: 3465-3473
        • afgan e。
        • 贝克D.
        • van den Beek M.
        • Blankenberg D.
        • Bouvier D.
        • ČECHM.
        • 谢尔顿J.
        • Clement D.
        • Coraor N.
        • Eberhard C.
        • Grüningb.
        • Guerler A.
        • 希尔曼 - 杰克逊J.
        • von kuster g.
        • Rasche E.
        • Soranzo N.
        • Turaga N.
        • 泰勒J.
        • Nekrutenko A.
        • Goecks J.
        无障碍,可重复和协作生物医学分析的银河系平台:2016年更新。
        核酸RES。 2016; 44 (Web服务器问题): W3-W10
        • Fornelli L.
        • durbin k.r.
        • 倒立者R.T.
        • 早期B.。
        • Greer J.B.
        • LEDUC R.D.
        • 康普顿P.D.
        • Kelleher N.L.
        使用台式Quadrupole-orbitrap质谱仪推进人蛋白质的自上而下分析。
        J.蛋白质组。 2017; 16: 609-618
        • 安德森L.C.
        • dehart c.j.
        • Kaiser N.K.
        • 倒立者R.T.
        • 史密斯D.F.
        • Greer J.B.
        • LEDUC R.D.
        • Blakney G.T.
        • 托马斯下午
        • Kelleher N.L.
        • Hendrickson C.L.
        通过自上而下的LC-21 TesLA FT-ICR质谱法鉴定和表征人蛋白综合体。
        J.蛋白质组。 2017; 16: 1087-1096
        • Zamdborg L.
        • LEDUC R.D.
        • 格洛克k.j.
        • kim y.b.
        • Viswanathan V.
        • spaulde i.t.
        • 早期B.。
        • bluhm e.j.
        • Babai S.
        • Kelleher N.L.
        起草PTM 2.0:改善蛋白质鉴定和顶部质谱法的表征。
        核酸RES。 2007; 35 (Web服务器问题): W701-W706.
        • 济孔克。
        • 金斯。
        • Bandeira N.
        光谱识别中的假发现率。
        BMC生物信息学。 2012; 13: S2
        • Storey J.D.
        • Tibshirani R.
        基因组研究的统计学意义。
        Proc。 Natl。阿卡。 SCI。美国。 2003; 100: 9440-9445
        • Benjamini Y.
        • Hochberg Y.
        控制虚假发现率:多次测试的实用和强大的方法。
        J. Roy。统计SOC。 1995; 57: 289-300
        • 德国R.
        • 艾迪S.R.
        • Krogh A.
        • 米奇G.
        生物序列分析:蛋白质和核酸的概率模型。 剑桥大学出版社, 剑桥1998
        • Rockwood A.L.
        • Haimi P.
        高效计算精度同位素峰。
        J.IM。 SOC。质谱。 2006; 17: 415-419
        • Fornelli L.
        • srzentićk.
        • Huguet R.
        • Mullen C.
        • Sharma S.
        • Zabrouskov V.
        • 倒立者R.T.
        • durbin k.r.
        • 康普顿P.D.
        • Kelleher N.L.
        通过自上而下的下下横射质谱法施加多种离子活化技术的单克隆抗体精确序列分析。
        肛门。化学。 2018; 90: 8421-8429
        • 凯瑟曼A.D.
        • 李米
        • Tran J.C.
        • durbin k.r.
        • 康普顿P.D.
        • 早期B.。
        • 托马斯下午
        • Kelleher N.L.
        从富集线粒体级分的人膜蛋白的顶部蛋白质组学。
        肛门。化学。 2013; 85: 1880-1888
        • karabacak n.m.
        • Li L.
        • Tiwari A.
        • 海沃德L.J.
        • 洪P.
        • Easterling M.L.
        • 琼脂J.N.
        使用自上向下质谱法从8至669kDa敏感和特异性鉴定野生型和变体蛋白。
        摩尔。细胞。蛋白质组学。 2009; 8: 846-856
        • eliasj.e.
        • Gygi S.P.
        目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
        NAT。方法。 2007; 4: 207-214
        • Benjamini Y.
        • 叶库赛D.
        依赖性多次测试中的虚假发现率的控制。
        安。统计数据。 2001; 29: 1165-1188
        • Wilhelm M.
        • Schlegl J.
        • Hahne H.
        • GOLYMI A.M.
        • Lieberenz M.
        • Savitski m.m.
        • Ziegler E.
        • Butzmann L.
        • Gessulat S.
        • 马克思H.
        • Mathieson T.
        • Lemeer S.
        • Schnatbaum K.
        • reimer u.
        • 文字H.
        • Mollenhauer M.
        • Slotta-huspenina J.
        • Boese J.-H.
        • Bantscheff M.
        • Gerstmair A.
        • FAERBER F.
        • Kuster B.
        群体蛋白质组的质谱。
        自然。 2014; 509: 582
      广告