人蛋白质组织蛋白质组学标准倡议

数据标准化,了解发展和政策
      关于出版支持蛋白质组学论文的基础数据的MCP指南(
      • 卡车。
      • Aeberberold R.
      • Baldwin M.
      • 伯灵名A.
      • 克劳瑟K.
      • Nesvizhskii A.
      需要在肽和蛋白质识别数据的出版中的指导方针:肽和蛋白质识别数据的出版指南上的工作组。
      )刺激了朝着更具结构性共享的(高质量)数据的运动。原始MCP指南讨论了判断质量的标准。但是,这只是发布蛋白质组学数据的过程的一个方面。质量分配的上游是使用标准化的数据格式和满足最小的报告要求,例如由人类蛋白质组织蛋白质组学标准倡议(HUPO-PSI)产生的那些(
      • 果园S.
      • 泰勒C.F.
      • 琼斯P.
      • Montechi-Palazzo L.
      • binz p.a.
      • 琼斯A.R.
      • Pizarro A.
      • 朱利安r.k.
      • Hermjakob H.
      进入实施时代:2006年9月25日至27日的Hupo-PSI秋季研讨会报告,华盛顿特区,美国。
      ),首先由Rolf Apweiler领导,目前由亨宁Hermjakob与Rudi Aebbersold作为联合椅。有趣的是,这三个方面是如何交互的:标准化的数据格式允许均匀而轻松地阅读不同实验室生成的数据,而最小的报告要求确保根据定义的集合进行足够的信息以执行质量分配标准。
      显然,数据共享的承诺不会以标准,报告指南或质量分配结束,因为数据必须最终被公开可用。然而,可用性应与可访问性合作,暗示有限数量的位置,这些位置与数据储备良好并提供强大的查询能力。这些特定要求最适合通过全局蛋白质组机器数据库(GPMDB)等集中式数据存储库(
      • 克雷格r.
      • Cortens J.P.
      • Beavis R.C.
      用于分析,验证和存储蛋白质识别数据的开源系统。
      ),蛋白质组学识别数据库(骄傲)(
      • 琼斯P.
      • 科特兰特。
      • 玛特L.
      • Quinn A.F.
      • 泰勒C.F.
      • Derache W.
      • Hermjakob H.
      • APWEILER R.
      骄傲:蛋白质组学群落的蛋白质和肽鉴定的公共储存库。
      )和peptidaitlas(
      • Desiere F.
      • 德意曲e.w.
      • nesvizhskii a.i.
      • Mallick P.
      • 国王N.L.
      • ENG J.K.
      • Aderem A.
      • 博伊尔R.
      • 布伦纳E.
      • Donohoe S.
      • Fausto N.
      • Hafen E.
      • 引擎盖L.
      • Katze M.G.
      • 肯尼迪K.A.
      • Kregenow F.
      • 李H.
      • 林B.
      • 马丁D.
      • ranish j.a.
      • 罗林斯D.J.
      • Samelson L.E.
      • Shiio Y.
      • 瓦特J.D.
      • Wollscheid B.
      • 赖特M.E.
      • 燕W.
      • 杨L.
      • yi e.c.
      • 张H.
      • Aeberberold R.
      与高通量质谱法获得的肽序列的人类基因组集成。
      )。这些方面的开发(标准化数据交换格式,最小的报告要求,质量标准和数据存储库)并行地进行,由涉及的不同方向驱动:标准,存储库开发人员和数据提供商的期刊,生产商。
      欧洲联盟资助的蛋白质组学数据收集(ProdaC)补助金提供了一个独特的机会,可以通过资助全面的项目同步和领导这些并行努力,同时支持建立标准数据格式,存储库的适应和实施标准标准的管道,用于数据提交到全球各种实验室的存储库。然而,最重要的是,Prodac项目还列出了存储库中组装数据的可交付的重用和算法,例如蛋白质序列数据库的注释,例如UNIPROTKB / SWISS-PROM,这是一种质量控制也发挥作用的过程。
      以上所展望的是标准作为必要的工具,以实现数据质量评估及其随后的重用。另外,因为标准化是一个持续移动的目标,在蛋白质组学等快速发展的场中,必要的审查和修订这些标准是必要的。与此同时,标准应该在定义和宽泛间隔的步骤中发展。后者对于引出广泛实施标准至关重要;直言不讳地说,没有人会投资于写作软件,以便在3个月内将改变的标准。
      已经确定标准的发展是为社区提供高质量和良好的注释数据的目标的重要组成部分,是通过序列数据库中出现的被动(通过序列数据库中出现的注释)或活动(通过下载和重新居住数据),它显然,将这​​些努力保持为纯粹的志愿企业呈现出次优势的情况。欧洲联盟对ProDAC Grant提供资金的示例可以扩展到这些标准至少有一些有针对性的资金。有趣的是,由于标准本质上是普遍的,(部分)的发展和维护标准的资金是在全球领先资金机构之间的蛋白质组学领域的原型合作的明确目标。

      参考

        • 卡车。
        • Aeberberold R.
        • Baldwin M.
        • 伯灵名A.
        • 克劳瑟K.
        • Nesvizhskii A.
        需要在肽和蛋白质识别数据的出版中的指导方针:肽和蛋白质识别数据的出版指南上的工作组。
        摩尔。细胞。蛋白质组学。 2004; 3: 531-533
        • 果园S.
        • 泰勒C.F.
        • 琼斯P.
        • Montechi-Palazzo L.
        • binz p.a.
        • 琼斯A.R.
        • Pizarro A.
        • 朱利安r.k.
        • Hermjakob H.
        进入实施时代:2006年9月25日至27日的Hupo-PSI秋季研讨会报告,华盛顿特区,美国。
        蛋白质组学。 2007; 7: 337-339
        • 克雷格r.
        • Cortens J.P.
        • Beavis R.C.
        用于分析,验证和存储蛋白质识别数据的开源系统。
        J.蛋白质组。 2004; 3: 1234-1242
        • 琼斯P.
        • 科特兰特。
        • 玛特L.
        • Quinn A.F.
        • 泰勒C.F.
        • Derache W.
        • Hermjakob H.
        • APWEILER R.
        骄傲:蛋白质组学群落的蛋白质和肽鉴定的公共储存库。
        核酸RES。 2006; 34: D659-D663
        • Desiere F.
        • 德意曲e.w.
        • nesvizhskii a.i.
        • Mallick P.
        • 国王N.L.
        • ENG J.K.
        • Aderem A.
        • 博伊尔R.
        • 布伦纳E.
        • Donohoe S.
        • Fausto N.
        • Hafen E.
        • 引擎盖L.
        • Katze M.G.
        • 肯尼迪K.A.
        • Kregenow F.
        • 李H.
        • 林B.
        • 马丁D.
        • ranish j.a.
        • 罗林斯D.J.
        • Samelson L.E.
        • Shiio Y.
        • 瓦特J.D.
        • Wollscheid B.
        • 赖特M.E.
        • 燕W.
        • 杨L.
        • yi e.c.
        • 张H.
        • Aeberberold R.
        与高通量质谱法获得的肽序列的人类基因组集成。
        基因组Biol。 2005; 6: R9