Mitominer,用于储存和分析线粒体蛋白质组学数据的集成数据库*

      线粒体是真核细胞的重要组成部分,其功能延伸超出能量产生,包括代谢,信号,细胞生长和凋亡。它们的功能障碍涉及大量代谢,退行性和与年龄相关的人类疾病。因此,重要的是表征和理解线粒体。许多实验试图确定线粒体蛋白质组,导致难以分析的大型和复杂的数据集。为了解决这一点,我们开发了一种新的公共资源,用于储存和调查这种被称为拟丝细胞的线粒体蛋白质组学数据,它使用模型来描述蛋白质组学数据和相关的生物信息。从UniProt和基因组项目的来自Uniprot和Genome项目的蛋白质注释,来自京都的基因和基因组的代谢途径数据,来自同源物的同源性关系以及来自网上的疾病信息的蛋白质组数据Mendelian遗产在人。我们通过研究这些数据集来证明丝立米霉素的优点,并表明报告的不同线粒体蛋白的数量约为3700,尽管两种动物和酵母共同的蛋白质的数量约为1400,膜蛋白似乎是不足的。此外分析表明,在线粒体蛋白质组学实验中定期检测到一些细胞骨代谢途径的酶,表明它们与外部线粒体膜的外部相关联。拟尖的数据和高级能力提供了一种框架,用于进一步的线粒体分析和未来系统水平模型的线粒体生理学。
      线粒体在真核新陈代谢的许多方面具有各种各样的作用,并涉及大量代谢,退行性和与年龄相关的人类疾病,包括癌症和老化本身(
      • Dimauro S.
      • SC.hon E.A.
      线粒体呼吸链疾病。
      ,
      • Trifonovic A.
      • WREDENBERG A.
      • Falkenberg M.
      • spelbrink j.n.
      • Rovio A.T.
      • 布鲁德C.E.
      • Bohlooly Y.M.
      • Gidlof S.
      • Oldfors A.
      • Wibom R.
      • Tordell J.
      • Jacobs H.T.
      • Larsson N.G.
      表达缺陷线粒体DNA聚合酶的小鼠过早老化。
      ,
      • 弗利斯M.S.
      • USADEL H.
      • Caballero O.L.
      • 吴L.
      • Buta M.R.
      • eleff s.m.
      • 詹吉斯
      • Sidransky D.
      肿瘤和体液中线粒体DNA突变的体积检测。
      ,
      • 华莱士D.C.
      一种线粒体的代谢和退行性疾病,衰老和癌症:进化医学的曙光。
      )。估计约1500种不同的蛋白质存在于哺乳动物线粒体中(
      • 泰勒S.W.
      • Fahy E.
      • Ghosh S.S.
      全球细胞内蛋白质组学。
      ),许多这些蛋白质是组织和发育状态特异性(
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )但尽管在这种细胞器中感兴趣,但线粒体蛋白质组尚未完全定义和表征。识别线粒体蛋白质及其翻译后修改的努力(
      • 卡罗尔J.
      • Fearnley I.M.
      • Skehel J.m.
      • 漫步M.J.
      • 香农r.j.
      • 赫斯特J.
      • Walker J.E.
      从牛心脏线粒体的复合物I的核编码亚基的翻译后修饰。
      ,
      • 卡罗尔J.
      • Fearnley I.M.
      • Walker J.E.
      膜蛋白分子量测量线粒体蛋白质的定义。
      )从纯化的线粒体细胞器对蛋白质复合物进行深入分析的蛋白质组学研究导致各种数据集的出版。这些数据集的数量,大小和复杂性耦合的缺乏普遍标准数据数据是与公共蛋白质数据库等资源的使用和集成的主要挑战。然而,了解系统水平的线粒体蛋白质组和模拟线粒体生理学和分子病理需要一种完全定义和可搜索的线粒体蛋白目录,其与相关数据交叉引用。
      目前可以在线粒体蛋白质组上存储10个网络可访问资源(表I.)。其中,包括数据集的数量的大变化,数据存储的方式,以及查询接口的复杂性。每个资源都有自己的优势和缺点,但一些限制很常见。首先,许多似乎没有积极维护。虽然它们的实验数据仍然有效,但它已与来自修订的公共数据库的信息集成,这会破坏对资源的信心。这强调,即使在没有仔​​细设计的情况下也难以维护。其次,许多资源仅限于单一物种或没有蛋白质同源性数据,其阻碍了交叉物种比较并使用陈列生来注释相关蛋白质。第三,许多资源不引用对个体蛋白质的实验参考。然而,需要出处来评估是否已正确鉴定为线粒体。第四,查询接口的复杂程度随之而变化。对于一些,数据被呈现为文本文件,其中查询限于单个标识符,而其他数据则使用关系数据库,这在可搜索字段的数量以及约束属性中允许更大的灵活性。少数资源有查询具有多个选项和约束的界面,该约束组合以构建复杂查询。但是,它们可以改善它们的灵活性和易用性。
      表I.在报告蛋白质的线粒体定位的公共数据库中编目的物种和证据类型
      数据库物种
      a 物种:HS, H. Sapiens.;毫米, M. Musculus.; rn, R. norvegicus.; DM, D. Melanogaster.; CE, Caenorhabditis elegans.; NC, 神经孢子仓库; SC, S. Cerevisiae.;在, A. Thaliana..
      证据
      b 报道了线粒体蛋白质定位的证据类型:从纯化的线粒体(M)的质谱,从GFP标记(G)的定位,或来自公共数据库和文献(a)的策划注释的鉴定。
      参考。
      HS.毫米rn.DM. ceNC.SC.
      MitoP2++++m,g,a
      • 和reoli c.
      • Prokisch H.
      • Hortnagel K.
      • 穆勒J.C.
      • Munsterkotter M.
      • SC.harfe C.
      • Meitinger T.
      Mitop2,酵母和人的线粒体蛋白质集成数据库。
      秘年++++++A
      • BASU S.
      • 云彩E.
      • 周C.
      • bogenhagen d.f.
      MIGENES:使用基因本体注释策划的线粒体蛋白的可搜索结构数据库。
      Mortes.
      c Moreres包括Uniprot的美唑烷种类。
      +++++A
      • Catalano D.
      • licciulli f.
      • 图里A.
      • 格里罗G.
      • Saccone C.
      • D'Elia D.
      MORETES:核编码线粒体基因的资源及其在美唑群中的产品。
      mitocroteome.+
      • COTTER D.
      • Guda P.
      • Fahy E.
      • Subramaniam S.
      型蛋白酶组:线粒体蛋白序列数据库和注释系统。
      HMPDB.+A
      ampdb.+
      • Heazlewood J.L.
      • Millar A.H.
      AMPDB:拟南芥线粒体蛋白质数据库。
      ampp.+M
      • KRUFT V.
      • Eubel H.
      • Jansch L.
      • Werhahn W.
      • 布劳恩H.P.
      蛋白质组学方法鉴定拟南芥新型线粒体蛋白。
      ormd.+M,G.
      • 福斯特L.J.
      • de hoog c.l.
      • 张Y.
      • 张Y.
      • 谢X.
      • Mootha V.k.
      通过蛋白质相关性分析的哺乳动物细胞器地图。
      ymp.+M
      • ohlmeier s.
      • Kastaniotis A.J.
      • HILTUNEN J.K.
      • Bergmann U.
      酵母线粒体蛋白质组,发酵和呼吸生长研究。
      ydpm.+M
      • Prokisch H.
      • SC.harfe C.
      • 营地II,D.G.
      • 小W.
      • 大卫兰。
      • 和reoli c.
      • Monroe M.E.
      • 摩尔r.j.
      • 格里尼科米。
      • 科泽尼C.
      • 赫克森k.k.
      • 莫斯塔赫苗
      • Zischka H.
      • 赫尔曼Z.S.
      • 戴维斯R.W.
      • Meitinger T.
      • Oefner P.J.
      • 史密斯r.d.
      • Steinmetz L.M.
      酵母中线粒体蛋白质组的整合分析。
      丝立清++++++m,g,a
      a 物种:HS, H. Sapiens.;毫米, M. Musculus.; rn, R. norvegicus.; DM, D. Melanogaster.; CE, Caenorhabditis elegans.; NC, 神经孢子仓库; SC, S. Cerevisiae.;在, A. Thaliana..
      b 报道了线粒体蛋白质定位的证据类型:从纯化的线粒体(M)的质谱,从GFP标记(G)的定位,或来自公共数据库和文献(a)的策划注释的鉴定。
      c Moreres包括Uniprot的美唑烷种类。
      鉴于其他资源的局限性,我们开发了一种新的公共资源,用于存储和分析关于线粒体蛋白质组的数据,称为拟丝细胞。此资源的基础是一种模型,用于通过GFP描述蜂窝定位
      使用的缩写是:
      GFP.
      绿色荧光蛋白
      ke
      Kyoto基因和基因组的百科全书
      omim
      在线孟德尔人民在男人的继承
      XML.
      可扩展标记语言
      MGI.
      小鼠基因组信息学
      PIR.
      蛋白质信息资源
      ID
      标识符
      爆破
      基本的局部比对搜索工具
      大卫
      注释,可视化和集成发现数据库。
      1使用的缩写是:GFP.
      绿色荧光蛋白
      ke
      Kyoto基因和基因组的百科全书
      omim
      在线孟德尔人民在男人的继承
      XML.
      可扩展标记语言
      MGI.
      小鼠基因组信息学
      PIR.
      蛋白质信息资源
      ID
      标识符
      爆破
      基本的局部比对搜索工具
      大卫
      注释,可视化和集成发现数据库。
      纯化细胞器的标记和质谱以及相关的生物信息,并将这些不同数据之间的关系正规化。在开发丝立清时,我们解决了其他资源共同的四个主要限制。首先,为了超越原始开发人员超越拟尖基础设施的长期维护和连续性,我们使用Intermine Data Warehouse建立了它(
      • Lyne R.
      • 史密斯r.
      • rutherford K.
      • Wakeling M.
      • 炫耀A.
      • Guillier F.
      • Janssens H.
      • 吉W.
      • 迈凯轮P.
      • 北诗
      • rana d。
      • 莱利T.
      • 沙利文J.
      • Watkins X.
      • Woodbridge M.
      • 莉莉K.
      • 罗素S.
      • ashburner m.
      • mizuuchi k。
      • Micklem G.
      Flymine:果蝇和anopheles基因组学的集成数据库。
      )而不是开发定制系统。通过作为文档,教程和活动用户和开发社区的开源系统,Intermine更易于维护。为了简化数据维护,可以通过使用自动Perl脚本更新MITominer中的底层数据源,并使用自动化Perl脚本,我们的目标是每4-6个月更新资源。此外,可以通过扩展数据模型然后使用Intermine来生成新的关系数据库模式来添加新类型的数据源。然后可以轻松加载与新架构兼容的XML格式的数据文件。其次,该模型不是特定的物种,并且拟尖目前包括六种物种的数据集。此外,通过在模型中掺入蛋白质原子学,可以比较这些物种之间的数据。第三,关于数据出处,拟丝液记录了每个单独蛋白质作为线粒体的分类的所有证据。这为每种蛋白质创造了全面的出处,并且用户可以评估蛋白质细胞定位的证据,并将其用作查询中的约束。第四,Intrmine为简单的数据浏览和查询提供了一个用户友好的查询界面,以及功能强大而灵活的方法,以便于包含多个资源和搜索约束的复杂分析。
      我们展示了通过使用中断系统的灵活查询接口来定义数据模型和导入的各种数据的优点,以报告(i)学习人数和他们识别的线粒体蛋白质的年增长率(ii)被注释为线粒体或具有线粒体定位的实验证据的蛋白质(特定物种)的数量,(iii)代谢途径中蛋白质的线粒体定位的证据,(iv)联合,交叉点和减法来自不同研究或生物的数据集中的线粒体蛋白。当考虑目前装载的所有线粒体数据时,已将大约3700种不同的蛋白质报告为线粒体,并且约1400个蛋白质对酵母和动物常见。组合来自多项研究的数据表明,跨膜蛋白的鉴定仍然困难,并且这些蛋白质可能在数据中经常呈现。此外,一些细胞溶质蛋白,例如糖酵解的蛋白质,可以通过与外部线粒体膜的相互作用与线粒体共定位。分析还突出了有机体线粒体生理学的已知差异,例如在动物的酵母和凋亡中发酵。

      实验步骤

       丝条瘤的数据库体系结构

      使用Intermine开源数据仓库系统(
      • Lyne R.
      • 史密斯r.
      • rutherford K.
      • Wakeling M.
      • 炫耀A.
      • Guillier F.
      • Janssens H.
      • 吉W.
      • 迈凯轮P.
      • 北诗
      • rana d。
      • 莱利T.
      • 沙利文J.
      • Watkins X.
      • Woodbridge M.
      • 莉莉K.
      • 罗素S.
      • ashburner m.
      • mizuuchi k。
      • Micklem G.
      Flymine:果蝇和anopheles基因组学的集成数据库。
      )和版本11.0已安装和配置。 Intermine的功能依赖于描述每个数据类型,其属性和这些不同数据类型之间的关系的对象模型,这些数据类型由使用共享标识符定义。 Intermine的核心对象模型包括基因,蛋白质,出版物和基因本体的定义(
      • ashburner m.
      • 球C.A.
      • 布莱克J.A.
      • Botstein D.
      • 巴特勒H.
      • 樱桃准晚
      • 戴维斯A.P.
      • Dolinski K.
      • 德怀特S.S.
      • EPPIG J.T.
      • 哈里斯M.A.
      • 山D.P.
      • ISSEL-TARVER L.
      • Kasarskis A.
      • 刘易斯S.
      • Matese J.C.
      • Richardson J.E.
      • Ringwald M.
      • 鲁宾上午
      • Sherlock G.
      基因本体:生物学统一的工具。基因本体组织。
      )。扩展该对象模型以结合用于描述细胞定位,蛋白质同源性,代谢途径,遗传表型以及翻译后修改以及GFP靶向和质谱数据的数据类型和属性。 Mitominer对象模型未标准化,因为它被设计用于最佳查询性能和Intermine查询Builder中的易于导航。 MITOMINER的关系数据库模式由Intermine系统自动生成对象模型。

       丝立清中使用的公共数据来源

      拟型丝立清填充了从几个公共资源的网站下载的数据。为了允许数据的交叉引用和集成,所有数据集中的蛋白质标识符统一到UniProt(
      • 吴C.H.
      • APWEILER R.
      • Bairoch A.
      • Natale D.A.
      • Barker W.C.
      • Boeckmann B.
      • 菲罗斯
      • Gasteiger E.
      • 黄鹤
      • Lopez R.
      • Magrane M.
      • 马丁M.J.
      • Mazumder R.
      • O'Donovan C.
      • redaschi n。
      • Suzek B.
      通用蛋白质资源(UNIPROT):蛋白质信息的扩展宇宙。
      )通过使用鼠标基因组信息(MGI)的在线转换工具(MGI)的登录号码(
      • Bult C.J.
      • EPPIG J.T.
      • Kadin J.A.
      • Richardson J.E.
      • 布莱克J.A.
      鼠标基因组数据库(MGD):小鼠生物学和模型系统。
      )对于来自的蛋白质 亩肌肉 和蛋白质信息资源(PIR)ID程序(
      • 吴C.H.
      • Yeh L.S.
      • 黄鹤
      • Arminski L.
      • Castro-Alvear J.
      • 陈Y.
      • 胡Z.
      • KEKTESIESP.
      • Ledley R.S.
      • Suzek B.E.
      • vinayaka c.r.
      • 张继夫
      • Barker W.C.
      蛋白质信息资源。
      )对于其他物种。在许多情况下,蛋白质被映射到多于一个Uniprot标识符,因为当使用这些程序时,用于片段,异构型和重复项的单独条目可以与原始标识符相关联。
      搜查文献是用Pubmed寻找的出版物,报告了蛋白质的线粒体定位的大规模数据集。将这些出版物的每个数据集下载并导入Microsoft Excel。从每个出版物记录的是从中分离出蛋白质的实验,组织或细胞系的类型,以及PubMed标识符。在可用的原始蛋白质标识符,亚细胞位置,鉴定的肽,序列覆盖率和用于纯化,分离和鉴定蛋白质的实验技术的情况下记录的。如果原始蛋白质标识符不能通过PIR ID或MGI映射到UNIPROT主登录号,则使用BLASTP将蛋白质与UNIPROT中的蛋白质进行比较(
      • altschul s.f.
      • Madden T.L.
      • SC.haffer A.A.
      • 张继夫
      • 张Z.
      • 米勒W.
      • Lipman D.J.
      Papped Blast和Psi-Blast:新一代蛋白质数据库搜索程序。
      )。如果有很大的匹配,则将UNIPROT主登录号分配给蛋白质。没有显着匹配的那些蛋白质被丢弃。通过使用PIR ID和MGI标识符转换工具,蛋白质线粒体定位的证据与代表其的许多Uniprot条目相关联。从欧洲分子生物学实验室 - 欧洲生物信息学研究所的细胞器数据库中取出了在生物体的线粒体基因组中编码的蛋白质的标识符,并用于向拟甲原虫中的适当蛋白质注释。
      蛋白质序列,相关特征和注释的来源是Uniprot(
      • 吴C.H.
      • APWEILER R.
      • Bairoch A.
      • Natale D.A.
      • Barker W.C.
      • Boeckmann B.
      • 菲罗斯
      • Gasteiger E.
      • 黄鹤
      • Lopez R.
      • Magrane M.
      • 马丁M.J.
      • Mazumder R.
      • O'Donovan C.
      • redaschi n。
      • Suzek B.
      通用蛋白质资源(UNIPROT):蛋白质信息的扩展宇宙。
      )。所有UNIPROT条目都以带有线粒体定位数据集的六种物种下载。通过使用Intermine解析器从PubMed中检索每个UNIPROT条目中的文献引用。从UniProt取出对生物过程,代谢功能和每种蛋白质的细胞组分的额外基因本体论注释(
      • Camon E.
      • Magrane M.
      • 巴克尔D.
      • 李五。
      • 调光e.
      • Maslen J.
      • Binns D.
      • Harte N.
      • Lopez R.
      • APWEILER R.
      基因本体注释(GOA)数据库:使用基因本体分享UNIPROT中的知识。
      )和个人基因组项目 M. Musculus. (
      • Bult C.J.
      • EPPIG J.T.
      • Kadin J.A.
      • Richardson J.E.
      • 布莱克J.A.
      鼠标基因组数据库(MGD):小鼠生物学和模型系统。
      ), rattus norvegicus. (
      • Twigger S.N.
      • Shimoyama M.
      • 溴贝格斯。
      • KWITEK A.E.
      • 雅各布H.J.
      大鼠基因组数据库,更新2007年 - 将疾病的路径扩展到数据并再次返回。
      ), 果蝇黑胶基 (
      • 威尔逊r.j.
      • Goodman J.L.
      • 钢板v.b.
      Flybase:对查询工具的集成和改进。
      ), 和 酿酒酵母酿酒酵母 (
      • 洪E.L.
      • Balakrishnan R.
      • 董Q.
      • Christie K.R.
      • 公园J.
      • Binkley G.
      • Costanzo M.C.
      • 德怀特S.S.
      • 恩格尔S.R.
      • fisk D.G.
      • Hirschman J.E.
      • Hitz B.C.
      • Krieger C.J.
      • Livstone M.S.
      • Miyasato S.R.
      • 纳什R.S.
      • ooughtred R.
      • Skrzypek M.S.
      • 翁科。
      • 黄娥。
      • 朱凯克。
      • Dolinski K.
      • Botstein D.
      • 樱桃准晚
      SGD的基因本体注释:新数据源和注释方法。
      )。
      最后列出了人类基因和他们相关疾病表型的描述是从OMIM(
      • HAMOSH A.
      • 斯科特A.F.
      • Amberger J.s.
      • Bocchini C.A.
      • McKusick V.A.
      在线Mendelian遗传在人(OMIM),人类基因的知识库和遗传障碍。
      ),从同源烯中取出同源蛋白质的定义(
      • 惠勒D.L.
      • 巴雷特T.
      • Benson D.A.
      • 布莱恩特S.H.
      • Canese K.
      • chetvernin V.
      • 教堂D.M.
      • Dicuccio M.
      • Edgar R.
      • Federhen S.
      • geer l.y.
      • Kapustin Y.
      • Khovayko O.
      • 兰德斯曼D.
      • Lipman D.J.
      • Madden T.L.
      • maglott d.r.
      • Ostell J.
      • 米勒V.
      • Pruitt K.D.
      • 舒勒G.D.
      • Sequeira E.
      • 雪利酒S.T.
      • Sirotkin K.
      • Souvorov A.
      • Starchenko G.
      • Tatusov R.L.
      • tatusova t.a.
      • 瓦格纳L.
      • Yaschenko E.
      国家生物技术信息中心的数据库资源。
      )和对代谢途径的反应,酶和代谢途径化合物的数据取自Kegg(
      • Kanehisa M.
      • goto s.
      • Hattori M.
      • Aoki-Kinoshita K.F.
      • ITOH M.
      • 川司玛斯。
      • Katayama T.
      • Araaki M.
      • Hirakawa M.
      从基因组学到化学基因组学:Kegg的新发展。
      )。使用UniProt中蛋白质的EC数量来定义蛋白质和代谢途径之间的交叉引用。

       将数据导入丝立清

      通过使用Intermine解析剂将Uniprot和基因本体的数据文件加载到丝立粒子中。通过使用使用BioPerl的Perl脚本将其他数据源转换为与Mitominer对象模型兼容的XML数据文件(
      • Stajich J.E.
      • 块D.
      • Boulez K.
      • Brenner S.E.
      • Chervitz S.A.
      • Dagdigian C.
      • uellen g.
      • 吉尔伯特J.G.
      • Korf I.
      • Lapp H.
      • Lehvaslaiho H.
      • Matsalla C.
      • Mungall C.J.
      • 奥斯本B.I.
      • pocock m.r.
      • SC.hatterp.
      • Senger M.
      • Stein L.D.
      • stupka E.
      • Wilkinson M.D.
      • Birney E.
      BioPerl Toolkit:Perl模块的生命科学。
      )模块,然后将它们装入丝立清。这些脚本旨在允许源快速更新,并具有最小的手动干预。显示了丝立米的简化数据流程 Fig. 1.
      图缩略图GR1.
      Fig. 1从外部公共资源中提取数据以加载和集成到拟丝细胞的过程。 数据从公共来源下载,使用MGI或PIR标识符映射工具映射不同源之间的标识符。使用Perl脚本从数据源创建XML格式的数据和配置文件。 XML文件由Intermine系统加载到底层PostgreSQL数据库中。 Intermine通过可配置的Web应用程序提供对数据(webapp.)通过使用Apache Tomcat。 ,基因本体。

       促型数据查询和分析

      Intermine通过使用Apache Tomcat来创建可配置的Web界面来提供对数据的访问。此界面允许使用使用Intermine查询引擎执行的积分查询构建器创建复杂的交叉资源查询。除了涉及爆炸搜索和David功能分类的分析外(
      • 丹尼斯Jr.,G.
      • 谢尔曼B.T.
      • Hosack D.A.
      • 杨杰。
      • 高W.
      • 车道H.C.
      • LEMPICKI R.A.
      David:用于注释,可视化和集成发现的数据库。
      ),在结果中报告的分析是使用用查询构建器编写的查询完成的。
      Uniprot数据库包含冗余,因为相同的蛋白质可以由多个条目表示。因此,作为线粒体中的线粒体报告的Uniprot条目的数量与线粒体蛋白的数量不同。通过将同源物掺入拟分液剂并使用它以簇重复条目来减少这种冗余。然而,应该注意的是,同源物确实聚集了一些高度相似的伞菌。给出了同源簇的数量,用于分析,所述分析报告蛋白质的数量,除非另有说明,例如,当评估具有线粒体定位证据的蛋白质的数量时。为了防止双重计数,如果它们不是同源蛋白簇的成员,则蛋白质被排除在分析中,因为许多这些是尺寸不足的片段,其与相应的全长对应物组成。同源烯还用于拟甲胺醇,以鉴定不同物种之间的正交蛋白质。随着同源的似乎在其同源标准中过于严格,对于一些分析,通过使用BLASTP来鉴定更多的突出局,预计值为10−35。 BLAST搜索是在从丝条术中出口的蛋白质中出口的蛋白质清单。

       定制和部署丝提员

      通过使用Intermine的Integral查询生成器工具,通过Intermine的Integral查询构建工具写入了符合用户最常见要求的查询。这些模板查询是在相关数据类别网页上提供的,以及在单个可搜索的网页上一起使用。 Intermine Web应用程序的用户界面是自定义的,并且该服务部署了。

       蛋白质的功能分析和分类

      确定哪些基因本体注释术语显着超过份额(p <0.001)在蛋白质列表中,与背景群体相比,David功能注释聚类工具(
      • 丹尼斯Jr.,G.
      • 谢尔曼B.T.
      • Hosack D.A.
      • 杨杰。
      • 高W.
      • 车道H.C.
      • LEMPICKI R.A.
      David:用于注释,可视化和集成发现的数据库。
      )被使用了;它使用修改版本的Fisher精确 p 价值。 DAVID分析是使用从拟尖输出的UNIPROT标识符列表完成。如果列表包含来自多种物种的标识符,则分别分别分析来自每个物种的标识符。

      结果

       丝提员的用户界面

      丝立清是公开访问的。为了便于在Web界面中导航,稍微MINER中的数据分为单独的数据类别,这些数据可以从Mitominer主页提供。数据类别是质谱数据,GFP标记数据,同源性信息(来自同源烯),蛋白质注释(来自UniProt等),代谢途径(来自Kegg),蛋白质组学出版物(来自Pubmed)和遗传表型和疾病(来自OMIM) )。数据类别在其源组织和提供后台信息,访问批量数据集,相关模板查询以及查询构建器的相关起始点。例如,蛋白质数据类别页面(Fig. 2)提供(i)蛋白质注释提供的蛋白质注释,(ii)下载有线粒体定位的实验证据的所有蛋白质的选择,(iii)模板查询对于最常见的蛋白质注释的模板查询,例如显示具有线粒体定位的实验证据的特定物种的所有蛋白质。报告页面指定与数据类别的条目相关的数据库中的信息,并为外部公共资源中的相关条目提供交叉引用。例如,蛋白质的报告页面( Fig. 3)列出蛋白质的属性和UNIPROT网站的条目的链接,以及标记和交叉参考GFP标签,质谱,出版物,组织分布,同源中的正向术中的可用数据,基因本体中的功能注释和OMIM中的表型信息。
      图缩略图GR2.
      Fig. 2蛋白质数据类的网页。 此页面描述了数据(左上方)并提供批量下载选项(右上)执行常见搜索的模板查询(底部)。
      图缩略图GR3.
      Fig. 3盎司醇结合蛋白质同源物7(OSH7P)的蛋白质报告页面 S. Cerevisiae. (Uniprot登录号码 P38755)。该页面显示蛋白质的性质,对包括Uniprot进入的其他数据的交叉引用,以及从GFP标记和质谱法的线粒体定位的证据。 OSH7P未作为UNIPROT的线粒体注释, 酿酒酵母 基因组数据库或基因本体论。
      Intermine提供了一种快速搜索选项,这是在Uniprot,Kegg或OMIM中的标识符或描述上查询拟型丝立仪的最简单方法。搜索返回符合可以选择各个报告页面的搜索项的条目列表。快速搜索文本框可从主菜单栏中提供,该栏显示在所有页面的所有页面顶部,并且可以使用外卡来拓宽搜索。
      Antermine查询Builder提供了Mitominer中数据的高级查询。可以使用布尔逻辑组合在模型中定义的任何数据类型的属性上组合约束来创建异常灵活的查询。此外,查询构建器指定结果表中显示的数据字段,并以什么顺序。结果表中的任何标识符,例如Uniprot登录号,都链接到该条目的报表页面,并且结果可以以各种格式导出,包括Microsoft Excel。例如,查询“显示人类中脂肪酸代谢(Kegg途径00071)中存在的所有蛋白质,并且具有质谱或线粒体定位的GFP实验证据”是从Kegg的数据类开始的查询建设者中建立的代谢途径并掺入通过EC交叉引用的蛋白质的线粒体定位约束(Fig. 4)。要执行查询,中断系统协调从UNIPROT,实验蛋白质组学和代谢途径的所需数据集成。结果证实,如在Kegg中所定义的脂肪酸代谢的许多人类蛋白质具有线粒体定位的实验证据(Fig. 5)。
      图缩略图GR4.
      Fig. 4用于构建定制查询的查询构建器的网页。 网页有三个组件:模型浏览器(左上方)选择对象模型的数据类和属性以包含在查询中;查询中包含的数据类,它们属性上的约束以及用于组合它们的布尔逻辑(右上);和数据列要显示并排序结果的输出(底部)。显示的查询是“显示在Kegg路径00071(脂肪酸代谢)中存在的所有蛋白质 H. Sapiens. 通过质谱或GFP实验具有线粒体定位的证据。“
      图缩略图GR5.
      Fig. 5用于查询结果的网页示例。 查询是“显示在Kegg Pathway 00071(脂肪酸代谢)中存在的所有蛋白质 H. Sapiens. 通过质谱或GFP标记实验具有线粒体定位的证据。“列中的数据可以排序或汇总,列可以移动或隐藏,可以将标识符保存到列表中,结果可以以不同的格式导出。
      为了满足Mitominer中最常见的用户查询,查询构建器用于创建模板查询。这些来自拟型器主页或数据类别页面访问(Fig. 2)。模板查询包括对数据模型的一个或多个属性的约束,例如指定特定的生物或代谢途径(Fig. 6)。为了对用户进行这种直接,提供了与描述一起的示例属性。可以使用快速搜索来搜索模板查询的集合,通过将选择菜单从标识符更改为模板来搜索。用户可以使用查询构建器进一步修改模板查询,这提供了使用查询生成器工具的好介绍。
      图缩略图GR6.
      Fig. 6预定义模板查询的网页。 查询显示在Kegg Pathway 00071(脂肪酸代谢)中存在的所有蛋白质 H. Sapiens. 通过质谱或GFP实验具有线粒体定位的证据。在运行查询之前,用户指定其标识符的Kegg路径,并从下拉框中选择所需的生物体。
      从菜单栏访问中访问Intermine的两种附加功能:列表和MyMine。列表功能允许上载的对象列表,例如Uniprot标识符,然后用作兼容模板查询或查询构建器中的约束。创建了几个公共列表:氧化磷酸化主要呼吸复合物中的蛋白质和线粒体蛋白的Mitocarta列表 HOMO SAPIENS.M. Musculus. (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )。 MyMine功能提供了个人帐户,其中包含用户名和密码,该密码存储查询和结果,以便稍后可以访问,导出或修改它们。可以组合,相交或从相同类型的任何其他保存的结果集中组合,相交或减去保存到接收到接收系统的一组结果,以生成作为几种不同查询的产品的列表。

       用丝立肌对线粒体蛋白质组的研究

      我们确定了33个出版物,报告了蛋白质线粒体定位的大规模数据集。 30个出版物描述了由纯化的线粒体细胞级分的质谱法测定的蛋白质(
      • 卡罗尔J.
      • Fearnley I.M.
      • Walker J.E.
      膜蛋白分子量测量线粒体蛋白质的定义。
      ,
      • Alonso J.
      • Rodriguez J.M.
      • baena-lopez l.a.
      • Santaren J.F.
      果蝇细胞基体细胞蛋白组的表征。
      ,
      • 卡罗尔J.
      • altman m.c.
      • Fearnley I.M.
      • Walker J.E.
      蛋白离子串联质谱法鉴定膜蛋白。
      ,
      • 达克鲁斯S.
      • Xenarios I.
      • Langridge J.
      • Vilbois F.
      • arone p.a.
      • 马蒂诺J.C.
      小鼠肝线粒体内膜的蛋白质组学分析。
      ,
      • Devreese B.
      • vanrobaeys f.
      • Smet J.
      • van beeumen J.
      • van coster r.
      二维蓝天然聚丙烯酰胺凝胶电泳分离的线粒体氧化磷酸化亚基的质谱鉴定。
      ,
      • Forner F.
      • 福斯特L.J.
      • Campanaro S.
      • 瓦尔G.
      大鼠线粒体从肌肉,心脏和肝脏的定量蛋白质组学比较。
      ,
      • 福斯特L.J.
      • de hoog c.l.
      • 张Y.
      • 张Y.
      • 谢X.
      • Mootha V.k.
      通过蛋白质相关性分析的哺乳动物细胞器地图。
      ,
      • Fountoulakis M.
      • 伯尔尼特P.
      • langen h.
      • Suter L.
      大鼠肝线粒体蛋白。
      ,
      • Fountoulakis M.
      • SC.hlaeger E.J.
      神经母细胞瘤细胞系IMR-32的线粒体蛋白。
      ,
      • Fukada K.
      • 张F.
      • Vien A.
      • Cashman N.R.
      • 朱H.
      家族性肌营养侧面硬化剂细胞系模型的线粒体蛋白质组学分析。
      ,
      • Gaucher S.P.
      • 泰勒S.W.
      • Fahy E.
      • 张B.
      • 警告D.E.
      • Ghosh S.S.
      • 吉布森B.W.
      使用多维液相色谱法与串联质谱法一起扩展人心脏线粒体蛋白质组的覆盖率。
      ,
      • 江X.S.
      • 戴J.
      • 盛Q.H.
      • 张L.
      • 夏Q.c.
      • 吴j.r.
      • 曾R.
      亚细胞蛋白质组学研究的比较蛋白质组学策略:ICAT方法与生物信息学预测相结合,以确定大鼠肝线粒体蛋白和过氧化氢酶线粒体定位的指示。
      ,
      • kislinger t.
      • Cox B.
      • 坎南A.
      • Chung C.
      • 胡诗
      • Ignatchenko A.
      • 斯科特M.S.
      • Gramolini a.o.
      • 莫里斯Q.
      • Hallett M.T.
      • rossant J.
      • 休斯。
      • 弗雷B.
      • Emili A.
      小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
      ,
      • Lescuyer P.
      • Strub J.M.
      • Luche S.
      • Diemer H.
      • 马丁内斯普
      • 范杜塞尔A.
      • Lunardi J.
      • rabilloud t.
      参考人体线粒体蛋白质组定义的进展。
      ,
      • 麦当劳T.
      • 盛S.
      • 斯坦利B.
      • 陈德。
      • ko Y.
      • COLE R.N.
      • Pedersen P.
      • 范艾克J.E.
      使用蛋白质分离技术扩展内部线粒体的亚颗粒:单向和二维液相色谱和二维凝胶电泳。
      ,
      • ohlmeier s.
      • Kastaniotis A.J.
      • HILTUNEN J.K.
      • Bergmann U.
      酵母线粒体蛋白质组,发酵和呼吸生长研究。
      ,
      • Pflieger D.
      • Le Caer J.P.
      • lemaire c.
      • 伯纳德B.A.
      • Dujardin G.
      • rossier J.
      通过LC-MS / MS进行系统鉴定线粒体蛋白。
      ,
      • Prokisch H.
      • SC.harfe C.
      • 营地II,D.G.
      • 小W.
      • 大卫兰。
      • 和reoli c.
      • Monroe M.E.
      • 摩尔r.j.
      • 格里尼科米。
      • 科泽尼C.
      • 赫克森k.k.
      • 莫斯塔赫苗
      • Zischka H.
      • 赫尔曼Z.S.
      • 戴维斯R.W.
      • Meitinger T.
      • Oefner P.J.
      • 史密斯r.d.
      • Steinmetz L.M.
      酵母中线粒体蛋白质组的整合分析。
      ,
      • rabilloud t.
      • Kieffer S.
      • Procaccio V.
      • Louwagie M.
      • Courchesne P.L.
      • 帕特森S.D.
      • 马丁内斯普
      • 加入J.
      • Lunardi J.
      人胎盘线粒体和蛋白质鉴定的二维电泳和质谱:朝向人体线粒体蛋白质组。
      ,
      • 驯鹿J.
      • Zahedi R.P.
      • Pfanner N.
      • Meisinger C.
      • 镰刀A.
      朝向完全酵母线粒体蛋白质组:线粒体蛋白质组学的多维分离技术。
      ,
      • Rezaul k.
      • 吴L.
      • Mayya V.
      • Hwang S.I.
      • 手。
      从人T白血病细胞中的线粒体蛋白质组进行系统特征。
      ,
      • Ruiz-Romero C.
      • Lopez-Armada M.J.
      • Blanco F.J.
      人普通关节软骨细胞的线粒体蛋白质组学特征。
      ,
      • SC.heffler N.K.
      • 米勒S.W.
      • 卡罗尔A.K.
      • 安德森C.
      • 戴维斯拉。
      • Ghosh S.S.
      • 吉布森B.W.
      SH-SY5Y神经母细胞瘤细胞系线粒体蛋白的二维电泳和质谱鉴定。
      ,
      • 镰刀A.
      • 驯鹿J.
      • 瓦格纳Y.
      • joppich c.
      • Zahedi R.
      • Meyer H.E.
      • SC.honfisch B.
      • Perschil I.
      • Chacinska A.
      • GUIARD B.
      • 击败P.
      • Pfanner N.
      • Meisinger C.
      蛋白质组 酿酒酵母酿酒酵母 mitochondria.
      ,
      • 泰勒S.W.
      • Fahy E.
      • 张B.
      • 格伦地下
      • 警告D.E.
      • Wiley S.
      • 墨菲A.N.
      • Gaucher S.P.
      • Capaldi R.A.
      • 吉布森B.W.
      • Ghosh S.S.
      人体心脏线粒体蛋白质组的表征。
      ,
      • 谢J.
      • TechRitz S.
      • Haebel S.
      • 喇叭A.
      • 奈茨尔H.
      • Klose J.
      • 舒梅克米
      来自永生淋巴细胞系中的人体线粒体蛋白的二维电泳图:患者测定线粒体障碍的先决条件。
      ,
      • Zahedi R.P.
      • 镰刀A.
      • Boehm上午
      • Winkler C.
      • Zufall N.
      • SC.honfisch B.
      • GUIARD B.
      • Pfanner N.
      • Meisinger C.
      酵母线粒体外膜的蛋白质组学分析显示出预蛋白质的亚类的积累。
      ),三个出版物使用了GFP标记(
      • 嗯w.k.
      • Falvo J.v.
      • Gerke L.C.
      • 卡罗尔A.S.
      • 豪森·克林。
      • Weissman J.s.
      • o'shea e.k.
      萌芽酵母蛋白质定位的全局分析。
      ,
      • Kumar A.
      • agarwal s.
      • 嘿曼J.A.
      • 马德森S.
      • Heidtman M.
      • Piccirillo S.
      • umansky l.
      • 绘图A.
      • Jansen R.
      • 刘Y.
      • 张克夫。
      • 米勒P.
      • Gerstein M.
      • 罗德尔G.S.
      • 斯奈德米
      酵母蛋白质组的亚细胞定位。
      ,
      • ozawa t.
      • Sako Y.
      • 佐藤M.
      • Kitamura T.
      • Umezawa Y.
      鉴定线粒体蛋白的遗传方法。
      )和三种技术(
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      ,
      • 卡尔沃S.
      • jain m.
      • 谢X.
      • sheth s.a.
      • 昌B.
      • Goldberger O.A.
      • Spinazzola A.
      • Zeviani M.
      • carr s.a.
      • Mootha V.k.
      通过整合基因组学系统鉴定人体线粒体疾病基因。
      ,
      • Mootha V.k.
      • Bunkenborg J.
      • 奥尔森J.V.
      • Hjerrild M.
      • wisniewski J.R.
      • 斯赫尔e.
      • Bolouri M.S.
      • 雷H.N.
      • Sihag S.
      • Kamal M.
      • 帕特森N.
      • 着陆器E.S.
      小鼠线粒体中蛋白质组成,组织多样性和基因调控的综合分析。
      )。这些出版物包括13个数据集 H. Sapiens.,八个来自 M. Musculus.,八个来自 S. Cerevisiae.,四个来自 R. norvegicus.,一个来自 Bos Taurus.和一个来自 D. Melanogaster.。所有这些出版物的数据都进口到拟尖。
      为了评估测定线粒体蛋白质组的进展,我们使用拟瘤瘤来从33个出版物中查找蛋白质线粒体定位的数据和出版物的年增长率。在出版物中报告的蛋白质数量(评价为同源烯簇的数量)与出版物数量的增长相匹配Fig. 7)。到2008年,所有物种中报告的蛋白质总数为3672.在2008年,线粒体蛋白数量的增加是220,虽然pagliarini 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )发表了一项研究,该研究鉴定了大约1100个线粒体蛋白质。具有线粒体定位实验证据的蛋白质比例,其在Uniprot进入中的“跨膜”关键词在2002年的18%增加到2008年的18%至21%。在3672个蛋白质中,1506(41%)被任何一个线粒体注释为线粒体基因本体或UNIPROT,1326(36%)尚未注释为线粒体,但在另一个亚细胞位置注释,840(23%)没有亚细胞定位的注释。
      图缩略图GR7.
      Fig. 7(I)蛋白数量的累积增加(I)蛋白报告为线粒体(灰色吧(ii)出版物(黑线)在过去的10年中,使用33次出版物对丝提物中包含的线粒体定位。 通过使用同源烯来除去蛋白质冗余以合并直晶和重复的蛋白质。跨膜蛋白的数量(深灰色)被发现的Uniprot注释约占总数的20%(浅灰)。
      我们利用丝条莫纳的能力来研究最大和最近的质量光谱数据集中的两个的相似之处和差异:Pagliarini的那些 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )和西兰德 等等。 (
      • kislinger t.
      • Cox B.
      • 坎南A.
      • Chung C.
      • 胡诗
      • Ignatchenko A.
      • 斯科特M.S.
      • Gramolini a.o.
      • 莫里斯Q.
      • Hallett M.T.
      • rossant J.
      • 休斯。
      • 弗雷B.
      • Emili A.
      小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
      )。在基斯林蛋白中鉴定了同源聚糖,1746种不同的蛋白质 等等。 (
      • kislinger t.
      • Cox B.
      • 坎南A.
      • Chung C.
      • 胡诗
      • Ignatchenko A.
      • 斯科特M.S.
      • Gramolini a.o.
      • 莫里斯Q.
      • Hallett M.T.
      • rossant J.
      • 休斯。
      • 弗雷B.
      • Emili A.
      小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
      )出版物和905在Pagliarini中被识别出来 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      ) 学习。跨膜蛋白的数量在西仑蛋白中为323(18.5%) 等等。 (
      • kislinger t.
      • Cox B.
      • 坎南A.
      • Chung C.
      • 胡诗
      • Ignatchenko A.
      • 斯科特M.S.
      • Gramolini a.o.
      • 莫里斯Q.
      • Hallett M.T.
      • rossant J.
      • 休斯。
      • 弗雷B.
      • Emili A.
      小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
      )数据集,跨膜蛋白的数量在Pagliarini中为204(22.5%) 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )数据集。这两个数据集之间的重叠是392蛋白。
      为了确定一些蛋白质是否通过质谱法更常见,我们探讨了拟瘤剂以确定据报道蛋白质的出版物的数量。该分布显示出无垢特征,其中大约一半的蛋白质在一次出版物中鉴定,在三个或更多的出版物中报告约30%( Fig. 8)。在四个或更多个质谱出版物中报告了九十五蛋白作为线粒体,但尚未在UNIPROT或其各自的基因组数据库中报告为线粒体。例如,来自苏克斯醇结合蛋白质同源物7(OSH7P) S. Cerevisiae. (Uniprot登录号码 P38755)已被鉴定为在四种质谱出版物中定位对线粒体(
      • Pflieger D.
      • Le Caer J.P.
      • lemaire c.
      • 伯纳德B.A.
      • Dujardin G.
      • rossier J.
      通过LC-MS / MS进行系统鉴定线粒体蛋白。
      ,
      • Prokisch H.
      • SC.harfe C.
      • 营地II,D.G.
      • 小W.
      • 大卫兰。
      • 和reoli c.
      • Monroe M.E.
      • 摩尔r.j.
      • 格里尼科米。
      • 科泽尼C.
      • 赫克森k.k.
      • 莫斯塔赫苗
      • Zischka H.
      • 赫尔曼Z.S.
      • 戴维斯R.W.
      • Meitinger T.
      • Oefner P.J.
      • 史密斯r.d.
      • Steinmetz L.M.
      酵母中线粒体蛋白质组的整合分析。
      ,
      • 驯鹿J.
      • Zahedi R.P.
      • Pfanner N.
      • Meisinger C.
      • 镰刀A.
      朝向完全酵母线粒体蛋白质组:线粒体蛋白质组学的多维分离技术。
      ,
      • 镰刀A.
      • 驯鹿J.
      • 瓦格纳Y.
      • joppich c.
      • Zahedi R.
      • Meyer H.E.
      • SC.honfisch B.
      • Perschil I.
      • Chacinska A.
      • GUIARD B.
      • 击败P.
      • Pfanner N.
      • Meisinger C.
      蛋白质组 酿酒酵母酿酒酵母 mitochondria.
      )以及GFP标记(
      • 嗯w.k.
      • Falvo J.v.
      • Gerke L.C.
      • 卡罗尔A.S.
      • 豪森·克林。
      • Weissman J.s.
      • o'shea e.k.
      萌芽酵母蛋白质定位的全局分析。
      )(Fig. 3)。
      图缩略图GR8.
      Fig. 8频率分布(灰色吧)和累积频率分布(黑线)通过质谱法将蛋白质报告为线粒体的出版物的数量。 通过使用同源物将蛋白质冗余结合以组合突出的蛋白质和重复的蛋白质。已鉴定在10种或更多研究中的蛋白质被分组为“10+。“
      由于用于鉴定线粒体蛋白的技术可以对诸如疏水性的蛋白质的性质敏感,因此我们使用拟拟查的型出版物进行了众所周知的线粒体蛋白的亚基已通过GFP标记或质谱法来研究。对于线粒体F型ATP合酶的亚基 M. Musculus. 和他们的正端,f的亚基1 子追容通常在更少的研究中被识别而不是F的研究o subcomplex (表二)。特别地,跨膜亚基表示差。例如 M. Musculus.,疏水A和C亚基已在单一质谱中进行鉴定,而亲水性催化α和β亚基已通过GFP标记和许多质谱研究鉴定。在线粒体转运仪家庭的46名哺乳动物中(
      • Palmieri F.
      线粒体转运仪系列(SLC25):生理和病理学影响。
      ),除了至少一个出版物中的质谱,所有这些除外所有除了八个出版物,虽然大多数人仅由Pagliarini报告 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )。没有来自质谱研究的没有证据的蛋白质是解耦蛋白2,Mitoferrin 1,Graves疾病载体蛋白,谷氨酸载体2,SLC25A38,SLC25A39,SLC25A41和SLC25A43。
      表二用于F的亚基的线粒体定位的实验证据oF1 ATP合酶在M. Masculus和其他物种中
      亚基uniprot ID.GFP.标记研究质谱型出版物数量TM Helces的数量
      b 在Uniprot报道的亚基中跨膜螺旋(TM)的数量。
      M. Musculus.其他物种
      a 物种是 H. Sapiens., R. norvegicus., B.金牛座, D. Melanogaster., 和 S. Cerevisiae..
      M. Musculus.其他物种
      a 物种是 H. Sapiens., R. norvegicus., B.金牛座, D. Melanogaster., 和 S. Cerevisiae..
      aP00848186
      bQ9CQQ7+5130
      c
      c 亚单位的同种型1。
      P48202122
      c
      d 亚单位的同种型2。
      P56383002
      c
      e 亚基C的同种型3。
      P56384012
      dQ9DCX2+5180
      eQ06185+370
      fP56135+590
      gQ9CPQ8+4140
      F6P97450550
      8(A6L)P03930141
      6.8 KDA.P56379230
      dQ78IK2+271
      αQ03265++7180
      βP56480++7190
      γQ91VR2++6140
      δQ9D3D96110
      εP56382+490
      OSCP.Q9DB20+5150
      a 物种是 H. Sapiens., R. norvegicus., B.金牛座, D. Melanogaster., 和 S. Cerevisiae..
      b 在Uniprot报道的亚基中跨膜螺旋(TM)的数量。
      c 亚单位的同种型1。
      d 亚单位的同种型2。
      e 亚基C的同种型3。
      我们通过使用拟甲基麦物将来自质谱法,GFP标记和注释的数据组合来估计六种物种中的每一个中的线粒体蛋白质组的大小。 M. Musculus. 当合并其质谱研究的结果后,当其质量光谱研究的结果后,蛋白质数量最多被报告为线粒体。 H. Sapiens. 然后 S. Cerevisiae. (表III)。然而,对于本三种物种,在UNIPROT或基因组数据库中作为线粒体注释的蛋白质的数量大致相同。仅有的 S. Cerevisiae. 鉴定了来自GFP标记研究的大量线粒体蛋白质。接下来我们通过使用同源物考虑从其直脑中的证据来推断蛋白质的线粒体定位。这将每个物种中的更多蛋白质鉴定为线粒体( 表III)。最后为了估计每种物种中线粒体蛋白质组的大小,我们将蛋白质与直接证据和注释的蛋白质组合在于从直脑中推断出来(表III)。 H. Sapiens.M. Musculus. 每个人都有大约3000个蛋白质被报告为线粒体,而 S. Cerevisiae. 在此列表中包含约1500.蛋白质是通常不被认为线粒体的蛋白质,但对线粒体定位的实验证据,例如来自糖醇的核心途径的蛋白质。
      表III非冗余蛋白数量(通过使用同源烯)在六种物种中被描述为线粒体
      物种物种中的蛋白质数量没有其他物种的蛋白质蛋白质
      e 在其他五种物种中被描述为线粒体的正牙(如同源烯所定义的蛋白质数量。
      全部的
      f 通过结合直接证据和从直肠推断出来的蛋白质数量被描述为线粒体。
      GFP.
      a GFP.,通过GFP标记和显微镜测定的蛋白质数量,具有线粒体定位。
      大众规范
      b 通过使用纯化的线粒体级分的质谱法测定的蛋白质数量。
      注释
      c 注释,由UNIPROT,基因组数据库或基因本体注释为线粒体注释的蛋白质数。
      合并
      d 结合,通过组合来自GFP,质谱和注释的证据来组合为线粒体的蛋白质数。
      GFP.大众规范注释合并
      H. Sapiens.142103785315512432465110927013025
      M. Musculus.52241194226263271436106318963124
      R. norvegicus.0533413754207170066518351907
      B.金牛座018415416207148364915951602
      D. Melanogaster.037236255271140771315201576
      S. Cerevisiae.57410049221196465842516201461
      a GFP.,通过GFP标记和显微镜测定的蛋白质数量,具有线粒体定位。
      b 通过使用纯化的线粒体级分的质谱法测定的蛋白质数量。
      c 注释,由UNIPROT,基因组数据库或基因本体注释为线粒体注释的蛋白质数。
      d 结合,通过组合来自GFP,质谱和注释的证据来组合为线粒体的蛋白质数。
      e 在其他五种物种中被描述为线粒体的正牙(如同源烯所定义的蛋白质数量。
      f 通过结合直接证据和从直肠推断出来的蛋白质数量被描述为线粒体。
      确定在中间共同的线粒体蛋白 H. Sapiens., M. Musculus., 和 S. Cerevisiae.,我们评估了我们计算过的线粒体蛋白质蛋白质中的重叠。许多提出的线粒体蛋白 H. Sapiens., M. Musculus., 和 S. Cerevisiae. 用同源烯定义的关系直观(Fig. 9)。超过90%的线粒体蛋白 H. Sapiens.M. Musculus. 是直观的,而大约50%的蛋白质 S. Cerevisiae. 对蛋白质的直观 H. Sapiens.M. Musculus.。然而,在被认为是非直字之间的蛋白质中 H. Sapiens.M. Musculus. 根据同源烯,存在已知的直晶型的实例。因此,通过使用BLASTP的所有蛋白质与预期值截止为10,通过将所有蛋白质进行比较来鉴定更多的远离同源物定义的外部蛋白质。 −35。随后是独特的蛋白质的数量 S. Cerevisiae. 跌至562,而所有三种物种中存在的地区数量上升至1393年,而且两者都有 H. Sapiens.M. Musculus. 升至3330(接近报告的蛋白质的99%)。剩余物种特异性蛋白质 H. Sapiens.M. Musculus.,几个预期值略大于用于BLASTP截止的值,并且一对夫妇在Refseq中有正常的原因,但从UniProt缺少这些序列。剩余的单身均在100个氨基酸下的小蛋白质的长度,有些是假设的标记。
      图缩略图GR9.
      Fig. 9三种线粒体蛋白质蛋白质中的正交蛋白数量。 通过实验证据(质谱或GFP标记)或注释或通过正牙的线粒​​体定位分配一种蛋白质作为线粒体。 主要数字 通过使用同源烯来确定蛋白质中的冗余和陈列科来计算。 数字括弧 通过使用爆炸来计算(阈值10−35 为了预计得分)以定义正轨。
      David功能注释群集工具Web服务用于确定统计学意义(p <0.001)来自基因本体论的生物过程术语在所有三种物种(使用所述蛋白质)的蛋白质中的基因本体中 S. Cerevisiae. 计算 p 价值观),(ii)特定于 S. Cerevisiae.和(iii)分享 H. Sapiens.M. Musculus. (使用蛋白质 H. Sapiens. 计算 p 价值观)但不是 S. Cerevisiae.。每组蛋白质如“生物合成过程”(312个蛋白质)存在许多统计学上显着但无关的注释项。 p < 10−26)。然而,在所有三种物种共同的蛋白质中,大卫报告的更多特异性基因本体学注释,包括羧酸代谢过程(136个蛋白质; p < 10−18),Cofactor代谢过程(87个蛋白质; p < 10−15),trna氨基酰化(29个蛋白质; p < 10−12),线粒体输送(36个蛋白质; p < 10−10),氨基酸代谢过程(80个蛋白质; p < 10−9),三羧酸循环(18个蛋白质; p < 10−9),线粒体组织和生物发生(60个蛋白质; p < 10−8),糖酵解(16个蛋白质; p < 10−4),脂质代谢过程(71个蛋白质; p < 10−3)和泛醌代谢过程(八种蛋白质; p < 10−3)。虽然特定于蛋白质 S. Cerevisiae. 有很多报告的常见组的术语,还存在统计学上显着的基因本体学生物过程术语,这些术语缺席 H. Sapiens.M. Musculus.,包括分枝族氨基酸生物合成过程(九种蛋白质; p < 10−4)和发酵(九种蛋白质; p < 10−3)。同样对于特定于的蛋白质 H. Sapiens.M. Musculus.,术语“凋亡计划”(30个蛋白质; p < 10−12)以及细胞组分术语“呼吸链复合物I”(38个蛋白质; p < 10−33)显着超越,缺席 S. Cerevisiae..

      讨论

      我们通过将公开实验的结果与相关的生物学信息相结合来确定和表征线粒体蛋白质的丝立肌,以确定和表征线粒体蛋白质。该实验证据通常不包括在公共序列数据库中,因为其大小,复杂性和高误率(
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )。拟瘤细胞与其他线粒体蛋白质组资源不同(表I.)通过使用模型来描述在开源内部数据仓库中实现的这些数据,并允许从多个源以及交叉资源查询集成数据。我们将蛋白质的线粒体定位与纯化的线粒体的GFP标记或质谱与蛋白质功能,蛋白质同源性,代谢途径,遗传表型和翻译后修饰的数据和注释,将数据集纳入蛋白质的线粒体定位。从这些实验研究中捕获了附加信息,例如用于纯化,分离和鉴定的技术,提供任何其他线粒体资源中不存在的细节水平。每个进入基础可访问此额外信息,并创建一个全面的出处,允许用户直接评估蛋白质定位的实验证据。代谢途径数据的独特含有为蛋白质提供了生理背景,以及支持系统生物学和建模方法是必不可少的。线粒体是许多代谢和生物能源途径的位点,是代谢模型构建的主要候选者(
      • vo t.d.
      • Palsson B.O.
      建立电力房屋:通过蛋白质组学和系统生物学进行线粒体研究的最新进展。
      )。这些重建远非完整,基因组学和蛋白质组学数据与代谢途径数据的整合将允许进一​​步改进。
      为了证明丝立米霉素的独特特征,我们分析了在拟甲米中的33项研究的数据分析了关于物种之间的线粒体蛋白质群的大小和重叠的一些一般性问题以及通过不同技术的定义进展。这些研究中鉴定的不同线粒体蛋白的数量计算为约3700,似乎达到高原(Fig. 7),虽然2006年后只发布了两项研究。但是,Pagliarini的研究 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )2008年确定了1000个蛋白质,将219种新蛋白质贡献到总数,表明进一步的研究可能识别新的线粒体蛋白质。特别地,据估计,在基因组中编码的三分之一的蛋白质是膜结合(
      • 卡罗尔J.
      • Fearnley I.M.
      • Walker J.E.
      膜蛋白分子量测量线粒体蛋白质的定义。
      )。然而直到2003年,透射蛋白蛋白的鉴定相对罕见(Fig. 7);这可能是由于二维电泳方法的局限性(
      • 卡罗尔J.
      • Fearnley I.M.
      • Walker J.E.
      膜蛋白分子量测量线粒体蛋白质的定义。
      )通常用于当时分离蛋白质级分。鉴定的跨膜蛋白的比例达到2008〜2008〜21%,随着更多GFP标记研究进行,使用更复杂的质谱技术,例如反相色谱。注意,由于缺失或不正确的UniProt型螺旋的注释,引用的跨膜蛋白的比例可能是不准确的。质谱已经用于大多数线粒体蛋白质组学研究,因为它具有高通量鉴定的优点,但难以与该方法相容的膜蛋白的分离和纯化是困难的(
      • 卡罗尔J.
      • Fearnley I.M.
      • Walker J.E.
      膜蛋白分子量测量线粒体蛋白质的定义。
      )。因此,在这些研究中,跨膜蛋白可能不足。因此,可以鉴定新的线粒体蛋白,进一步使用能够捕获疏水性膜蛋白的线粒体蛋白质组,特别是使用能够捕获疏水膜蛋白的方法。
      在来自基斯林斯的两个最大的质谱数据集之间仅共享392种蛋白质 等等。 (
      • kislinger t.
      • Cox B.
      • 坎南A.
      • Chung C.
      • 胡诗
      • Ignatchenko A.
      • 斯科特M.S.
      • Gramolini a.o.
      • 莫里斯Q.
      • Hallett M.T.
      • rossant J.
      • 休斯。
      • 弗雷B.
      • Emili A.
      小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
      )和Pagliarini. 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )在小鼠线粒体上,代表约22%的西仑 等等。 (
      • kislinger t.
      • Cox B.
      • 坎南A.
      • Chung C.
      • 胡诗
      • Ignatchenko A.
      • 斯科特M.S.
      • Gramolini a.o.
      • 莫里斯Q.
      • Hallett M.T.
      • rossant J.
      • 休斯。
      • 弗雷B.
      • Emili A.
      小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
      )设定和43%的Pagliarini 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      ) 放。这表明通过结合这两项研究,将约2200种不同的蛋白质被鉴定为线粒体。如果Pagliarini报道的假发现率 等等。 (
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )被应用,然后总数落到约1770年。这高于哺乳动物线粒体中估计的1500种不同的蛋白质(
      • 泰勒S.W.
      • Fahy E.
      • Ghosh S.S.
      全球细胞内蛋白质组学。
      )。这两项研究不太可能鉴定了特别是关于膜蛋白的所有线粒体蛋白质,并且表明线粒体蛋白质组可能远远大于电流估计值。
      我们推测报告蛋白质的线粒体定位的质谱研究的数量越大,蛋白质是线粒体的可能性越多。我们发现,在Uniprot中报告的大多数蛋白质在UniProt作为线粒体注释。这些可以代表丰富的可溶性蛋白质,其是普遍途径和方法的组分,因此更常好地通过质谱法纯化和鉴定。然而,在四个或更多个数据集中报告的拟甲瘤中存在近100个蛋白质,并且在UNIPROT或其基因组数据库中未被注释为线粒体。一个例子是氧食醇结合蛋白质同源7(OSH7P)来自 S. Cerevisiae. (Fig. 3)具有来自GFP和质谱的证据。由于线粒体中产生的氧冬醇可能在维持细胞内胆固醇稳态中发挥重要作用(
      • ren s.
      • Hylemon P.
      • 张Z.P.
      • Rodriguez-Agudo D.
      • Marques D.
      • 李X.
      • 周H.
      • GIL G.
      • 熊熊队
      鉴定肝细胞核和线粒体中的新型磺化的苏克斯醇,5胆甾烯-3β,25-二醇3-磺酸盐。
      ),在线粒体中的氧食醇结合蛋白的新存在是合理的。
      不经常观察到的蛋白质可以被认为是来自细胞溶溶胶和其他细胞器的污染物,因此可以丢弃。然而,许多线粒体蛋白质可能是疏水膜蛋白(
      • 卡罗尔J.
      • Fearnley I.M.
      • Walker J.E.
      膜蛋白分子量测量线粒体蛋白质的定义。
      ),具有低丰度,或特定于特定的发展阶段或组织。这些是使它们难以使用质谱分离和检测的特征。因此,忽略仅在一个质谱上报告的近1700个蛋白质(Fig. 8)可能导致大量正版的线粒体蛋白质被打折。例如,ATP合酶的疏水亚基对线粒体定位的实验证据差(表二),特别是疏水性C亚基,尽管在内部线粒体膜中具有非常高的丰度。对于线粒体运输车家族的成员来说也是如此。虽然这些实施例中的所有蛋白质在UniProt中的线粒体被注释,但是在丝立米霉素中的搜索中缺少基因本体,这不适用于新的蛋白质。促霉素还可用于排除被注释的蛋白质,以定位于除线粒体以外的亚细胞位置,试图减少误报。但是,这将影响总量的36%,其中许多可能是双本地化的情况(
      • Regev-Rudzki N.
      • 松树O.
      黯然失色分布:蛋白质双重靶向的现象及其意义。
      )或在细胞溶溶胶中起作用的蛋白质,但是通过与外部线粒体膜的外部的相互作用来共同地用线粒体定位。例如,使用拟瘤器的搜索显示,在动物和酵母的线粒体蛋白质组学测定中定期检测到糖酵解途径的所有核心,表明它们在结构上与线粒体相关,如图所示 拟南芥蒂利亚纳 (
      • Giege P.
      • Heazlewood J.L.
      • Roessner-Tunali U.
      • Millar A.H.
      • Fernie A.R.
      • Leaver C.J.
      • SweetLove L.J.
      糖醇分解的酶在拟南芥细胞中的线粒体有效。
      ),而不是污染物,尽管这种互动争议(
      • 福斯特L.J.
      • de hoog c.l.
      • 张Y.
      • 张Y.
      • 谢X.
      • Mootha V.k.
      通过蛋白质相关性分析的哺乳动物细胞器地图。
      )。
      通过组合直接证据和从直肠推断出来的不同物种中估计线粒体蛋白质组的大小(表III)。报告的蛋白质总数 M. Musculus.H. Sapiens. 大约是3300,远远高于以前的估计数(
      • 泰勒S.W.
      • Fahy E.
      • Ghosh S.S.
      全球细胞内蛋白质组学。
      )。已经使用有限数量的数据集计算了现有估计,因此可能不成富的是,使用一系列实验技术的拟甲瘤中的33个出版物的结果更有可能识别比线粒体蛋白质组的更宽范围一种用于隔离的单一技术。然而,这种组合还增加了假阳性的可能性,这对于纯化细胞器的质谱研究估计高达40%(
      • Pagliarini D.J.
      • 卡尔沃S.E.
      • 昌B.
      • sheth s.a.
      • vafai s.b.
      • ong s.e.
      • 沃尔福德G.A.
      • Sugiana C.
      • boneh a。
      • 陈W.K.
      • 山D.E.
      • vidal m.
      • 埃文斯J.G.
      • Thorburn D.R.
      • carr s.a.
      • Mootha V.k.
      线粒体蛋白质概要阐明了综合体疾病生物学。
      )。尽管查询生成器可用于应用这些滤波器,但我们并未消除仅从少量肽序列中鉴定的任何蛋白质或具有不充分的序列覆盖率。例如,可以在单个质谱研究中拒绝报告的任何蛋白质,序列覆盖率小于25%,尽管目前少数研究记录了这种细节水平。
      我们调查了三种物种的线粒体蛋白质部分之间的重叠(Fig. 9)发现,大量比例的线粒体蛋白质组是常见的。这是预期的,鉴于线粒体在能量生产,新陈代谢,自身生物发生和维护以及其共同进化起源的普遍作用。这是通过使用大卫发现的基因本体论术语的确认,这描述了这些常见蛋白质的功能。然而, S. Cerevisiae. 近600个蛋白质不存在 H. Sapiens.M. Musculus., 然而 H. Sapiens.M. Musculus. 共享近2000个线粒体蛋白,这些蛋白质不存在 S. Cerevisiae.。其中一些差异可能是由于参与共同代谢途径的基因数量的扩张或减少。但分析证实了存在 S. Cerevisiae. 用于缺乏的过程的蛋白质 H. Sapiens.M. Musculus.,如发酵和支链氨基酸生物合成。特定于蛋白质的功能性注释 H. Sapiens.M. Musculus., 和....相比 S. Cerevisiae.,鉴定参与NADH的蛋白质:氟喹酮氧化还原酶(综合体I),其缺乏 S. Cerevisiae.和细胞凋亡。细胞凋亡在酵母中的作用仍然存在争议(
      • 郑温
      • 浸出。
      • Hardwick J.m.
      酵母和哺乳动物细胞的线粒体死亡途径。
      );然而,在多细胞生物体中,对于由线粒体介导的细胞死亡是一种极其重要和良好的调节方法。因此,由于新进化的功能或与另一个王国中的功能丧失,对不同界比不同王国的Mitochondria的功能分析证实了不同王国的不同过程。
      甲型瘤是一种新的线粒体蛋白质组资源,将实验数据与来自Uniprot和基因组项目的蛋白质注释,来自Kegg的代谢途径数据,来自同胞的同源性关系的代谢途径数据以及来自OMIM的疾病表型。这种独特的组合允许进一步分析线粒体蛋白质组,并为线粒体生理学和代谢的系统水平评估提供基础。我们的初步分析表明线粒体蛋白质组比以前的估计大得多,尽管区分污染物和疏水性,低丰度或双局部化蛋白质仍然具有挑战性。
      从MRC线粒体生物学单位的网站可以访问一个公共版本的丝立清资源。

      致谢

      我们感谢Richard Smith,Kim Rutherford,以及Flymine项目的GoS Micklem,以协助与海洋系统和John Walker和Ian Fearnley有关蛋白质组学的宝贵建议。

      参考

        • Dimauro S.
        • SC.hon E.A.
        线粒体呼吸链疾病。
        N. Eng。 J.Med。 2003; 348: 2656-2668
        • Trifonovic A.
        • WREDENBERG A.
        • Falkenberg M.
        • spelbrink j.n.
        • Rovio A.T.
        • 布鲁德C.E.
        • Bohlooly Y.M.
        • Gidlof S.
        • Oldfors A.
        • Wibom R.
        • Tordell J.
        • Jacobs H.T.
        • Larsson N.G.
        表达缺陷线粒体DNA聚合酶的小鼠过早老化。
        自然。 2004; 429: 417-423
        • 弗利斯M.S.
        • USADEL H.
        • Caballero O.L.
        • 吴L.
        • Buta M.R.
        • eleff s.m.
        • 詹吉斯
        • Sidransky D.
        肿瘤和体液中线粒体DNA突变的体积检测。
        科学。 2000; 287: 2017-2019
        • 华莱士D.C.
        一种线粒体的代谢和退行性疾病,衰老和癌症:进化医学的曙光。
        安努。 Rev. Genet。 2005; 39: 359-407
        • 泰勒S.W.
        • Fahy E.
        • Ghosh S.S.
        全球细胞内蛋白质组学。
        趋势生物技术。 2003; 21: 82-88
        • Pagliarini D.J.
        • 卡尔沃S.E.
        • 昌B.
        • sheth s.a.
        • vafai s.b.
        • ong s.e.
        • 沃尔福德G.A.
        • Sugiana C.
        • boneh a。
        • 陈W.K.
        • 山D.E.
        • vidal m.
        • 埃文斯J.G.
        • Thorburn D.R.
        • carr s.a.
        • Mootha V.k.
        线粒体蛋白质概要阐明了综合体疾病生物学。
        细胞。 2008; 134: 112-123
        • 卡罗尔J.
        • Fearnley I.M.
        • Skehel J.m.
        • 漫步M.J.
        • 香农r.j.
        • 赫斯特J.
        • Walker J.E.
        从牛心脏线粒体的复合物I的核编码亚基的翻译后修饰。
        摩尔。细胞。蛋白质组学。 2005; 4: 693-699
        • 卡罗尔J.
        • Fearnley I.M.
        • Walker J.E.
        膜蛋白分子量测量线粒体蛋白质的定义。
        Proc。 Natl。阿卡。 SCI。美国。 2006; 103: 16170-16175
        • Lyne R.
        • 史密斯r.
        • rutherford K.
        • Wakeling M.
        • 炫耀A.
        • Guillier F.
        • Janssens H.
        • 吉W.
        • 迈凯轮P.
        • 北诗
        • rana d。
        • 莱利T.
        • 沙利文J.
        • Watkins X.
        • Woodbridge M.
        • 莉莉K.
        • 罗素S.
        • ashburner m.
        • mizuuchi k。
        • Micklem G.
        Flymine:果蝇和anopheles基因组学的集成数据库。
        基因组Biol。 2007; 8: R129
        • ashburner m.
        • 球C.A.
        • 布莱克J.A.
        • Botstein D.
        • 巴特勒H.
        • 樱桃准晚
        • 戴维斯A.P.
        • Dolinski K.
        • 德怀特S.S.
        • EPPIG J.T.
        • 哈里斯M.A.
        • 山D.P.
        • ISSEL-TARVER L.
        • Kasarskis A.
        • 刘易斯S.
        • Matese J.C.
        • Richardson J.E.
        • Ringwald M.
        • 鲁宾上午
        • Sherlock G.
        基因本体:生物学统一的工具。基因本体组织。
        自然遗传。 2000; 25: 25-29
        • 吴C.H.
        • APWEILER R.
        • Bairoch A.
        • Natale D.A.
        • Barker W.C.
        • Boeckmann B.
        • 菲罗斯
        • Gasteiger E.
        • 黄鹤
        • Lopez R.
        • Magrane M.
        • 马丁M.J.
        • Mazumder R.
        • O'Donovan C.
        • redaschi n。
        • Suzek B.
        通用蛋白质资源(UNIPROT):蛋白质信息的扩展宇宙。
        核酸RES。 2006; 34: D187-D191
        • Bult C.J.
        • EPPIG J.T.
        • Kadin J.A.
        • Richardson J.E.
        • 布莱克J.A.
        鼠标基因组数据库(MGD):小鼠生物学和模型系统。
        核酸RES。 2008; 36: D724-D728
        • 吴C.H.
        • Yeh L.S.
        • 黄鹤
        • Arminski L.
        • Castro-Alvear J.
        • 陈Y.
        • 胡Z.
        • KEKTESIESP.
        • Ledley R.S.
        • Suzek B.E.
        • vinayaka c.r.
        • 张继夫
        • Barker W.C.
        蛋白质信息资源。
        核酸RES。 2003; 31: 345-347
        • altschul s.f.
        • Madden T.L.
        • SC.haffer A.A.
        • 张继夫
        • 张Z.
        • 米勒W.
        • Lipman D.J.
        Papped Blast和Psi-Blast:新一代蛋白质数据库搜索程序。
        核酸RES。 1997; 25: 3389-3402
        • Camon E.
        • Magrane M.
        • 巴克尔D.
        • 李五。
        • 调光e.
        • Maslen J.
        • Binns D.
        • Harte N.
        • Lopez R.
        • APWEILER R.
        基因本体注释(GOA)数据库:使用基因本体分享UNIPROT中的知识。
        核酸RES。 2004; 32: D262-D266
        • Twigger S.N.
        • Shimoyama M.
        • 溴贝格斯。
        • KWITEK A.E.
        • 雅各布H.J.
        大鼠基因组数据库,更新2007年 - 将疾病的路径扩展到数据并再次返回。
        核酸RES。 2007; 35: D658-D662
        • 威尔逊r.j.
        • Goodman J.L.
        • 钢板v.b.
        Flybase:对查询工具的集成和改进。
        核酸RES。 2008; 36: D588-D593
        • 洪E.L.
        • Balakrishnan R.
        • 董Q.
        • Christie K.R.
        • 公园J.
        • Binkley G.
        • Costanzo M.C.
        • 德怀特S.S.
        • 恩格尔S.R.
        • fisk D.G.
        • Hirschman J.E.
        • Hitz B.C.
        • Krieger C.J.
        • Livstone M.S.
        • Miyasato S.R.
        • 纳什R.S.
        • ooughtred R.
        • Skrzypek M.S.
        • 翁科。
        • 黄娥。
        • 朱凯克。
        • Dolinski K.
        • Botstein D.
        • 樱桃准晚
        SGD的基因本体注释:新数据源和注释方法。
        核酸RES。 2008; 36: D577-D581
        • HAMOSH A.
        • 斯科特A.F.
        • Amberger J.s.
        • Bocchini C.A.
        • McKusick V.A.
        在线Mendelian遗传在人(OMIM),人类基因的知识库和遗传障碍。
        核酸RES。 2005; 33: D514-D517.
        • 惠勒D.L.
        • 巴雷特T.
        • Benson D.A.
        • 布莱恩特S.H.
        • Canese K.
        • chetvernin V.
        • 教堂D.M.
        • Dicuccio M.
        • Edgar R.
        • Federhen S.
        • geer l.y.
        • Kapustin Y.
        • Khovayko O.
        • 兰德斯曼D.
        • Lipman D.J.
        • Madden T.L.
        • maglott d.r.
        • Ostell J.
        • 米勒V.
        • Pruitt K.D.
        • 舒勒G.D.
        • Sequeira E.
        • 雪利酒S.T.
        • Sirotkin K.
        • Souvorov A.
        • Starchenko G.
        • Tatusov R.L.
        • tatusova t.a.
        • 瓦格纳L.
        • Yaschenko E.
        国家生物技术信息中心的数据库资源。
        核酸RES。 2007; 35: D5-D12
        • Kanehisa M.
        • goto s.
        • Hattori M.
        • Aoki-Kinoshita K.F.
        • ITOH M.
        • 川司玛斯。
        • Katayama T.
        • Araaki M.
        • Hirakawa M.
        从基因组学到化学基因组学:Kegg的新发展。
        核酸RES。 2006; 34: D354-D357
        • Stajich J.E.
        • 块D.
        • Boulez K.
        • Brenner S.E.
        • Chervitz S.A.
        • Dagdigian C.
        • uellen g.
        • 吉尔伯特J.G.
        • Korf I.
        • Lapp H.
        • Lehvaslaiho H.
        • Matsalla C.
        • Mungall C.J.
        • 奥斯本B.I.
        • pocock m.r.
        • SC.hatterp.
        • Senger M.
        • Stein L.D.
        • stupka E.
        • Wilkinson M.D.
        • Birney E.
        BioPerl Toolkit:Perl模块的生命科学。
        Genome Res。 2002; 12: 1611-1618
        • 丹尼斯Jr.,G.
        • 谢尔曼B.T.
        • Hosack D.A.
        • 杨杰。
        • 高W.
        • 车道H.C.
        • LEMPICKI R.A.
        David:用于注释,可视化和集成发现的数据库。
        基因组Biol。 2003; 4: P3
        • Alonso J.
        • Rodriguez J.M.
        • baena-lopez l.a.
        • Santaren J.F.
        果蝇细胞基体细胞蛋白组的表征。
        J.蛋白质组。 2005; 4: 1636-1645
        • 卡罗尔J.
        • altman m.c.
        • Fearnley I.M.
        • Walker J.E.
        蛋白离子串联质谱法鉴定膜蛋白。
        Proc。 Natl。阿卡。 SCI。美国。 2007; 104: 14330-14335
        • 达克鲁斯S.
        • Xenarios I.
        • Langridge J.
        • Vilbois F.
        • arone p.a.
        • 马蒂诺J.C.
        小鼠肝线粒体内膜的蛋白质组学分析。
        J. Biol。化学。 2003; 278: 41566-41571
        • Devreese B.
        • vanrobaeys f.
        • Smet J.
        • van beeumen J.
        • van coster r.
        二维蓝天然聚丙烯酰胺凝胶电泳分离的线粒体氧化磷酸化亚基的质谱鉴定。
        电泳。 2002; 23: 2525-2533
        • Forner F.
        • 福斯特L.J.
        • Campanaro S.
        • 瓦尔G.
        大鼠线粒体从肌肉,心脏和肝脏的定量蛋白质组学比较。
        摩尔。细胞。蛋白质组学。 2006; 5: 608-619
        • 福斯特L.J.
        • de hoog c.l.
        • 张Y.
        • 张Y.
        • 谢X.
        • Mootha V.k.
        通过蛋白质相关性分析的哺乳动物细胞器地图。
        细胞。 2006; 125: 187-199
        • Fountoulakis M.
        • 伯尔尼特P.
        • langen h.
        • Suter L.
        大鼠肝线粒体蛋白。
        电泳。 2002; 23: 311-328
        • Fountoulakis M.
        • SC.hlaeger E.J.
        神经母细胞瘤细胞系IMR-32的线粒体蛋白。
        电泳。 2003; 24: 260-275
        • Fukada K.
        • 张F.
        • Vien A.
        • Cashman N.R.
        • 朱H.
        家族性肌营养侧面硬化剂细胞系模型的线粒体蛋白质组学分析。
        摩尔。细胞。蛋白质组学。 2004; 3: 1211-1223
        • Gaucher S.P.
        • 泰勒S.W.
        • Fahy E.
        • 张B.
        • 警告D.E.
        • Ghosh S.S.
        • 吉布森B.W.
        使用多维液相色谱法与串联质谱法一起扩展人心脏线粒体蛋白质组的覆盖率。
        J.蛋白质组。 2004; 3: 495-505
        • 江X.S.
        • 戴J.
        • 盛Q.H.
        • 张L.
        • 夏Q.c.
        • 吴j.r.
        • 曾R.
        亚细胞蛋白质组学研究的比较蛋白质组学策略:ICAT方法与生物信息学预测相结合,以确定大鼠肝线粒体蛋白和过氧化氢酶线粒体定位的指示。
        摩尔。细胞。蛋白质组学。 2005; 4: 12-34
        • kislinger t.
        • Cox B.
        • 坎南A.
        • Chung C.
        • 胡诗
        • Ignatchenko A.
        • 斯科特M.S.
        • Gramolini a.o.
        • 莫里斯Q.
        • Hallett M.T.
        • rossant J.
        • 休斯。
        • 弗雷B.
        • Emili A.
        小鼠器官和细胞器蛋白表达的全局调查:组合蛋白质组学和转录组分析。
        细胞。 2006; 125: 173-186
        • Lescuyer P.
        • Strub J.M.
        • Luche S.
        • Diemer H.
        • 马丁内斯普
        • 范杜塞尔A.
        • Lunardi J.
        • rabilloud t.
        参考人体线粒体蛋白质组定义的进展。
        蛋白质组学。 2003; 3: 157-167
        • 麦当劳T.
        • 盛S.
        • 斯坦利B.
        • 陈德。
        • ko Y.
        • COLE R.N.
        • Pedersen P.
        • 范艾克J.E.
        使用蛋白质分离技术扩展内部线粒体的亚颗粒:单向和二维液相色谱和二维凝胶电泳。
        摩尔。细胞。蛋白质组学。 2006; 5: 2392-2411
        • ohlmeier s.
        • Kastaniotis A.J.
        • HILTUNEN J.K.
        • Bergmann U.
        酵母线粒体蛋白质组,发酵和呼吸生长研究。
        J. Biol。化学。 2004; 279: 3956-3979
        • Pflieger D.
        • Le Caer J.P.
        • lemaire c.
        • 伯纳德B.A.
        • Dujardin G.
        • rossier J.
        通过LC-MS / MS进行系统鉴定线粒体蛋白。
        肛门。化学。 2002; 74: 2400-2406
        • Prokisch H.
        • SC.harfe C.
        • 营地II,D.G.
        • 小W.
        • 大卫兰。
        • 和reoli c.
        • Monroe M.E.
        • 摩尔r.j.
        • 格里尼科米。
        • 科泽尼C.
        • 赫克森k.k.
        • 莫斯塔赫苗
        • Zischka H.
        • 赫尔曼Z.S.
        • 戴维斯R.W.
        • Meitinger T.
        • Oefner P.J.
        • 史密斯r.d.
        • Steinmetz L.M.
        酵母中线粒体蛋白质组的整合分析。
        Plos Biol。 2004; 2: e160
        • rabilloud t.
        • Kieffer S.
        • Procaccio V.
        • Louwagie M.
        • Courchesne P.L.
        • 帕特森S.D.
        • 马丁内斯普
        • 加入J.
        • Lunardi J.
        人胎盘线粒体和蛋白质鉴定的二维电泳和质谱:朝向人体线粒体蛋白质组。
        电泳。 1998; 19: 1006-1014
        • 驯鹿J.
        • Zahedi R.P.
        • Pfanner N.
        • Meisinger C.
        • 镰刀A.
        朝向完全酵母线粒体蛋白质组:线粒体蛋白质组学的多维分离技术。
        J.蛋白质组。 2006; 5: 1543-1554
        • Rezaul k.
        • 吴L.
        • Mayya V.
        • Hwang S.I.
        • 手。
        从人T白血病细胞中的线粒体蛋白质组进行系统特征。
        摩尔。细胞。蛋白质组学。 2005; 4: 169-181
        • Ruiz-Romero C.
        • Lopez-Armada M.J.
        • Blanco F.J.
        人普通关节软骨细胞的线粒体蛋白质组学特征。
        骨关节炎软骨。 2006; 14: 507-518
        • SC.heffler N.K.
        • 米勒S.W.
        • 卡罗尔A.K.
        • 安德森C.
        • 戴维斯拉。
        • Ghosh S.S.
        • 吉布森B.W.
        SH-SY5Y神经母细胞瘤细胞系线粒体蛋白的二维电泳和质谱鉴定。
        线粒体。 2001; 1: 161-179
        • 镰刀A.
        • 驯鹿J.
        • 瓦格纳Y.
        • joppich c.
        • Zahedi R.
        • Meyer H.E.
        • SC.honfisch B.
        • Perschil I.
        • Chacinska A.
        • GUIARD B.
        • 击败P.
        • Pfanner N.
        • Meisinger C.
        蛋白质组 酿酒酵母酿酒酵母 mitochondria.
        Proc。 Natl。阿卡。 SCI。美国。 2003; 100: 13207-13212
        • 泰勒S.W.
        • Fahy E.
        • 张B.
        • 格伦地下
        • 警告D.E.
        • Wiley S.
        • 墨菲A.N.
        • Gaucher S.P.
        • Capaldi R.A.
        • 吉布森B.W.
        • Ghosh S.S.
        人体心脏线粒体蛋白质组的表征。
        NAT。 Biotechnol。 2003; 21: 281-286
        • 谢J.
        • TechRitz S.
        • Haebel S.
        • 喇叭A.
        • 奈茨尔H.
        • Klose J.
        • 舒梅克米
        来自永生淋巴细胞系中的人体线粒体蛋白的二维电泳图:患者测定线粒体障碍的先决条件。
        蛋白质组学。 2005; 5: 2981-2999
        • Zahedi R.P.
        • 镰刀A.
        • Boehm上午
        • Winkler C.
        • Zufall N.
        • SC.honfisch B.
        • GUIARD B.
        • Pfanner N.
        • Meisinger C.
        酵母线粒体外膜的蛋白质组学分析显示出预蛋白质的亚类的积累。
        摩尔。 BIOL。细胞。 2006; 17: 1436-1450
        • 嗯w.k.
        • Falvo J.v.
        • Gerke L.C.
        • 卡罗尔A.S.
        • 豪森·克林。
        • Weissman J.s.
        • o'shea e.k.
        萌芽酵母蛋白质定位的全局分析。
        自然。 2003; 425: 686-691
        • Kumar A.
        • agarwal s.
        • 嘿曼J.A.
        • 马德森S.
        • Heidtman M.
        • Piccirillo S.
        • umansky l.
        • 绘图A.
        • Jansen R.
        • 刘Y.
        • 张克夫。
        • 米勒P.
        • Gerstein M.
        • 罗德尔G.S.
        • 斯奈德米
        酵母蛋白质组的亚细胞定位。
        基因开发。 2002; 16: 707-719
        • ozawa t.
        • Sako Y.
        • 佐藤M.
        • Kitamura T.
        • Umezawa Y.
        鉴定线粒体蛋白的遗传方法。
        NAT。 Biotechnol。 2003; 21: 287-293
        • 卡尔沃S.
        • jain m.
        • 谢X.
        • sheth s.a.
        • 昌B.
        • Goldberger O.A.
        • Spinazzola A.
        • Zeviani M.
        • carr s.a.
        • Mootha V.k.
        通过整合基因组学系统鉴定人体线粒体疾病基因。
        NAT。遗传。 2006; 38: 576-582
        • Mootha V.k.
        • Bunkenborg J.
        • 奥尔森J.V.
        • Hjerrild M.
        • wisniewski J.R.
        • 斯赫尔e.
        • Bolouri M.S.
        • 雷H.N.
        • Sihag S.
        • Kamal M.
        • 帕特森N.
        • 着陆器E.S.
        小鼠线粒体中蛋白质组成,组织多样性和基因调控的综合分析。
        细胞。 2003; 115: 629-640
        • Palmieri F.
        线粒体转运仪系列(SLC25):生理和病理学影响。
        pfluegers拱门。欧元。 J. physiol。 2004; 447: 689-709
        • ren s.
        • Hylemon P.
        • 张Z.P.
        • Rodriguez-Agudo D.
        • Marques D.
        • 李X.
        • 周H.
        • GIL G.
        • 熊熊队
        鉴定肝细胞核和线粒体中的新型磺化的苏克斯醇,5胆甾烯-3β,25-二醇3-磺酸盐。
        J. Lipid Res。 2006; 47: 1081-1090
        • Regev-Rudzki N.
        • 松树O.
        黯然失色分布:蛋白质双重靶向的现象及其意义。
        生物。 2007; 29: 772-782
        • Giege P.
        • Heazlewood J.L.
        • Roessner-Tunali U.
        • Millar A.H.
        • Fernie A.R.
        • Leaver C.J.
        • SweetLove L.J.
        糖醇分解的酶在拟南芥细胞中的线粒体有效。
        植物细胞。 2003; 15: 2140-2151
        • 郑温
        • 浸出。
        • Hardwick J.m.
        酵母和哺乳动物细胞的线粒体死亡途径。
        Biochim。 Biophys。 acta。 2008; 1783: 1272-1279
        • vo t.d.
        • Palsson B.O.
        建立电力房屋:通过蛋白质组学和系统生物学进行线粒体研究的最新进展。
        是。 J. physiol。 2007; 292: C164-C177
        • 和reoli c.
        • Prokisch H.
        • Hortnagel K.
        • 穆勒J.C.
        • Munsterkotter M.
        • SC.harfe C.
        • Meitinger T.
        Mitop2,酵母和人的线粒体蛋白质集成数据库。
        核酸RES。 2004; 32: D459-D462
        • BASU S.
        • 云彩E.
        • 周C.
        • bogenhagen d.f.
        MIGENES:使用基因本体注释策划的线粒体蛋白的可搜索结构数据库。
        生物信息学。 2006; 22: 485-492
        • Catalano D.
        • licciulli f.
        • 图里A.
        • 格里罗G.
        • Saccone C.
        • D'Elia D.
        MORETES:核编码线粒体基因的资源及其在美唑群中的产品。
        BMC生物信息学。 2006; 7: 36
        • COTTER D.
        • Guda P.
        • Fahy E.
        • Subramaniam S.
        型蛋白酶组:线粒体蛋白序列数据库和注释系统。
        核酸RES。 2004; 32: D463-D467
        • Heazlewood J.L.
        • Millar A.H.
        AMPDB:拟南芥线粒体蛋白质数据库。
        核酸RES。 2005; 33: D605-D610
        • KRUFT V.
        • Eubel H.
        • Jansch L.
        • Werhahn W.
        • 布劳恩H.P.
        蛋白质组学方法鉴定拟南芥新型线粒体蛋白。
        植物理性。 2001; 127: 1694-1710