广告

GPROX,一种用户友好的生物信息学分析平台和定量蛋白质组学数据的可视化*

  • Kristoffer t.g. Rigbolt.
    隶属关系
    实验生物信息学中心(CEBI),生物化学系和分子生物学系,南丹麦大学,坎普斯州55,DK-5230欧语M,丹麦
    搜索本作者的文章
  • Jens T.Vanselow.
    隶属关系
    实验生物信息学中心(CEBI),生物化学系和分子生物学系,南丹麦大学,坎普斯州55,DK-5230欧语M,丹麦
    搜索本作者的文章
  • Blagoy Blagoev.
    一致
    应解决谁的通信:实验性生物信息学中心(CEBI),生物化学系,南丹麦大学生物化学和分子生物学系,Campusvej 55,DK-5230 Odense M,丹麦。电话。:+ +45 6550 2366;传真:+45 6593 3018
    隶属关系
    实验生物信息学中心(CEBI),生物化学系和分子生物学系,南丹麦大学,坎普斯州55,DK-5230欧语M,丹麦
    搜索本作者的文章
  • 作者脚注
    *该工作得到了丹麦自然科学研究委员会和欧盟第7架构计划(Health-F4-2008-201648 /潜在客户)的伦贝克基金会(B. B. - B. - Junior Group Server奖学金)的支持。 J.T. V.由长期奖学金(ALTF 1267-2009)得到支持。
    本文包含补充方法,参考文献和图3和图2. S1到S7。
    1所用的缩写是:GPROXGRAGHICAL蛋白质组学数据探索性促进生长因子生长因子生长因子胰腺炎肝细胞生长因子根茎根氏族和基因组循环系统的疾病途径影响分析。
      最近的技术进步使得可以在单一蛋白质组学实验中识别和量化数千种蛋白质。由于这些发展,数据分析已成为蛋白质组学实验的瓶颈。为了向蛋白质组学群落提供用户友好的平台进行综合分析,检查和可视化的定量蛋白质组学数据,我们开发了图形蛋白质组学数据探险者(Gprox)
      使用的缩写是:
      吉隆坡
      图形蛋白质组学数据资源管理器
      egf.
      表皮生长因子
      基因本体论
      HGF.
      肝细胞生长因子
      ke
      Kyoto基因和基因组的百科全书
      OS.
      操作系统
      斯维亚
      信号通路影响分析。
      。该程序不需要特殊的生物信息学培训,因为GPROX的所有功能都可以在其图形用户友好的界面内访问,这对大多数用户都直观。基本功能有助于简单的管理和组织大数据集和复杂的实验设置以及定量数据的检查和图形绘图。这些是通过易于提供的高级分析选项(如数据库查询,基于丰度比的聚类)补充,具有富集测试 例如 GO条款和途径分析工具。许多绘图可视化定量蛋白质组学数据的绘图选项可用,GPROX中的大多数分析函数在载体和位图格式中创建可定制的高质量图形显示。通用导入要求允许在程序中分析的基本上所有的质谱平台,定量策略和软件。 GPROX代表了一种强大的蛋白质组学数据分析方法,为蛋白质组学实验者提供了具有用于定量蛋白质组学数据的生物信息学分析的工具箱。该程序被释放为开源,可以从项目网页自由下载 http://gprox.sourceforge.net.
      在过去十年中,通过质谱仪,分馏技术,定量策略和数据分析软件的恒定发展,已经促进了蛋白质谱的鉴定和定量。使用最先进的技术可以量化数千次蛋白质(
      • Rigbolt K.T.
      • prokhorova t.a.
      • Akimov V.
      • Henningsen J.
      • 约翰森P.T.
      • Kratchmarova I.
      • 卡西姆M.
      • 奥尔森J.V.
      • Blagoev B.
      人胚胎干细胞分化的蛋白质组和磷酸磷蛋白酶的系统宽的时间表征。
      ,
      • 邓布尔J.
      • Kratchmarova I.
      • Blagoev B.
      受体酪氨酸激酶信号传导:来自定量蛋白质组学的视图。
      ,
      • Swaney D.L.
      • 温格C.D.
      • Coon J.J.
      使用多种蛋白酶对大规模质谱的蛋白质组学的价值。
      ,
      • 彭J.
      • 施瓦茨D.
      • eliasj.e.
      • Thororen C.C.
      • 诚变。
      • Marsischky G.
      • Roelofs J.
      • 芬利D.
      • Gygi S.P.
      一种了解蛋白质泛素的蛋白质组学方法。
      ,
      • Usaite R.
      • Wohlschlegel J.
      • venable J.D.
      • 公园S.K.
      • 尼尔森J.
      • 奥尔森L.
      • YALES III,J.R.
      野生型和葡萄糖抑制酿酒酵母菌菌株产生的全局酵母定量蛋白质组数据的特征:两种定量方法的比较。
      ,
      • Aye T.T.
      • Spolten A.
      • taouatas n。
      • Varro A.
      • van veen t.a.
      • vos m.a.
      • Heck A.J.
      人体中的蛋白质组含蛋白质浓度。
      ,
      • prokhorova t.a.
      • Rigbolt K.T.
      • 约翰森P.T.
      • Henningsen J.
      • Kratchmarova I.
      • 卡西姆M.
      • Blagoev B.
      细胞培养(硅酸)中氨基酸的稳定同位素标记,以及自我更新和分化人胚胎干细胞的膜蛋白质蛋白质的定量比较。
      ,
      • 克里斯滕森A.R.
      • Schandorff S.
      • Høyer-hansen M.
      • Nielsen M.O.
      • jäätteläm。
      • 邓杰尔J.
      • 安德森J.S.
      饥饿诱导的自噬期间有序细胞器降解。
      ,
      • iwasaki m.
      • Miwa S.
      • Ikegami T.
      • Tomita M.
      • 塔卡卡N.
      • Ishihama Y.
      与串联质谱偶联的一维毛细管液相色谱分离揭示了在微阵列规模上的大肠杆菌蛋白质组。
      ,
      • Rigbolt K.T.
      • Blagoev B.
      硅胶蛋白质全组定量。
      ),甚至在单一蛋白质组学实验中完全完全蛋白质素(
      • De Godoy L.M.
      • 奥尔森J.V.
      • Cox J.
      • Nielsen M.L.
      • 哈伯纳N.C.
      • Fröhlichf.
      • Walther T.C.
      综合质谱型蛋白质组定量单倍体与二倍体酵母。
      ,
      • Picotti P.
      • Bodenmiller B.
      • 穆勒L.N.
      • Domon B.
      • Aeberberold R.
      靶影科酿酒酵母的全动态范围蛋白质组分析。
      )。已经开发出用于蛋白质识别和定量的强大软件解决方案,允许用户处理存储在原始质谱数据中的信息。这些软件解决方案是由科学界开发的(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ,
      • Matthiesen R.
      • Trelle M.B.
      • Højrupp.
      • Bunkenborg J.
      • Jensen O.N.
      VEMS 3.0:基于串联质谱法的算法和计算工具基于蛋白质的翻译后修饰的鉴定。
      ,
      • Mortensen P.
      • gouw J.W.
      • 奥尔森J.V.
      • ong s.e.
      • Rigbolt K.T.
      • Bunkenborg J.
      • Cox J.
      • 福斯特L.J.
      • Heck A.J.
      • Blagoev B.
      • 安德森J.S.
      MSQUANT,一种基于质谱的定量蛋白质组学的开源平台。
      ,
      • 德意曲e.w.
      • 门多萨L.
      • Shteynberg D.
      • Farrah T.
      • 林H.
      • 塔斯曼N.
      • 太阳Z.
      • Nilsson E.
      • 普拉特B.
      • Prazen B.
      • ENG J.K.
      • 马丁D.B.
      • nesvizhskii a.i.
      • Aeberberold R.
      Trans-Qualeomic管道的导游。
      )通过仪器供应商,通过峰(生物信息学溶液)和蛋白质组发现者(Thermo Sciencific)。面对这些领域的这些进步,我们发现数据分析目前是蛋白质组学实验的瓶颈。熟悉几种先进的生物信息工具,而且优选地编程技能,现在是对大型蛋白质组学数据集的全面分析至关重要(
      • Kumar C.
      基于质谱的蛋白质组学数据集的生物信息分析。
      )。到目前为止,通常需要没有熟悉计算机程序编程的实验者来使用不是的电子表格应用程序 本身 因此,用于分析生物数据,因此有限使用,用于与现代蛋白质组学实验产生的大量数据合作。或者,许多用于分析的软件解决方案“ omics“ 已经开发了数据,值得注意的例子是多因素查看器(
      • 赛德A.I.
      • Bhagabati N.K.
      • 胸罩J.C.
      • 梁W.
      • Sharov V.
      • Howe E.A.
      • 李杰。
      • Thiagarajan M.
      • 白色J.A.
      • Quackenbush J.
      TM4微阵列软件套件。
      )为聚类和统计分析和GSEA-P提供可用算法(
      • Subramanian A.
      • Kuehn H.
      • 古怪J.
      • Tamayo P.
      • Mesirov J.P.
      GSEA-P:基因型富集分析的桌面应用。
      ),Fatigo +(
      • al-shahrour f.
      • Minguez P.
      • TárragaJ.
      • 麦地那我
      • Alloza E.
      • Montaner D.
      • Dopazo J.
      Fatigo +:基因组数据的功能性分析工具。用微阵列实验集成功能注释,调节基序和交互数据。
      )和大卫(
      • 丹尼斯Jr.,G.
      • 谢尔曼B.T.
      • Hosack D.A.
      • 杨杰。
      • 高W.
      • 车道H.C.
      • LEMPICKI R.A.
      David:用于注释,可视化和集成发现的数据库。
      )专注于对特别基因本体学的注释和浓缩分析(GO)的资源(GO)(
      • ashburner m.
      • 球C.A.
      • 布莱克J.A.
      • Botstein D.
      • 巴特勒H.
      • 樱桃准晚
      • 戴维斯A.P.
      • Dolinski K.
      • 德怀特S.S.
      • EPPIG J.T.
      • 哈里斯M.A.
      • 山D.P.
      • ISSEL-TARVER L.
      • Kasarskis A.
      • 刘易斯S.
      • Matese J.C.
      • Richardson J.E.
      • Ringwald M.
      • 鲁宾上午
      • Sherlock G.
      基因本体:生物学统一的工具。基因本体组织。
      )条款。 Qupe等工具(
      • Albaum S.P.
      • NeuWeger H.
      • Fränzelb。
      • Lange S.
      • 佩塞斯D.
      • Trötschelc.
      • 擦拭。
      • Kalinowski J.
      • Nattkemper T.W.
      • 韦斯曼A.
      QUPE - 富有的互联网应用程序在分析基于质谱的定量蛋白质组学实验的分析中迈出了一步。
      ),丹特(
      • Polpitiya A.D.
      • 钱W.J.
      • jaitly n ..
      • petyuk v.a.
      • Adkins J.N.
      • 营2nd,D.G.
      • 安德森G.A.
      • 史密斯r.d.
      DANTE:用于测量 - 用于对 - 中型数据的定量分析的统计工具。
      )和统治(
      • van Breukelen B.
      • van denorn h.w.
      • 博米姆。
      • Heck A.J.
      统治:用于改善定量质谱的定量后分析工具箱。
      )提供一系列先进的统计程序,用于进行蛋白质丰富比进行后定量分析。最后,cytoscape(
      • Shannon P.
      • Markiel A.
      • ozier O.
      • Baliga N.S.
      • 王J.T.
      • Ramage D.
      • amin n.
      • Schwikowski B.
      • IDEKER T.
      Cytoscape:用于生物分子交互网络的集成模型的软件环境。
      )开发团队对尤其是蛋白质 - 蛋白质相互作用数据和蛋白质网络可视化进行了显着贡献。
      虽然这些和其他独立的工具对其专业目的非常有用,但它们不支持复杂的实验设置和数据输入和输出格式的不同要求使互操作性复杂化并阻碍若干分析步骤的集成。允许实验者将若干单独的工具组合,例如生物信息管理资源管理器等程序(
      • 沙阿尔。
      • Singhal M.
      • Klicker K.R.
      • Stephan e.g.
      • Wiley H.S.
      • 水壶
      为系统生物学启用高吞吐量数据管理:生物信息学资源管理器。
      )和预先填写(
      • Gehlenborg N.
      • 燕W.
      • 李我。
      • yoo h.
      • 奈塞特克。
      • Hwang D.
      • Aeberberold R.
      • 引擎盖L.
      Prequips-An Inteniby软件平台,用于集成,可视化和分析LC-MS / MS蛋白质组学数据。
      ),两者都使用程序gaggle(
      • 香农P.T.
      • reiss d.j.
      • 邦诺R.
      • Baliga N.S.
      Gaggle:用于集成生物信息学软件和数据源的开源软件系统。
      )对于数据传输,为数据分析提供多功能平台。基于Gaggle的集成解决方案是强大的,但特别是分歧的接口用户面临着不同的界面可能是对非专科学家有挑战性的。最后,有几种商业解决方案可用, 例如 熟智能途径分析(Ingenuity Systems)和Proteincenter(Thermo Scientific / Proxeon)。然而,与这些计划相关的高费用和商业软件解决方案的内常性性质可能会对这些应用构成重要障碍。
      这些问题导致我们开发了图形蛋白质组学数据资源探险者(GPROX),一种用于全面和集成的生物信息学分析和大型蛋白质组学数据集的可视化的软件包。 GPROX的基本概念是提供类似于常见电子表格应用程序的数据浏览环境,并且从该界面提供可用的功能,用于分析蛋白质组学数据。因此,Gprox的主要目标是允许实验者没有生物信息学的专业技能,以分析他们的数据并产生用于科学出版物或演示的图形表示。 GPROX专注于在单个平台内提供各种有用的分析功能,特别是在用户友好的界面和高质量的图形物体的生产上。该软件以及完整的源代码可自由地下载 http://gprox.sourceforge.net.

      实验步骤

       GPROX开发环境

      Gprox的整体结构和背景示意性地示出 Fig. 1。主程序和用户界面在Microsoft .NET环境下以Visual Basic编程语言编写。面向对象的架构和.NET环境中可用的大量图形对象允许创建用户友好的图形接口,类似于公共的Microsoft Windows应用程序。此外,在.NET中实现的高级功能的大型存储库使其成为接口数据和与操作系统(OS)通信的有效平台。 .NET环境的一个缺点是它需要Microsoft Windows操作系统。但由于大多数情况下,如果不是全部,大众光谱仪供应商专有软件仅适用于Windows,大多数蛋白质组学实验室都需要Windows系统进行数据生成和分析。
      图缩略图GR1.
      Fig. 1GPROX结构概述。 GPROX接受作为输入包含作为最小蛋白质访问密钥和定量信息的标签或字符分隔文件。初始分析会话设置是通过一个简单的输入向导完成的,也支持定义实验设计。用户界面提供对所有功能的访问,并使用R环境进行高级分析和图形生成。与分析会话关联的所有文件都在本地保存,从会话文件中可以打开存储的会话以进行持续分析。
      GPROX中的大多数功能用于数据处理和生成图形对象的脚本被实现为为R编写的脚本,用于统计计算和图形的免费软件环境(
      • R开发核心团队
      R:统计计算的语言和环境。
      ), 看 补充图S1A。近年来,近年来获得了越来越普及的加工 omics. 数据,特别是通过生物导体联盟可获得的快速养育库(
      • 绅士r.c.。
      • Carey V.J.
      • 贝茨下午
      • Bolstad B.
      • 偷偷摸摸的M.
      • Dudoit S.
      • 埃利斯B.
      • Gautier L.
      • GE Y.
      • 绅士J.
      • 霍希克斯。
      • Hothorn T.
      • Huber W.
      • IACUS S.
      • Irtizarry R.
      • 休息
      • 李C.
      • Maechler M.
      • rossini a.j.
      • Sawitzki G.
      • 史密斯C.
      • Smyth G.
      • Tierney L.
      • 杨杰。
      • 张继夫
      Biocometion:用于计算生物学和生物信息学的开放软件开发。
      )。此外,R非常适用于处理定量蛋白质组学实验产生的大量数值数据,并包含一系列良好的开发功能,用于以许多格式产生简单的和高级图形输出。基于.NET基于用户界面和R之间的接口是通过用作外部R实例的输入的选项卡分隔文件来实现。完成R-Task后,选项卡分隔的输出文件返回到主程序,图形对象在本地保存并在主程序中显示。在正常操作期间,用户不会面对R任务,该r任务被执行为背景中的外部进程。对于调试目的尤其是r-process的标准和错误输出送回主程序并在本地保存。在Gprox中实现的所有R功能都在记录的R包中收集( Gproxutils., GPROXPLOT. , 和 甘氨酸分析)与程序一起分发。这些封装及其包括的功能也可以直接使用或作为熟悉R的实验者的灵感来源来修改或扩展目前在GPROX中实施的功能(见 补充方法和补充图。S1 )。

       要求,安装和支持

      GPROX安装程序可以自由下载,没有项目网站的注册(http://gprox.sourceforge.net)作为自安装可执行文件。该程序需要具有当代Windows操作系统的标准桌面计算机(我们已在安装的Windows XP和Windows7 32/64位的英文版本中测试了程序,版本3.5或更高版本。由于该程序批判性地依赖于R和多个加载库的工作安装,因此也必须在用户的计算机上安装这些组件。在GPROX的第一个启动期间,提示用户下载并安装这些组件。要帮助用户使用此任务,我们已包含自动安装程序。此外,在GPROX帮助中给出了有关手动安装R和附加库的详细信息。此外,在与程序一起分布的教程中详细描述了整个安装过程。有关进一步支持,我们创建了一个GPROX帮助Google集团,用户可以发布疑问和评论。可以从项目网站或直接访问该组 http://groups.google.com/group/gprox.

       支持的数据,导入和输出

      GPROX所需的输入格式是标签或字符分隔文件,其中第一行中的列标题和单独行中的每个蛋白质条目。输入文件中的每个蛋白质存在的最小信息是数据库登录密钥和定量信息。如果需要,还可以从上述数据处理可获得的任何其他信息,也可以从此输入数据文件导入用于Gprox内的后续应用程序。此附加信息可能是 例如 肽信息或数据库注释,如基因本体(
      • ashburner m.
      • 球C.A.
      • 布莱克J.A.
      • Botstein D.
      • 巴特勒H.
      • 樱桃准晚
      • 戴维斯A.P.
      • Dolinski K.
      • 德怀特S.S.
      • EPPIG J.T.
      • 哈里斯M.A.
      • 山D.P.
      • ISSEL-TARVER L.
      • Kasarskis A.
      • 刘易斯S.
      • Matese J.C.
      • Richardson J.E.
      • Ringwald M.
      • 鲁宾上午
      • Sherlock G.
      基因本体:生物学统一的工具。基因本体组织。
      )或pfam(
      • 芬恩r.d.
      • 朦胧J.
      • 泰特J.
      • Coggill P.
      • 哈吉尔A.
      • Pollington J.E.
      • Gavin O.L.
      • gunasekaran p.
      • CERIC G.
      • Forslund K.
      • HOLM L.
      • Sonnhammer E.L.
      • 艾迪S.R.
      • Bateman A.
      PFAM蛋白质家族数据库。
      )。由于这种通用输入格式,Gprox的应用不限于特定的质谱仪仪表平台,定量技术或数据处理和定量软件。
      将数据导入GPROX通过输入向导完成(参见 补充图。S2A)要求用户选择输入文件,指定包含登录键和定量比率的列,最后,如果需要,请指定实验设置。要指定实验设置,可以分配包含定量数据的数据列以单独的实验。实验设置的布置有助于分析更复杂的定量蛋白质组学实验,其中 例如 比较不同处理后的时间调控模式。在这种情况下,单个实验将包括来自不同时间点的定量数据,用于一个治疗条件。然后可以单独或一起分析多个独立实验并在Gprox内进行比较。
      在创建此类会话时,重新创建先前会话所需的所有信息都会在会话文件夹中保存为平面文件(.gpx文件),用户可以从中重新加载会话以继续分析。
      GPROX采用数据管理设置,其中输入数据文件被视为数据库,其中仅指定的列仅放置在仅包含用于数据分析的相关信息的会话数据表中。输入表中的其他数据列可以根据分析期间的需求导入并将其附加到会话表。由于仅在活动会话表上执行所有数据处理,因此提高了处理效率,另外,原始输入文件保持不变。
      我们试图将GPROX产生的图形尽可能接近最终状态,但用户可能希望在外部图形编辑器中进行微调或布局它们的数据,例如 例如 在使用它们之前,Adobe Illustrator或Corel Draw在演示文稿或出版物中。为此,多种输出格式,包括向量(EPS,PDF)和位图(PNG,BMP,JPG,TIF)图形,使用户能够在外部应用程序中打开和自由地修改数字。

       Gprox用户界面

      GPROX的主要用户界面在外观中类似于电子表格程序的类似 例如 打开Office Calc或Microsoft Excel。程序中的所有操作可通过功能区控制,菜单和专用对话框访问(Fig. 2)。主要用户环境是包含最多五个窗口的多文档接口(补充图。S2B)。会话信息窗口包含有关当前会话的所有信息,包括所有生成的表格和图形对象的列表以及指定的实验设置的概述。 “数据表”窗口包含会话表作为选项卡页的集合。启动新会话时,创建单个会话表,但在分析会话过程中,用户可以将此表的子集移动到新会话表。数据分析步骤仅在活动选项卡页面上执行,允许用户处理和分析完整数据收集的子集。
      图缩略图GR2.
      Fig. 2Gprox用户界面。 Gprox显示的多个文档用户界面,在专用窗口中,执行分析的数据表,分析结果和分析会话中产生的所有图。程序内的所有功能都可以通过功能区控制访问(另请参阅 )。
      在分析会话过程中,可以创建大集合图形对象,其中显示在专用图形窗口中。要浏览图形对象,请将图形窗口包含一个资源管理器面板,以选择可显示的项目和重命名,删除或移动文件。从分析步骤的所有表格输出都包含在“分析表”窗口中作为选项卡页集,类似于数据表窗口。最后,输入表可以显示在GPROX内,这是主要用于参考目的,因为输入表仅用作数据库而不改变其内容。
      我们努力使软件尽可能直观和用户友好,但尤其是更高级的分析步骤允许更改多个相关参数。为了帮助用户选择这些参数并在程序的基本使用中提供支持,在各个对话框中编译的HTML帮助(CHM)功能和工具提示帮助框辅助使用该软件。此外,描述GPROX中的示例工作流程的逐步教程与程序一起分发,以帮助用户开始使用该程序。

       数据处理算法

      关于处理算法和数据分析策略的详细信息在补充方法中描述并概述 补充图S4到S6.

      结果

      为了证明GPROX的特征,先前公布的定量蛋白质组学数据集比较了表皮生长因子(EGF)或肝细胞生长因子(HGF)刺激后的磷酪氨酸依赖信号传导5和30分钟(
      • 哈蒙德D.E.
      • 海德R.
      • Kratchmarova I.
      • Beynon R.J.
      • Blagoev B.
      • Clague M.J.
      HGF. 和EGF依赖性磷酸赖氨酸信号网络的定量分析。
      )被使用(实验设置总结在 补充图S3)。为了分析这些数据集,将数据导入到GPROX,将IPI附加密钥指定为蛋白质标识符,并且在EGF或HGF刺激后含有定量比的相应列被分配给两个单独的实验。说明了以下部分中概述的分析步骤的概述 Fig. 3A.
      图缩略图GR3.
      Fig. 3在Gprox中分析步骤,蛋白质动力学和数据库信息。 A概述,用于举例说明GPROX应用于分析定量蛋白质组学数据的分析步骤。 B,可以容易地要求一项或多种蛋白质和实验的比率的曲线征集蛋白质调节的快速概述。在这种情况下,每个面板包括来自不同实验的各个面板的调节曲线。 C,可以容易地请求IPI和UNIPROT数据库表,以便选择蛋白质立即为用户提供存储在这些数据库中的可用信息。此外,这些数据库条目链接到其他主要资源或更高级别的注释。

       数据组织和检查

      GPROX的一个主要目标是提供一种舒适的环境,用于以电子表格的方式浏览定量蛋白质组学数据。基本功能,如排序,查找,删除或插入行和列以及算术运算 例如 整体列支持组织和实验数据的修改,求和或平均。在这方面,数据子集还可以分配给新的数据表,提供基于的数据分组 例如 功能类别或规定。此外,在分析会话过程中可以轻松修改在数据导入期间定义的实验设置, 例如 比较实验性质或考虑GPROX内的数据处理。
      强度比率形式的定量数据通常需要转换到其他尺度。利用GPROX对数,可以容易地执行平方根和逆变换。从示例数据集反向命中(用于确定虚假发现速率(
      • Cox J.
      MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
      ,
      • eliasj.e.
      • Gygi S.P.
      目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
      ))和胰蛋白酶,牛血清白蛋白和角蛋白等常见的污染物鉴定被移动到单独的表中,并且剩余的蛋白质定量是转化的。
      GPROX中的一个强大功能是其在飞行的绘图功能,其中来自一个或多个蛋白质的定量数据可以显示为线条图(Fig. 3B)。这非常有用,因为它可以快速概述所选蛋白质的调节模式和治疗条件的差异。这里,如果选择了多于一种蛋白质并且定义了多于一个实验条件,可以用两种不同的方式绘制定量数据:(1)为每个选定的蛋白质产生一个图,包括所有实验条件或(2)一个为每个实验条件生成图,每个曲线包含来自所有选定蛋白的数据。为了举例说明我们展示的绘图功能 Fig. 3B 关键生长因子信号蛋白的调节。从这些绘图中,虽然受体蛋白EGFR和HGFR在刺激之间反对调节,但对于关键效应激酶ERK1 / 2,观察到非常相似的调节。
      通常还需要从给定蛋白质获得立即获得所有可用信息。因此,完整的国际蛋白质指数(
      • kersey p.j.
      • Duarte J.
      • 威廉姆斯A.
      • 卡拉维多奥鲁Y.
      • Birney E.
      • APWEILER R.
      国际蛋白质指数:蛋白质组学实验的集成数据库。
      )和Uniprot(
      • Uniprot财团
      2010年通用蛋白质资源(Uniprot)。
      )可以迅速显示与更多信息源链接的数据库表,以便兴趣的蛋白质(Fig. 3C )。

       数据分布的可视化

      为了评估定量数据的分布,Gprox提供了不同可视化的调色板。这些绘图可以高度自定义,以允许用户可视化其定量数据的键特征。为此目的,可以容易地生产直方图,盒绘图,散射图和密度图,以评估或比较蛋白质调节并评估复制实验的重复性(Fig. 4A to 4D)。例如,直方图 Fig. 4A 表明,尽管未调节大部分蛋白质,但与30分钟的延长刺激相比,定量比的分布在5分钟的时间点的较高值。在一个图中总结了完整的定量比集可以提供跨实验条件的蛋白质调节的全面概述(Fig. 4E)。最后,可以很容易地要求描述性统计数据,以进一步帮助获取数据概述。
      图缩略图GR4.
      Fig. 4GPROX中数据分布的可视化。 以直方图形式的蛋白质丰度比分布的图解概况(A),盒子图(B), 散点图 (C),密度散射图(D)和热带(E)。单独或组合,可视化提供数据累积属性的摘要,这是不可或缺的 例如 用于比较实验或评估复制实验的重复性。

       聚类分析

      调节模式最常反映蛋白质在相应的细胞途径中的明显累及,因此可以用于提示这些蛋白质的可能的功能作用。为了找到具有类似调节模式的内含物蛋白,无监督的聚类是一种流行和强大的方法。通过进行这种有用的生物信息运动,可以获得具有类似定量图案的可综合数量的蛋白质基团。基于模糊C均值算法的Gprox无监督聚类(
      • Futschik M.E.
      • 卡莱尔B.
      基因表达时间课程数据的噪声鲁棒软聚类。
      )已经实施(见 补充图S4 有关详细信息)。模糊C-Means群集非常适合于对定量蛋白质组学数据进行聚类,与相关的K-means聚类相比,将每个条目与给定的可能性,隶属值相关联。成员资格值用于评估给定的条目适合共识配置文件的程度,并允许根据其适合于集群共识配置文件的彩色编码集群图项。
      用户可以通过用户自定义群集分析 例如 群集数,算法迭代次数,颜色方案数量和调节阈值,标准化和图形属性的规范。为了举例说明群集模块的输出,我们将示例数据集进行到聚类,结果清楚地表明数据集中的蛋白质可以分成具有不同调节模式的组,对应于对生长因子刺激的不同响应(Fig. 5A)。例如,在簇5中发现了诸如受体的生长因子信号传导途径的早期组分,而在簇4和6中可以发现许多下游组分作为GTP酶和激酶。集群分析的额外值是它可以作为随后识别具有给定调节模式的特征的特征的基础,如下面的一部分中的例子。
      图缩略图GR5.
      Fig. 5GPROX中的聚类和富集分析。 A,通过模糊-c的毫无监督聚类来说明示例数据,揭示了不同的规则模式。 B,在每个簇中超出的去生物过程术语的浓缩分析(见图5A)。从这个分析中,很清楚,不同的规则模式概述(A)也对应于不同的细胞过程。

       批量数据库检索

      由科学界维持的许多数据库提供了有关蛋白质功能,结构,修饰,序列和遗传背景的大量信息,并且在分析蛋白质组学数据时具有巨大的价值。为了提取数据表中所有蛋白质的最新注释Gprox从IPI检索信息(
      • kersey p.j.
      • Duarte J.
      • 威廉姆斯A.
      • 卡拉维多奥鲁Y.
      • Birney E.
      • APWEILER R.
      国际蛋白质指数:蛋白质组学实验的集成数据库。
      ),Uniprot(
      • Uniprot财团
      2010年通用蛋白质资源(Uniprot)。
      )或Ensembl(
      • flicek p.
      • Amode M.R.
      • 巴克尔D.
      • 宝贝K.
      • 布伦特S.
      • 陈Y.
      • Clapham P.
      • 盖子G.
      • Fairley S.
      • Fitzgerald S.
      • 戈登L.
      • Hendrix M.
      • Hourlier T.
      • 约翰逊N.
      • KähäriA.
      • Keefe D.
      • 凯恩斯。
      • Kinsella R.
      • Kokocinski F.
      • kulesha e。
      • Larsson P.
      • 龙班I.
      • 迈凯轮W.
      • 过度泛民B.
      • Pritchard B.
      • Rat H.S.
      • 里奥斯D.
      • 里奇G.R.
      • ruffier m.
      • Schuster M.
      • 肉体D.
      • Spudich G.
      • 唐y.a.
      • Trevanion S.
      • Vandrovcova J.
      • Vilella A.J.
      • 白人s.
      • Wilder S.P.
      • ZADISSA A.
      • Zamora J.
      • Aken B.L.
      • Birney E.
      • Cunningham F.
      • 邓汉I.
      • 德国R.
      • Fernandez-Suarez X.M.
      • Herrero J.
      • 哈贝德T.J.
      • 帕克A.
      • Proctor G.
      • Vogel J.
      • Searle S.M.
      Ensembl 2011。
      )使用BioMart的数据库(
      • 杜林克斯。
      • 莫鲁y.
      • Kasprzyk A.
      • 戴维斯S.
      • de Moor B.
      • Brazma A.
      • Huber W.
      生物摩托和生物导体:生物数据库与微阵列数据分析之间的强大联系。
      )欧洲生物信息学院(EBI)提供的DBFETCH服务。以这种方式,可以在这些数据库中存储和定期更新的许多蛋白质注释并将其直接附加到数据表中。该信息可以帮助实验者获得蛋白质功能的概述,但还可以为蛋白质的功能分配或分析蛋白质组中的过度特征的分析提供基础。除了为用户提供从中选择要检索注释的数据库之外,还可以通过与输入键分开的附加密钥来提取数据库信息。如果多个键与蛋白质相关,则可以使用肽计数来过滤用于数据库查询的键。对于示例数据集,我们首先将IPI标识符转换为Uniprot登录密钥,并使用这些来检索Go生物过程注释(
      • ashburner m.
      • 球C.A.
      • 布莱克J.A.
      • Botstein D.
      • 巴特勒H.
      • 樱桃准晚
      • 戴维斯A.P.
      • Dolinski K.
      • 德怀特S.S.
      • EPPIG J.T.
      • 哈里斯M.A.
      • 山D.P.
      • ISSEL-TARVER L.
      • Kasarskis A.
      • 刘易斯S.
      • Matese J.C.
      • Richardson J.E.
      • Ringwald M.
      • 鲁宾上午
      • Sherlock G.
      基因本体:生物学统一的工具。基因本体组织。
      )来自Uniprot数据库。

       特征浓缩分析

      为了方法是否是特定特征,例如GO术语或结构域,对给定群体中的受调节蛋白或蛋白质进行描述,GPROX包含一个模块,可用于评估数据子集中的富集的富集(补充图S5)。该模块可用于测试数据表中存在的任何特征的富集。通过这种方式,模块基本上是通用的,就探索的特征而言,可以使用一系列统计测试来执行富集分析 p 值调整算法。 GO注释的分层结构可用于过滤最多描述的术语,其最能描述数据的属性。
      富集测试的输出是表格摘要以及分析的图形概述。表格输出提供有关事件的详细信息 p 富集注释的价值观。图形输出的类型取决于测试的执行方式。在最简单的情况下,测试是在调节蛋白质中普遍的特定特征,产生条形图,其总结了受调节和未调节的蛋白质内的富集特征的频率。替代方案,分析可以测试来自前一群集分析的特定集群中是否富集的特定特征在这种情况下,在这种情况下,在哪个情况下显示富集的集群各个特征注释。对于示例数据设置,GO生物过程注释用于概述其在每个集群中的发生。从中观察到 Fig. 5B 在簇5和6中发现了与生长因子信号有关的许多术语的富集。
      聚类,注释检索和富集分析的易于访问性允许用户,即使在数据分析的早期阶段,也可以获得这些调节模式的蛋白质调节和细胞过程结合的有价值概述。这些分析可能是指导 例如 鉴定蛋白质群体靶向在随访实验中。

       途径分析

      在生物学系统中,蛋白质通常不会作为独立实体施加其功能,而是作为多蛋白复合物的成员或信号转导途径,两者都可以通过定量蛋白质组学有效地分析(
      • C.
      基于质谱的蛋白质组学解码信号网络。
      ,
      • vermeulen M.
      • 哈伯纳N.C.
      使用定量质谱法测定特定蛋白质 - 蛋白质相互作用的高置信度。
      ,
      • Blagoev B.
      • ong s.e.
      • Kratchmarova I.
      用定量蛋白质组学对磷酸赖斯汀依赖信号网络的时间分析。
      ,
      • 邓布尔J.
      • Kratchmarova I.
      • Blagoev B.
      通过定量蛋白质组学进行测绘蛋白质 - 蛋白质相互作用。
      )。因此,总结蛋白质调节的强大方法是在信号转导,代谢途径或多蛋白复合物的背景下显示它。 GPROX提供了将蛋白质定量值映射到信号通路和由基因和基因组(KEGG)的京都百科全书维护的多分子结构信息(
      • Kanehisa M.
      • goto s.
      • Furumichi M.
      • Tanabe M.
      • Hirakawa M.
      Kegg用于表示疾病和药物的分子网络分析。
      )( 补充图S6)。蛋白质的分配可以是选定的途径或来自大型Kegg途径储存库的显着扰动的途径。为了鉴定显着的扰动途径巨胶依赖于所实施的信号通路影响分析(SPIA)算法 斯维亚 package for R (
      • tarca a.l.
      • Draghici S.
      • Khatri P.
      • 哈桑斯。
      • Mittal P.
      • kim J.s.
      • Kim C.J.
      • Kusanovic J.P.
      • Romero R.
      一种新的信号通路影响分析。
      )。我们发现该算法非常适合,因为除了评估途径的富集外,还包括关于计算A的途径扰动和单个途径拓扑的信息。 p 价值。如果为SPIA算法获得了显着的命中,则提供了汇总分析结果的表格,并将调节值映射到所有重要途径。该途径节点(蛋白质)的这种颜色编码可以以两种不同的方式完成,节点的调节值在低至高于高于高的梯度或途径中所识别的蛋白质的簇注释。虽然具有简单渐变的途径节点提供了全面的监管概述,但是通过集群成员资格着色途径的可能性使用户能够说明 例如 更精细的时间课程概况。在 Fig. 6 在EGF刺激30分钟后的调节映射到ERBB信号通路上。从这个图中可以看出,途径上游上游的一些蛋白质返回到控制水平或被下调,而在稍后的时间点处仍然活跃下游效应器。为了比较 补充图S7,5分钟后的调节,刺激显示途径上游蛋白质的上游调节,并将群集信息映射到途径。
      图缩略图GR6.
      Fig. 6GPROX途径分析EGF刺激的细胞反应。 用EGF 30分钟刺激后的调节被映射到ERBB Kegg信号通路。对应于在示例性数据中鉴定的蛋白质的节点根据调节进行颜色编码,所以上调蛋白质在红色的色调中着色,下调蛋白质在蓝色阴影中着色,而不是调节的蛋白质是灰色的。该分析说明在EGF刺激30分钟后,途径上游的蛋白质返回到控制状态,或者在下游效应蛋白保持上调的同时下调。

      讨论

      我们已经概述了GPROX的结构和特征,并且使用示例数据集,示例了典型的工作流程。这里不可能详细描述所有功能和应用,但我们认为Gprox充分通用,以允许用户自定义他们的分析并从富裕的定量蛋白质组学数据中提取大量信息。我们希望在单个平台中提供的功能内提供的功能范围可以作为一个舒适的数据浏览平台,也可以作为用于仔细审查定量蛋白质组学数据的属性的工具箱。据说,很明显,它超出了一个软件解决方案的范围,可以纳入引言中描述的程序的所有专业功能,但我们发现Gprox在定量蛋白质组学数据分析中提供了强大的集线器。
      在我们看来,定量随后的生物信息学分析软件现状在蛋白质组学的快速技术改进之后滞后。因此,我们希望Gprox可能对该领域的持续发展提供贡献,并帮助实验者在其生物信息学分析中克服障碍。

      致谢

      我们感谢所有宿有线会员的意见和乐于助人的讨论; jörn邓杰尔,Yasushi Ishihama,Irina Kratchmarova,Marcus Kruger,Jesper Olsen和Shao-en ong进行了预先测试; Dean Hammond和Michael Clague为示例数据集。

      补充材料

      参考

        • Rigbolt K.T.
        • prokhorova t.a.
        • Akimov V.
        • Henningsen J.
        • 约翰森P.T.
        • Kratchmarova I.
        • 卡西姆M.
        • 奥尔森J.V.
        • Blagoev B.
        人胚胎干细胞分化的蛋白质组和磷酸磷蛋白酶的系统宽的时间表征。
        SCI。信号。 2011; 4: rs3
        • 邓布尔J.
        • Kratchmarova I.
        • Blagoev B.
        受体酪氨酸激酶信号传导:来自定量蛋白质组学的视图。
        摩尔。 Biosyst。 2009; 5: 1112-1121
        • Swaney D.L.
        • 温格C.D.
        • Coon J.J.
        使用多种蛋白酶对大规模质谱的蛋白质组学的价值。
        J.蛋白质组。 2010; 9: 1323-1329
        • 彭J.
        • 施瓦茨D.
        • eliasj.e.
        • Thororen C.C.
        • 诚变。
        • Marsischky G.
        • Roelofs J.
        • 芬利D.
        • Gygi S.P.
        一种了解蛋白质泛素的蛋白质组学方法。
        NAT。 Biotechnol。 2003; 21: 921-926
        • Usaite R.
        • Wohlschlegel J.
        • venable J.D.
        • 公园S.K.
        • 尼尔森J.
        • 奥尔森L.
        • YALES III,J.R.
        野生型和葡萄糖抑制酿酒酵母菌菌株产生的全局酵母定量蛋白质组数据的特征:两种定量方法的比较。
        J.蛋白质组。 2008; 7: 266-275
        • Aye T.T.
        • Spolten A.
        • taouatas n。
        • Varro A.
        • van veen t.a.
        • vos m.a.
        • Heck A.J.
        人体中的蛋白质组含蛋白质浓度。
        摩尔。 Biosyst。 2010; 6: 1917-1927
        • prokhorova t.a.
        • Rigbolt K.T.
        • 约翰森P.T.
        • Henningsen J.
        • Kratchmarova I.
        • 卡西姆M.
        • Blagoev B.
        细胞培养(硅酸)中氨基酸的稳定同位素标记,以及自我更新和分化人胚胎干细胞的膜蛋白质蛋白质的定量比较。
        摩尔。细胞。蛋白质组学。 2009; 8: 959-970
        • 克里斯滕森A.R.
        • Schandorff S.
        • Høyer-hansen M.
        • Nielsen M.O.
        • jäätteläm。
        • 邓杰尔J.
        • 安德森J.S.
        饥饿诱导的自噬期间有序细胞器降解。
        摩尔。细胞。蛋白质组学。 2008; 7: 2419-2428
        • iwasaki m.
        • Miwa S.
        • Ikegami T.
        • Tomita M.
        • 塔卡卡N.
        • Ishihama Y.
        与串联质谱偶联的一维毛细管液相色谱分离揭示了在微阵列规模上的大肠杆菌蛋白质组。
        肛门。化学。 2010; 82: 2616-2620
        • Rigbolt K.T.
        • Blagoev B.
        硅胶蛋白质全组定量。
        方法mol。 BIOL。 2010; 658: 187-204
        • De Godoy L.M.
        • 奥尔森J.V.
        • Cox J.
        • Nielsen M.L.
        • 哈伯纳N.C.
        • Fröhlichf.
        • Walther T.C.
        综合质谱型蛋白质组定量单倍体与二倍体酵母。
        自然。 2008; 455: 1251-1254
        • Picotti P.
        • Bodenmiller B.
        • 穆勒L.N.
        • Domon B.
        • Aeberberold R.
        靶影科酿酒酵母的全动态范围蛋白质组分析。
        细胞。 2009; 138: 795-806
        • Cox J.
        MaxQuant能够高肽识别率,个体化P.P.B.范围质量精度和蛋白质组含蛋白质定量。
        NAT。 Biotechnol。 2008; 26: 1367-1372
        • Matthiesen R.
        • Trelle M.B.
        • Højrupp.
        • Bunkenborg J.
        • Jensen O.N.
        VEMS 3.0:基于串联质谱法的算法和计算工具基于蛋白质的翻译后修饰的鉴定。
        J.蛋白质组。 2005; 4: 2338-2347
        • Mortensen P.
        • gouw J.W.
        • 奥尔森J.V.
        • ong s.e.
        • Rigbolt K.T.
        • Bunkenborg J.
        • Cox J.
        • 福斯特L.J.
        • Heck A.J.
        • Blagoev B.
        • 安德森J.S.
        MSQUANT,一种基于质谱的定量蛋白质组学的开源平台。
        J.蛋白质组。 2010; 9: 393-403
        • 德意曲e.w.
        • 门多萨L.
        • Shteynberg D.
        • Farrah T.
        • 林H.
        • 塔斯曼N.
        • 太阳Z.
        • Nilsson E.
        • 普拉特B.
        • Prazen B.
        • ENG J.K.
        • 马丁D.B.
        • nesvizhskii a.i.
        • Aeberberold R.
        Trans-Qualeomic管道的导游。
        蛋白质组学。 2010; 10: 1150-1159
        • Kumar C.
        基于质谱的蛋白质组学数据集的生物信息分析。
        费用。 2009; 583: 1703-1712
        • 赛德A.I.
        • Bhagabati N.K.
        • 胸罩J.C.
        • 梁W.
        • Sharov V.
        • Howe E.A.
        • 李杰。
        • Thiagarajan M.
        • 白色J.A.
        • Quackenbush J.
        TM4微阵列软件套件。
        方法酶。 2006; 411: 134-193
        • Subramanian A.
        • Kuehn H.
        • 古怪J.
        • Tamayo P.
        • Mesirov J.P.
        GSEA-P:基因型富集分析的桌面应用。
        生物信息学。 2007; 23: 3251-3253
        • al-shahrour f.
        • Minguez P.
        • TárragaJ.
        • 麦地那我
        • Alloza E.
        • Montaner D.
        • Dopazo J.
        Fatigo +:基因组数据的功能性分析工具。用微阵列实验集成功能注释,调节基序和交互数据。
        核酸RES。 2007; 35: W91-96
        • 丹尼斯Jr.,G.
        • 谢尔曼B.T.
        • Hosack D.A.
        • 杨杰。
        • 高W.
        • 车道H.C.
        • LEMPICKI R.A.
        David:用于注释,可视化和集成发现的数据库。
        基因组Biol。 2003; 4: P3
        • ashburner m.
        • 球C.A.
        • 布莱克J.A.
        • Botstein D.
        • 巴特勒H.
        • 樱桃准晚
        • 戴维斯A.P.
        • Dolinski K.
        • 德怀特S.S.
        • EPPIG J.T.
        • 哈里斯M.A.
        • 山D.P.
        • ISSEL-TARVER L.
        • Kasarskis A.
        • 刘易斯S.
        • Matese J.C.
        • Richardson J.E.
        • Ringwald M.
        • 鲁宾上午
        • Sherlock G.
        基因本体:生物学统一的工具。基因本体组织。
        NAT。遗传。 2000; 25: 25-29
        • Albaum S.P.
        • NeuWeger H.
        • Fränzelb。
        • Lange S.
        • 佩塞斯D.
        • Trötschelc.
        • 擦拭。
        • Kalinowski J.
        • Nattkemper T.W.
        • 韦斯曼A.
        QUPE - 富有的互联网应用程序在分析基于质谱的定量蛋白质组学实验的分析中迈出了一步。
        生物信息学。 2009; 25: 3128-3134
        • Polpitiya A.D.
        • 钱W.J.
        • jaitly n ..
        • petyuk v.a.
        • Adkins J.N.
        • 营2nd,D.G.
        • 安德森G.A.
        • 史密斯r.d.
        DANTE:用于测量 - 用于对 - 中型数据的定量分析的统计工具。
        生物信息学。 2008; 24: 1556-1558
        • van Breukelen B.
        • van denorn h.w.
        • 博米姆。
        • Heck A.J.
        统治:用于改善定量质谱的定量后分析工具箱。
        生物信息学。 2009; 25: 1472-1473
        • Shannon P.
        • Markiel A.
        • ozier O.
        • Baliga N.S.
        • 王J.T.
        • Ramage D.
        • amin n.
        • Schwikowski B.
        • IDEKER T.
        Cytoscape:用于生物分子交互网络的集成模型的软件环境。
        Genome Res。 2003; 13: 2498-2504
        • 沙阿尔。
        • Singhal M.
        • Klicker K.R.
        • Stephan e.g.
        • Wiley H.S.
        • 水壶
        为系统生物学启用高吞吐量数据管理:生物信息学资源管理器。
        生物信息学。 2007; 23: 906-909
        • Gehlenborg N.
        • 燕W.
        • 李我。
        • yoo h.
        • 奈塞特克。
        • Hwang D.
        • Aeberberold R.
        • 引擎盖L.
        Prequips-An Inteniby软件平台,用于集成,可视化和分析LC-MS / MS蛋白质组学数据。
        生物信息学。 2009; 25: 682-683
        • 香农P.T.
        • reiss d.j.
        • 邦诺R.
        • Baliga N.S.
        Gaggle:用于集成生物信息学软件和数据源的开源软件系统。
        BMC生物信息学。 2006; 7: 176
        • R开发核心团队
        R:统计计算的语言和环境。
        • 绅士r.c.。
        • Carey V.J.
        • 贝茨下午
        • Bolstad B.
        • 偷偷摸摸的M.
        • Dudoit S.
        • 埃利斯B.
        • Gautier L.
        • GE Y.
        • 绅士J.
        • 霍希克斯。
        • Hothorn T.
        • Huber W.
        • IACUS S.
        • Irtizarry R.
        • 休息
        • 李C.
        • Maechler M.
        • rossini a.j.
        • Sawitzki G.
        • 史密斯C.
        • Smyth G.
        • Tierney L.
        • 杨杰。
        • 张继夫
        Biocometion:用于计算生物学和生物信息学的开放软件开发。
        基因组Biol。 2004; 5: R80
        • 芬恩r.d.
        • 朦胧J.
        • 泰特J.
        • Coggill P.
        • 哈吉尔A.
        • Pollington J.E.
        • Gavin O.L.
        • gunasekaran p.
        • CERIC G.
        • Forslund K.
        • HOLM L.
        • Sonnhammer E.L.
        • 艾迪S.R.
        • Bateman A.
        PFAM蛋白质家族数据库。
        核酸RES。 2010; 38: D211-222
        • 哈蒙德D.E.
        • 海德R.
        • Kratchmarova I.
        • Beynon R.J.
        • Blagoev B.
        • Clague M.J.
        HGF. 和EGF依赖性磷酸赖氨酸信号网络的定量分析。
        J.蛋白质组。 2010; 9: 2734-2742
        • eliasj.e.
        • Gygi S.P.
        目标 - 诱饵搜索策略通过质谱法对大规模蛋白质鉴定的置信度提高。
        NAT。方法。 2007; 4: 207-214
        • kersey p.j.
        • Duarte J.
        • 威廉姆斯A.
        • 卡拉维多奥鲁Y.
        • Birney E.
        • APWEILER R.
        国际蛋白质指数:蛋白质组学实验的集成数据库。
        蛋白质组学。 2004; 4: 1985-1988
        • Uniprot财团
        2010年通用蛋白质资源(Uniprot)。
        核酸RES。 2010; 38: D142-148
        • Futschik M.E.
        • 卡莱尔B.
        基因表达时间课程数据的噪声鲁棒软聚类。
        J. Bioinform。计算。 BIOL。 2005; 3: 965-988
        • flicek p.
        • Amode M.R.
        • 巴克尔D.
        • 宝贝K.
        • 布伦特S.
        • 陈Y.
        • Clapham P.
        • 盖子G.
        • Fairley S.
        • Fitzgerald S.
        • 戈登L.
        • Hendrix M.
        • Hourlier T.
        • 约翰逊N.
        • KähäriA.
        • Keefe D.
        • 凯恩斯。
        • Kinsella R.
        • Kokocinski F.
        • kulesha e。
        • Larsson P.
        • 龙班I.
        • 迈凯轮W.
        • 过度泛民B.
        • Pritchard B.
        • Rat H.S.
        • 里奥斯D.
        • 里奇G.R.
        • ruffier m.
        • Schuster M.
        • 肉体D.
        • Spudich G.
        • 唐y.a.
        • Trevanion S.
        • Vandrovcova J.
        • Vilella A.J.
        • 白人s.
        • Wilder S.P.
        • ZADISSA A.
        • Zamora J.
        • Aken B.L.
        • Birney E.
        • Cunningham F.
        • 邓汉I.
        • 德国R.
        • Fernandez-Suarez X.M.
        • Herrero J.
        • 哈贝德T.J.
        • 帕克A.
        • Proctor G.
        • Vogel J.
        • Searle S.M.
        Ensembl 2011。
        核酸RES。 2011; 39: D800-806
        • 杜林克斯。
        • 莫鲁y.
        • Kasprzyk A.
        • 戴维斯S.
        • de Moor B.
        • Brazma A.
        • Huber W.
        生物摩托和生物导体:生物数据库与微阵列数据分析之间的强大联系。
        生物信息学。 2005; 21: 3439-3440
        • C.
        基于质谱的蛋白质组学解码信号网络。
        NAT。 Rev. mol。细胞生物。 2010; 11: 427-439
        • vermeulen M.
        • 哈伯纳N.C.
        使用定量质谱法测定特定蛋白质 - 蛋白质相互作用的高置信度。
        Curr。拍摄。 Biotechnol。 2008; 19: 331-337
        • Blagoev B.
        • ong s.e.
        • Kratchmarova I.
        用定量蛋白质组学对磷酸赖斯汀依赖信号网络的时间分析。
        NAT。 Biotechnol。 2004; 22: 1139-1145
        • 邓布尔J.
        • Kratchmarova I.
        • Blagoev B.
        通过定量蛋白质组学进行测绘蛋白质 - 蛋白质相互作用。
        方法mol。 BIOL。 2010; 658: 267-278
        • Kanehisa M.
        • goto s.
        • Furumichi M.
        • Tanabe M.
        • Hirakawa M.
        Kegg用于表示疾病和药物的分子网络分析。
        核酸RES。 2010; 38: D355-360
        • tarca a.l.
        • Draghici S.
        • Khatri P.
        • 哈桑斯。
        • Mittal P.
        • kim J.s.
        • Kim C.J.
        • Kusanovic J.P.
        • Romero R.
        一种新的信号通路影响分析。
        生物信息学。 2009; 25: 75-82