试验和统计考虑,以避免使用差动凝胶电泳的蛋白质组学研究中的错误结论*

  • Natasha A. Karp.
    脚注
    隶属关系
    剑桥大学生物化学系,建筑o,唐宁网站,剑桥CB2 1QW,英国
    搜索本作者的文章
  • 保罗S. McCormick.
    脚注
    隶属关系
    化学,大学化学实验室,透镜菲尔德路,剑桥CB2 1新国
    搜索本作者的文章
  • 马修R. Russell.
    脚注
    隶属关系
    剑桥大学生物化学系,建筑o,唐宁网站,剑桥CB2 1QW,英国
    搜索本作者的文章
  • Kathryn S. Lilley
    一致
    应该解决对应的通信。剑桥大学生物化学部门。 o,唐宁网站,剑桥,英国CB2 1QW。电话:44-1223-765-255;传真:44-1223-333-345;
    隶属关系
    剑桥大学生物化学系,建筑o,唐宁网站,剑桥CB2 1QW,英国
    搜索本作者的文章
  • 作者脚注
    1所用的缩写是:2D,二维; FDR,虚假发现率; SA,标准化丰富; ECA, E. Carotovora.; PCER,按比较错误率; FWER,家人错误率; q,standile。
    2 N.A.A.Karp,P.S.Mccormick,M. R. Russell,K.S.Lilley,未发表的观察。
    *这项工作是由生物技术和生物科学研究理事会(BBSRC)拨款BB / C50694 / 1支持的。本文的出版费用部分按付款方式部分支付。因此,本文必须明白“广告“按照18 U.S.C.第1734节仅表明这一事实。
    本文的在线版本(可提供 http://www.mcponline.org)含有补充材料。
    §BBSRC授予BB / C50694 / 1支持的BBSRC研究助理。
    ‖由联合利华支持。
    **由BBSRC战略学生支持BBS / Q / Q / 2004/05630支持。
      在定量蛋白质组学中,错误发现率(FDR)可以定义为表达式统计学上显着的变化中的误报的数量。当单变量试验如学生时,在同时测试数百或数千种蛋白质或肽种类的表达变化的同时测试中累积误报's t使用测试。目前大多数研究人员仅依赖于估计p值和显着性阈值,但这种方法可能导致误报,因为它不考虑多个测试效果。对于每种物种,可以计算FDR方面的重要性,生产个人q价值观。这q价值通过允许调查员在意义呼叫中获得可接受的真实或误报的可接受水平来保持电力。这q价值方法依赖于对实验设计的正确统计测试的使用。在这种情况下,一个制服p值频率分布在两个样本之间没有表达的差异时,应该得到两个样本。在这里,我们报告了一个偏见p在三染量Dige实验的情况下的值分布,没有表达的变化。显示偏差从使用共同的内标中的数据中的相关性。用双染料模式,其中每个样品具有其自身的内标,取出此类偏差,从而实现了应用q对两种不同的蛋白质组学研究。在第一研究的情况下,我们证明了通过更传统的方法的80%的意义呼唤是误报。在第二,我们表明计算了q值为用户控制提供FDR。这些研究表明了电力和易用性q校正多个测试的值。这项工作还突出了对强大的实验设计的需求,包括适当应用统计程序。
      定量蛋白质组学,蛋白质表达的全局变化研究,是一种快速生长的领域,其中二维(2D)
      使用的缩写是:2D,二维; FDR,虚假发现率; SA,标准化丰富; ECA, E. Carotovora.; PCER,按比较错误率; FWER,家人错误率; q,standile。
      凝胶电泳(
      • kleno t.g.
      • Leonardsen L.R.
      • kjeldal h.o.
      • Laursen S.M.
      • Jensen O.N.
      • Baunsgaard D.
      蛋白质组学和多元数据分析研究了大鼠肝脏肼毒性的机制。
      ,
      • Fieget J.
      • 迪尔曼C.
      • Lagniel G.
      • 戴维尤姆
      • Negroni L.
      • 拉布拉特J.
      • De Vienne D.
      基于二维凝胶电泳的可靠定量蛋白质组学评估因子。
      ),用稳定同位素的蛋白质和肽的差异标记(
      • Brancia F.
      基于质量蛋白质组学的质谱。
      )和无标记的质谱峰值强度测量(
      • 老为
      • Meyer-Arendt K.
      • Aveline-Wolf L.
      • 皮尔斯K.G.
      • 门多萨A.
      • 七夹J.R.
      • resing K.A.
      • ahn n.g.
      霰弹枪蛋白质组学定量人体蛋白质的无标记方法的比较。
      )是测量蛋白质表达水平的变化的枢转方法。大规模基因组测序和基因表达研究的产出推动了全球评估蛋白质行为的需要,这是我们对细胞功能和疾病过程的理解的核心。在定量研究中,蛋白质或肽信号的定量允许将蛋白质水平与另一个状态的比较。无论使用的技术如何,都可以用各种统计方法分析产生的数据。在两个样品的简单比较中,当高于指定的阈值时,蛋白质表达的变化被认为是显着的(
      • karp n.
      • Kreil D.
      • 莉莉K.
      使用二维差异凝胶电泳在成对比较期间确定与Decyder TM的蛋白质表达的显着变化。
      )。更严格的研究结合复制使用单变量(
      • kleno t.g.
      • Leonardsen L.R.
      • kjeldal h.o.
      • Laursen S.M.
      • Jensen O.N.
      • Baunsgaard D.
      蛋白质组学和多元数据分析研究了大鼠肝脏肼毒性的机制。
      ,
      • 燕J.X.
      • devenish a.t.
      • 等待R.
      • 石头T.
      • 刘易斯S.
      • 福勒S.
      荧光二维差异凝胶电泳与大肠杆菌大肠杆菌的蛋白质组学分析。
      )或多变量统计方法(
      • kleno t.g.
      • Leonardsen L.R.
      • kjeldal h.o.
      • Laursen S.M.
      • Jensen O.N.
      • Baunsgaard D.
      蛋白质组学和多元数据分析研究了大鼠肝脏肼毒性的机制。
      ,
      • karp n.a.
      • 格里芬J.L.
      • 莉莉K.S.
      局部最小二乘判别分析在表达蛋白质组学中的二维差异凝胶研究中的应用。
      )分析数据。单变量的方法,例如学生 t 测试,分析来自每种蛋白质物种的数据,以确定样品之间的差异是否显着。在多变量方法中,例如原理分量分析,同时分析所有数据以寻找表达式的模式。这些统计方法中的每一个都涉及许多数学假设;但是,这些假设通常忽略,可能导致错误的结果(
      • Meunier B.
      • 鲍利J.
      • PIEN I.
      • 伯纳德C.
      • 皮卡德B.
      • Hocquette J.f.
      二维凝胶电泳中差异蛋白表达检测的数据分析方法。
      )。无论用于收集蛋白质组学数据的分析方法,必须克服统计分析的微妙问题,以确保进行有效的结论。
      迄今为止,大多数已发表的定量蛋白质组学研究使用了已建立的2D凝胶电泳方法进行定量,并应用单一试验以鉴定具有显着变化的蛋白质物种(
      • Meunier B.
      • 鲍利J.
      • PIEN I.
      • 伯纳德C.
      • 皮卡德B.
      • Hocquette J.f.
      二维凝胶电泳中差异蛋白表达检测的数据分析方法。
      ),尽管现在使用基于非凝胶的方法的研究数量增加。这些测试计算概率(p)观察测试统计器比给出来自数据计算的数据,所以样本来自同一人群(IE。表达的任何明显变化都是偶然发生的)。通常,如果计算出的情况,表达式变化被认为是显着的 p 值低于规定的意义阈值,例如0.01(按比较误差率(PCer))。两种类型的误差是可能的:当宣称蛋白质物种错误地错误地表达蛋白质物种时,会发生假阳性(I型错误);当测试未能检测到差异表达的物种时,会发生假否定(II型错误)。在表达研究中,每种物种进行数千种统计测试。大量的假阳性可能在0.01置信水平上积聚,因为即使两种样品之间不存在蛋白质表达的变化,1%的样本差异也会很大。这种误报的累积被称为多个测试问题,并且是在多个特征中应用时基于置信统计测试的一般性质(Dige每个特征是凝胶点)。虽然已经讨论了在定量蛋白质组学中进行多次测试的问题(
      • listgarten J.
      • Emili A.
      使用液相色谱 - 串联质谱法对比较蛋白质组学分析的统计和计算方法。
      ),这个问题的程度很少经过测试,但有可能导致大量的虚假引导。
      在微阵列字段中,多个测试问题一直是详细讨论的主题。早期方法使用了各方误差率,它在所进行的所有测试中控制一个或多个错误拒绝(I型错误)的概率。最简单和最保守的方法是Bonferroni校正,它通过将PCer除以完成的比较数来调整显着性的阈值(
      • 平淡的准噶米。
      • altman d.g.
      多重意义测试:Bonferroni方法。
      )。例如,当测试1000个蛋白质物种时,将阈值为0.05将除以导致0.00005的严格组织误差率(FWER)的测试数量。该方法未能考虑数据内的特征依赖性,并且没有考虑与与发生变化的测试比例相关的误报的风险。在蛋白质组学数据中,可能出现特征依赖性,因为蛋白质在生物化学途径内和跨越生物化学途径内和蛋白质多次表示时彼此影响;例如,在2D凝胶电泳中,单个蛋白质可以在电荷列车中的多个位置表示。在微阵列社区内,已发现控制FWER过于保守,并导致了许​​多兴趣的兴趣特征。还有人认为,在利用后来的确认研究的探索性实验的背景下,如果正确选择了大多数重要物种,则允许一些错误的导致不会出现严重问题(
      • Smyth G.K.
      • 杨Y.H.
      • 速度T.
      cDNA微阵列数据分析中的统计问题。
      ,
      • Draghici S.
      统计智能:高密度微阵列数据的有效分析。
      ,
      • Cui X.
      • 丘吉尔G.A.
      cDNA微阵列实验中差异表达的统计试验。
      )。随后在微阵列数据的大规模数据分析中被广泛接受了允许真正变化中的误报的概念(
      • 钱。
      • 黄S.
      鉴别表达鉴定基因的假发现速率方法的比较。
      )。这导致了方法的应用来控制焦点正在实现真实和误报的可接受比率的假发现率(FDR)。 Benjamini和Hochberg(
      • Benjamini Y.
      • Hochberg Y.
      控制虚假发现率 - 一种实用而强大的多次测试方法。
      )最初定义了假发现率,作为标识为假的重大变化的比例。例如,10%的FDR率意味着平均鉴定为显着的10%的变化将预期从I型错误中出现。原始的FDR方法也被认为是过于保守的发现实验,因为它没有考虑到这些实验中的一部分真正改变的功能(
      • Storey J.D.
      • Tibshirani R.
      基因组研究的统计学意义。
      ,
      • Storey J.D.
      一种直接的虚假发现率的方法。
      )。因此,最近的方法侧重于优化过程来控制和消除虚假发现,通过考虑数据的行为。
      通过Storey开发FDR的扩展并计算a q 每个测试功能的值(
      • Storey J.D.
      • Tibshirani R.
      基因组研究的统计学意义。
      ,
      • Storey J.D.
      一种直接的虚假发现率的方法。
      )。这 q 价值是在发出此功能时产生的误报的预期比例(IE。蛋白质物种)在两个样品之间表达的显着变化。虽然 p 价值是在试验的假阳性率方面的重要性, q 价值是假冒发现率方面的衡量标准。因此,仅使用阈值专注于 p values (例如。管理FWER)的方法控制不变特征的速率称为重要的速率,而对FDR的焦点控制了重要特征的速率为false。因此,FDR的计算将注意力集中在称为重要的功能的内容。这 q 值由值计算 p 在一项研究中获得的所有功能,用楼层和蒂瓦兰尼开发的易于使用的点击工具(
      • Storey J.D.
      • Tibshirani R.
      基因组研究的统计学意义。
      )。频率分布 p 值用于估计不变的特征的比例;然后用于估计错误的发现率(Fig. 1)。估计过程依赖于假设使用适合于实验设计和数据特性的统计测试。在不变的情况下使用适当的测试导致均匀分布 p 获得的值。这 q 使用该值计算 p 价值分布;这允许实验者选择适合其实验的FDR阈值。限制分析对具有的功能 q 价值 ≤x 结果整体FDR≤x。一个优势 q 价值方法是其特征之间的弱依赖性的容忍度(
      • Storey J.D.
      • Tibshirani R.
      基因组研究的统计学意义。
      )。正如楼层和蒂布兰尼的争论(
      • Storey J.D.
      • Tibshirani R.
      基因组研究的统计学意义。
      )对于微阵列数据,我们还认为蛋白质组学数据在蛋白质组学数据之间的依赖性可以被认为是弱的,因为随着测量的数量增加,依赖会忽略不计。研究比较各种FDR控制方法对微阵列表达数据的研究发现了 q 价值方法提供最高的明显功率(
      • 钱。
      • 黄S.
      鉴别表达鉴定基因的假发现速率方法的比较。
      )。存在几种FDR控制程序;然而 q 值易于使用,维护功率,是宽度的特征依赖性,并导致输出,允许实验者选择合适的FDR。这使得这使得 q 价值方法适用于定量蛋白质组学。
      图缩略图GR1.
      Fig. 1示出分布的频率直方图 p 学生通常预期的值 t 当23%的特征发生变化时,蛋白质组学表达数据的测试。 没有表达变化的蛋白质将有助于均匀的频率分布,而表达变化的蛋白质将趋于低 p 价值。 FDR进程正在搜索非背景事件。为了评估这一点,该过程需要将背景分布与相同贡献的变化分布分开 p 价值分布。第一步是使用频率直方图的平坦部分来估计从背景不变的群体引起的均匀频率分布,假设最多 p 1附近的值将是背景事件(虚线)。这 q 使用该功能计算每个功能的值 p 该特征的值作为显着性阈值并在称为重要的功能的总数内估计假正数的比例。
      一些研究应用微阵列分析对蛋白质表达数据的方法含有多种测试控制程序,发现选择显着的蛋白质种类的数量降低(
      • Meunier B.
      • 鲍利J.
      • PIEN I.
      • 伯纳德C.
      • 皮卡德B.
      • Hocquette J.f.
      二维凝胶电泳中差异蛋白表达检测的数据分析方法。
      ,
      • FODOR I.K.
      • 纳尔逊D.O.
      • Alegria-Hartman M.
      • 罗宾斯K.
      • langlois r.g.
      • Turteltaub K.W.
      • Corzett T.H.
      • McCutchen-Maloney S.L.
      用解析分析二维差异凝胶电泳实验的统计挑战。
      ,
      • 常J.
      • van Remmen H.
      • 病房W.F.
      • Regnier F.E.
      • Richardson A.
      • 康奈尔J.
      用二维凝胶电泳生成的数据处理统计分析:缺少数据,归一化和统计数据。
      ,
      • 王G.
      • wu w.w.
      • 曾W.
      • chou c.l.
      • 沉R.F.
      使用LC偶联离子阱或FT质谱的无标记蛋白质定量:具有复杂蛋白质蛋白质的再现性,线性度和应用。
      )。多次测试控制程序不是这些出版物的主要关注点,因此对该过程中使用的潜在假设有很少的关注。
      二维聚丙烯酰胺凝胶电泳允许数千种蛋白质的分辨率,导致蛋白质组的全球视图。通过在分离之前标记样品,可以通过标记样品来可视化产生的光斑模式, 例如。放射性(
      • norbeck J.
      • Blomberg A.
      酵母蛋白的二维电泳分离使用非线性宽范围(pH3-10)固定在第一维度中的pH梯度;碱性电气聚焦的再现性和证据(PI> 7) proteins.
      )或荧光(
      • kleno t.g.
      • Leonardsen L.R.
      • kjeldal h.o.
      • Laursen S.M.
      • Jensen O.N.
      • Baunsgaard D.
      蛋白质组学和多元数据分析研究了大鼠肝脏肼毒性的机制。
      ,
      • 燕J.X.
      • devenish a.t.
      • 等待R.
      • 石头T.
      • 刘易斯S.
      • 福勒S.
      荧光二维差异凝胶电泳与大肠杆菌大肠杆菌的蛋白质组学分析。
      ,
      • 胡Y.
      • 王G.
      • 陈G.Y.
      • 傅X.
      • 姚S.Q.
      蛋白质组分析 酿酒酵母酿酒酵母 二维差分凝胶电泳的金属应力下。
      ),或与总蛋白质污渍的分离,如胶体Coomassie(
      • Fieget J.
      • 迪尔曼C.
      • Lagniel G.
      • 戴维尤姆
      • Negroni L.
      • 拉布拉特J.
      • De Vienne D.
      基于二维凝胶电泳的可靠定量蛋白质组学评估因子。
      ),Sypro Ruby,或深紫色(
      • Chevalier F.
      • rofidal V.
      • 瓦莱卡P.
      • Bergoin A.
      • rossignol m.
      最近荧光染料蛋白质染色的蛋白质组学能力。
      ,
      • Smejkal G.B.
      • 罗宾逊M.H.
      • 拉撒塞夫A.
      荧光污渍的比较:二维凝胶中蛋白质的相对光稳定性和差异染色。
      )。可以将斑点体积与另一个样本进行比较,并且它是表达研究的建立技术。荧光数字方法具有高灵敏度,因此是表达研究中的强大工具。使用内标的高灵敏度产生,该内部标准已被证明是大量提高量化的准确性(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。 Dige涉及用光谱解析的荧光Cydyes™(Cy2,Cy3和Cy5; GE Healthcare)标记样品。然后将标记的样品混合在等电聚焦之前并在同一2D凝胶上分离。对于多功能接近,Cydyes™通常是Cy2,用于标记内部标准,该标准由平均样品组成。该标准样品用于匹配凝胶系列的光斑图案,并计算可以在许多凝胶中比较的每个斑点的标准化丰度值。通常,Cy3和Cy5树纹用于标记来自两个独立组的两个样品,以确保染料和凝胶平衡(
      • karp n.a.
      • 格里芬J.L.
      • 莉莉K.S.
      局部最小二乘判别分析在表达蛋白质组学中的二维差异凝胶研究中的应用。
      ,
      • Marouga R.
      • 大卫队
      • 霍金斯E.
      DIGE系统的开发:2D荧光差异凝胶分析技术。
      )。典型的13厘米Dige凝胶含有1000-1500个斑点;其中,600-1000个斑点通常与六凝胶系列相匹配,具体取决于凝胶的质量(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。在简单的水平中,在跨越800个斑点的两组的比较中,可能在现场使用的PCER意义阈值可能出现八个误报(p < 0.01).
      本研究重点关注在2D凝胶电泳与Dige的背景下进行多次测试的问题。为了建立建立的方法,这项研究使用了学生的 t 测试是因为大多数公布的Dige研究利用这种方法来确定表达的重大变化。
      N.A.A.Karp,P.S.Mccormick,M. R. Russell,以及K.S.Lilley,未发表的观察。
      学生们 t 测试是一个简单的测试,假设数据从正常分布中随机采样并显示方差的同质性。无论使用的统计方法如何,所有测试都有需要考虑的潜在假设,并且所有单变量测试都会遭受多次测试的问题。这 q 价值过程依赖于统一分配 p 当没有表达式的更改发生时的值。为了调查这一点,我们获得了样本相同的数据。发现这些相同的数据偏见 p 对更高值的值。在这些经验观察之后,使用数据仿真来了解用Dige相同的数据找到的结构。因此,根据这些观察,我们提出了关于DIGE实验的设计的建议,允许应用FDR校正程序。使用新的实验设计, q 价值方法适用于两个在蛋白质组学实验室解决典型问题的生物学问题。讨论了新的实验设计对重要性呼叫的影响,并展示了如何避免洪水阳性结果。

      实验步骤

       数据集 -

      评估分配 p 当没有发生表达的变化时,获得相同的数据集,其中使用三染料系统穿过六凝胶组的相同样品,导致每点最多12个数据点。在相同的凝胶中,用Cy2,Cy3和Cy5单独标记三种50μg样品的样品;混合;并用2D凝胶电泳分开,如Karp和Lilley详述(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。使用三个独立的相同的数据集使用 埃尔维亚 Carotovora (ECA)野生型样品,以研究再现性。为了评估样品类型的行为,还可以获得相同的数据集,用于鼠脑,肝脏和心脏组织。对于基于双染料系统(CY3和CY5)的数据集,其中两个 埃尔维亚 合并相同的数据集。
      为了证明使用FDR程序的应用,当使用两种染料Dige系统时,研究了两个生物学问题。在生物学研究1中,效果 per2 评估小鼠肝脏样品中的敲击;研究2看了ECA0020突变的效果 埃尔维亚。在这些研究中,使用对比较的每组的四种生物重复。在两种染料系统中,用Cy3标记50μg的每个样品并与50μgCy5标记的混合样品合并。将汇集的样品用2D凝胶电泳分离,并在标准方法中可视化荧光图像(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。

       样品制备-

      对于相同的研究,在30℃下在30℃下在300rpm下搅拌过夜,在液体肉汤培养基(10g /升戊粉,5g /升豆菇酵母酵母萃取物和5g /升氯化钠)中生长细菌样品通过以5000rpm以4℃离心10分钟收获。将细胞重悬于裂解缓冲液中(8 m 尿素,2%(w / w)乳液,5米m 醋酸镁,10米m TRIS,pH 8.0和蛋白酶抑制剂混合物在1×浓度(CALBIOCHEM)下将I设定为1),并通过超声处理(冰上3×10-S脉冲)裂解。从Wistar大鼠收获脑,肝脏和心脏组织24小时分娩。细胞在裂解缓冲液中均化(8 m 尿素,2%(w / w)amidosulfobetaine-14,5米m 醋酸镁,10米m 使用电动杵(CALBIOCHEM)将TRIS,pH 8.0和蛋白酶抑制剂混合物设定为1×浓度(CALBIOCHEM),并且通过三个冻融和超声处理细胞裂解细胞。
      在生物学研究1中,调查a的效果 per2 小鼠中的敲除突变,收获肝脏样品 per2 具有同步昼夜时钟的敲除和野生型小鼠,并在活动开始后提取6小时(昼夜昼夜时间18),然后在-70°C下冷冻。从每个样品中取出组织块并在CHAPS裂解缓冲液中均化。通过丢弃在4500rpm以4℃离心10分钟后丢弃形成的颗粒来除去细胞碎片。为了收获可溶性蛋白质级分,将样品在4℃下以13,000rpm离心10分钟,丢弃颗粒。提取来自四个遗传相同的小鼠肝脏的材料,用于给予生物重复的每种样品。
      在生物学研究2中,探讨突变的效果 E. Carotovora. 亚种 atroSeptica. SCRI1043基因ECA0020,如Coulthurst所述的等位基因交换产生所述菌株 。 (
      • Coulthurst S.J.
      • 莉莉K.S.
      • Salmond G.P.
      遗传和蛋白质组学分析Luxs在肠道植物病中的作用, 埃尔维亚 Carotovora.
      )。对于每种样品类型,在果胶酶最小培养基中生长四种独立培养物(
      • Coulthurst S.J.
      • 莉莉K.S.
      • Salmond G.P.
      遗传和蛋白质组学分析Luxs在肠道植物病中的作用, 埃尔维亚 Carotovora.
      )在25℃下,在300℃下24小时以300rpm振荡,并在5000rpm以4℃下离心10分钟收获。将细胞重悬于裂解缓冲液中(8 m 尿素,2%(w / w)乳液,5米m 醋酸镁,10米m TRIS,pH 8.0和蛋白酶抑制剂混合物在1×浓度(CALBIOCHEM)下将I设定为1),并通过超声处理(冰上3×10-S脉冲)裂解。为了收获可溶性蛋白质级分,使用低速离心除去细胞碎片(在4℃下以8000rpm 15分钟);然后将其高速离心,以除去不溶物质(在4℃下以13,000rpm)的不溶性材料。对于所有样品,使用如制造商所述,使用Bio-rad DC蛋白质测定法测定蛋白质浓度。

       数据分析-

      使用Decyder TM生物变化分析5.02(GE HealthCare)进行凝胶分析,这是一个专门用于Dige的软件包,遵循制造商的建议。使用比例方法和日志在软件中归一化数据10 用于稳定方差的标准化的转化。每个共检测的估计斑点数量设定为2500.专注于凝胶系列匹配的斑点的研究。这 q 使用该价值计算 p 通过由Storyy和Tibshirani提供的点击工具在Decyder中计算的值(
      • Storey J.D.
      • Tibshirani R.
      基因组研究的统计学意义。
      )。统计权力计算在卡普和莉莉(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。

       数据仿真 -

      使用自由软件r(
      R开发核心团队
      )。使用的脚本可用于补充附录1。

      结果

       用三染料制度研究潜在的假设

      准确应用 q 价值手术假定计算正确 p 值,它取决于使用适当的统计测试。统一分配 p 在组之间不存在差异的情况下的值可用于测试是否正在使用正确的统计测试。从相同的数据,利用三染料系统,将来自每个凝胶的对数标准化的丰度值随机分配给1组1或第2组,确保染料平衡(例如,参见 图2A)。将1和2组与学生进行比较 t 测试。通过三染料系统,相同的数据集导致偏差 p 值较高的值。这表明数据比随机抽样中的预期更相似,这表明学生的 t 测试不合适(图3A)。为此,发生的潜在假设 t 测试没有得到满足,导致失真 p 获得的值。学生们 t 测试假设通过检查相同的数据并发现有效的Dige技术以先前对Dige技术进行评估后两者的独立采样,正常性和均匀性。
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。这表明,在传统的三染力方法中,现场的最终标准化丰度(SA)数据并非真正独立。这导致数据中的相似性导致组的群体比随机机会更加相似,这使得偏向a p 价值 of 1.
      图缩略图GR2.
      Fig. 2DIGE中使用的三种染料模式的图解表示。
      图缩略图GR3.
      Fig. 3示例 p 在学生的价值分布 t 测试相同样本数据的比较。A,在确保染料平衡时使用三染料系统时获得的示例性型材。 B,当使用双染料系统时获得的示例型材。这些结果来自于 埃尔维亚 same-same dataset.

       调查数据模拟的潜在假设

      偏见 p 用学生分析相同的数据时,用三染料系统观察到的值 t 测试表明,随机抽样的假设不正确导致斑点相关性。假设该效果是由于在从凝胶中获得给定斑点的两个标准化丰度值的计算中的使用中出现了常见的内标光斑体积。内部标准光斑音量中的任何错误都是在从相同凝胶获得的两个SA值之间常见的,导致这些值的最终SA值中的常见失真。调查这种设计是否可能导致偏差 p 价值分布,基于使用直接系统的各种实验设计来模拟数据,其中假设所有斑点具有相同的平均值和S.D。
      首先观察到均匀频率分布 p 当没有发生变化时,获得了值的值提供了学生的假设 t 通过数据模拟确认了测试。数据随机从两个正常分布的群体中采样,具有相同的平均值和S.D。使用10个数据点给出两组,并使用学生进行比较组 t 测试。这重复了一千次。当学生的假设 t 测试得到了坚持得到的 p 值确实给出了均匀的频率分布(图4A)。这对于各种不同的平均值和S.D进行了测试。组合(数据未显示)。
      图缩略图GR4.
      Fig. 4p 从各种实验方法的数据模拟获得的值频率分布,以便每组10个数据点与学生进行比较 t test.A,数据已从具有相同均值和S.D的组独立上采样。这相当于利用现货量,没有内标。 B,数据具有标准化的丰度方法,而是通过对从等同于三染料模式获得的凝胶获得的每对值的共同的内标来获得。 C,数据具有标准化的丰度方法,但是通过使用与双染料模式相当的独立内部标准来获得。
      然后生成数据以模拟与典型的Dige实验模式从相同的数据获得的那些。通过从正常分布的群体随机采样的数据,通过具有相同平均值和S.D的数据来获得Cy3,Cy5和Cy2建模值。每组提供10个数据点。将标准化的丰度值计算为与每个凝胶对(Cy3和Cy5值)的比率计算为常见的内标(Cy2)值。在典型的Dige实验设计之后将SA值分配给第1组或2(Fig. 1),然后与生成的数据与学生进行比较 t 测试。这重复了一千次,由此产生了 p 值在频率分布中向1偏向1(图4B.)。这对于各种不同的平均值和S.D进行了测试。组合(数据未显示)。
      为了确保观察到的偏差是由常见的内标方法而不是使用比例,重复该过程,但使用仅使用一种染料作为内标,而另一个染料的染料用于样品,并在凝胶系列中比较了所得SA值(图。2B)。这种两种染料方法与用于标记样品的Cy3和使用用于标记内标的Cy2的方法相当。通过从具有相同平均值和S.D的群体随机采样数据获得Cy3和Cy5相同的值。每组提供10个数据点。通过将采样值随机分配给1或2组来获得SA值,并将组与学生进行比较 t 测试。这重复了一千次,在这种情况下 p 值给出了均匀的频率分布(图4C.)。数据仿真确认,从传统的数字标准值的利用率产生了来自传统的DIGE模式的相同数据中观察到的偏差,导致在斑点相关的相关性。使用双染料模式将避免这种情况。

       用双染料制度研究潜在的假设

      不均匀的 p 用三染料系统出现的价值分布由于数据点相关(在斑点相关性地)并且因此违反独立假设。显示相关的相关性来自使用Cy2作为来自每个凝胶的两个样品的共同定义。在数学上,这导致组之间的差异的变化是每个样本的方差和共方差的综合(参见 等式1)(
      • Casella G.
      • Berger R.
      )。不考虑共同方差,统计测试高估了导致偏差的真实方差 p 为了解决这一点,实验者可以利用重要性测试,该试验掺入术语以考虑共方或改变实验设计,使得在凝胶上仅获得一个数据点(两种染料方法; 图。2B)。针对使用更复杂的模型,我们以前表现出三染料系统在假设独立采样的数据分析时,三染料系统的方差比两种染料系统更高
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。然而,可以认为,当用更复杂的模型分析三染料系统时,它可能会更强大。评估使用三种染料系统更复杂的模型超出了本研究的范围。此外,通过使用更复杂的模型,存在过度装备的风险。因此,进一步研究了双染料系统的使用。在先前的出版物中,Cy3和Cy5染料组合给出了最低噪声;因此,这将是推荐的染料对与一种染料标记样品和其他染料标记标准(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )。
      两种方式的差异的变化=Var(X¯1)+var.(X¯2)+COV.(X¯1+X¯2)
      (eq。1)


      来自双染料设计的相同的ECA数据随机分配给1组或第2组,并将组与学生进行比较 t 测试。通过改变组分配来重复四次,审查了分布(图3B.)。理想情况下,随机采样效果,均匀分布 p 应获得值。对于其中一个任务来说,一些偏向更高的偏见 p 观察到值(参见补充信息)。这些分布都是从相同的数据集获得,但在组分配中有更改。偏差可能从数据中的数据中的相似性出现,该凝胶在对相对的组中分配的成对运行。这表明可以在可能的情况下消除任何系统偏差来源的重要性,例如通过在大批中运行凝胶以确保条件尽可能相似。总的来说,在这项研究中转向两种染料系统确保了均匀分布 p 在没有预期表达差异的情况下,将在不变的情况下满足值,条件是通过使用生物重复来维持常态和异质性的非均质性的假设。

       通过过滤数据集选择

      在微阵列社区中,应该被视为数据集的问题非常简单。然而,在2D凝胶电泳中,由于光斑检测可以导致许多虚假特征作为潜在斑点,例如灰尘颗粒或涂抹的问题更复杂。伪影斑可以被假设为不变的功能,从而有助于 p 值背景,它将屏蔽在多个测试情况下表达式中更改的功能。删除有助于这种背景的非真实斑点可能会增加灵敏度。因此,可以在提供数据集的选择中使用替代滤波器 p 值分布与这种过滤器无关,并且在数据分析之前选择过滤器。因此,考虑了在选择数据集中使用过滤器。
      到目前为止,分析集中在凝胶系列中匹配的斑点,因为这应该过滤“真实”蛋白质斑点,因为只有实际斑点始终存在于凝胶系列的该位置。考虑使用卷滤波器的替代方法。但是,现货量取决于各种技术问题, 例如。扫描设置(未示出的数据)以及被视为低体积的内容将显着取决于用于蛋白质和肽鉴定的仪器的样品的下游处理和仪器的敏感性。也可以在实验者判断的“真实性”上过滤斑点;然而,这种方法将是高度主观和劳动密集型的。因此,在审议问题后,我们的建议是专注于匹配的斑点。

       校正表达研究中的多重测试

       生物学研究1:截击截止的表达研究 -

      利用双染料Dige模式,比较野生型小鼠肝脏样品 per2 利用四个生物重复的敲除样品,以及 q 应用价值方法。总共检测到823个蛋白质斑点并与数据集相匹配。使用在场内常用0.01的PCER阈值,八个斑点具有重要意义 p 价值观。其中,六个将被选中,因为他们在实验室中被认为是在下游加工方面被认为是合适的。
      在分析期间, p 价值频率分布在低温下没有大幅增加 p 表明很少被检测到的值显着变化(图5A)。斑点的斑点不变化的比例为0.796,导致 q 斑点的值在0.7004和0.795之间变化。因此,对于当前方法的六个斑点被当前方法确定,预计80%将是假阳性(表I.)。
      图缩略图GR5.
      Fig. 5评估这一点 p 从小鼠肝脏的Dige表达研究获得的价值分布 per2 knock-out.A,频率直方图 p 价值在哪里 虚线 图示了由不变的群体产生的估计均匀频率分布。 B,一个统一的q-q图 p 价值 distribution.
      表I.在昼夜学习中选择的六个斑点是因为它们的P值低于PCer意义阈值(P<0.01)与学生的t测试p值和计算的q值
      掌握派位数平均比率表达比例p valueq value
      3660.77−1.300.00380.7704
      3550.85−1.180.00570.7704
      9200.79−2.270.00690.7704
      18360.78−1.290.00770.7704
      6801.241.240.00830.7704
      16551.251.250.0090.7704
      q 值得出现的价值,因为没有明确的斑点斑点的信号 p 在背景上方的价值分布。评估的替代方法 p 值分布是绘制均匀的Q-Q图,它提供了与均匀分布的偏差的清晰表示(图5B.)。 Q-Q图是用于确定样本是否来自指定的图形技术,在这种情况下是均匀的人口。靶分群体(y 轴)绘制针对相应的样本量子(x 轴)在定量位于给定值下方的点数(或百分比)。这种图形方法清楚地表明了 p 价值与均匀分布没有显着偏差,因此没有与相同的研究的差异(Fig. 6)。通过考虑FDR,结论是没有斑点在显着改变,以便保证下游处理。
      图缩略图GR6.
      Fig. 6标准偏差 相对 各个数据集的百分位位置。 与A. 虚线 表示对Dige的Cy3和Cy5两种染料方法经历的技术噪声。这 广场 与A. 实线 显示平均S.D.从生物学研究中的野生型肝脏计算1,以及 三角形 与A. 实线 显示平均S.D.对于野生类型 埃尔维亚 生物学研究中的样品2.这些值作为噪声的估计估计,以协助他人在实验规划中。
      研究的突变预计具有生物学显着的变化(
      • Gallego M.
      • 康H.
      • virshup d.m.
      蛋白质磷酸酶1调节昼夜节律蛋白彼此占菌株的稳定性。
      )。未能检测到实验中的任何变化表明,该设计的功率太少了,表达式的大小发生变化。与Karp和Lilley发布的技术噪声相比,发现包含75%的斑点的噪音在该研究中占此研究的4倍(
      • karp n.a.
      • 莉莉K.S.
      最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
      )(Fig. 6)。使用LENTH完成电力研究(
      • Lenth R.
      有效样本大小测定的一些实用指南。
      )电动工具清楚地表明,由于高生物噪声,只有四个重复检测变化的功率低(Fig. 7)。
      图缩略图GR7.
      Fig. 7当方差包含75%的斑点时,在检测到2倍变化时,功率和数量之间的关系和重复的关系。 广场 与A. 实线 显示为生物学研究1获得的关系1,以及 三角形 与A. 实线 显示为生物学研究获得的关系2.生物系统1中的噪声,小鼠肝脏,较高导致推荐的0.8在本研究中使用的四个重复下降。

       生物学研究2:Erwinia突变体的表达研究 -

      利用双染料Dige Schema, E. Carotovora. 将野生型样品与利用四种生物重复的突变体进行比较,以及 q 应用价值方法。在数据集中检测到总共575个蛋白质点并匹配。使用现场内使用的当前PCER意义阈值( p <0.01),104个斑点具有重要意义 p 价值观。其中,86将被选中,因为它们被认为适合下游加工。随着PCER阈值的这种多个测试情况,错误发现率的程度是未知的。
      为了确认控制FWER的方法的保守性,应用了Bonferroni校正方法。控制FWER至0.05导致调整后的意义阈值(p′ <0.000087)导致选择11个点,如统计上显着。此方法控制任何一个I型错误但假设独立测试的可能性。该方法提供了对误报的强烈控制,并导致最强烈的统计推理和对所选斑点的高度信心,但具有很小的力量。
      随着楼层的应用 q 价值接近斑点不变的斑点的比例估计为0.473,而且 q 计算每个斑点的值。频率分布 p 具有优势朝向低值的价值表明,高比例的斑点具有显着的表达变化给出 p 值并因此低 q values (Fig. 8)。
      图缩略图GR8.
      Fig. 8评估 p 价值 distribution.A,频率直方图 p 从Dige研究中获得的价值 埃尔维亚 学习。这 虚线 表示不变的群体产生的估计均匀频率分布。 B,统一的q-q图 p 价值 distribution.
      计算出的 q 值允许估计要为各种错误发现速率阈值计算的错误发现(表二)。结果突出显示,通过增加误电的比例,实验的功率增加,并且检测到倍增数量的显着斑点。
      表二利用Q值方法,选择的斑点数量具有各种误报率为Erwinia研究的估计
      q 价值 cutoffFDR.重要斑点数量估计误报的数量
      计算确认真正的斑点
      %
      0.01160581
      0.0252.598882
      0.0551601398
      0.0757.520316915
      0.101024020124

      讨论

      多重测试问题在定量蛋白质组学领域几乎没有注意;然而,误报的积累可能导致后续研究中的资源大量浪费。 FDR方法,重点关注虚假和真实阳性的余额,解决这个问题并保持实验的力量检测表达变化。这 q 价值是FDR的扩展,提供了每种功能的重要性的衡量标准,同时考虑到数千个功能同时测试了数千个功能。这 q 价值方法很容易解释和实施。的力量 q 值是它允许实验者选择对它们的错误率及其随后的研究,例如正交验证技术。在蛋白质表达的变化的验证是容易的情况下,调查员可以选择接受更高的FDR。必须考虑对所有定量蛋白质组学方法进行多次测试的问题。在这里,我们集中在Dige方法上,但使用了 q 值方法可以同样适用于其他定量方法。
      在第一次生物学研究中,看着a的效果 per2 在小鼠肝脏中,评估虚假发现率的重要性被突出显示,因为该研究证明了如果未考虑多次测试问题,则展示了获得错误导线的风险。使用严格的PCER的当前方法(p <0.01),六个斑点将被选为重要,其中五种估计是与之相关的错误发现 q 价值方法。通过这种方法,高假发现率不会导致未选择用于下游加工的蛋白质。作为 per2 是昼夜节律的关键负调节因子,敲门时,预期表达的重大变化(
      • Gallego M.
      • 康H.
      • virshup d.m.
      蛋白质磷酸酶1调节昼夜节律蛋白彼此占菌株的稳定性。
      )。因此,无法检测表达的统计上显着变化的缺乏统计能力。由于高生物噪声和出现变化尺寸的重复,实验的力量很低。
      在第二种生物学研究中,看着效果 埃尔维亚 突变,突变 q 值方法被证明是用于评估错误发现率的揭示系统。这允许实验者考虑对下游研究和可用资源可接受的错误率。在表达研究完成后,预期的错误率形成了应影响结果解释的警告。
      这些生物学研究的噪声比较同意微阵列研究,其中细胞培养物中的生物噪声小于近交小鼠群体(
      • Novak J.P.
      • 石板r.
      • 哈德森T.J.
      大规模基因表达数据中变异性的表征:研究设计的影响。
      )。很容易预测人口研究中的生物变异性仍然会更大。考虑到预期的变化对于确保实验将有足够的权力来解决所解决的生物问题是必不可少的。
      这里描述的研究突出了研究人员需要验证统计测试和程序的假设,以实现计算测试的适当行为,确保有效的结论。对于每种技术,可以预测这些问题会有所不同,需要个性化解决方案。发现与Dige一起使用的传统的三染料模式提供相关数据,从而违反了学生的独立假设 t 测试和防止有意义的应用 q 价值方法。从使用Cy2作为来自每个凝胶的两个样品的常见内标,所示的相关性被示出为常见的内部标准,从而导致斑点相关性。这可能会因更复杂的统计测试而计入;然而,随着三染料的高噪声,使用双染料系统结合更用户友好的统计分析,它更简单。做出有效的推论并允许应用 q 使用Dige结合学生的价值方法 t 试验,建议使用两种染料模式,其中Cy3染料标记样品和CY5标记的内标。对于其他定量技术也可能出现共同的问题,利用多路复用和内部标准,例如ITRAQ标记系统(用于多路复用相对蛋白质定量的胺改性标记试剂),其中四个或八种可能的标签中的一个是用于标记几个单独的标记实验的内部标准。
      总体上,本文介绍的生物学研究,典型的蛋白质组群落,突出了对稳健的实验设计的需求,包括统计程序的适当应用。此类计划应包括验证测试和程序的假设,以确保从研究中得出的结论有效。在设计实验时,预期的技术和生物可变性,表达式的预期大小,以及重复的数量都需要考虑确保足够的力量以允许检测表达的变化。

      致谢

      我们感谢J. Byers博士,S. Coulthurst博士,以及M. Doury博士提供样品。我们特别感谢Renata Feret为凝胶 埃尔维亚 biological study.

      补充材料

      参考

        • kleno t.g.
        • Leonardsen L.R.
        • kjeldal h.o.
        • Laursen S.M.
        • Jensen O.N.
        • Baunsgaard D.
        蛋白质组学和多元数据分析研究了大鼠肝脏肼毒性的机制。
        蛋白质组学。 2004; 4: 868-880
        • Fieget J.
        • 迪尔曼C.
        • Lagniel G.
        • 戴维尤姆
        • Negroni L.
        • 拉布拉特J.
        • De Vienne D.
        基于二维凝胶电泳的可靠定量蛋白质组学评估因子。
        蛋白质组学。 2004; 4: 1939-1949
        • Brancia F.
        基于质量蛋白质组学的质谱。
        Curr。肛门。化学。 2006; 2: 1-7
        • 老为
        • Meyer-Arendt K.
        • Aveline-Wolf L.
        • 皮尔斯K.G.
        • 门多萨A.
        • 七夹J.R.
        • resing K.A.
        • ahn n.g.
        霰弹枪蛋白质组学定量人体蛋白质的无标记方法的比较。
        摩尔。细胞。蛋白质组学。 2005; 4: 1487-1502
        • karp n.
        • Kreil D.
        • 莉莉K.
        使用二维差异凝胶电泳在成对比较期间确定与Decyder TM的蛋白质表达的显着变化。
        蛋白质组学。 2004; 4: 1421-1432
        • 燕J.X.
        • devenish a.t.
        • 等待R.
        • 石头T.
        • 刘易斯S.
        • 福勒S.
        荧光二维差异凝胶电泳与大肠杆菌大肠杆菌的蛋白质组学分析。
        蛋白质组学。 2002; 2: 1682-1698
        • karp n.a.
        • 格里芬J.L.
        • 莉莉K.S.
        局部最小二乘判别分析在表达蛋白质组学中的二维差异凝胶研究中的应用。
        蛋白质组学。 2005; 5: 81-90
        • Meunier B.
        • 鲍利J.
        • PIEN I.
        • 伯纳德C.
        • 皮卡德B.
        • Hocquette J.f.
        二维凝胶电泳中差异蛋白表达检测的数据分析方法。
        肛门。生物学习。 2005; 340: 226-230
        • listgarten J.
        • Emili A.
        使用液相色谱 - 串联质谱法对比较蛋白质组学分析的统计和计算方法。
        摩尔。细胞。蛋白质组学。 2005; 4: 419-434
        • 平淡的准噶米。
        • altman d.g.
        多重意义测试:Bonferroni方法。
        BMJ BR。 Med。 J.(临床。res。)。 1995; 310: 170
        • Smyth G.K.
        • 杨Y.H.
        • 速度T.
        cDNA微阵列数据分析中的统计问题。
        方法mol。 BIOL。 2003; 224: 111-136
        • Draghici S.
        统计智能:高密度微阵列数据的有效分析。
        药物讨论。今天。 2002; 7: S55-S63
        • Cui X.
        • 丘吉尔G.A.
        cDNA微阵列实验中差异表达的统计试验。
        基因组Biol。 2003; 4: 210
        • 钱。
        • 黄S.
        鉴别表达鉴定基因的假发现速率方法的比较。
        基因组学。 2005; 86: 495-503
        • Benjamini Y.
        • Hochberg Y.
        控制虚假发现率 - 一种实用而强大的多次测试方法。
        J. R. Stat。 SOC。 B. 1995; 57: 289-300
        • Storey J.D.
        • Tibshirani R.
        基因组研究的统计学意义。
        Proc。 Natl。阿卡。 SCI。美国。 2003; 100: 9440-9445
        • Storey J.D.
        一种直接的虚假发现率的方法。
        J. R. Stat。 SOC。 B. 2002; 64: 479-498
        • FODOR I.K.
        • 纳尔逊D.O.
        • Alegria-Hartman M.
        • 罗宾斯K.
        • langlois r.g.
        • Turteltaub K.W.
        • Corzett T.H.
        • McCutchen-Maloney S.L.
        用解析分析二维差异凝胶电泳实验的统计挑战。
        生物信息学。 2005; 21: 3733-3740
        • 常J.
        • van Remmen H.
        • 病房W.F.
        • Regnier F.E.
        • Richardson A.
        • 康奈尔J.
        用二维凝胶电泳生成的数据处理统计分析:缺少数据,归一化和统计数据。
        J.蛋白质组。 2004; 3: 1210-1218
        • 王G.
        • wu w.w.
        • 曾W.
        • chou c.l.
        • 沉R.F.
        使用LC偶联离子阱或FT质谱的无标记蛋白质定量:具有复杂蛋白质蛋白质的再现性,线性度和应用。
        J.蛋白质组。 2006; 5: 1214-1223
        • norbeck J.
        • Blomberg A.
        酵母蛋白的二维电泳分离使用非线性宽范围(pH3-10)固定在第一维度中的pH梯度;碱性电气聚焦的再现性和证据(PI> 7) proteins.
        酵母。 1997; 13: 1519-1534
        • 胡Y.
        • 王G.
        • 陈G.Y.
        • 傅X.
        • 姚S.Q.
        蛋白质组分析 酿酒酵母酿酒酵母 二维差分凝胶电泳的金属应力下。
        电泳。 2003; 24: 1458-1470
        • Chevalier F.
        • rofidal V.
        • 瓦莱卡P.
        • Bergoin A.
        • rossignol m.
        最近荧光染料蛋白质染色的蛋白质组学能力。
        植物化学。 2004; 65: 1499-1506
        • Smejkal G.B.
        • 罗宾逊M.H.
        • 拉撒塞夫A.
        荧光污渍的比较:二维凝胶中蛋白质的相对光稳定性和差异染色。
        电泳。 2004; 25: 2511-2519
        • karp n.a.
        • 莉莉K.S.
        最大化检测蛋白质表达变化的敏感性:使用最小阴影的实验设计。
        蛋白质组学。 2005; 5: 3105-3115
        • Marouga R.
        • 大卫队
        • 霍金斯E.
        DIGE系统的开发:2D荧光差异凝胶分析技术。
        肛门。生物丹纳尔。化学。 2005; 382: 669-678
        • Coulthurst S.J.
        • 莉莉K.S.
        • Salmond G.P.
        遗传和蛋白质组学分析Luxs在肠道植物病中的作用, 埃尔维亚 Carotovora.
        摩尔。植物别墅。 2006; 7: 31-46
        • R开发核心团队
        R:统计计算的语言和环境。 统计计算的基础, 维也纳,奥地利2006
        • Casella G.
        • Berger R.
        统计推断。 Duxbury Press., 贝尔蒙特,加利福尼亚州1990: 250
        • Gallego M.
        • 康H.
        • virshup d.m.
        蛋白质磷酸酶1调节昼夜节律蛋白彼此占菌株的稳定性。
        生物学习。 j。 2006; 399: 169-175
        • Lenth R.
        有效样本大小测定的一些实用指南。
        是。统计员。 2001; 55: 187-193
        • Novak J.P.
        • 石板r.
        • 哈德森T.J.
        大规模基因表达数据中变异性的表征:研究设计的影响。
        基因组学。 2002; 79: 104-113