需要稿件内容和出版指南 分子& Cellular Proteomics

以下指南描述了杂志杂志所需的信息 设计用于蛋白质,肽或后期改性(PTM)鉴定的质谱分析及其量化 无论研究是否是焦点的生物学或临床。

作者必须包括稿件中的信息,以允许读者和审核人员评估其数据的有效性和可重复性,以及他们观察的重要性。该信息包括对整体实验设计的描述和理由的描述(例如,统计上独立,技术或生物重复的数量,样本量等)。此外,关于原始质谱数据如何转换为数据库搜索的格式的详细信息,数据处理中使用的搜索引擎,数据库,评分函数,错误发现率(FDR)和如何清楚地说明和合理地计算出来的统计学方法,以便使用什么统计学方法。下面详细讨论这些主题。作者也很重要,即作者还审查 清单文件 在提交稿件时必须在提交网站上完成。未能提供所需信息将导致在遵守遵守情况之前导致稿件的重大延误和拒绝。

如果您的稿件描述了临床研究或糖类研究,请查看此外 用于准备描述临床蛋白质组学研究的手稿的刊登指南糖类研究公布的指导方针, 分别。如果您的稿件描述了肽的测量,则使用靶向MS接近的修饰肽和蛋白质(MRM,PRM)或采用目标数据分析的DIA研究,请参考我们的 有针对性的质谱指南 或者 直接指南, 分别。

使用先前生成的软件或算法开发数据集的稿件应引用与数据集相关的原始文献参考,并提供所使用的存储库的名称和Web地址以及特定数据集标识符。与先前公布的研究无关的数据集符合本文所述的研究论文所描述的所有审查指南。

点击目录中的标题直接跳到该部分:

  1. 必须在实验程序中提供的信息 Section
  2. 必须在结果部分或补充材料中提供的信息
  3. 将原始数据提交到存储库

I.必须提供的信息 实验步骤 Section

实验设计和统计理由:

作者必须在实验程序中包含一个小节 与标题的部分 “实验设计和统计理由”。在本节中,明确说明:

  • 结果中分析和描述的样本总数
  • 进行了技术,过程和/或生物复制的数量。如果没有进行重复分析,明确说明为什么应考虑为您的学习可接受
  • 所用的控制的数量和类型
  • 用于随机化的方法(如果适合您的研究)
  • 用于选择样品号,复制等的基本原理完全描述和/或引用用于这些分析的统计测试,并提供所使用的统计测试选择的原因

数据库搜索参数和验收标准的标识:

对于描述MS / MS或肽质量指纹(PMF)分析的所有稿件,作者必须在实验程序中进行详细 稿件的部分原始质谱数据如何转换为数据库搜索的格式,在数据处理中使用的搜索引擎,使用的数据库,所用的评分函数,错误发现率(FDR)以及如何计算出来,用来推断出意义的统计方法。具体来说,请描述以下内容:

  • 峰值列表: 用于从原始数据创建“峰值列表”的方法和/或程序(包括版本号和/或日期)以及在创建此峰值列表中使用的参数,特别是任何可能影响随后的质量的处理数据库搜索。示例包括平滑,任何信噪比阈值,充电状态分配或去同位素等。在已经执行了峰列表集合的附加定制处理的情况下,例如,群集或过滤,应引用方法和/或程序(包括版本号)。
  • 搜索引擎: 必须提供用于数据库搜索的所有程序的名称和版本(或发布日期)。
  • 序列数据库或光谱库: 必须列出所有序列数据库或使用频谱库的名称和版本(或发布日期)。如果在内部编译数据库或库,则需要完整描述序列或光谱源,并且用于库生成的软件。必须包括从每个数据库或库中实际搜索的条目数。如果使用的数据库或库非常小(<1000个条目)或排除普通污染物,必须具体提供了理由,因为这可能会产生误导性分配和不准确的错误发现率估计。
  • 酶特异性: 必须列出用于产生肽的所有酶的描述,包括必须列出允许的错过和非特异性裂解(例如半胰蛋白酶)的数量。
  • 固定修改(s): 必须给出所考虑的所有修改的列表(包括残留物特异性)。
  • 可变修改: 必须给出所考虑的所有修改的列表(包括残留物特异性)。如果未指定已固定或可变修改,则应如此陈述。
  • 前体离子的质量耐受性。
  • 片段离子的大众耐​​受性 (PMF数据不需要)。
  • 被排除的已知污染物 (特别是对于PMF数据):必须识别来自预先指定污染物的峰值(或者如果这些碎片中的任何一个用于校准)。
  • 阈值分数/期望值: 用于接受单个光谱的标准应与理由一起说明。
  • 肽和蛋白质水平的假发现率: 对于大规模的实验,任何额外统计分析的结果估计数据集的识别确定度的衡量标准,或者允许确定错误发现率,例如诱饵搜索或其他计算方法的结果。

II。必须提供的信息 结果部分 或者 补充材料

蛋白质和肽鉴定:

  • 分配所有肽序列: 必须提供列表(在一个或多个表格中),注意到不注意从预期的酶切割特异性的任何偏差。
  • 前体充电和质量/充电: 应列出这些参数的每个肽分配在同一表中。
  • 观察到所有修改。
  • 匹配和无与伦比的群众数量: 对于PMF数据,应在识别表中列出匹配和无与伦比的峰值总数。
  • 得分: 相关得分(取决于所用的软件)和所进行的搜索所获得的任何相关统计信息,必须为每种肽提供。
  • 蛋白质登录号和序列数据库或频谱库源。 (注意:如果鉴定仅在肽水平处呈现,则可以省略蛋白质水平信息。)
  • 分配给每种蛋白质的不同肽序列数的数量: 当计算该数量时,应计数与具有相同主序列的肽的多个匹配作为单个不同的肽,包括表示不同前体充电状态或修改状态的多个匹配。任何替代假设必须是合理的。
  • 蛋白质序列%覆盖: 该值应表示为由分配的肽跨越的氨基酸的数量除以序列长度×100。或者,可以给出衍生的蛋白质识别概率。
    (注意:所有报告蛋白质标识的所有文章最小化必须提供登录号,每种识别的肽数量和稿件适当的百分比或提交给期刊的补充材料。仅在公共存储库中依赖于该信息符合期刊要求。)
  • 蛋白质根据单个独特的肽确定: 不鼓励,但如果包括在内,必须提供用于查看这些标识的注释光谱的能力。有关如何提供注释光谱的详细信息,请参阅下文。
  • 查看注释质谱: 对于基于一种独特的肽鉴定的所有蛋白质,以及含有肽修饰的所有肽(参见下文),或者对于通过肽质量指纹鉴定的蛋白质,必须提供用于这些识别的注释光谱的能力。通过注释光谱,我们指的是标记光谱中的所有显着峰的M / Z以及它们的片段离子指定(例如,如果光谱来自MS / MS实验)相对于序列,则它们的片段离子名称(例如,Y,B等)报道。这可以通过以下三种方式之一实现:
    • 将所有光谱和搜索结果提交到公共结果存储库,该存储库配备有频谱观众,在提交稿件之前。此信息将显示为已发布文章中的超链接。请参阅题为“有关如何提供对注释光谱的信息“有关如何遵守的详细信息。
    or
    • Spectra的提交(用稿件)和搜索结果的文件格式,允许使用可自由的查看器可视化光谱。
    or
    • 以“Office”或PDF格式提交(用稿件)的注释光谱。
  • 笔记: 通过在线稿件提交过程提交的文件的大小应小于100 MB。如果文件大于100 MB的大小,则该期刊建议将文件存入合适的存储库,例如Proteomexchange Consortium的成员[http://www.proteomexchange.org],然后在手稿中提供数据集标识符以及伴随稿件提交的求职信。 作者必须在提交所有存放数据的用户名和密码时提供在提交的求职信中,无论在审查过程中没有公开可用的存储库。 否则会导致稿件失败,遵守合规性检查并延迟文章的最终决定。发布作者网站上的结果作为此数据的唯一来源不满足此要求,因为遵循审查过程需要匿名访问数据。

后期修改:

关注发生后期修改(PTMS)的研究需要专门的方法和文档来分配修改的类型和站点。本节中的指导原则适用于生理条件下发生的PTM,以及可以分配生物意义,例如磷酸化,糖基化等以及有目的地诱导对研究结果的核心重要性的化学修饰,例如化学品交联。这些指南不适用于来自样品处理或制备的常见修改,例如Cys的氧化或烷基化的氧化。除了指南II中描述的数据的表格演示文稿之外,还需要以下信息:

  • 修改的网站: 在每种肽序列内,必须清楚地定位所有修改(除非含糊;见下文),必须描述这一点的方式(通过计算或手动检查)。
  • 采用任何本地化得分阈值的理由。
  • 含糊不清的作业: 必须列入含有模糊PTM站点本地化的肽 单独的表 从那些有明确的网站本地化的人。在存在多种修改位点的情况下,至少一个是模糊的,那么这些肽应该用模糊的分配列出。必须明确标记含糊不清的分配。

    歧义的例子包括:
    • 一种或多种改性位点的改性肽是模糊的。
    • 在相同蛋白质中重复肽序列的情况,因此不能分配特异性修饰位点。
    • 在多种蛋白质中重复相同肽的情况,例如,在多种蛋白质中重复。剪接变体和副病剂(另见第IV部分)。
    • 同学修饰(例如,乙酰化与三甲基化,磷酸化与磺化等),其中可能无法区分。能够区分这些的方法的实例包括质谱方法,例如精确的质量测定,观察​​签名片段离子(例如,在负离离子模式中用于分配磺化的磷酸化),或生物或化学策略。
       
  • 注释,质量标记的光谱: 所有修饰肽的光谱必须提交到公共储存库或伴随稿件,如在II部分中的上文和更详细的文件中描述的“有关如何提供对注释光谱的信息 “。

来自肽作业的蛋白质推论:

由于基于蛋白水解消化和所得肽的随后表征的蛋白质鉴定实验导致这些肽与其蛋白质前体之间的连接性丧失,因此基于肽序列的分配的鉴定可以形成两种可能的结果:截然不同肽仅映射到一种以多于一种蛋白质序列(蛋白质组)的一种蛋白质序列或肽,例如由替代剪接而产生的。当识别是后一种类型的时候,需要作者(除了指南中描述的数据的表格演示文稿)到:

  • 为组合到组的所有蛋白质提供加入号(或其他标识符)。作者应该证明来自蛋白质组的单个蛋白质的任何病例已经被单独出去,或者在断言蛋白质组的一个以上的难以区分的成员时实际存在。
  • 提供属于每种蛋白质组的常见肽的概要列表,并且与特定蛋白质不同的肽。
  • 如果蛋白质从不同的物种中鉴定出比所研究的蛋白质,州(并且是合理的)。例如,在仓鼠研究中鉴定小鼠或人蛋白质。

肽和蛋白质量化:

提出质谱分析的定量蛋白质组成果的原稿必须提供以下信息:

  • 所有相关的量化数据(作为肽和蛋白质识别表的一部分)以及如何处理原始数据以产生这些测量的描述。
  • 如何使用技术复制和统计方法验证测量的分析可靠性。可以使用标准方法或专用软件的引用。但是,必须证明稿件中包含的数据实际上符合同一模型。
  • 如何使用生物重复,统计方法,独立实验等进行测量的生物可靠性。基于单一生物实验的研究通常是不可接受的(用于测试生物信息系统的数据集除外)。如果不能进行来自相同来源的生物学复制(例如患者样品),则必须执行足够大量的类似生物样品,以便能够进行声音结论。

    注意:对于报告质谱数据的任何文章,上述三种要求是强制性的,必须包含在稿件或补充材料中。
  • 对相关系统误差效应的处理描述,例如来自重叠前体离子的干扰,不完全同位素标记,偏压校正误差等。
  • 对随机误差问题的描述,例如异常抑制和阈值的分类排除等。例如,基于信号到噪声或最小离子计数。
  • 适当的不确定性估计和用于误差分析的方法。

许多蛋白质或肽的定量通常导致需要使用某种形式的多假设检测校正。只要有可能,应为每个单独的蛋白质而不是全球数据集提供蛋白质量化的置信度。从稿件中的定量数据中产生的任何结论或假设必须与确定的不确定性的估计有音乐会。

  • 如果没有通过在特定实验中搜索的数据库搜索组分,则必须提供测量分析物的身份和测量其测量的特异性(例如存在/不存在)。这特别适用于基于强度的方法,例如Seldi,选择的反应监测/多重反应监测(SRM / MRM)和精确的质量和保留时间(AMT)的方法。
  • 量化蛋白质组中多种同种型的描述。
  • 对于光谱计数测量,除了上述指南之外,应提供额外的细节,例如计数肽或光谱的数量,无论是否计算修饰的肽,半胰蛋白酶或共用肽,以及是否使用动态排除, 等等。

使用靶向MS接近定量肽,修饰的肽和蛋白质

我们开发了一个 新的指南 用于测量肽,改性肽和使用靶标MS方法的蛋白质。请参阅 我们的社论 了解更多信息。

III。将原始数据提交到存储库

在首次提交纸张中,必须存入原始仪器供应商文件格式中的所有质谱输出文件,在独立于作者控制的可公开访问网站中。 应以需要访问用户名和密码的方式存放数据。访问信息将在提交时提供给编辑器(通过包含在求职信中),并将其作为手稿审查过程的一部分提供给审阅者。如果能够读取仪器供应商文件格式的软件,则会鼓励数据转换为诸如MZML等MZML之类的软件不可用。在所有情况下,预计频谱都会在任何可能影响后续解释的质量的任何处理之前以形式提供的光谱,如峰值列表指南中所述(参见第i节)。 MCP的编辑认识到上传大型数据集有时可以发电不可预见的困难和遇到问题的作者应该联系 [电子邮件 protected] 咨询和/或帮助。作者不会因这种困难而导致的延误受到惩罚。 必须以书面管理编辑以书面形式提交来自此要求的豁免(或与技术问题无关)的请求[[电子邮件 protected]] 在提交时。 禁运存款必须在出版时公开可用。

例如,MS蛋白质组学数据已经沉积在Proteomexchange联盟(http://proteomecentral.proteomexchange.org)通过带有数据集标识符PXDXXXXX的骄傲合作伙伴存储库(提交者以提供正确的数字)。

关于此要求的进一步信息可以通过联系获得 [电子邮件 protected].