深度报道的大肠杆菌蛋白质组使错误发现率的评估简单proteogenomic实验。
文章的细节
-
引用
-
克鲁格K, Carpy Behrends G,电气自动方式K,苏亚雷斯数控,Macek B
深度报道的大肠杆菌蛋白质组使错误发现率的评估简单proteogenomic实验。
摩尔细胞蛋白质组学。2013年11月,12 (11):3420 - 30。doi: 10.1074 / mcp.M113.029165。Epub 2013 8月1。
- PubMed ID
-
23908556 (在PubMed]
- 文摘
-
最新进展在质谱(MS)导致了猎枪蛋白质组学的应用提高到基因组注释的细化。典型的“proteo-genomic”工作流依靠肽MS / MS谱到数据库的映射派生通过six-frame基因组序列的翻译。这些数据库包含大部分的假蛋白质序列,使得统计信心产生的肽谱匹配难以评估。这里我们进行了全面的分析大肠杆菌蛋白质组使用LTQ-Orbitrap女士并绘制相应的MS / MS谱到six-frame翻译的大肠杆菌基因组。我们假设的蛋白质编码部分大肠杆菌基因组方法完整的注释和大多数六frame-specific(小说)肽谱匹配可以被视为鉴定假阳性。我们证实我们的假设表明,小说的后验误差概率分布是几乎相同的逆转(假)打击;这使我们估算出灵敏度、特异性、准确性,和错误发现率在一个典型的细菌proteo-genomic数据集。我们使用两个互补的计算框架进行处理和统计评估MS / MS数据:MaxQuant Trans-Proteomic管道。我们表明,MaxQuant达到一个更加敏感的six-frame数据库搜索与一个可接受的错误发现率,因此适合全球基因组reannotation应用程序,而Trans-Proteomic管道达到更高的特异性和非常适合高信任度的验证。使用一个小和好的注释细菌基因组使我们解决基因组覆盖率达到的最先进的细菌蛋白质组学:鉴定肽序列映射到所有表达大肠杆菌蛋白质但覆盖31.7%的蛋白编码基因序列。 Our results show that false discovery rates can be substantially underestimated even in "simple" proteo-genomic experiments obtained by means of high-accuracy MS and point to the necessity of further improvements concerning the coverage of peptide sequences by MS-based methods.