健我头条 > 生物谷 > 正文

Science:震惊!公共数据库存在非常高的测序错误

生物谷31阅读2017-02-20

本文系生物谷原创编译,欢迎分享,转载须授权!

在一项新的研究中,来自新英格兰生物学实验室公司(New England Biolabs Inc., 简称NEB)的一个研究团队发现储存在公共数据库中的DNA测序样品具有比期待中更高的低频突变错误率(low-frequency mutation error rate)。他们描述了他们如何开发出一种能够计算DNA测序样品中错误率的算法,以及当在两种公共基因组数据库中运行时,它揭示了什么。相关研究结果发表在2017年2月17日的Science期刊上,论文标题为“DNA damage is a pervasive cause of sequencing errors, directly confounding variant identification”。

当研究DNA在导致癌性肿瘤(cancerous tumor)的细胞突变中的作用时,研究人员依赖于储存测序信息的数据库的准确性,比如当尝试着找出趋势时,依赖于这些数据库中的信息寻找共性的那些研究人员。这些研究涉及对发生低频突变的不同人的基因组与总体人口的基因组进行比较,并且利用他们发现的结果构建癌症数据集。但是如今,NEB团队开展的这项研究对公共数据库的准确性提出质疑。

为了测量一种给定的数据集的准确率,NEB团队开发出一种算法,该算法能够被用来计算因测序过程期间发生DNA损伤而表现出突变(不是自然发生的突变)的序列数量。该团队随后利用他们的算法计算几种公共数据库(最为知名的是千人基因组计划和TCGA数据库的一部分)的错误率,他们报道他们发现这两种知名数据库的错误率分别是41%和73%。

NEB团队注意到他们的算法不能够揭示出这些非自然发生的DNA损伤的来源,但是提出它可能是由于在进行测序之前使用的某些样品制备技术导致的。他们也指出为测序仪开发出的其他算法能够测试它们自己的测序错误,但是由于缺乏非常有说服力的理由,它们并没有被广泛地使用。他们指出DNA测序仪开始这样做了。他们也注意到已在开发的新工具可能有助在制备期间让DNA损伤最小化,而且它们的使用可能改进公共数据库的准确性。

原始出处:

Lixin Chen, Pingfang Liu, Thomas C. Evans Jr. et al. DNA damage is a pervasive cause of sequencing errors, directly confounding variant identification. Science, 17 Feb 2017, 355(6326):752-756, doi:10.1126/science.aai8690.

本文为头条号作者发布,不代表今日头条立场。

本文来自其他网站,不代表健我头条立场和观点,如若转载,请注明出处:https://news.jianwo.com/detail_12194.html如有版权问题,请联系客服配合您删除这篇文章。

  • 0

参与讨论

  • 后参与评论...

生物谷

最近文章
相关文章
关注我们

全国800多万医院管理运营人的家园

  • Copyright©jianwo.com 版权所有 2021 All Rights Reserved
  • |
  • 京ICP备17057397号-5
  • |
  • 增值电信业务经营许可证:京B2-20220198
  • |
  • 全国统一客服:010-56019139