DBSNP数据库是一个由NCBI维护的大型数据库,专门收录人类基因组中的单核苷酸多态性(SNP)和短插入/缺失(indels)等遗传变异信息。以下是关于DBSNP数据库的特色功能介绍:
特色功能
- 收录内容全面:DBSNP数据库不仅收录了SNP和短插入/缺失多态性,还包括微卫星标记和短重复序列等数据。
- 数据丰富:DBSNP数据库已收集了超过1.84亿份提交文件,代表了55种生物的超过6400万种不同变种。
- 支持多种查询方式:用户可以通过rs号、ss号等多种方式进行查询,获取特定SNP的详细信息。
- 数据更新和维护:DBSNP数据库不断更新,以包含最新的遗传变异数据,确保数据的准确性和完整性。
- 数据下载和访问:DBSNP数据库提供了多种格式的数据下载,包括FASTA格式的序列数据,方便用户进行进一步分析。
数据库结构
DBSNP数据库采用“中心和辐条”模型,中心是包含主要表格的dbSNPmain,而辐条是包含具体生物体数据的子数据库。
查询示例
以检索NAT5的不同SNP的基因序列为例,用户可以通过NCBI首页进入DBSNP,输入rs号来查询特定SNP的详细信息,包括突变类型、碱基变化情况、人群频率等。
DBSNP数据库通过其全面的数据收录、丰富的查询方式、持续的数据更新和维护,以及便捷的数据下载和访问功能,为遗传学研究人员提供了一个强大的工具,帮助他们更好地理解和分析遗传变异。