编号
zgly0001630469
文献类型
期刊论文
文献题名
批量下载GenBank基因序列数据的新工具——NCBIminer
作者
徐晓婷
王志恒
DimitarDimitrov
CarstenRahbek
作者单位
北京大学城市与环境学院生态学系
北京大学地表过程分析与模拟教育部重点实验室
NaturalHistoryMuseum
UniversityofOslo
Oslo
Norway
CenterforMacroecology
EvolutionandClimate
NaturalHistoryMuseumofDenmark
UniversityofCopenhagen
ImperialCollegeLondon
GrandChallengesinEcos
母体文献
生物多样性
年卷期
2015年04期
年份
2015
分类号
Q811.4
关键词
GenBank
生物信息学
基因序列
系统进化
DNA
核苷酸序列
文摘内容
核苷酸序列是生物体遗传信息的载体,是现代生物学和生态学的基础数据。随着测序技术的进步,大量核苷酸序列被提取并存储在公共数据平台中,其中Gen Bank(http://www.ncbi.nlm.nih.gov/genbank/)是目前最大的核苷酸序列数据平台之一。截至2015年2月,该平台收录核苷酸序列总数已超过1.8亿条、覆盖全球超过30万个物种。但如何从如此海量的数据中准确、快速查找并下载所需数据已成为限制基因数据广泛使用的障碍之一。为此,我们开发了一款可高效、准确下载Gen Bank数据的生物信息学软件NCBIminer。NCBIminer可根据用户提供的核苷酸序列名称、数据类型、一或多条初始化参考序列,查找并下载用户指定的多个物种或类群的特定基因序列数据。该软件下载地址为https://github.com/greengirl/NCBIminer/releases/,可在Windows、Linux和MAC操作系统下免费使用;同时,其操作简单,用户无需生物信息学背景。为方便该软件的使用,本文将介绍该软件的工作流程与算法、安装及使用过程中的参数设置等。