Database Hub

数据库导航

精选全球高质量生信数据库,按组学类型、数据对象和分析场景快速检索。这里不是普通链接合集,而是面向分析项目的数据库入口地图。

46

databases

8

tutorials

12

categories

当前显示 46 / 46 个数据库

高质量公共数据库导航
单细胞与空间组学★★★★★

10x Datasets

10x Genomics Public Datasets

10x 官方示例数据集合,适合学习 Cell Ranger、Seurat、Scanpy 和 Visium 流程。

scRNA-seqVisiumMultiome

适合场景

  • 下载示例数据
  • 练习单细胞流程
  • 测试软件参数
蛋白与结构★★★★★

AlphaFold DB

AlphaFold Protein Structure Database

大规模蛋白结构预测数据库,适合没有实验结构时快速查看结构预测。

Predicted StructureProtein

适合场景

  • 查预测结构
  • 下载 PDB/mmCIF
  • 结构域判断
肿瘤组学★★★★★

cBioPortal

cBioPortal for Cancer Genomics

癌症多组学可视化和探索平台,适合快速查看突变、表达、CNV 和生存关联。

CancerMutationCNVExpression

适合场景

  • 癌症基因查询
  • 突变频率
  • 生存分析
单细胞与空间组学★★★★★

CELLxGENE

CZ CELLxGENE Discover

交互式单细胞数据浏览和下载平台,适合查看公开 h5ad 数据和细胞注释。

scRNA-seqh5adCell Annotation

适合场景

  • 浏览单细胞数据
  • 下载 h5ad
  • 比较细胞类型
变异与临床注释★★★★★

ClinVar

ClinVar

临床变异解释数据库,提供变异与疾病、致病性和证据提交记录。

VariantClinical Significance

适合场景

  • 查变异致病性
  • 临床注释
  • 遗传病解释
综合门户★★★★★

EMBL-EBI

European Molecular Biology Laboratory - European Bioinformatics Institute

欧洲核心生物数据平台,整合基因组、蛋白、结构、表达、通路和化学信息资源。

GenomeExpressionProteinPathway

适合场景

  • 跨库检索
  • 下载表达数据
  • 查蛋白结构
原始测序数据★★★★★

ENA

European Nucleotide Archive

欧洲核酸和原始测序数据仓库,下载 FASTQ 链接清晰,适合批量下载公共数据。

Raw ReadsFASTQSequence

适合场景

  • 下载 FASTQ
  • 检索测序项目
  • 跨库获取原始数据

使用示例

1 tutorials

通过 ENA 获取 FASTQ 直链

查看教程

批量下载公开测序数据时,ENA 通常能直接提供 fastq_ftp 字段。

fields=run_accession,fastq_ftp,fastq_md5

  1. 1. 进入 ENA Browser,输入 SRR/ERR/DRR 或 BioProject 编号。
  2. 2. 在 Run 信息中查看 FASTQ FTP 链接。
  3. 3. 使用 wget、aria2c 或脚本批量下载 fastq_ftp 文件。
基因组与注释★★★★★

Ensembl

Ensembl Genome Browser

常用脊椎动物基因组浏览器,提供基因结构、转录本、坐标、同源基因和 BioMart 下载。

GenomeGene AnnotationGTF

适合场景

  • 查基因坐标
  • 下载 GTF
  • 查同源基因

使用示例

2 tutorials

下载参考基因组与 GTF

查看教程

构建 STAR/HISAT2 索引或做 featureCounts 计数前,先统一 genome FASTA 与 GTF 注释版本。

Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz + Homo_sapiens.GRCh38.*.gtf.gz

  1. 1. 进入 Ensembl FTP,选择物种目录和 release 版本。
  2. 2. 从 fasta 目录下载 genome FASTA,从 gtf 目录下载对应 GTF。
  3. 3. 记录 release 号,并在流程文档中固定该版本。

用 BioMart 做 ID 转换

查看教程

把 Ensembl gene ID 转换为 gene symbol、Entrez ID 或描述信息。

ENSG00000141510 -> TP53

  1. 1. 进入 Ensembl BioMart,选择 Ensembl Genes 数据集。
  2. 2. 选择目标物种,并上传或粘贴 gene ID 列表。
  3. 3. 在 Attributes 中勾选 Gene stable ID、Gene name 和 Description 后导出。
肿瘤组学★★★★★

GDC / TCGA

Genomic Data Commons

NCI 癌症组学数据门户,整合 TCGA 等项目的表达、突变、CNV 和临床数据。

CancerRNA-seqMutationClinical

适合场景

  • 下载 TCGA
  • 肿瘤表达分析
  • 突变和临床关联

使用示例

2 tutorials

下载 TCGA 表达矩阵

查看教程

做肿瘤差异表达、生存分析或免疫浸润分析前,获取 TCGA RNA-seq 数据。

TCGA-LUAD + Transcriptome Profiling + STAR Counts

  1. 1. 进入 GDC Portal,选择 Program = TCGA 和目标癌种项目。
  2. 2. 在 Data Category 中选择 Transcriptome Profiling。
  3. 3. 选择 HTSeq Counts 或 STAR Counts 后加入 Cart,并下载 manifest。

获取突变 MAF 与临床信息

查看教程

分析癌症突变谱、驱动基因或突变与生存/分型的关系。

TCGA-BRCA + Masked Somatic Mutation + Clinical

  1. 1. 在 Repository 里选择 Simple Nucleotide Variation。
  2. 2. 下载 Masked Somatic Mutation MAF 文件。
  3. 3. 同步下载 Clinical Supplement 或通过 GDC API 获取病例信息。
通路与功能富集★★★★★

Gene Ontology

Gene Ontology Resource

基因功能注释标准体系,覆盖生物过程、分子功能和细胞组分。

OntologyAnnotation

适合场景

  • GO 富集
  • 功能注释
  • 基因集解释
转录组表达★★★★★

GEO

Gene Expression Omnibus

NCBI 功能基因组数据仓库,收录 RNA-seq、芯片、甲基化、ChIP-seq 等项目。

RNA-seqMicroarrayExpression Matrix

适合场景

  • 找表达数据
  • 下载表达矩阵
  • 复现论文

使用示例

2 tutorials

下载 GEO 表达矩阵

查看教程

快速获取论文已整理好的表达矩阵,用于差异分析、WGCNA 或验证候选基因。

GSE + expression matrix + sample metadata

  1. 1. 用 GSE 编号进入 GEO Series 页面。
  2. 2. 查看 Supplementary files 是否包含表达矩阵或 count matrix。
  3. 3. 下载 matrix 后检查样本分组、探针注释和基因 ID 类型。

从 GEO 追踪到 SRA 原始数据

查看教程

当 GEO 只提供样本信息时,需要跳转 SRA 下载 FASTQ 重新分析。

GSE accession -> SRA Run Selector -> SRR list

  1. 1. 在 GEO 样本页面查找 SRA Run Selector 链接。
  2. 2. 导出 RunInfo 表,获得 SRR 编号和样本对应关系。
  3. 3. 按样本分组整理 metadata,再进入 SRA/ENA 下载。
变异与临床注释★★★★★

gnomAD

Genome Aggregation Database

大规模人群变异频率数据库,适合过滤常见变异和解释稀有变异。

VariantAllele FrequencyVCF

适合场景

  • 查人群频率
  • 过滤常见变异
  • 稀有病分析
微生物与宏基因组★★★★★

GTDB

Genome Taxonomy Database

基于基因组的细菌和古菌分类数据库,适合宏基因组物种注释和系统发育。

Microbial GenomeTaxonomy

适合场景

  • 微生物分类
  • 宏基因组注释
  • 系统发育
变异与临床注释★★★★★

GWAS Catalog

NHGRI-EBI GWAS Catalog

GWAS 研究和性状关联变异数据库,适合查 SNP 与疾病/性状关联。

GWASVariantTrait

适合场景

  • 查性状关联
  • 候选位点解释
  • 遗传关联证据
单细胞与空间组学★★★★★

Human Cell Atlas

Human Cell Atlas Data Portal

人类细胞图谱数据入口,适合寻找组织级单细胞参考数据和细胞类型图谱。

scRNA-seqSpatialCell Atlas

适合场景

  • 查人类单细胞图谱
  • 找参考数据
  • 细胞类型注释参考
蛋白与结构★★★★★

Human Protein Atlas

Human Protein Atlas

人类蛋白表达、组织定位、细胞定位和病理表达数据库。

Protein ExpressionTissuePathology

适合场景

  • 查组织表达
  • 查细胞定位
  • 肿瘤蛋白表达
通路与功能富集★★★★★

KEGG

Kyoto Encyclopedia of Genes and Genomes

通路、代谢、疾病和药物知识库,常用于 KEGG pathway 富集分析。

PathwayGene SetMetabolism

适合场景

  • KEGG 富集
  • 代谢通路
  • 通路图解释
模式生物与植物★★★★★

MGI

Mouse Genome Informatics

小鼠基因组和功能注释核心数据库,适合小鼠基因、表型和模型查询。

Mouse GenePhenotypeModel

适合场景

  • 小鼠基因
  • 表型
  • 疾病模型
微生物与宏基因组★★★★★

MGnify

EMBL-EBI MGnify

宏基因组数据分析和归档平台,适合查环境样本、微生物群落和功能注释。

MetagenomicsAmpliconAssembly

适合场景

  • 宏基因组项目
  • 环境微生物
  • 功能注释
通路与功能富集★★★★★

MSigDB

Molecular Signatures Database

常用基因集数据库,适合 GSEA、GSVA、通路打分和功能解释。

Gene SetPathway

适合场景

  • GSEA
  • GSVA
  • 通路打分
综合门户★★★★★

NCBI

National Center for Biotechnology Information

全球最常用的生物信息综合入口,覆盖文献、序列、基因、基因组、变异和表达数据。

SequenceGenomeGeneLiterature

适合场景

  • 查基因
  • 查序列
  • 查文献
基因组与注释★★★★★

NCBI Genome

NCBI Genome Database

NCBI 参考基因组和组装信息入口,适合查物种 genome assembly 和下载 FASTA/GFF。

GenomeAssemblyFASTAGFF

适合场景

  • 下载参考基因组
  • 查 assembly
  • 查物种基因组版本
微生物与宏基因组★★★★★

NCBI Taxonomy

NCBI Taxonomy Database

NCBI 物种分类体系入口,适合查询 taxid、物种层级和分类名称标准化。

TaxonomySpecies

适合场景

  • 查 taxid
  • 物种名称标准化
  • 分类层级
蛋白与结构★★★★★

PDB

Protein Data Bank

实验解析蛋白和核酸三维结构数据库,适合结构生物学和功能解释。

Protein StructurePDB

适合场景

  • 查蛋白结构
  • 下载 PDB
  • 结构功能解释
文献与知识★★★★★

PubMed

PubMed Literature Database

生命科学和医学文献检索首选入口,适合查方法论文、PMID 和研究证据。

LiteraturePMID

适合场景

  • 查论文
  • 查方法出处
  • 找综述
通路与功能富集★★★★★

Reactome

Reactome Pathway Database

人工审核通路数据库,适合人类和模式生物通路富集与机制解释。

PathwayReactionGene Set

适合场景

  • 通路富集
  • 机制解释
  • 通路层级浏览
基因组与注释★★★★★

RefSeq

NCBI Reference Sequence Database

NCBI 人工维护参考序列集合,常用于基因、转录本、蛋白和参考注释。

TranscriptProteinGenome

适合场景

  • 查标准转录本
  • 查蛋白序列
  • 参考注释
微生物与宏基因组★★★★★

SILVA

SILVA rRNA Database

高质量 rRNA 序列数据库,常用于 16S/18S 扩增子分析的物种注释。

rRNATaxonomy

适合场景

  • 16S 注释
  • rRNA 分类
  • 扩增子分析
原始测序数据★★★★★

SRA

Sequence Read Archive

NCBI 原始测序 reads 数据库,适合下载公开 FASTQ/SRA 用于复现或再分析。

Raw ReadsFASTQSRA

适合场景

  • 下载 FASTQ
  • 复现论文数据
  • 批量公共数据挖掘

使用示例

1 tutorials

从 SRR 编号下载 FASTQ

查看教程

复现论文测序数据,或把公开 reads 接入自己的 RNA-seq / WGS 流程。

fasterq-dump SRRxxxxxxx --split-files -e 8

  1. 1. 在 SRA 页面检索 BioProject、GSE 或 SRR 编号。
  2. 2. 记录 SRR run accession,并使用 SRA Toolkit 下载。
  3. 3. 用 fasterq-dump 转换 FASTQ,再用 gzip 压缩并进入质控流程。
通路与功能富集★★★★★

STRING

STRING Protein Interaction Networks

蛋白互作网络数据库,适合候选基因网络分析和 hub gene 解释。

PPINetwork

适合场景

  • 蛋白互作
  • 网络分析
  • hub gene 解释
模式生物与植物★★★★★

TAIR

The Arabidopsis Information Resource

拟南芥核心数据库,适合植物基因功能、注释和突变体信息查询。

GeneAnnotationMutant

适合场景

  • 拟南芥基因
  • 植物注释
  • 突变体查询
基因组与注释★★★★★

UCSC Genome Browser

University of California Santa Cruz Genome Browser

经典基因组浏览器,适合查看基因坐标、peak、保守性、表观组和自定义 track。

Genome BrowserTracksAnnotation

适合场景

  • 看基因组区域
  • 上传自定义 track
  • 查保守性
蛋白与结构★★★★★

UniProt

Universal Protein Resource

蛋白序列、功能、结构域、GO 注释和交叉引用的核心数据库。

ProteinFunctionFASTA

适合场景

  • 查蛋白功能
  • 查结构域
  • ID 转换
变异与临床注释★★★★

1000 Genomes

1000 Genomes Project

经典人群基因组项目,提供不同人群的公开变异数据。

WGSVariantVCF

适合场景

  • 查人群变异
  • 下载 VCF
  • 方法测试
转录组表达★★★★

ArrayExpress

ArrayExpress Archive

EMBL-EBI 表达实验归档库,包含芯片和测序表达项目。

ExpressionMicroarrayRNA-seq

适合场景

  • 检索表达实验
  • 下载补充矩阵
  • 查实验设计
变异与临床注释★★★★

dbSNP

Database of Single Nucleotide Polymorphisms

NCBI SNP 和小变异数据库,适合查询 rsID、变异坐标和基础注释。

SNPVariantrsID

适合场景

  • 查 rsID
  • 变异坐标转换
  • 基础 SNP 注释
综合门户★★★★

DDBJ

DNA Data Bank of Japan

日本 DNA 数据库,与 NCBI 和 ENA 共同组成国际核酸序列数据库合作体系。

SequenceRaw ReadsGenome

适合场景

  • 提交序列
  • 检索核酸数据
  • 下载 DRA 数据
文献与知识★★★★

Europe PMC

Europe PubMed Central

开放文献平台,适合检索全文、预印本、基金信息和文献引用网络。

LiteratureFull Text

适合场景

  • 查开放全文
  • 查预印本
  • 追踪引用
转录组表达★★★★

Expression Atlas

EMBL-EBI Expression Atlas

提供跨组织、物种、条件的基因表达查询,适合快速查看基因表达模式。

ExpressionBaselineDifferential

适合场景

  • 查基因表达
  • 看组织特异性
  • 表达模式探索
模式生物与植物★★★★

FlyBase

FlyBase

果蝇遗传和基因组数据库,适合果蝇基因、突变和表型查询。

GeneGeneticsPhenotype

适合场景

  • 果蝇基因
  • 突变体
  • 表型
模式生物与植物★★★★

Gramene

Gramene Plant Genomics

植物比较基因组数据库,适合作物基因组、同源基因和通路查询。

Plant GenomeGenePathway

适合场景

  • 作物基因组
  • 植物同源基因
  • 比较基因组
单细胞与空间组学★★★★

HuBMAP

Human BioMolecular Atlas Program

人体组织空间和单细胞多组学图谱项目,适合空间组学和组织定位参考。

SpatialSingle-cellProteomics

适合场景

  • 查空间组学数据
  • 组织图谱
  • 多组学参考
肿瘤组学★★★★

ICGC

International Cancer Genome Consortium

国际癌症基因组联盟数据资源,适合跨癌种、跨项目查找癌症组学数据。

CancerWGSMutation

适合场景

  • 查癌症队列
  • 跨项目比较
  • 癌症变异
单细胞与空间组学★★★★

Single Cell Portal

Broad Institute Single Cell Portal

Broad Institute 单细胞研究数据平台,适合查找研究项目、marker 和可视化结果。

scRNA-seqMetadataVisualization

适合场景

  • 查单细胞研究
  • 看 marker
  • 下载数据
模式生物与植物★★★★

WormBase

WormBase

线虫基因组和遗传学数据库,适合 C. elegans 基因和功能查询。

GeneGenomePhenotype

适合场景

  • 线虫基因
  • 功能注释
  • 遗传学信息
模式生物与植物★★★★

ZFIN

Zebrafish Information Network

斑马鱼模型生物数据库,适合基因、表达、突变体和表型查询。

GeneExpressionPhenotype

适合场景

  • 斑马鱼基因
  • 表达模式
  • 突变体