10x Datasets
10x Genomics Public Datasets
10x 官方示例数据集合,适合学习 Cell Ranger、Seurat、Scanpy 和 Visium 流程。
适合场景
- 下载示例数据
- 练习单细胞流程
- 测试软件参数
Database Hub
精选全球高质量生信数据库,按组学类型、数据对象和分析场景快速检索。这里不是普通链接合集,而是面向分析项目的数据库入口地图。
46
databases
8
tutorials
12
categories
当前显示 46 / 46 个数据库
高质量公共数据库导航10x Genomics Public Datasets
10x 官方示例数据集合,适合学习 Cell Ranger、Seurat、Scanpy 和 Visium 流程。
适合场景
AlphaFold Protein Structure Database
大规模蛋白结构预测数据库,适合没有实验结构时快速查看结构预测。
适合场景
cBioPortal for Cancer Genomics
癌症多组学可视化和探索平台,适合快速查看突变、表达、CNV 和生存关联。
适合场景
CZ CELLxGENE Discover
交互式单细胞数据浏览和下载平台,适合查看公开 h5ad 数据和细胞注释。
适合场景
ClinVar
临床变异解释数据库,提供变异与疾病、致病性和证据提交记录。
适合场景
European Molecular Biology Laboratory - European Bioinformatics Institute
欧洲核心生物数据平台,整合基因组、蛋白、结构、表达、通路和化学信息资源。
适合场景
European Nucleotide Archive
欧洲核酸和原始测序数据仓库,下载 FASTQ 链接清晰,适合批量下载公共数据。
适合场景
使用示例
1 tutorials批量下载公开测序数据时,ENA 通常能直接提供 fastq_ftp 字段。
fields=run_accession,fastq_ftp,fastq_md5
Ensembl Genome Browser
常用脊椎动物基因组浏览器,提供基因结构、转录本、坐标、同源基因和 BioMart 下载。
适合场景
使用示例
2 tutorials构建 STAR/HISAT2 索引或做 featureCounts 计数前,先统一 genome FASTA 与 GTF 注释版本。
Homo_sapiens.GRCh38.dna.primary_assembly.fa.gz + Homo_sapiens.GRCh38.*.gtf.gz
把 Ensembl gene ID 转换为 gene symbol、Entrez ID 或描述信息。
ENSG00000141510 -> TP53
Genomic Data Commons
NCI 癌症组学数据门户,整合 TCGA 等项目的表达、突变、CNV 和临床数据。
适合场景
使用示例
2 tutorials做肿瘤差异表达、生存分析或免疫浸润分析前,获取 TCGA RNA-seq 数据。
TCGA-LUAD + Transcriptome Profiling + STAR Counts
分析癌症突变谱、驱动基因或突变与生存/分型的关系。
TCGA-BRCA + Masked Somatic Mutation + Clinical
Gene Ontology Resource
基因功能注释标准体系,覆盖生物过程、分子功能和细胞组分。
适合场景
Gene Expression Omnibus
NCBI 功能基因组数据仓库,收录 RNA-seq、芯片、甲基化、ChIP-seq 等项目。
适合场景
使用示例
2 tutorials快速获取论文已整理好的表达矩阵,用于差异分析、WGCNA 或验证候选基因。
GSE + expression matrix + sample metadata
当 GEO 只提供样本信息时,需要跳转 SRA 下载 FASTQ 重新分析。
GSE accession -> SRA Run Selector -> SRR list
Genome Aggregation Database
大规模人群变异频率数据库,适合过滤常见变异和解释稀有变异。
适合场景
Genome Taxonomy Database
基于基因组的细菌和古菌分类数据库,适合宏基因组物种注释和系统发育。
适合场景
NHGRI-EBI GWAS Catalog
GWAS 研究和性状关联变异数据库,适合查 SNP 与疾病/性状关联。
适合场景
Human Cell Atlas Data Portal
人类细胞图谱数据入口,适合寻找组织级单细胞参考数据和细胞类型图谱。
适合场景
Human Protein Atlas
人类蛋白表达、组织定位、细胞定位和病理表达数据库。
适合场景
Kyoto Encyclopedia of Genes and Genomes
通路、代谢、疾病和药物知识库,常用于 KEGG pathway 富集分析。
适合场景
Mouse Genome Informatics
小鼠基因组和功能注释核心数据库,适合小鼠基因、表型和模型查询。
适合场景
EMBL-EBI MGnify
宏基因组数据分析和归档平台,适合查环境样本、微生物群落和功能注释。
适合场景
Molecular Signatures Database
常用基因集数据库,适合 GSEA、GSVA、通路打分和功能解释。
适合场景
National Center for Biotechnology Information
全球最常用的生物信息综合入口,覆盖文献、序列、基因、基因组、变异和表达数据。
适合场景
NCBI Genome Database
NCBI 参考基因组和组装信息入口,适合查物种 genome assembly 和下载 FASTA/GFF。
适合场景
NCBI Taxonomy Database
NCBI 物种分类体系入口,适合查询 taxid、物种层级和分类名称标准化。
适合场景
Protein Data Bank
实验解析蛋白和核酸三维结构数据库,适合结构生物学和功能解释。
适合场景
PubMed Literature Database
生命科学和医学文献检索首选入口,适合查方法论文、PMID 和研究证据。
适合场景
Reactome Pathway Database
人工审核通路数据库,适合人类和模式生物通路富集与机制解释。
适合场景
NCBI Reference Sequence Database
NCBI 人工维护参考序列集合,常用于基因、转录本、蛋白和参考注释。
适合场景
SILVA rRNA Database
高质量 rRNA 序列数据库,常用于 16S/18S 扩增子分析的物种注释。
适合场景
Sequence Read Archive
NCBI 原始测序 reads 数据库,适合下载公开 FASTQ/SRA 用于复现或再分析。
适合场景
使用示例
1 tutorials复现论文测序数据,或把公开 reads 接入自己的 RNA-seq / WGS 流程。
fasterq-dump SRRxxxxxxx --split-files -e 8
STRING Protein Interaction Networks
蛋白互作网络数据库,适合候选基因网络分析和 hub gene 解释。
适合场景
The Arabidopsis Information Resource
拟南芥核心数据库,适合植物基因功能、注释和突变体信息查询。
适合场景
University of California Santa Cruz Genome Browser
经典基因组浏览器,适合查看基因坐标、peak、保守性、表观组和自定义 track。
适合场景
Universal Protein Resource
蛋白序列、功能、结构域、GO 注释和交叉引用的核心数据库。
适合场景
1000 Genomes Project
经典人群基因组项目,提供不同人群的公开变异数据。
适合场景
ArrayExpress Archive
EMBL-EBI 表达实验归档库,包含芯片和测序表达项目。
适合场景
Database of Single Nucleotide Polymorphisms
NCBI SNP 和小变异数据库,适合查询 rsID、变异坐标和基础注释。
适合场景
DNA Data Bank of Japan
日本 DNA 数据库,与 NCBI 和 ENA 共同组成国际核酸序列数据库合作体系。
适合场景
Europe PubMed Central
开放文献平台,适合检索全文、预印本、基金信息和文献引用网络。
适合场景
EMBL-EBI Expression Atlas
提供跨组织、物种、条件的基因表达查询,适合快速查看基因表达模式。
适合场景
FlyBase
果蝇遗传和基因组数据库,适合果蝇基因、突变和表型查询。
适合场景
Gramene Plant Genomics
植物比较基因组数据库,适合作物基因组、同源基因和通路查询。
适合场景
Human BioMolecular Atlas Program
人体组织空间和单细胞多组学图谱项目,适合空间组学和组织定位参考。
适合场景
International Cancer Genome Consortium
国际癌症基因组联盟数据资源,适合跨癌种、跨项目查找癌症组学数据。
适合场景
Broad Institute Single Cell Portal
Broad Institute 单细胞研究数据平台,适合查找研究项目、marker 和可视化结果。
适合场景
WormBase
线虫基因组和遗传学数据库,适合 C. elegans 基因和功能查询。
适合场景
Zebrafish Information Network
斑马鱼模型生物数据库,适合基因、表达、突变体和表型查询。
适合场景