返回数据库导航

Database Tutorial

Ensembl基因组与注释Database Tutorial

用 BioMart 做 ID 转换

把 Ensembl gene ID 转换为 gene symbol、Entrez ID 或描述信息。

数据库
Ensembl
资源类型
基因组与注释
地区
Europe
推荐等级
5/5

Quick Steps

教程步骤速览

先快速看完整操作路径,再进入下方详细教程。

  1. STEP 1

    进入 Ensembl BioMart,选择 Ensembl Genes 数据集。

  2. STEP 2

    选择目标物种,并上传或粘贴 gene ID 列表。

  3. STEP 3

    在 Attributes 中勾选 Gene stable ID、Gene name 和 Description 后导出。

Example Query

示例查询

复制这个关键词或编号,可以快速进入数据库检索练习。

ENSG00000141510 -> TP53

Tutorial

数据库使用教程

按教程完成检索、筛选、下载和结果确认。

用 Ensembl BioMart 做 ID 转换

适用场景

当你的表达矩阵是 Ensembl gene ID,但下游富集、作图或报告需要 gene symbol、Entrez ID、描述信息时,可以用 BioMart 批量转换。

操作步骤

  1. 打开 Ensembl BioMart。
  2. Database 选择 Ensembl Genes
  3. Dataset 选择目标物种,例如 Human genes
  4. Filters 中选择 Gene stable ID(s),粘贴基因 ID。
  5. Attributes 中选择 Gene stable IDGene nameNCBI gene IDGene description
  6. 导出 TSV 文件并与表达矩阵合并。

示例输入

ENSG00000141510
ENSG00000157764
ENSG00000012048

R 合并示例

expr <- read.csv("deg_results.csv")
anno <- read.delim("ensembl_biomart.tsv")
merged <- merge(expr, anno, by.x = "gene_id", by.y = "Gene.stable.ID", all.x = TRUE)
write.csv(merged, "deg_results_annotated.csv", row.names = FALSE)

注意事项

  • ID 转换必须匹配物种。
  • Ensembl ID 带版本号时,如 ENSG00000141510.18,通常需要先去掉 .18
  • 多对一映射需要保留原始 ID,避免误合并。