返回数据库导航

Database Tutorial

GEO转录组表达Database Tutorial

下载 GEO 表达矩阵

快速获取论文已整理好的表达矩阵,用于差异分析、WGCNA 或验证候选基因。

数据库
GEO
资源类型
转录组表达
地区
USA
推荐等级
5/5

Quick Steps

教程步骤速览

先快速看完整操作路径,再进入下方详细教程。

  1. STEP 1

    用 GSE 编号进入 GEO Series 页面。

  2. STEP 2

    查看 Supplementary files 是否包含表达矩阵或 count matrix。

  3. STEP 3

    下载 matrix 后检查样本分组、探针注释和基因 ID 类型。

Example Query

示例查询

复制这个关键词或编号,可以快速进入数据库检索练习。

GSE + expression matrix + sample metadata

Tutorial

数据库使用教程

按教程完成检索、筛选、下载和结果确认。

下载 GEO 表达矩阵

适用场景

当你想快速复用公开表达数据做差异分析、WGCNA、免疫浸润或候选基因验证时,优先查看 GEO 是否提供整理好的表达矩阵。

操作步骤

  1. 打开 GEO,输入 GSE 编号。
  2. 在 Series 页面查看实验设计、样本分组和平台信息。
  3. 找到 Supplementary files,下载 count matrix、TPM matrix 或 normalized matrix。
  4. 下载 sample metadata,整理 group、batch、treatment 等字段。
  5. 检查表达矩阵是 raw counts、TPM 还是芯片 normalized intensity。

R 读取示例

expr <- read.delim("GSE_expression_matrix.tsv", row.names = 1, check.names = FALSE)
meta <- read.delim("GSE_sample_metadata.tsv")

dim(expr)
head(meta)

判断能否用于 DESeq2

数据类型能否直接用于 DESeq2
raw counts可以
TPM/FPKM不建议
normalized microarray不可以,用 limma

常见问题

  • GEO 矩阵列名与样本表不一致时,先建立 GSM 到 sample name 的映射。
  • 芯片数据需要探针注释,不要直接把 probe ID 当 gene symbol。
  • 如果只有 SRA 链接,没有矩阵,需要走 SRA/ENA 下载 FASTQ 重新分析。