返回数据库导航

Database Tutorial

GEO转录组表达Database Tutorial

从 GEO 追踪到 SRA 原始数据

当 GEO 只提供样本信息时,需要跳转 SRA 下载 FASTQ 重新分析。

数据库
GEO
资源类型
转录组表达
地区
USA
推荐等级
5/5

Quick Steps

教程步骤速览

先快速看完整操作路径,再进入下方详细教程。

  1. STEP 1

    在 GEO 样本页面查找 SRA Run Selector 链接。

  2. STEP 2

    导出 RunInfo 表,获得 SRR 编号和样本对应关系。

  3. STEP 3

    按样本分组整理 metadata,再进入 SRA/ENA 下载。

Example Query

示例查询

复制这个关键词或编号,可以快速进入数据库检索练习。

GSE accession -> SRA Run Selector -> SRR list

Tutorial

数据库使用教程

按教程完成检索、筛选、下载和结果确认。

从 GEO 追踪到 SRA 原始数据

适用场景

GEO 页面没有可直接使用的表达矩阵,或者你希望统一用自己的流程重新分析公开 RNA-seq、WGS、CUT&Tag 数据。

操作步骤

  1. 进入 GEO Series 页面,找到 SRA Run Selector 链接。
  2. 在 Run Selector 中下载 RunInfo.csv
  3. 提取 RunSampleNameLibraryLayoutPlatform 等字段。
  4. 根据 SRR 编号用 SRA Toolkit 或 ENA 下载 FASTQ。
  5. 建立 metadata.tsv,记录样本分组和 SRR 对应关系。

元数据整理示例

runinfo <- read.csv("SraRunInfo.csv")
metadata <- runinfo[, c("Run", "SampleName", "LibraryLayout", "Platform")]
write.table(metadata, "metadata.tsv", sep = "\t", row.names = FALSE, quote = FALSE)

下载衔接

cut -f1 metadata/srr_list.txt | while read srr
do
  fasterq-dump "$srr" --split-files -e 8 -O fastq
done

注意事项

  • 一个 GSM 可能对应多个 SRR,需要合并同一样本的多个 lane。
  • 先检查 LibraryLayout,避免单端数据误按双端流程跑。
  • 公开数据再分析必须记录原始 accession,方便结果追溯。