← 返回数据库导航数据库 GEO 资源类型 转录组表达 地区 USA 推荐等级 5/5
Database Tutorial
GEO转录组表达Database Tutorial
从 GEO 追踪到 SRA 原始数据
当 GEO 只提供样本信息时,需要跳转 SRA 下载 FASTQ 重新分析。
Quick Steps
教程步骤速览
先快速看完整操作路径,再进入下方详细教程。
- STEP 1
在 GEO 样本页面查找 SRA Run Selector 链接。
- STEP 2
导出 RunInfo 表,获得 SRR 编号和样本对应关系。
- STEP 3
按样本分组整理 metadata,再进入 SRA/ENA 下载。
Example Query
示例查询
复制这个关键词或编号,可以快速进入数据库检索练习。
GSE accession -> SRA Run Selector -> SRR list
Tutorial
数据库使用教程
按教程完成检索、筛选、下载和结果确认。
从 GEO 追踪到 SRA 原始数据
适用场景
GEO 页面没有可直接使用的表达矩阵,或者你希望统一用自己的流程重新分析公开 RNA-seq、WGS、CUT&Tag 数据。
操作步骤
- 进入 GEO Series 页面,找到 SRA Run Selector 链接。
- 在 Run Selector 中下载
RunInfo.csv。 - 提取
Run、SampleName、LibraryLayout、Platform等字段。 - 根据 SRR 编号用 SRA Toolkit 或 ENA 下载 FASTQ。
- 建立
metadata.tsv,记录样本分组和 SRR 对应关系。
元数据整理示例
runinfo <- read.csv("SraRunInfo.csv")
metadata <- runinfo[, c("Run", "SampleName", "LibraryLayout", "Platform")]
write.table(metadata, "metadata.tsv", sep = "\t", row.names = FALSE, quote = FALSE)
下载衔接
cut -f1 metadata/srr_list.txt | while read srr
do
fasterq-dump "$srr" --split-files -e 8 -O fastq
done
注意事项
- 一个 GSM 可能对应多个 SRR,需要合并同一样本的多个 lane。
- 先检查 LibraryLayout,避免单端数据误按双端流程跑。
- 公开数据再分析必须记录原始 accession,方便结果追溯。