← 返回数据库导航数据库 GDC / TCGA 资源类型 肿瘤组学 地区 USA 推荐等级 5/5
Database Tutorial
GDC / TCGA肿瘤组学Database Tutorial
获取突变 MAF 与临床信息
分析癌症突变谱、驱动基因或突变与生存/分型的关系。
Quick Steps
教程步骤速览
先快速看完整操作路径,再进入下方详细教程。
- STEP 1
在 Repository 里选择 Simple Nucleotide Variation。
- STEP 2
下载 Masked Somatic Mutation MAF 文件。
- STEP 3
同步下载 Clinical Supplement 或通过 GDC API 获取病例信息。
Example Query
示例查询
复制这个关键词或编号,可以快速进入数据库检索练习。
TCGA-BRCA + Masked Somatic Mutation + Clinical
Tutorial
数据库使用教程
按教程完成检索、筛选、下载和结果确认。
获取 TCGA 突变 MAF 与临床信息
适用场景
用于分析癌症突变谱、驱动基因、TMB、突变与表达/生存/分型之间的关系。
MAF 下载步骤
- 打开 GDC Repository。
- Program 选择
TCGA,Project 选择目标癌种。 - Data Category 选择
Simple Nucleotide Variation。 - Data Type 选择
Masked Somatic Mutation。 - 下载 MAF 文件和 manifest。
临床信息
可以在 GDC Portal 的 Clinical 或 Case 页面下载,也可以通过 API 获取病例、生存、分期等字段。
R 读取示例
library(data.table)
maf <- fread("tcga.maf.gz", skip = "Hugo_Symbol")
table(maf$Variant_Classification)
常见分析
- 高频突变基因统计。
- TMB 计算。
- 突变型 vs 野生型表达差异。
- 突变状态与总生存期关联。
注意事项
- MAF 中样本 barcode 要和表达矩阵 barcode 统一截取规则。
- 临床字段缺失较常见,需要做缺失值统计。
- TMB 计算要明确外显子区域大小和过滤规则。