返回数据库导航

Database Tutorial

GDC / TCGA肿瘤组学Database Tutorial

获取突变 MAF 与临床信息

分析癌症突变谱、驱动基因或突变与生存/分型的关系。

数据库
GDC / TCGA
资源类型
肿瘤组学
地区
USA
推荐等级
5/5

Quick Steps

教程步骤速览

先快速看完整操作路径,再进入下方详细教程。

  1. STEP 1

    在 Repository 里选择 Simple Nucleotide Variation。

  2. STEP 2

    下载 Masked Somatic Mutation MAF 文件。

  3. STEP 3

    同步下载 Clinical Supplement 或通过 GDC API 获取病例信息。

Example Query

示例查询

复制这个关键词或编号,可以快速进入数据库检索练习。

TCGA-BRCA + Masked Somatic Mutation + Clinical

Tutorial

数据库使用教程

按教程完成检索、筛选、下载和结果确认。

获取 TCGA 突变 MAF 与临床信息

适用场景

用于分析癌症突变谱、驱动基因、TMB、突变与表达/生存/分型之间的关系。

MAF 下载步骤

  1. 打开 GDC Repository。
  2. Program 选择 TCGA,Project 选择目标癌种。
  3. Data Category 选择 Simple Nucleotide Variation
  4. Data Type 选择 Masked Somatic Mutation
  5. 下载 MAF 文件和 manifest。

临床信息

可以在 GDC Portal 的 Clinical 或 Case 页面下载,也可以通过 API 获取病例、生存、分期等字段。

R 读取示例

library(data.table)
maf <- fread("tcga.maf.gz", skip = "Hugo_Symbol")
table(maf$Variant_Classification)

常见分析

  • 高频突变基因统计。
  • TMB 计算。
  • 突变型 vs 野生型表达差异。
  • 突变状态与总生存期关联。

注意事项

  • MAF 中样本 barcode 要和表达矩阵 barcode 统一截取规则。
  • 临床字段缺失较常见,需要做缺失值统计。
  • TMB 计算要明确外显子区域大小和过滤规则。