返回软件与算法

Software & Algorithm Detail

变异检测Variant Calling命令行软件

GATK HaplotypeCaller

GATK 体系中用于 germline SNV/Indel 检测的核心工具,常见于 WGS/WES 流程。

资源类型
命令行软件
方法分类
变异检测
原始分类
Variant Calling
创建时间
2026/6/3

Benchmark

性能基准测试

当前图表用于比较不同数据规模下的时间消耗和内存消耗。

性能基准测试

GATK 4 / 32 threads / GRCh38 resource bundle

Benchmark

Documentation

软件原理、用法与参数

统一使用 Markdown 文档渲染,保留命令行代码块、参数表和示例说明。

GATK HaplotypeCaller

工具定位

HaplotypeCaller 是标准 germline variant calling 的核心模块,适合单样本或 GVCF 联合分析流程。

核心思想

在活跃区域局部重组装 haplotype,再对 reads 与候选 haplotype 进行概率建模并输出变异。

输入与输出

数据对象说明
BQSR 后 BAM上游分析输入
参考基因组 FASTA上游分析输入
GVCF下游解读结果
cohort VCF下游解读结果

示例命令

gatk HaplotypeCaller -R GRCh38.fa -I sample.bam -O sample.g.vcf.gz -ERC GVCF
gatk GenotypeGVCFs -R GRCh38.fa -V cohort.g.vcf.gz -O cohort.vcf.gz

解读要点

  1. GATK 参考资源、known-sites 和基因组版本必须一致。
  2. 队列项目建议使用 GVCF joint genotyping。
  3. 硬过滤或 VQSR 阈值要按项目规模和物种资源选择。