← 返回软件与算法资源类型 Python 包 方法分类 单细胞分析 原始分类 Single-cell 创建时间 2026/6/3
Software & Algorithm Detail
单细胞分析Single-cellPython 包
Scanpy
Python 生态的单细胞分析框架,适合大规模 AnnData 数据处理和可复现脚本化分析。
Benchmark
性能基准测试
当前图表用于比较不同数据规模下的时间消耗和内存消耗。
性能基准测试
Python 3.11 / Scanpy / sparse matrix
Documentation
软件原理、用法与参数
统一使用 Markdown 文档渲染,保留命令行代码块、参数表和示例说明。
Scanpy
工具定位
Scanpy 常用于 Python 工作流中的 scRNA-seq 质控、归一化、聚类、marker 和可视化。
核心思想
以 AnnData 为核心数据结构,结合稀疏矩阵和邻接图算法完成高通量细胞图谱分析。
输入与输出
| 数据对象 | 说明 |
|---|---|
| 10x matrix | 上游分析输入 |
| AnnData h5ad | 上游分析输入 |
| h5ad | 下游解读结果 |
| UMAP | 下游解读结果 |
| Leiden clusters | 下游解读结果 |
示例命令
import scanpy as sc
adata = sc.read_10x_mtx('filtered_feature_bc_matrix')
sc.pp.filter_cells(adata, min_genes=200)
sc.pp.normalize_total(adata)
sc.pp.log1p(adata)
sc.pp.highly_variable_genes(adata)
sc.tl.pca(adata)
sc.pp.neighbors(adata)
sc.tl.umap(adata)
sc.tl.leiden(adata)
解读要点
- Python 环境和包版本要固化,避免 numpy/scipy 版本冲突。
- 大规模数据建议使用 h5ad 中间文件分阶段保存。
- 与 Seurat 互转时要检查 layer、raw、obs 和 var 字段是否一致。