返回软件与算法

Software & Algorithm Detail

单细胞分析Single-cellPython 包

Scanpy

Python 生态的单细胞分析框架,适合大规模 AnnData 数据处理和可复现脚本化分析。

资源类型
Python 包
方法分类
单细胞分析
原始分类
Single-cell
创建时间
2026/6/3

Benchmark

性能基准测试

当前图表用于比较不同数据规模下的时间消耗和内存消耗。

性能基准测试

Python 3.11 / Scanpy / sparse matrix

Benchmark

Documentation

软件原理、用法与参数

统一使用 Markdown 文档渲染,保留命令行代码块、参数表和示例说明。

Scanpy

工具定位

Scanpy 常用于 Python 工作流中的 scRNA-seq 质控、归一化、聚类、marker 和可视化。

核心思想

以 AnnData 为核心数据结构,结合稀疏矩阵和邻接图算法完成高通量细胞图谱分析。

输入与输出

数据对象说明
10x matrix上游分析输入
AnnData h5ad上游分析输入
h5ad下游解读结果
UMAP下游解读结果
Leiden clusters下游解读结果

示例命令

import scanpy as sc
adata = sc.read_10x_mtx('filtered_feature_bc_matrix')
sc.pp.filter_cells(adata, min_genes=200)
sc.pp.normalize_total(adata)
sc.pp.log1p(adata)
sc.pp.highly_variable_genes(adata)
sc.tl.pca(adata)
sc.pp.neighbors(adata)
sc.tl.umap(adata)
sc.tl.leiden(adata)

解读要点

  1. Python 环境和包版本要固化,避免 numpy/scipy 版本冲突。
  2. 大规模数据建议使用 h5ad 中间文件分阶段保存。
  3. 与 Seurat 互转时要检查 layer、raw、obs 和 var 字段是否一致。