Seurat使用
R中Seurat常规操作
Seurat pipline
背景
Seurat 是一个R包,专为单细胞RNA-seq数据的QC、分析和探索而设计。Seurat旨在使用户能够从单细胞转录组学测量中识别和解释异质性来源,并整合不同类型的单细胞数据。
Seurat 是由 Andrew Satija 实验室开发并维护的、最流行和最具影响力的单细胞数据分析软件包之一,它的发展历史与单细胞测序技术本身的进步紧密相连。
- Seurat 在 2015 年首次发布,最初主要用于流式细胞仪(FACS)分选的细胞群体和早期低通量单细胞测序数据的分析。
- V2 标志着 Seurat 成为一个完整的 scRNA-seq 分析流程工具。它整合了单细胞分析的关键步骤:
- 质量控制 (QC): 基于基因数和 UMI 计数进行筛选。
- 归一化与数据缩放: 处理计数数据的异质性。
- 降维: 引入 主成分分析 (PCA)。
- 聚类分析: 用于鉴定细胞类型。
- 可视化: 使用 t-SNE 进行二维可视化。
- Seurat V3 (2018年 - 2020年):数据整合与多模态分析
- 引入 “整合” (Integration) 功能,使用 CCA (Canonical Correlation Analysis) 和 MNN (Mutual Nearest Neighbors) 等方法,有效地去除批次效应
- 采用更擅长保留全局结构的 UMAP (Uniform Manifold Approximation and Projection) 替代 t-SNE 作为默认降维可视化方法。
- V4:空间数据整合
- 新增空间转录组支持: 随着 空间转录组学 技术(如 Visium)的兴起,V4 专门加入了处理和分析具有空间位置信息的单细胞数据的模块。
- 多模态和对象结构优化: 进一步优化了多模态数据处理流程。
- V5: 统一数据结构与多组学框架
- V5 的目标是提供一个更加统一和灵活的框架(新的 Assay 对象结构),以适应所有形式的单细胞和空间多组学数据(如 scATAC-seq、空间蛋白组学、scRNA-seq 等)
- SeuratObject 结构: 增强了底层数据结构,使得数据的存储和管理更加模块化和高效,便于同时管理和分析多种组学数据
