STOmics logo 时空组学

EN
SAW软件操作手册 SAW软件操作手册 SAW软件操作手册
SAW软件操作手册
搜 索
SAW软件操作手册
背景介绍
1.软件描述
Stereo-seq分析流程软件包[1](Stereo-seq Analysis Workflow,SAW)整合了多个Stereo-seq空间组基因表达分析工具,这些工具可用于还原以及可视化测序数据在芯片上的空间表达信息。Stereo-seq[2]原始测序数据经SAW分析后,得到可以用于下游分析的空间表达矩阵。为满足更加便捷的数据分析,SAW空间转录组分析具有13步必要流程,空间蛋白组&转录组分析具有21步必要流程,另外还有其他辅助分析工具。
splitMask通过Q4 FASTQ文件里的CID indexing,将Stereo-seq芯片 T mask 文件拆分成多个部分。
CIDCount计算Stereo-seq芯片T mask 文件的CID数量,预估mapping过程中的所需内存(建议在mapping之前使用该模块)
mapping将记录于FASTQ文件的Stereo-seq原位捕获的测序reads和空间信息对应。将reads与参考基因组比对,并生成排序后的BAM文件;
merge (可选)合并CID(类似barcode)对应reads数列表。仅应用于多对FASTQ数据合并分析;
count读取mapping生成的BAM文件,对比对结果进行基因注释、去重、和基因表达分析;
register用于将显微拍照的组织切片影像图与count生成的基因表达矩阵文件(GEF)进行配准;当图像QC失败或缺图像时可选择性不使用register。
imageTools将IPR文件转换成TIFF文件,例如把TIFF文件进行模板对齐和拼接,把组织分割和细胞分割图像进行二值化,当图像QC失败或者缺失图像时可不使用此模块。
tissueCut根据count生成的基因表达矩阵或同时结合register得到的配准图像,识别芯片上的组织覆盖区域,提取对应位置的基因表达矩阵;
spatialCluster & spatialCluster-SP根据tissueCut生成的组织覆盖区域表达矩阵做bin200的聚类分析;
cellCut根据count生成的基因表达矩阵并同时结合从register和imageTools得到的细胞分割结果图,识别芯片上每个细胞的空间位置区域,提取单个细胞的基因表达矩阵;当图像QC失败或者缺失图像时可不使用此模块。
cellCorrect根据register和imageTools生成的对齐后的细胞分割图像进行调整,提取调整后的细胞分割图像在cell bin GEF和GEM格式下的表达矩阵。
cellCluster & cellCluster-SP根据count(转录组)或mapping-SP(蛋白组)生成的表达矩阵,并同时结合从register和imageTools得到的细胞分割结果图,识别芯片上每个细胞的空间位置区域,提取单个细胞的基因表达矩阵;当图像QC失败或者缺失图像时可不使用此模块。
saturation根据count生成的用于抽样统计的文件计算组织覆盖区域的测序饱和度。
report生成整合了每步分析结果的JSON格式统计报告,以及HTML网页分析报告,展示基因的空间表达分布、关键统计指标、测序饱和度统计图、以及聚类分析结果;HTML报告是否具有cell bin统计数据和关键结果的图像处理,取决于图像是否通过QC以及和register程序选取的模式。
mapping-SP将记录于FASTQ文件的原位捕获的测序reads和空间信息对应。将reads与特定的蛋白数据库比对,并生成蛋白的GEF文件。
calibration读取count和mapping-SP生成的GEF文件进行空间位置匹配。
multiomicsAnalysis整合 RNA 和蛋白数据,并利用Total Variational Inference计算潜空间。对潜空间进行聚类分析,并进行一一对应的差异表达分析,从而找到marker基因和蛋白。
report-PT (Proteomics & Transcriptomics)生成整合了每步分析结果的JSON格式统计报告,以及HTML网页分析报告,展示基因和蛋白的空间表达分布、关键统计指标、测序饱和度统计图、聚类分析结果、蛋白比例以及多组学分析;HTML报告是否具有cell bin统计数据和关键结果的图像处理,取决于图像是否通过QC以及和register程序选取的模式。
其他便捷功能:
cellCut的其他应用根据count生成的基因表达矩阵或同时结合register得到的配准图像,识别芯片上的组织覆盖区域,提取对应位置的基因表达矩阵;
checkGTF检查确认GTF或GFF文件格式正确,否则重新调整成count兼容的格式
imageTools的其他应用1)以R-G-B的顺序融合2-3张TIFF图,用于检查分割结果;
2)将模版信息标记在拼接大图上辅助评估拼接和配准结果;
3)将TIFF图转成RPI格式。
manualRegister根据StereoMap可视化软件获取到的手动配准操作参数运行manualRegister来修改IPR中的配准记录。可通过开启“微调”参数在manualRegister运行时对手动配准结果进行自动调整,使其更加精准。
lasso根据StereoMap可视化软件手动套索获取的GEOJSON记录的区域信息提取对应坐标范围的一个或多个空间或细胞的基因表达矩阵子集。
cellChunk
生成用于StereoMap渲染的编码预计算数据。
MIDFilter
依据StereoMap生成 MID 范围,手动进行空间表达矩阵的过滤。
2.系统要求

运行SAW的Linux系统需满足的最低要求包括:

  • 8-core Intel or AMD processor (24 cores recommended)
  • 128GB RAM (256GB recommended)
  • 1TB free disk space
  • 64-bit CentOS/RedHat 7.8 or Ubuntu 20.04

运行SAW需提前安装下列其中一个软件:

  • docker(5): version 20.10.8 or higher
  • singularity(6): oversion 3.8 or higher
3.相关软件
  • ImageStudio: ImageStudio是图像处理桌面应用,包含图像QC、手动拼接、手动组织分割、手动细胞分割四个主要模块。每个模块对应输出结果均可接入SAW进行进一步分析。SAW v7.1建议ImageStudio的版本>=v3.0.3。

  • StereoMap: StereoMap是一个支持Stereo-seq分析数据高清交互式可视化的桌面端软件。SAW流程中输出的GEF矩阵、图像RPI和IPR数据、聚类结果等均可在StereoMap中展示。SAW v7.1建议StereoMap>=3.1.1。

联系方式
即刻了解华大时空组学
咨询