需要注意:一、新版本软件可兼容旧版本功能;二、三个软件必须配套使用,即软件的不同版本号之间需要配套。现有不同版本号间的配套规则如下:
分析工具 |
系统要求 |
主要功能 |
输入文件 |
---|---|---|---|
SAW |
64-bit CentOS/RedHat 7.8 or Ubuntu 20.04 |
数据过滤、图像配准、表达矩阵获取和下游分析等 |
参考文件:参考基因组文件可以通过多个生物数据库获取,比如Ensembl, UCSC Genome Browser和NCBI。您也可以构建自己的reference。 微生物分析使用的索引文件可以直接通过 Kraken2数据库下载。 时空芯片mask文件:保存了所有已知的CID(Coordinate ID,坐标ID)序列信息,这些序列用于将捕获到的生物分子映射回其原始的空间位置。 测序FASTQ文件:分析Stereo-seq时空数据需要使用存储了从组织切片获取的序列数据的FASTQ文件。每条RNA序列都包含一段CID和一段MID(molecular ID,分子ID)序列,用于识别其空间位以及量化每个分子。 图像:显微镜拍摄的影像图在时空数据中通常指的是在同一组织切片上进行拍照和分子捕获的图像。这样,图像信息和测序信息可以在相同的空间位置上更可靠地联系起来。图像为时空测序数据提供了更多关于细胞或分子类型以及样本空间结构的信息补充。 |
StereoMap |
64-bit Windows 10 & 11 |
显微镜图像质控、图像拼接、可视化展示和交互式手动处理等 |
图像:显微镜拍摄的影像图在时空数据中通常指的是在同一组织切片上进行拍照和分子捕获的图像。这样,图像信息和测序信息可以在相同的空间位置上更可靠地联系起来。图像为时空测序数据提供了更多关于细胞或分子类型以及样本空间结构的信息补充。 |
可以按照不同组织类型的细胞大小等,根据下游分析效果多次调试bin20,50,100,200数值。其中bin20一般是动物细胞大小,bin50和100是常用于分析的binsize大小,bin200一般用于快速可视化效果展示。
需要注意:一、新版本软件可兼容旧版本功能;二、三个软件必须配套使用,即软件的不同版本号之间需要配套。现有不同版本号间的配套规则如下:
1. 细胞分割的效果受到显微镜拍照的情况和分割算法等多重因素的影响。拍照时如果存在组织过曝、模糊等因素,会影响算法识别细胞,导致无法分割。对于密集区域本身清晰度不够,并且可能存在细胞重叠的情况,那么也会导致算法难以识别。如果图像中组织不同区域局部亮度不均匀、或者存在实验导致的拖尾、背景存在杂质等情况,也会导致分割错误。(部分示例见下方)
2. 从算法本身来讲,因为分析流程的自动分割算法是基于人工标注的数据集,学习训练而来,所以一些非常少见的细胞形态未能涵盖进数据集中,也可能会导致算法无法准确识别出细胞。
3. 如果自动算法分割效果不佳,可以尝试使用ImageStudio桌面端图像处理软件进行手动调整,也可以尝试用使用Stereopy或其他算法重新分割。如果希望细胞分割出的细胞面积更大,可以尝试在分割之后使用Stereopy的细胞修正算法对细胞直径进行扩大,以覆盖更大的面积。
• CID过滤:过滤CID无法比对上mask文件的reads;
• MID过滤:过滤MID序列中含有N碱基的reads,过滤MID为polyA的reads,过滤含有至少一个以上质量值低于10的碱基的reads;
• reads过滤:过滤含有接头和dnb序列的reads。
• 第一步:检查HTML报告中Valid CID Reads的比例是否正常,不可低于10%,如低于10%请确认测序FASTQ文件和芯片SN对应;
• 第二步:如Valid CID Reads的比例较低,在10%~30%左右,可能存在两种可能性:
○ 参考基因组格式异常:Multi-Mapped Reads比例高, Uniquely Mapped Reads比例很低且几乎全部注释失败,需要检查注释使用的GTF/GFF文件是否符合格式要求,是否可以通过检测程序;
○ 存在混样的可能性:需要自行排查实验部分;