STOmics logo 时空组学

EN
常见问答 常见问答 常见问答
常见问答
筛选项目 清除选项
时空产品
试剂
时空转录组
时空转录组+H&E染色
时空转录组FFPE
时空蛋白转录组
时空转录组+多重免疫荧光
仪器平台
时空自动化样本处理系统
生信工具
时空云平台
本地生信分析工具
技术流程
实验室搭建
实验前准备
透化
染色和拍照
反转录及文库构建测序
分析及结果
134条搜索结果:
Q 是否有工具可以辅助检查注释文件规范? 展开 收起
A

1、方式一 (SAW < v8.0.0)

①可以使用SAW sif中的checkGTF工具进行检查,运行方式如下:

## export SINGULARITY_BIND="/path/to/input/dir,/path/to/output/dir"

singularity exec SAW.sif checkGTF \

    -i <input.gtf/gff> \  ## GTF/GFF file input to be checked

    -o <output.gtf/gff>  ## [optional]. Set to output revised GTF/GFF file. Be aware that this may remove some genes which do not meet the requirements and cannot be fixed

②可能有部分无法被程序修复的基因注释记录会在输出时被删除,可以在日志中找到记录,重新修改GTF文件后再次尝试。


2、方式二 (SAW >= v8.0.0)

①可以使用SAW checkGTF分析流程进行检查,运行方式如下:

SAW checkGTF \

    -input-gtf=/path/to/input/GTF/or/GFF \

    -output-gtf=/path/to/output/GTF/or/GFF

②可能有部分无法被程序修复的基因注释记录会在输出时被删除,可以在日志中找到记录,重新修改GTF文件后再次尝试。

Q rRNA的比对如何在分析过程中去除?是否可以手动设置需要去除的rRNA序列? 展开 收起
A

此功能的使用需根据SAW版本进行区分


方式一 (SAW < v8.0.0)

①可以在参考基因组FASTA文件中手动添加rRNA序列,重新构建reference index后,再在SAW运行mapping时打开rRNAremove开关,过滤掉比对上rRNA序列的reads。rRNA过滤功能在SAW v6.0版本新增。

②添加rRNA序列规则:在FASTA文件中增加待过滤的rRNA序列,“>”开头的序列名称需要在第一个部分的名称最后增加“_rRNA”,用于程序识别。示例如下:


5eecdaf48460cde597a98a21623c3e677bdf515d479ad2214e47bcdad4e608bc2bf3b0078b9fb6c839e8703ac5556d0d718780e9e3cc06fe46e1353cea9e5d502a881532c0d1bab4b2d4d47cb1cc505d08cf75a52f134f4b4bd6b5792c76823f


③运行SAW mapping时在bcPara文件中增加一行,输入"rRNAremove"。示例如下:
bcPara file

in=<mask>

in1=<lane_read_1.fq.gz>

in2=<lane_read_2.fq.gz>

barcodeReadsCount=<lane.barcodeReadsCount.txt>

barcodeStart=0

barcodeLen=25

umiStart=25

umiLen=10

umiRead=1

mismatch=1

bcNum=<CIDCount>

polyAnum=15

mismatchInPolyA=2

rRNAremov

④如果query read比对上rRNA,其比对记录第三列RNAME为参考基因组中添加了"_rRNA"尾缀的序列名称,第十二列Optional fields的XF:i标签为3。后续注释时,根据XF标签的记录,统计rRNA的比例。

微信截图_20240812174341


方式二 (SAW >= v8.0.0)

①使用SAW makeRef构建比对所需的参考基因组索引文件,若需进行rRNA去除,需要在构建时设置--rRNA-fasta参数,自动添加rRNA信息并构建索引文件。

②运行SAW count时开启--rRNA-remove参数即可,并且使用添加了rRNA信息的索引文件。

③去除rRNA的步骤细节和原理详见SAW 8.0用户手册。

Q 为什么在 StereoMap 的转录组分析图层会看到两个热图? 展开 收起
A

StereoMap v4.0 版本后默认展示组织区域的热图,如果运行 SAW v8.0 软件进行分析时没有输入显微镜图像,程序会基于表达矩阵信息进行组织分割,如果分析人员对自动算法提取的组织内矩阵不满意,可能需要基于整张芯片的表达热图重新进行组织区域的圈选(使用lasso工具),故此场景下,在 StereoMap 中会看到全芯片和组织区域两个范围的转录组热图。

Q 为什么在 StereoMap lasso 前后 MID 统计信息会有部分差异? 展开 收起
A
  • 主要原因为 StereoMap lasso 统计信息与 SAW lasso 生成的矩阵计算数值的逻辑不一致:
    • lasso 的统计信息:首先判断当前圈选的区域的 sport 点是否过 bin 的中心,如果过了 bin 的中心,则统计该 bin 的信息;否则不统计。
    • SAW 提取矩阵:首先将圈选的轮廓区域转换为 bin 1 ,即最小的颗粒度,再从 bin1 转换为其它大 bin。

微信截图_20240812172554

微信截图_20240812172611

Q 在 StereoMap 中可视化查看结果时,发现自动配准的情况下,图像边界外出现基因表达现象,是否正常? 展开 收起
A

微信截图_20240812172432


这种情况是正常的,以上图为例,图为图像+矩阵热图的可视化展示,原因主要有两点:一,由于样本切片位于芯片边缘,图像组织分割结果会生成在矩阵外周,造成“外溢”的假象;二,在观察矩阵热图时通常选择bin20或者bin50(将其视为一个spot单位点)的bin size尺寸,bin的坐标位点计算是取其左上角顶点,当实际表达只占spot单位点的一小部分时,可视化展示也会将整个spot点亮,所以矩阵边缘看起来像是“外扩”。

Q SAW分析完成会产生多个GEF文件,分别记录了哪些信息?是否支持可视化? 展开 收起
A

微信截图_20240812172301

Q SAW 分析任务如果意外中断了是否可以断点重启? 展开 收起
A

使用 SAW >= v8.0.0 运行SAW count分析流程时,如遇到因集群意外停机、环境kill任务或者队列爆内存情况,在重启集群/服务器后,重新提交任务,程序可以rerun分析,但是要求两次分析任务的命令参数完全一致,不可有任何更改,程序会对此进行校验,如有区别,会当成第二次不同的任务启动。

注:此功能不适用于参数设置错误,或者输入数据错误等人为因素引发的问题。

Q SAW 原始入参FASTQ文件的格式和要求? 展开 收起
A

SAW分析流程入参时支持Q40的FASTQ和Q4的FASTQ文件。

  • Q40:以41种质量值描述所有的测序完成的碱基质量的质量体系。Q40 FASTQ为常见的PE形式、成对出现的数据,通常命名为<slide>_<lane_number>_<read_index>.fq.gz,包含read 1 和 read 2,少数情况下可能没有"read",此时可以检查是否为成对出现,或者检查文件格式。

## Q40 read 1

@V350156489L4C001R00100001484/1

TCTGCAGCCAACATGGACAGATCCTTTTAGAACTT

+

D>DC<CBEADEABCB(AADCDD2DD"DBE*$F'C'


## Q40 read 2

@V350156489L4C001R00100001484/2

CTATGAAACACACTATCCTCAATCGGCTCCTTAATTTCAATACCAGCCGT

+

ECFCCB?CAECEBDBCCFDFEFDF?<FCF>B?2EC=C?C<CE(AA=;B5B


Q4:以4种质量值描述所有的测序完成的碱基质量的质量体系。Q4 FASTQ为一组16或64个单个文件出现,通常命名为<slide>_<lane_number>_<sample_barcode>_<split_index>.fq.gz。少数情况下可能文件前缀中没有barcode,通过文件目录中的barcode目录名区分。Q4 FASTQ经常也会被叫做SE FASTQ,其实实际依然是双端测序,但在完成测序下机写出FASTQ时,以单个文件的方式输出,看起来和SE数据一样。这种格式将read1中的信息编码后写入read 2的readID中,同时序列质量信息以Q4(以4种质量值描述所有的测序完成的碱基质量的质量体系)方式记录,以降低存储。

微信截图_20240813092206

## Q4 read

@FP300000513L1C002R00400000218 CE242DF29A57 97D26

GTGTAGTGAACCCCATGGTAGTTTTCTGATTGTTGTTAAAAAAAATGACTTAACATATTACATGGACACTCAATAAAAATGTTTTATTTCCTGTTGAAAA

+

FFFFFFFFFFFF8F8FFFFFFFFFFFFF8FFFFFFFFF8FF8FFF8FFFFFFF,FFFFFFFFFFF8FFFFFF8F8F,F8FFFFFF,FFFFFFFFFF,FFF

Q 如果基因组的chr/scaffolds数量较多(例如:超过5000),导致构建参考基因组时提示内存不足,应如何处理? 展开 收起
A

可通过设置--genomeChrBinNbits

=min(18,log2[max(GenomeLength/NumberOfReferences,ReadLength)])来降低RAM消耗,例如:14G大小的参考基因组,其chr/scaffolds为90k,根据上述公式,计算发现--genomeChrBinNbits的参数值应设置为17。详情可参考STAR软件的说明手册https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf

注:SAW 软件版本 < 8.0

Q 对于FFPE样本目前可以做ssDNA染色后再添加邻片H&E图像作为底片加进去用来做组织分割吗?如果用H&E染色来做细胞分割,目前有第三方接入流程吗? 展开 收起
A

1、可以邻片H&E切片圈组织结构,受临片配准精度限制,组织分割结果需要用户手动介入进行调整;

2、H&E染色做细胞分割,时空StereoMap软件兼容任何第三方软件的细胞分割结果。

联系我们
即刻了解华大时空组学
咨询