STOmics logo 时空组学

EN
常见问答 常见问答 常见问答
常见问答
筛选项目 清除选项
时空产品
试剂
时空转录组
时空转录组+H&E染色
时空转录组+多重免疫荧光
生信工具
时空云平台
本地生信分析工具
技术流程
实验室搭建
实验前准备
透化
染色和拍照
反转录及文库构建测序
分析及结果
99条搜索结果:
Q 针对组织透化实验过程中出现脱片现象,有什么改善方案吗?可否提供相关操作说明? 展开 收起
A
针对容易脱片样本,透化实验过程中可选甘油封片的操作,具体请参考以下步骤操作
1.组织切片与烤片
a. 将组织切片贴到芯片上后,37℃烤片时间延长至10 min;
2.组织固定
 a. 烤片结束后,立即将芯片载体置于− 20℃预冷的甲醇中,确保甲醇浸没载体上的所有芯片,固定50 min;
 b. 固定结束后,将玻片盒或50 mL 离心管转移至通风橱中;
 c. 将载体从玻片盒或50 mL 离心管中取出,用无尘纸吸干载玻片背面和芯片周围多余的甲醇,确保无液体残留;
 d. 将载体竖立放在载玻片染色架上,置于通风橱中晾干4-6 min,让甲醇充分挥发;
 e. 甲醇挥发完全后,肉眼可见组织变白,将载体转移至实验桌上。
3.甘油封片
 a. Glycerol 使用前离心,用移液器缓慢吸取5 μL Glycerol 甘油滴加到组织中央,避免产生气泡;
 b. 用镊子夹取盖玻片,小心将盖玻片的一端放在芯片边上,同时握住另一端,然后逐渐将盖玻片放低到芯片上直至完全覆盖芯片;待甘油浸润整张芯片后,静置10 min 以上。
 c. 静置结束后,用镊子将盖玻片轻轻推至载玻片边缘,夹住盖玻片一角,用镊子轻轻地平行移动盖玻片,直到芯片与盖玻片完全分离;
 d. 将载体置于装有30 mL 0.1X SSC 的50 mL 离心管中浸泡3-5 s;
 e. 取出载玻片,用无尘纸擦去载玻片背面及芯片四周的残液,确保无液体残留。
后续操作按照《Stereo-seq透化试剂套装(载体版)使用说明书》(说明书版本号:D)“3.5. 透化时间测试”章节继续。
备注说明:若是在透化实验中该方法有改善组织脱片的效果,在转录组实验中,可以使用本方案中的烤片时间以及固定时间替代《Stereo-seq转录试剂套装(载体版)使用说明书》(说明书版本号:D)中对应操作的时间。
Q 一个细胞的大小和square bin size的关系是怎样的? 展开 收起
A

以一个细胞的直径为10 μm左右计算时,一个细胞约相当于bin20(10 μm x 10 μm)或 bin14(取diagonal = 10 μm)。

Q Bin是方形区域还是指圆形区域?分析时如何选择合适的Binsize? 展开 收起
A

Bin是芯片上规整的N × N的方形区域,区域内表达信息汇总就是Bin的表达信息,注意不包含正方最右侧边和最下方边的DNB点(Bin1除外)。

可以按照不同组织类型的细胞大小等,根据下游分析效果多次调试Bin20、50、100、200数值。其中Bin20与动物细胞大小近似,Bin50和Bin100是常用于分析的Binsize大小,Bin200一般用于快速可视化效果展示。

Q Valid CID比例异常应该怎么处理? 展开 收起
A

Valid CID rate低可以排查的方向有3个:

1. 测序情况。测序质量低会影响比对结果。除了Q30还需要检查call N的情况,可以查看下机报告的base distribution,如果出现N碱基的比例高的情况,就需要考虑是因为测序问题,影响了valid CID rate,最好优先排查。

2. 芯片mask h5文件和fastq不对应。因为mask里记录的CID和对样本测序得到的CID不匹配,导致valid CID rate低。这个情况如果单一出现,一般比例极低,但如果涉及到后一个情况,比例波动比较大,需要酌情判断。

3. 污染/混样。在实验过程中或者建库测序的时候混入了其他样本,因为受到污染,所以影响了valid CID rate。那么可能存在两张芯片,同时可以和这个文库的下机数据比对上。如果混的比较多,可以有明确的组织pattern,如果比例极小,有的情况下会有部分高亮点。

Q 华大时空组学技术Stereo-seq配套的线下分析软件ImageQC/Imagestudio、SAW以及StereoMap 使用时有哪些注意事项? 展开 收起
A

需要注意:一、新版本软件可兼容旧版本功能;二、三个软件必须配套使用,即软件的不同版本号之间需要配套。现有不同版本号间的配套规则如下:

imageQCImageQC描述SAWSAW描述

<= 1.0.8文件格式:.json + .tar.gz描述:ssDNA图像QC<= 4.1.0支持组织分割和ssDNA图像配准

>= 1.1.0文件格式:.ipr + .tar.gz描述:ssDNA图像QC>= 5.1.3支持ssDNA图像细胞分割;支持Q4 FASTQ数据分析

ImageStudioImageStudio描述SAWSAW描述StereoMapStereoMap描述
1.0文件格式:.ipr + .tar.gz描述:ssDNA图像QC及手动处理>= 5.5支持ssDNA图像细胞分割;支持Q4 FASTQ数据分析;1支持空间表达热图展示;基因分布megre展示;ssDNA图展示及手动配准;
2.0文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、mIF图像QC及手动处理>= 6.0支持mIF配准;支持rRNA过滤2mIF图展示;mIF图merge展示;
2.1文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、mIF图像QC及手动处理;及QC失败图像的全手动处理;>= 6.1< 7.0支持ImageStudio全手动处理图像接入流程;
2.1< 3.0支持多gef一次性读入,通过切换标签展示
2.2文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、mIF图像QC及手动处理;及QC失败图像的全手动处理;>= 6.1< 7.0支持ImageStudio全手动处理图像接入流程;
2.1< 3.0支持多gef一次性读入,通过切换标签展示
3.0文件格式:.ipr + .tar.gz描述:ssDNA、DAPI、H&E、mIF图像QC及手动处理;及QC失败图像的全手动处理;
7count重构上线register重构,升级组织分割和细胞分割V03算法。支持H&E全流程处理支持基于细胞分割的mask图像结果,使用EDM算法进行细胞修正。<=3.0支持读入不同binsize/resolution的h5ad;cgef文件跑过SAW cellChunk模块后写入/codedCellBlock信息,加载cgef时支持渲染cellbin热图
7.1支持时空蛋白试剂盒分析,可获得蛋白表达矩阵支持蛋白组和转录组联合分析
3.1支持蛋白+转录试剂盒分析结果可视化支持主副窗分别展示不同组学,或分别展示热图和聚类图支持主副窗联动展示


Q 在时空组学分析中,对基因注释文件GTF/GFF格式的要求是什么? 展开 收起
A

1.   文件格式:

○ GFF文件 或者 GTF文件,文件后缀名支持 gtf/gtf.gz,gff/gff.gz,gff3/gff3.gz


2.   GTF文件格式:

○ 注释行以 # 开始

○ 主体部分共 9列,以tab作为分隔符:seqname source feature start end score strand frame attributes

▪ type:注释信息的类型必须含有genetranscriptexon

▪ start/end:最大值需小于2^31

▪ strand:链的正向与负向,分别用加号+和减号-表示。

▪ 第9列为attributes,格式为tag "value"(标签“值”),不同属性之间以空格相隔 ; 必须要有以下4个

• gene_name value

• gene_id value: 表示转录本在基因组上的基因座的唯一的ID。gene_id与value值用空格分开,如果值为空,则表示没有对应的基因。

• transcript_name value

• transcript_id value: 预测的转录本的唯一ID。transcript_id与value值用空格分开,空表示没有转录本。

○ 目前最大有效基因数必须小于2^20,即1048576

○ 不可以乱序,即同一个gene的transcript/exons需按顺序排列


3.   GFF文件格式:

○ 注释行以 # 开始

○ 主体部分共 9列,以tab作为分隔符:seqid source type start end score strand phase attributes

▪ type:注释信息的类型必须含有gene, mRNAexon

▪ start/end:最大值需小于2^31

▪ strand:“+”表示正链,“-”表示负链,“.”表示不需要指定正负链,“?” 表示未知

▪ 第9列为attributes,格式为tag=value (标签=值),不同属性之间以分号相隔

• 需要存在ID Name Parent(对gene无需判断Parent)

• 对于第三列的命名规则请务必仔细研究 ⇒ “树状分级” (不能只列出child行 而没有parent行!)示例如下:

1


○ 目前最大有效基因数必须小于2^20,即1048576

○ 可以乱序,但仍需满足 gene必须出现在对应mRNA之前,mRNA必须出现在对应的exon之前的规则


4. 其他注意事项:

○ gene/gene_name(基因的名字) 值不含有特殊符号(空格,各类型括号,引号,<>,%等)。支持使用的常见特殊符号有”_“,"."。

○ gene/gene_name(基因的名字) 值长度小于64个字符

○ 虽然GFF文件现在大部分使用的都是第三版(GFF3),但是文件命名时请命名为.gff ;同理对于GTF文件也请文件命名时采用.gtf

Q 读取注释文件时会忽略对应基因的情况有哪些? 展开 收起
A

• gtf格式的属性没有gene_name gene_id transcript_name transcript_id(对gene只需要有gene_namegene_id

• gff格式的属性没有ID Name Parent(对gene无需判断Parent)

• 同一个gene下的数据包含多个gene_id,日志打印 "Multiple gene IDs for gene xxx: id1, id2..."

• 同一个gene下的数据同时包含正反链,日志打印 "Strand disagreement for gene xxx - skipping"

• transcript或exon没有transcript_id,日志打印 "Record does not have transcriptID for gene xxx"

• 同一个gene有多条transcript的transcript_id / ID相同,日志打印 "Transcript appears more than once for xxx"

• 存在exon的start > end,日志打印 "Exon has 0 or negative extent for xxx"

• 同一个transcript下的exons之间有overlap,日志打印 "Exons overlap for xxx"

• 一个gene没有任何transcript,日志打印 "No transcript for gene xxx"

ps: 一个contig下出现多条gene有相同的gene_name,合并为一个gene

Q 构建reference时报错"Fatal INPUT FILE error, no valid exon lines in the GTF file"如何处理? 展开 收起
A

可能是注释GTF/GFF文件和基因组FASTA文件中两者对染色体的命名不完全统一 ,请注意chromosome name要统一

Q 为什么大部分的注释文件中的基因都未被注释上? 展开 收起
A

• 大概率是注释文件不规范导致的,请再次参考上述文件格式要求的内容自行排查;

• 另一种可能性是由于strand正负链符号不规范导致,注释文件中strand值只能是 “+” (forward) 或 “-” (reverse),请不要和下划线 “_” 搞混。

Q 是否有工具可以辅助检查注释文件规范? 展开 收起
A

• 可以使用SAW sif中的checkGTF工具进行检查,运行方式如下:

Bash
 
## export   SINGULARITY_BIND="/path/to/input/dir,/path/to/output/dir"
  singularity exec SAW.sif checkGTF \
      -i <input.gtf/gff> \  ## GTF/GFF file input to be checked
      -o <output.gtf/gff>  ## [optional]. Set to output revised   GTF/GFF file. Be aware that this may remove some genes which do not meet the   requirements and cannot be fixed.

• 可能有部分无法被程序修复的基因注释记录会在输出时被删除,可以在日志中找到记录重新修改GTF文件后再次尝试。

联系我们
即刻了解华大时空组学
咨询