SCS【2】单细胞转录组 之 cellranger

What is Cell Ranger/h2>

Cell Ranger是10X genomics公司为单细胞RNA测序分析量身打造的数据分析软件,可以直接输入Illumina 原始数据(raw base call,BCL)输出表达定量矩阵、降维(pca),聚类(Graph-based& K-Means)以及可视化(t-SNE)结果,结合配套的Loupe Cell Browser给予研究者更多探索单细胞数据的机会。cellranger的高度集成化,使得单细胞测序数据探索变得更加简单,研究者有更多的时间来做生物学意义的挖掘。Cell Ranger包括5个与3’单细胞基因表达解决方案和相关产品的分析流程:

1. cellranger mkfastq

将Illumina测序仪生成的原始基调用(BCL)文件分解为FASTQ文件。它是Illumina的bcl2fastq的包装,具有10x Genomics库特有的附加功能和简化的样本表格式。

2. cellranger count

cellranger count从cellranger mkfastq中获取FASTQ文件,并执行对齐、过滤、条形码计数和UMI计数。它使用Chromium细胞条形码生成特征条形码矩阵,确定簇,并执行基因表达分析。计数管道可以从同一口GEM井的多次排序运行中获取输入。cellranger count还处理特征条形码数据和基因表达读取。

3. cellranger multi

cellranger multi用于分析Cell Multiplexing和Fixed RNA Profiling数据。它从cellranger mkfastq中获取FASTQ文件,并执行对齐、过滤、条形码计数和UMI计数。它使用Chromium细胞条形码生成特征条形码矩阵,确定簇,并执行基因表达分析。cellranger多管道还支持特征条码数据的分析。

4. cellranger aggr

Cellranger aggr聚合了多个Cellranger count或Cellranger multi运行的输出,将这些运行归一化到相同的测序深度,然后重新计算特征条形码矩阵并对组合数据进行分析。aggr管道可用于将来自多个样本的数据组合成一个实验范围内的特征条形码矩阵和分析。

5. cellranger reanalyze

Cellranger再分析采用由Cellranger计数、Cellranger或Cellranger聚合产生的特征条形码矩阵,并使用可调参数设置重新运行降维、聚类和基因表达算法。

工作流程

如果您从原始基本调用(BCL)文件开始,Cell Ranger工作流将从为每个流单元目录解码BCL文件开始。10x基因组公司建议使用生成FASTQs中描述的cellranger mkfastq。如果您从已经通过bcl2fastq直接解复用的FASTQ文件开始,或者从SRA等公共源文件开始,您可以跳过cellranger mkfastq,并从cellranger count开始。请参阅指定输入FASTQ页面(count, multi),以了解在您的场景中使用哪些参数的具体指导方针。工作流程的具体步骤取决于您有多少样本、GEM孔和流式细胞,以及您是否包括来自特征条形码、细胞多路复用或固定RNA分析试剂盒的数据。本节描述了一些可能的工作流程。

在本例中,一个样品通过一个GEM阱处理,并在一个流单元上测序。在这种情况下,使用cellranger mkfastq生成FASTQs,并按照单样本分析中的描述运行cellranger count。这个例子还演示了两个测序库。一个GEM井可以产生多个物理库:一个基因表达库和一个或多个特征条码库。

一个样品,一个GEM孔,多个流动细胞

在这里,一个样品通过多个GEM孔处理。这通常是在进行技术复制实验时进行的。然后将来自GEM井的库汇集到一个流单元并进行测序。在这种情况下,使用cellranger mkfastq对测序运行的数据进行多路分离,然后通过单独的cellranger计数实例从每个GEM井运行库。然后,您可以使用cellranger aggr执行组合分析,如多库聚合中所述。

多个样品,多个GEM孔,一个流动槽

Cell Ranger 6.0引入了对分析Cell多路数据的支持。在这种情况下,多个样本使用Cell Multiplexing Oligos (CMOs)进行唯一标记,使多个样本可以集中在单个GEM孔中。这就产生了每个GEM孔的CMO和基因表达(GEX)库。运行cellranger mkfastq来生成FASTQ文件之后,在GEX和CMO库的组合FASTQ数据上运行cellranger多管道。

多个样本,一个GEM孔,一个流式细胞(固定RNA分析)

当数据是单细胞靶向基因表达和抗体捕获与CRISPR指南捕获分析,需要注意一下我们多输入两个文件,设置 –target-panel 和 –feature-ref 参数。

这些都需要在服务器上使用,资源要求蛮高的,自己一般不具备这样的条件,可以联系桓峰基因。

桓峰基因,铸造成功的您!

有想进生信交流群的老师可以扫最后一个二维码加微信,备注“单位+姓名+目的”,有些想发广告的就免打扰吧,还得费力气把你踢出去!

敬请期待!!

有想进生信交流群的老师可以扫最后一个二维码加微信,备注“单位+姓名+目的”,有些想发广告的就免打扰吧,还得费力气把你踢出去!

References:

  1. Luecken MD, Theis FJ. Current best practices in single-cell RNA-seq analysis: a tutorial. Mol Syst Biol. 2019;15(6):e8746. Published 2019 Jun 19. doi:10.15252/msb.20188746

图片

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年7月8日
下一篇 2022年7月8日

相关推荐