单细胞专题|3.单细胞转录组的上游分析-从BCL到FASTQ

(1) 软件安装和介绍

Cellranger mkfastq 管道可用于将 BCL 文件解码为单个库的 FASTQ 文件。如果测序提供程序已经完成了这一步,则可以直接使用每个库的 FASTQ 文件进行数据分析。cellranger mkfastq的本质是调用bcl2fastq生成bcl2fastq,并生成额外的10x样本信息。Bcl2fastq是 illumina开发的bcl到fastq的转换程序。cellranger下载安装地址如下:

https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest?

安装cellranger

在conda环境中安装bcl2fastq,因为Cellranger依赖于bcl2fastq。

(2) 案例

公司提供的bcl原始测序文件,本次教学使用使用cellranger的测试数据

您的数据可能看起来有点不同,这取决于测序仪器使用。查看目录的前几个级别是检查完整性的好方法。如果您没有看到 RTAComplete.txt、 RunInfo.xml 和 runParameters.xml 文件,那么管道很可能会失败。如果缺少任何这些文件,请与您的测序提供程序联系,并要求获得完整的运行目录。

? Lane:要处理flowcell的那个通道。可以是单个泳道(1)、范围(例如 2-4)或flowcell中所有泳道(*)。

? Sample:样本名称。所有生成的 FASTQ 表头前缀,对应于所有下游 10x 管道中的 –sample 参数。样本名称只允许使用字母、数字、下划线_和-;不允许使用其他符 ,包括点(“.” )。

? Index:用于文库构建的 10x 样本索引,例如 SI-TT-D9 或 SI-GA-A1。

查看帮助文档

Cellranger mkfastq 将 BCL 文件解码为单个库的 FASTQ 文件

? –id:mkfastq命令输出FASTQ文件的文件夹名称

? –run:BCL(Base CALL)所在文件夹名称(该文件为illumina测序的下机文件)

? –csv:对应BCL文件的样本信息表,用于描述如何在 Illumina flow 单元上对样本进行索引。

查看输入:

运行时间根据系统资源的不同而不同,但是它不应该占用多于几分钟的时间。现在转到 fastq _ path 目录。

具有有效排序索引的Demultiplexed FASTQ 文件可以在以 flow cell id 命名的目录下找到,在本例中为 H35KCBCXY。

这些来自 管道的输出作为 的输入。我们后续介绍

经 典 栏 目

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年3月23日
下一篇 2022年3月23日

相关推荐