生信分析流程框架概述

目录

  • 1. 工作流管理系统
    • Scripts
    • Make
    • nextflow
  • 2. 工作流引擎
    • Cromwell
    • Argo
  • 3. 工作流语言
    • Common Workflow Language (CWL)
      • 1. 定义
      • 2. 使用方法
    • WDL
  • 扩展阅读
    • YAML格式

A pipeline is a set of data processing elements connected in series, where the output of one element is the input of the next one. The elements of a pipeline are often executed in parallel or in time-sliced fashion; in that case, some amount of buffer storage is often inserted between elements.

1. 工作流管理系统

Scripts

使用脚本语言把处理数据的脚本或软件串成。

Make

nextflow

例1.

2. 工作流引擎

Cromwell

Argo

云原生的工作流。

3. 工作流语言

无论 Snakemake,还是 Nextflow 都需要用户按照工具本身定义的语法来创建流程。这给流程在不同平台间的迁移带来了不便。
工作流语言旨在提供一套语法标准,以解决可移植性差的问题。生信领域最常见的工作流语言有 CWLWDL。下文对他们的用法做一个简单介绍。

Common Workflow Language (CWL)

1. 定义

CWL 是一种描述命令行工具并将它们连接在一起以创建工作流规范

2. 使用方法

CWL文件使用YAML或JSON格式编写。调用形式一般为 ,上述命令将工作流描述和输入文件作为参数提供给CWL运行器。

例1.

是一个输入参数的列表。每个参数又有多个字段组成,如参数名称 ,参数值类型 (string, int, long, float, double, null, array, record, File, Directory, Any)等。

WDL

相较CWL,WDL 抽离了很多在需要通过文件解析的部分,因而可用性较好。
基本单元由 ,,,, 构成。

扩展阅读

YAML格式

  • 键值对 key: value
  • 注释 #
  • 数据结构: Maps & Arrays
  • JSON 风格

Does anyone use CWLDoes it actually help you get work donebr> https://vatlab.github.io/sos-docs/index.html#content
https://bcbio-nextgen.readthedocs.io/en/latest/

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年2月16日
下一篇 2021年2月16日

相关推荐