sistemas como marca Build se utilizan con frecuencia para crear flujos de trabajo complicados, por ejemplo, en bioinformática. & nbsp; snakemake tiene como objetivo reducir la complejidad de los flujos de trabajo que crean proporcionando un lenguaje limpio y moderno dominio específico especificación (DSL) en estilo pitón, junto con un entorno de ejecución rápida y cómoda.
Instalación
- En Ubuntu 12.04, puede instalar el paquete Debian python3-snakemake disponible en nuestro repositorio Launchpad.
- En otros sistemas, se necesita una instalación de trabajo de Python> = 3.2. Dependiendo de su sistema, puede instalar snakemake mediante la emisión de cualquiera easy_install snakemake o easy_install3 snakemake en la línea de comandos. Si usted no tiene privilegios de administrador, tener una mirada en el argumento --user de easy_install.
- Por último, snakemake se puede instalar manualmente descargando el archivo del código fuente de PyPI.
Uso
Snakemake ofrece un DSL simple de describir los flujos de trabajo que crean archivos en varios pasos posteriores:
muestras = ["01", "02"]
# Opcionalmente definir un directorio donde se debe hacer el trabajo.
workdir: "path / to / workdir"
# Similar a hacer, definir reglas ficticios que actúan como tipos de generación.
descartar todo:
& Nbsp; de entrada: "diffexpr.tsv", ...
descartar resumen:
& Nbsp; de entrada: "{muestra} .mapped.bam" .formato (= muestra s) para s en muestras
& Nbsp; de salida: "diffexpr.tsv"
& Nbsp; ejecutar:
& Nbsp; # ... proporcionar algo de código python para producir la salida de los archivos de entrada
& Nbsp; # por ejemplo. archivos de entrada de acceso por índice
& Nbsp; de entrada [1]
& nbsp; # Los valores acceso comodín
& Nbsp; wildcards.sample
& Nbsp; # ejecutar fácilmente comandos de shell automáticamente utilizando el shell por defecto, mientras que tiene acceso directo
& Nbsp; # para todas las variables locales y globales a través de la minilenguaje formato
& Nbsp; threads = 6
& Nbsp; shell ("--threads algúncomando {hilos} {introducir [0]} {salida [0]}")
descartar map_reads:
& Nbsp; # asignar nombres de archivos de entrada y de salida
& Nbsp; de entrada: lee = "{muestra} .fastq", hg19 = "hg19.fasta"
& Nbsp; # archivos de salida marca para ser después de la creación de protección contra escritura
& Nbsp; de salida: asignada = protegida ("{} muestra .mapped.sai")
& Nbsp; # Opcionalmente definen los mensajes que se muestran en lugar de descripción de la regla genérica sobre la ejecución de la norma:
& Nbsp; mensaje: "Mapping lee a {} input.hg19"
& nbsp; hilos: 8
& Nbsp; shell:
& Nbsp; # proporciona directamente los comandos de shell (en una cadena de líneas múltiples o individual) si no se necesita la sintaxis de python.
& Nbsp; # de nuevo, las variables globales y locales se puede acceder a través de la minilenguaje formato.
& Nbsp; # más, el número de hilos utilizados por la regla se puede especificar. El planificador snakemake asegura que la regla se ejecuta con el número especificado de hilos si suficientes núcleos se ponen a disposición a través de la opción de línea de comandos -j.
& Nbsp; "" "
& Nbsp; bwa aln -t {hilos} {} {input.hg19 input.reads}> {output.mapped}
& Nbsp; algunos demás --command
& Nbsp; "" "
Dado un "Snakefile" con una sintaxis tal, el flujo de trabajo se puede ejecutar (por ejemplo, con un máximo de 6 procesos paralelos) por issueing:
& Nbsp; snakemake -j6 -s Snakefile
Para más detalles, ver el tutorial
Características :.
- Definir los flujos de trabajo de manera textual escribiendo reglas de cómo crear una salida archivos de los archivos de entrada en una sintaxis basada sencilla python. En contraste con GNU make (que es principalmente un sistema de construcción), snakemake permite una regla para crear varios archivos de salida.
- Snakemake calcula automáticamente que necesitan ser ejecutados reglas para crear la salida deseada.
- Tanto la cáscara, así como sintaxis completa python dentro de una norma es compatible. Comandos Shell tienen acceso directo a todas las variables pitón locales y globales.
- Como GNU make, snakemake puede programar ejecuciones de reglas paralelas cuando sea posible. Además, entre paralelización regla se puede combinar con la paralelización regla intra (por ejemplo hilos) y snakemake asegura que el número de núcleos en cuenta no excede el valor dado.
- Archivos se puede marcar como temporal (es decir, que se pueden eliminar una vez que no se necesita nada más) o protegidos (es decir, serán protegidos, después de la creación).
- de entrada y salida pueden contener varios comodines con nombre.
- de entrada y salida pueden ser nombrados para que abordarlos dentro de la regla se convierte en la mano.
- Un mapa a reducir como funcionalidad se logra mediante el uso de la fácil de leer python sintaxis lista por comprensión.
- Como una característica experimental, snakemake puede ejecutarse en un clúster especificando el comando submit (por ejemplo qsub para Sun Grid Engine).
Reglas basadas
Archivos
Archivos
Requisitos :
- Python
Comentarios que no se encuentran