MetagenomeDB es una biblioteca de Python diseñado para almacenar fácilmente, recuperar y anotar secuencias metagenómica. & Nbsp; MetagenomeDB actúan como una capa de abstracción en la cima de una base de datos MongoDB. Proporciona una API para crear y modificar y conectar dos tipos de objetos, es decir, secuencias y colecciones:
& Nbsp; * secuencias (clase Secuencia) puede ser lee, contigs, clones de PCR, etc.
& Nbsp; * colecciones (clase Collection) representa conjuntos de secuencias; por ejemplo, las lecturas resultante de la secuenciación de una muestra, contigs ensamblados a partir de un conjunto de lecturas, biblioteca PCR
Cualquier objeto puede ser anotado utilizando una sintaxis similar a un diccionario:
# Primero, importamos la biblioteca
importación MetagenomeDB como mdb
# Entonces se crea un nuevo objeto de secuencia con dos
# (Obligatorio) propiedades, 'nombre' y 'secuencia'
s = mdb.Sequence ({"name": "Mi secuencia", "secuencia": "ATGC"})
# El objeto ahora puede ser anotado
print s ["longitud"]
s ["tipo"] = "leen"
# Una vez modificado, necesita el objeto que se cometió
# Para la base de datos para las modificaciones permanezcan
s.commit ()
Objetos de la secuencia de tipo o Collection se pueden conectar entre sí con el fin de representar diferentes conjuntos de datos de metagenómica. Los ejemplos incluyen, pero no se limitan a:
& Nbsp; * colección de lecturas como resultado de una carrera de secuenciación (relación entre la secuencia de múltiples objetos y uno Collection)
& Nbsp; * conjunto de contigs resultantes del montaje de un conjunto de lecturas (relación entre dos objetos Collection)
& Nbsp; * lee que son parte de un contig (relación entre la secuencia de múltiples objetos y una secuencia)
& Nbsp; * secuencia que es similar a otra secuencia (relación entre dos objetos de secuencia)
& Nbsp; * colección que forma parte de una colección más grande (relación entre dos objetos Collection)
El resultado es una red de secuencias y la colección, que se puede explorar el uso de métodos específicos; IEG, Collection.list_sequences (), Sequence.list_collections (), Sequence.list_related_sequences (). Cada uno de esos métodos permiten filtros sofisticados utilizando la sintaxis de la consulta de MongoDB:
# Lista de todas las colecciones de 'collection_of_reads' Tipo
# La secuencia 's' pertenecen a
Colecciones = s.list_collections ({"type": "collection_of_reads"})
# Lista de todas las secuencias que también pertenecen a estas colecciones
# Con una longitud de al menos 50 pb
de c en las colecciones:
& Nbsp; c.list_sequences impresión ({"longitud": {"$ gt": 50}})
MetagenomeDB también proporciona un conjunto de herramientas de línea de comandos para importar secuencias de nucleótidos, secuencias de proteínas, BLAST y salida de los algoritmos de alineación FASTA, y archivos de ensamblaje de la ECA. . Otras herramientas se proporcionan para agregar o eliminar varios objetos, o para anotar ellos
Requisitos
- Python
Comentarios que no se encuentran