Coder Social home page Coder Social logo

inmegen / pipelines_inmegen Goto Github PK

View Code? Open in Web Editor NEW
7.0 3.0 0.0 3.14 MB

Flujos de trabajos desarrollados y automatizados en el INMEGEN para el procesamiento de datos genómicos y transcriptómicos.

Home Page: https://serviciosbio.inmegen.gob.mx/

Nextflow 78.83% Shell 6.59% R 8.39% Dockerfile 6.19%
bioinformatics rnaseq-analysis somatic-variants variant-calling dockerfile genomic-data-analysis nextflow-pipeline transcriptome-analysis

pipelines_inmegen's Introduction

INMEGEN

Nextflow run with docker

Flujos de trabajo

Este repositorio contiene información detallada sobre los flujos de trabajo (pipelines) desarrollados y automatizados en el Instituto Nacional de Medicina Genómica (INMEGEN), asociados a los servicios de anślisis bioinformśticos del Inmegen.

Para saber más y realizar una solicitud del servicio de análisis, visita nuestro sitio web dando clic aquí.

El principal objetivo de estos pipelines es el procesamiento de datos provenientes de secuenciación masiva (Whole Genome Sequencing [WGS]/Whole Exome Sequencing [WES], RNA sequencing [RNA-seq]) de manera reproducible y repetible, con base en el uso de herramientas confiables y avaladas por la comunidad científica.

En cada uno de los siguientes directorios de este repositorio [marcado entre corchetes] se encuentran las instrucciones necesarias para ejecutar cada flujo de trabajo:

  • Cuantificación y Análisis de expresión diferencial a partir de datos de RNA-seq [QDEA-RNAseq]
  • Identificación conjunta de variantes germinales a partir de datos WGS/WES [VC-Germline]
  • Identificación de variantes somáticas a partir de datos WGS/WES [VC-Somatic]
  • Identificación de variantes a partir de datos de RNA-seq [VC-RNAseq]
  • Análisis de calidad de archivos de secuenciación masiva en formato FASTQ [Fastq-QC]
  • Identificación conjunta de variantes germinales a partir de datos WGS/WES con bootstrapping [BT-VC-Germinal]

Los directorios que contienen pipelines de procesamiento que son requeridos por más de un flujo de trabajo

  • Preprocesamiento de archivos FASTQ [Data-preprocessing]
  • Anotación de variantes con Annovar [Annotation]

Otros directorios contienen información general:

  • Los procesos en los que están divididos los flujos de trabajo se encuentran en el directorio [modules]
  • El diagrama de flujo correspondiente a cada pipeline se encuentra en la carpeta [flowcharts]
  • El directorio [docker] contiene el Dockerfile para crear el repositorio pipelines_inmegen

Para ejecutar los pipelines

Como pre-requisito para ejecutar los pipelines es necesario contar con:

  1. NextFlow (versión mayor o gual a 22.10.7)

  2. Docker (versión mayor o gual a 23.0.5)

Además, es necesario clonar la imagen de docker de este repositorio con el comando

docker pull pipelinesinmegen/pipelines_inmegen:public

En caso de querer construir la imagen de docker con el Dockerfile que se encuentra en el directorio [docker] utiliza:

docker build -t pipelinesinmegen/pipelines_inmegen:public -f Dockerfile .

Finalmente, clonar este repositorio utilizando:

git clone https://github.com/INMEGEN/Pipelines_INMEGEN.git

NOTA: Debes asegurarte de que el directorio de docker cuente con suficiente espacio para generar la imagen (~ 8 GB).

Políticas de uso

Los flujos de este repositorio pueden ser descargados y utilizados sin restricciones para uso académico. En caso de utilizar cualquiera de estos flujos solicitamos incluir la siguiente frase en los productos académicos generados: “Agradecemos a la Subdirección de Genómica Poblacional y a la Subdirección de Bioinformática del Instituto Nacional de Medicina Genómica por proveer flujos de trabajo que han sido utilizados de forma parcial o total como parte del análisis de este trabajo (We acknowledge the Population Genomics and the Bioinformatics Departments from the National Institute of Genomic Medicine for providing workflows that were, either partially or completely, used as part of the analysis in this work )”

Si requieres el apoyo de nuestro personal para implementar alguno de estos flujos de trabajo en tus datos, este se considerará un servicio. Por lo tanto, se cobrará de acuerdo a los tabuladores existentes en la cartera de servicios INMEGEN.

NOTA: por un tiempo limitado, estos servicios estarán disponibles gratuitamente para personal interno del INMEGEN.

En ningún caso nuestros servicios incluyen interpretación de resultados o generación de resultados más allá de los descritos como parte del flujo de trabajo.

En caso de querer iniciar una colaboración académica con alguno de los miembros de este proyecto favor de contactarnos directamente.

No está permitida la utilización de estos flujos de trabajo con fines comerciales por terceros.

Equipo de desarrollo

Daniel Pérez-Calixto [email protected]

Laura Gómez-Romero [email protected]

Alejandra Cervera Taboada [email protected]

Licencia

Pipelines INMEGEN © 2023 by INMEGEN is licensed under CC BY-NC-SA 4.0

Contacto

Visita nuestro sitio web.

Cualquier duda o comentario escribir a nuestro correo de contacto

pipelines_inmegen's People

Contributors

danpc11 avatar laura-gomez avatar

Stargazers

 avatar Yalbi Balderas-Martinez  avatar Ernesto Paas avatar Alejandra Paulina Pérez González avatar Helena avatar Hugo Tovar avatar  avatar

Watchers

Hugo Tovar avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.