Des reads single-end ou pairés au format FASTQ peuvent être analysés par NGS QC Toolkit. Les reads sont filtrés en fonction de leur qualité et sont présentés dans un ou plusieurs ficher(s) FASTQ. Un rapport, au format HTML accompagné de graphes, est généré pour présenter toutes les statistiques relatives aux reads analysés:
Séquences provenant soit de la technologie Illumina, soit de 454, soit des 2 mélangées, en single end, mate pair ou paired end.
ABySS est un assembleur de novo, parallélisé, pour les reads courts. Il utilise un algorithme d’assemblage basé sur un graphe de De Bruijn. Il requiert des reads single-end et/ou pairés au format fasta/fastq et génère un assemblage au format fasta.
Mira (Mimicking Intelligent Read Assembly) est un assembleur pour les petits génomes. Il est basé sur une approche overlap-layout-consensus et supporte les reads issus de séquençage Sanger, 454, Ion Torrent, Solexa et Pacific Biosciences. Il requiert des reads single-end et/ou pairés au format fasta/fastq et génère un assemblage au format fasta.
CLC est un réputé pour être l'assembleur le plus performant à l'heure actuelle. Son algorithme est basé sur un graphe de De Bruijn. Il requiert des reads single-end et/ou pairés au format fasta/fastq et génère un assemblage au format fasta.
Deux algorithmes différents sont utilisés selon les cas : samse/sampe pour les reads single-end ou paired end de moins de 200 bp, ou bwasw pour les séquences de plus de 200 bp.
Pour les alignments de reads sur plusieurs séquences.
Cet outil est destiné à aligner des reads courts sur de grands génomes de manière rapide et en minimisant la mémoire utilisée.
L'utilisation de cet outil requiert deux assemblages issus de deux assembleurs différents au format fasta. Il aligne les contigs de l'assemblage pris pour requête, sur les contigs de l'assemblage choisi comme référence pour obtenir de plus grands contigs.
Cet outil de scaffolding requiert un assemblage au format fasta et des reads pairés au format fastq. Il aligne les reads sur l'assemblage pour regrouper les contigs en scaffolds.
Utilisation du logiciel DECIPHER (version 1.1.2)
Utilisation du script Tango (version 1.2.0)
Nécessite un fichier taxonomie au format Newick sans redondance, ou le fichier au format fasta des séquences 16S du site GreenGenes
khmer est un ensemble d'outils pour effectuer des analyses et des transformations basées sur la composition en k-mers. Ces étapes sont particulièrement utile dans le cas de l'analyse de Métagénomes - Nécessite des fichiers .fastq ou .fasta