Logiciels Publics (liste mise à jour le 01/06/2012)

La version des outils mis en ligne ici est  : EMBOSS 2.3.1

Le Centre de Bioinformatique de Bordeaux (CBiB) met à disposition de la communauté scientifique un panel d'applications en ligne grâce à l'environnement PISE. Cet outil a été développé par Catherine Letondal à l'Institut Pasteur.

L'ensemble des programmes suivant est disponible à travers une page web. Pour chacun des programmes, il existe une version simplifiée où les paramètres sont choisis par défaut et une version avancée, où l'utilisateur peut choisir les paramètres.



Alignements et comparaisons de séquences

Recherche de séquences similaires dans les banques  : BLAST 

Comparaison et alignement de deux séquences : 

EMBOSS :
needle : Alignement global Needleman-Wunsch. 
water : Alignement local Smith-Waterman. 
showalign : Affichage d'un alignement multiple de séquences.
merger : Fusionne deux séquences recouvrantes. 
megamerger: Fusionne deux séquences d'ADN recouvrantes. 
stssearch : Comparaison de primer STS avec des séquences d'ADN. 
matcher : Trouve le meilleur alignement local possible entre deux séquences. 
stretcher : Trouve le meilleur alignement global possible entre deux séquences. 
supermatcher : Comparaison d'une très grande séquence avec une ou plusieurs séquences. 
wordmatch : Recherche de toutes les sections identiques d'une taille donnée entre deux séquences d'ADN. 
polydot : Dotplot rapide de plusieurs séquences. Équivalent de polydot d'EGCG. 
dottup : Affiche un dotplot "wordmatch" de deux séquences. 
plotcon : Affiche la qualité de conservation d'un alignement multiple. 
est2genome : Alignement d'EST et de séquences génomiques. 
diffseq : Trouve des différences (SNPs) entre des séquences quasi-identiques.
 
infoalign : Affiche des informations sur un alignement multiple.

 

EMBOSS :

emma : interface du programme ClustalW.
plotcon : Courbe de la qualité de conservation d'un alignement multiple.

cons : Calcule la séquence consensus d'un alignement multiple.
prophecy : Crée une matrice ou profil à partir d'alignements multiples. 
prophet : Crée un alignement avec gaps pour les profils
distmat : Calcule une matrice de distance à partir d'un alignement multiple.

HMM (Hidden Markov Models)
HMMER: utilisation de HMM (S. Eddy)

Phylogénie

PHYLIP : PHYLogeny Inference Package (Felsenstein).

fastDNAml (version 1.2) : Construction d'arbres phylogénétiques de séquences d'ADN par la méthode du maximum de vraisemblance. Implémentation très rapide du programme DNAML du package PHYLIP (Olsen, Matsuda, Hagstrom, Overbeek).

BionNJ (nouveau) : Calcul d'arbre phylogénétique par une version améliorée de l'algorithme NJ, adaptée aux distances évolutives obtenues à partir de séquences alignées


Recherche de gènes et régions codantes

EMBOSS :
transeq : traduction d'une séquence nucléique 
getorf : Extraction d'ORFs (Open Reading Frames). 
plotorf: Graphe des ORFs potentiels. 
backtranseq : traduction inverse d'une protéine en ADN 
prettyseq : output sequence with translated ranges 
showorf : affichage améliorée des traductions d'une séquence 
chips : statistiques d'usage des codons 
codcmp : comparaison de tables d'usage de codons 
syco: statistiques de Gribskov sur l'usage de codons synonymes 
coderet: extraction de CDS, mRNA et de traductions des tables de features d'une entrée de banque 
marscan: recherche de sites MAR/SAR dans une séquence nucléique

 


Recherche et extraction de motifs

Cette page propose différents outils pour la recherche de motifs connus ou l'extraction de motifs à partir d'un ensemble de séquences. 

Recherche d'un motif
Attention, les interfaces Web n'autorisent pas l'utilisation de la syntaxe PROSITE complète pour les programmes fuzztran, fuzznuc et fuzzpro. 

EMBOSS :

fuzztran: recherche d'un motif protéique après traduction
fuzznuc : Recherche d'un motif donné dans une séquence d'ADN

 

 

Recherche de répétitions

EMBOSS :

einverted: recherche de répétitions inversées. 
equicktandem : recherche de répétitions en tandem. 
etandem: recherche de répétitions en tandem dans une séquence d'ADN, d'une taille suggérée par etandem. 
palindrome : recherche de répétitions inversées dans une séquence d'ADN.

 

 

 

RepeatMasker : recherche de répétitions et de régions de faible complexité dans une séquence d'ADN (Arian Smith).

 

Sputnik : recherche des séquences microsatellites dans des séquences d'ADN (Chris Abajian).

HMM (Hidden Markov Models)

HMMER: utilisation de HMM (S. Eddy) 

Divers

EMBOSS :

msbar : Mutations illimitées d'une séquence. 
compseq: Comptage des compositions des dimères, trimères, etc... dans une séquence. 
shuffleseq : Mélange de séquences en maintenant la composition. 
chaos : Create a chaos game representation plot for a sequence. 
freak : Table ou courbe de fréquences de résidus/bases.


Outils pour les séquences

Conversions de formats de séquences

READSEQ : utilitaire de base de conversion de format

Features

EMBOSS :

infoseq : Affichage de quelques informations simples d'une séquence.
maskseq : Masquage de régions d'une séquence.
profit : Recherche dans une séquence ou une base de donnée à partir d'une matrice ou un profil
dreg : Cherche une expression régulière dans une séquence nucléique
preg : Cherche une expression régulière dans une séquence protéique

seqmatchall : Compare toutes les séquences entre elles.
maskfeat: Masquage des features d'une séquence. 
showfeat: Affichage des features d'une séquence.

Édition de séquence

EMBOSS :

biosed: Remplacer ou supprimer une section de séquence spécifiée par son contenu. 
cutseq: Supprimer une section de séquence. 
pasteseq: Insérer une séquence dans une autre. 
extractseq: Extrait une ou des régions d'une séquence. 
degapseq: Enlève les gaps d'une séquence. 
descseq: Change le nom ou la description d'une séquence. 
trimest : Retirer les poly-A de séquences d'EST. 
vectorstrip : Élimination des séquences de vecteur de clonage. 
trimseq: Supprime les bits ambigus à la fin de la séquence.

Manipulation de séquences

EMBOSS :

listor: Produit un fichier listant l'union de deux fichiers de séquences (OU logique). 
seqret : Lit et retourne une séquence
newseq : Ecrit une nouvelle séquence.
notseq: Exclusion de séquences d'un fichier. 
nthseq: Écrit une séquence parmi plusieurs séquences. 
splitter: Éclate une séquence en plusieurs petites séquences recouvrantes.

 


Analyses de séquences de protéines

 

Analyse de Structure

EMBOSS :

pepcoil: Prédiction de régions "coiled coil" 
pepwheel: Montre une séquence de protéine sous forme d'hélice 
pepnet: Affiche une protéine sous forme de réseau d'hélices 
helixturnhelix: Affiche les sites de liaisons nucléiques 
sigcleave: Affiche les sites de signal de clivage 
tmap : Graphe des régions transmembranaires

 

Structure secondaire
scope: Convertit un fichier de classification SCOP dans un format similaire au format EMBL 
nrscope: Convertit un fichier redondant de classification SCOP de format EMBL en un fichier non-redondant 
domainer: Construit un fichier de coordonnées
Structure tertiaire

Recherche de motifs

EMBOSS :

fuzzpro : Recherche d'un motif donné dans une protéine. Voir le programme PROSE pour utiliser la syntaxe complète PROSITE. 
fuzztran: Recherche d'un motif protéique après traduction. 
patmatdb : Recherche d'un motif dans des séquences de protéines. 
patmatmotifs : Recherche des motifs d'une séquence de protéine à partir d'une banque de motifs.
 

Attention, les interfaces Web n'autorisent pas l'utilisation de la syntaxe PROSITE complète pour les programmes fuzztran, et fuzzpro. 

Composants de protéines

EMBOSS :

antigenic : Recherche de sites antigéniques dans une protéine. 
helixturnhelix : Sites de liaison d'acides nucléiques. 
pepcoil : Prédiction de régions "coiled coil". 
pepnet : Affiche une protéine comme un réseau d'hélices. 
pepwheel : Affiche une protéine comme des hélices. 
pscan : Recherche de motifs de la banque PRINTS dans une séquence. 
sigcleave : Prédit les sites de clivages de "peptides signaux". 
oddcomp : Recherche les régions dont la compositions est biaisé. 
tmap : Graphe des régions transmembranaires. 
TopPred 2 : prédiction topologique de régions transmembranaires.

 

Propriétés de protéines

EMBOSS :

emowse : Identification de protéines par spectrométrie de masse
checktrans : Statistiques sur les propriétés des ORF.
 
digest : Prédiction de profils de digestion par des enzymes protéolytiques ou des réactifs chimiques. 
pepwindow : Trace l'hydropathie d'une protéine. 
pepwindowall : Trace l'hydropathie d'un ensemble de protéines alignées. 
pepinfo : affiche en parallèle l'acide aminé et ses propriétés.
octanol : Graphique de la différence de solubilité en octanol et en eau d'une protéine. 
iep : Calcul du point isoélectrique d'une protéine. 
pepstats : Statistiques sur les protéines. 
mwfilter: Filtrer le bruit de fond dans les poids moléculaires en sortie d'une spectrométrie de masse. 
prettyplot : Équivalent de prettyplot d'EGCG. Propose également une sortie texte pour les alignements. 
hmoment : Calcul de moment hydrophobique. 
charge : Courbe de charge.

 

Cinétique Enzymatique

EMBOSS :

findkm: Calcule le Km et la Vmax d'une réaction enzymatique.

 


Analyses de séquences d'ADN

Recherche de motifs

EMBOSS :

fuzznuc : Recherche d'un motif donné dans une séquence d'ADN 
fuzztran: recherche d'un motif protéique après traduction

Attention, les interfaces Web n'autorisent pas l'utilisation de la syntaxe PROSITE complète pour les programmes fuzztran et fuzznuc.

Sites de restriction

EMBOSS :

restrict : Recherche de site de clivage d'enzymes de restriction. 
redata : Recherche dans REBASE d'un nom, d'une référence ou d'un fournisseur d'enzyme. 
restover : Recherche les sites de restriction qui produisent des extrémités cohésives.
recoder : Enlève les sites de restriction sans modifier la traduction
remap : Affiche une séquence avec les sites de restriction, la traduction, etc... 
silent : Criblage par enzymes de restriction de mutations silencieuses.

Facteurs de transcription

EMBOSS :

tfscan : recherche des facteurs transcription dans une séquence d'ADN.

 

Répétitions

 

RepeatMasker : recherche de répétitions et de régions de faible complexité dans une séquence d'ADN (Arian Smith). 

 

Sputnik : recherche des séquences microsatellites dans des séquences d'ADN (Chris Abajian).

EMBOSS :

einverted: recherche de répétitions inversées. 
equicktandem : recherche de répétitions en tandem. 
etandem: recherche de répétitions en tandem dans une séquence d'ADN, d'une taille suggérée par etandem. 
palindrome : recherche de répétitions inversées dans une séquence d'ADN. 

 

Usage des codons, composition

EMBOSS :

chips : statistiques d'usage des codons. 
codcmp : comparaison de tables d'usage de codons. 
syco : statistiques de Gribskov sur l'usage de codons synonymes. 
cusp : crée une table d'usage des codons. 
wordcount : Comptage des mots d'une taille donnée dans une séquence d'ADN. 
geecee : Calcule le pourcentage de GC d'une séquence nucléique

Îlots CpG

EMBOSS :

cpgreport : Liste les régions riches en CpG
newcpgreport : Liste les régions riches en CpG
newcpgseek : Liste les régions riches en CpG (révision de cpgreport)
cpgplot : Graphique des régions riches en CpG

Primers

EMBOSS :

primersearch : Recherche de paires de primers dans des séquences nucléiques. 
Eprimer3 : Recherche d'amorces de PCR

Propriétés de l'ADN

EMBOSS :

dan : Calcule la température de fusion DNA RNA/DNA. 
isochore : Graphe des isochores dans de grandes séquences d'ADN. 
showseq : Affiche une séquence avec ses caractéristiques, traduction...
banana: Bending and curvature plot in B-DNA.

Divers

EMBOSS :

wordmatch : Recherche de toutes les sections identiques d'une taille donnée entre deux séquences d'ADN. 
revseq : Inverse et complémente une séquence. 
lindna : Affiche la représentation des cartes linéaires de constructions d'ADN. 
cirdna : Affiche la représentation des cartes circulaires de constructions d'ADN. 
wobble : Wobble base plot.
cai : affiche les codons synonymes par statistiques de Gribskov.
btwisted : Calcul le twisting dans une séquence d'ADN.

vectorstrip : Élimination des séquences de vecteur de clonage. 
abiview : Lecture et affichage de fichier de trace ABI. 
coderet: Extraction de CDS, mRNA et de traductions des tables de features d'une entrée de banque. 
marscan : Recherche de sites MAR/SAR dans une séquence nucléique. 
trimest : Retirer les poly-A de séquences d'EST.

 


Analyse d'ARN

EMBOSS :

palindrome : recherche de répétitions inversées dans une séquence nucléique.