Typages en microbiologie : définition, différentes méthodes de typage, cas particulier des typages MLST


2. Typages MLST et bases de données MLST

Il me semble (novembre 2019) que le typage par séquençage multilocus (MultiLocus Sequence Typing, MLST ), proposé au départ vers 1998, est la méthode standardisée, universelle : il s'agit d'examiner les séquences nucléotidiques de plusieurs locus codant des gènes de ménage ( housekeeping genes ) ou des fragments de gènes de ménage (judicieusement choisis au départ). Pour chaque fragment de locus séquencé, des séquences différentes représenteront des allèles différents. L’ensemble des séquences obtenues pour une souche donnée correspond à un profil caractéristique que l’on peut représenter par un codage (taxonomie). Les données MLST ainsi recueillies sont accessibles sur des bases de données librement accessibles via internet et on obtient ainsi un système transparent, performant, avec une nomenclature uniforme.


Pour comprendre de quoi il s'agit exactement, voici un petit exercice. (liens testés en novembre 2019).

 • Se rendre à :http://pubmlst.org/.

 • Cliquer, par le menu, sur "Databases". Une liste d'espèces typées selon le MLST apparaît. Cliquer, pour l'exemple choisi, vers les pages de l'espèce « Vibrio parahaemolyticus». On atteint ainsi http://pubmlst.org/vparahaemolyticus/.

 • Dans le paragraphe « Information », cliquer sur : " Primers and protocol used for amplification and sequencing"
On voit alors la liste des gènes de ménage choisis et les séquences d'amorces permettant l'amplification PCR et le séquençage de fragments de séquences des gènes choisis.

 • Revenir à la page « Vibrio parahaemolyticus MLST Databases », http://pubmlst.org/vparahaemolyticus/.

 • Dans le paragraphe « Access main databases » , cliquer sur : " Sequences and profiles definitions ".
On atteint ainsi « Vibrio parahaemolyticus locus/sequence definitions database », http://pubmlst.org/perl/bigsdb/bigsdb.pl?db=pubmlst_vparahaemolyticus_seqdef.

 • Ouvrir alors un nouvel onglet de navigation sur : " alleles sequences ".
Cliquer sur "All loci by scheme". On débouche sur une page qui liste les noms des gènes séquencés en commençant par ceux utilisés en typage MLST.
Choisir un gène, par exemple « dnaE ». Cliquer sur "dnaE".
La page signale que "400" variantes de cette zone du génome ont été découvertes. On peut cliquer sur "400" et découvrir les séquences des 400 variantes. Un numéro de 1 à 400 a été donné à chacune. On peut les examiner une par une, les télécharger ... Le lien "Locus Explorer" tout en bas de page suivi de "Polymorphic Sites - Display polymorphic site frequencies and sequence schematic" et "Submit" envoie vers une présentation élégante de cette diversité allélique chez cette zone de dnaE.
On a aussi accès aux séquences aminoacides traduites qui correspondent. Les variants sont évidemment beaucoup moins nombreux puisque le code génétique est dégénéré.

 • De nouveau à partir de la page « Vibrio parahaemolyticus locus/sequence definitions database » ( http://pubmlst.org/perl/bigsdb/bigsdb.pl?db=pubmlst_vparahaemolyticus_seqdef) ouvrir maintenant un nouvel onglet de navigation sur : " Browse profiles " c'est à dire l'adresse ( https://pubmlst.org/bigsdb?db=pubmlst_vparahaemolyticus_seqdef&page=query ).
Garder les options par défaut et cliquer sur "Submit". On a alors accès à tous les différents profils découverts avec des souches de cette espèce !

Pour l'exemple étudié, 2208 types différents rencontrés chez des isolats Vibrio parahaemolyticus sont alors proposés.
Ainsi, le type 1 (ST1) est :

ST

dnaE

gyrB

recA

dtdS

pntA

pyrC

tnaA

1

5

52

27

13

17

25

10

Ce qui signifie que chez le type Vibrio parahaemolyticus appelé ST1 (strain 1), la séquence de dnaE est la séquence répertoriée sous le numéro 5 dans la base « alleles sequences » vue précédemment. Que la séquence gyrB est la numéro 52 dans la base "alleles sequences" concernant gyrB. Et ainsi de suite pour les autres gènes de ménage concernés pour le MLST typage de Vibrio parahaemolyticus. Edifiant ? Non ?


Et un autre exercice pour enfoncer le clou et bien s'imprégner de l'aspect « universel et transparent ».
Ouvrir un onglet de navigation à la page " All species MLST databases and published schemes " grâce à l'adresse https://pubmlst.org/databases.shtml Descendre dans la page obtenue (http://pubmlst.org/databases.shtml).
Observer que c'est par exemple l'Institut Pasteur (cocorico ...) qui héberge les données : Klebsiella pneumoniae, Listeria Monocytogenes, lactobacillus casei et bien d'autres.
Se promener dans une des ces pages à l'aide du lien. Et aller voir qu'on est en terrain connu. De l'intérêt des bases de données internationales coordonnées ...


retour en haut de page