Introduction
La phylogénie est l'étude des relations de parenté entre les êtres vivants. Elle permet de trouver des liens de parenté entre des individus (pour recréer des arbres généalogiques), mais surtout de retracer les liens de parenté entre des populations ou des espèces entières. Grâce à l'essor d'outils et méthodes d'analyses génétiques, il est possible de determiner à quelle famille, population ou espèce un individu appartient : plus sa séquence d'ADN (support de l'information génétique) est proche de celles des individus d'une famille, population ou espèce, plus il a de liens de parenté avec celle-ci. On parle de distance génétique (souvent mesurée en % de différences génétiques).
Le barcoding est l'une de ces méthodes d’identification des espèces, et repose sur une courte séquence standardisée d’ADN pour determiner à quelle espèce appartient un individu isolé. Elle a été proposée par Hebert et al. (2003) et suppose que la distance génétique intraspécifique (entre individus d’une même espèce) est inférieure à la distance interspéficique (entre individus d’espèces différentes). Intuitivement, cela revient à dire que deux êtres humains sont génétiquement plus proches entre eux que chacun d'eux n'est proche d'un chimpanzé par exemple. Ainsi, les entités biologiques sont séparées entre elles par un « barcoding gap » (ou fossé de barcoding en français). Alors que l’intérêt pour cette technique a rapidement augmenté dans plusieurs domaines de la biologie, différentes critiques et remises en cause de son efficacité existent au sein de la communauté scientifique.
Questions
Le barcoding est-il un outil efficace et utile pour la classification des espèces ?
Quelles sont ses limites ?
Quels sont ses avantages et inconvénients par rapport à d'autres outils qui répondent au même objectif ?
Introduction
Le barcoding d’ADN (ou DNA barcoding), tel que proposé pour la première fois par Hebert et al. (2003) [1], est une technique qui permet de caractériser génétiquement un individu ou un échantillon d’individus animaux en lui attribuant un code-barres, à partir d’un gène mitochondrial : le gène codant pour la cytochrome c oxydase I (COI). Cette méthode est basée sur la divergence moléculaire (ou barcoding gap) représentant la différence entre la variabilité intraspécifique et la divergence interspécifique : les individus d’une même espèce auront une divergence moléculaire inférieure à celle d’individus d’espèces différentes. Ainsi, il est possible de relier un spécimen inconnu à l’espèce à laquelle il appartient, mais aussi de découvrir de nouvelles espèces. Pour ce faire, des bases de données sont nécessaires : elles regroupent les séquences “type” du code-barres d’ADN universel (la COI pour les animaux [1]) d’un maximum d’espèces connues à ce jour, auxquelles vont être comparés les échantillons d’ADN. De cette façon, les spécimens vont pouvoir être identifiés comme taxon déjà existant ou comme nouvelle espèce. Aussi, en considérant que des individus qui présentent un taux de divergence moléculaire au dessus du seuil de divergence intraspécifique toléré (Hebert et al. 2003 [1] utilisent un seuil fixé à 3% chez les animaux), on peut discriminer des espèces différentes. En effet, il suffit de considérer que des individus qui présentent une divergence moléculaire supérieure au seuil appartiennent à des espèces différentes. La méthode d’analyse moléculaire basée sur le pourcentage de divergence moléculaire entre taxon est appelée “méthode de distance” et est à l’heure actuelle la plus largement utilisée dans les analyses de barcoding.
Cet outil moléculaire montre un grand potentiel pour de nombreuses utilisations : classification taxonomique des individus d’espèces connues, découverte de nouvelles espèces, discrimination d’espèces cryptiques [2], identification de l’origine et de l’identité d’un échantillon [2], [1], etc. Ainsi, le barcoding pourrait permettre un gain d’efficacité en taxonomie par rapport à l’approche traditionnelle (i.e. basée sur l’analyse des traits morphologiques). En effet, cette méthode est plus rapide, moins onéreuse, produit une classification des espèces objective, et des données (séquences d’ADN) comparables au sein du règne animal entier. Le barcoding pourrait donc permettre une réelle avancée dans le domaine de la taxonomie.
Cet outil émergeant a ainsi rapidement conquis une grande partie de la communauté scientifique. Néanmoins, il reste au cœur d’une controverse : alors que certains auteurs sont totalement convaincus de l’utilité et de l’efficacité de la méthode, d’autres s’inquiètent des dangers inhérents à l’utilisation de cette technique, parfois trop simpliste et automatisée.
Cœur de la synthèse
Le barcoding d’ADN est aujourd'hui largement utilisé en biologie mais aussi dans l'industrie (e.g. analyses alimentaires et pharmaceutiques, voir notamment Lowenstein et al. 2009). Néanmoins, cette méthode présente un certain nombre de désavantages et doit faire face à des critiques parfois virulentes [3].
En effet, il existe un important biais dans les bases de données utilisées pour les analyses de barcoding. En comparaison avec leur diversité biologique estimée dans la nature, les animaux sont sur-représentés dans les bases de données, alors que les protistes et les champignons sont largement sous-représentés. Or, ce sont précisément ces deux derniers taxons qui nécessiteraient le plus une taxonomie indépendante des analyses morphologiques [3]. De plus, ces bases de données peuvent être biaisées lorsque plusieurs laboratoires identifient de manière différente un même taxon. En effet, de nombreuses études montrent des confusions au niveau sémantique, menant à des méthodologies inadaptées. Ainsi, les interprétations erronées qui en résultent peuvent engendrer des erreurs dans les bases de données [4]. Malgré l’utilité du barcoding en biologie, son potentiel peut donc être réduit du fait d’une mauvaise utilisation.
Également, la séquence codante pour la COI, proposée comme code-barres universel pour les animaux [1], ne permet pas une analyse génétique efficace pour certains taxons (e.g. amphibiens [3]). Aussi, il n’existe pas encore de consensus sur le code-barres à utiliser pour les autres taxons, comme c’est notamment le cas chez les plantes. Toutefois, plusieurs études ont montrées que des code-barres issus de gènes chloroplastiques ou de combinaisons de gènes (nucléaires, mitochondriaux, et/ou chloroplastiques) présentent une efficacité accrue et seraient donc très prometteurs en biologie végétale [5].
De plus, le gène codant pour la COI est un gène mitochondrial. Or, l’histoire évolutive du génome mitochondrial (et du génome chloroplastique) n’est pas forcément la même que celle du génome nucléaire (dans le noyau). En outre, certaines espèces présentent différents génomes mitochondriaux au sein d’un même individu (i.e. hétéroplasmie). Tout cela pose d'importants problèmes pour l’analyse et la pertinence des informations recueillies via des séquences COI [3].
Également, face à l'amélioration des techniques de séquençage à haut débit, le domaine de la biologie connaît une autre révolution moléculaire. Les techniques permettant un accès facile et rapide au génome entier des organismes pourraient rendre le barcoding obsolète [3]. Car en effet, bien que des publications récentes (voir notamment Shokrala et al. 2014) montrent l’intérêt du séquençage de nouvelle génération pour augmenter la rapidité de séquençage des code-barres, pourquoi se restreindre à n’utiliser qu’une courte séquence d’ADN alors que le génome entier est disponible ? Le cas échéant, utiliser de longues séquences d’ADN, voire le génome entier d’un organisme, peut-il toujours être considéré comme étant une méthode de barcoding d’ADN ?
L’idée qu’une unique et courte séquence d’ADN puisse discriminer des espèces cryptiques (différentiables génétiquement mais que rien ne différencie au niveau morphologique) peut sembler naïve [3]. En effet, une spéciation est un processus complexe, généralement accompagné d’introgressions (transferts de gènes d'une espèce à une autre) et d’hybridations passagères, ce qui brouille le signal génétique. La discrimination entre espèces peut demander l’utilisation d’une grande quantité d’informations moléculaires pour pouvoir réellement conclure sur la séparation génétique entre entités biologiques [3], [6].
De plus, le seuil de divergence moléculaire utilisé par Hebert et al. (2003) [1] fixé à 3%, n’est pas efficace chez tous les groupes taxonomiques. Une analyse préalable du taux de divergence moléculaire au sein du taxon étudié doit être effectuée afin de fixer le seuil à une valeur adaptée à l’objet d’étude (car en effet le barcoding gap dépend du type d’organisme étudié). Une fois que le seuil de divergence est fixé, cette méthode peut devenir un outil très efficace pour effectuer un inventaire de biodiversité. Elle permet de dénombrer les espèces présentent dans une zone d’étude, sans nécessairement (dans un premier temps) leur attribuer un nom et donc les associer à une classification.
La méthode la plus utilisée dans les analyses de barcoding est la méthode des distances génétiques proposée par Hebert et al. (2003) [1]. Or, il semble que ce ne soit pas une technique fiable pour la découverte de nouvelles espèces, notamment dans les cas complexes (e.g. absence de barcoding gap due à une spéciation récente) [7], [8], [3], [6]. Face à cela, des méthodes d’analyse plus efficaces, basées notamment sur les différences entre caractères moléculaires de séquence d’ADN, peuvent être utilisées. Cependant, le domaine du barcoding semble peiner à modifier ses habitudes méthodologiques [3].
Par conséquent, à elles seules, les études de barcoding ne peuvent pas toujours garantir une classification taxonomique parfaite, et dans de nombreux cas, l’intervention couplée des méthodes moléculaires et morphologiques est indispensable pour raffiner les analyses [8], [6]. Cependant, l’utilisation de cette technique peut être une alternative lorsque les techniques traditionnelles d’analyses morphologiques ne peuvent être appliquées aux échantillons, notamment dans le cas des invertébrés du sol (e.g. pour individus juvéniles) [9]. Ainsi, malgré son potentiel, le barcoding ne met aucunement en péril le métier de taxonomiste comme il a pu être signalé par certains auteurs [5] car les études nécessitent régulièrement l’intervention des méthodes traditionnelles. Il pourrait au contraire libérer les taxonomistes d’une partie de leur travail d’identification d’espèces connues pour passer plus de temps à la description de nouvelles espèces. De plus, cet outil aisé d’utilisation pourrait se démocratiser dans le grand public et provoquer un engouement pour la taxonomie. Ainsi le problème de l’obstacle taxonomique pourrait être au moins partiellement résolu [5]. Le barcoding est néanmoins un outil très utile sur le terrain et complémentaire aux analyses morphologiques lorsque les espèces échantillonnées sont déjà connues et renseignées dans les bases de données.
Bien que le barcoding échoue dans certains cas, il peut montrer des résultats prometteurs. Chapple et Ritchie (2013) [6] ont montré, via une approche rétrospective, que pour l’identification et la délimitation de spécimens de scinques de Nouvelle Zélande, le barcoding est aussi fiable que les méthodes de taxonomie traditionnelles (i.e. traits morphologiques). D’autres études confortent l’efficacité du barcoding pour l’identification d’espèces [9], et ce même à large échelle géographique [10].
De plus, une autre méthode plus efficace que celles des distances génétiques [1], basée sur les différences de caractères génétiques entre séquences code-barres, a été proposée (voir notamment DeSalle et al. 2005). Cette technique n’est pas axée sur le principe de divergence génétique, et ne nécessite donc pas la présence d’un barcoding gap entre les espèces étudiées. Ainsi, en utilisant cette méthode d’analyse, le barcoding se révèle efficace dans les cas complexes (e.g. récente divergence entre espèces) [2].
Depuis Hebert et al. (2003) [1], bon nombre de publications ont tenté de tester l’efficacité du barcoding d’ADN [2], [7]. Il y est présenté l’efficacité d’assignation taxonomique, c.a.d. le pourcentage d’assignation d’un individu inconnu au taxon auquel il appartient (famille, genre ou espèce). Or, pour un même pourcentage de réussite de classement, certains auteurs concluront à une bonne efficacité du barcoding alors que d’autres jugerons que la méthode est inefficace. Dans ces études, qui sont néanmoins nécessaires, les conclusions peuvent ainsi sembler arbitraires.
Conclusion et ouverture
En conclusion, il semble que le barcoding d’ADN soit accepté dans la majeure partie de la communauté scientifique. Les critiques qui lui sont faites sont essentiellement ciblées, non pas sur son utilité, mais sur les méthodes employées. En effet, le barcoding est validé comme outil pouvant permettre une grande avancée en taxonomie et dans la découverte de nouvelles espèces (moins coûteux, plus rapide et accessible). De tels travaux sont d’autant plus importants dans le contexte actuel d’érosion rapide de la biodiversité. En effet, un déficit dans la connaissance des espèces en voie de disparition pourrait entraver la compréhension du fonctionnement des écosystèmes, surtout en ce qui concerne les organismes du sol [9].
Cependant, selon les taxons ciblés, toutes les études ne sont pas couronnées de succès (e.g. méthodologies inappropriées, spéciation récentes, hybridations passées ou actuelles, etc.), ce qui freine l’enthousiasme pour le barcoding.
En tant que domaine scientifique récent, le barcoding a besoin d'acquérir des méthodes puissantes (pour le traitement et l’analyse des données), intégratives (i.e. association avec la taxonomie traditionnelle) et uniformisées dans l’ensemble du domaine scientifique afin d’acquérir une efficacité accrue. Cet outil prometteur va devoir surmonter des défis qui sont encore devant lui pour pouvoir jouer un rôle majeur dans la connaissance de la biodiversité ; objectif non négligeable dans le cadre actuel de changement global, notamment pour la protection des espèces menacées.
Publiée il y a presque 9 ans par Suzanne Bonamour et collaborateurs..