Séquence conservée
En biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.
Une séquence fortement conservée est une séquence qui est restée relativement similaire le long de l'arbre phylogénétique, donc depuis assez longtemps dans le temps géologique. Les ARN ribosomaux, qui sont présents dans tous les domaines du vivant ; les séquences homéoboxes, qui sont répandues parmi les eucaryotes et l'ARNt chez les bactéries, sont des exemples de séquences fortement conservées. L'étude de la conservation des séquences est à cheval sur les domaines de la génomique, de la protéomique, de la biologie évolutive, de la phylogénétique, de la bioinformatique et des mathématiques .
Historique
modifierLa découverte du rôle de l'ADN dans l'hérédité et les observations par Frederick Sanger de différences entre les gènes de l'insuline de différentes espèces animales en 1949[1] ont incité les premiers biologistes moléculaires à étudier la taxonomie d'un point de vue moléculaire[2],[3] . Des études dans les années 1960 ont utilisé des techniques d'hybridation de l'ADN et de réactivité croisée des protéines pour mesurer la similitude entre des protéines orthologues connues, comme l'hémoglobine[4] ou le cytochrome C[5]. En 1965, Emile Zuckerkandl et Linus Pauling ont introduit le concept de l' horloge moléculaire [6], proposant que l'utilisation de taux constants de remplacement des acides aminés pourrait permettre d'estimer le temps écoulé depuis la divergence (en) de deux organismes. Alors que les phylogénies initiales correspondaient aux archives fossiles, les observations selon lesquelles certains gènes semblaient évoluer à des rythmes différents ont conduit au développement des théories de l'évolution moléculaire . La comparaison par Margaret Dayhoff en 1966 des séquences de ferrodoxine a montré que la sélection naturelle conserve et optimise des séquences protéique essentielles à la vie[7].
Mécanismes
modifierLes séquences d'acides nucléiques dans un génome peuvent progressivement changer au cours du temps à cause de mutations et de délétions aléatoires[8],[9]. Les séquences peuvent également se recombiner ou être supprimées lors de réarrangements chromosomiques. Les séquences conservées sont des séquences qui persistent dans le génome malgré ces différents évènements, et ont des taux de mutation plus faible que celui attendu aléatoirement[10].
La conservation peut concerner des séquences d'acides nucléiques codantes et non codantes. Les séquences d'ADN hautement conservées sont considérées par hypothèse comme ayant un rôle fonctionnel, quoique ce rôle soit mal compris pour de nombreuses séquences d'ADN non codantes fortement conservées[11],[12]. La mesure dans laquelle une séquence est conservée peut varier en fonction de la pression de sélection, de sa robustesse à la mutation, de la taille de la population et de la dérive génétique. De nombreuses séquences fonctionnelles, comme les domaines protéiques, sont modulaires, et contiennent ainsi des régions qui peuvent être soumises à des pressions de sélection indépendantes[13].
Références
modifier- Sanger, « Species Differences in Insulins », Nature, vol. 164, no 4169, , p. 529 (PMID 18141620, DOI 10.1038/164529a0, Bibcode 1949Natur.164..529S)
- Marmur, Falkow et Mandel, « New Approaches to Bacterial Taxonomy », Annual Review of Microbiology, vol. 17, no 1, , p. 329–372 (PMID 14147455, DOI 10.1146/annurev.mi.17.100163.001553)
- Pace, Sapp et Goldenfeld, « Phylogeny and beyond: Scientific, historical, and conceptual significance of the first tree of life », Proceedings of the National Academy of Sciences, vol. 109, no 4, , p. 1011–1018 (PMID 22308526, PMCID 3268332, DOI 10.1073/pnas.1109716109, Bibcode 2012PNAS..109.1011P)
- Zuckerlandl et Pauling, « Molecular disease, evolution, and genetic heterogeneity », Horizons in Biochemistry, , p. 189–225
- Margoliash, « Primary Structure and Evolution of Cytochrome C », Proc Natl Acad Sci U S A, vol. 50, no 4, , p. 672–679 (PMID 14077496, PMCID 221244, DOI 10.1073/pnas.50.4.672, Bibcode 1963PNAS...50..672M)
- E Zuckerkandl et LB Pauling, Evolutionary Divergence and Convergence in Proteins, , 96–166 p. (ISBN 9781483227344, DOI 10.1016/B978-1-4832-2734-4.50017-6)
- Eck et Dayhoff, « Evolution of the Structure of Ferredoxin Based on Living Relics of Primitive Amino Acid Sequences », Science, vol. 152, no 3720, , p. 363–366 (PMID 17775169, DOI 10.1126/science.152.3720.363, Bibcode 1966Sci...152..363E)
- Kimura, « Evolutionary Rate at the Molecular Level », Nature, vol. 217, no 5129, , p. 624–626 (PMID 5637732, DOI 10.1038/217624a0, Bibcode 1968Natur.217..624K)
- King et Jukes, « Non-Darwinian Evolution », Science, vol. 164, no 3881, , p. 788–798 (PMID 5767777, DOI 10.1126/science.164.3881.788, Bibcode 1969Sci...164..788L)
- Kimura et Ohta, « On Some Principles Governing Molecular Evolution », Proc Natl Acad Sci USA, vol. 71, no 7, , p. 2848–2852 (PMID 4527913, PMCID 388569, DOI 10.1073/pnas.71.7.2848, Bibcode 1974PNAS...71.2848K)
- (en) Asthana, Roytberg, Stamatoyannopoulos et Sunyaev, « Analysis of Sequence Conservation at Nucleotide Resolution », PLOS Computational Biology, vol. 3, no 12, , e254 (ISSN 1553-7358, PMID 18166073, PMCID 2230682, DOI 10.1371/journal.pcbi.0030254, Bibcode 2007PLSCB...3..254A, lire en ligne)
- (en) Cooper et Brown, « Qualifying the relationship between sequence conservation and molecular function », Genome Research, vol. 18, no 2, , p. 201–205 (ISSN 1088-9051, PMID 18245453, DOI 10.1101/gr.7205808, lire en ligne )
- (en) Gilson, Marshall-Christensen, Choi et Shakhnovich, « The Role of Evolutionary Selection in the Dynamics of Protein Structure Evolution », Biophysical Journal, vol. 112, no 7, , p. 1350–1365 (PMID 28402878, PMCID 5390048, DOI 10.1016/j.bpj.2017.02.029, Bibcode 2017BpJ...112.1350G, arXiv 1606.05802)