« UTF-8 » : différence entre les versions

Contenu supprimé Contenu ajouté
Hyrax apple (discuter | contributions)
m Redirection vers GNU/Linux
Description technique : J ai modifié le numéro de l'euro qui était faux (8365 au lieu de 8364)
Balises : Révoqué Modification par mobile Modification par le web mobile
Ligne 9 :
 
== Description technique ==
Techniquement, il s'agit de [[codage des caractères|coder]] les caractères [[Unicode]] sous forme de séquences de un à quatre [[codet]]s d'un [[octet]] chacun. La norme Unicode définit entre autres un ensemble (ou répertoire) de caractères. Chaque caractère est repéré dans cet ensemble par un index entier aussi appelé « [[point de code]] ». Par exemple le caractère « € » ([[Euro (symbole)|euro]]) est le 83658364{{e}} caractère du répertoire Unicode, son index, ou point de code, est donc 8364 (0x20AC) (on commence à compter à partir de 0).
 
Le répertoire Unicode peut contenir plus d'un million de caractères, ce qui est bien trop grand pour être codé par un seul [[octet]] (limité à des valeurs entre 0 et 255). La norme Unicode définit donc des méthodes standardisées pour coder et stocker cet index sous forme de séquence d'octets : UTF-8 est l'une d'entre elles, avec [[UTF-16]], [[UTF-32]] et leurs différentes variantes.
Ce document provient de « https://fr.wikipedia.org/wiki/UTF-8 ».