« UTF-8 » : différence entre les versions
Contenu supprimé Contenu ajouté
m Redirection vers GNU/Linux |
→Description technique : J ai modifié le numéro de l'euro qui était faux (8365 au lieu de 8364) Balises : Révoqué Modification par mobile Modification par le web mobile |
||
Ligne 9 :
== Description technique ==
Techniquement, il s'agit de [[codage des caractères|coder]] les caractères [[Unicode]] sous forme de séquences de un à quatre [[codet]]s d'un [[octet]] chacun. La norme Unicode définit entre autres un ensemble (ou répertoire) de caractères. Chaque caractère est repéré dans cet ensemble par un index entier aussi appelé « [[point de code]] ». Par exemple le caractère « € » ([[Euro (symbole)|euro]]) est le
Le répertoire Unicode peut contenir plus d'un million de caractères, ce qui est bien trop grand pour être codé par un seul [[octet]] (limité à des valeurs entre 0 et 255). La norme Unicode définit donc des méthodes standardisées pour coder et stocker cet index sous forme de séquence d'octets : UTF-8 est l'une d'entre elles, avec [[UTF-16]], [[UTF-32]] et leurs différentes variantes.
|