Discussion:American Standard Code for Information Interchange

Dernier commentaire : il y a 3 ans par 2A01:E34:ECFA:5760:D0EA:ED62:32C4:B47A dans le sujet Section « Principes » : passage pas clair, voire faux.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

[ASCII] ou [American standard code for information interchange] ?

La discussion sur se sujet a été déplacée à: Wikipédia:Prise de décision, acronymes comme titres d'article ? (FvdP 5 déc 2003 à 21:33 (CET))


Pour moi, l'ASCII n'a rien a voir avec un langage de programmation. Je remplace donc le tag {{sérieLangagesInfo}} par [[Catégorie:Normes et standards informatiques]]

Olrick 4 jul 2004 à 20:59 (CEST)


Introduction et "compatibilité"

modifier

"La norme ASCII (...) est la norme (...) la plus largement compatible."

ca ne veut absolument rien dire : compatible avec quoi ? on n'est jamais compatible tout court. Baldodo (d) 25 mai 2010 à 17:11 (CEST)Répondre


Ça veut dire que le nombre d'autres normes avec laquelle elle est compatible est le plus élevé parmi les normes de caractères BeKowz (discuter) 22 octobre 2015 à 13:59 (CEST)Répondre

Apostrophe utilisé comme accent aigu ?

modifier

Au sujet de ceci :

« 39 047 27 0100111 ' Apostrophe droite (par le passé employée à tord comme Accent aigu[2],[3].) »

Je ne comprend pas le sens de la remarque ajoutée par . En ASCII, il n'y a pas d'accent aigu ni d'accent grave (ils ont été ajoutés en ISO-8859), comment pourrait-on utiliser l'apostrophe à tort comme un accent aigu ? Il faudrait clarifier. — mro [d] 7 juin 2010 à 12:47 (CEST)Répondre

J'ai essayé de clarifier d'après les sources. Idéalement, il faudrait avoir une copie du standard pour sourcer. Marc Mongenet (d) 7 juin 2010 à 23:01 (CEST)Répondre
A ce sujet, je suggère la note du dernier paragraphe de la dernière page (page 3.7) du standard suivant http://www.itscj.ipsj.or.jp/ISO-IR/002.pdf . Il s'agit a priori de la deuxième norme ISO de codage des caractères, la première étant dédiée aux caractères de contrôle C0. Par la suite, d'autre normes ont été fait sans caractères de composition. Il y aurait donc une question de contexte: quelles normes, dans quel contexte, quelle séquences d'échappement, etc.
On ne peut pas dire à tort, puisque tout est une question de convention. Juste clarifier quelles conventions, où quand comment pourquoi....

S'inspirer de la version anglaise

modifier

La version anglaise semble beaucoup plus détallée et beaucoup plus précise. Pourquoi ne pas s'en inspirer? — Le message qui précède, non signé, a été déposé par 77.199.96.98 (discuter), le 8 juillet 2012 à 09:16


Excuse moi, mais il me semble qu'on ferait mieux de s'inspirer de l' AdQ espagnol. BeKowz (discuter) 22 octobre 2015 à 14:02 (CEST)Répondre

Mode texte dans l'article ASCII.

modifier

bonjour, vous avez rajouté Mode texte dans l'article ASCII. Toutefois, ce sont des choses qui n'ont rien à voir.

C'est exactement comme si l'on ajoutait un lien teletexte dans l'article sur la langue anglaise.

Car effectivement, on peut utiliser le teletexte pour afficher des textes an anglais, comme on peut afficher de l'ASCII en mode texte.

Ceci étant dit, ce n'est pas limitatif, ni dans un sens, ni dans l'autre: on peut utiliser d'autres langues/codages de caractères, ou d'autres affichage (graphique, imprimés).

Je pense donc supprimer le lien Mode texte de la page ASCII, et recopier ce commentaire sur la page de discussion. 86.75.233.31 (d) 16 septembre 2012 à 11:03 (CEST)Répondre

⋅ • ⋅
• •

Pour ce qui est du télétexte, la réponse est très simple, il s'agit du même codage que celui du minitel (c'est normalisé) avec ses caracères semi-graphiques et caractères accentués, ainsi que séquences d'échappement. Ce codage est un surensemble de l'ASCII.

Pour ce qui est du mode texte, on peut envisager d'autres codages, mais l'ASCII est devenu universel, tous les codages utilisés actuellement en mode texte sont des sur-ensembles de l'ASCII (notamment les extensions en 8 bits).

Les derniers ordinateurs qui n'utilisait pas l'ASCII sont à ma connaissance le ZX81 et peut-être le ZX Spectrum (à vérifier).

Le mode texte aujourd'hui se réfère pratiquement au mode texte des PC (vestige de l'époque où la mémoire vidéo était chère et gardé pour la compabilité ascendente) qui utilise en réalité la page 437 (en stantard) qui est une extension de l'ASCII.

Une autre utilisation du "mode texte" reste aussi le télétexte qui n'a à ma connaissance jamais évolué. Zizomis (d) 16 septembre 2012 à 18:19 (CEST)Répondre

⋅ • ⋅
• •
Oui, l'ASCII est un sous-ensemble de la plupart des codages de caractères. Mais il n'est pas spécifique au mode texte, il peut tout aussi bien être utilisé dans des interfaces graphiques (tcl/tk, gnome, X-Window, Windows, etc.).
Oui, le mode texte n'est pas préconfiguré pour utiliser l'ASCII, mais la page de code 437 au niveau matériel et 850 au niveau DOS, même si d'autres configurations sont possibles.
Rien ne dit que le minitel et le vidéotexte utilisent les mêmes pages de code, vous n'en apportez aucune preuve. Il est possible que la/les page (s) utilisées dépendent du pays comme Quelques images le laissent penser. (Le DOS, Windows, Linux et le minitel utilisent déjà chacun un codage de caractère distincts). ou plus précisément, le minitel semble utiliser le codage Antiope (télétexte), alors que le teletexte semble utiliser le codage en:World System Teletext.
L'un et l'autre sont dans doute des surensembles de l'ISO-646, ou des variations de l'ASCII, cf pages 106 et 107 du standard suivant: http://www.phecap.nl/download/enhenced-teletext-specs.pdf ( «Table 35: Latin G0 Primary Set» et «Table 36: Latin National Option Sub-sets») 86.75.233.31 (d) 17 septembre 2012 à 23:33 (CEST)Répondre

les derniers ordinateurs qui n'utilisent pas l'ASCII... vous vouliez sans doute dire un surensemble de l'ASCII... Car quasiment personne n'utilise l'ASCII pur.
Et de nos jours, tout le monde n'utilise pas l'ASCII, pour ne citer que deux exemples, le GSM 03.38 ( http://en.wikipedia.org/wiki/GSM_03.38 ) et le télétexte ( voir plus haut). 86.75.233.31 (d) 17 septembre 2012 à 23:41 (CEST)Répondre
Je crois en effet qu'il est important de faire la distinction entre ce qui est l'ASCII à proprement parler, un jeu de caractères sur sept bits, et les nombreuses extensions incompatibles entre elles, qui par définition ne sont plus de l'ASCII mais une extension.
C'est pour toutes ces raisons que je ne comprends pas bien le lien que l'on veut faire. Et si lien il doit y avoir, il me semblerait bon qu'il soit dans une phrase, mais je ne vois pas quelle phrase on peut faire avec mode texte et ASCII. Si ce n'est «le mode texte exactement comme tous les autres logiciels utilise une des innombrables et non-intéropérables extensions de l'ASCII» ou «Les innombrables et non-intéropérables extensions de l'ASCII sont utilisées dans de nombreux logiciels et matériel, comme parrmi une infinité d'autre exemples le mode texte».
Je ne bloque donc pas l'ajout de ce lien, je dis simplement que la sémantique d'un tel lien est douteuse, et mérite d'être éclaircie, a minima par une phrase.
A mon humble avis, il doit être possible de sortir de cette confusion en créeant un article sur le modèle anglais: http://en.wikipedia.org/wiki/Extended_ASCII .Ceci permettrait de clairement distinguer ce qui est du ressort des normes ASCII et des normes ISO-646 d'une part, et ce qui est du ressort de leurs extensions d'autre part.
Je rebondis également sur votre phrase l'ASCII est devenu universel qui est juste si l'on considère que les textes qui sont limités au seuls caractères du sous-ensemble ASCII fonctionnent avec la plupart des logiciels avec la plupart des configurations d'encodage, mais qui est faut si l'on devait comprendre que l'ASCII seul ou un surensemble de l'ASCII serait suffisamment universel, pour lire et écrire des textes dans une langue quelconque autre que l'anglais moderne.
86.75.233.31 (d) 17 septembre 2012 à 22:24 (CEST)Répondre

On ne va pas se battre pour un lien, interne de surcroit. La discussion par contre est intéressante.

En ce qui concerne le minitel et le télétexte, bien qu'issus de deux normes différentes utilisent très probablement les même codage dans les 128 premiers octets (il faudrait en effet vérifier sur la norme). Quoiqu'il en soit, l'ASCII au sens strict a bien été conçu pour l'anglais et pas d'autre langues.

Un article sur l'ASCII étendu pourquoi pas, mais c'est casse gueule dans le sens où aucune norme ne s'est vraiment imposée (contrairement à l'ASCII). Effectivement cela dépende du constructeur (ZX Spectrum, amstrad CPC, atari et amiga) ont chacun eu leur extension.

Si on en s'en tient au PC, il y a les pages de code dos, windows, linux, gem et j'en passe. La page 437 est tout de même la page par défaut, et celle en principe utilisée dans les logiciels en mode texte sous DOS (les pages de codes ne furent introduit il me semble qu'avec le dos 5)

Pour en revenir au minitel, j'ai regardé. S'il est possible d'afficher des alphabets non latins, c'est que les caractères sont redéfinissables, donc codage maison. Zizomis (d) 19 septembre 2012 à 00:34 (CEST)Répondre

Il me semble que c'était ISO latin 1 pour l'Amiga. Marc Mongenet (d) 19 septembre 2012 à 11:00 (CEST)Répondre
Au delà d'être intéressante, la discussion a le mérite de mettre en lumière les points qui ne sont pas traités par wikiepedia: pour synthétiser:
  • L'ASCII en tant que normes de codages est grossièrement couvert par cet article
  • L'ASCII en tant que que base de nombreuses variantes de codages 7 bits est couvert par l'ISO 646
  • Les différents types d'extensions de l'ASCII 8 bits, mono-octet, multi-octets, et les problématiques d'interopérabilité ne sont pas couverte par la wikipedia francophone; encore une fois, les anglais l'on déjà fait: en:Extended ASCII. Complétion/création d'un article à envisager: ASCII étendu
  • L'historique des encodages utilisés en France et pour représenter la langue française ne sont pas couverts par wikipedia: Complétion/création d'un article à envisager
  • L'article teletexte semble avoir des lacunes sur l'antipope et les nouveaux standards européen de teletexte en:World System Teletext. Complétion/création d'un article à envisager
  • Les technologies permettant de redéfinir les caractères (DRCS, Dynamical Redefinable Character Set – en français, JCRD, jeu de caractères redéfinissable).Complétion/création d'un article à envisager
  • Avec wikipedia, on ne sait pas dire quels encodages ont été utilisés par le minitel et le télétexte
Par contre, je pense qu'il faut être précis dans ses affirmations et affirmer des choses vérifiables aussi bien dans les articles que dans les pages de discussions.

Indices de la table ASCII en 2D

modifier

Bonjour,

Pourquoi la table Ascii en 2D a comme indices de ligne les numéros "001" à "007", plutôt que "1" à "7" ou "10" à "70", ou "0x10" à "0x70" comme sur cette page ? Par exemple, le caractère A (code Ascii 0x41) est dans la ligne 4 et la colonne 1. On comprends mieux que "0x40 et 1 font 0x41" que "004 et 1 font 41". Cette table est insérée dans l'article via le tag { { Table des caractères Unicode/U0000 } }, donc je préfère ne pas modifier moi même sans comprendre.

JeromeJerome (d) 8 octobre 2012 à 14:49 (CEST)Répondre

Je ne sais pas pourquoi {{Table des caractères Unicode/U0000}} a été écrit ainsi. Mais comme la table est peu explicite, je l'ai mise après l'autre. Marc Mongenet (d) 8 octobre 2012 à 16:45 (CEST)Répondre
Cette table Ascii est un extrait de la table Unicode. Elle suit donc la numérotation des points de code Unicode qui sont numérotés sur cinq chiffres héxadécimaux de 0x00000 à 0x1FFFF, mais usuellement exprimés sou la forme U+0000 à U+FFFF. Par exemple, le caractère A (code Ascii 0x41, code Unicode U+0041) est dans la ligne 004 et la colonne 1. On comprends mieux 004 accolé à 1 donne 0041 (absence d'iopération mathématique) que "0x40 et 1 font 0x41" (le fait de donner le poids nécéssite une opération mathématique).
J'ai cru voir deux tables ASCII, mais dans l'absolu, aucune table n'est nécéssaire, les tables ASCII étant déjà présentes dans l'article ad hoc. Cet article devrait donc plutôt se focaliser sur l'aspect étendu.

Recyclage intro

modifier

Bonjour. L'intro actuelle n'est pas franchement claire :

  • Elle insiste beaucoup sur le rapport entre ASCII / importance de la langue anglaise / impact pour les autres langues.
  • ... mais elle ne définit pas très clairement ce qu'est l'ASCII

Il faudrait probablement recadrer l'intro pour que le début soit plus descriptif (qu'est ce que l'ASCII), et mettre les considérations l'anglais / les autres langues plus en bas.

J'ai tenté de modifier dans ce sens, mais je ne connais pas le domaine. Je constate juste qu'en tant que lecteur, l'intro ne joue pas vraiment son rôle :/ Comme remarqué plus haut, l'article sur :en structure mieux l'info (en:ASCII).

C|-|ERRY discuter 20 septembre 2013 à 11:52 (CEST)Répondre

L'introduction insiste beaucoup sur le fait que l'ASCII fut utilisé pour la langue anglaise sans doute pour les deux raisons suivantes:
  • c'est un standard américain
  • il est limité aux caractères de la langue anglaise.
Partant de là, une définition claire de l'ASCII serait de dire que, par exemple :
  • «L'ASCII est une convention/standard des Etats-Unis, sur le codage des caractères de la langue anglaise pour l'échange d'information. Initialement local aux Etats-Unis, la puissance de l'industrie de ce pays a permis à cette convention de conquérir tous les pays anglophones ou utilisant l'écriture anglaise et a été complété par d'autres conventions/standards pour pouvoir être utilisé dans d'autres régions ou dans d'autres langues.»
Comment mieux introduire l'ASCII?
— Le message qui précède, non signé, a été déposé par 86.67.214.67 (discuter), le 15 octobre 2013 22:30
Je pense qu'il manque à la définition quelque chose comme :
  • « l'ASCII encode 128 caractères : les chiffres de 0 à 9, les lettres de A à Z (en minuscules et en majuscules), des symboles de ponctuation basiques, et certains caractères de contrôles... » (
En gros, ce texte de wp:en (que j'ai mal et partiellement traduit)
  • « that encodes 128 specified characters - the numbers 0-9, the letters a-z and A-Z, some basic punctuation symbols, some control codes that originated with Teletype machines, and a blank space - into the 7-bit binary integers. »
Avec ça mis avant de dire que l'ASCII est anglo-centré, on verrait mieux ce que c'est. Et du coup, on comprend mieux l'histoire de "c'est lié à la langue anglaise, ça n'a pas d'accent, etc. Par ex on aurait :
  • « L'ASCII est une convention/standard des Etats-Unis, sur le codage des caractères de la langue anglaise pour l'échange d'information. l'ASCII encode 128 caractères : les chiffres de 0 à 9, les lettres de A à Z (en minuscules et en majuscules), des symboles de ponctuation basiques, et certains caractères de contrôles... blabla. Initialement local aux Etats-Unis, la puissance de l'industrie de ce pays a permis à cette convention de conquérir tous les pays anglophones ou utilisant l'écriture anglaise. L'ASCII a été complété par d'autres conventions/standards pour pouvoir être utilisé dans d'autres régions ou dans d'autres langues et est connu pour son influence incontournable sur les codages de caractères qui lui ont succédé »
C|-|ERRY discuter 16 octobre 2013 à 10:20 (CEST)Répondre
La citation suivante est pas mal, mais discutable, voir bémols ci-après:
« L'ASCII est une convention/standard des Etats-Unis, sur le codage des caractères de la langue anglaise pour l'échange d'information. l'ASCII encode 128 caractères : les chiffres de 0 à 9, les lettres de A à Z (en minuscules et en majuscules), des symboles de ponctuation basiques, et certains caractères de contrôles... blabla. Initialement local aux Etats-Unis, la puissance de l'industrie de ce pays a permis à cette convention de conquérir tous les pays anglophones ou utilisant l'écriture anglaise. L'ASCII a été complété par d'autres conventions/standards pour pouvoir être utilisé dans d'autres régions ou dans d'autres langues et est connu pour son influence incontournable sur les codages de caractères qui lui ont succédé »
  • L'ASCII est une convention/standard → Un bémol: C'est peut-être simplificateur Une suppose l'unicité alors qu'il a été défini plusieurs fois, avec des variantes négligeables. S'il n'était défini qu'une seule fois, quelle serait cette définition!? (Au hasard: ISO-646-02 et ISO-646-06 ?)
  • L'ASCII est une convention/standard → Un bémol: en fait c'est à la fois une convention et un (ou plusieurs) standards?
  • des Etats-Unis → Un bémol: N'est-ce pas le même (ou quasiment le même) que le standard ISO 646 du Royaume-Uni ou d'autres pays anglophones?
  • l'ASCII encode 128 caractères → Un bémol: seulement 94 caractères affichables (95 en comptant l'espace)
  • L'ASCII a été complété par d'autres conventions/standards → Un bémol: on pourrait préciser L'ASCII a été par la suite complété par d'autres conventions/standards
  • pour l'échange d'information → Un bémol: Dans le contexte de l'époque, cela est d'avantage relatif à l'interopérabilité des machines dans un même pays qu'entre différents pays.
  • → Autre bémol: on ne précise pas qu'il manque des caractères, comme les accents.
  • → Autre bémol: Il manque l'aspect ancien et en perte de vitesse (au profit d'unicode, au moins sur internet www.actualitix.com/le-langage-unicode-est-le-plus-utilise.html ).
Je propose donc: « L'ASCII désigne une convention sur le codage des caractères de la langue anglaise issue du processus de standardisation pour l'échange d'information entre machines de différents constructeurs aux Etats-Unis. L'ASCII autorise 128 valeurs couvrants 95 caractères affichables et notamment les 10 chiffres de 0 à 9, les 26 lettres de A à Z (en minuscules et en majuscules), des symboles de ponctuation basiques. Initialement locale aux Etats-Unis, la puissance de l'industrie de ce pays a permis à cette convention de conquérir tous les pays anglophones ou utilisant l'écriture anglaise. L'ASCII a été complété par d'autres conventions/standards pour pouvoir être utilisé dans d'autres régions ou dans d'autres langues et est connu pour son influence incontournable sur les codages de caractères qui lui ont succédé (concept d'ASCII étendu) »
Un essai d'allègement de style et quelques précisions : « ASCII est une norme de codage informatique des caractères de la langue anglaise, issue du processus de standardisation pour l'échange d'information entre ordinateurs de différents constructeurs américains. ASCII autorise 128 codes couvrants 95 caractères affichables, dont les chiffres de 0 à 9, les lettres minuscules et capitales de A à Z, et des symboles de ponctuation. De part la puissance de l'industrie informatique américaine, cette convention s'est diffusée dans tous les pays anglophones, puis complétée par des conventions pour d'autres langues, et se retrouve finalement dans les codages de caractères les plus diffusés au monde. » Marc Mongenet (discuter) 13 juin 2014 à 10:57 (CEST)Répondre

Merci pour répondre a cette question svp

modifier

Donner les caractéristiques de la codification ASCII?

Dénomination du symbole @

modifier

Le symbole @ dans la table ASCII à pour signification "Arobace ou arobase ou A commercial". Le terme Arobace n'a pas l'air d'être employé et n'est pas présent dans la liste des dénominations possibles dans l'article Arobase. Le Larousse en ligne emploi Arobase ou Arrobe. Il serait donc préférable d'utiliser "Arobase ou arrobe ou A commercial" comme signification.

--Benjamin (discuter) 6 janvier 2015 à 13:58 (CET)Répondre

Toute dépend si l'article (ou la section de l'article) a pour but de documenter ce que la norme dit, ce que les gens pensent de la norme, ou les deux aspects.


Je pense que avant de faire quoi que ce soit, il faut faire une liste à faire. Qui est d'accord avec moi ? BeKowz (discuter) 23 octobre 2015 à 20:10 (CEST)Répondre

Les « trois octets » du BOM (Byte Order Mark)

modifier

Dans la partie « Internationalisation », il est écrit à propos du Byte Order Mark : « Certains logiciels anciens ne sont pas compatibles avec la présence de ces trois octets ».

Or ce caractère n'est codé en trois octets que dans le cas d'UTF-8 − où, d'ailleurs, il est inutile puisqu'il n'y a qu'un seul ordre des octets en UTF-8. En UTF-16 il est codé en deux octets, tandis qu'en UTF-16 il est codé en quatre octets.

Comment corriger ce texte pour qu'il soit un peu plus pertinent, tout en restant court car c'est la page sur ASCII et pas celle sur Unicode ? --Wikimiako (discuter) 20 mai 2019 à 12:49 (CEST)Répondre

J'ai supprimé tout le paragraphe, car en plus d'être discutable, il était hors sujet. Marc Mongenet (discuter) 21 mai 2019 à 01:30 (CEST)Répondre

Section « Principes » : passage pas clair, voire faux.

modifier

Dans le paragraphe suivant, la dernière phrase (mise en caractères gras ci-dessous) semble incohérente avec la définition (exacte) d’octet.

L'ASCII définit 128 caractères numérotés de 0 à 127 et codés en binaire de 0000000 à 1111111. Sept bits suffisent donc. Toutefois, les ordinateurs travaillant presque tous sur un multiple de huit bits (un octet) depuis les années 1970, chaque caractère d'un texte en ASCII est souvent stocké dans un octet dont le 8e bit est 0. Aujourd'hui encore, certains systèmes de messagerie électronique et de SMS fonctionnent avec des bytes ou multiplets composés de seulement sept bits (contrairement à un octet qui est un byte ou multiplet standardisé à huit bits).

On pourrait facilement reformuler ce passage mais auparavant il faudrait une référence sur ces « systèmes de messagerie électronique et de SMS » .... pour comprendre ce que l’auteur veut dire exactement. — Le message qui précède, non signé, a été déposé par l'IP 2A01:E34:ECFA:5760:D0EA:ED62:32C4:B47A (discuter), le 25 février 2021 à 08:53 (CET)Répondre

Revenir à la page « American Standard Code for Information Interchange ».