Représentation d’un texte en machine

CODE ASCII

Appeler aussi :

Américain Standard Code for Information Interchange  ou ASCII est un encodage crée en 1961.

Il s’agit d’un jeu de 128 caractère  codés sur 7 bits.

ISO-8859-1

Cet encodage sur 8 bit reprend l’ascii pour les caractères imprimables et ajoute les caractères utiles à l’alphabet latin.La première version date de 1986.

Les valeurs de 128 à 159 ne sont pas utilisées.

Unicode

Unicode est un système de codage créé en 1998, qui spécifie un nombre unique pour chaque caractère, quels que soient la plate-forme, le logiciel et la langue utilisés. 

Le format UTF-8 est l’encodage correspondant le plus répandu.Les textes codés en ascii et en iso-8859-1 restent compatibles avec l’utf-8.

UTF-8 continue après 256 pour obtenir plus de 100 000 caractères différents en limitant l’espace utilisé.

Unicode est constitué de 137 929 caractères, et est compatible avec plus de 100 écritures différentes, grâce à ses jeux de caractères uniques. Unicode supporte toutes les langues du monde.

C’est une norme universelle de codage de caractères. Elle est utilisée pour prendre en charge les caractères dans des scripts non ASCII(American Standard Code for Information Interchange). À l’origine, Internet a été construit en ASCII, et donc basé sur l’alphabet anglais, qui ne comporte que 128 caractères .

Aucune réponse

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *