Club de Haute TechnologieClub Culturel de haute technologie: Faire des prototypes et des logiciels. Domaines : - Electronique - Informatique - Domotique - Robotique - Energie - Réseaux.



UTF-8 codage caractères ASCII vers UTF-8



Principe des caractères UTF-8

Pour pouvoir placer des codes UTF-8 dans un fichier représentant un grand nombre de formes de lettres comme celles avec des accents ou encore des représentations différentes, le codage ASCII sur 7 bits 0xxxxxxx n'est pas suffisant. Les caractères UTF-8 seront codés sur 2, 3 ou 4 octets. Pour garder une compatibilité avec l'encodage standard ASCII, ce sont les bits de poids forts qui serviront d'indicateur. Donc, dès qu'un bit de poids fort est à UN, il y a des chances pour que le codage soit en UTF-8 et pas seulement en ASCII standard.


Reconnaitre le codage UTF-8

Pour reconnaitre le codage UTF-8, nous allons d'abord vérifier si l'on a 110xxxxx 10xxxxxx ce qui représente un codage UTF-8 sur 2 octets ou bien 11100000 101xxxxx 10xxxxxx ce qui représente un codage UTF-8 sur 3 octets etc.. Après il y a des restrictions et des interdictions. Ce qui au final nous donne une table d'encodage un peu plus complexe mais nous en avons maintenant compris le principe et pouvons donc dire qu'un texte encodé en français en UTF-8 permet d'avoir les accents sur les lettres et est bien sûr un peu plus long en UTF-8 qu'en ASCII simple.


Exemple de mise en œuvre UTF-8.

Dans notre site, tous les fichiers sont encodés en UTF-8. Donc grâce à ce codage UTF-8 et au fait que nous informons le navigateur que les caractères sont en UTF-8, vous avez une écriture correcte avec les accents. Le codage UTF-8 prend de plus en plus d'importance aussi je vous engage à encoder dès maintenant tout en UTF-8. Lorsque vous transférez des informations même par un port série RS232 ou COM, utilisez de l'UTF-8 et vos programmes de visualisation devront reconnaitre de l'UTF-8. Si vous aussi, vous souhaitez faire quelque chose du même genre et que vous souhaitez avoir un peu d'aide et d'assistance, n'hésitez pas à adhérer à notre club d'Informatique Technique Insitec.fr. Vous pouvez vous connecter avec login et password 'demonstration' et accédez à certaines démonstrations.
utf-8
Accueil   
Logiciel   
Cours   
Radiocom   
Copyright © 2023 insitec.fr Tous droits réservés.
Informations Légales