Unicode: derrière le rideau

Le consortium Unicode a célébré son 25e anniversaire l’année dernière. La vérité est que, malgré tout le travail, Unicode fait pour garantir le texte des langues du monde entier – la plupart d’entre nous connaissent Unicode comme le groupe qui approuve de nouveaux emojis.
Ce qui pourrait ne pas être si clair, c’est pourquoi un grand consortium est requis, ou la complexité cachée de l’Unicode. Ou comment les emojis vomissants montrés dans le dessin animé XCKD ci-dessus sont déjà considérés comme « valides (mais pas recommandés) ».

Mark Davis, co-fondateur et président actuel d’Unicode, a cherché à clarifier comment l’emoji s’intègre à Unicode dans cet aperçu de haut niveau qui examine ce qu’est Unicode, et comment le sous-comité Emoji Unicode (« emoji SC ») s’inscrit dans il.
Davis note que les emojis ne constituent qu’une fraction du nombre total de caractères dans la norme Unicode. Vous pouvez à peine les faire dans ce graphique:

Les personnages seuls ne racontent pas la moitié de l’histoire. Un certain nombre de glyphes doivent se combiner lorsqu’ils sont affichés dans certains ordres ou combinaisons.

Une combinaison qui sera familière à beaucoup est la façon dont les tons de peau des emoji sont mis en œuvre.
Ceux-ci fonctionnent en détectant quand un personnage de modificateur est affiché après les emoji humains, comme 👧 fille. Ceux-ci se combinent sur des plates-formes prises en charge pour montrer un seul emoji:

Une implémentation plus compliquée consiste à rejoindre deux ou plusieurs emojis dans ce qu’on appelle une séquence Emoji ZWJ.
Ceux-ci sont utilisés pour créer des professions telles que la femme juge. Cet emoji est créé en utilisant la femme 👩 et les emojis à l’échelle de l’équilibre en séquence.
Un personnage « Zwj » (menuiseur de largeur zéro) se situe entre ces deux emojis, et est une colle invisible qui rejoint plusieurs emojis en un (où pris en charge).

D’autres types de séquences ZWJ répertorient un emoji existant tel que 🕵️ Detective avec un symbole de genre ♀️ signe féminin ajouté après.
Ce type de séquence ZWJ est généralement utilisé si un emoji existe déjà. Par exemple: coureur, surfeur ou plusieurs gestes.

Et oui, vous pouvez combiner les modificateurs et les ZWJ pour créer une séquence plus longue.

Unicode ne contrôle pas les séquences ZWJ de la même manière que les nouveaux emojis qui nécessitent leur propre point de code.
Unicode a recommandé des séquences qui devraient être prises en charge pour la cohérence multiplateforme. Cependant, les vendeurs sont libres de combiner tous les emoji avec tout autre, comme ils le souhaitent.
Microsoft a six chats Ninja disponibles dans Windows qui ne font pas partie de la liste recommandée d’Unicode. 🐱 Cat Face et 🚀 Rocket sont combinés sur Windows 10 pour montrer un emoji pour 🐱‍🚀 Astro Cat.
Astro Cat est valide (car il utilise une structure de séquence correcte) mais non recommandée comme les autres professions et sexes.

XKCD a suggéré que Vomit devrait être un personnage de modificateur pour faire un « cow-boy de vomissements ».
Davis souligne que 🤠 Cowboy Hat Face pouvait déjà être combiné avec des vomissements pour créer une séquence ZWJ valide:

D’autres types de séquences existent pour les emoji, y compris les séquences de drapeaux, les séquences de balises et les séquences de keycap. Vous devez consulter l’ensemble des diapositives pour les voir plus en détail.
Enfin, un regard sur le calendrier (actuel, 2017) pour la naissance d’un nouvel emoji:

🚨 Mise à jour avril 2020: Le calendrier actuel de la façon dont un nouvel emoji est créé a été considérablement affecté par la pandémie Covid-19. Vous pouvez en savoir plus sur le calendrier révisé pour 2020 et au-delà ici.
Bien sûr, Unicode a encore beaucoup à faire en dehors du support des emoji:

« Il y a environ 7 000 langues humaines vivantes, avec différents niveaux de vitalité. Moins de 100 de ces langues sont bien soutenues sur les ordinateurs, les téléphones portables et d’autres appareils, tandis que tout le reste risque d’être numériquement désavantagé »

Unicode a un programme d’adoption d’un caractère. Les fonds recueillis par les adoptions vont à la recherche pour soutenir ces langues numériquement défavorisées.
Plus:

Unicode Emoji par Mark Davis
Unicode adopte un personnage
Nouveaux emojis pour 2017
Hacks d’emoji amusants

Rechercher des émoticônes: