Et que, évidemment, les deux URL ci-dessous pointent vers deux pages différentes :
►http://seenthis.net/tags/ссср
►http://seenthis.net/tags/cccp
Stéphane, je n’ai pas utilisé le mot « extraordinaire ». Pourquoi poses-tu la question ?
En revanche, je fais la remarque puisque :
– tu m’as posé la question du multilinguisme, et la gestion d’Unicode est essentielle dans le cadre du multilinguisme ;
– ça n’est pas « extraordinaire », mais je connais au moins un autre réseau social très utilisé qui ne gère absolument pas les hashtags Unicode.
À part ça, faut pas être blasé :-)) J’ai commencé ma vie professionnelle au milieu des années 90 avec le logiciel TeX, logiciel universellement admiré, mais qui m’interdisait à l’époque de taper directement des caractères accentués. Puis, une fois que j’ai su tout de même utiliser les caractères accentués, j’ai dû gérer des fichiers envoyés par les auteurs, utilisant les deux encodages propriétaires de Microsoft (alors que de mon côté j’utilisais l’encodage propriétaire du Macintosh). Et quand tout cela est devenu, pour moi, à peu près clair, j’ai démarré sur le Net, avec les accents qui se perdaient dans les emails, et les documentations qui prétendaient qu’il fallait utiliser des entités HTML pour coder des accents sur le Web. Alors si tu veux, oui, avec les caractères Unicode, j’ai tendance à avoir une âme d’enfant :-))
Désolé de revenir sur terre... mais c’est quoi la différence des deux #cccp à la saisie ? Le clavier cyrillique ou romain ?
C’est ça, Aris : l’un est en alphabet cyrillique, l’autre en alphabet latin. Le dessin des lettres est similaire, mais ce sont des lettres différentes.
Ce que ça traduit pour Seenthis, c’est que tu peux faire des #hashtags qui ne sont pas écrits en caractères latins, mais dans un autre alphabet : cyrillique, arabe, hébreu, arménien...
Twitter a effectivement du mal avec les hashtags en non-ASCII. C’est exaspérant mais, pour le reste, Twitter gère plutôt bien l’Unicode, que ce soit dans son client Web ou dans l’API.
@stephane, dans Twitter,
– ►http://seenthis.net/tags/שָׁלוֹם n’est pas identifié comme une URL
– #СССР n’est pas identifié comme un hashtag.
Il y a donc de la marge entre « plutôt bien » et « extraordinaire » :-))
@fil, si tu utilises des polices PostScript ou OpenType, avec XeTeX notamment, tu ne devrais pas avoir besoin de quoi que soit. Plutôt de vérifier que ton package ne redéfinit pas le comportement de œ.