Le Consortium Unicode ® Publie CLDR, Version 1.8
MOUNTAIN VIEW, CA -- (Marketwire – Le 17 Mars 2010) Le Consortium Unicode a annoncé aujourd’hui la sortie de la nouvelle version d’Unicode Common Locale Data Repository (Unicode CLDR 1.8), qui fournit aux développeurs des données essentielles à l’internationalisation des logiciels, de façon à gérer au mieux les langues du monde.
CLDR 1.8 contient des données pour 186 langues et 159 territoires, soit 501 environnements linguistiques en tout. La version 1.8 du référentiel contient plus de 22 % de données en plus que la version précédente, avec 42 000 données nouvelles ou modifiées provenant de plus de 300 collaborateurs.
Pour cette édition, le Consortium Unicode s’est allié avec le Réseau Africain pour la Localisation des TIC (ANLoc), projet financé par le Centre de Recherches pour le Développement International (CRDI) Canada, afin d’aider au développement de la recherche sur le continent africain. L’objectif d’ANLoc est de permettre aux africains d’entrer dans l’ère numérique en favorisant l’usage de leurs langues dans les applications informatiques. Afrigen, un sous-projet du réseau ANLoc, se concentre sur la création de données linguistiques africaines.
Afrigen-ANLoc a pour mission de créer des paramètres régionaux corrects pour au moins une centaine de langues parmi les plus de 2000 langues parlées en Afrique, et d’intégrer ces données dans le projet Unicode CLDR et dans OpenOffice.org. L’implémentation de ces paramètres dans CLDR est une étape essentielle dans le processus d’internationalisation des applications informatiques, qui permettra à des populations qui n’avaient jamais pu le faire auparavant d’utiliser leurs langues sur des ordinateurs et sur des téléphones portables.
Le projet Afrigen-ANLoc a sélectionné environ 200 langues candidates, incluant toutes les langues officielles reconnues par un gouvernement national et toutes les langues parlées par au moins 500 000 personnes. Des langues supplémentaires on été ajoutées grâce à l’intervention de bénévoles. Les données ont été rassemblées pour le projet Afrigen-ANLoc par des locuteurs bénévoles partout dans le monde, saisies grâce à une application web spécialement développée pour cela, et ensuite incorporées dans le référentiel CLDR. En tout, plus de 150 bénévoles ont rassemblé des paramètres régionaux pour 72 langues africaines, dont 54 ont été incorporées dans la version 1.8 de CLDR. 41 de ces langues sont entièrement nouvelles dans le projet Unicode CLDR, alors que 13 autres étaient déjà présentes dans des versions précédentes et ont été ainsi enrichies. Ces langues sont parlées dans 26 pays sur tout le continent africain.
« L’association avec Afrigen-ANLoc a été d’un bénéfice énorme pour nous » déclare John Emmons, vice-président du comité technique du CLDR et ingénieur en chef pour le projet CLDR chez IBM. « La contribution d’Afrigen a permis d’ajouter un grand nombre de langues, ce que nous n’aurions pu faire en suivant nos procédures normales, et ceci tout en maintenant le niveau de qualité et la cohérence exigés pour chaque langue. »
Pour plus d’information sur Unicode CLDR version 1.8, consulter http://cldr.unicode.org/index/downloads/cldr-1.8
L’outil de collecte des données a été développé par Louise Berthilson de IT46 (http://www.it46.se) dans le cadre d’un projet dirigé par Martin Benjamin, directeur de Kamusi Project International ( http://kamusi.org ). Pour plus d’information sur le Réseau Africain pour la Localisation des TIC, consulter: http://www.africanlocalisation.net. Pour plus d’information sur le projet Afrigen-ANLoc, consulter: http://www.it46.se/afrigen . Pour plus d’information sur le CRDI, consulter: http://www.idrc.ca.
A propos du Consortium Unicode
Le Consortium Unicode est une organisation à but non lucratif créée pour développer, approfondir et promouvoir l’utilisation du standard Unicode ainsi que d’autres standards d’internationalisation qui y sont associés. Les membres du consortium incluent plusieurs sociétés et organismes spécialisés dans le secteur de l’informatique et du traitement de l’information. Parmi ces membres on peut compter Adobe Systems, Apple, DENIC eG, Google, Gouvernement de l’Inde, Gouvernement du Tamil Nadu, IBM, Microsoft, Monotype Imaging, Oracle, The Society for Natural Language Technology Research, SAP, Sybase, The University of California (Berkeley), The University of California (Santa Cruz), Yahoo! ainsi que plus d’une centaine d’entreprises, institutions et individus.
Pour plus d’information, veuillez contacter le Consortium Unicode.
French translation kindly volunteered by Yves Desrichard, with minor updates by Adel El Zaim