Cos'è Unicode?
Unicode assegna un numero univoco a ogni
carattere,
indipendentemente dalla piattaforma,
indipendentemente dall'applicazione,
indipendentemente dalla lingua.
I computer, in buona sostanza, non sanno far altro che trattare
numeri. Per immagazzinare in memoria lettere o altri segni è
necessario che a ogni carattere venga assegnato un numero. Esistono
centinaia di sistemi di codifica, preesistenti a Unicode, e ognuno
di questi abbina i numeri ai caratteri in modo differente. Nessuna
di queste codifiche comprende un numero di caratteri sufficiente per
tutte le circostanze. Per le sole lingue dell'Unione Europea, ad
esempio, è necessario utilizzare parecchi sistemi di codifica
distinti. Anche considerando una solo lingua, come l'italiano, non
esiste una codifica unica che comprenda tutte le lettere e tutti i
segni di punteggiatura e simboli tecnici di uso comune.
Questi sistemi di codifica, inoltre, sono in contraddizione l'uno
con l'altro. Succede che due codifiche utilizzino lo stesso numero
per due caratteri diversi o che, viceversa, adottino numeri
diversi per lo stesso carattere. Qualsiasi elaboratore, e a
maggior ragione un server di rete, ha bisogno di utilizzare
codifiche diverse. Il problema è che, quando i dati passano da una
codifica a un'altra, o da una piattaforma a un'altra, si corre il
serio rischio di perdere informazioni.
Unicode sta cambiando le cose!
Unicode attribuisce un numero univoco a ogni carattere,
indipendentemente dalla piattaforma, dall'applicativo, dalla lingua.
Lo standard Unicode è stato adottato da leader di mercato del
calibro di Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun,
Sybase, Unisys e
molti
altri. Unicode è alla base di molti moderni standard, come XML,
Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML eccetera, e
costituisce l'implementazione ufficiale dello standard
internazionale ISO/IEC 10646. Unicode è supportato da molti sistemi
operativi, da tutti i più moderni web browser e da
molti altri
prodotti. L'emergere dello standard Unicode, unito alla recente
disponibilità di strumenti che lo supportano, è fra i più
significativi sviluppi della tecnologia della globalizzazione del
software.
L'adozione di Unicode sui siti web e nelle applicazioni
client/server o multi-tiered, rispetto all'utilizzo dei set di
caratteri tradizionali, permette un significativo abbattimento dei
costi di gestione. Unicode consente che un'unica versione di un
software o di un sito web siano fruibili con piattaforme, lingue e
paesi diversi, evitando la necessità di reingenierizzare il prodotto
per ogni situazione specifica. Permette, inoltre, il trasporto del
testo fra sistemi diversi senza che abbia luogo alcuna corruzione
dei dati.
Lo Unicode Consortium
Lo
Unicode Consortium è un consorzio senza fini di lucro, istituito
per sviluppare, estendere e promuovere l'uso dello standard Unicode.
I membri del consorzio rappresentano un'ampia gamma di aziende e di
organizzazioni attive nell'information technology. Il consorzio è
finanziato unicamente per mezzo delle quote versate dai membri. L'adesione allo
Unicode Consortium è aperta a tutte le aziende, agli enti e alle
singole persone, provenienti da qualsiasi parte del mondo, che
intendano sostenere lo standard Unicode e partecipare al suo
sviluppo ed alla sua estensione.
Per maggiori informazioni si vedano (in inglese): un
glossario, un'introduzione
tecnica e un
elenco di
risorse utili.
Italian translation by M. Cimarosti