Definición ABC » Tecnología » Unicode

+

Definición de Unicode

Para poder transmitir información, antes hay que ponerse de acuerdo en cómo se hará. Esta es la función tanto de las lenguas para hablar, como de los alfabetos para escribir, o los protocolos de comunicaciones para las computadoras y dispositivos electrónicos.

Para transmitir información textual entre hardware distinto y sistemas operativos diferentes que tendremos el problema de que estas máquinas pueden estar configuradas en idiomas muy distintos (por ejemplo, uno escrito alfabéticamente, y otro en ideogramas), y que incluso presenten una mayor o menor cantidad de letras comparándolos los unos con los otros.

En este marco, resulta clave la creación de un estándar de codificación de texto que sea independiente de hardware y software, válido para su uso con múltiples lenguas, que es precisamente lo que es Unicode.

Nacido a finales de 1987, el Unicode buscaba solucionar, precisamente, el intercambio de documentos entre sistemas informáticos distintos, de forma que los usuarios no tuvieran que preocuparse por la lengua en la que estaban escritos dichos documentos.

La clave de Unicode es la asignación de un código único para cada símbolo, invariable a través de las plataformas que lo soportan (tanto hardware como software)

Para ello, Unicode utiliza dos bytes (16 bits), lo que le proporciona un espacio de direccionamiento de 65.536 caracteres. Los que son compartidos por varios alfabetos, no se repiten. Así, por ejemplo, solo hay un carácter Ç, que es compartido por idiomas como el portugués, catalán, turco o albanés.

De esta forma, hay suficiente espacio para alojar todos lo caracteres necesarios correspondientes a idiomas que necesitan de una gama mayor, como pueden ser el chino o el japonés.

Unicode fue creado por Apple y Xerox, sumándose a la iniciativa a posteriori otras empresas como Sun Microsystems y Microsoft

Junto a los caracteres básicos, se incluyen los mismos con tildes, acentos circunflejos, y otros modificadores de uso habitual, como las vocales acentuadas en castellano.

Además de caracteres pertenecientes a sistemas de escrituras de lenguas viva, en Unicode también encontramos caracteres correspondientes a lenguas muertas, como el griego antiguo, el cuneiforme o el rúnico.

Además, encontramos caracteres que no corresponden a letras y números, como notas musicales, iconos, flechas, o marcos y bordes

Al abrir un documento que contiene caracteres que no corresponden al sistema de escritura del idioma en el cual está configurado el software del sistema, lo que hace este es recuperar el carácter correspondiente del estándar Unicode, mostrando así la representación adecuada en cada momento, y no un símbolo raro producto de una mala interpretación de la codificación.

Actualmente, todos los sistemas operativos soportan Unicode.

Fotos: Fotolia - Carballo / Sangeeta

 
 
 
Temas en Unicode
 

Redes Sociales

  • Facebook
    49117 fans
  • Twitter
    2302
  • Google
    453
  •