Международный стандарт для хранения, категоризации и интерпретации знаков.
Unicode - промышленный стандарт, разработанный, чтобы позволить тексту и
символам от всех систем письма мира, последовательно представляться и
управляться компьютерами. Развитый в тандеме с Универсальным стандартом
кодировки и изданный в книжной форме как Стандарт Unicode, Unicode состоит
из символьного репертуара , методологии кодирования и набора стандартных
кодировок символов, ряда кодовых диаграмм для визуальной справки,
перечисления символов верхнего и нижнего регистра, ряда компьютерных файлов
справочных данных, и управляется для нормализации, разложения, сопоставления
и предоставления.
У Консорциума Unicode, некоммерческой организации, которая координирует
развитие юникода, есть амбициозная цель возможной замены существующих схем
кодировки символов в Unicode и его стандартные схемы Unicode Transformation
Format (UTF), поскольку многие существующие схемы ограничены в размере и
объеме, и несовместимы с многоязычной окружающей средой. Успех юникода при
объединении кодировок привел к широкому распространенному и преобладающему
использованию в интернационализации и локализации программного обеспечения.
Стандарт был осуществлен во многих недавних технологиях, включая XML, язык
программирования Java и современные операционные системы.
Общие форматы Unicode включают:
-
UTF-8
-
UTF-16
-
UTF-32