スポンサードリンク
|
|
情報処理用語集>U>Unicode |
|
Unicodeとは、ユニコードと読み、コンピュータ上で多言語の文字、
記号を標記するために1980年代に提唱された文字コードである。
アメリカのコンピュータメーカ、ゼロックス(Xerox)社を初めとし、
IBM(International Business Machines corporation)社、
マイクロソフト(MicroSoft)社、アップル(Apple)社、
ヒューレット・パッカード・カンパニー(Hewlett−Packard Company)社、
サン・マイクロシステムズ(Sun microsystems)社、
徳島県のジャストシステム(JUSTSYSTEMS CORPORATION)社
などの情報関連企業グループが中心となり、参加した
ユニコードコンソーシアム(The Unicode Consortium)により
作られ、1993年にISO(国際標準化機構)が
「ISO/IEC 10646」の一部(UCS−2)として標準採用した
統一された文字コード体系。
従来、漢字のように文字の多い国では1文字2バイト(16ビット)で
表現していた。
英数字など文字の少ない国では1文字は1バイト(8ビット)で
表現することもあった。
このため、全世界がネットワークで接続されている時代になると、
いろいろな不都合が生じていた。
そこで、一部の文字を除いて全ての文字を2バイトで表現し、
世界の文字を統一して、1つのコードで言語処理を可能にしようとした
もので、CJK(中日韓)統合漢字を含む世界の主要な言語のほとんどの
文字を収録している。
しかし、2バイト表記では最大65536文字しか収録できないため、
中日韓で同じ目的やルーツ、意味の漢字はすべて同じ文字とみなし、
できる限り同じコードポイントに割り当てるハンユニフィケーション
(統合作業)が行われたが、1990年代半ばにこれはアジアの文化を
疎かにしたものだなど、批判や議論が多方面から発生したが、事実が
明らかになるにつれ沈静化していった。
現在、Unicode全体はUCS−4である4バイト(32ビット)で
1114112文字が収録さている。
スポンサードリンク
|
|
Copyright (C) 情報処理用語集 All Rights Reserved
|
|