Unicode standard

Unicode standard

The Unicode standard is a character coding system designed to support the worldwide interchange, processing, and display of the written texts of the diverse languages and technical disciplines of the modern world.

Industry: Computer; Software

Add a new term

Contributors in Unicode standard

Become a Contributors

Unicode standard

字元編碼形式 (CEF)

Computer; Unicode standard

從一個字元映射設置定義為用於表示資料的實際代碼單位。

編碼形式

Computer; Unicode standard

從一個字元映射設置定義為用於表示資料的實際代碼單位。

正常化分解

Computer; Unicode standard

將映射到本質上等效的序列 — — 例如，將 ä 映射到 a + 組合變音符。字元或字元序列，結果從以遞迴方式應用的正常化的映射，發現在 Unicode 字元資料庫中，直到可以進一步分解沒有字元，然後重新排序無空格標記的分解。 *A 正常化分解並不刪除的格式設置資訊。 ...

規範相當於

Computer; Unicode standard

兩個字元序列據說是規範等效項，如果他們完全正常化分解是相同的。 *為例，序列和是典型的等效項。規範等價是 Unicode 的屬性。它不應混淆與特定語言的排序規則或匹配，這可能會增加其他等效項。為例，瑞典文，ö 被視為一個完全不同的字母從 o 和後 z.在德國整理、 ö 弱上相當於 oe 和 oe 用逐份列印。在英語，ö 是只 o 與變音符號，指示它從上一個字母 (如 ...

規範排序演算法

Computer; Unicode standard

在 D 的分解後的字元序列，直到序列中不包含沒有更多的重新排序對交換中每個重新排序對字元的位置。 *規範排序演算法實際上是當地冒泡排序，保證正常化分解或相容性分解將包含在其中一個結合標記跟隨直接由另一個沒有子序列相結合具有更低，非零結合教室標記*標準訂購的規範排序演算法的方法應用於整個分解序列定義。例如，規範分解序列的會導致序列、未規範順序的序列。大多數分解為 Unicode ...

編碼方案

Computer; Unicode standard

一個字元的編碼形式加上位元組序列化。在 Unicode 中有七個字元編碼方案： UTF 8、 UTF-16、 UTF-16BE、 UTF-16LE、 UTF 32、 UTF-32BE 和 UTF-32LE。

字元標識

Computer; Unicode standard

一個字元的標識是由其字元名稱和代表性的標誌符號代碼圖表中建立的。 *A 字元可能會具有更廣泛的使用比其名字的最貼切的字面解釋可能指示；編碼表示形式、名稱和代表性的標誌符號需要時確定身份的一個字元在上下文中進行評審。為例，002E U + 句號可以代表一句段，簡稱期間，十進位數位分隔符號的英文，數千個數字分隔符號用德語，等等。字元名稱本身是唯一的但可能會造成誤導。 *的一致性與代表性的標誌符號 ...