統一碼定序演算法

Also known as UCA

演算法

Wikidata facts

Show 1 more fact

reference URL: www.unicode.org/reports/tr10

Sources (1)

wikidata.org

via Wikidata · CC0

Article · 中文

統一碼定序演算法（英語：Unicode collation algorithm，縮寫：UCA）是統一碼技术报告 #10 中定义的一种算法，它是一种可自定义的方法。對任何以統一碼表示的字符串文本，不論是使用哪種文字和语言，都可為其生成二进制键。這些鍵可以逐字节且有效地比對，從而可以根據語言規則為他們定序或排序。這個過程中，還提供可以忽略大小写、重音等的选项。統一碼技术报告 #10 还定義了默认統一碼定序元素表（英語：Default Unicode Collation Element Table，縮寫：DUCET)。此文件定義了預設的排列顺序。 DUCET 可针对不同语言进行定制。可以在通用當地數據儲存庫（英語：Common Locale Data Repository，縮寫：CLDR）中找到一些此类自定义。國際統一碼部件（ICU）中包含了 UCA 的开源實作件。 ICU 支持裁剪，来自 CLDR 的整理裁剪包含在 ICU 中。剪裁效果和许多语言特定的剪裁效果显示在在线ICU 区域设置浏览器中。

Abstract from DBpedia / Wikipedia · CC BY-SA