Also known as BOCU, BOCU-1
MIME compatible Unicode compression scheme
統一碼二進制有序壓縮(英語:Binary Ordered Compression for Unicode,縮寫:BOCU) 是統一碼技術注解文件所定義的規範,可以兼容MIME的統一碼压缩方案。 雖然UTF-8適合廣泛使用,但對於非拉丁文和中日韓統一表意文字的文字,相較於代码页技術,它佔用了更多的空間(較高的 "字節 / 碼位" 之比)。另一方面,SCSU 佔用的空間與代碼頁差不多,但卻不相容於MIME。二進制有序壓縮則结合了UTF-8的廣泛適用性和統一碼標準壓縮方案(SCSU)的紧凑性。 这种编码旨在用于压缩短字符串,并保持码点顺序。 BOCU-1 是IANA注册的字符集。
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).