Also known as ISCII, Code page 806
coding scheme for Indian writing systems
印度文字資訊交換碼(英:Indian Script Code for Information Interchange,縮:ISCII,印度文: सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता,IS13194:1991)是一種編碼系統,其對象為多種在印度所使用的書寫系統。它包含婆羅米系文字,所支援的文字包含了:、孟加拉文、天城文、古吉拉特文、古木基文、卡納達文、馬拉雅拉姆文、奧里亞文、泰米爾文和泰盧固文。它不支援由阿拉伯文所衍生出來的印度書寫系統。但它仍混和使用喀什米爾語、信德語、烏爾都語、波斯語、普什圖語和阿拉伯語。由阿拉伯語衍生的書寫系統則採用之後的波斯阿拉伯文字資訊交換碼。 婆羅米系書寫系統在結構上類似,只是使用不同的字母外形。此編碼將相同音的編在相同碼位。如 0xB3 0xDB 代表 [ki]。在天城文中産生 कि ,在古木基文中為 ਕਿ,在泰米爾文中則為 கி 。在富文件可以利用標記來選擇或在純文件中使用 ATR 碼。 使用此方法的動機為,它可以很容易地在不同書寫系統間做轉寫。然而,其彼此間的不相容又使得這在實作不容易。見 關於印度文字資訊交換碼(页面存档备份,存于互联网档案馆)。 此編碼是八位元編碼。其較低的 128 碼位為純ASCII,其較高 128 碼位為此編碼專用。除了表示字符的碼位,此編碼還包括一個記憶用碼位,用來指示接下來的位元組包含兩種資訊之一。一種會改變書寫系統直到下一個書寫系統指示器或行結尾。另一種則選擇顯示模式,如粗體或斜體。此編碼並未提供預設書寫系統。
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).