Module documentation
return { ["Adlam"] = "Adlm", ["Afaka"] = "Afak", ["Ahom"] = "Ahom", ["Anatolian Hieroglyphs"] = "Hluw", ["Arabic"] = "Arab", ["Armenian"] = "Armn", ["Assamese"] = "as-Beng", ["Avestan"] = "Avst", ["Balinese"] = "Bali", ["Bamum"] = "Bamu", ["Bassa"] = "Bass", ["Batak"] = "Batk", ["Baybayin"] = "Tglg", ["Bengali"] = "Beng", ["Bhaiksuki"] = "Bhks", ["Blissymbols"] = "Blis", ["Book Pahlavi"] = "Phlv", ["Brahmi"] = "Brah", ["Braille"] = "Brai", ["Buginese"] = "Bugi", ["Buhid"] = "Buhd", ["Burmese"] = "Mymr", ["Canadian syllabics"] = "Cans", ["Carian"] = "Cari", ["Caucasian Albanian"] = "Aghb", ["Chakma"] = "Cakm", ["Cham"] = "Cham", ["Cherokee"] = "Cher", ["Chorasmian"] = "Chrs", ["Clear Script"] = "xwo-Mong", ["Coptic"] = "Copt", ["Cuneiform"] = "Xsux", ["Cypriot"] = "Cprt", ["Cypro-Minoan"] = "Cpmn", ["Cyrillic"] = "Cyrl", ["Demotic"] = "Egyd", ["Deseret"] = "Dsrt", ["Devanagari"] = "Deva", ["Dhives Akuru"] = "Diak", ["Dogra"] = "Dogr", ["Dongba"] = "Nkdb", ["Duployan"] = "Dupl", ["Egyptian hieroglyphic"] = "Egyp", ["Elbasan"] = "Elba", ["Elymaic"] = "Elym", ["Ethiopic"] = "Ethi", ["Fraktur"] = "Latf", ["Gaelic"] = "Latg", ["Geba"] = "Nkgb", ["Georgian"] = "Geor", ["Glagolitic"] = "Glag", ["Gothic"] = "Goth", ["Grantha"] = "Gran", ["Greek"] = "Grek", ["Gujarati"] = "Gujr", ["Gunjala Gondi"] = "Gong", ["Gurmukhi"] = "Guru", ["Han"] = "Hani", ["Hangul"] = "Hang", ["Hanifi Rohingya"] = "Rohg", ["Hanunoo"] = "Hano", ["Hatran"] = "Hatr", ["Hebrew"] = "Hebr", ["Hieratic"] = "Egyh", ["Hiragana"] = "Hira", ["Iberian"] = "Ibrn", ["Image-rendered"] = "Imag", ["Imperial Aramaic"] = "Armi", ["Indus"] = "Inds", ["Inscriptional Pahlavi"] = "Phli", ["Inscriptional Parthian"] = "Prti", ["International Phonetic Alphabet"] = "Ipach", ["Japanese"] = "Jpan", ["Javanese"] = "Java", ["Jurchen"] = "Jurc", ["Kaithi"] = "Kthi", ["Kana"] = "Hrkt", ["Kannada"] = "Knda", ["Katakana"] = "Kana", ["Kawi"] = "Kawi", ["Kayah Li"] = "Kali", ["Kharoshthi"] = "Khar", ["Khitan Large"] = "Kitl", ["Khitan Small"] = "Kits", ["Khmer"] = "Khmr", ["Khojki"] = "Khoj", ["Khudawadi"] = "Sind", ["Khutsuri"] = "Geok", ["Korean"] = "Kore", ["Kpelle"] = "Kpel", ["Lao"] = "Laoo", ["Latin"] = "Latn", ["Leke"] = "Leke", ["Lepcha"] = "Lepc", ["Limbu"] = "Limb", ["Linear A"] = "Lina", ["Linear B"] = "Linb", ["Lisu"] = "Lisu", ["Loma"] = "Loma", ["Lontara"] = "Maka", ["Lycian"] = "Lyci", ["Lydian"] = "Lydi", ["Mahajani"] = "Mahj", ["Malayalam"] = "Mlym", ["Manchu"] = "mnc-Mong", ["Mandaic"] = "Mand", ["Manichaean"] = "Mani", ["Marchen"] = "Marc", ["Masaram Gondi"] = "Gonm", ["Maya"] = "Maya", ["Medefaidrin"] = "Medf", ["Meitei Mayek"] = "Mtei", ["Mende"] = "Mend", ["Meroitic cursive"] = "Merc", ["Meroitic hieroglyphic"] = "Mero", ["Modi"] = "Modi", ["Mongolian"] = "Mong", ["Moon"] = "Moon", ["Morse code"] = "Morse", ["Mro"] = "Mroo", ["Multani"] = "Mult", ["Musical notation"] = "Music", ["N'Ko"] = "Nkoo", ["Nabataean"] = "Nbat", ["Nag Mundari"] = "Nagm", ["Nandinagari"] = "Nand", ["New Tai Lue"] = "Talu", ["Newa"] = "Newa", ["Nüshu"] = "Nshu", ["Nyiakeng Puachue Hmong"] = "Hmnp", ["Odia"] = "Orya", ["Ogham"] = "Ogam", ["Ol Chiki"] = "Olck", ["Old Cyrillic"] = "Cyrs", ["Old Hungarian"] = "Hung", ["Old Italic"] = "Ital", ["Old North Arabian"] = "Narb", ["Old Permic"] = "Perm", ["Old Persian"] = "Xpeo", ["Old Sogdian"] = "Sogo", ["Old South Arabian"] = "Sarb", ["Old Uyghur"] = "Ougr", ["Orkhon runes"] = "Orkh", ["Osage"] = "Osge", ["Osmanya"] = "Osma", ["Pahawh Hmong"] = "Hmng", ["Palmyrene"] = "Palm", ["Pau Cin Hau"] = "Pauc", ["Pazend"] = "pal-Avst", ["Phags-pa"] = "Phag", ["Phoenician"] = "Phnx", ["Pollard"] = "Plrd", ["Psalter Pahlavi"] = "Phlp", ["Ranjana"] = "Ranj", ["Rejang"] = "Rjng", ["Rongorongo"] = "Roro", ["Rumi numerals"] = "Rumin", ["Runic"] = "Runr", ["Samaritan"] = "Samr", ["Saurashtra"] = "Saur", ["Shahmukhi"] = "pa-Arab", ["Sharada"] = "Shrd", ["Shavian"] = "Shaw", ["Siddham"] = "Sidd", ["SignWriting"] = "Sgnw", ["Simplified Han"] = "Hans", ["Sinhalese"] = "Sinh", ["Sogdian"] = "Sogd", ["Sorang Sompeng"] = "Sora", ["Soyombo"] = "Soyo", ["Sui"] = "Shui", ["Sundanese"] = "Sund", ["Syloti Nagri"] = "Sylo", ["Syriac"] = "Syrc", ["Tagbanwa"] = "Tagb", ["Tai Nüa"] = "Tale", ["Tai Tham"] = "Lana", ["Tai Viet"] = "Tavt", ["Takri"] = "Takr", ["Tamil"] = "Taml", ["Tamyig"] = "sit-tam-Tibt", ["Tangsa"] = "Tnsa", ["Tangut"] = "Tang", ["Telugu"] = "Telu", ["Tengwar"] = "Teng", ["Thaana"] = "Thaa", ["Thai"] = "Thai", ["Tibetan"] = "Tibt", ["Tifinagh"] = "Tfng", ["Tirhuta"] = "Tirh", ["Toto"] = "Toto", ["Traditional Han"] = "Hant", ["Ugaritic"] = "Ugar", ["Unspecified"] = "None", ["Vai"] = "Vaii", ["Varang Kshiti"] = "Wara", ["Visible Speech"] = "Visp", ["Vithkuqi"] = "Vith", ["Wancho"] = "Wcho", ["Woleai"] = "Wole", ["Xibe"] = "sjo-Mong", ["Yezidi"] = "Yezi", ["Yi"] = "Yiii", ["Zanabazar Square"] = "Zanb", ["Zhang-Zhung"] = "xzh-Tibt", ["Zhuyin"] = "Bopo", ["flag semaphore"] = "Semap", ["mathematical notation"] = "Zmth", ["symbol"] = "Zsym", ["uncoded"] = "Zzzz", ["undetermined"] = "Zyyy", }
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).