UTF-EBCDIC is a character encoding capable of encoding all 1,112,064 valid character code points in Unicode using 1 to 5 bytes (in contrast to a maximum of 4 for UTF-8). It is meant to be EBCDIC-friendly, so that legacy EBCDIC applications on mainframes may process the characters without much difficulty. Its advantages for existing EBCDIC-based systems are similar to UTF-8's advantages for existing ASCII-based systems. Details on UTF-EBCDIC are defined in Unicode Technical Report #16.
UTF-EBCDIC — EBCDIC-совместимый способ кодирования символов Unicode, похожий на UTF-8. Главное различие между UTF-8 и UTF-EBCDIC заключается в том, что в данной кодировке допустимо использование символов U+0080 … U+009F в качестве управляющих символов EBCDIC. Для того, чтобы достичь этого, вместо используемых в UTF-8 битов признака продолжения (10) используются биты (101).Данная кодировка используется чрезвычайно редко, даже на EBCDIC мэйнфреймах, для которых эта кодировка и была создана. Большинство операционных систем от IBM, использующих EBCDIC, такие как z/OS, поддерживают UTF-16.
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).