Also known as The Unicode Standard, Uni-code, Unicode Standard
internationaler Standard zur Definition aller Schriftzeichen mit einem digitalen Code
Unicode is a standardized system that assigns unique numerical codes to characters used in all the world's writing systems, allowing computers to store and display text from any language or script. As of its latest version, it encompasses over 159,000 characters representing 172 different scripts, making it possible for digital devices to handle text reliably across languages and cultures.
AI-generated from the Wikipedia summary — may contain errors.
via Wikipedia infobox
Der Unicode-Standard (Aussprachen: amerikanisches Englisch [ˈjuːnikoʊd], britisches Englisch [ˈjuːnikəʊd]; dt. [ˈjuːnikoːt]) legt fest, wie Schrift elektronisch gespeichert wird, z. B. auf einem Computer oder Telefon. Der durch den Standard festgelegte Zeichensatz enthält 145.000 Zeichen. Das Unicode-Konsortium hat dazu 159 moderne und alte Schriften berücksichtigt, wie auch Symbole, Emojis und nicht druckbare Steuerzeichen. Die ISO bezeichnet den Standard als ISO 10646 und den Zeichensatz als Universal Coded Character Set (UCS). Unicode muss auch tatsächlich in Nullen und Einsen übersetzt werden. Eine solche Umwandlung wird als Unicode Transformation Format (UTF) bezeichnet. Durchgesetzt hat sich dabei UTF-8. In einigen Fällen ist auch noch UTF-16 anzutreffen, speziell in Betriebssystemen und Programmiersprachen, da eine Umstellung nicht einfach ist.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata · CC0
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).