Also known as C0 Controls, U+0000-007F, C0 Controls and Basic Latin, ASCII character set, ASCII in Unicode
ASCII と同じ文字を含む Unicode ブロック (U+0000-007F)
via Wikidata · CC0
基本ラテン文字(きほんラテンもじ、英語: Basic Latin)は、Unicodeの1つ目のブロックである。ASCII文字コードの全ての文字(基本ラテン文字と制御文字)が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)ともいう。UTF-8において、収録されたキャラクタが1バイトで表現できる唯一のブロックである。 基本ラテン文字ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない。
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).