Also known as multi-byte character set, MBCS
type of character encoding scheme
Uma codificação de largura variável é um tipo de esquema codificação de caracteres em que códigos de comprimentos diferentes são usados para codificar um conjunto de caracteres (um repertório de símbolos) para representação em um computador. As codificações de largura variável mais comuns são as codificações multibyte, que usam vários números de bytes (octetos) para codificar diferentes caracteres.Alguns autores, principalmente na documentação da Microsoft, usam o termo conjunto de caracteres multibyte (que é um , porque o tamanho da representação é um atributo da codificação, não do conjunto de caracteres). Codificações iniciais de largura variável usando menos de um byte por caractere às vezes eram usadas para compactar texto em inglês em menos bytes em jogos de aventuras pros primeiros microcomputadores. No entanto, os (que, ao contrário das fitas, permitem acesso aleatório, permitindo que o texto seja carregado sob demanda), os aumentos na memória do computador e os algoritmos de compressão de uso geral tornaram esses truques amplamente obsoletos. Codificações multibyte são geralmente o resultado de uma necessidade de aumentar o número de caracteres que podem ser codificados sem quebrar a compatibilidade com versões anteriores com uma restrição existente. Por exemplo, com um byte (de 8 bits) por caractere, pode-se codificar 256 caracteres possíveis. Para codificar mais de 256 caracteres, a escolha óbvia seria usar dois ou mais bytes por unidade de codificação (dois bytes (16 bits) permitiriam 65.536 caracteres possíveis) mas tal mudança quebraria a compatibilidade com os sistemas existentes e, portanto, pode não ser viável em tudo.
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).