In linguistic morphology and information retrieval, stemming is the process of reducing inflected (or sometimes derived) words to their word stem, base or root form—generally a written word form. The stem need not be identical to the morphological root of the word; it is usually sufficient that related words map to the same stem, even if this stem is not in itself a valid root. Algorithms for stemming have been studied in computer science since the 1960s. Many search engines treat words with the same stem as synonyms as a kind of query expansion, a process called conflation.
في التشكل اللغوي، التشذيب والتجذيع هي عملية للحد من تصريف (أو في بعض الأحيان اشتقاق) الكلمات لإنتاج اصل الكلمات، أو شكل الجذر. ولا يحتاج الاصل ان يكون مكافئ للجذر الصرفي للكلمة، بل هو عادة يكون كافيا لأن يجعل الكلمات ذات الصلة يكون لها نفس الاصل، حتى لو كان هذا الاصل ليس في حد ذاته جذر صالح. وكانت المشكلة طويلة الأمد في علوم الكمبيوتر، وكان نشر أول بحث حول هذا الموضوع في عام 1968. عملية التشذيب، تدعى في كثير من الأحيان عملية الدمج، وهي مفيدة في محركات البحث أو الفهرسة وغيرها من مشاكل معالجة اللغة الطبيعية.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).