جیاوازیی لێڤنشتاین
ماتریکسی جیاوازیی دەستکاری بۆ دوو وشە کە تێچووی جێگۆڕکێ بە ١ و تێچووی سڕینەوە یان زیادکردن بە ٠٫٥ بەکاردێنن | |
| کڵاس | پێوانەکردنی جیاوازیی نێوان دوو زنجیرە |
|---|---|
لە تیۆریی زانیاری و زمانەوانی و زانستی کۆمپیوتەر، جیاوازیی لێڤنشتاین پێوەرێکی پێوانی زنجیرەنووسەیە بۆ پێوانەکردنی جیاوازیی نێوان دوو زنجیرە. جیاوازیی لێڤنشتاین لەنێوان دوو وشە کەمترین ژمارەی دەستکارییەکانی نووسەیەکە (وەک زیادکردن، سڕینەوە یان جێگۆڕکێ) کە بۆ گۆڕینی وشەیەک بۆ وشەیەکی تر پێویستە. بە ناوی بیرکاری سۆڤیەت، ڤلادیمیر لێڤنشتاین کراوە کە پێوەرەکەی لە ١٩٦٥ دانا.[١]
لەوانەیە جیاوازیی لێڤنشتاین بە جیاوازیی دەستکاریش ناوی ببرێت، ھەرچەندە ڕەنگە زاراوەکە بۆ خێزانێکی گەورەتر لە پێوەرەکانی پێوانی دەستکاری بەکاربێت.[٢]:٣٢
ناساندن
[دەستکاری]جیاوازیی لێڤنشتاین لە نێوان دوو زنجیرەنووسەی (بە درێژیی و بە ڕیز) بە دیاری دەکرێ کاتێک
کاتێک لە چەند زنجیرەنووسەیەکی زنجیرەنووسەی ھەموو نووسەکانە بێجگە لە یەکەم نووسەی (بۆ نموونە )، و بریتییە لە یەکەم نووسەی (بۆ نموونە ). یان یان بۆ ئاماژەدان بە نووسەی ەم لە زنجیرەنووسەی ، بە ژماردن لە سفڕەوە بەکاردێت، کەواتە .
لە ھاوکێشەکە، یەکەم بەشی minimum لەگەڵ سڕینەوە (لە بۆ ) و، دووەم لەگەڵ زیادکردن و سێیەمیش لەگەڵ جێگۆڕکێ دەگونجێ.
ئەم ناساندنە ڕاستەوجۆ لەگەڵ جێبەجێکردنی سادەی گەڕانەوەیی دەگونجێ.
نموونە
[دەستکاری]بۆ نموونە، جیاوازیی لێڤنشتاین لەنێوان «kitten» و «sitting» بریتییە لە ٣، چونکە ئەم ٣ دەستکارییەی خوارەوە وشەیەک دەکەنە یەکێکی تر، و ھیچ ڕێگایەک نییە بە کەمتر لە ٣ دەستکاری بکرێت:
- sitten ← kitten (دانانی «s» لە جێگەی «k»)،
- sittin ← sitten (دانانی «i» لە جێگەی «e»)،
- sitting ← sittin (زیادکردنی «g» لە کۆتایی).
دەتوانرێت نموونەیەکی سادەی سڕینەوە لە «uninformed» و «uniformed» ببیندرێت کە جیاوازییەکەیان بریتییە لە ١:
- uniformed ← uninformed (سڕینەوەی «n»).
سنوورەکانی بەرزترین و نزمترین
[دەستکاری]جیاوازیی لێڤنشتاین چەند ڕێسایەکی سادەی سنوورەکانی بەرزترین و نزمترینی ھەیە کە بەبێ ئەوەی پێویست بە حساباتی تەواو بکات، دەتوانرێت بەرزترین و نزمترین جیاوازیی لێڤنشتاین کە ڕێی تێ دەچێت بزانرێت. ڕێساکان بریتین لە:
- جیاوازییەکە بە لای کەمەوە جیاوازیی درێژییەکەیە.
- بۆ نموونە، لەنێوان «car» (کە ٣ پیتە) و «cars» (کە ٤ پیتە)، جیاوازییەکە بە لای کەمەوە بریتییە لە ١.
- جیاوازییەکە قەت لە درێژیی وشە درێژەکە زیاتر نییە.
- بۆ نموونە، بۆ گۆڕینی «run» بۆ «running»، ئەوپەڕی ٧ دەستکاری پێویستە.
- ئەگەر وشەکان ھەمان شت بوون، جیاوازییەکە بریتییە لە سفڕ.
- ژمارەی دەستکارییەکان بۆ گۆڕینی وشەی A ڕاستەوخۆ بۆ C ھەمیشە بچووکتر یان یەکسانە بە سەرجەمی دەستکاریی پێویست بۆ گۆڕینی A بۆ B، و پاشان B بۆ C (لاسەنگەی سێگۆشەیی).
- ئەو وشانە ھەمان درێژییان ھەیە، جیاوازییەکە کەمتر یان یەکسانە بە ژمارەی پییتە نابەرامبەرەکان (کە ئەمە پێی دەڵێن جیاوازیی ھامینگ).
- بۆ نموونە، بۆ گۆڕینی «flaw» بۆ «lawn»:
- شوێنی ھەر ٤ پیتەکە گۆڕاوە، بۆیە جیاوازیی ھامینگ بریتییە لە ٤.
- بەڵام جیاوازیی لێڤنشتاین بریتییە لە ٢ («f» لە سەرەتای وشەکە سڕاوەتەوە و «n» لە کۆتاییی وشەکە زیاد کراوە).
- بۆ نموونە، بۆ گۆڕینی «flaw» بۆ «lawn»:
بەکارھێنانەکان
[دەستکاری]لە نزیککردنەوەی زنجیرەنووسەی چوونیەکدا، مەبەست لە دۆزینەوەی ھاوشێوەکانی زنجیرەنووسە کورتەکانە لە چەندین دەقی درێژتر، لەو حاڵەتانەی کە ژمارەیەکی بچووک لە جیاوازی ڕەچاو دەکرێت. لەوانەیە ئەو زنجیرەنووسە کورتانە، بۆ نموونە، لە فەرھەنگێکەوە بێن. لێرەدا، یەکێک لەو زنجیرەنووسانە بە زۆری کورتە، لەکاتێکدا درێژیی ئەوی تر دەکرێ ھەرچەند بێت. جیاوازیی لێڤنشتاین بوارێکی فراوانی بەکارھێنانی ھەیە، بۆ نموونە لە پشکنەرەکانی ڕێنووس، سیستەمەکانی چاکسازیی ناسینەوەی ھێما بەبینایی، و نەرمامێر تا یارمەتیی وەرگێڕانی زمانی سروشتی بە پشتنبەستن بە بیرگەی وەرگێڕان بدات.
دەکرێ جیاوازیی لێڤنشتاین لەنێوان دوو زنجیرەنووسەی درێژتریش حسابات بکات، بەڵام تێچووی حسابکردنی، کە بە نزیکی لەگەڵ بەرھەمی درێژیی دوو زنجیرەنووسەکە ھاوڕێژەیە، کە ئەمەش وا دەکات بێھوودە بێت. بەم شێوەیە، کە وەک یاریدەدەرێک لە گەڕانی زنجیرەنووسەی نائاشکرا لە بەکارھێنانەکانی وەک ڕیکۆرد لینکەیج بەکار ھات، ئەوا زنجیرەنووسە بەراوردکراوەکان زۆربەی جار کورتن تا یارمەتیی باشترکردنی خێرایی بەراوردکردنەکان بدەن.[ژێدەر پێویستە]
لە زمانەوانیدا، جیاوازیی لێڤنشتاین وەک پێوەرێکی پێوان بەکارھاتووە تا جیاوازیی زمانەوانی یان، تا چەند دوو زمان لە یەکتری جیاوازن بپێوێت.[٣] ئەمە پەیوەندیدارە بە تێگەیشتنی دووقۆڵی: تا جیاوازیی زمانەوانی بەرزتر بێت، تێگەیشتنی دووقۆڵی نزمتر دەبێت، و تا جیاوازیی زمانەوانی نزمتر بێت، تێگەیشتنی دووقۆڵی بەرزتر دەبێت.
جیاوازیی لێڤنشتاین لە بەکارھێنانەکانی وەک بیستنپێوی، یارمەتیی حسابکردنی دروستی لە تاقیکردنەوەکانی بیستنی کەسێک دەدات. بە پێوانی جیاوازیی نێوان ئەو دەنگەی کە لێ دراوە، و ئەو وەڵامەی کە گوێگرەکە دەیدات بە دەستەوە کار دەکات. دەکرێ سزای ھەر ھەڵەیەک بە دوو ڕێگە چارە بکرێت: یان ھەر ھەڵەیەک تێچوویەکی جێگیری دەدرێتێ، یانیش تێچووەکە کێشدارە، کە سزایەکی بچووکتر دەداتە ئەو ھەڵە دەنگییانە کە زۆر لە یەکتری دەچن.[٤]
جیاوازیی لێڤنشتاین و ئەلگۆریتمە ھاوشێوەکانی لە زیندەزانیارییەکان، جیاوازیی نێوان زنجیرە پەیوەندیدارەکان بە ژینناسی وەک ئەوانەی لە دی ئێن ئەی و پرۆتین ھەن دەپێون. ئەو دەستکارییانەی لە ئەلگۆریتمەکە ڕوو دەدەن ھاوشێوەی ئەوانەن کە لە بازدانە بۆماوەیییەکان ڕوو دەدەن: زیادکردن، سڕینەوە یان جێگۆڕکێی نیوکلیۆتاید (لە دی ئێن ئەی) یان ترشی ئەمینی (لە پڕۆتین). کاتێک ژمارەی لێڤنشتاین لە نێوان دوو زنجیرەکە بچووک بێت، ئەوا ئەوە ئاماژەیەکی بەھێزە کە دوو بوونەوەرەکە یان پەیوەندییەکی نزیکیان ھەیە یانیش دوو پارچەکەی دی ئێن ئەی ھەمان کار دەکەن.[٥]
پەیوەندی لەگەڵ پێوەرەکانی تری پێوانی جیاوازیی دەستکاری
[دەستکاری]جیاوازیی لێڤنشتاین یەکێکە لەو چەندین ڕێگایەی کە جیاوازیی دەستکاری دەپێوێت. ڕێگەکانی تر بەپێی کردەوە تایبەتەکانی دەستکاری کە ھەر یەکەیان ڕێگەی پێ دەدەن جیا دەکرێنەوە. بۆ نموونە:
- جیاوازیی دەمەڕاو–لێڤنشتاین ڕێگە بە ھەمان ئەو دەستکارییانە دەدات کە لێڤنشتاین ڕێگەی پێ دەدات، بەڵام ئەمیان ڕێگە بە ئاڵوگۆڕکردنی دوو نووسەی دراوسێی یەکتریش دەدات.
- جیاوازیی LCS تەنیا ڕێگە بە زیادکردن و سڕینەوە دەدات و ڕێگە بە جێگۆڕکێکردن نادات.
- جیاوازیی ھامینگ تەنیا ڕێگە بە جێگۆڕکێکردن دەدات، و لە ئاکامدا، دەتوانرێت تەنیا لەسەر ئەو زنجیرەنووسانەی کە ھەمان درێژییان ھەیە بەکاربێت.
- جیاوازیی جارۆ تەنیا ڕێگە بە ئاڵوگۆڕکردنی نووسەکان دەدات.
بەگشتی، جیاوازیی دەستکاری بە کردارە ڕێگەپێدراوەکان و تێچووەکانیان پێناسە دەکرێت. ئەم چەمکە بۆ ئەلگۆریتمە پێشکەوتووەکانی ڕێکخستنی زنجیرەییی دی ئێن ئەی وەک ئەلگۆریتمی سمیت–واتەرمان درێژ دەبێتەوە کە دەکرێ تێچووی کردارێک پشت بە شوێنەکەشی لەناوی زنجیرەکەدا ببەستێت.
ئەمانەش ببینە
[دەستکاری]- ئەپاچی لووسیین (گەڕانچییەکی سەرچاوەکراوە کە جیاوازیی دەستکاری جێبەجێ دەکات)
- بۆشاییی مەتری
سەرچاوەکان
[دەستکاری]- ↑ В. И. Левенштейн (١٩٦٥). «В. И. Левенштейн, "Двоичные коды с исправлением выпадений, вставок и замещений символов", Докл. АН СССР, 163:4 (1965), 845–848» Двоичные коды с исправлением выпадений, вставок и замещений символов [Binary codes capable of correcting deletions, insertions, and reversals]. Доклады Академии Наук СССР (بە ڕووسی). ١٦٣ (4): ٨٤٥–٨٤٨. Appeared in English as: Levenshtein, Vladimir I. (شوباتی ١٩٦٦). «Binary codes capable of correcting deletions, insertions, and reversals». Soviet Physics Doklady. ١٠: ٧٠٧–٧١٠. Bibcode:١٩٦٦SPhD...١٠..٧٠٧L.
{{cite journal}}:|bibcode=length بپشکنە (یارمەتی) - ↑ Jan D. ten Thije؛ Ludger Zeevaert (١ی کانوونی دووەمی ٢٠٠٧)، Receptive multilingualism: linguistic analyses, language policies, and didactic concepts، John Benjamins Publishing Company، ژپنک ٩٧٨-٩٠-٢٧٢-١٩٢٦-٨،
Assuming that intelligibility is inversely related to linguistic distance … the content words the percentage of cognates (related directly or via a synonym) … lexical relatedness … grammatical relatedness
. - ↑ Fontan، L.؛ Ferrané، I.؛ Farinas، J.؛ Pinquier، J.؛ Aumont، X. (2016). «Using Phonologically Weighted Levenshtein Distances for the Prediction of Microscopic Intelligibility». Proc. INTERSPEECH ’16: 17th Proc. Annu. Conf. Int. Speech Commun. Assoc. INTERSPEECH 2016. San Francisco, USA. لاپەڕە 650–654.
- ↑ Berger، Bonnie؛ Waterman، Michael S.؛ Yu، Yun William (حوزەیرانی ٢٠٢١). «Levenshtein Distance, Sequence Comparison and Biological Database Search». IEEE Transactions on Information Theory. ٦٧ (6): ٣٢٨٧–٣٢٩٤. doi:١٠.١١٠٩/TIT.٢٠٢٠.٢٩٩٦٥٤٣. ISSN ١٥٥٧-٩٦٥٤.
بەستەرە دەرەکییەکان
[دەستکاری]- Black، Paul E.، ed. (١٤ی ئابی ٢٠٠٨)، «Levenshtein distance»، Dictionary of Algorithms and Data Structures [online]، U.S. National Institute of Standards and Technology، لە ٢ی تشرینی دووەمی ٢٠١٦ ھێنراوە
- جێبەجێکردنەکانی ڕۆسێتا کۆد لەسەر جیاوازیی لێڤنشتاین