وشەناسیی کۆمپیۆتری

لە ویکیپیدیاوە، ئینسایکڵۆپیدیای ئازاد
باز بدە بۆ: ڕێدۆزی، گەڕان

وشەناسیی کۆمپیۆتری (Computational lexicology) لکێکە لە زمانناسی کۆمپیۆتری، کە پەیوەستە بە بەکارھێنانی کۆمپیۆتر لە لێکۆڵینەوە و لێکدانەوەی وشەنامە (Lexicon) دا. بە پێی ھەندێ لە لێکۆڵەران وەکوو ئامسلێر (Amsler، ١٩٨٠) وشەناسیی کۆمپیۆتری بریتیە لە بەکارھێنانی کۆمپیۆتر لە لێکۆڵینەوەی ئەو دەستە لە فەرھەنگەکان دا کە ماشین دەتوانێ بیخوێنێتەوە. ئەم تێکۆنۆلۆژییە وشەکان و شکڵە جیاجیاکانی ئەوان لە نێو زمان دا لێک ئەداتەوە و ڕوونی دەکاتەوە کە وشە چۆن و بە شێوەگەلێک بە کار دەھێنرێت.

وشەناسی کۆمپیۆتری جیاوازە لە وشەنووسی کۆمپیۆتری (Computational lexicology) کە بریتیە لە بەکارھێنانی کۆمپیۆتر لە نووسینی فەرھەنگ و وشەنامە دا.


مێژوو[دەستکاری]

ھاوکات لەگەڵ پەیدابوونی ئەو فەرھەنگانەی کە ماشین دەیتوانی بیخوێنێتەوە، وشەناسیی کۆمپیۆتری وەکوو لکێکی جودا لە نێو بواری زمانناسیی کۆمپیۆتری دا پەیدا بوو، و سەرەتا لە دەیەی ١٩٦٠ بە دروستکردنی شریتگەلێکی ماشین-خوێنەر لە ھەفتەمین فەرھەنگی زانکۆی مەرییەم وێبستێر (Merriam-Webster Seventh Collegiate Dictionary) و فەرھەنگی گیرفانیی نوێی وێبستێر (Merriam-Webster New Pocket Dictionary) لە لایەن جان ئۆلنەی (John Olney) و ھاوکارانیەوە لە شەریکەی پەرەپێدانی سیستەم (System Development Corporation) دەستی پێکرد. ئەمڕۆکە وشەناسیی کۆمپیۆتری زیاتر بە بەرنامەکانی وۆردنێت (WordNet)ـەوە ناسراوە.

لێکۆڵینەوەی وشەنامە[دەستکاری]

وشەناسیی کۆمپیۆتری زۆر یارمەتیدەر بووە لە تێگەیشتن لە ناوەرۆک و سنوورەکانی فەرھەنگە چاپیەکان بۆ مەبەستی لێکدانەوەی کۆمپیۆتری (واتە ڕوونی کردەوە کە کارە کۆنەکانی فەرھەنگ‌نووسی بۆ جێبەجێکردنی پێداویستیەکانی زمانناسیی کۆمپیۆتری ناتەواوە و پێویستە سەرچاوەی زیاتر بخرێتە بەردەست). لێکدانەوەکان و لێکۆڵینەوەکانی پسپۆڕانی وشەناسیی کۆمپیۆتری توانیویەتی تەقریبەن ھەموو بەشەکانی و لایەنەکانی نووسینی وشە لە فەرھەنگی چاپی دا ڕوون بکاتەوە، لەوانە:

  1. سەروشە (headword) کامەیە و چۆن دروست دەبێت - ئەمەش بە کار دەھێنرێت بۆ دروستکردنی لیستەکانی ڕاستکردنەوەی ڕێنووسی وشە؛
  2. سەروشە چەند جۆری جیاواز و حاڵەتی سەرفی لە خۆی دەگرێت - ئەمە بە کار دەھێنرێت بۆ تێگەیشتن لە مۆرفۆلۆژی بە شێوەی تەجروبی؛
  3. سەروشە چۆن لە نێو سیلابەکان (ھجاکان) دا سنووردار دەکرێت؛
  4. سەروشە چۆن گۆ دەکرێت (تەلەفۆز دەکەرێت) - ئەمە لە سیستەمەکانی دروسکردن چێکردنی وتە دا بە کار دەھێنرێت؛
  5. سەروشە چ ڕۆلگەلێکی ڕێزمانی لە خۆی دەگرێت (واتە ناو، ئاوەڵناو، ئاوەڵکردار ھتد.)-ئەمەش بە کار دەھێنرێت بۆ تەگێرەکانی POS؛
  6. ئەو کۆدە مژاری یان بوارییانەی کە ئەدرێت لە وشە - ئەمە بەکار دەھێنرێت بۆ ناسینەوەی مژار یان بواری دەق و نووسراوەکە؛
  7. واتاکان و سینتاکسی سەروشە - ئەمە بە کار دەھێنرێت بۆ ڕوونکردنەوەی واتای دەقیقی وشە لە نێو بەستێن (context) دا؛
  8. ڕیشەناسیی سەروشە و کەڵکی ئەو بۆ مەبەستی وەسفکردنی وشە لە ڕێگەی زمانی بنەڕەتی وشەکەوە - ئەمە بە کار دەھێنرێت بۆ وەسفکردنی وشەکانی نێو دەق و نووسراوەکان لە ڕوانگەی ئەو زمانانەوە کە بنەرەتی وشەکان پێک دێنن.
  9. نموونە ڕستەکان، واتە ئەو ڕستانەی کە وەکوو نموونەی چۆنیەتی بەکارھێنانی وشە لە فەرھنەگەکان دا دەنووسرێن؛
  10. زێدەوشەکان (واتە ئەو وشە زیادی و دەستەوژاە چەندوشەییانەی کە لەسەر بنەمای سەروشە دروست دەکرێن)؛ وە ھەروەھا وشە پەیوەندیدارەکان وەکوو ھاوواتاکان و دژواتاکان.

ژمارەیەکی زۆر لە زمانناسانی کۆمپیۆتری چیتر بڕوایان نەما بە فەرھەنگە چاپییەکان وەکوو سەرچاوەیەک بۆ زمانناسیی کۆمپیۆتری چونکا ئەم فەرھەنگانە زانیاری سینتاکسی و سێمەنتیکی (واتاناسی) تەواویان تێدا نەبوو بۆ ئەوەی لە بەرنامە کۆمیۆتریەکان دا بە کار بھێنرێن. کارکردن لە سەر وشەناسیی کۆمپیۆتری لە ماوەیەکی کورت دا بوو بە ھۆی خەبات و تێکۆشان لە دوو ئاڕاستەی دیکە دا.

جێگرەوەکانی وشەناسیی کۆمپیۆتری[دەستکاری]

First، collaborative activities between computational linguists and lexicographers led to an understanding of the role that corpora played in creating dictionaries. Most computational lexicologists moved on to build large corpora to gather the basic data that lexicographers had used to create dictionaries. The ACL/DCI (Data Collection Initiative) and the LDC (Linguistic Data Consortium) went down this path. The advent of markup languages led to the creation of tagged corpora that could be more easily analyzed to create computational linguistic systems. Part-of-speech tagged corpora and semantically tagged corpora were created in order to test and develop POS taggers and word semantic disambiguation technology.

The second direction was toward the creation of Lexical Knowledge Bases (LKBs). A Lexical Knowledge Base was deemed to be what a dictionary should be for computational linguistic purposes، especially for computational lexical semantic purposes. It was to have the same information as in a print dictionary، but totally explicated as to the meanings of the words and the appropriate links between senses. Many began creating the resources they wished dictionaries were، if they had been created for use in computational analysis. WordNet can be considered to be such a development، as can the newer efforts at describing syntactic and semantic information such as the FrameNet work of Fillmore. Outside of computational linguistics، the Ontology work of artificial intelligence can be seen as an evolutionary effort to build a lexical knowledge base for AI applications.

ستانداردکردن[دەستکاری]

Optimizing the production، maintenance and extension of computational lexicons is one of the crucial aspects impacting NLP. The main problem is the interoperability: various lexicons are frequently incompatible. The most frequent situation is: how to merge two lexicons، or fragments of lexicons? A secondary problem is that a lexicon is usually specifically tailored to a specific NLP program and has difficulties being used within other NLP programs or applications.

To this respect، the various data models of Computational lexicons are studied by ISO/TC٣٧ since ٢٠٠٣ within the project lexical markup framework leading to an ISO standard in ٢٠٠٨.

سەرچاوەکان[دەستکاری]

Amsler، Robert A. ١٩٨٠. Ph.D. Dissertation، "The Structure of the Merriam-Webster Pocket Dictionary". The University of Texas at Austin.

بەستەری دەرەکی[دەستکاری]