سفارش تبلیغ
صبا ویژن
 
خود پسندی خرد را تباه می کند . [امام علی علیه السلام]
 
امروز: شنبه 103 اردیبهشت 1

پردازش زبان‌های طبیعی

پردازش زبان‌های طبیعی یکی از زیرشاخه‌های بااهمیت در حوزه گسترده هوش مصنوعی، و نیز در دانش زبان‌شناسی است. تلاش عمده در این زمینه ماشینی کردن فرایند درک و برداشت مفاهیم بیان گردیده با یک زبان طبیعی انسانی‌ست. به تعریف دقیق‌تر پردازش زبان‌های طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و نوشتاری. با استفاده از آن می‌توان به ترجمه زبان‌ها پرداخت، از صفحات وب و بانک‌های اطلاعاتی نوشتاری جهت پاسخ دادن به پرسش‌ها استفاده کرد، یا با دستگاه‌ها مثلاً برای مشورت گرفتن به گفتگو پرداخت.[1]

این‌ها تنها مثال‌هایی از کاربردهای متنوع پردازش زبان‌های طبیعی هستند. گفتنی‌ست هنوز سیستم کارآمدی برای پردازش زبان‌های طبیعی به وجود نیامده‌است. 

محدودیت‌ها 

پردازش زبان‌های طبیعی رهیافت بسیار جذابی برای ارتباط بین انسان و ماشین محسوب می‌شود و در صورت عملی شدنش به طور کامل می‌تواند تحولات شگفت‌انگیزی را در پی داشته‌باشد. سیستم‌های قدیمی محدودی مانند SHRDLU که با واژه‌های محدود و مشخصی سر و کار داشتند، بسیار عالی عمل می‌کردند، به طوری که پژوهشگران را به شدت نسبت به این حوزه امیدوار کرده‌بودند. اما در روبه‌رویی با چالش‌های جدی‌تر زبانی و پیچیدگی‌ها و ابهام‌های زبان‌ها، این امیدها کم‌رنگ شدند. مسئله? پردازش زبان‌های طبیعی معمولاً یک مسئله AI-Complete محسوب می‌شود، چرا که محقق شدن آن به طور کامل مستلزم سطح بالایی از درک جهان خارج و حالات انسان برای ماشین است.

موانع اساسی 

  • نیاز به درک معانی: رایانه برای آن که بتواند برداشت درستی از جمله‌ای داشته باشد و اطلاعات نهفته در آن جمله را درک کند، گاهی لازم است که برداشتی از معنای کلمات موجود در جمله داشته باشد و تنها آشنایی با دستور زبان کافی نباشد. مثلاً جمله حسن سیب را نخورد برای این که کال بود. و جمله حسن سیب را نخورد برای این که سیر بود. ساختار دستوری کاملاً یکسانی دارند و تشخیص این که کلمات کال و سیر به حسن برمی‌گردند یا به سیب بدون داشتن اطلاعات قبلی درباره ماهیت حسن و سیب ممکن نیست.
  • دقیق نبودن دستور زبان‌ها: دستور هیچ زبانی آن‌قدر دقیق نیست که با استفاده از قواعد دستوری همیشه بتوان به نقش هر یک از اجزای جمله‌های آن زبان پی برد. برای مثال در جمله کوتاه باز روی زمین نشست. نمی‌توان تشخیص داد که باز قید جمله به معنای دوباره است یا این که فاعل جمله به معنای نوعی پرنده شکاری است.

پردازش زبان‌های طبیعی آمارگرا 

پردازش زبان‌های طبیعی به شکل آمارگرا عبارت است از استفاده از روش‌های تصادفی، احتمالاتی و آماری برای حل مسائلی مانند آن‌چه که در بالا ذکر شده. به خصوص از این روش‌ها برای حل مسائلی استفاده می‌کنند که ناشی از طولانی بودن جملات و زیاد بودن تعداد حالات ممکن برای نقش کلمات هستند. این روش‌ها معمولاً مبتنی بر نمونه‌های متنی و مدل‌های مارکف هستند.

کارکردهای مهم پردازش زبان‌های طبیعی 

  • خلاصه‌سازی خودکار
  • استخراج اطلاعات
  • بازیابی اطلاعات
  • ترجمه ماشینی
  • تشخیص نوری نویسه‌ها
  • تشخیص گفتار
  • ویرایش

تاریخچه 

نخستین تلاش‌ها برای ترجمه توسط رایانه ناموفق بودند، به طوری که ناامیدی بنگاه‌های تأمین بودجه پژوهش از این حوزه را نیز در پی داشتند. پس از اولین تلاش‌ها آشکار شد که پیچیدگی زبان بسیار بیشتر از چیزی‌ست که پژوهشگران در ابتدا پنداشته‌بودند. بی‌گمان حوزه‌ای که پس از آن برای استعانت مورد توجه قرار گرفت زبان‌شناسی بود. اما در آن دوران نظریه زبان‌شناسی وجود نداشت که بتواند کمک شایانی به پردازش زبان‌ها بکند. در سال 1957 کتاب ساختارهای نحوی اثر نوام چامسکی زبان‌شناس جوان آمریکایی که از آن پس به شناخته‌شده‌ترین چهره زبان‌شناسی نظری تبدیل شد به چاپ رسید.[2] از آن پس پردازش زبان با حرکت‌های تازه‌ای دنبال شد اما هرگز قادر به حل کلی مسئله نشد.

 

پانویس

  1.  Sheffield University.
  2.  Birmingham University.

پیوندهای بیرونی 

  • مرکز مطالعات زبان و اطلاعات، استانفورد
  • تهیه بانک پرحجم واژگان برای کاربرد در نظام‌های متن سازی و سازه یابی و بازیابی اطلاعات، ترجمه: سید مهدی سمائی، مرکز اطلاعات و مدارک علمی ایران

منابع

  • Crystal D., The Cambridge Encyclopedia of Language, 2nd edition, Cambridge University Press, 1996. ISBN 5-521-55967-7

  • Manning, C. D., and Schutze, H., Foundations of Statistical Natural Language Processing, ?th edition, The MIT Press, 2002. ISBN 0-262-13360-1


 نوشته شده توسط لادن در شنبه 90/3/21 و ساعت 9:2 صبح | نظرات دیگران()
درباره خودم

وبلاگ  چت روم  کامپیوتر و شبکه در سایت الفور
مدیر وبلاگ : علی[32]
نویسندگان وبلاگ :
لادن[38]
حیران[0]

وبلاک چت روم شبکه و کامپیوتر در سایت الفور تاریخ تاسیس 19/1/1390

آمار وبلاگ
بازدید امروز: 5
بازدید دیروز: 2
مجموع بازدیدها: 102273
جستجو در صفحه

لوگوی دوستان
خبر نامه
 
وضیعت من در یاهو