دانشگاه صنعتی شریف
نقشه سایتتماس با دانشگاهEnglish
۱۳۹۰/۰۵/۰۲  ۱۰:۵۵

طراحی تحلیل‌گر صرفی pars Morph برای اولین بار توسط دانشجوی دانشگاه صنعتی شریف


وحید مواجی یکی از دانشجویان کارشناسی ارشد مرکز زبان موفق به ارایه برنامه‌ای تحت عنوان تحلیلگر صرفی شده است، این برنامه برای اولین بار طراحی شده و می‌تواند در راستای علوم زبان شناختی و مهندسی زبان بسیار کارساز و مفید باشد.
در زیر جهت معرفی این طرح مصاحبه‌ای با ایشان انجام داده‌ایم که بخشی از آن را در ادامه خواهید خواند؛
- لطفاً طرح خود را معرفی نمایید.
برنامه تحلیلگر صرفی Pars Morph در راستای موضوع پایان‌نامه کارشناسی ارشد این جانب وحید مواجی دانشجوی رشته زبان‌شناسی رایانشی در مرکز زبان‌ها و زبان‌شناسی می‌باشد.
این پایان‌نامه تحت سرپرستی و راهنمایی دکتر محرم اسلامی و به مشاوره دکتر بهرام وزیرنژاد در آزمایشگاه پردازش زبان و گفتار مرکز زبان دانشگاه صنعتی شریف در حال انجام است.
این تحقیق دو بعد نظری و کاربردی دارد. به لحاظ نظری، ساختمان درونی کلمه در زبان فارسی را ابتدا صورت‌بندی می‌کنیم که در آن فرآیندهای ترکیب (Compounding)، اشتقاق (Derivation) و نیز صورت‌های تصریفی (Inflectional) کلمه مشخص میشود. در این بخش، به امکان ترکیب تکواژهای قاموسی در ساختمان کلمه مرکب، نحوه واژه سازی با افزودن وندهای اشتقاقی با مشخص کردن جایگاه وندهای اشتقاقی در ساختمان کلمه مشتق و به صورت-کلمه‌ها (Word-Forms) می پردازیم. در صورت-کلمه‌ها نیز جایگاه وندهای غیراشتقاقی در ساختمان کلمه معتبر است که در این تحقیق به این مهم از حیث پردازش رایانه‌ای توجه شده است. همه این ویژگی‌ها ابتدا به لحاظ نظری صورت‌بندی شده‌اند و سپس برابر یافته‌های علمی تحقیق حاضر، برنامه تحلیل‌گر صرفی زبان فارسی طراحی گردیده است.
در مرحله پیاده‌سازی، عملکرد برنامه برابر جزئیاتی که در بالا به آن اشاره گردید، کنترل می‌گردد. این برنامه توسط زبان برنامه نویسی پایتون نوشته است و با استفاده از معماری Django تحت وب قرار گرفته‌است.
- دسترسی به این برنامه به چه صورت امکان پذیر می‌باشد؟
دموی این برنامه اکنون به صورت برخط در آدرس اینترنتی:http://81.31.191.11 در دسترس می‌باشد.
- از نتایج این تحقیق در چه زمینه‌های می‌توان‌استفاده نمود؟
نتایج این تحقیق در زمینه‌های مختلف قابل استفاده است، از جمله:
1. مطالعات زبان‌شناختی
• ریشه‌یابی کلمات
• جستجو‌های گوناگون در پیکره‌های بزرگ متنی
• تهیه فرهنگ‌های بسامدی، فرهنگ‌های طیفی، تهیه فهرست مدخل‌های انواع فرهنگ‌ها
• دستور نویسی
2. مطالعات مربوط به مهندسی زبان
• تبدیل متن به گفتار
• ترجمه ماشینی
• استخراج اطلاعات از متون با حجم بالا
• خلاصه‌سازی متون
• طراحی موتورهای جستجوگر فارسی
یادآور می‌گردد که بعد از تکمیل تحلیلگر صرفی و با استفاده از خروجی این برنامه، اقدام به طراحی و پیاده‌سازی تحلیلگر نحوی خواهد شد.
- و در آخر ؟
• لازم است در انتها از زحمات آقای دکتر محرم اسلامی، آقای دکتر بهرام وزیرنژاد، سرکارخانم دکتر پروانه خسروی‌زاده و آقای دکتر مقداری رئیس مرکز زبان تشکر به‌عمل آورم.
 

لطفا نظرات و پیشنهادات خود را به آدرس web [at] sharif.ir ارسال فرمایید
۱۳۹۰، دانشگاه صنعتی شریف، تهران، ایران
طراحی و اجرا در آزمایشگاه وب Powered by Cybiran