دانشگاه صنعتی شریف
نقشه سایتتماس با دانشگاهEnglish
۱۳۸۹/۱۱/۱۹  ۱۵:۵۳

نمایه‌سازی خط تیره برای نرم‌افزارهای ترجمه ماشینی

به گزارش روابط عمومی دانشگاه صنعتی شریف، طرح نمایه‌سازی خط تیره برای نرم‌افزارهای ترجمه ماشینی توسط پروانه خسروی زاده در مرکز زبان‌ها و زبان‌شناسی دانشگاه صنعتی شریف ابداع شده است.
در چكیده این طرح آمده است كه: موارد کاربرد خط تیره (dash) در زبان‌های فارسی و انگلیسی بسیار متنوع است. عدم توجه به این تنوع کاربرد و نیز عدم وجود تحقیقی در زمینه شناسایی و تعریف موارد ظهور این نشانه در متون زبان فارسی و انگلیسی، معضلی را برای نرم‌افزارهای ترجمه ماشینی و پردازشگرهای زبان طبیعی به وجود آورده است. به طوری که درک درست این نشانه را در بافت‌های مختلف برای رایانه بسیار مشکل می‌سازد. خط تیره بر حسب کاربردهای متفاوت خود گاه در درون واژه و گاه در مرز واژه‌ها ظاهر میشود، میتواند بیانگر واژهای شکسته شده در انتهای سطر باشد، قبل و بعد از یک عبارت توضیحی یا جمله معترضه قرار گیرد و یا حتی میان دو عدد واقع گردد. همسانی این نشانه با علامت منها و نماد منفی در ریاضیات نیز به پیچیدگی مسئله می‌افزاید. طرح حاضر تحقیقی است برای شناخت انواع ممکن کاربرد خط تیره در زبان فارسی و نمایه‌سازی خط تیره برای نرم‌افزارهای ترجمه ماشینی و تبدیل متن به گفتار.
از آنجا که شناخت و تفکیک موارد وقوع خط تیره هم در پردازش متن مبدأ و مقصد نقش اساسی بازی میکند و هم در برنامه‌های رایانه‌ای تبدیل متن به گفتار به کاربرد صحیح آهنگ گفتار منجر می‌شود، هدف اصلی از اجرای این طرح ارائه ابزاری برای کارایی بیشتر نرم‌افزارها و برنامه‌های رایانه‌ای ترجمه و نیز تبدیل متن به گفتار است.

لطفا نظرات و پیشنهادات خود را به آدرس web [at] sharif.ir ارسال فرمایید
۱۳۹۰، دانشگاه صنعتی شریف، تهران، ایران
طراحی و اجرا در آزمایشگاه وب Powered by Cybiran