چکيده
شباهتيابي معنايي متون يكي از زيرشاخههاي پردازش زبان طبيعي است كه در چند سال اخير تحقيقات گستردهاي را به خود معطوف كردهاست. منظور از شباهتيابي معنايي، محاسبه ميزان شباهت معنايي بين دو سند متني، پاراگراف يا جمله ميباشد كه به دو صورت تك زبانه و چندزبانه مطرح است. هدف اصلي اين سمينار بررسي روشهاي شباهتيابي بين جملاتي ميباشد كه زبان متفاوتي دارند؛ بعضي از اين روشها بصورت مستقيم و با ايجاد فضاي برداري يكسان اين عمل را انجام ميدهند و بعضي از آنها نيز از ماشينهاي ترجمه براي يكسان كردن زبان دو جمله استفاده ميكنند سپس با استفاده از روشهاي شباهتيابي جملات تكزبانه ميزان شباهت دو جمله را اندازهگيري ميكنند و اين ميزان شباهت با عددي بين 0 تا 5 مشخص ميشود..
در چند سال اخير مدل هاي زباني مبتني بر مبدلها ارائه شدهاند، كه زمينهي مناسبي براي پيشرفت در زمينه شباهتيابي متون را فراهم كردهاست و همين موضوع انگيزه ما براي اين پژوهش شدهاست.