چکيده
بيشتر واژگان در زبان طبيعي چند معنايي هستند، يعني چندين معني و مفهوم را دارا هستند. ابهامزدايي معناي واژگان يكي از مهمترين وظايف در پردازش زبان طبيعي است. فرآيند يافتن معناي صحيح واژهي چند معنايي، به كمك تجزيه و تحليل محتواي متن را ابهام زدايي معناي واژگان ميگويند. پيونددهي موجوديتها نيز عملياتي شبيه ابهام زدايي معناي واژگان است كه در آن هر كلمه به يك موجوديت در پايگاه دانش نگاشت ميشود. همچنين از به اشتراكگذاري الگوريتمهاي پيونددهي موجوديت و الگوريتمهاي ابهام زدايي معناي واژگان روشي تحت عنوان بيبلفاي معرفي شدهاست كه كمك بهسزايي به فهم ماشيني متون كردهاست. بيبلفاي مبتني بر بيبلنت است. بيبلنت بزرگترين فرهنگ لغت جامع چند زبانه است كه از تركيب بزرگترين منبع واژگان معنايي موجود در زبان انگليسي، وردنت و بزرگترين دانشنامه ويرايش شده، ويكيپديا ساخته شدهاست. پيش از اين پژوهشهاي بسيار كمي در زمينهي ابهام زدايي معناي واژگان در زبان فارسي صورت گرفته است و به دليل وجود فراواني كلمات مبهم در زبان فارسي نياز به اين پژوهش مروري احساس ميشود.
پس از مرور پژوهشهايي در حوزه ي ابهام زدايي معناي واژگان، در اين سمينار به معرفي رهيافتهاي مختلف در ابهام زدايي معناي واژگان از قبيل باناظر، بيناظر، نيمه نظارت شده و دانش محور پرداخته خواهد شد. و در ادامه به دستهبندي الگوريتمهاي متداول در اين زمينه و بررسي سيستمهاي باناظر در مرزهاي دانش پرداخته خواهد شد و منابع داده از قبيل فرهنگ لغت بيبلنت نيز معرفي ميشوند. در انتهاي اين پژوهش به جمع بندي و نتيجه گيري در ارتباط با روشهاي ابهام زدايي معناي واژگان و پيشنهاد و بررسي كارهاي آتي در اين زمينه پرداخته ميشود.