-
شماره ركورد
33314
-
پديد آورنده
امين فتحي
-
عنوان
جستوجوي خودكار شبكه هاي عصبي در حوزه پردازش زبانه اي طبيعي
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
هوش مصنوعي و رباتكيز
-
سال تحصيل
1400
-
تاريخ دفاع
1403/4/24
-
استاد راهنما
دكتر ناصر مزيني
-
استاد مشاور
نداشتم
-
دانشكده
مهندسي كامپيوتر
-
چكيده
استفاده از مدلهاي مبتني بر هوش مصنوعي به صورت گستردهاي در زمينههاي مختلفي در جريان است. با اين حال، ساخت يك مدل هوش مصنوعي با كيفيت بالا براي يك كار خاص، به شدت به تخصص انساني متكي است و مانع از كاربرد گسترده آن ميشود. مسئلهي نام برده منجر به اهميت پيدا كردن طراحي روشها و رويكردهايي شده است كه هدف آنها جستوجوي خودكار شبكههاي عصبي با كمترين ميزان دخالت انسان شده است. اولين تلاشها براي اين امر كه مبتني بر الگوريتمهاي تكاملي و يادگيري تقويتي بودند، علاوه بر زمانبر بودن به توان محاسباتي بسيار بالا نيز نياز داشتند. نوآوريها و پژوهشهاي انجام شده در جستوجوي خودكار غالباً در سه فاز اصلي تعيين فضاي جستوجو، تعيين الگوريتم جستوجو و تعيين روشهاي ارزيابي بوده است. علاوه بر اين روشهاي جستوجوي خودكار شبكههاي عصبي بيشتر در وظايف پردازش تصاوير به كار گرفته شدهاند و خلأ استفاده از اين روشها در وظايف مرتبط با پردازش زبانهاي طبيعي مشهود است. وظايفي نظير ترجمه زبان، تحليل احساسات و خلاصهسازي متن.
در اين پژوهش به دنبال ارائهي روشي براي جستوجوي معماري خودكار در وظيفه ترجمه ماشيني هستيم كه قابليت اعمال در ساير وظايف پردازش زبان را نيز داشته باشد. براي اين امر نيازمند يك فضاي جستوجوي مناسب هستيم تا نهايتاً با استفاده از يك الگوريتم جستوجوي فراابتكاري مدلهايي با كارايي و امتياز مناسب براي وظيفهي ترجمه ماشيني (از فارسي محاورهاي به انگليسي) ارائه دهيم، چنين مدلي قادر خواهد بود كه در وظايف كوچك و قابل تجاريسازي، به خوبي با مدلهاي زباني بزرگ كه با چالشهايي همراه هستند، رقابت كند. روش ارائه شده در اين پاياننامه قابليت استفاده در ساير وظايف پردازش زبان را دارا است و به عنوان يك نوآوري در اين زمينه مطرح ميشود. فضاي جستوجويي به كمك معماري مدلهاي MT5 طراحي شده است كه شامل 512 معماري مختلف براي مدلها ميباشد. همچنين در اين پژوهش، از الگوريتم فراابتكاري كلوني زنبور به علت محدوديتهاي سختافزاري به عنوان الگوريتم جستوجو استفاده شده است. نتايج اين پژوهش بر روي مجموعه دادگانTEP نشان ميدهد كه عملكرد ترجمه ماشيني بهبود يافته است و اين بهبود با استفاده از معيارSacreBLEU ارزيابي شده است.
-
تاريخ ورود اطلاعات
1404/02/09
-
عنوان به انگليسي
Automated search for neural networks in the domain of natural language processing
-
تاريخ بهره برداري
7/14/2025 12:00:00 AM
-
دانشجوي وارد كننده اطلاعات
امين فتحي
-
چكيده به لاتين
The use of AI-based models is widely prevalent across various domains. However, constructing a high-quality AI model tailored for specific tasks heavily relies on human expertise, posing a barrier to its widespread application. This issue has underscored the importance of developing approaches and methodologies aimed at automating the search for neural networks with minimal human intervention. Initial efforts in this direction, relying on evolutionary algorithms and reinforcement learning, have been computationally intensive and time-consuming.
Innovations and research in automated search primarily focus on three main phases: defining the search space, determining search algorithms, and establishing evaluation methods. Moreover, automated search methods for neural networks have predominantly been applied in image processing tasks, while their application in natural language processing tasks such as machine translation, sentiment analysis, and text summarization remains underexplored.
This research aims to propose a method for automating architecture search in machine translation tasks, applicable to other natural language processing tasks as well. To achieve this, we require an appropriate search space to ultimately present models with efficient performance and scores suitable for machine translation (specifically from colloquial Persian to English) using a metaheuristic search algorithm. Such a model will effectively compete with large language models facing significant challenges in smaller, commercially viable tasks.
The presented method in this thesis demonstrates potential for use in other language processing tasks and is highlighted as an innovation in this field. The search space is designed using MT5 model architectures, encompassing 512 different configurations for models. Additionally, due to hardware limitations, the Bee Colony Optimization algorithm has been employed as the search algorithm. Results on the TEP dataset indicate improved machine translation performance, evaluated using the SacreBLEU metric.
-
كليدواژه هاي فارسي
جستوجوي شبكههاي عصبي , پردازش زبانهاي طبيعي , ترجمه ماشيني , يادگيري عميق
-
كليدواژه هاي لاتين
Neural architecture search , Natural language processing , Machine translation , Deep learning
-
Author
amin fathi
-
SuperVisor
dr. nasser mozayani
-
لينک به اين مدرک :