• شماره ركورد
    33314
  • پديد آورنده

    امين فتحي

  • عنوان
    جستوجوي خودكار شبكه هاي عصبي در حوزه پردازش زبانه اي طبيعي
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    هوش مصنوعي و رباتكيز
  • سال تحصيل
    1400
  • تاريخ دفاع
    1403/4/24
  • استاد راهنما
    دكتر ناصر مزيني
  • استاد مشاور
    نداشتم
  • دانشكده
    مهندسي كامپيوتر
  • چكيده
    استفاده از مدل‌هاي مبتني بر هوش مصنوعي به صورت گسترده‌اي در زمينه‌هاي مختلفي در جريان است. با اين حال، ساخت يك مدل هوش مصنوعي با كيفيت بالا براي يك كار خاص، به شدت به تخصص انساني متكي است و مانع از كاربرد گسترده آن مي‌شود. مسئله‌ي نام برده منجر به اهميت پيدا كردن طراحي روش‌ها و رويكردهايي شده است كه هدف آن‌ها جست‌وجوي خودكار شبكه‌هاي عصبي با كمترين ميزان دخالت انسان شده است. اولين تلاش‌ها براي اين امر كه مبتني بر الگوريتم‌هاي تكاملي و يادگيري تقويتي بودند، علاوه بر زمان‌بر بودن به توان محاسباتي بسيار بالا نيز نياز داشتند. نوآوري‌ها و پژوهش‌هاي انجام شده در جست‌وجوي خودكار غالباً در سه فاز اصلي تعيين فضاي جست‌وجو، تعيين الگوريتم جست‌وجو و تعيين روش‌هاي ارزيابي بوده است. علاوه بر اين روش‌هاي جست‌وجوي خودكار شبكه‌هاي عصبي بيشتر در وظايف پردازش تصاوير به كار گرفته شده‌اند و خلأ استفاده از اين روش‌ها در وظايف مرتبط با پردازش زبان‌هاي طبيعي مشهود است. وظايفي نظير ترجمه زبان، تحليل احساسات و خلاصه‌سازي متن. در اين پژوهش به دنبال ارائه‌ي روشي براي جست‌وجوي معماري خودكار در وظيفه ترجمه ماشيني هستيم كه قابليت اعمال در ساير وظايف پردازش زبان را نيز داشته باشد. براي اين امر نيازمند يك فضاي جست‌وجوي مناسب هستيم تا نهايتاً با استفاده از يك الگوريتم جست‌وجوي فراابتكاري مدل‌هايي با كارايي و امتياز مناسب براي وظيفه‌ي ترجمه ماشيني (از فارسي محاوره‌اي به انگليسي) ارائه دهيم، چنين مدلي قادر خواهد بود كه در وظايف كوچك و قابل تجاري‌سازي، به خوبي با مدل‌هاي زباني بزرگ كه با چالش‌هايي همراه هستند، رقابت كند. روش ارائه شده در اين پايان‌نامه قابليت استفاده در ساير وظايف پردازش زبان را دارا است و به عنوان يك نوآوري در اين زمينه مطرح مي‌شود. فضاي جست‌وجويي به كمك معماري مدل‌هاي MT5 طراحي شده است كه شامل 512 معماري مختلف براي مدل‌ها مي‌باشد. همچنين در اين پژوهش، از الگوريتم فراابتكاري كلوني زنبور به علت محدوديت‌هاي سخت‌افزاري به عنوان الگوريتم جست‌وجو استفاده شده است. نتايج اين پژوهش بر روي مجموعه دادگانTEP نشان مي‌دهد كه عملكرد ترجمه ماشيني بهبود يافته است و اين بهبود با استفاده از معيارSacreBLEU ارزيابي شده است.
  • تاريخ ورود اطلاعات
    1404/02/09
  • عنوان به انگليسي
    Automated search for neural networks in the domain of natural language processing
  • تاريخ بهره برداري
    7/14/2025 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    امين فتحي

  • چكيده به لاتين
    The use of AI-based models is widely preva‎lent across various domains. However, constructing a high-quality AI model tailored for specific tasks heavily relies on human expertise, posing a barrier to its widespread application. This issue has underscored the importance of developing approaches and methodologies aimed at automating the search for neural networks with minimal human intervention. Initial efforts in this direction, relying on evolutionary algorithms and reinforcement learning, have been computationally intensive and time-consuming. Innovations and research in automated search primarily focus on three main phases: defining the search space, determining search algorithms, and establishing eva‎luation methods. Moreover, automated search methods for neural networks have predominantly been applied in image processing tasks, while their application in natural language processing tasks such as machine translation, sentiment analysis, and text summarization remains underexplored. This research aims to propose a method for automating architecture search in machine translation tasks, applicable to other natural language processing tasks as well. To achieve this, we require an appropriate search space to ultimately present models with efficient performance and scores suitable for machine translation (specifically from colloquial Persian to English) using a metaheuristic search algorithm. Such a model will effectively compete with large language models facing significant challenges in smaller, commercially viable tasks. The presented method in this thesis demonstrates potential for use in other language processing tasks and is highlighted as an innovation in this field. The search space is designed using MT5 model architectures, encompassing 512 different configurations for models. Additionally, due to hardware limitations, the Bee Colony Optimization algorithm has been employed as the search algorithm. Results on the TEP dataset indicate improved machine translation performance, eva‎luated using the SacreBLEU metric.
  • كليدواژه هاي فارسي
    جست‌وجوي شبكه‌هاي عصبي , پردازش زبان‌هاي طبيعي , ترجمه ماشيني , يادگيري عميق
  • كليدواژه هاي لاتين
    Neural architecture search , Natural language processing , Machine translation , Deep learning
  • Author
    amin fathi
  • SuperVisor
    dr. nasser mozayani