• شماره ركورد
    26937
  • پديد آورنده

    صحابه رجواني

  • عنوان
    پيش بيني فروش در كسب وكار خرده فروشي با استفاده از يادگيري ماشين (مطالعه موردي:فروشگاه هاي زنجيره اي)
  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي فناوري اطلاعات (IT)- تجارت الكترونيكي
  • سال تحصيل
    1397
  • تاريخ دفاع
    1400/12/26
  • استاد راهنما
    مهدي غضنفري
  • استاد مشاور
    محمدرضا رسولي
  • دانشكده
    مهندسي صنايع
  • چكيده
    پيش بيني فروش، بخش مهمي از برنامه‌ ريزي و استراتژي كسب و كار است و به دليل اهميت آن در صنعت خرده فروشي و نظام توليدي كشور و همچنين عدم وجود روش هاي مناسب يا مدلي راهبردي در خصوص اين پديده، پردازش به آن از ضرورت انجام تحقيق مي باشد؛ پيش بيني فروش موجب بهبود عملكرد كسب و كار ها مي گردد و در نتيجه مي توان با ارائه يك مدل راهبردي در پيش بيني فروش، موجب تامين موجودي كالا و در نتيجه افزايش رضايت مشتريان گرديد. با مرور ادبيات و ارزيابي مدل هاي يادگيري ماشين در حوزه پيش بيني فروش، نشان داده شده است كه روش هاي درختي بر روي داده هاي دنياي واقعي به خوبي عمل كرده اند. لذا مساله ي كه اين تحقيق روي آن متمركز شده، اين است كه مناسب ترين الگوريتم از ميان دو الگوريتم، بهگشته گراديان سبك و بهگشته گراديان نهايي براي پيش¬بيني فروش انتخاب شود در نهايت گام به گام در اين پژوهش به اهميت پيش- ردازش داده ها و تحليل آنها، در پيش بيني فروش با مدل هاي يادگيري ماشين اشاره مي گردد. جامعۀ آماري در اين پژوهش، داده هاي يك شركت در صنعت خرده فروشي مي باشد كه شامل 40 فروشگاه است و يك فروشگاه به عنوان نمونه آماري با روش تصادفي و در دسترس انتخاب شده است. مجموعه داده، شامل فروش روزانه كالاها از 30/9/1396 تا 7/10/1399 در دو گروه مواد غذايي و بهداشتي مي باشد. بعد از تبديل داده ها به يك سري زماني، تا تاريخ 29/12/1398 به عنوان آموزش و هفت روز انتهاي آن براي آزمون استفاده شده است. جهت پاسخ به سوالات در گام نخست به پيش پردازش داده ها پرداخته شد كه در ابتدا با روش LOF داده¬هاي پرت، شناسايي و سپس مقادير آن ها با روش KNN جايگزين شده اند و سپس داده ها به مدل بازگشتي بهگشته گراديان سبك و گراديان نهايي داده شدند و در اين دو مدل تابع هزينه پواسون و توييدي مورد ارزيابي قرار گرفتند و در نهايت دو مدل انتخابي در دو گروه با MAE و RMSE ارزيابي گشت. نتايج حاكي از آن بوده كه الگوريتم گراديان سبك در گروه موادغذايي با تابع هزينه توييدي و در گروه بهداشتي با تابع هزينه پواسون با ميانگين قدر مطلق خطا و ريشه مربعات 0.30 ،4.8، 0.16و1.47 به عنوان الگوريتم بهينه به عنوان پيش بيني فروش (تفاضا) براي داده¬ها انتخاب شده است. همسو با نتايج به دست آمده مي توان انتظار داشت با در نظر گفتن ويژگي هاي پر كاربرد(بحراني) و اهميت به تابع هزينه(توزيع داده ها) در مدل بهگشته گراديان سبك، در مقابل مدل بهگشته گراديان نهايي، به خطايي كمتري در پيش بيني فروش در كسب وكار خرده فروشي دست يابيم. علاوه بر آن انتظار داريم كارايي اين روش در فروشگاه¬هاي زنجيرها ي بيشتر از روش هاي سنتي باشد.
  • تاريخ ورود اطلاعات
    1401/06/16
  • عنوان به انگليسي
    Sales Forecasting in the Retail Business Use Machine Learning (Case Study: Chain Stores)
  • تاريخ بهره برداري
    3/17/2023 12:00:00 AM
  • دانشجوي وارد كننده اطلاعات

    صحابه رجواني

  • چكيده به لاتين
    Sales forecasting is an important part of business planning and strategy. It is important in the retail industry and the country's production system due to the lack of appropriate methods or strategic models for this phenomenon and the need for research. To arrive at the research model, by reviewing the literature and eva‎luating machine learning models, it has been shown that tree methods have worked well on real-world data. Sales forecasting improves the performance of businesses and as a result, by providing a strategic model in sales forecasting, can provide inventory and thus increase customer satisfaction. Therefore, the key issue that we will focus on in this research is the most appropriate algorithm among the two algorithms, Light gradient boosting(LGB) and extreme gradient boosting(XGB) to solve the sales forecast problem. The importance of data preprocessing and analysis in sales forecasting with machine learning models is pointed out in this research. In this study, the statistical population is the data of a company in the retail industry that includes 40 stores and one store has been selected as a statistical sample by random and available methods. The data set includes daily sales of goods and to answer the questions, in the first step, the data were pre-processed, which were first identified by the LOF method of discarded data, and then their values were replaced by the KNN method; Then the properties are considered based on the data set and in the next step, the data were given to the recursive model of Light gradient boosting(LGB) and extreme gradient boosting(XGB) and in these two models the Poisson and Tweedie cost function were eva‎luated. selected data collection from 21/12/2017 to 27/12/2020 data of a store and includes two departments of food and cosmetics. After converting the data into a time series, 19/3/2020 was used as training data, the last seven days were used for testing data, and finally, two selected models were eva‎luated in two departments with MAE and RMSE. The results showed the LGB in the food department with the Tweedie cost function and the cosmetics department with the Poisson cost function with the mean absolute error and the Root mean squared error of 0.30, 4.8, 0.16 1.47 choose as the optimal algorithm. Consistent with the results obtained, we can expect to achieve a lower error in the sales forecast in the retail business in LGB, versus XGB. In addition, we expect the performance of this technique to be more efficient in the chain stores than in traditional methods.
  • Author
    Sahabe Rejvani
  • SuperVisor
    Dr. Ghazanfari