بهترین پیتزای تهران
معرفی مفاهیم اولیه
(1) مدلهای پیشبینی
- مدلهای پیشبینی بر دو قسمند:
- مدلهای قابل توضیح (explainable models): در این مدلها میتوانیم روند تصمیمگیری الگوریتم را که منجر به پیشبینی میشود ببینیم. تمام جزییات نیز قابل مشاهدهاند.
- مدلهای غیرقابل توضیح (unexplainable models ): این مدلها به مثابه یک جعبه سیاه (black box) عمل میکنند. رکوردها و دیتاهای قبلی به آنها داده میشود و پس از محاسبات و اعمال ریاضی، نتیجه حاصل میگردد. در این حالت ما قادر به مشاهده مسیر طی شده برای رسیدن به نتیجه نهایی نیستیم.
(2) روش SEFR
- این روش امتیاز دهی بخشی از دیتا را میگیرد و موضوع را بر اساس تحلیل دیتای قبلی، پیشبینی میکند. اصطلاحا به آن الگوریتم Classification نیز میگویند. این الگوریتم در اصل برای پیشبینی دیتای مبتنی بر تکست ساخته شده اما به حوزههای دیگر مانند تصویر یا موارد پزشکی نیز گسترش یافته است. روش SEFR در این زمینهها هم توانسته موفق عمل کند اما کماکان بیشترین دقت و بهترین عملکرد را در حوزه پیشبینی تکست داراست.
- برای تست این روش میتوانیم 90% از دیتای اسنپ فود را به الگوریتم بدهیم و از آن بخواهیم10 %باقی مانده را پیشبینی کند. در این حالت میتوانیم امتیازهای داده شده را با دیتای قبلی قیاس کرده و صحت حدس الگوریتم را بسنجیم.
(3) Topic Modeling
- مدلسازی موضوعی مشخص میکند در هر دیتا چه مفاهیمی مطرح شده. متن به الگوریتم داده میشود و الگوریتم به صورت بدون نظارت (unsupervised) چند مفهوم را استخراج میکند.
روش کار
- از تجمیع روش SEFR و مدلسازی موضوعی میتوانیم تشخیص دهیم کدام کلمات و مفاهیم در نظرات مردمی بیشترین تاثیر مثبت و بیشترین تاثیر منفی را بر تصمیم نهایی مدل گذاشتهاند. از آن جا که روش SEFR از انواع مدلهای explainable یا همان قابل توضیح است میتوان روند رسیدن به نتیجه را مشاهده کرد. . به عبارتی اگر الگوریتم یک کامنت را منفی تلقی کند، میتوانیم بفهمیم کدام مفهوم امتیاز منفی را برای این کامنت ایجاد کرده است.
- برای مثال با مرور نظرات مردمی برای یک رستوران درمییابیم که کلمه سلام در یک کامنت اعتبار چندانی ندارد و امتیاز صفر میگیرد. یا کلمه تاخیر باعث گرفتن بیشترین امتیاز منفی در کامنتها شده است.
- *نکته: لزوما تاثیرگذارترین کلمات پرتکرارترین آنها نیستند.
هدف پژوهش
- این پژوهش به منظور رتبهبندی پیتزا در رستورانهای زنجیرهای معروف و با استفاده از پیشپردازش متون، مدلسازی موضوعی، و امتیازدهی روش SEFR انجام شده است. مفاهیم کلیدی در مدلسازی دستهبندی با SEFR، امتیازی از 1- تا 1+ گرفتند، و مثبتترین و منفیترین مفاهیم تاثیرگذار روی رضایت مشتریان برای هر رستوران استخراج شدند.
نتیجه پژوهش
- با محاسبه میانگین امتیاز کاربرها توی اسنپ فود میشه فهمید تو هر منطقه بهترین و بدترین پیتزای منطقه مال کدوم رستورانه.
- با همین روش میشه رتبه بندی پیتزا در رستوران های زنجیره ای معروف رو به دست آورد.
- شیلا
- پرپروک
- پلاک
- باگت
- تله پیتزا
- پیتزا سیب
- باروژ
- اژدر زاپاتا
- پیانو
- پیتزا هات
- برگرلند
- آواچی
- عطاویچ
- هایدا
- هفت چنار
*نکته: در این رتبهبندی تنها معیار امتیازهای اپلیکیشن اسنپ فود است.
در ادامه به بررسی نظرات مردمی و تاثیر آن در این رتبهبندی میپردازیم:
روش تحقیق
- از بین بیش از یک میلیون کامنت مردمی ثبت شده در فاصله بهمن 94 الی فروردین 1400 تنها کامنتهای مربوط به سفارشهای پیتزا از رستورانهای زنجیرهای دارای حداقل 5 شعبه، از سایرین تفکیک شدند. بر اساس امتیازی که هرکاربر بالای کامنت خود ثبت نموده، برای 54 هزار کلمه که در کامنتهای مردمی استفاده شده بود، نمره مثبت و منفی تعیین کردیم. برای مثال به جز کلمات "عالی"، "خوب"و "خوشمزه" کلماتی مانند "حلالش" و "پرچم" نیز نشاندهنده رضایت مشتری هستند. از سویی دیگر به جز کلماتی مانند "بدمزه"، "افتضاح" و "سرد"، کلماتی همچون "اونقدرام" و "آبرو" گویای نارضایتی مشتری هستند.
بر اساس این تحلیل، مفاهیم کلیدی که باعث ایجاد بیشترین رضایت یا نارضایتی در هر برند شدهاند را یافتهایم:
شیلا
- مثبت: مزه خوب، کیفیت غذا، تحویل سریع، تنوع منو، رفتار پرسنل
- منفی: استفاده از سویا، خیس بودن، درخواست وجه از سوی پیک، کارتن غذا، مانده بودن غذا
پرپروک
- مثبت: مزه خوب، سبک بودن، مودب بودن پرسنل، بهداشت بالا، سالم بودن مواد
- منفی: سرد بودن، جابجایی نامناسب، له شدن غذا داخل بسته، ماسیده بودن، قیمت بالا
باگت
- مثبت: لذیذ بودن، استفاده خوب از سیر، استفاده خوب از قارچ، سرویس خوب، تحویل سریع
- منفی: شباهت نداشتن به عکس، افت کیفیت، کیفیت خمیر پیتزا، ماسیده بودن، کیفیت سوسیس
سیب 360
- مثبت: مودب بودن پرسنل، استفاده از بیکن، تحویل سریع، سبک بودن، داغ رسیدن غذا
- منفی: بیمزه بودن غذا، شباهت نداشتن به عکس، افت کیفیت، کیفیت خمیر، بوی غذا
باروژ
- مثبت: استفاده مناسب از روغن، تحویل سریع، سس چیلی، رفتار پرسنل، تندی مناسب غذا
- منفی: کیفیت گوجه، کیفیت خمیر پیتزا، کیفیت پیاز، ماسیده بودن غذا، نامرغوب بودن مواد
پیتزا هات
- مثبت: مزه خوب، رفتار پرسنل، پرملات بودن، داغ بودن، ترد بودن
- منفی: ماسیده بودن، نامرغوب بودن، سرد بودن، مانده بودن مواد، کیفیت خمیر پیتزا
برگرلند
- مثبت: لذیذ بودن، متفاوت بودن غذا، استفاده خوب از سس، بهویژه آلفردو، کیفیت خوب زیتون
- منفی: ماسیده بودن، خشک بودن، کیفیت خمیر پیتزا، سرد بودن، نپخته بودن
آواچی
- مثبت: پخته بودن غذا، تحویل سریع، ترد بودن غذا، کیفیت خمیر پیتزا
- منفی: مانده بودن، سوخته بودن، کیفیت پنیر پیتزا، کیفیت مواد اولیه، خیس بودن، چرب بودن
عطاویچ
- مثبت: مودب بودن پرسنل، تحویل سریع، پرملات بودن، استفاده مناسب از نمک، استفاده از آویشن
- منفی: کیفیت پنیر پیتزا، کیفیت پپرونی، سرد بودن، استفاده از مواد نامرغوب، استفاده از کدو
هایدا
- مثبت: تحویل سریع، ترد بودن غذا، کیفیت پپرونی، استفاده از آویشن، کیفیت پنیر
- منفی: بدمزه بودن، از دهن افتاده بودن، بیات بودن، کهنه بودن، کیفیت کالباس