مدت زمان تقریبی مطالعه: ۷ دقیقه

رگرسیون چیست ؟

در مقابلِ واژه‌ی رگرسیون (regression) می‌توانید یک جمله را در ذهن خود برای همیشه ثبت کنید و آن هم این است:«تعیین رابطه بین متغیر‌هایی که به یکدیگر مرتبط هستند و متغیرهایی که ارتباطی به یکدیگر ندارند!» به متغیر‌های گروه ِاول «پاسخ» و به گروه دوم «پیشگو» می‌گوییم. برای اینکه درک بهتری از این جمله و توضیح داشته باشید، پیشنهاد می‌کنیم حتما با ادامه‌ی این مطلب ِنادین سافت، همراه باشید.

رگرسیون
رگرسیون

رگرسیون چیست؟

در هوش مصنوعی، روش ریاضی پیدا کردن رابطه بین دو یا چند متغیر به رگرسیون مشهور است. این مفهوم به طور گسترده­ای در یادگیری ماشین برای پیش بینی رفتار یک متغیر بسته به مقدار متغیر دیگر استفاده می شود. بسیاری از عوامل در کنار یکدیگر، سازنده‌ یا عامل پیش آمدِ یک اتفاق، رویداد یا یک وضعیت هستند. مثلا تصادف‌هایی که داخل یک شهر رخ می‌دهد را تصور کنید. عوامل متعددی در ایجاد این وضعیت می‌توانند دخیل باشند؛ از جمله کیفیت بد یک راه یا مسیر، وضعیت ِنابسامان هوا (مثلا مه شدید) و نامناسب بودن ِکیفیت خودرو‌ها. تمامی این عوامل را کنار یکدیگر تصور کنید. این موارد، متغیرهای پیشگو هستند.

کاملا عادی و طبیعی است که این متغیر‌ها به صورت مستقیم بر روی متغیر ِپاسخ تاثیر می‌گذارند. پس رگرسیون را می‌توان یک معادله در نظر گرفت که به واسطه‌ی چند متغیر ِمستقل، پیشگوییِ یک متغیر وابسته را ارائه می‌کند.

با درک بهتر این مفهوم، حال می‌توان متغیر‌های مستقل را در دو حالت گسسته یا پیوسته در نظر گرفت. اما این در حالی است که متغیر‌های وابسته، همواره پیوسته هستند. نوع متغیر‌ها در یک تحقیق تعیین­ کننده‌ی نوع ِرگرسیون خواهند بود. این موضوع به هدف تحقیق یا پژوهشی که در حال ارائه‌ی آن هستیم، بستگی دارد.

رگرسیون
رگرسیون خطی جهت ترسیم بهترین منحنی جهت تفکیک بین داده­ها

رگرسیون خطی چیست؟

رگرسیون خطی (linear regression) را می‌توان ساده­ترین نوع این روش در نظر گرفت. رگرسیون خطی به دو دسته‌ی خطی ساده و خطی چندگانه تقسیم بندی می‌شود. این دو نوع، شامل یک ساختار ِکامل و وسیع هستند و نیازمندی‌های مربوط به گستره وسیعی از تحلیل‌ها را پاسخ می‌دهند.

این در حالی است که این مدل، برای کلیه‌ی پژوهش‌ها و مسائل کاربرد ندارد؛ به این خاطر که ارتباط بین متغیر‌های پاسخ و رگرسیونی به واسطه یک تابع غیر خطی ممکن می‌شود. مثلا حالتی را تصور کنید که متغیر وابسته تنها دو حالت داشته باشد؛ مثلا منفی یا مثبت باشد یا شامل وجود و عدم وجود باشد. در این حالت نمی‌توان از این نوع استفاده کرد و بهتر است که به سراغ رگرسیون لجستیک برویم.

انواع رگرسیون تنها به دو نوع خطی و لجستیک خلاصه نمی‌شود و می‌توان آنها را شامل موارد زیر دانست:

  • رشد
  • مرکب
  • توانی
  • معکوس
  • لگاریتمی
  • سهمی
  • منحنی s

و غیره.

کاربرد‌های رگرسیون خطی ساده و چندگانه از جهاتی با یکدیگر کاملا متفاوت است. در نوع خطی باید فقط یک متغیر داشته باشیم تحتِ عنوان ِ«پیش بینی کننده». اما در نوع چندگانه با توجه به ضرورت مسئله، بیش از یک متغیر ِپیش بینی کننده داریم.

رگرسیون
انواع رگرسیون

کاربردهای رگرسیون؟

تجزیه و تحلیل­ها در کسب و کار

 حالا که می‌دانیم کاربرد و نقش رگرسیون چیست، کاربرد آن چه ضرورتی برای یک کسب و کار دارد؟ در واقع، رگرسیون یک روش آماری مفید است که می‌تواند برای تعیین میزان تأثیر متغیرهای مستقل خاص بر متغیرهای وابسته – در یک سازمان یا یک کسب و کار –  استفاده شود. سناریوهای مربوط به تجزیه و تحلیل رگرسیون برای به دست آوردن بینش‌های تجاری ارزشمند بسیار مناسب عمل می‌کنند.

بنابراین دفعه بعد که در کسب و کار تان فرضیه ای پیش آمد تحت این عنوان که:

یک عامل – فرقی ندارد که قابل کنترل یا غیر قابل کنترل باشد – بر بخشی از کسب و کارتان تأثیر می‌گذارد. شما می‌توانید از یک تحلیل رگرسیونی برای تعیین اینکه باید به آن بها دهید یا خیر استفاده کنید؛ این تحلیل به شما این امکان را می‌دهد که تصمیمات تجاری آگاهانه تری بگیرید، منابع را به طور موثرتری کنترل کنید و در نهایت سود خود را افزایش دهید.

به طور کلی یادگیری ماشین

رگرسیون یک شیوه با ناظر است که جهت پیش­بینی مقادیر استفاده می­شود. هدف نهایی الگوریتم رگرسیون ترسیم بهترین خط یا منحنی بین داده­ها است. دو معیار اصلی که برای ارزیابی مدل رگرسیون آموزش دیده استفاده می­شود، واریانس و ارور هستند.

ما در به کارگیری این علوم در راستای اهداف و نیازهای شما در کنارتان هستیم.

منابع

[1] https://www.alchemer.com/resources/blog/regression-analysis/

[2] https://amarpishro.com/statistics-training/linear-regression

مقالات پیشنهادی