سلام! به عنوان تأمین کننده دروازه اتومبیل - رگرسیون ، اغلب در مورد چگونگی جمع شدن در برابر مدل های سنتی خودجوش سؤال می شود. در این وبلاگ ، من می خواهم تفاوت ها را به روشی که درک آن آسان است ، تجزیه کنم ، بنابراین بیایید درست شیرجه بزنیم.
مدل های سنتی خودجوش چیست؟
مدلهای سنتی خودجوش مدتهاست که وجود دارد ، و آنها بسیار خوب هستند - در دنیای آمار و تجزیه و تحلیل داده ها شناخته شده اند. به زبان ساده ، یک مدل خودجوش مقادیر آینده را بر اساس مقادیر گذشته از همان متغیر پیش بینی می کند. به عنوان مثال ، اگر به دنبال قیمت سهام هستید ، ممکن است از یک مدل خودکار استفاده کنید تا قیمت فردا را بر اساس قیمت چند روز گذشته پیش بینی کنید.
این مدل ها بر اساس این ایده است که در طول زمان الگوی یا رابطه خاصی در داده ها وجود دارد. آنها برای وزن گیری مقادیر گذشته از مجموعه ای از ضرایب استفاده می کنند و سپس آنها را جمع می کنند تا پیش بینی کنند. شکل کلی یک مدل خودکار از سفارش P (AR (P)) را می توان به صورت زیر نوشت:
$ y_t = c+\ varphi_1y_ {t - 1}+\ varphi_2y_ {t 2}+\ cdots+\ car_py_py_ {t - p}+\ epsilon_t $


در اینجا ، $ y_t $ مقدار متغیر در زمان t است ، c ثابت است ، $ \ varphi_i $ ضرایب خودکار است و $ \ epsilon_t $ اصطلاح خطا است.
یکی از مزایای بزرگ مدلهای سنتی خودجوش ، سادگی آنهاست. درک و اجرای آنها نسبتاً آسان است ، به خصوص برای مجموعه داده های کوچکتر. همچنین ، آنها به خوبی مورد مطالعه قرار گرفته اند ، و روشهای آماری زیادی برای تخمین ضرایب و ارزیابی عملکرد مدل در دسترس است.
با این حال ، آنها محدودیت هایی دارند. به عنوان مثال ، آنها فرض می کنند که رابطه بین مقادیر گذشته و آینده خطی است. در سناریوهای واقعی جهان ، داده ها اغلب دارای الگوهای غیر خطی هستند و مدل های سنتی اتورگرایی ممکن است نتوانند این پیچیدگی ها را به طور دقیق ضبط کنند. مسئله دیگر این است که آنها می توانند نسبت به Outliers در داده ها حساس باشند. یک مقدار شدید می تواند ضرایب را از بین ببرد و پیش بینی ها را کمتر قابل اطمینان کند.
دروازه خودکار - رگرسیون چیست؟
حالا ، بیایید در موردخودکار - دروازه رگرسیونبشر دروازه خودکار - رگرسیون یک رویکرد پیشرفته تر است که به برخی از کاستی های مدلهای سنتی خودجوش می پردازد. این طراحی شده است تا در استفاده از الگوهای داده پیچیده انعطاف پذیرتر و بهتر باشد.
ویژگی اصلی دروازه خودکار - توانایی آن در کنترل سازگار با جریان اطلاعات از گذشته است. به جای استفاده از ضرایب ثابت مانند در مدلهای سنتی خودجوش ، مکانیسم شیروانی دارد. این مکانیسم شیروانی تصمیم می گیرد که چه مقدار از اطلاعات گذشته باید در پیش بینی در هر مرحله از زمان استفاده شود.
تصور کنید که سعی در پیش بینی مصرف برق یک ساختمان دارید. در بعضی از روزها ، مصرف ممکن است بسیار تحت تأثیر استفاده روز قبل باشد ، در حالی که در روزهای دیگر ، عواملی مانند آب و هوا یا رویدادهای خاص ممکن است تأثیر بیشتری داشته باشد. دروازه خودکار - رگرسیون می تواند خود را تنظیم کند تا این موقعیت های مختلف را در نظر بگیرد.
تفاوت در ساختار مدل
بارزترین تفاوت بین دروازه رگرسیون خودکار و مدلهای سنتی خودجوش در ساختار آنها نهفته است. مدلهای سنتی خودجوش مجموعه ای از ضرایب دارند که در طی فرآیند آموزش تخمین زده می شوند. پس از تنظیم این ضرایب ، آنها در طول فرآیند پیش بینی یکسان هستند.
در مقابل ، دروازه رگرسیون اتومبیل دارای ساختار پویا است. مکانیسم دروازه به آن اجازه می دهد تا نحوه استفاده از اطلاعات گذشته را بر اساس وضعیت فعلی داده ها تغییر دهد. این بدان معنی است که می تواند با گذشت زمان با الگوهای و روندهای مختلف در داده ها سازگار شود.
به عنوان مثال ، در یک سری از داده های فروش ، یک مدل سنتی خودجوش ممکن است فرض کند که رابطه بین فروش گذشته و آینده همیشه یکسان است. اما دروازه خودکار - رگرسیون می تواند هنگام تغییرات ناگهانی ، مانند یک کمپین بازاریابی جدید یا اوج فصلی ، تشخیص دهد و پیش بینی خود را بر این اساس تنظیم کند.
تفاوت در رسیدگی به غیر خطی
همانطور که قبلاً نیز اشاره کردم ، مدلهای سنتی خودجوش روابط خطی بین ارزشهای گذشته و آینده را فرض می کنند. این یک اشکال اساسی در هنگام برخورد با داده های واقعی جهانی است ، که اغلب دارای الگوهای غیر خطی است.
از طرف دیگر دروازه اتومبیل - رگرسیون ، در کار با غیر خطی بسیار بهتر است. مکانیسم شیروانی می تواند تعامل پیچیده بین متغیرها را ضبط کند. بسته به روابط غیر خطی در داده ها ، می تواند یاد بگیرد که چه موقع به مقادیر خاص گذشته و چه موقع دیگران را نادیده بگیرد.
بیایید بگوییم که شما در حال تجزیه و تحلیل داده های جریان ترافیک هستید. الگوهای ترافیک می تواند بسیار غیر خطی باشد ، با عواملی مانند زمان روز ، تصادفات و بسته شدن جاده ها که همه بر جریان تأثیر می گذارد. یک مدل سنتی خودجوش ممکن است به دلیل این غیر خطی ها برای پیش بینی دقیق جریان ترافیک تلاش کند. اما دروازه خودکار - رگرسیون می تواند با این تغییرات سازگار شود و پیش بینی های دقیق تری انجام دهد.
تفاوت در استحکام با Outliers
Outliers می تواند یک سردرد واقعی برای مدلهای سنتی خودجوش باشد. از آنجا که این مدلها به ضرایب ثابت متکی هستند ، یک دور واحد می تواند تأثیر قابل توجهی در ضرایب تخمین زده شده و در نتیجه بر روی پیش بینی ها داشته باشد.
دروازه اتومبیل - رگرسیون نسبت به Outliers قوی تر است. مکانیسم شیروانی می تواند در هنگام حضور یک دور از دسترس را تشخیص دهد و تأثیر آن بر پیش بینی را کاهش دهد. این می تواند به صورت انتخابی انتخاب کند که از کدام مقادیر گذشته استفاده شود ، به طوری که Outlier کل پیش بینی را کاهش نمی دهد.
به عنوان مثال ، در یک مجموعه داده از قیمت سهام ، پرش ناگهانی و غیر منتظره قیمت به دلیل یک رویداد یک بار (مانند اعلامیه اصلی یک شرکت) می تواند یک چیز مهم باشد. یک مدل سنتی خودجوش ممکن است بیش از حد باشد - ضرایب آن را بر اساس این دور از ذهن تنظیم کند و منجر به پیش بینی های نادرست آینده شود. با این حال ، دروازه رگرسیون ، می تواند تأثیر این دورتر را به حداقل برساند و هنوز هم پیش بینی های معقول داشته باشد.
عملکرد در سناریوهای مختلف داده
هنگامی که نوبت به عملکرد می رسد ، دروازه خودکار - رگرسیون اغلب از مدل های سنتی خودجوش ، به ویژه در سناریوهای داده پیچیده پیشی می گیرد.
در مجموعه داده هایی با داده های فرکانس بالا ، مانند داده های کنه مالی یا داده های سنسور ، دروازه رگرسیون خودکار می تواند تغییرات سریع و الگوهای کوتاه مدت را به طور مؤثر ضبط کند. مدل های سنتی خودجوش ممکن است برای سازگاری با این تغییرات سریع بسیار کند باشد.
در داده های طولانی مدت - مدت زمان - سریال ، دروازه رگرسیون خودکار می تواند دقت خود را در مدت طولانی تر حفظ کند. این امر می تواند روند ، فصلی و سایر الگوهای طولانی مدت را بهتر از مدل های سنتی خودجوش کند ، که ممکن است با افزایش افق زمانی ، اثربخشی خود را از دست بدهند.
برنامه های کاربردی
تفاوت بین دروازه رگرسیون خودکار و مدلهای سنتی خودجوش نیز به برنامه های عملی مختلف تبدیل می شود.
مدلهای سنتی خودجوش هنوز در کارهای ساده پیش بینی شده که در آن داده ها دارای الگوهای خطی نسبتاً پایدار هستند ، مورد استفاده قرار می گیرند. به عنوان مثال ، از آنها می توان برای پیش بینی فروش ماهانه یک محصول چاه با الگوی تقاضای مداوم استفاده کرد.
از طرف دیگر ، دروازه رگرسیون ، برای برنامه های پیچیده و پویا مناسب تر است. این می تواند در مناطقی مانند مدیریت ریسک مالی مورد استفاده قرار گیرد ، جایی که پیش بینی دقیق روند بازار بسیار مهم است. همچنین در مدیریت شبکه هوشمند مفید است ، جایی که می تواند با در نظر گرفتن عوامل مختلفی مانند آب و هوا و رفتار مصرف کننده ، تقاضای برق را با دقت بیشتری پیش بینی کند.
چرا دروازه خودکار - رگرسیون را انتخاب کنید؟
اگر در بازار یک راه حل پیش بینی هستید ، در اینجا دلایلی وجود دارد که ممکن است بخواهید دروازه خودرو را در نظر بگیرید.
اول ، انعطاف پذیری آن. این می تواند با الگوهای مختلف داده و شرایط تغییر سازگار باشد ، به این معنی که احتمالاً در طیف گسترده ای از سناریوها پیش بینی های دقیقی دارید.
دوم ، استحکام آن. لازم نیست بیش از حد نگران این باشید که پیش بینی های خود را از بین ببرد.
سوم ، توانایی آن در رسیدگی به غیر خطی. در دنیای پیچیده امروز ، بیشتر داده ها دارای ویژگی های غیر خطی هستند و دروازه رگرسیون خودکار می تواند به طور مؤثر با آنها مقابله کند.
برای خرید و همکاری تماس بگیرید
اگر علاقه مند به کسب اطلاعات بیشتر در مورد Auto - Regressive Gate هستید یا قصد خرید آن را برای تجارت خود دارید ، دوست دارم با شما گپ بزنم. این که آیا شما در حال کار بر روی یک پروژه مقیاس کوچک و یا یک برنامه بزرگ سازمانی در مقیاس بزرگ هستید ، دروازه رگرسیون خودکار می تواند یک پیش بینی رقابتی در پیش بینی و تجزیه و تحلیل داده ها به شما ارائه دهد. فقط به این نتیجه برسید ، و ما می توانیم بحثی را در مورد چگونگی متناسب با نیازهای خاص شما شروع کنیم.
منابع
- Box ، Gep ، Jenkins ، GM ، & Reinsel ، GC (2015). تجزیه و تحلیل سری زمانی: پیش بینی و کنترل. ویلی
- Goodfellow ، I. ، Bengio ، Y. ، & Courville ، A. (2016). یادگیری عمیق مطبوعات MIT.
