انواع الگوریتم های یادگیری ماشین
یادگیری ماشینی مطالعه الگوریتم ها و مدل های آماری مورد استفاده سیستم های کامپیوتری است که به جای استفاده از دستورالعمل های واضح، از الگوها و استنباط برای انجام وظایف استفاده می کنند. می توان گفت: یادگیری ماشینی علمی است، که موجب می شود رایانه ها بدون نیاز به یک برنامه سریع، در مورد یک موضوع خاص یاد بگیرند. در ادامه به بررسی موضوع انواع الگوریتم های یادگیری ماشین می پردازیم. جهت کسب اطلاعات بیشتر تا انتهای این مطالب همراه ما باشید:
طبقه بندی الگوریتم های یادگیری ماشین
به عنوان زیر مجموعه ای از هوش مصنوعی، الگوریتم های یادگیری ماشین یک مدل ریاضی بر اساس داده های نمونه و داده های آموزش، به منظور پیش بینی یا تصمیم گیری بدون برنامه ریزی آشکار ایجاد می کنند. یادگیری ماشینی در بسیاری از زمینه ها مانند مهندسی، کسب و کار، پزشکی و زبان شناسی کاربرد دارد. برای اینکه بتوانیم بهترین الگوریتم های موجود در یادگیری ماشین را بفهمیم، آن ها را تحت سع عنوان کلی طبقه بندی می کنیم که در بخش های بعدی هر یک از آن ها را مورد بررسی قرار می دهیم.
یادگیری نظارت شده (Supervised learning)
در این نوع یادگیری ما یک سری داده برچسب دار شده را در اختیار ماشین قرار می دهیم و ماشین به کمک این داده ها یک سری چیز ها را پیش بینی می کند. در این جا ما یک الگوریتمی را می سازیم که به بهترین وجه، داده ورودی را توصیف می کند و ارزش آن را تخمین می زند، یا اینکه آن را طبقه بندی می کند. به عنوان مثال شما در مورد یک کاری، از اپلیکیشن سوال می پرسید و اپلیکیشن پیش بینی می کند که شما در آن کار موفق خواهید شد یا خیر.
یا اینکه اینستاگرام عکس دوست شما را برچسب دار می کند و اگر دوست شما عکس جدیدی از خود بگذارد، سریع او را شناسایی می کند و به شما خبر می دهد. از این جهت به این یادگیری، نظارت شده می گویند، که انسان داده های برچسب دار شده را به ماشین می دهد تا به کمک آن ها بهتر بتواند کار کند. یعنی عملاً انسان روی ماشین نظارت دارد.
یادگیری بدون نظارت (Unsupervised Machine Learning)
همان طور که از نام الگوریتم یادگیری بدون نظارت پیدا است، نیازی به نظارت نیست. این به این معنی است که در یادگیری ماشین بدون نظارت، ماشین با استفاده از مجموعه داده بدون برچسب آموزش داده می شود و ماشین خروجی را بدون هیچ گونه نظارتی پیش بینی می کند. در این نوع یادگیری، مدل ها با داده هایی که نه طبقه بندی شده اند و نه برچسب گذاری شده اند، آموزش داده می شوند و مدل بدون هیچ نظارتی روی آن داده ها عمل می کند. هدف اصلی الگوریتم یادگیری بدون نظارت، دسته بندی و گروه بندی مجموعه داده های مرتب نشده طبق شباهت ها، تفاوت ها و الگوها است. به ماشین ها دستور داده می شود که الگوهای پنهان را از مجموعه داده های ورودی پیدا کنند.
پیشنهاد ما : معرفی ماژول های دوره تحول دیجیتال
یادگیری تقویتی (Reinforcement Learning)
در یادگیری تقویتی حوزه های بیشتری از هوش مصنوعی در بر گرفته می شود، که به ماشین ها اجازه می دهد برای رسیدن به اهداف خود با محیط پویای اطراف خود، در تعامل باشند. این امر، باعث می شود که ماشین ها و عامل های نرم افزاری بتوانند رفتار ایده آل را در یک زمینه خاص ارزیابی کنند. با کمک این بازخورد پاداش، عامل ها می توانند رفتار و بهبود آن را در دراز مدت یاد بگیرند. این پاداش باز خورده ساده به عنوان یک سیگنال تقویتی شناخته می شود. عامل در محیط جهت انجام اقداماتی که مبتنی بر وضعیت فعلی هستند، مورد نیاز است.
یادگیری تقویتی با یادگیری نظارت شده تفاوت دارد. به این جهت که داده آموزشی دارای نگاشت خروجی است. به طوری که مدل، قادر به یادگیری پاسخ صحیح می باشد. در حالی که در مورد یادگیری تقویتی هیچ کلید پاسخی وجود ندارد که هنگام انجام کار خاص به عامل ارائه شود. زمانی که هیچ مجموعه داده آموزشی وجود ندارد، از تجربه خودش یاد می گیرد.
معرفی الگوریتم های یادگیری ماشین
در این بخش به برخی از مهم ترین و بهترین الگوریتم های یادگیری ماشین اشاره می کنیم:
۱.الگوریتم جنگل تصادفی
جنگل تصادفی یک الگوریتم تحت نظارت است، که هم برای طبقه بندی و هم برای رگرسیون استفاده می شود. با این حال بیش تر برای مشکلات طبقه بندی مورد استفاده قرار می گیرد. همانطور که می دانیم یک جنگل از درختان، تشکیل شده است و تعداد بیش تر درختان به معنای این است که جنگل مقاومت بیشتری دارد. به همین ترتیب الگوریتم جنگل تصادفی، درختان تصمیم گیری را با استفاده از نمونه های داده ایجاد می کند و در نهایت بهترین راه حل را با استفاده از رای گیری انتخاب می کند.
۲. الگوریتم درختان تصمیم گیری
درختان تصمیم گیری پیش بینی و کلاس بندی را آسان می کنند. با استفاده از درخت های تصمیم گیری فرد می تواند با یک مجموعه داده ورودی مشخص تصمیم گیری کند. تصمیم گیری رو می توانیم با این مثال درک کنیم:
فرض کنید که شما می خواهید برای خرید یک شامپو به بازار بروید. ابتدا بررسی می کنید که آیا به شامپو نیاز دارید یا خیر؟ اگر شامپو تمام کرده باشید، مجبور هستید که به بازار بروید و آن را خریداری کنید. علاوه بر این موضوع، شما به بیرون نگاه می کنید و آب و هوا را ارزیابی می کنید. اگر باران ببارد شما به بازار نخواهید رفت. اما اگر اینطور نباشد و هوا آفتابی باشد، شما به بازار می روید. طبق همین اصول ما می توانیم یک درخت سلسله مراتبی بسازیم تا خروجی خود را از طریق چند تصمیم گیری بدست آوریم. برای ساخت یک درخت تصمیم دو روش القا و روش هرس وجود دارد. در روش القا، ما درخت تصمیم گیری را می سازیم و در روش هرس، درخت را با حذف چندین پیچیدگی ساده می کنیم.
۳. الگوریتم های کاهش ابعاد (Dimensional Reduction Algorithms)
برخی از دیتاست ها ممکن است متغیر های زیادی داشته باشند. این موضوع باعث سخت تر شدن کار با آن ها می شود. امروزه اطلاعات جمع آوری شده در سیستم ها به خاطر وجود منابع بیش از اندازه در سطح بسیار درونی رخ می دهند. در این موارد مجموعه داده ها ممکن است شامل هزاران متغیر باشند و بیش تر آن ها نیز غیر ضروری هستند. در این موارد، تقریباً شناسایی متغیرهایی که بیش ترین تاثیر در پیش بینی ما را دارند، غیر ممکن است. الگوریتم های کاهش اندازه، در این شرایط استفاده می شوند. با استفاده از الگوریتم های دیگر مثل جنگل تصادفی و درخت تصمیم، برای شناسایی مهم ترین متغیر ها اقدام می کنیم.
۴. الگوریتم رگرسیون خطی
برای درک عملکرد الگوریتم رگرسیون خطی، به این فکر کنید که چطور می توانید چوب های تصادفی را به ترتیب وزن آن ها مرتب کنید. شما قادر نیستید که هر چوب را وزن کنید. شما فقط می توانید وزن آن ها را با نگاه کردن به ارتفاع و قطر چوب ها، حدس بزنید و با استفاده از ترکیبی از این پارامتر های قابل مشاهده آن ها را مرتب کنید. این مسئله، عملکرد رگرسیون خطی در یادگیری ماشین است. به این نکته باید توجه کنید که وزن، متغیری کمی است؛ بنابراین، متغیر وابسته در رگرسیون خطی، کمی است.
۵. الگوریتم رگرسیون لجستیک
الگوریتم رگرسیون لجستیک، یک تکنیک آماری جهت نشان دادن تاثیر متغیر های کمی و کیفی بر متغیر وابسته دو وجهی یا همان دو طبقه ای است. تحلیل رگرسیون لجستیک مانند تحلیل رگرسیون خطی است، اما با این تفاوت که در رگرسیون خطی متغیر وابسته، متغیری کمی است. اما در رگرسیون لجستیک، متغیر وابسته، یک متغیر کیفی و دو وجهی می باشد. یعنی نمی توان آن را با عدد بیان کرد.
۶. الگوریتم های خوشه بندی
خوشه بندی، مانند رگرسیون، کلاس مسئله و کلاس روش ها را توصیف می کند. روش های خوشه بندی به طور معمول توسط رویکرد های مدل سازی، به عنوان مثال مبتنی بر مرکز و سلسله مراتب سازمانی، سازماندهی می شوند. همه روش ها مربوط به استفاده از ساختار های ذاتی، در داده ها برای سازماندهی بهتر در گروه های دارای حداکثر اشتراک هستند.
۷. الگوریتم استخراج قواعد انجمنی
یادگیری قوانین انجمنی یک تکنیک یادگیری بدون نظارت است،که روابط جالبی را بین متغیرها و فیلدها در یک مجموعه داده بزرگ/ دیتاست پیدا می کند. هدف اصلی این الگوریتم یادگیری ماشین، یافتن وابستگی یک آیتم داده به آیتم داده دیگر و ترسیم آن متغیر ها بر اساس آن است، تا بتواند حداکثر سود را ایجاد کند. این الگوریتم اصولاً در تحلیل سبد بازار کاربرد دارد.
برخی از الگوریتم های رایج یادگیری قوانین انجمنی عبارتند از: Apriori Algorithm، Eclat، FP-growth.
بیشتر بخوانید: هوش مصنوعی در موتورهای جستجو
کلام آخر
در این مقاله ما تعدادی از الگوریتم های یادگیری ماشین که در صنعت علوم داده ضروری هستند را معرفی کردیم. شما می توانید با یادگیری این الگوریتم ها و فهم ساختار آن ها، مسائل یادگیری ماشین را حل کنید. هر چقدر بر روی این الگوریتم ها مسلط تر باشید، توانایی حل مسائل پیچیده تر را نیز خواهید داشت. این الگوریتم ها ترکیبی از الگوریتم های یادگیری نظارت شده و بدون نظارت هستند که برای پیاده سازی مدل های یادگیری ماشین کاملا ضرورت دارند. امید وارم این مطلب برای شما مفید بوده باشد.
دیدگاهتان را بنویسید