Machine Learning چیست؟
Machine Learning شاخهای از هوش مصنوعی (AI) و علوم کامپیوتر است که با استفاده از دادهها و الگوریتمها برای تقلید به روشی که انسانها یاد میگیرند تمرکز دارد و به تدریج دقت آن را بهبود میبخشد.
IBM سابقه ای غنی در زمینه Machine Learning دارد. یکی از آنها، آرتور ساموئل، به دلیل ابداع اصطلاح “Machine Learning” با تحقیقات خود در مورد بازی Checkers اعتبار دارد. رابرت نیلی، استاد خودخوانده Chrckers، این بازی را در سال 1962 روی یک کامپیوتر IBM 7094 انجام داد و به رایانه باخت. در مقایسه با آنچه امروزه می توان انجام داد، این شاهکار پیش پا افتاده به نظر می رسد، اما نقطه عطفی بزرگ در زمینه هوش مصنوعی به حساب می آید.
طی چند دهه گذشته، پیشرفت تکنولوژیکی در زمینه ذخیرهسازی و قدرت پردازش، برخی از محصولات نوآورانه مبتنی بر MachineLearning، مانند موتور توصیه نتفلیکس و خودروهای خودران را توانمند ساخته است.
Machine Learning جزء مهمی از حوزه رو به رشد علم داده است. از طریق استفاده از روش های آماری، الگوریتم ها برای طبقه بندی یا پیش بینی و کشف بینش های کلیدی در پروژه های دیتا کاوی آموزش داده می شوند. این بینشها متعاقباً تصمیمگیری را در برنامهها و کسبوکارها هدایت میکنند و به طور ایدهآل بر معیارهای رشد کلیدی تأثیر میگذارند. با ادامه گسترش و رشد دیتا های بزرگ، تقاضای بازار برای دانشمندان دیتا افزایش می یابد. از آنها خواسته می شود تا به شناسایی مرتبط ترین سؤالات تجاری و دیتاها بپردازند و به آنها کمک کنند.
الگوریتمهای Machine Learning معمولاً با استفاده از چارچوبهایی ایجاد میشوند که توسعه راهحل را سریعتر میکنند، مانند TensorFlow و PyTorch.
Machine Learning vs. Deep Learning vs. Neural Networks
از آنجایی که Deep Learning و Machine Learning به جای یکدیگر مورد استفاده قرار می گیرند،توجه به تفاوت های ظریف بین این دو ارزش دارد. Machine Learning، Deep Learning و Neural Networks همگی زیر شاخه های هوش مصنوعی هستند. با این حال، Neural Networks در واقع زیر شاخه ای از Machine Learning هستند و Deep Learning زیر شاخه ای از شبکه های Neural Networks هستند.
تفاوت Deep Learning و Machine Learning در نحوه یادگیری هر الگوریتم است. Machine Learning “عمیق” میتواند از مجموعه دادههای برچسبگذاریشده، که به عنوان یادگیری نظارتشده نیز شناخته میشود، برای اطلاعرسانی الگوریتم خود استفاده کند، اما لزوماً به یک مجموعه داده برچسبدار نیاز ندارد. Deep Learning میتواند دادههای بدون ساختار را به شکل خام (مثلاً متن یا تصاویر) وارد کند و میتواند به طور خودکار مجموعهای از ویژگیهایی را تعیین کند که دستههای مختلف دادهها را از یکدیگر متمایز میکند. این امر برخی از مداخلات انسانی مورد نیاز را حذف می کند و امکان استفاده از مجموعه داده های بزرگتر را فراهم می کند. شما می توانید یادگیری عمیق را به عنوان “یادگیری ماشینی مقیاس پذیر” در نظر بگیرید.
یادگیری ماشین کلاسیک یا “غیر عمیق” بیشتر به مداخله انسان برای یادگیری وابسته است. متخصصان انسانی مجموعه ای از ویژگی ها را برای درک تفاوت بین ورودی های داده تعیین می کنند که معمولاً برای یادگیری به داده های ساختاریافته بیشتری نیاز دارند.
بیشتر بخوانید: انواع الگوریتم های یادگیری ماشین
شبکههای عصبی یا شبکههای عصبی مصنوعی (ANN) از لایههای گرهای تشکیل شدهاند که شامل یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی است. هر گره یا نورون مصنوعی به دیگری متصل می شود و دارای وزن و آستانه مرتبط است. اگر خروجی هر گره فردی بالاتر از مقدار آستانه مشخص شده باشد، آن گره فعال می شود و داده ها را به لایه بعدی شبکه ارسال می کند. در غیر این صورت، هیچ داده ای توسط آن گره به لایه بعدی شبکه منتقل نمی شود. “عمیق” در یادگیری عمیق فقط به تعداد لایه های یک شبکه عصبی اشاره دارد. یک شبکه عصبی که از بیش از سه لایه تشکیل شده است؛ که شامل ورودی و خروجی می شود و میتواند یک الگوریتم یادگیری عمیق یا یک شبکه عصبی عمیق در نظر گرفته شود. یک شبکه عصبی که فقط سه لایه دارد، فقط یک شبکه عصبی اولیه است.
Deep Learning و شبکههای عصبی باعث تسریع پیشرفت در زمینههایی مانند بینایی رایانه، پردازش زبان طبیعی و تشخیص گفتار میشوند.
Machine Learning چگونه کار میکند.
UC Berkeley سیستم یادگیری یک الگوریتم یادگیری ماشین را به سه بخش اصلی تقسیم می کند.
1. فرآیند تصمیم گیری: به طور کلی، الگوریتم های یادگیری ماشین برای پیش بینی یا طبقه بندی استفاده می شود. بر اساس برخی از داده های ورودی، که می توانند دارای برچسب یا بدون برچسب باشند، الگوریتم شما تخمینی در مورد یک الگو در دادهها ایجاد میکند.
2. ارورِ یک تابع: ارورِ یک تابع پیش بینی مدل را ارزیابی میکند. اگر نمونه های شناخته شده وجود داشته باشند، ارورِ یک تابع میتواند مقایسه ای برای ارزیابی دقت مدل انجام دهد.
3. فرآیند بهینه سازیِ یک مدل: اگر مدل بتواند بهتر با نقاط داده در مجموعه آموزشی تناسب داشته باشد، وزنها برای کاهش اختلاف بین مثال شناخته شده و برآورد مدل تنظیم میشوند. الگوریتم این فرآیند “ارزیابی و بهینه سازی” را تکرار می کند و وزن ها را به طور مستقل تا رسیدن به آستانه دقت به روز میکند.
روش های Machine Learning
مدل های Machine Learning سه دسته اصلی تقسیم می شوند.
Machine Learning تحت نظارت
یادگیری نظارت شده، که به عنوان یادگیری ماشین نظارت شده نیز شناخته میشود، با استفاده از مجموعه داده های برچسب گذاری شده برای آموزش الگوریتمها برای طبقه بندی داده ها یا پیش بینی دقیق نتایج تعریف میشود. همانطور که داده های ورودی به مدل وارد میشود، مدل وزن خود را تا زمانی که به طور مناسب برازش داده شود تنظیم میکند. این به عنوان بخشی از فرآیند اعتبار سنجی متقاطع برای اطمینان از اینکه مدل از برازش بیش از حد یا عدم تناسب اجتناب میکند، رخ می دهد. یادگیری تحت نظارت به سازمان ها کمک می کند تا انواع مشکلات دنیای واقعی را در مقیاسی حل کنند، مانند طبقه بندی هرزنامه ها در یک پوشه جداگانه از صندوق ورودی شما. برخی از روشهای مورد استفاده در یادگیری نظارت شده عبارتند از: neural networks، naïve bayes، linear regression، logistic regression، random forest و support vector machine (SVM).
Machine Learning بدون نظارت
یادگیری بدون نظارت، که به عنوان یادگیری ماشین بدون نظارت نیز شناخته میشود، از الگوریتم های یادگیری ماشین برای تجزیه و تحلیل و خوشه بندی مجموعه داده های بدون برچسب استفاده می کند. این الگوریتم ها الگوهای پنهان یا گروه بندی داده ها را بدون نیاز به دخالت انسان کشف می کنند. توانایی این روش در کشف شباهتها و تفاوتها در اطلاعات، آن را برای تجزیه و تحلیل دادههای اکتشافی، استراتژیهای فروش متقابل، تقسیمبندی مشتری، و تشخیص تصویر و الگو ایدهآل میکند. همچنین برای کاهش تعداد ویژگی های یک مدل از طریق فرآیند کاهش ابعاد استفاده می شود. Principal component analysis (PCA) و singular value decomposition (SVD) دو رویکرد رایج برای این کار هستند. سایر الگوریتمهای مورد استفاده در یادگیری بدون نظارت شامل شبکههای عصبی، خوشهبندی k-means و روشهای خوشهبندی احتمالی است.
یادگیری نیمه نظارتی
یادگیری نیمهنظارتی واسطهای متعادل بین یادگیری تحت نظارت و بدون نظارت است. در طول آموزش، از یک مجموعه داده برچسبدار کوچکتر برای هدایت طبقهبندی و استخراج ویژگی از یک مجموعه داده بزرگتر و بدون برچسب استفاده میکند. یادگیری نیمه نظارت شده میتواند مشکل نداشتن داده های برچسب گذاری شده کافی برای الگوریتم یادگیری نظارت شده را حل کند. همچنین اگر برچسب گذاری داده های کافی بسیار پرهزینه باشد، به آن کمک میکند.
تقویت Machine Learning
یادگیری ماشینی تقویتی یک مدل یادگیری ماشینی است که شبیه به یادگیری نظارت شده است، اما الگوریتم با استفاده از داده های نمونه آموزش داده نمی شود. این مدل با استفاده از آزمون و خطا یاد می گیرد. دنباله ای از نتایج موفقیت آمیز برای ایجاد بهترین توصیه یا از آن برای یک مشکل خاص تقویت می شود.
الگوریتم های رایج Machine Learning
تعدادی از الگوریتم های یادگیری ماشین بیشتر استفاده میشوند؛که شامل:
Neural networks: شبکه های عصبی نحوه عملکرد مغز انسان را با تعداد زیادی گره پردازشی مرتبط شبیه سازی می کنند. شبکه های عصبی در تشخیص الگوها خوب هستند و نقش مهمی در کاربردهایی از جمله ترجمه زبان طبیعی، تشخیص تصویر، تشخیص گفتار و ایجاد تصویر دارند.
Linear regression: این الگوریتم برای پیش بینی مقادیر عددی بر اساس رابطه خطی بین مقادیر مختلف استفاده می شود. به عنوان مثال، این تکنیک می تواند برای پیش بینی قیمت خانه بر اساس داده های تاریخی برای منطقه مورد استفاده قرار گیرد.
Logistic regression: این الگوریتم یادگیری نظارت شده برای متغیرهای پاسخ طبقهای، مانند پاسخهای «بله/خیر» به سؤالات، پیشبینی میکند. می توان از آن برای برنامه هایی مانند طبقه بندی اسپم و کنترل کیفیت در خط تولید استفاده کرد.
Clustering: با استفاده از یادگیری بدون نظارت، الگوریتم های Clustering می توانند الگوهای موجود در داده ها را شناسایی کنند تا بتوان آنها را گروه بندی کرد. رایانه ها می توانند با شناسایی تفاوت های بین اقلام داده ای که انسان ها نادیده گرفته اند، به دانشمندان دیتا کمک کنند.
Decision trees: درخت تصمیم را می توان هم برای پیش بینی مقادیر عددی (regression) و هم برای طبقه بندی دادهها به دستهها استفاده کرد. درختان تصمیم از یک دنباله انشعاب از تصمیمات مرتبط استفاده میکنند که میتواند با یک نمودار درختی نمایش داده شود. یکی از مزایای درخت تصمیم این است که بر خلاف جعبه سیاه شبکه عصبی، در آن اعتبارسنجی و ممیزی آسان است.
Random forests: در یک Random forests، الگوریتم یادگیری ماشین یک مقدار یا دسته را با ترکیب نتایج تعدادی درخت تصمیم پیشبینی میکند.
همچنین بخوانید: اینترنت اشیا چیست؛ هر آنچه باید درباره(IoT) بدانید!
موارد استفاده از Machine Learning در دنیای واقعی
در اینجا فقط چند نمونه از Machine Learning وجود دارد که ممکن است هر روز با آنها روبرو شوید:
تشخیص گفتار: همچنین با نامهای تشخیص خودکار گفتار (ASR)، تشخیص گفتار رایانهای یا گفتار به متن نیز شناخته میشود و قابلیتی است که از پردازش زبان طبیعی (NLP) برای ترجمه گفتار انسان به قالب نوشتاری استفاده میکند. بسیاری از دستگاههای تلفن همراه برای انجام جستجوی صوتی از تشخیص گفتار در سیستمهای خود استفاده میکنند. مانند Siri یا improve accessibility برای ارسال پیامک.
خدمات به مشتری: چت رباتهای آنلاین در طول کسب تجربه مشتری جایگزین عوامل انسانی میشوند و نحوه تفکر ما را در مورد تعامل با مشتری در بین وبسایتها و پلتفرمهای رسانههای اجتماعی تغییر میدهند. رباتهای گفتگو به سؤالات متداول (پرسشهای متداول) در مورد موضوعاتی مانند حمل و نقل پاسخ میدهند، یا توصیههای شخصی، فروش متقابل محصولات یا اندازههای پیشنهادی را برای کاربران ارائه میدهند. به عنوان مثال می توان به عوامل مجازی در سایت های تجارت الکترونیک اشاره کرد. یا رباتهای پیامرسان، با استفاده از Slack و Facebook Messenger. و کارهایی که معمولاً توسط دستیارهای مجازی و دستیارهای صوتی انجام میشوند.
چشمانداز رایانه: این فناوری هوش مصنوعی رایانهها را قادر میسازد تا اطلاعات معنیداری را از تصاویر دیجیتال، ویدیوها و سایر ورودیهای بصری به دست آورند و سپس اقدام مناسب را انجام دهند. بینایی کامپیوتر با پشتیبانی از شبکههای عصبی کانولوشنال، کاربردهایی در برچسبگذاری عکس در رسانههای اجتماعی، تصویربرداری رادیولوژی در مراقبتهای بهداشتی و خودروهای خودران در صنعت خودرو دارد.
موتورهای توصیه: با استفاده از دیتاهای رفتار مصرف گذشته، الگوریتمهای هوش مصنوعی میتوانند به کشف روندهای دادهای که میتوانند برای توسعه استراتژیهای فروش متقابل مؤثرتر مورد استفاده قرار گیرند، کمک کنند. این رویکرد توسط خرده فروشان آنلاین برای ارائه توصیه های مربوط به محصول به مشتریان در طول فرآیند پرداخت استفاده میشود.
معاملات خودکار سهام: پلتفرمهای معاملاتی با فرکانس بالا مبتنی بر هوش مصنوعی که برای بهینهسازی سبد سهام طراحی شدهاند، هزاران یا حتی میلیونها معامله را در روز بدون دخالت انسان انجام میدهند.
تشخیص تقلب: بانک ها و سایر موسسات مالی می توانند از یادگیری ماشینی برای شناسایی تراکنش های مشکوک استفاده کنند. یادگیری تحت نظارت می تواند یک مدل را با استفاده از اطلاعات مربوط به تراکنش های جعلی شناخته شده آموزش دهد. تشخیص ناهنجاری میتواند تراکنشهایی را شناسایی کند که غیر معمول به نظر میرسند و مستحق بررسی بیشتر هستند.
چالش های Machine Learning
همانطور که فناوری یادگیری ماشین توسعه یافته است، مطمئناً زندگی ما را آسانتر کرده است. با این حال، پیادهسازی یادگیری ماشینی در مشاغل، نگرانیهای اخلاقی زیادی را در مورد فناوریهای هوش مصنوعی نیز ایجاد کرده است. برخی از این موارد عبارتند از:
تکنولوژیکِ منحصربهفرد
در حالی که این موضوع توجه عمومی زیادی را به خود جلب می کند، بسیاری از محققان نگران این ایده نیستند که هوش مصنوعی در آینده نزدیک از هوش انسانی پیشی بگیرد. تکینگی تکنولوژیک نیز به عنوان هوش مصنوعی قوی یا ابر هوش نامیده می شود. فیلسوف نیک بوستروم، ابرهوشی را اینگونه تعریف میکند: هر هوشی که عملاً در هر زمینهای، از جمله خلاقیت علمی، خرد عمومی، و مهارتهای اجتماعی، مشغول است، از بهترین مغزهای انسان بسیار بهتر عمل میکند. علیرغم این واقعیت که ابرهوشی در جامعه قریب الوقوع نیست، ایده آن سوالات جالبی را ایجاد میکند زیرا ما استفاده از سیستم های خودران مانند اتومبیل های خودران را در نظر می گیریم. این غیر واقعی است که فکر کنیم یک ماشین بدون راننده هرگز تصادف نمیکند، اما چه کسی در این شرایط مسئول است؟ آیا هنوز باید وسایل نقلیه خودران را توسعه دهیم یا این فناوری را به وسایل نقلیه نیمه خودران که به مردم کمک می کنند با خیال راحت رانندگی کنند محدود کنیم؟ هیئت منصفه هنوز در این مورد صحبت نمیکند، اما این ها انواع بحث های اخلاقی هستند که با توسعه فناوری جدید و خلاقانه هوش مصنوعی در حال وقوع هستند.
تاثیر هوش مصنوعی بر مشاغل
در حالی که بسیاری از تصورات عمومی از هوش مصنوعی در مورد از دست دادن شغل متمرکز است، این نگرانی احتمالاً باید دوباره اصلاح شود. با هر فناوری جدید و مخرب، می بینیم که تقاضای بازار برای نقش های شغلی خاص تغییر می کند. به عنوان مثال، وقتی به صنعت خودرو نگاه می کنیم، بسیاری از تولیدکنندگان، مانند جنرال موتورز(GM)، روی تولید خودروهای الکتریکی تمرکز می کنند تا با ابتکارات سبز هماهنگ شوند. صنعت انرژی از بین نمی رود، اما منبع انرژی در حال تغییر از مصرف سوخت به برق است.
به همین ترتیب، هوش مصنوعی تقاضا برای مشاغل را به مناطق دیگر منتقل می کند. باید افرادی وجود داشته باشند که به مدیریت سیستم های هوش مصنوعی کمک کنند. هنوز هم باید افرادی وجود داشته باشند که مشکلات پیچیده تری را در صنایعی که به احتمال زیاد تحت تأثیر تغییرات تقاضای شغلی قرار می گیرند، مانند خدمات مشتری، حل کنند. بزرگترین چالش هوش مصنوعی و تأثیر آن بر بازار کار، کمک به افراد برای انتقال به نقشهای جدید مورد تقاضا خواهد بود.
پیشنهاد ما: پکیج تست نفوذ (سطح مقدماتی)
حریم خصوصی
حریم خصوصی معمولاً در زمینه حریم خصوصی داده ها، حفاظت از داده ها و امنیت داده ها مورد بحث قرار می گیرد. این نگرانی ها به سیاست گذاران اجازه داده است که در سال های اخیر گام های بیشتری بردارند. به عنوان مثال، در سال 2016، قانون GDPR برای محافظت از داده های شخصی افراد در اتحادیه اروپا و منطقه اقتصادی اروپا ایجاد شد و به افراد کنترل بیشتری بر داده های خود داد. در ایالات متحده، ایالت های جداگانه در حال توسعه سیاست هایی هستند، مانند قانون حفظ حریم خصوصی مصرف کنندگان کالیفرنیا (CCPA) که در سال 2018 معرفی شد و از کسب و کارها می خواهد که مصرف کنندگان را در مورد جمع آوری داده های خود آگاه کنند. قوانینی مانند این شرکت ها را وادار کرده است که در نحوه ذخیره و استفاده از اطلاعات شخصی قابل شناسایی (PII) تجدید نظر کنند. در نتیجه، سرمایهگذاری در امنیت به یک اولویت افزاینده برای کسبوکارها تبدیل شده است، زیرا آنها به دنبال حذف هرگونه آسیبپذیری و فرصتهایی برای نظارت، هک و حملات سایبری هستند.
تعصب و تبعیض
مواردی از تعصب و تبعیض در تعدادی از سیستم های یادگیری ماشینی، سوالات اخلاقی زیادی را در مورد استفاده از هوش مصنوعی ایجاد کرده است. چگونه میتوانیم در برابر تعصب و تبعیض محافظت کنیم، زمانی که دادههای آموزشی ممکن است توسط فرآیندهای انسانی مغرضانه تولید شوند؟ در حالی که شرکتها معمولاً نیت خوبی برای تلاشهای اتوماسیون خود دارند، رویترز برخی از پیامدهای پیشبینی نشده استفاده از هوش مصنوعی در شیوههای استخدام را برجسته میکند. آمازون در تلاش خود برای خودکارسازی و سادهسازی یک فرآیند، ناخواسته بین نامزدهای شغلی بر اساس جنسیت برای نقشهای فنی تبعیض قائل شد و این شرکت در نهایت مجبور شد پروژه را کنار بگذارد. Harvard Business Review سؤالات مهم دیگری را در مورد استفاده از هوش مصنوعی در شیوه های استخدام مطرح کرده است، مانند اینکه از چه داده هایی باید بتوانید هنگام ارزیابی یک نامزد برای یک نقش استفاده کنید.
تعصب و تبعیض به عملکرد منابع انسانی نیز محدود نمی شود. آنها را می توان در تعدادی از برنامه های کاربردی از نرم افزار تشخیص چهره گرفته تا الگوریتم های رسانه های اجتماعی یافت.
همانطور که کسبوکارها از خطرات هوش مصنوعی آگاهتر میشوند، در این بحث پیرامون اخلاق و ارزشهای هوش مصنوعی نیز فعالتر شدهاند. به عنوان مثال، IBM تولید محصولات تشخیص و تجزیه و تحلیل چهره با هدف کلی خود را به پایان رسانده است. آرویند کریشنا، مدیرعامل IBM نوشت: IBM قاطعانه مخالف است و استفاده از هر فناوری، از جمله فناوری تشخیص چهره ارائهشده توسط سایر فروشندگان، برای نظارت انبوه، پروفایلهای نژادپرستی، نقض حقوق و آزادیهای اولیه بشر، یا هر هدفی که سازگار نیست را نمیپذیرد. که با ارزشها و اصول اعتماد و شفافیت ما هماهنگ نیست.
مسئوليت
از آنجایی که قانون قابل توجهی برای تنظیم شیوه های هوش مصنوعی وجود ندارد، هیچ مکانیزم اجرایی واقعی برای اطمینان از اجرای هوش مصنوعی اخلاقی وجود ندارد. انگیزههای فعلی برای اخلاقی بودن شرکتها، پیامدهای منفی یک سیستم هوش مصنوعی غیراخلاقی است. برای پر کردن این شکاف، چارچوبهای اخلاقی به عنوان بخشی از همکاری بین اخلاقشناسان و محققان برای کنترل ساخت و توزیع مدلهای هوش مصنوعی در جامعه پدیدار شدهاند. با این حال، در حال حاضر، اینها فقط برای راهنمایی هستند. برخی تحقیقات نشان میدهد که ترکیبی از مسئولیت های توزیع شده و فقدان آینده نگری در مورد پیامدهای بالقوه برای جلوگیری از آسیب به جامعه مفید نیست.
دیدگاهتان را بنویسید