Data science Fundamental (level1): آمارتوصیفی در دیتاساینس

توضیحات

Data science Fundamental (level1): آمارتوصیفی در دیتاساینس

مدت دوره:      28 ساعت                 پیش نیاز: ندارد

(این دوره با هدف معرفی جامع علم داده و جذب حداکثری مخاطبان، با قیمت‌گذاری حداقلی ارائه شده است)

در این گام دانشجو با اصول اولیه نظریات آمار و احتمالات و جبر خطی آشنا می شود، مباحث آمار توصیفی از جمله مود، میانه و میانگین، کشیدگی و چولگی، انحراف معیار و واریانس، نظریه حد مرکزی انواع آزمون های همبستگی از جمله پیرسون، اسپیرمن و کندال از سرفصل های این دوره می باشد.

لازم به ذکر است که در این گام دانشجو همزمان با جنبه های تئوری این بخش آشنا و بلافاصله تئوری های آموخته شده در نرم­افزار SPSS و زبان R اجرا می­شود.

یکی از سرفصل های مهم در این گام چیزی است که امروزه قصه گویی در علم داده نامیده می شود (data science visualization) و در این دوره ترسیم انواع نمودارها از جمله هیستوگرام، بارپلات، اجایو، فراوانی تراکمی، توزیع نرمال و نمودار اسکاترپلات… توسط R آموزش داده می شود.

نکته: در برخی مدارس علم داده در خارج از کشور این دو مرحله از هم جدا می شود و دانشجو در ابتدا صرفاً نگاه تئوری و بدون استفاده از کامپیوتر دارد و در مرحله بعد از آن کامپیوتر مورد استفاده قرار می­گیرد ولی بطور کلی روشی که بیشتر در دیتاساینس مورد استفاده قرار می­گیرد حظور همزمان این دو در کنار هم می باشد (تجربه شخصی نگارنده هم نشان داده است از آنجا که نگاه ما به آمار متفاوت از نگاه آمار سنتی برای مباحثی مانند کنکور و پایان نامه است لازم است از همان ابتدا دو علم آمار و کامپیوتر با یکدیگر ادغام گردند)

لازم به ذکر است دو زبان R و پایتون (خصوصاً R) به عنوان زبان های محبوب در حوزه دیتاساینس و آمار محسوب می­شود، پایتون یک زبان برنامه­نویسی چند منظوره است و R یک زبان اختصاصی برای داده کاوی

سرفصل های گام اول Data Science

  • مفاهیم اولیه در آمار
  • آمار توصیفی (بخش اول)
  • اشنایی با انواع متغیر در علم آمار
  • شاخص های مرکزی
  • مد (mode) و توزیع یکنواخت
  • توزیع تصادفی یکنواخت در پایتون
  • ترسیم توزیع تصادفی در پایتون
  • میانه (median)
  • استفاده از پایتون برای تشخیص میانه
  • میانگین و محاسبه میانگین توسط R
  • آشنایی با نمودار های آماری
  • ترسیم نمودار های آماری در R و SPSS
  • توزیع نرمال
  • ترسیم توزیع نرمال
  • چولگی (skewness)
  • محاسبه چولگی توسط R و SPSS
  • نمودار جعبه ای (boxplot)
  • رسم باکس پلات توسط پایتون، R و SPSS
  • شاخص های پراکندگی
  • دامنه تغییرات
  • انحراف چارکی
  • محاسبه کوانتایل دیوی ایشن (انحراف چارکی) در R و SPSS
  • انحراف متوسط (انحراف از میانگین) (mean deviation)
  • محاسبه انحراف متوسط
  • واریانس
  • قضیه حد مرکزی
  • انحراف استاندارد
  • ضریب تغییرات
  • کشیدگی (kurtosis)
  • تاثیر اعمال ریاضی بر شاخص‌های آماری (مرکزی / پراکندگی)
  • نمرات استاندارد
  • رتبه درصدی
  • نمراه استاندارد Z
  • نمره استاندارد T
  • همبستگی
  • Scatter plots (نمودار پراکنش)
  • ترسیم نمودار پراکنش در R و SPSS
  • ضریب همبستگی پیرسون
  • انواع ضرایب همبستگی
  • ضریب همبستگی اسپیرمن
  • پروژه 1 انجام همبستگی توسط داده های واقعی در ، R و SPSS
  • انجام آزمون های هبستگی در SPSS
  • اندازه اثر در همبستگی
  • همبستگی پیرسون در R و SPSS
نظرات (0)

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “Data science Fundamental (level1): آمارتوصیفی در دیتاساینس”

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *