Data science Fundamental (level1): آمارتوصیفی در دیتاساینس
Data science Fundamental (level1): آمارتوصیفی در دیتاساینس
مدت دوره: 28 ساعت پیش نیاز: ندارد
(این دوره با هدف معرفی جامع علم داده و جذب حداکثری مخاطبان، با قیمتگذاری حداقلی ارائه شده است)
در این گام دانشجو با اصول اولیه نظریات آمار و احتمالات و جبر خطی آشنا می شود، مباحث آمار توصیفی از جمله مود، میانه و میانگین، کشیدگی و چولگی، انحراف معیار و واریانس، نظریه حد مرکزی انواع آزمون های همبستگی از جمله پیرسون، اسپیرمن و کندال از سرفصل های این دوره می باشد.
لازم به ذکر است که در این گام دانشجو همزمان با جنبه های تئوری این بخش آشنا و بلافاصله تئوری های آموخته شده در نرمافزار SPSS و زبان R اجرا میشود.
یکی از سرفصل های مهم در این گام چیزی است که امروزه قصه گویی در علم داده نامیده می شود (data science visualization) و در این دوره ترسیم انواع نمودارها از جمله هیستوگرام، بارپلات، اجایو، فراوانی تراکمی، توزیع نرمال و نمودار اسکاترپلات… توسط R آموزش داده می شود.
نکته: در برخی مدارس علم داده در خارج از کشور این دو مرحله از هم جدا می شود و دانشجو در ابتدا صرفاً نگاه تئوری و بدون استفاده از کامپیوتر دارد و در مرحله بعد از آن کامپیوتر مورد استفاده قرار میگیرد ولی بطور کلی روشی که بیشتر در دیتاساینس مورد استفاده قرار میگیرد حظور همزمان این دو در کنار هم می باشد (تجربه شخصی نگارنده هم نشان داده است از آنجا که نگاه ما به آمار متفاوت از نگاه آمار سنتی برای مباحثی مانند کنکور و پایان نامه است لازم است از همان ابتدا دو علم آمار و کامپیوتر با یکدیگر ادغام گردند)
لازم به ذکر است دو زبان R و پایتون (خصوصاً R) به عنوان زبان های محبوب در حوزه دیتاساینس و آمار محسوب میشود، پایتون یک زبان برنامهنویسی چند منظوره است و R یک زبان اختصاصی برای داده کاوی
سرفصل های گام اول Data Science
- مفاهیم اولیه در آمار
- آمار توصیفی (بخش اول)
- اشنایی با انواع متغیر در علم آمار
- شاخص های مرکزی
- مد (mode) و توزیع یکنواخت
- توزیع تصادفی یکنواخت در پایتون
- ترسیم توزیع تصادفی در پایتون
- میانه (median)
- استفاده از پایتون برای تشخیص میانه
- میانگین و محاسبه میانگین توسط R
- آشنایی با نمودار های آماری
- ترسیم نمودار های آماری در R و SPSS
- توزیع نرمال
- ترسیم توزیع نرمال
- چولگی (skewness)
- محاسبه چولگی توسط R و SPSS
- نمودار جعبه ای (boxplot)
- رسم باکس پلات توسط پایتون، R و SPSS
- شاخص های پراکندگی
- دامنه تغییرات
- انحراف چارکی
- محاسبه کوانتایل دیوی ایشن (انحراف چارکی) در R و SPSS
- انحراف متوسط (انحراف از میانگین) (mean deviation)
- محاسبه انحراف متوسط
- واریانس
- قضیه حد مرکزی
- انحراف استاندارد
- ضریب تغییرات
- کشیدگی (kurtosis)
- تاثیر اعمال ریاضی بر شاخصهای آماری (مرکزی / پراکندگی)
- نمرات استاندارد
- رتبه درصدی
- نمراه استاندارد Z
- نمره استاندارد T
- همبستگی
- Scatter plots (نمودار پراکنش)
- ترسیم نمودار پراکنش در R و SPSS
- ضریب همبستگی پیرسون
- انواع ضرایب همبستگی
- ضریب همبستگی اسپیرمن
- پروژه 1 انجام همبستگی توسط داده های واقعی در ، R و SPSS
- انجام آزمون های هبستگی در SPSS
- اندازه اثر در همبستگی
- همبستگی پیرسون در R و SPSS

دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.