
دوره آموزشی Data Engineering
Round # | Name | Chapters | Duration(hour) |
Round1 | RDBMS and Data Warehousing for Data Engineers | 1, 2, 3, 4, 5, 6 | 1+30+30+6+2+6 |
Round2 | Programming Fundamentals for Data Engineers | 7 and 8 | 21+6 |
Round3 | Data Engineering with Distributed and NoSQL Systems | 9, 10 and 11 | 3+21+12 |
Round4 | Data Engineering with Distributed and Big Data Platforms | 12 ad 13 | 30+21 |
بخش 1 : مفاهیم مهندسی داده
- نقش های حوزه دیتا
- Data Analysts
- Data Engineer
- Data Scientist
- Data Administrator
- وظایف مهندس داده
- تفاوت مهندس داده و مهندس نرم افزار
- توانمندی های نرم افزاری و توسعه نرم افزار که یک مهندس داده نیاز دارد
بخش 2 : طراحی و پیاده سازی دیتابیس – RDBMS Fundamentals
- پایگاه داده های رابطه ای و ویژگی های آن
- مروری بر ساختار دیتابیسها
- طراحی دیتابیس و نرمال سازی
- مقدمه ای بر پیاده سازی دیتا بیس در MS SQL Server و Oracle
- دستورات SQL و کار با دیتابیس
- مباحث پیشرفته در دستورات SQL
- توسعه procedure و function و کاربرد آن
- مقدمه ای بر بهبود کارایی در دیتابیس و indexing
بخش 3: طراحی و پیاده سازی انبار داده – Data Warehousing
- انبارداده و ویژگی ها و کاربرد های آن
- تفاوت DW و سیستم های OLTP
- روش های طراحی DW
- Star and Snowflake
- Fact and Dimension Modeling
- ETL و روش های پیاده سازی آن
- استفاده از SP ها
- استفاده از ابزارهای ETL
- استفاده از زبان های برنامه نویسی
- پیاده سازی ETL به کمک SSIS
- چالش های Dimension Update و انواع SCD
بخش4: نصب و راه اندازی نرم افزاها و روش های آن – Software Deployment and Installation
- مقدمه ای بر روش های نصب نرم افزارها
- استفاده از سرور فیزیکی برای استقرار نرم افزار
- استفاده از VM ها برای استقرار نرم افزار
- معرفی Docker و استفاده از Docker برای استقرار نرم افزار
- نصب SQL Server و Oracle در بستر داکر
بخش 5: مصورسازی و ابزارهای آن – Visualization
- Visualization و اهمیت آن برای مهندسان داده
- معرفی کلی ابزارهای Visualization
- کار با Power BI جهت مصور سازی داده های DW
بخش6: پلتقرم های Cloud برای DB و DW – RDBMS and DW in Cloud Platforms
- معرفی پلتفرم های Cloud و ماهیت آنها
- معرفی و کار با سرویس های AWS برای DW و DB
- AWS RDS
- AWS Redshift
- معرفی و کار با سرویس های Azure برای DW و DB
- Azure SQL DB
- Azure Synapse
بخش7: برنامه نویسی Functional
- زبان های برنامه نویسی مهم برای مهندسان داده
- انواع زبان های برنامه نویسی
- مقدمه ای بر OOP
- مقدمه ای بر Functional Programing
- دلایل استفاده از بان های برنامه نویس functional برای کار با دیتا
- توسعه روال های مختلف به کمک زبان برنامه نویسی Python
- استفاده از Python جهت توسعه روال های ETL
بخش 8: کار با Git و فرآیند CICD
- انجام integration IDE and Git
- انجام Poll – Commit – Push
- CI and CD
- مقدمه ای بر Jenkins
- مقدمه ای بر Chef
بخش 9: سیستم های توزیع شده – Distribute Systems
- موازی کاری و توزیع شدگی
- توزیع دیتا و پردازش
- Scalability
- Sharding
- Fault Tolerance
- High Availability
- چالش های توزیع دیتا
- چالش های توزیع پردازش
بخش 10: سیستم های NoSQL – NoSQL Systems and Databases
- تعریف و ویژگی NoSQL Databases
- معرفی و کار با MongoDB
- مفاهیم
- نصب و راه اندازی
- کار با MongoDB و مدل سازی داده
- Replication and Sharding
- معرفی و کار با Elastic
- مفاهیم
- نصب و راه اندازی
- کار با Elastic و مدل سازی داده
- Replication and Sharding
- مقدمه ای بر ELK
- معرفی و کار با Cassandra
- مفاهیم
- نصب و راه اندازی
- کار با Cassandra و مدل سازی داده
- Replication and Data Distribution
بخش 11: پلتقرم های Cloud برایDB NoSQL – NoSQL Databases in Cloud Platforms
- معرفی و کار با سرویس های AWS برای NoSQL
- AWS OpenSearch
- AWS Document DB
- AWS Dynamo DB
- معرفی و کار با سرویس های Azure برای NoSQL
- Azure Search
- Azure Cosmos DB
بخش 12: کلان داده و ابزارهای ذخیره و پردازش آن – Big Data and Big Data Processing Platforms
- تعریف big data و مثال های ان
- تعریف data lake و lakehouse
- معرفی Hadoop و نحوه کارکرد ان
- HDFS
- YARN
- معرفی و کار با Object Storage
- MinIO
- معرفی و کار با Trino
- توسعه روال های ETL با Trino
- معرفی و کار با Spark
- توسعه روال های ETL با Spark SQL
- معرفی NiFi و استفاده از آن برای Ingestion
- معرفی Kafka و ویژگی های آن
- Topic – Partition
- Producer and Consumer
بخش 13: پلتقرم های Cloud برای Big Data– Big Data Processing in Cloud Platforms
- معرفی و کار با سرویس های AWS برای Big Data
- AWS S3
- AWS Athena
- AWS EMR
- AWS Glue
- معرفی و کار با سرویس های Azure برای Big Data
- Azure Data Factory
- Azure Data Lake Storage
- Azure Databricks
- Azure Synapse
درخواست مشاوره
برای کسب اطلاعات بیشتر درباره این دوره درخواست مشاوره خود را ارسال کنید و یا با ما در تماس باشید.
درخواست مشاورهدوره های مرتبط
مسیر آموزشی Digital signal processing
مسیر آموزشی Digital signal processing ساعت آموزشی مورد نیاز: 120 ساعت مدرس: دکتر مهدی شکری زاده (دکتری پردازش سیگنال از…
دوره آموزشی: AI in telecom
دوره آموزشی: AI in telecom (کاربردهای هوشمصنوعی در تلکام) ساعت آموزشی مورد نیاز: 40 ساعت مدرس: دکتر وحید محمد زاده…
دوره آموزشی داده کاوی با پایتون Data Mining with Python
دوره آموزشی داده کاوی با پایتون (Data Mining with Python) ساعت آموزشی مورد نیاز 70 ساعت مدرس علی عاقلی –…
آموزش دوره Data Analyst (AI Tier 1)
مدت دوره 170 ساعت دوره دیتا ساینتیست یک برنامه آموزشی جامع است که به تحلیل و تفسیر دادهها به منظور…
نظرات
تماس با ما