یادگیری ماشین کاربردی و ساخت مدل‌های پیشرفته با پایتون

این دوره یک کاوش عمیق و فنی در الگوریتم‌های بنیادی یادگیری ماشین است. تمرکز اصلی بر درک ریاضیات پشت الگوریتم‌ها، نحوه عملکرد آن‌ها و پیاده‌سازی عملی‌شان با پایتون و کتابخانه Scikit-learn است. دوره سه شاخه اصلی یادگیری ماشین را پوشش می‌دهد: یادگیری نظارت‌شده (Supervised)، نظارت‌نشده (Unsupervised) و مقدمه‌ای بر یادگیری تقویتی (Reinforcement). شرکت‌کنندگان نه تنها یاد می‌گیرند که از مدل‌ها استفاده کنند، بلکه درک می‌کنند که چرا و چگونه کار می‌کنند.

مدرس دوره:

دکتر محمد رضا عاطفی
دکتر حمیدرضا یزدانی

مدت زمان دوره:

240 ساعت

پیشنیاز دوره:

ندارد

اهداف دوره:

  • درک عمیق مبانی نظری و ریاضیاتی الگوریتم‌های کلیدی یادگیری ماشین.
  • مهندسی ویژگی  و کسب مهارت در تولید، انتخاب و تبدیل ویژگی‌ها برای بهبود عملکرد مدل.
  • تسلط بر پیاده‌سازی، آموزش و ارزیابی مدل‌های یادگیری نظارت‌شده و نظارت‌نشده.
  • توانایی انتخاب الگوریتم مناسب برای مسائل مختلف (طبقه‌بندی، رگرسیون، خوشه‌بندی).
  • تسلط بر معیارهای ارزیابی و تکنیک‌های اعتبارسنجی متقاطع
  • یادگیری تکنیک‌های ارزیابی و تنظیم مدل برای جلوگیری از بیش‌برازش (Overfitting).
  • کسب تجربه عملی در ساخت و بهینه‌سازی مدل‌ها با Scikit-learn.

پس از اتمام این دوره می توانید:

  • شما قادر خواهید بود برای یک مسئله مشخص، مدل‌های پیش‌بینی‌کننده مختلفی بسازید،
  • عملکرد آن‌ها را با معیارهای مناسب مقایسه کرده و بهترین مدل را با تنظیم هایپرپارامترها بهینه‌سازی کنید.
  • الگوهای پنهان در داده‌های بدون برچسب را از طریق خوشه‌بندی کشف کرده و ابعاد داده‌ها را کاهش دهید.
  • مدل‌های یادگیری ماشین پیچیده‌تر را برای مسائل رگرسیون و طبقه‌بندی طراحی و پیاده‌سازی کنید.
  • تکنیک‌های پیشرفته مهندسی ویژگی را به کار ببرید و عملکرد مدل را بهبود بخشید.

مخاطبان این دوره:

این دوره برای متخصصان داده، مهندسان یادگیری ماشین، تحلیلگران پیشرفته و هر کسی که دارای دانش نسبی از پایتون و مفاهیم پایه‌ای آمار و جبر خطی است و به دنبال تسلط بر جنبه‌های عملی و پیشرفته‌تر یادگیری ماشین است، مناسب می‌باشد. این دوره برای افرادی طراحی شده که پایه‌های علم داده را می‌دانند و اکنون می‌خواهند به صورت تخصصی بر روی الگوریتم‌های مدل‌سازی تمرکز کنند. مهندسان نرم‌افزار، تحلیل‌گران داده و فارغ‌التحصیلان رشته‌های فنی مخاطبان اصلی این دوره هستند.

سرفصل های دوره:

  1. مروری بر یادگیری ماشین و چرخه حیات پروژه:
    • مفاهیم پایه و مرور کوتاه بر الگوریتم‌های مقدماتی.
    • چرخه حیات پروژه ML: از تعریف مسئله تا استقرار و نظارت.
  2. پیش‌پردازش داده‌ها و مهندسی ویژگی پیشرفته:
    • مقیاس‌بندی (Scaling)، نرمال‌سازی (Normalization) و استانداردسازی (Standardization).
    • مدیریت داده‌های از دست رفته و پرت.
    • تکنیک‌های مهندسی ویژگی
  3. مدل‌های رگرسیون پیشرفته:
    • رگرسیون چندجمله‌ای (Polynomial Regression).
    • رگرسیون‌های منظم‌سازی‌شده (Regularized Regression): Ridge, Lasso, Elastic Net.
    • ماشین‌های بردار پشتیبان رگرسیون (SVR).
  4. مدل‌های طبقه‌بندی پیشرفته:
    • Naive Bayes پیشرفته (Multinomial, Bernoulli).
    • ماشین‌های بردار پشتیبان (SVM) – رویکردهای پیشرفته و کرنل‌ها.
    • K-Nearest Neighbors (KNN) و کاربردهای آن.
  5. درختان تصمیم (Decision Trees) و روش‌های :Ensemble
    • معماری درختان تصمیم و معیارهای شکاف (Gini, Entropy).
    • Bagging و :Random Forests نظریه و پیاده‌سازی.
    • Boosting: AdaBoost, Gradient Boosting مقدماتی.
  6. Gradient Boosting Machines (GBMs):
    • XGBoost: نظریه، پارامترها و پیاده‌سازی با. Scikit-learn
    • LightGBM و CatBoost مفاهیم و تفاوت‌ها.
    • تنظیم هایپرپارامتر برای GBMs.
  7. ارزیابی و اعتبارسنجی پیشرفته مدل‌ها:
    • انواع اعتبارسنجی (K-Fold, Stratified K-Fold, Leave-One-Out).
    • معیارهای ارزیابی برای مسائل نامتوازن (Imbalanced Data): Precision-Recall Curve.
    • تحلیل خطای مدل (Error Analysis).
  8. خوشه‌بندی (Clustering):
    • K-Means پیشرفته (K-Means++).
    • DBSCAN: نظریه و پیاده‌سازی.
    • خوشه‌بندی سلسله‌مراتبی (Hierarchical Clustering).
    • معیارهای ارزیابی خوشه‌بندی.
  9. سیستم‌های توصیه‌گر (Recommender Systems) – رویکرد ML:
    • فیلترینگ مشارکتی مبتنی بر کاربر و آیتم.
    • مقدمه‌ای بر فاکتورسازی ماتریس (Matrix Factorization) و SVD.
  10. تشخیص ناهنجاری (Anomaly Detection):
    • روش‌های آماری (Z-score).
    • روش‌های مبتنی بر چگالی (Local Outlier Factor).
    • استفاده از Isolation Forest.
  11. بهینه‌سازی هایپرپارامترها و: AutoML
    • Grid Search و Random Search پیشرفته.
    • بهینه‌سازی بیزی (Bayesian Optimization) (مقدماتی).
    • مقدمه‌ای بر AutoML (مثلاً TPOT, Auto-Sklearn).
  12. مدیریت پروژه یادگیری ماشین:
    • Pipelines در Scikit-learn.
    • ذخیره و بارگذاری مدل (Joblib, Pickle).
    • مقدمه‌ای بر Version Control برای مدل‌ها و داده‌ها.
  13. پروژه عملی ۱: پیش‌بینی دقیق یک مسئله (طبقه‌بندی چندکلاسه با داده‌های نامتوازن).
    • شامل مهندسی ویژگی و استفاده از الگوریتم های مناسب.
  14. پروژه عملی ۲: سیستم امتیازدهی اعتبار (Credit Scoring) با مدل‌های قابل تفسیر.
    • تفسیر نتایج با مدلهای ساخته شده.
  15. پروژه عملی ۳: تشخیص ناهنجاری در داده‌های سنسور صنعتی.
  16. کارگاه‌های عملی: حل مسائل Kaggle و چالش‌های واقعی.
  17. نکات مربوط به عملکرد مدل در محیط‌های تولید (Production).
  18. پروژه نهایی: پیاده‌سازی یک سیستم پیش‌بینی End-to-End برای یک مسئله پیچیده.
    • شامل همه مراحل از پیش‌پردازش تا ارزیابی و استقرار اولیه.

ابزار های دوره:

پایتون و کتابخانه های مربوطه

منابع دوره:

کتاب‌ها:

“Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow” by Aurélien Géron (بخش ML)

“The Hundred-Page Machine Learning Book” by Andriy Burkov

“Applied Predictive Modeling” by Max Kuhn and Kjell Johnson

 

دوره‌های آنلاین معتبر:

Coursera: “Machine Learning Engineering for Production (MLOps)” Specialization (DeepLearning.AI)

Udacity: “Machine Learning Engineer Nanodegree”

Kaggle Learn (برای تمرینات عملی و مسابقات).

 

مستندات و کتابخانه‌های پایتون:

Scikit-learn Documentation

XGBoost Documentation

LightGBM, CatBoost Documentation

SHAP, LIME Documentation

مقالات و بلاگ‌های تخصصی:

Towards Data Science, Medium, Kaggle Blog.

پرسش و پاسخ:

  • آیا این دوره به ریاضیات نیاز دارد؟بله، درک مفاهیم جبر خطی، حسابان و آمار و احتمال برای فهم عمیق الگوریتم‌ها ضروری است.
  • تفاوت این دوره با دوره شبکه‌های عصبی چیست؟این دوره بر الگوریتم‌های “کلاسیک” یادگیری ماشین تمرکز دارد. شبکه‌های عصبی و یادگیری عمیق در دوره تخصصی بعدی به تفصیل پوشش داده می‌شوند.
  • آیا مباحث دوره علم داده پیش‌نیاز است؟بله، داشتن مهارت در پاک‌سازی داده و مهندسی ویژگی (که در دوره علم داده پوشش داده می‌شود) برای موفقیت در این دوره بسیار مهم است.

تمایل دارید در دوره شرکت کنید؟
فرم زیر را پر کنید. ما در اسرع وقت با شما تماس خواهیم گرفت.