الگوریتم انتخاب ویژگی (Feature Selection)چیست؟ بخش 2

5.مثال های عددی مثال اول : فیلتر بر اساس حد آستانه واریانس (Variance Threshold) موضوع: پیش‌پردازش داده‌های یک فریم‌ورک «تشخیص ایمیل‌های اسپم» صورت مسئله: یک مهندس داده در خط لوله یادگیری ماشین خود، ماتریسی با ۳ ویژگی (تعداد کلمات کلیدی، وجود لینک خارجی، و طول ایمیل) برای ۵ ایمیل نمونه در اختیار دارد. او قصد […]

الگوریتم انتخاب ویژگی (Feature Selection)چیست؟بخش 1

1.مقدمه در مسائل یادگیری ماشین، افزایش تعداد ویژگی‌ها همیشه به بهبود عملکرد مدل منجر نمی‌شود. در بسیاری از پروژه‌های داده‌محور، وجود ویژگی‌های زائد، نویزی یا هم‌بسته می‌تواند باعث افزایش پیچیدگی مدل، کاهش سرعت آموزش، افزایش مصرف حافظه و حتی افت توان تعمیم مدل شود. این مسئله به‌ویژه در داده‌های پُربعد (High-Dimensional Data) اهمیت بیشتری پیدا […]

الگوریتم درخت تصمیم(Decision Tree)چیست؟

1.مقدمه الگوریتم یکی از شناخته‌شده‌ترین و قابل‌تفسیرترین روش‌های یادگیری ماشین است که برای مسائل طبقه‌بندی و رگرسیون به کار می‌رود. ایده‌ی اصلی این الگوریتم تقسیم تدریجی داده‌ها بر اساس ویژگی‌هایی است که بیشترین توانایی را در تفکیک نمونه‌ها دارند. نتیجه‌ی این فرآیند ساختاری درختی است که در آن هر گره نمایانگر یک تصمیم، هر شاخه […]

الگوریتم ساده بیز (Naive Bayes)چیست؟

1.مقدمه الگوریتم ساده بیز (Naive Bayes) یکی از قدیمی‌ترین و در عین حال مؤثرترین الگوریتم‌های یادگیری ماشین است که بر پایه نظریه احتمال و قضیه بیز عمل می‌کند. این الگوریتم با وجود سادگی ساختاری، در بسیاری از مسائل دسته‌بندی عملکردی سریع، پایدار و قابل قبول ارائه می‌دهد. ایده اصلی Naive Bayes این است که ویژگی‌های […]