الگوریتم انتخاب ویژگی (Feature Selection)چیست؟ بخش 2

5.مثال های عددی مثال اول : فیلتر بر اساس حد آستانه واریانس (Variance Threshold) موضوع: پیشپردازش دادههای یک فریمورک «تشخیص ایمیلهای اسپم» صورت مسئله: یک مهندس داده در خط لوله یادگیری ماشین خود، ماتریسی با ۳ ویژگی (تعداد کلمات کلیدی، وجود لینک خارجی، و طول ایمیل) برای ۵ ایمیل نمونه در اختیار دارد. او قصد […]
الگوریتم انتخاب ویژگی (Feature Selection)چیست؟بخش 1

1.مقدمه در مسائل یادگیری ماشین، افزایش تعداد ویژگیها همیشه به بهبود عملکرد مدل منجر نمیشود. در بسیاری از پروژههای دادهمحور، وجود ویژگیهای زائد، نویزی یا همبسته میتواند باعث افزایش پیچیدگی مدل، کاهش سرعت آموزش، افزایش مصرف حافظه و حتی افت توان تعمیم مدل شود. این مسئله بهویژه در دادههای پُربعد (High-Dimensional Data) اهمیت بیشتری پیدا […]
الگوریتم درخت تصمیم(Decision Tree)چیست؟

1.مقدمه الگوریتم یکی از شناختهشدهترین و قابلتفسیرترین روشهای یادگیری ماشین است که برای مسائل طبقهبندی و رگرسیون به کار میرود. ایدهی اصلی این الگوریتم تقسیم تدریجی دادهها بر اساس ویژگیهایی است که بیشترین توانایی را در تفکیک نمونهها دارند. نتیجهی این فرآیند ساختاری درختی است که در آن هر گره نمایانگر یک تصمیم، هر شاخه […]
الگوریتم ساده بیز (Naive Bayes)چیست؟

1.مقدمه الگوریتم ساده بیز (Naive Bayes) یکی از قدیمیترین و در عین حال مؤثرترین الگوریتمهای یادگیری ماشین است که بر پایه نظریه احتمال و قضیه بیز عمل میکند. این الگوریتم با وجود سادگی ساختاری، در بسیاری از مسائل دستهبندی عملکردی سریع، پایدار و قابل قبول ارائه میدهد. ایده اصلی Naive Bayes این است که ویژگیهای […]