قسمت 2 :تأثیرات داده‌های پرت بر تحلیل آماری و مدل های یادگیری ماشین

مقدمه داده‌های پرت (Outliers) همیشه بخشی از واقعیت‌های یک دیتاست هستند. گاهی بی‌خطر و قابل‌چشم‌پوشی، گاهی هم مخرب و گمراه‌کننده است. اهمیت این داده‌ها فقط در مقدار غیرعادی‌شان نیست، بلکه در تأثیری است که می‌توانند بر تحلیل، تصمیم‌گیری و مدل‌های یادگیری ماشین داشته باشند. در این بخش بررسی می‌کنیم که داده‌های پرت چگونه می‌توانند نتایج […]

قسمت ۱: داده های پرت چیست؟کالبدشکافی Outlier ها از تعریف تا طبقه‌بندی

مقدمه داده‌های پرت فقط مقادیر عجیب در میان داده‌ها نیستند؛ بلکه می‌توانند منبع خطا، نشانه‌ای از مشکل پنهان یا حتی سرنخی برای کشف علمی باشند. در ساده‌ترین تعریف، داده‌ی پرت مشاهده‌ای است که رفتاری چنان متفاوت دارد که تردید به همگونی فرآیند تولیدش ایجاد می‌شود. این پدیده در حوزه‌های گوناگونی مانند آمار، روان‌شناسی، یادگیری ماشین، […]