قسمت 2 :تأثیرات دادههای پرت بر تحلیل آماری و مدل های یادگیری ماشین

مقدمه دادههای پرت (Outliers) همیشه بخشی از واقعیتهای یک دیتاست هستند. گاهی بیخطر و قابلچشمپوشی، گاهی هم مخرب و گمراهکننده است. اهمیت این دادهها فقط در مقدار غیرعادیشان نیست، بلکه در تأثیری است که میتوانند بر تحلیل، تصمیمگیری و مدلهای یادگیری ماشین داشته باشند. در این بخش بررسی میکنیم که دادههای پرت چگونه میتوانند نتایج […]
قسمت ۱: داده های پرت چیست؟کالبدشکافی Outlier ها از تعریف تا طبقهبندی

مقدمه دادههای پرت فقط مقادیر عجیب در میان دادهها نیستند؛ بلکه میتوانند منبع خطا، نشانهای از مشکل پنهان یا حتی سرنخی برای کشف علمی باشند. در سادهترین تعریف، دادهی پرت مشاهدهای است که رفتاری چنان متفاوت دارد که تردید به همگونی فرآیند تولیدش ایجاد میشود. این پدیده در حوزههای گوناگونی مانند آمار، روانشناسی، یادگیری ماشین، […]