در این تحقیق از پنج الگوریتم یادگیری ماشین(جنگل تصادفی، درخت تصمیمگیری، رگرسیون لجستیک، k نزدیکترین همسایه و شبکه عصبی مصنوعی) برای تشخیص حمله استفاده شده است. در این تحقیق برای ارزیابی الگوریتمها از مجموعه داده مرجع UNSW-NB15 استفاده شده است. یک مجموعه داده نسبتاً جدید که حاوی مقدار زیادی داده ترافیک شبکه با 9 کلاس از حملات شبکه است. نتایج در محیط ژوپیتر(Jupyter) پایتون نشان میدهد که الگوریتم جنگل تصادفی به بالاترین درصد صحت دست یافته است. همچنین از تکنیک نمونهبرداری بیش از حد اقلیت ترکیبی(SMOTE) برای مشکل عدم تعادل کلاسها استفاده شده است. پس از اعمال SMOTE، الگوریتم جنگل تصادفی با 24 ویژگی انتخاب شده با روش تجزیه و تحلیل مؤلفههای اصلی(PCA) به درصد صحت بالاتری دست یافته است.
راهنمای استفاده
فایل با فرمت rar بارگذاری شده است که برای باز کردن به نرمافزار winrar نیاز دارید.
محتوای فایل دانلودی
فایل شبیهسازی شده با ژوپیتر پایتون
مقاله اصلی به زبان انگلیسی(2021)
گزارش مقاله به فارسی(8 ص)
لینک دانلود مجموعه داده
فیلم اجرای کدها