ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ФИЛЬТРАЦИИ СПАМА В ЭЛЕКТРОННОЙ ПОЧТЕ
Главная статья
Аннотация
В данной статье рассматривается применение алгоритмов машинного обучения для автоматической фильтрации спам-сообщений в электронной почте. В качестве основной модели была выбрана логистическая регрессия, отличающаяся высокой интерпретируемостью и эффективностью при работе с текстовыми данными. Для эксперимента использовался реальный набор данных из открытого источника, включающий размеченные письма категории “спам” и “не спам”. Предобработка была сведена к минимуму: проведено только удаление дубликатов и векторизация текста.. Результаты модели показали высокие значения точности (97.87%), полноты (86.23%), precision (97.54%) и F1-меры (91.54%), что подтверждается также анализом матрицы ошибок. Полученные результаты демонстрируют целесообразность использования логистической регрессии как надёжного и эффективного инструмента в задачах фильтрации электронной корреспонденции. Работа может служить основой для дальнейших исследований и разработки более сложных систем интеллектуальной защиты от спама.
Подробнее

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.
Неисключительные права на статью передаются журналу в полном соответствии с Лицензией Creative Commons By-NC-SA 4.0 (Международная)