ИСПОЛЬЗОВАНИЕ МЕТОДА TF-IDF ДЛЯ ДЕТЕКТИРОВАНИЯ ВРЕДОНОСНЫХ PDF ФАЙЛОВ
Главная статья
Аннотация
В статье рассматривается применение метода TF-IDF (Term Frequency-Inverse Document Frequency) для обнаружения вредоносных PDF файлов. Исследуется, как этот метод может быть использован для анализа текста внутри PDF документов, чтобы определить, содержит ли файл вредоносный код или нет. Метод TF-IDF позволяет извлекать ключевые слова из текста, что делает его эффективным инструментом для анализа больших объемов данных. В статье подробно описывается процесс интеграции TF-IDF с алгоритмами машинного обучения, что позволяет значительно улучшить точность и эффективность обнаружения вредоносных файлов. Также рассматриваются преимущества и ограничения предложенного подхода, а также возможности интеграции с другими извлекаемыми признаками из PDF документов для детектирования их вредоносности.
Подробнее
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.
Неисключительные права на статью передаются журналу в полном соответствии с Лицензией Creative Commons By-NC-SA 4.0 (Международная)