ИСПОЛЬЗОВАНИЕ МЕТОДА TF-IDF ДЛЯ ДЕТЕКТИРОВАНИЯ ВРЕДОНОСНЫХ PDF ФАЙЛОВ

Главная статья

Н.Д. Огольцова

Аннотация

В статье рассматривается применение метода TF-IDF (Term Frequency-Inverse Document Frequency) для обнаружения вредоносных PDF файлов. Исследуется, как этот метод может быть использован для анализа текста внутри PDF документов, чтобы определить, содержит ли файл вредоносный код или нет. Метод TF-IDF позволяет извлекать ключевые слова из текста, что делает его эффективным инструментом для анализа больших объемов данных. В статье подробно описывается процесс интеграции TF-IDF с алгоритмами машинного обучения, что позволяет значительно улучшить точность и эффективность обнаружения вредоносных файлов. Также рассматриваются преимущества и ограничения предложенного подхода, а также возможности интеграции с другими извлекаемыми признаками из PDF документов для детектирования их вредоносности.

Подробнее

Как цитировать
ОГОЛЬЦОВА, Н.Д.. ИСПОЛЬЗОВАНИЕ МЕТОДА TF-IDF ДЛЯ ДЕТЕКТИРОВАНИЯ ВРЕДОНОСНЫХ PDF ФАЙЛОВ. Международный журнал информационных технологий и энергоэффективности, [S.l.], v. 9, n. 5(43), p. 013-017, мая 2024. ISSN 2500-1752. Доступно на: <http://openaccessscience.ru/index.php/ijcse/article/view/590>. Дата доступа: 03 июля 2024
Раздел
Информационные технологии