ОПРЕДЕЛЕНИЕ ЭТАПОВ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА И ВЫБОР АЛГОРИТМА КЛАСТЕРИЗАЦИИ СООБЩЕНИЙ ЖУРНАЛЬНЫХ ФАЙЛОВ СЕРВЕРА | Международный журнал информационных технологий и энергоэффективности

PDF

Опубликована ноя 6, 2022

А.Д. Янул

Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А.Бонч-Бруевича

Аннотация

В статье приводится обоснование разработки собственного российского ПО, представлено приложение для кластеризации сообщений журнальных файлов сервера и описан эксперимент по определению этапов предварительной обработки текста для процесса кластеризации. Также приводится обоснование основного инструментария для выполнения данной задачи (библиотеки scikit-learn (Python)) и выбор алгоритмов кластеризации (DBSCAN и BIRCH). По ходу статьи на графиках приведены зависимости качества кластеризации (в виде коэффициента Силуэта) и времени выполнения процесса от выбранных этапов предварительной обработки. В заключении дается анализ полученных в ходе эксперимента зависимостей.

Как цитировать

ЯНУЛ, А.Д.. ОПРЕДЕЛЕНИЕ ЭТАПОВ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА И ВЫБОР АЛГОРИТМА КЛАСТЕРИЗАЦИИ СООБЩЕНИЙ ЖУРНАЛЬНЫХ ФАЙЛОВ СЕРВЕРА. Международный журнал информационных технологий и энергоэффективности, [S.l.], v. 7, n. 3(25) ч.2, p. 008-015, ноя. 2022. ISSN 2500-1752. Доступно на: <http://openaccessscience.ru/index.php/ijcse/article/view/198>. Дата доступа: 09 мая 2025

ABNT APA BibTeX CBE EndNote - формат EndNote (Macintosh & Windows) MLA Формат ProCite - RIS (Macintosh & Windows) RefWorks Формат Reference Manager - RIS (только Windows) Turabian

Выпуск

Том 7 № 3(25) ч.2 (2022)

Раздел

Информационные технологии

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.

Неисключительные права на статью передаются журналу в полном соответствии с Лицензией Creative Commons By-NC-SA 4.0 (Международная)

Статьи на боковой панели

Главная статья

Аннотация

Подробнее