ОПРЕДЕЛЕНИЕ ЭТАПОВ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА И ВЫБОР АЛГОРИТМА КЛАСТЕРИЗАЦИИ СООБЩЕНИЙ ЖУРНАЛЬНЫХ ФАЙЛОВ СЕРВЕРА

Главная статья

А.Д. Янул

Аннотация

В статье приводится обоснование разработки собственного российского ПО, представлено приложение для кластеризации сообщений журнальных файлов сервера и описан эксперимент по определению этапов предварительной обработки текста для процесса кластеризации. Также приводится обоснование основного инструментария для выполнения данной задачи (библиотеки scikit-learn (Python)) и выбор алгоритмов кластеризации (DBSCAN и BIRCH). По ходу статьи на графиках приведены зависимости качества кластеризации (в виде коэффициента Силуэта) и времени выполнения процесса от выбранных этапов предварительной обработки. В заключении дается анализ полученных в ходе эксперимента зависимостей.

Подробнее

Как цитировать
ЯНУЛ, А.Д.. ОПРЕДЕЛЕНИЕ ЭТАПОВ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА И ВЫБОР АЛГОРИТМА КЛАСТЕРИЗАЦИИ СООБЩЕНИЙ ЖУРНАЛЬНЫХ ФАЙЛОВ СЕРВЕРА. Международный журнал информационных технологий и энергоэффективности, [S.l.], v. 7, n. 3(25) ч.2, p. 008-015, ноя. 2022. ISSN 2500-1752. Доступно на: <http://openaccessscience.ru/index.php/ijcse/article/view/198>. Дата доступа: 22 дек. 2024
Раздел
Информационные технологии