Аннотация и ключевые слова
Аннотация:
В работе представлено сравнительное исследование применения градиентного бустинга и полносвязных нейронных сетей для решения задачи бинарной классификации полезности пользовательских отзывов на платформе Steam. На выборке объёмом более 6,4 миллиона записей проведён анализ эффективности обоих подходов при работе с разреженными текстовыми признаками.

Ключевые слова:
машинное обучение, градиентный бустинг, XGBoost, нейронные сети, классификация текстов, TF-IDF, анализ отзывов
Список литературы

1. Воронцов К.В. Математические методы обучения по прецедентам (теория машинного обучения). - URL: http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf (дата обращения: 15.02.2026).

2. Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. - М.: ДМК Пресс, 2015. - 400 с.

3. Чен Т., Гестрин К. XGBoost: Масштабируемая система бустинга деревьев / Чен Т., Гестрин К. // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. - 2016. - С. 785–794. DOI: https://doi.org/10.1145/2939672.2939785

4. Николенко С.И., Кадурин А.А., Архангельская Е.О. Глубокое обучение. Погружение в мир нейронных сетей. / Николенко С.И., Кадурин А.А., Архангельская Е.О. - СПб.: Питер, 2020. - 480 с.

5. Новикова Т.П. Разработка алгоритма количественного инвестирования на базе Random Forest / Т.П. Новикова, С.А. Евдокимова, У Гоцуй // Моделирование систем и процессов. – 2022. – Т. 15, № 1. – С. 53-60. DOI: https://doi.org/10.12737/2219-0767-2022-15-4-53-60

6. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. / Маннинг К., Рагхаван П., Шютце Х. - М.: Вильямс, 2011. - 528 с.

7. Пальмов С.В. Анализ тональности текстов: методы и приложения // Программная инженерия. - 2018. - № 9. - С. 417–425.

8. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение / Гудфеллоу Я., Бенджио И., Курвилль А. - M.: ДМК Пресс, 2018. - 652 с.

9. Коршунов А.В., Гомзин А.Г. Тематическое моделирование текстов на естественном языке / Коршунов А.В., Гомзин А.Г. // Труды ИСП РАН. - 2012. - Т. 23. DOI: https://doi.org/10.15514/ISPRAS-2012-23-13

10. Провост Ф., Фосетт Т. Data Science для бизнеса. - URL: https://www.researchgate.net/publication/256438799_Data_Science_for_Business (дата обращения: 14.02.2026).

11. Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы интеллектуального анализа данных с использованием R. / Шитиков В.К., Мастицкий С.Э. - URL: https://github.com/ranalytics/data-mining (дата обращения: 17.02.2026).

Войти или Создать
* Забыли пароль?