Россия
Россия
Россия
Воронежская область, Россия
Проблема смещений (bias) в больших языковых моделях (LLM), таких как GPT, является одной из наиболее актуальных в области искусственного интеллекта. Смещения, унаследованные от нерепрезентативных и несправедливых обучающих данных, могут приводить к дискриминационным и вредоносным результатам, усиливающим социальное неравенство. Цель данной статьи — систематизировать и исследовать источники смещений, методы их обнаружения и пути смягчения. В работе формализуется проблема смещения как задача многокритериальной оптимизации, а также предлагается методология математического моделирования для оценки эффективности различных методов снижения смещения. В рамках методологии рассматриваются такие подходы, как предварительная обработка данных, тонкая настройка и контролируемая генерация выходных данных (RLHF). Результаты моделирования демонстрируют, что комбинированное применение этих методов позволяет существенно снизить уровень смещения, однако не устраняет его полностью. Ключевой вывод заключается в необходимости комплексного, многоэтапного подхода к управлению смещениями на протяжении всего жизненного цикла LLM, а также в важности разработки более совершенных методов обнаружения и этических стандартов.
большие языковые модели, смещение (bias), этика ИИ, машинное обучение, RLHF, справедливость
1. Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big? DOI: https://doi.org/10.1145/3442188.3445922
2. Bommasani, R., et al. (2022). On the Opportunities and Risks of Foundation Models.
3. Weidinger, L., et al. (2021). Ethical and social risks of harm from language models.
4. Циммерлинг, А. В. Модальные операторы в автоматических системах перевода и больших языковых моделях / А. В. Циммерлинг, А. М. Баюк // Компьютерная лингвистика и интеллектуальные технологии : Доклады по материалам ежегодной международной конференции "Диалог" (2025), Москва, 23 апреля 2025 года. Том 23. – Москва, 2025. – С. 471-480. – EDN VHOYVM.
5. Мохаммад, Ж. Х. Извлечение ключевых фраз на основе больших языковых моделей / Ж. Х. Мохаммад // Известия ЮФУ. Технические науки. – 2024. – № 5(241). – С. 143-151. – DOIhttps://doi.org/10.18522/2311-3103-2024-5-143-151. – EDN SFYQUK.
6. Цзыюэ, В. Оптимизация и потенциал развития машинного перевода на примере больших языковых моделей типа ChatGPT / В. Цзыюэ // Актуальные вопросы переводоведения и регионоведения : сборник статей Международного форума, Нижний Новгород, 20–22 октября 2023 года. – Нижний Новгород: Нижегородский государственный лингвистический университет им. Н.А. Добролюбова, 2024. – С. 67-75. – EDN VSPADK.



