Аннотация и ключевые слова
Аннотация (русский):
В работе предложен ML-фреймворк для классификации лесных пожаров на основе синтеза больших данных. Использованы данные ERA5 Copernicus, исторические данные о пожарах Рослесхоза и геоданные Сибири. Применены пространственно-временная фильтрация и алгоритмы повторной выборки. Модель эффективно выявляет пожары, минимизируя ложные срабатывания, и может быть интегрирована в системы раннего предупреждения для российских лесов.

Ключевые слова:
лесной пожар, классификация, машинное обучение, обучение с учителем, набор данных, большие данные, случайный лес, XGBoost, LightGBM, SMOTE, NearMiss, SMOTE-ENN
Список литературы

1. Рослесхоз. Открытые данные о лесных пожарах за 2000–2018 гг. // https://rosleshoz.gov.ru. – Режим доступа: 15.03.2024. – 120 с.

2. Tyukavina, A. Global trends of forest loss due to fire from 2001 to 2019 / A. Tyukavina, P. Potapov, M.C. Hansen // Frontiers in Remote Sensing. – 2022. – Vol. 3. – P. 825190. – 15 с.

3. Ghate, S.N. Forest wildfire detection and forecasting utilizing machine learning and image processing / S.N. Ghate, P. Sapkale, M. Mukhedkar // 2023 International Conference for Advancement in Technology (ICONAT). – IEEE, 2023. – P. 1–8. – 8 с.

4. Hersbach, H. ERA5 hourly data on single levels from 1940 to present / H. Hersbach et al. // Copernicus Climate Change Service (C3S) Climate Data Store (CDS). – 2023. – 280 с. – URL: https://cds.climate.copernicus.eu

5. Росстат. Стандартная классификация субъектов Российской Федерации. // https://rosstat.gov.ru. – Режим доступа: 10.02.2024. – 45 с.

6. Росреестр. ГИС-сервис «Гидрография» (2022). // https://pkk.rosreestr.ru. – Режим доступа: 12.02.2024. – 30 с.

7. Kaur, P. Data integration framework with multi-source big data for enhanced forest fire prediction / P. Kaur et al. // Manuscript under review. – 2023. – 25 с.

8. ГОСТ Р 57976-2017. Методика оценки пожарной опасности лесов. – М.: Изд-во стандартов, 2017. – 32 с.

9. Lemaître, G. Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning / G. Lemaître, F. Nogueira, C.K. Aridas // Journal of Machine Learning Research. – 2017. – Vol. 18(17). – P. 1–5. – 5 с.

10. Chawla, N.V. SMOTE: Synthetic minority over-sampling technique / N.V. Chawla et al. // Journal of Artificial Intelligence Research. – 2002. – Vol. 16. – P. 321–357. – 37 с.

11. Batista, G.E. A study of the behavior of several methods for balancing machine learning training data / G.E. Batista et al. // ACM SIGKDD Explorations Newsletter. – 2004. – Vol. 6(1). – P. 20–29. – 10 с.

12. Rodriguez-Galiano, V.F. An assessment of the effectiveness of a random forest classifier for land-cover classification / V.F. Rodriguez-Galiano et al. // ISPRS Journal of Photogrammetry and Remote Sensing. – 2012. – Vol. 67. – P. 93–104. – 12 с.

13. Chen, T. XGBoost: A scalable tree boosting system / T. Chen, C. Guestrin // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. – 2016. – P. 785–794. – 10 с.

14. Ke, G. LightGBM: A highly efficient gradient boosting decision tree / G. Ke et al. // Advances in Neural Information Processing Systems. – 2017. – Vol. 30. – P. 3146–3154. – 9 с.

Войти или Создать
* Забыли пароль?