COMPARATIVE ANALYSIS OF CLOUD SYSTEMS ARCHITECTURES OPERATING BIG DATA

E. Chernyshova; V. Kondusova; G. Spesivtsev

doi:doi:10.58168/MoInSyTe2024_495-500

Home / Conferences / MODELING INFORMATION SYSTEMS AND TECHNOLOGIES / Materials of the International Scientific and Practical Conference «MODELING INFORMATION SYSTEMS AND TECHNOLOGIES»

COMPARATIVE ANALYSIS OF CLOUD SYSTEMS ARCHITECTURES OPERATING BIG DATA

Submit manuscript Download PDF
Text

To cite

COMPARATIVE ANALYSIS OF CLOUD SYSTEMS ARCHITECTURES OPERATING BIG DATA

Section: SECTION 2. DESIGN AUTOMATION SYSTEMS

Proceedings: MATERIALS OF THE INTERNATIONAL SCIENTIFIC AND PRACTICAL CONFERENCE «MODELING INFORMATION SYSTEMS AND TECHNOLOGIES»

UDC 004.9

E. Chernyshova ¹

V. Kondusova ²

G. Spesivtsev ³

Author and publication information

Authors:

1. Voronezh State University of Forestry and Technologies named after G.F. Mo-rozov
Russian Federation

2. Voronezh State University of Forestry and Technologies named after G.F. Morozov
Russian Federation

3. Voronezh State University of Forestry and Technologies named after G.F. Morozov
Russian Federation

Type:

Сonference article

DOI:

https://doi.org/10.58168/MoInSyTe2024_495-500

Pages:

from 495 to 500

Published:

17.09.2024

Subject area:

UDC 004.9

Language:

Russian

Keywords:

distributed architecture, server-client architecture, Big Data, cloud systems

Abstract and keywords

Abstract:
The article provides a comparative analysis of the architecture of cloud systems operating big data. The architecture of cloud systems working with Big Data is a complex infrastructure, which is a system for storing, processing and working with large volumes of analysis data in a cloud environment. Analysis of the architectures that operate Big Data allows us to identify their disadvantages and advantages, as well as the features of their work.

Keywords:
distributed architecture, server-client architecture, Big Data, cloud systems

Text

Text (PDF): Read Download

Распределенная архитектура считается одной из основных архитектурных моделей в работе с Big Data в облачной системе. Данная архитектура легко масштабируема и производительна это достигается за счет того, что в этой модели данные храниться и обрабатываться на нескольких серверах или узлах данные разбиваются на части что обеспечивает анализ больших объёмов данных и параллельную обработку. Примерами распределенных облачных систем для Big Data являются Apache Hadoop, Apache Spark и Google Cloud Dataflow. Данная системы предоставляют инструменты обработки анализа данных и хранения данных в облаке используя для этого распределенную архитектуру и с ее помощью достигают масштабируемости и производительности системы.

К основным характеристикам распределенной архитектуры Big Data, а облачной системе относят:

Горизонтальное масштабирование: это возможность увеличения производительности, а также обработки данных благодаря возможности добавления новых узлов.
Отказоустойчивость: если один из узлов выдает ошибку и перестает работать данные сохраняться автоматически, и обработка проходит без прерываний.
Параллельная обработка: одновременная обработка данных на нескольких узлах ускоряет процесс анализа данных.
Распределенное хранение: для обеспечения баланса доступности и нагрузки данные распределяться автоматически.
Управление данными: выполнения задач на различных узлах и распределение данных автоматически управляется системой.

Также рассмотрим недостатки распределенной архитектуры Big Data в облаке:

Сложность управления: управление данной архитектурой требует наличия специальных знаний, а также навыков что вызывает трудности для части организации.
Затраты на инфраструктуру: развертывание обслуживание и поддержка распределенной архитектуры требует значительных затрат на обслуживание серверов и инфраструктуру.
Безопасность: распределенная архитектура требует увеличения количества сервера, а это влияет на риск утечки данных или несанкционированного доступа к информации и это требует дополнительных способов сохранения безопасности.
Согласованность данных: между различными узлами распределённой архитектуры возникают проблемы согласованности данных что приводит к ошибкам в анализе.

Распределенная архитектура Big Data в облаке в целом являет собой эффективное решение для работы с большими объёмами данных, однако стоит отметить, что для успешной реализации стоит учитывать ее особенности и недостатки что бы избежать рисков и обеспечивать эффективный анализ данных.

Другой популярной архитектурой облачных систем, оперирующих Big Data, является сервер-клиентская архитектура. В данной архитектуре данные

хранятся на сервере централизованно, а приложения клиентов получают доступ к данным через интерфейс или с помощью API. Примерами таких облачных систем являются Amazon Web Services (AWS) и Microsoft Azure.

Сейчас идет постоянный рост объёмов данных и сильной необходимостью эффективного и быстрого их анализа и за этого клиента серверная архитектура все больше набирает популярность среди решений для предприятий. Данная модель является системой, где с клиентскими устройствами через облачную инфраструктуру взаимодействуют серверы, хранящие данные и обрабатывающие их обеспечивая возможность и доступа к данным и анализу большого объёма информации в реальном времени.

Преимущества сервер-клиентской архитектуры Big Data в облаке:

Масштабируемость: По мере необходимости серверы в облаке могут быть масштабируемы горизонтально и вертикально что обеспечит увеличение объёма хранимых данных и производительность.
Отказоустойчивость: обеспечение с помощью облачных серверов высокой доступности данных и при отказе одного сервера перенаправление нагрузки на другие узлы уменьшая риск потери информации.
Гибкость: для обеспечения гибкости в работе с информацией устройства клиентов имеют доступ к данным из любой точки мира через интернет.
Быстродействие: для ускорения и оптимизации бизнес-процессов обработка и анализ данных больших объёмов информации происходят на облачных серверах.

Рассмотрим недостатки сервер-клиентской архитектуры Big Data в облаке:

Высокие затраты на обслуживание: для организации с ограниченным бюджетом это может серьезной проблемой так как подержание и обновление серверов требует значительных финансовых затрат как на техническую поддержку, так и на инфраструктуру.
Одиночная точка отказа: при выходе из строя сервера, на котором храниться данные это приводит к недоступности информации для приложений клиентов, а отсутствие резервного копирования повлечёт за собой потерю ценной информации.
Низкая отказоустойчивость: если происходит сбой в сете или отказ сервера временно может быть потерян доступ к данным что привет к задержке работы с информации и данными.
Безопасность данных: сервер-клиентская архитектура подразумевает хранение всей информации на централизованных серверах что увеличивает риск утечки информации и несанкционированного доступа к ней Иза этого приходиться принимать дополнительные меры для обеспечения безопасности данных на серверах.

В целом, сервер-клиентская архитектура, как и распределенная имеет свои плюсы и минусы, которые стоит учитывать при внедрении и разработки системы обработки и внедрения данных. Можно сказать, что сервер-клиентская архитектура — это гибкое и эффективное решение для работы с большими данными которая обеспечивает должную производительность. Из чего следует что организациям проще и быстрее адаптироваться к меняющемся потребностям рынка что обеспечит эффективность бизнес-процессов.

Сравнивая две архитектурные модели, которые мы рассмотрели выше это распределенная архитектура и сервер-клиентской архитектуры, можно выделить следующие преимущества и недостатки каждой из них:

Распределенная архитектура:

Преимущества: высокая производительность, горизонтальное масштабирование, отказоустойчивость, пероральная обработка, распределённое хранение, управление данными.

Недостатки: сложность настройки и управления, требовательность к ресурсам, затраты на инфраструктуру, безопасность.

2. Сервер-клиентская архитектура:

Преимущества: простота использования, централизованное управление данными, гибкость и быстродействие.

Недостатки: ограничения по производительности и масштабируемости, высокие затраты на обслуживание, низкая отказоустойчивость, одиночная точка отказа.

В зависимости от конкретных задач организации или компании и потребностей можно выбрать оптимально подходящую архитектуру для работы с Big Data в облаке. При выборе подходящей системы нужно учитывать много факторов требования к производительности системы также к безопасности данных масштабируемости системы и другие важные факторы. Таким образом, проведенный сравнительный анализ архитектур распределенной архитектуры и сервера-клиентской архитектуры позволяет выбрать самый подходящий вариант для конкретных потребностей и задач организации. Каждая из рассмотренных моделей имеет свои недостатки и преимущества, которые нужно учитывать при выборе системы для работы с Big Data в облаке.

References

1. Shipilova E.A., Nekrylov E.E., Kurchenkova T.V. Analiz i modelirovanie traektoriy povedeniya pol'zovateley onlayn-servisov s ispol'zovaniem platformy RETENTIONEERING // Modelirovanie sistem i processov. – 2022. – T. 15, № 3. – S. 82-93.

2. Strength test of the industrial building's load-bearing structures / Sazonova S.A., Nikolenko S.D., Zyazina T.V., Chernyshova E.V., Kazbanova I.M. // Journal of Physics: Conference Series. III International Conference on Metrological Support of Innovative Technologies (ICMSIT-III-2022). Krasnoyarsk. – 2022. – S. 22016

3. Karpenko, A. Oblachnye arhitektury: razrabotka ustoychivyh i ekonomichnyh oblachnyh prilozheniy. (2023): 50-53.

4. Novikova T. P. Upravlenie dannymi: laboratornyy praktikum / T. P. Novikova. – Voronezh, 2022. – 106 s.

5. Vaygend, A. BIG DATA. Vsya tehnologiya v odnoy knige". (2019): 14-23.

6. Su, K. Teoreticheskiy minimum po Big Data. Vse chto nuzhno znat' o bol'shih dannyh. (2020): 33-43.

7. Razrabotka special'nogo programmnogo obespecheniya steganograficheskogo skrytiya informacii v audiofaylah / Zhumatiy V.P., Denisenko D.I., Chernyshova E.V. // Informatika: problemy, metody, tehnologii. Materialy XX Mezhdunarodnoy nauchno-metodicheskoy konferencii ; pod red. A.A. Zacarinnogo, D.N. Borisova. – 2020. – S. 1022-1031.

8. Poluektov A.V., Makarenko F.V., Yagodkin A.S. Ispol'zovanie storonnih bibliotek pri napisanii programm dlya obrabotki statisticheskih dannyh // Modelirovanie sistem i processov. – 2022. – T. 15, № 2. – S. 33-41.

Submit manuscript Download PDF
Text

To cite

Citations:

Confirmation

Регистрация