Россия
Россия
Россия
Россия
Развитие генеративного искусственного интеллекта — от крупных языковых моделей до диффузионных и состязательных архитектур — обнажило стратегическую роль данных. Модели создают новый контент, но качество результата определяется тем, как устроены процессы сбора, хранения, индексирования и доставки обучающих и вспомогательных наборов. Классические реляционные СУБД и распространённые NoSQL‑хранилища предложили основу для многих проектов, однако специфика генеративных систем сместила фокус: возникает потребность в хранении векторных представлений (embeddings), в поиске по смысловой близости, в высокой скорости выборок. Эта монография систематизирует архитектуры баз данных, применимых в генеративных сценариях, рассматривает методы индексирования и интеграции с моделями, а также анализирует риски и направления дальнейшего развития.
генеративные модели; базы данных; векторные базы данных; embeddings; семантический поиск; RAG; индексирование; машинное обучение; безопасность данных; федеративное обучение
1. Garcia-Molina, H.; Ullman, J.; Widom, J. Database Systems: The Complete Book. – 2nd ed. – Pearson, 2023. – 1248 p.
2. Stonebraker, M.; Hellerstein, J. M. Readings in Database Systems (5th ed.). – MIT Press, 2024. – 620 p.
3. Pinecone. Vector Database for Machine Learning. – Режимдоступа: https://www.pinecone.io/, свободный. – Датаобращения: 10.09.2025.
4. Weaviate. Open-SourceVectorDatabase. – Режим доступа: https://weaviate.io/, свободный. – Дата обращения: 09.09.2025.
5. Milvus. Open-SourceVectorDatabaseforAI. – Режим доступа: https://milvus.io/, свободный. – Дата обращения: 12.09.2025.
6. FAISS (FacebookAISimilaritySearch). – Режим доступа: https://github.com/facebookresearch/faiss, свободный. – Дата обращения: 15.09.2025.
7. TimescaleInc. TimescaleDBDocumentation. – Режим доступа: https://docs.timescale.com/, свободный. – Дата обращения: 15.09.2025.
8. InfluxData. InfluxDBDocumentation – Режим доступа: https://docs.influxdata.com/, свободный. – Дата обращения: 15.09.2025.
9. OpenAI. Retrieval-AugmentedGeneration: BestPractices. – Режим доступа: https://platform.openai.com/, свободный. – Дата обращения: 15.09.2025.



