Курс для ИТ-архитекторов и специалистов по проектированию и разработке архитектуры данных (Big Data), планированию инфраструктуры озер данных (Data Lakes) и проектов Big Data в компаниях.
Что такое архитектура данных
Сегодня любое предприятие управляется данными. Многие компании создают и активно используют корпоративные хранилища данных (КХД, DWH — Data WareHouse), куда стекается информация из множества источников: интернет, внутренние и внешние информационные системы, технологическое оборудование и т.д. Традиционные принципы проектирования таких озер данных не справляются с требованиями современного бизнеса: огромные объемы разноформатных файлов, высокая скорость доступа к информации, облачная инфраструктура, гибкие настройки многопользовательского доступа. Архитектурное проектирование системы, включая построение модели данных — это фундамент, без подготовки которого невозможно построение надежного озера данных, традиционного хранилища или аналитической системы.
Технологии Big Data ориентированы на эффективное, безопасное и непротиворечивое управление данными в масштабе всего предприятия. Большинство бизнесов в качестве одного из ключевых направлений своего развития называют Data Centric (дата-центричность). Ожидается, что разработка и внедрение проектов Big Data, таких как озера данных (Data Lake), расширят возможности «традиционных » DWH. Однако, всегда ли эти ожидания оправдываются? Все ли зависит от выбранного технологического стека? Что можно сделать, чтобы избежать фиаско Big Data-проекта? Как внедрить технологии Big Data в production, не разрушая существующие КХД, а дополняя их новыми функциональными возможностями? Ответить на эти вопросы поможет наш курс «Архитектура данных».