К основному контенту

Общие сведения об архитектуре хранилища данных и ее различных типах

Управление данными с помощью архитектуры хранилища данных

Сегодня хранение данных распространено в мире управления технологиями и является инновацией, к которой движутся многие организации. Архитектура хранилища данных используется для общей связи и управления данными для всех конечных пользователей в рамках одного предприятия или сети. Практически все хранилища данных отличаются по характеристикам, но характеризуются наличием в них стандартных жизненно важных компонентов.

Все производственные приложения, такие как управление запасами, закупки продуктов к оплате и расчет заработной платы, предназначены для онлайн-обработки транзакций или OLTP. Все такие приложения собирают и используют данные в ходе своей повседневной работы. Приложения для хранения данных поддерживают специальные требования ко всем этим наборам данных и обеспечивают прогнозирование, анализ тенденций, профилирование и сводную отчетность, а также другие задачи.

Складская база данных автоматизирована сверху донизу и обычно обновляется в нерабочее время. Данные, накопленные в хранилище, сортируются, обобщаются и объединяются для дальнейшего использования.

Большинство хранилищ данных и архитектуры, используемые для них в серверной части, различаются в зависимости от элементов в ситуации организации. Общие архитектуры, которым следует специалист по обработке и анализу данных, включают:

  • Основной
  • С промежуточным пространством
  • С киосками данных и промежуточными областями

В этой статье мы рассмотрим архитектуру хранилищ данных и различные типы, используемые в них. Мы углубляемся в технологию и изучаем варианты.

Свойства хранилища данных

Типичное хранилище данных поставляется с несколькими инструментами, которыми могут пользоваться конечные пользователи в хранилище. Инструменты доступа включают в себя:

  • Средства разработки приложений
  • Инструменты запросов и отчетов
  • Информационные инструменты для руководителей
  • Инструменты интеллектуального анализа данных
  • Online Analytical and Processing Tools

Все эти инструменты могут использоваться конечными пользователями для разработки ключевых операций в архитектуре данных. Разобравшись с ключевыми точками доступа, мы теперь прольем свет на свойства хранилища данных. Свойства структурированы в 5 различных головок, в том числе;

  1. Разделение: Разделение является первым свойством хранилища данных, так как вся транзакционная и аналитическая обработка предназначена для того, чтобы храниться как можно дальше друг от друга.
  2. Расширяемость: архитектор, работающий над хранилищем данных, должен иметь возможность выполнять новые операции и запускать новые технологии без необходимости работать над всей системой и обновлять ее от начала до конца.
  3. Административность: администрирование или управление хранилищем данных должно быть упрощено, а не усложняться.
  4. Безопасность: Склад должен иметь протоколы мониторинга и доступа, чтобы убедиться, что все конечные точки и входы в систему всегда надежно охраняются.
  5. Масштабируемость: Рост — это то, что не может отрицать ни одно хранилище данных. Аппаратные и программные протоколы в хранилище данных должны быть чрезвычайно простыми в обновлении. Объем данных в хранилище должен управляться и должен быть постепенно гибким, чтобы соответствовать росту организации.

Типы структуры хранилища данных

Хотя хранилища данных могут быть разных форм, сегодня в мире, ориентированном на данные, существует три основных типа хранилищ данных. К таким типам относятся:

Одноуровневая архитектура

Склад с одноуровневой архитектурой не реализуется комплексно на практике. Одноуровневая архитектура хранилища работает с основной целью минимизации избыточности данных. Одноуровневый склад в основном носит физический характер.

Как известно большинству людей, единственным физическим уровнем в одноуровневом хранилище является исходный уровень. Хранилище данных создается с помощью специального промежуточного программного обеспечения и используется для многомерного представления всех операционных данных.

Одноуровневая структура хранилища данных уязвима по своей природе, так как она не может понять требования к разделению транзакционной и аналитической обработки. Запросы согласовываются с операционными данными и влияют на транзакционные рабочие нагрузки, управляющие хранилищем.

Двухуровневая архитектура

Недостатки одноуровневой модели и потребность в дополнительном разделении устраняются за счет двухуровневой структуры хранилища данных, рассмотренной ниже:

Хотя этот тип хранилища данных известен как двухуровневый, поскольку он разделяет физические источники в хранилище данных, на самом деле в этой архитектуре присутствует четыре уровня и последующие этапы.

Эти слои включают в себя:

  1. Начальный исходный уровень: Большинство двухуровневых хранилищ данных используют разнородные источники данных. Данные поступают из информационных систем внутри или за пределами стен организации.
  2. Промежуточный уровень данных: Промежуточный уровень данных контролирует извлечение, очистку и структурирование всех данных. Промежуточный процесс предусматривает интеграцию данных вместе с устранением всех пробелов и несоответствий. Здесь происходят такие процессы, как трансформация, экстракция и ETL.
  3. Хранилище данных: информация, размещенная и структурированная на предыдущем уровне, теперь сохраняется в отдельном репозитории, известном как хранилище данных. Доступ к хранилищу данных также можно получить само по себе, но в основном оно реплицируется в виде витрин данных, которые передаются отдельным отделам.
  4. Анализ: Это уровень, на котором гибко и эффективно доступны все данные, присутствующие в хранилище. Анализ поможет получить полезную информацию и принять бизнес-решения.

Трехуровневая архитектура

Трехуровневая модель хранилища данных добавляет согласованный слой между исходным уровнем и уровнем хранилища данных двухуровневой архитектуры. Согласованный слой располагается между источником и складом.

Согласованный уровень помогает создать модель ссылок для отделов по всей организации. Согласованный уровень также можно использовать для генерации потоков данных, подачи внешних процессов и обеспечения интеграции данных по всем направлениям. Ссылочный слой может уводить слой анализа немного дальше от источника, создавая своего рода замедленную съемку.

Хранилища данных и их архитектуры играют неотъемлемую роль в сегодняшнюю цифровую эпоху, основанную на данных. Три типа хранилищ данных помогают получать полезную информацию о данных в организациях и предоставляют аналитику.

Комментарии

Популярные сообщения из этого блога

Опробование GPT4All в Arch Linux

10 способов использовать генеративный ИИ для продвинутого SEO

Как настроить Atom как Python IDE?

Yandex.Metrika counter