С развитием информационных технологий происходит постоянный рост объемов информации, а также возрастают требования к скорости предоставления данных, то есть к производительности систем хранения данных(далее СХД).
Традиционный подход к использованию отдельных или выделенных аппаратных систем хранения данных, накладывает большие ограничения по возможностям наращивания объема хранения, а рост производительности обеспечивают за счет покупки дополнительного дорогостоящего оборудования. Внедрение и обслуживание такого оборудования требует наличия высококвалифицированных специалистов, а также дополнительных затрат на поддержку со стороны производителя.
Такая модель использования СХД требует постоянных капитальных затрат в условиях постоянного роста объемов данных. Альтернативой такому подходу является использование программно-определяемых систем хранения данных. Такие СХД предлагают объединение различных, разрозненных ресурсов хранения(локальные диски, NAS/SAN системы, SSD, NVMe) в единые пулы с различным уровнем защиты от потерь данных и различным уровнем производительности. Данные системы используют технологии виртуализации и производительные сети для создания нового типа СХД – виртуального. Преимущества данного подхода заключается в высокой масштабируемости таких решений и низкой стоимости.
Основная идея состоит в том, чтобы использовать объем и производительность локальных источников хранения данных каждого аппаратного сервера или ПК, позволяя при этом наращивать суммарную производительность и объем, как это происходит с вычислительными ресурсами процессора и оперативной памяти(ОЗУ). Таким образом каждый новый узел в кластере хранения добавляет производительности и объема общей виртуальной СХД. При этом узлы не обязательно должны быть идентичными с точки зрения аппаратного обеспечения. Такой подход позволяет хранить в распределенном виде большие объемы данных(петабайты), предоставляя необходимый уровень производительности и защиты от потерь. Узлы хранения могут быть построены как на базе систем виртуализации, так и на базе аппаратных ресурсов(ПК, физический сервер).
Основой такого решения является распределенная файловая системы, которая управляет потоками записи/чтения, определяет уровень отказоустойчивости и производит автоматизацию операций обслуживания. Она позволяет динамически добавлять ресурсы в существующий виртуальных кластер хранения, и перераспределять хранимые данные в случае отказа или отключения ресурсов хранения от кластера.