Крупный международный облачный файл-хостинг рос быстрее, чем его инфраструктура. Ручное управление серверами при 3M пользователях стало критическим риском. Мы перевели всё на IaC, автомасштабирование и CI/CD — за 18 дней.
Сервис обслуживал 3 миллиона пользователей и хранил петабайты данных, но инфраструктура управлялась вручную. Каждый деплой занимал до 4 часов и требовал ручного вмешательства инженеров.
При пиковых нагрузках масштабирование занимало 2-3 часа. Риск человеческой ошибки при работе с production-данными был неприемлемо высок.
Мы перевели всю инфраструктуру на Terraform: каждый сервер, балансировщик, S3-бакет описан кодом. Packer-образы обеспечивают идентичность окружений. Auto Scaling Groups реагируют на нагрузку автоматически.
GitLab CI/CD обеспечивает zero-downtime деплои через rolling updates. Prometheus + Grafana дают полную видимость 12K+ одновременных соединений в реальном времени.
| Метрика | До | После | Изменение |
|---|---|---|---|
| Деплой новой версии | ~4 часа (вручную) | ~60 минут (CI/CD) | -75% |
| Масштабирование при пиках | Ручное, 2-3 часа | Авто, 5-10 минут | -95% |
| Доступность сервиса | 99.5% | 99.99% | +0.49% |
| Операционные затраты | Базовый уровень | -30% от базового | -30% |
| Одновременные подключения | ~3K | 12K+ | +4x |
100% инфраструктуры описано в Terraform. Любой сервер можно пересоздать за минуты. Нет ни одного ресурса, созданного вручную.
Packer собирает готовые AMI-образы с предустановленным ПО. Auto Scaling Group запускает идентичные инстансы — никаких конфигурационных дрейфов.
Горячие данные на SSD-инстансах, холодные — в S3. PDS для объектного хранилища. MySQL с read replicas для метаданных. Итог: 6 PB при минимальных затратах.
«Мы не верили, что за 18 дней можно перевести петабайтное хранилище на IaC без единого часа даунтайма. Теперь наш деплой занимает час вместо четырёх, а масштабирование происходит автоматически.»
Расскажите о вашей инфраструктуре — мы предложим конкретный план за 24 часа.