Единственная точка отказа | Простой обзор

По | 24.09.2020

В области информационных технологий проектирование систем включает в себя процесс определения архитектуры, интерфейсов, модулей и данных для системы, которая удовлетворяет определенным требованиям. Это важный процесс для повышения эффективности разработки продуктов / услуг и обеспечения удобного взаимодействия с пользователем.

Допустим, у вас есть приложение, которое ежедневно обслуживает миллионы пользователей. На стороне сервера вам нужны отличные инженеры, чтобы обрабатывать такой большой объем запросов. Запросы к серверу никогда не должны завершаться ошибкой, даже если есть проблема с базой данных или аппаратный сбой.

Однако, если бэкэнд или интерфейс не спроектирован правильно, простая ошибка может привести к закрытию всего приложения — всего, от сервера до компьютерной сети. Одним из основных источников таких ошибок является Single Point Of Failure (SPOF).

В этой обзорной статье мы объяснили, почему SPOF — самая серьезная проблема для ИТ-специалистов, его общий источник и как уменьшить такие сбои. Начнем с основного вопроса.

Что такое единственная точка отказа?

Определение: Единственная точка отказа — это любая часть системы, которая в случае отказа приводит к прекращению работы всей системы. Проще говоря, если что-то сломается, все выйдет из строя.

SPOF возникают из-за ошибочного дизайна и плохих методов реализации. Они нежелательны в любой системе, будь то программное приложение, аппаратный модуль, производственная система или бизнес-практика.

Например, если вы запускаете веб-сайт, который размещен только на одном сервере в определенном месте, то этот сервер будет единственной точкой отказа. Если сервер выйдет из строя, посетители не смогут получить доступ к сайту. Эта единая точка может остановить все действия, связанные с вашим сайтом. Если такой риск существует в вашем бизнесе, вам необходимо принять меры для его снижения.

Какое решение?

Самый эффективный способ снизить потенциальный риск SPOF — это добавить избыточность. Это включает в себя установку избыточных аппаратных компонентов и программных приложений.

Например, можно использовать избыточные массивы независимых дисков (RAID) для хранения баз данных сервера каталогов или развернуть несколько дублирующих экземпляров серверов каталогов на разных хостах.

Избыточность может быть добавлена ​​на разных уровнях. Возьмем пример с независимым таксистом. На низком уровне у него могут быть инструменты и запасные части для ремонта автомобиля в случае его поломки. На среднем уровне он может одолжить такси своего друга, чтобы выполнить эту работу. На высшем уровне у него может быть другая машина и достаточно комплектующих, чтобы полностью заменить неисправные детали в случае многократных поломок.

Теперь давайте посмотрим на простой пример избыточности вычислений.

1.) В простой настройке может быть несколько возможных единственных точек отказа.

фигура 1

2.) Некоторые единичные точки отказа можно избежать, добавив дублирующиеся компоненты оборудования.

фигура 2

3). Нулевого SPOF можно достичь, построив систему с полным резервированием, хотя такая установка намного дороже, чем простая установка, показанная на рисунке 1.

Рисунок 3 | Нулевой SPOF

На системном уровне можно развернуть балансировщик нагрузки, чтобы обеспечить высокую доступность кластера серверов. В этом случае на каждом сервере может быть несколько жестких дисков, блоков питания и других модулей. Более высокий уровень избыточности может быть достигнут за счет добавления дополнительных серверов, которые могут взять на себя нагрузку активных серверов в случае их выхода из строя.

Сам центр обработки данных поддерживает множество операций, например бизнес-логику. Следовательно, он сам по себе является потенциальным SPOF для бизнеса, если его функции не могут быть воспроизведены где-либо еще.

На уровне сайта (наивысшем) весь центр обработки данных может быть реплицирован с различными настройками и доступен, когда основной сервер перестает отвечать. Этот тип резервирования обычно находится в центре внимания программы обеспечения отказоустойчивости или восстановления ИТ-инфраструктуры.

Чтобы не было SPOF, в больших сетях, включая Интернет и ARPANET, используется коммутация пакетов, метод маршрутизации и передачи данных по цифровой сети в пакеты. Он использует несколько путей между двумя хостами в сети и оптимально использует пропускную способность канала.

Прочтите: 10 организаций, контролирующих Интернет

Когда возникает ошибка в любом узле между двумя хостами, данные передаются через альтернативный узел. Коммутация пакетов также минимизирует задержку передачи и повышает надежность связи.

Для предотвращения возникновения единой точки отказа широко используются три сетевых протокола:

  1. Промежуточная система к промежуточной системе эффективно перемещает информацию в компьютерной сети, определяя лучший маршрут для данных.
  2. Сначала откройте кратчайший путь распределяет информацию о маршрутизации между маршрутизаторами, принадлежащими одной автономной системе. Для передачи данных он использует алгоритм «сначала кратчайший путь» (алгоритм Дейкстры).
  3. Кратчайший путь моста упрощает разработку и настройку сети, обеспечивая многопутевую маршрутизацию.

Оценка SPOF

Три общих места, где обычно появляются SPOF, — это оборудование, программное обеспечение и сторонние услуги / поставщики. Люди также являются единственной точкой отказа в большинстве организаций, но на них часто не обращают внимания. Люди в бизнесе могут быть SPOF по нескольким причинам, таким как ошибки, мошенничество, нечестность, недостаток знаний и ограниченный опыт.

Следующим шагом после обнаружения SPOF будет его классификация с точки зрения сложности его исправления. Всего может быть три категории:

  • Легко: Может быть исправлено в разумные сроки и за разумные деньги.
  • Умеренный: Не может быть исправлено напрямую; тем не менее, можно разработать надежный обходной путь.
  • Трудно: Неисправность сложна и требует больших затрат для устранения.

В дополнение к этому, SPOF могут быть классифицированы с точки зрения вероятности возникновения (низкий, средний и высокий риск) и их воздействия на бизнес (низкий, средний и высокий уровень воздействия).

Предотвращение единой точки отказа

Поскольку очень многие критически важные процессы зависят от сетевого подключения, просто нельзя терпеть отключения центров обработки данных. Тем не менее, более 30% всех центров обработки данных ежегодно выходят из строя. Около 34% предприятий говорят, что один час простоя стоит более 1 миллиона долларов.

Независимо от потерь, произошедших из-за простоя центра обработки данных, в действительности 80% простоев можно предотвратить. Хотя любой инструмент в сети может быть угрозой SPOF, большинство отключений вызвано вредоносным ПО и другими киберугрозами.

Читайте: 13 различных типов компьютерных вирусов

Современные инструменты защиты от угроз, включая балансировщики нагрузки, системы предотвращения вторжений, брандмауэры веб-приложений и решения Advanced Threat Protection, всегда подвергаются риску при сбоях питания или сбоях контроллера сетевого интерфейса или при фильтрации интернет-трафика.

Эти инструменты уязвимы как для обычных угроз, таких как атаки методом перебора, так и для сложных угроз, таких как внедрение внешних объектов XML или подделка межсайтовых запросов. Поскольку они не могут постоянно защищать сеть, необходимо принимать избыточные меры безопасности.

Существует несколько методов реализации архитектуры брандмауэра веб-приложений, которые сводят к минимуму эффективность и частоту широкого спектра атак. Например, многоуровневые брандмауэры веб-приложений разделяют различные модули приложений в зависимости от их операций на несколько уровней.

Поскольку каждый уровень работает в отдельной системе, SPOF отсутствует. Точно так же правильная реализация нескольких балансировщиков нагрузки может уменьшить количество единой точки отказа в сети.

Не кладите все яйца в одну корзину

Хотя многие компании предоставляют свои собственные версии облачных резервных копий, не рекомендуется полагаться только на одну резервную копию для защиты данных вашего бизнеса. Даже облачные сервисы от технологических гигантов, таких как Amazon, Microsoft и Google, терпят неудачу несколько раз в год.

Читайте: 25 крупнейших изобретений в области компьютерных наук

Если вы управляете компанией, вам необходимо учитывать все возможные сценарии при создании избыточности. Не думайте, что кто-то может обеспечить 100% безотказную работу и всегда будьте готовы с Планом Б, если что-то пойдет не так.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *