Одним из этапов становления и развития IТ-инфраструктуры организаций является важный процесс выбора платформы для запуска своих сервисов. В основном предпочтение отдается аппаратной архитектуре x86 с операционной системой Linux на борту. Это связано с большой распространенностью этой архитектуры и ее относительной совокупной дешевизной за счет использования программного обеспечения с открытым исходным кодом. Уровень надежности, который обеспечивается такой платформой, бывает достаточным для запуска большинства серверных приложений. При этом сбой в работе этих приложений, как правило, не приводит к существенным убыткам. Однако, у многих организаций есть такие сервисы, малейший простой которых может привести к большим репутационным и финансовым потерям.
Исследования показывают, что в 2018 году организации определяли класс надежности mission-critical как 0.20, то есть менее 12 минут незапланированного простоя сервера в год. При этом, в качестве трех основных причин простоев указываются человеческие ошибки, связанные с неправильной конфигурацией, планированием систем и т.п. (80%), безопасность (57%) и сложность систем (44%).
Для обеспечения надлежащего уровня надежности, а также других немаловажных условий для запуска критичных приложений, хотим обратить внимание специалистов на серверные системы IBM Power с операционной системой AIX.
ОС AIX является проприетарной коммерческой системой UNIX от IBM, которая непрерывно и успешно развивается, начиная с середины 80-х годов прошлого века. Работает данная ОС на серверах IBM с процессорами Power с RISC-архитектурой. На сегодняшний день данная платформа представлена серверами IBM Power с процессорами Power9 и ОС AIX версии 7.2.
Эта платформа обеспечивает исключительный уровень надежности по сравнению с архитектурой x86. Основываясь на отчете ITIC 2017 — 2018 Global Server Hardware, Server OS Reliability Report, платформа Power+AIX является лидером по надежности, уступая только мейнфреймам IBM. Следующее изображение показывает сравнение количества простоев различных систем:
Такая надежность обеспечивается уникальными свойствами архитектуры, малая часть из которых перечислена ниже:
- Серверы IBM Power поставляются со встроенным аппаратным гипервизором, позволяющим создавать виртуальные серверы (LPAR) как с общими, так и выделенными физи-чески-разделенными аппаратными ресурсами.
- Память гипервизора зеркалируется, что минимизирует риски остановки всей системы при аппаратных ошибках работы оперативной памяти.
- Такие функции как Processor Instruction Retry сводят практически к нулю возможность краха системы (например, «синий экран смерти») из-за аппаратной ошибки.
- Динамическая замена вышедших из строя процессора и/или памяти на серверах с имеющимися ресурсами CoD* (Capacity
- on Demand). Например, вышедший из строя процессор или модуль оперативной памяти будет выведен из эксплуатации, а имеющийся неактивный процессор, находящийся в режиме CoD, будет незамедлительно активирован и будет функционировать до момента физической замены испорченного.
- Уникальная возможность добавления, удаления и замены PCI-адаптеров без каких-либо остановок.
- Стандартизированные, хорошо документированные команды управления в AIX и псевдографический интерфейс управления позволяют с легкостью производить настройку ОС. Работать с AIX значительно проще, чем работать с Linux. Практика показывает, что человек, обладающий основными навыками работы с Linux сможет с легкостью освоить AIX.
- AIX Dynamic System Optimizer и Active System Optimizer позволяют динамически оптимизировать работу операционной системы. Так, эти функции производят мониторинг системы на предмет возможности увеличения производительности. Если такая возможность обнаружена, производится автоматическое изменение параметров. Данный процесс происходит постоянно до достижения максимальной производительности.
- Продукт PowerSC, имеющий ряд важных функций по обеспечению безопасности, таких как файрвол на уровне гипервизора, автоматический аудит соответствия регулятивным требованиям PCI-DSS и другим нормативам безопасности.
- Гарантированная бинарная совместимость (binary compatibility), обеспечивающая работу старого ПО на ОС AIX последних версий. Так, например, программа, скомпилированная когда-то на системе AIX 5L (~2001 год), будет гарантированно работать без изменений на самой последней версии AIX 7.2, что позволяет защищать ранее сделанные инвестиции.
- Установка обновлений ОС и Кернела без перезагрузок обеспечивает абсолютную беспрерывность работы вашей инфраструктуры.
* CoD — Capacity on Demand. Эта опция, доступная на серверах Power Enterprise-класса (E950, E980 и аналогичных серверах с Power8, Power7 и др.). При приобретении сервера заказчик приобретает перманентные лицензии на активацию конкретного количества процессоров и памяти. При этом, в сервере физически может присутствовать большее количество процессоров и оперативной памяти, включенной в конфигурацию практически бесплатно. При необходимости роста заказчику будет нужно всего-навсего приобрести активационные ключи, а не ждать прибытия дополнительного оборудования, которое к тому времени могло быть снято с производства. Активировать эти ресурсы можно перманентно или в пиковые периоды (производя оплату по факту использования ресурсов). Отдельно необходимо отметить функцию Mobile Capacity On Demand, позволяющей «переносить» ресурсы с одного физического сервера на другой по необходимости (симметрично активировать/деактивировать ресурсы между серверами).
Помимо функций, обеспечивающих высокую надежность, платформа AIX+Power, несмотря на свою более высокую относительную стоимость, обладает рядом других существенных преимуществ, обеспечивающих меньшую относительную стоимость владения инфраструктурой в целом. Серверы на базе Power9 обладают следующими преимуществами в производительности по сравнению с процессорами x86 Xeon SP:
- В 2 раза больше производительности на одно ядро.
- В 2 раза больше скорости по PCI (Power9 — единственные системы на рынке с PCIe 4.0).
- В 2,5 раза больше памяти на сокет.
- В 1,8 раза больше пропускная способность оперативной памяти.
К тому же, аппаратный гипервизор позволяет физически разделять процессорные (и другие) ресурсы. Такая система позволяет значительно сэкономить на стоимости лицензии программного обеспечения, которое планируется запускать на данной платформе. Так, подавляющее большинство производителей ПО, которое лицензируется по процессорным ядрам, требуют лицензирования всех ядер, доступных ОС либо кластеру виртуализации. На x86 это, как правило, означает необходимость лицензирования всех ядер на сервере. Так как IBM Power позволяет гарантированно ограничить количество используемых ОС (или группой ОС) физических ядер, и количество этих ядер может быть значительно ниже, чем на x86 (за счет большей производительности на ядро), очевидна существенная экономия средств на закупке лицензий ПО. В совокупности данных возможностей Power/AIX заказчик получает системы высочайшей надежности с идеальным балансом и гибкостью распределения ресурсов, как ни в одной из других существующих систем.
Помимо серверов для стандартных нагрузок, IBM имеет в своем портфеле специализированные системы, оптимизированные под определенные задачи, такие как in-memory базы данных SAP HANA (H922 и H924), а также машинное обучение и искусственный интеллект (AC922).
IBM Power AC922 — сервер с воздушным или водяным охлаждением, позволяющий устанавливать до 6 GPU-акселераторов NVIDIA Tesla V100. Данная система предназначена для машинного обучения и обладает гораздо большей производительностью по сравнению с серверами на базе x86. Благодаря шине PCIe 4.0 и встроенным в процессор интерфейсам NVLink 2.0 и OpenCAPI, высокая скорость передачи данных обеспечивается не только на уровне GPU<->GPU, но и CPU<->GPU. Благодаря этому максимальная пропускная способность на AC922 в 9,6 раза больше, чем аналогичная система на базе x86.
Благодаря этим интерфейсам система AC922 получает возможность расширить память GPU с помощью системной оперативной памяти, и, тем самым, использовать более объемные и детализированные объекты, что позволяет увеличивать скорость обучения аналитической системы. Различные сравнительные тесты показывают, что скорость обучения системы AC922 от 2,5 до 5 раз быстрее по сравнению с аналогичной системой на базе x86 с одинаковым количеством одинаковых GPU. А в некоторых тестах скорость AC922 превышала x86 в десятки раз!
Снабдив систему AC922 программным фреймворком для глубокого машинного обучения IBM Power-AI, организация получит мощную систему, способную решать всевозможные аналитические задачи на базе полученной путем обучения поведенческой модели клиентской базы, которая поможет организации быть более клиентоориентированной, вовремя создавать необходимые продукты и услуги, обретая за счет этого значительное конкурентное преимущество.
Компания Fominov Consulting, имеющая статус золотого партнера, является ключевым партнером-интегратором и сервисным центом IBM в Азербайджане.