Почему стоит выбрать процессор Xeon
Более 15 лет Intel выпускает свои серверные процессоры x86 и процессоры для рабочих станций под названием «Xeon». Они варьировались от простых вариантов основной линейки процессоров Intel с некоторыми дополнительными функциями, такими как поддержка памяти ECC, до гораздо более совершенных конструкций с дополнительными возможностями процессора и кэш-памятью.
Несмотря на то, что Intel ориентирует Xeon на конкретные типы пользователей и приложений, возникает некоторая путаница, когда они являются подходящим выбором по сравнению с более массовым процессором (таким как современный Core i5 или i7). Я попросил геймеров рассказать о Xeon, и выяснилось, что они думали об этих процессорах как о более мощных, и что это даст прирост производительности в их играх. Точно так же у меня были вопросы о работе серверов на процессорах Core i7. Так, когда Xeon имеет смысл, и что он в действительности приносит в производительности?
Несколько процессоров –Некоторые приложения могут получить огромную выгоду от наличия большого количества процессорных ядер, большого объема памяти или высокой пропускной способности памяти (или всех трех моментов). В таких ситуациях система с более чем одним процессором может быть отличным способом … но основные процессоры, такие как серия Core, не поддерживают это. Тем не менее, многие Xeon делают это благодаря добавленной логике на кристалле, чтобы облегчить связь между процессорами, чтобы они могли совместно использовать доступ к памяти и координировать рабочие нагрузки. Каждый ЦП в такой конфигурации имеет свой собственный контроллер памяти и набор модулей памяти, а также свои вычислительные ядра, так что вы получаете как необработанную вычислительную мощность, так и объем памяти, который можно установить (емкость) и перемещать в то же время время (пропускная способность). Возможность использования нескольких процессоров Xeon текущего поколения можно найти в первой цифре названия их модели. Например:
Xeon E3 1246 V3 (1 = только один процессор)
Xeon E5 2460 V3 (2 = поддержка двух процессоров, но также может использоваться отдельно)
Xeon E5 4627 V2 (4 = поддержка четырехъядерных процессоров)
Каждый процессор также имеет контроллер PCI-Express, который поддерживает определенное количество дорожек (в зависимости от модели), поэтому наличие нескольких процессоров могут обеспечить материнские платы с большим количеством слотов PCI-Express. Это может быть полезно для размещения большого количества карт ускорителей или сопроцессоров, таких как Intel Xeon Phi или NVIDIA Tesla.
Более высокое число ядер. В дополнение к возможности использования более одного ЦП в системе для повышения производительности многопоточной рабочей нагрузки, некоторые Xeon содержат больше ядер, чем другие процессоры Intel. В настоящее время процессоры Core i3 работают с двумя ядрами, Core i5 – с четырьмя ядрами, Core i7 – с восемью ядрами, а серия Xeon E5 – с восемью ядрами! По мере того, как увеличивается количество ядер, базовая тактовая частота несколько снижается, а стоимость возрастает из-за сложности, но многопоточные приложения могут извлечь выгоду от этих дополнительных ядер.
Это несколько веских причин использовать систему на базе Xeon, хотя и не все. Существуют и другие факторы, такие как удаленное управление, множественные и / или высокоскоростные сетевые порты и другие, которые встречаются на материнских платах классов серверов и рабочих станций, заполненных Xeons… но они не относятся к самим процессорам Xeon.
А как насчет плохих идей? Или, другими словами, дезинформированные причины получить Xeon? Вот некоторые из основных причин, по которым я видел людей, желающих Xeon, когда им на самом деле было бы лучше служить чему-то другому:
«Более« мощный »Xeon поможет моей игре, верно?» –
Некоторые люди предполагают, что поскольку процессоры Xeon находятся на рабочих станциях и серверах высокого класса, они также должны быть лучше для игр. Это определенно * не * верно, потому что компьютерные игры не нуждаются в большом количестве ядер или других различных преимуществах, которые Xeons предлагает. На момент написания этой статьи ни одна игра не использует более четырех ядер, а многие используют меньше. Тем не менее, игры чувствительны к тактовой частоте … и, как я упоминал ранее, когда вы увеличиваете количество ядер, вы обычно уменьшаете тактовую частоту. Таким образом, приобретение 18-ядерного Xeon для игр на самом деле приведет к гораздо более низкой производительности, чем более дешевый 4-ядерный процессор с более высокой тактовой частотой. Можно привести некоторые аргументы в пользу 6-ядерного процессора для игр (на будущее, много фоновых приложений, работающих одновременно и т. Д.), Но это можно выполнить в рамках линейки Core i7,
Этот принцип распространяется не только на игры. Некоторые профессиональные приложения для рабочих станций не используют много ядер, поэтому лучше использовать обычные процессоры. Есть правило – чем меньше количество ядер, тем более высокая тактовая частота Xeon, но более массовые процессоры от Intel стремятся достичь чуть более высоких тактовых частот. Что тоже уменьшает выгоду ксеон…
«Я хочу иметь максимально возможную тактовую частоту для своих вычислений, возможно, даже разогнать процессор…» – Если вы хотите разогнать процессор, тогда вам не нужен Xeon. Они не с разблокированными множителями, как процессоры «энтузиастов» (верхнего уровня), которые Intel предполагает для разгона, и материнские платы, созданные для использования с Xeon, вряд ли будут иметь те варианты тонкой настройки, которые также необходимы. Кроме того, платформы на основе Xeon – это надежность, а разгон по самой своей природе является более рискованным предложением. Вы выдвигаете процессор за пределы его номинальных характеристик, и хотя это можно сделать консервативно (мы гарантируем, что каждая разогнанная здесь система проходила те же тесты стабильности, что и обычные системы), это по своей сути менее надежный вариант, особенно в течение длительного периода времени.
Что такое Intel Xeon Scalable Gen3?
В свое время, в далеком уже 2017 году, мы опубликовали статью Что такое Intel Xeon Scalable?, в которой поясняли суть масштабной трансформации серверной линейки процессоров Intel. С тех пор прошло 4 года и два поколения Xeon, и мы вновь решили вернуться к этой теме. Что представляют из себя Intel Xeon Scalable Gen3, какие новейшие технологии они в себя вобрали? Как выглядит линейка Xeon, что означают многочисленные индексы моделей? Обо всем этом мы расскажем здесь.
Все о ядре Sunny Cove
Начнем с самого главного. Семейство Ice Lake-SP, процессоры Intel Xeon Scalable третьего поколения, предназначены для использования в двухсокетных серверах (платформа Whitley) и включают в себя ядра Sunny Cove, выполненные по 10 нм техпроцессу. Вот так во всей своей красе выглядит кристалл 28-ядерного процессора Ice Lake-SP.
В ядре Sunny Cove много микроархитектурных усовершенствований и новшеств. Сравним важнейшие характеристики ядра с предшествующим поколением.
| Cascade Lake | Ice Lake | |
|---|---|---|
| Буфер для хранения инструкций для внеочередного исполнения команд | 224 | 384 |
| Количество операций загрузки + хранения в кэш-памяти | 72 + 56 | 128 + 72 |
| Количество команд в планировщике | 97 | 160 |
| Количество регистров (целочисленных и с плавающей запятой) | 180 + 168 | 280 +224 |
| Очередь выборки команд | 64 на поток | 70 на поток; |
| L1Dкэш (Kбайт) | 32 | 48 |
| Скорость работы L1 Dкэша (загрузка + хранение) (Байт/Цикл) | 128 + 64 | 128 + 64 |
| Буфер ассоциативной трансляции L2 (записей) | 1.5K | 2K |
| L2-кеш (Мбайт) | 1 | 1.25 |
Микроархитектура ядра Sunny Cove выглядит следующим образом.
В области сжатия данных и специальных SIMD-инструкций также проведена большая работа. Добавлены операции битовой алгебры, а также инструкции VBMI (Vector Bit Manipulation Instruction) для операций перестановки, сдвига, расширения и сжатия, используемых в дискретной математике, словарной декомпрессии и проч.
Что в индексе тебе моем
Нынешний «большой запуск» включает в себя сразу 53 модели процессоров. Как разобраться в таком разнообразии? В этом нам помогут индексы моделей, разделяющие все поколение на группы. Признаться, сначала эти индексы, наоборот, всех запутали — к нам регулярно приходили просьбы пояснить их значение. Что ж, сейчас есть возможность разобраться в обоих вопросах.
В таблицах ниже приведены основные характеристики каждой серии. Темно-серый цвет обозначает класс Xeon Platinum, желтый — Xeon Gold, светло-серый — Xeon Silver.
Начнем мы с серии H/HL для 4- и 8-сокетных платформ, стоящей во всей линейке несколько особняком. Эти модели принадлежат к предыдущему семейству Cooper Lake, выполнены по 14-нм техпроцессу и имеют соответствующий функционал (ревизию PCIe, поддержку памяти и т.д.). Они предназначены для специально разработанных для них серверов — просим иметь в виду. Серия Н поддерживает до 1,2 Тб памяти на сокет, HL — до 4,5 Тб.
Далее следует основная серия без индексов (ну, почти). Она олицетворяет саму сущность Xeon Scalable: масштабируемость и полезность каждого ядра — вы получаете ровно то, что вам требуется. Как видите, совсем без индексов и тут не обошлось: модели с буковкой Y поддерживают технологию Intel Speed Select — Performance Profile 2.0 (Intel SST PP). На эту тему мы еще поговорим.
Отдельно обратим внимание на серию с увеличенным размером анклава SGX — они не удостоились отдельного индекса, но имеют 512 Гб под анклавы SGX вместо типовых для Gen3 64 Гб. Дополнительные индексы в этом списке: Q — предназначен для водяного охлаждения, S — поддерживает Intel Speed Select — Performance Profile 2.0.
Серия P/V для облачных провайдеров насчитывает пока по одному экземпляру каждого процессора. P предлагается использовать в IaaS, а V — в SaaS платформах виртуализации.
Модели с индексом N — для сетевых устройств и технологий виртуализации сетевых функций.
Очень маленькая пока серия М — для обработки медиа и AI-применений.
Индекс T указывает на соответствие стандарту NEBS — такие процессоры могут работать в экстремальных условиях и рассчитаны на длительное использование.
Процессоры серии U могут использоваться только в односокетных платформах.
Теперь вы знаете об индексах Xeon Scalable Gen3 всё!
Speed Select бывает разный
Intel SST-PP позволяет сконфигурировать для процессора три конфигурационных профиля, включающих в себя количество активных ядер, TDP, базовую частоту SIMD, температуру перехода (TjMax), а начиная с Ice Lake еще и ряд других, таких как базовая частота AVX2/AVX512, частота памяти и прочее. Управление конфигурациями осуществляется с помощью утилиты Intel. Таким образом, мы получаем три фиксированных набора характеристик (показаны на схеме звездочками), оптимальных для каких-либо нагрузок — по сути, три разных процессора. Далее, эти процессоры используются различными группами пользователей для своих задач на основе разделения времени или по графику: скажем, днем сервер выполняет функцию VDI, а ночью считает результаты каких-либо экспериментов или занимается тяжелым рендерингом.
Intel SST-BF, как следует из названия, перераспределяет базовую частоту между менее и более приоритетными ядрами, тем самым улучшая общую производительность системы, ведь при ее использовании дополнительную частоту получат ядра с критически важной нагрузкой.
С помощью Intel SST-CP операционная система или менеджер виртуальных машин может назначать приоритеты процессорным ядрам. Когда появляется возможность для повышения частоты, Power Control Unit (PCU) распределяет запас согласно приоритетам. Приоритизация частоты работает с расширениями SSE, AVX2, AVX512. Таким образом, дополнительная производительность доставляется именно туда, где она требуется больше всего: для решения критических на текущий момент задач и ликвидацию узких мест.
SST-TF позволяет выбранным приоритетным ядрам превысить потолок максимальной турбо-частоты; при этом турбо-частота для остальных ядер будет уменьшена исходя из ТТХ процессора. Набор приоритетных ядер может изменяться динамически во время работы.
Почему стоит переходить на Gen3 уже сейчас?
Напоследок давайте подведем итоги, так сказать, с потребительской точки зрения. Почему Xeon Scalable Gen3 интересны прямо сейчас? Во-первых, все вышеперечисленные улучшения вылились в солидный прирост производительности — около 20% по сравнению с предшественниками. Это означает, что для тех же задач можно использовать или меньше серверов, или более дешевые процессоры.

Сервер HPE ProLiant DL380 Gen10 Plus на базе Intel Xeon Scalable Gen3
Ну и в-четвертых, что немаловажно, ведущие производители серверного «железа», такие как HPE, ASUS и прочие, за этот год успели представить большой ассортимент продуктов на базе Gen3 — как готовых к использованию изделий, так и различного рода «конструкторов». Так что с предложением проблем также быть не должно.
Мы рассказали самое основное о процессорах Intel Xeon Scalable Gen3. Если вам интересна эта тема, пишите нам, о чем бы вы еще хотели узнать.
Что такое Intel Xeon Scalable?
Обновление модельного ряда процессоров Intel Xeon в этом году стало самым значительным событием на рынке серверных платформ Intel начиная с 2011 года – тогда были выпущены так привычные нам линейки Е3, Е5, Е7. И вот снова четырехзначные индексы, вдобавок серии Platinum, Gold, Silver и Bronze, а также обобщающий бренд Xeon Scalable. С первой попытки оказалось трудно понять логику происходящего, и в заинтересованных кругах подвис вопрос: зачем это вообще понадобилось? Об идеологической подоплеке создания семейства Xeon Scalable и самых интересных новшествах в нем мы расскажем в этом посте.
Быстрее, совместимее, гибче
Итак, для начала идеологический аспект. В последние годы жизнь в семействе Intel Xeon шла по накатанному. Постепенно щелкали счетчики поколений, происходило это несинхронно и беспорядочно. Каждая линейка Е3, Е5, Е7 жила своей жизнью, в своем сокете, несовместимая с соседями. Сервера проектировались под конкретную линейку и только под нее.
Шло время, Е7 менялись медленно, Е3 побыстрее, но все равно значительно, на несколько лет, опаздывали по техпроцессу от Intel Core. А нереализованный потенциал – это упущенная выгода. Проанализировав ситуацию, в Intel выделили ключевые проблемы, которые должен решить выход принципиально новых Xeon:
Какие области более всего нуждаются в комплексах с подобными характеристиками? Самые динамично развивающиеся, такие как облачные хранилища и сервисы, программно определяемые системы и так далее. Ну а что делать, если требуются сервера под традиционные нагрузки, скажем, для телекома (к слову сказать, показывающего в последнее время отрицательную динамику роста серверных мощностей)? Тогда Xeon Scalable можно считать следующим поколением Intel Xeon, партнеры Intel без проблем предоставят вам консультацию о соответствии старых и новых линеек.
Новые возможности
Теперь о функциональных новшествах Xeon Scalable – они также служат цели превращения платформы в идеально масштабируемую ноду.
Scalable и не только
Означает ли нынешняя реформа то, что все Intel Xeon станут теперь Scalable? Отнюдь. В целом линейка будет выглядеть следующим образом:
Сервера с Intel Scalable уже доступны для заказа. Вот, например, HP DL360 Gen10. Обратите внимание, если предыдущее поколение DL360 строилось только на процессорах Intel Xeon E5 (как и положено двухсокетному серверу), то теперь в вашем распоряжении весь набор линеек от 3000 до 8000 (от Bronze до Platinum). Вот такая скалабильность получается.
Intel Xeon W — когда хочется помощней
В семействе Cascade Lake пополнение: вслед за Intel Xeon Scalable второго поколения представлены новые модели серии Xeon W. Напомню, что процессоры с индексом W предназначены для высокопроизводительных рабочих станций — в частности, конкретно эти новинки войдут в состав свежеанонсированного Apple Mac Pro, хотя подойдут и для любого другого компьютера — даже в настенном исполнении.

Всего в семействе представлено 9 моделей, все они почти идентичны по функционалу и отличаются лишь количеством ядер и частотами. Некоторые модели имеют дополнительный индекс М — он означает наличие более продвинутого контроллера памяти, поддерживающего до 2 Тб ОЗУ. Все остальные ограничены «всего лишь» одним терабайтом. С младшими моделями используется память DDR4-2666, а старшие могут работать и с DDR4-2933. Что касается сокета, то он такой же, как у Scalable — LGA 3647.
Из функциональных новшеств хотелось бы отметить Intel Deep Learning Boost — дополнительный набор инструкций AVX-512, который ускоряет процессы машинного обучения и Deep Learning за счет векторных операций скалярного произведения 8-битных и 16-битных величин с 32-битным суммированием.
Численные эксплуатационные характеристики приведены в таблице. Отметим, что по сравнению с предыдущим поколением увеличился выбор моделей с количеством ядер больше 20 — ранее таковых был вообще один экземпляр, теперь 4. Благодаря улучшениям в техпроцессе удалось понизить TDP: ранее для 28 ядер он составлял 255 Вт, сейчас — 205 Вт. Так что и в рамках 14 нм еще есть, чем заняться.
До чего дошел прогресс — Xeon E5450 vs. Core i3-8100 в современных приложениях и играх
Введение
Несмотря на неумолимый ход технического прогресса, рост вычислительной мощности компьютерных комплектующих на короткой дистанции (длиной в пару лет) обычно не выглядит столь уж впечатляющим. Взять, к примеру, уже ставшие мемом «жалкие» 5% прибавки к IPC в очередном поколении процессоров Intel — согласитесь, такое. Конечно, всегда можно аргументировать, что пример выбран максимально подходящий под вышеобозначенный тезис: Intel последние годы занимался лишь оптимизацией крайне удачной на момент своего выхода микроархитектуры Skylake, существенным образом свои процессоры не перерабатывая, так что и ожидать хотя бы двузначного прироста IPC от поколения к поколению здесь не стоило. У AMD, например, приросты IPC при переходе от Zen к Zen 2 и от Zen 2 к Zen 3 вполне себе двузначные, но это опять же около 15%, что выглядит впечатляюще разве что на фоне упомянутых выше показателей Intel и в отрыве от контекста. А контекст состоит в том, что несмотря на значительный рывок в IPC при переходе на первое поколение микроархитектуры Zen, процессоры этой архитектуры лишь приблизились по показателям IPC к представителям актуальной на тот момент очередной оптимизации Skylake. И поэтому двузначный прирост IPC при переходе от Zen к Zen 2, когда AMD наконец-таки догнала Intel, а затем и при переходе от Zen 2 к Zen 3, когда AMD удалось уже обогнать конкурента, не должен вводить в заблуждение — столь высокие на фоне Intel показатели прогресса от поколения к поколению у AMD в последние годы обусловлены тем, что точка отсчёта (Zen) была всё же заметно ниже лучших представителей Intel того времени.
реклама
Но речь сейчас, конечно же, не о противопоставлении AMD и Intel, а о том, что в целом рост производительности центральных процессоров в последние годы сильно замедлился, и упомянутый резкий рывок AMD по IPC здесь как раз таки не показатель по указанной выше причине. Вот, как в общем выглядит график роста целочисленной производительности одних из лучших центральных процессоров за период в 40 лет по данным наборов тестов SPECint (из Hennessy, J. L., Patterson, D. A. Computer architecture: a quantitative approach, 6th ed.):
Конечно же, о двукратном приросте производительности за каждую пару лет, как это было в «лихие 90-е» речи уже давно не идёт — тогда переход на RISC-архитектуры позволил сравнительно легко и достаточно долго год от года существенно увеличивать производительность путём наращивания кэшей, всё более эффективного использования суперскалярности и повышения тактовых частот. Но уже в начале 2000-х стало ясно, что такой «халяве» осталось продолжаться недолго — за прошедшие с момента перехода индустрии на RISC-архитектуры годы инженеры «выжали» из преимуществ RISC почти «все соки». Привычные методы увеличения производительности себя почти полностью исчерпали — рост тактовых частот практически остановился из-за физических ограничений (энергопотребление и тепловыделение росли банально быстрее, чем тактовые частоты), а увеличение скорости шины, размера кэш-памяти и улучшение некоторых других аспектов микроархитектуры более не приводили к ощутимому росту производительности и экономически себя не оправдывали. По этой причине с середины 2000-х индустрия начинает массово переходить на многоядерные процессоры, и ещё некоторое время одноядерная производительность продолжала расти преимущественно за счёт улучшения техпроцесса и покорения всё более высоких тактовых частот уже в рамках многоядерных моделей. Однако, к концу 2010-х обсуждаемый рост практически полностью остановился: прирост порядка нескольких процентов в год — реалии современного процессорного рынка. Нам тут остаётся лишь вторить главному герою мультфильма «Падал прошлогодний снег».
Но даже если взять за точку отсчёта момент появления первых многоядерных процессоров, то 10% и даже 20% прироста год от года заметить на самом деле не так уж просто, особенно учитывая тот факт, что во многих реальных задачах прирост производительности при переходе от поколения к поколению до указанных чисел не дотягивает. Совсем другой дело — посмотреть во что суммарно выльются все эти улучшения на сравнительно большой дистанции, скажем, лет 10. Оценить, так сказать, «кумулятивный эффект» от многочисленных микроархитектурных и прочих изменений в центральных процессорах и связанных с ними узлах (в первую очередь, оперативной памятью), причём сделать это в реальном программном обеспечении. Вот этим мы сегодня и займёмся, а поможет нам в этом парочка 4-ядерных процессоров Intel двух разных эпох — Xeon E5450 (аналог настольного Core 2 Quad Q9650) и Core i3-8100.
реклама
Участники тестирования
Участников сегодняшнего тестирования действительно разделяют целых 10 лет технического прогресса в области процессоростроения: Xeon E5450 увидел свет в ноябре 2007, а Core i3-8100 — в октябре 2017. Настольный аналог Xeon E5450, Core 2 Quad Q9650, конечно, вышел чуть позже (в августе 2008), но сути дела это сильно не меняет. За указанный, внушительный по меркам компьютерной индустрии, срок процессоры Intel пережили 4 смены микроархитектуры, если считать по «такам» (Core → Nehalem → Sandy Bridge → Haswell → Skylake), 3 смены техпроцесса (45 нм → 32 нм → 22 нм → 14 нм), а заодно и столь «любимые» всеми 4 смены процессорного разъёма (LGA 775 → LGA 1156 → LGA 1155 → LGA 1150 → LGA 1151), или точнее даже 5, учитывая две лишь механически совместимые версии LGA 1151. Для простоты сравнения Xeon E5450 был немного разогнан с 333 МГц по шине до 400 МГц, так что его итоговая частота оказалась равной таковой у далёкого потомка в лице Core i3-8100, а именно 3.6 ГГц. Но не стоит думать, что таким разгоном мы искусственным образом ставим представителя микроархитектуры Core в более выгодное положение, ведь даже в настольной линейке процессоров Intel той эпохи имелся процессор с 400 МГц шиной, остановившийся всего в одном шаге (по множителю) от частоты 3.6 ГГц — Core 2 Extreme QX9770 со стоковой частотой 8.0 × 400 МГц = 3200 МГц. Ну а среди серверных 4-ядерных процессоров Intel микроархитектуры Core можно обнаружить и Xeon X5492 со стоковой частотой 8.5 × 400 МГц = 3400 МГц, то есть всего лишь на 200 МГц ниже используемой в нашем тестировании. Так что в отношении небольшого разгона Xeon E5450 можно сказать, что мы лишь подтянули его показатели до таковых у самых топовых представителей микроархитектуры Core, разве что совсем немного переусердствовав.
реклама
Конечно, не все даже указанные выше улучшения являются существенными для нашего конкретного случая. Так, например, последний пункт нам безразличен, так как Core i3-8100 не поддерживает ни Hyper-Threading, ни Turbo Boost, но упомянуть эти технологии всё же стоило.
Основы тестовых стендов LGA 775 и LGA 1151 составляют материнские платы ASUS P5Q3 и GIGABYTE B360M H, соответственно. Остальные комплектующие, кроме оперативной памяти, идентичны: видеокарта GeForce RTX 2060 Super от KFA2, бюджетный SSD WD Green на 240 ГБ под Windows и приложения, жёсткий диск Seagate 7200 BarraCuda на 3 ТБ под игры, блок питания Xilence Performance A+ 630 Вт. Первые два тестовых стенда оснащены 4 планками DDR3-1600 CL9 памяти с Aliexpress объёмом по 4 ГБ каждая, о которой неоднократно писалось ранее, последний— 2 планками Patriot Signature DDR4-2400 CL17 памяти объёмом по 8 ГБ каждая.









