Почему повышение тока на AMD Ryzen не убьёт ваш процессор
Если кто-то хочет повысить быстродействие CPU, обычно он находит способ сделать это. Будь то пользователь, самостоятельно разгоняющий свой компьютер, или же производители материнских плат, подстраивающие настройки для улучшения быстродействия ЦП ещё перед продажей – в итоге всем хочется увеличить быстродействие, и по множеству причин. Эта ненасытная жажда максимального быстродействия означает, однако, что некоторые из этих подстроек и изменений могут вывести ЦП за пределы «спецификаций». В итоге часто можно видеть методы, выполняющие обещания по увеличению скорости работы за счёт увеличения температуры или сокращения времени жизни железа.
В этой связи стоит рассмотреть появившуюся недавно информацию о том, что производители материнских плат играют с настройками тока, подаваемого на процессоры от AMD. Увеличивая его, они увеличивают и потенциальную мощность процессора, что в итоге приводит к увеличению не только скорости работы, но и температуры. Такой подход к подстройке железа нельзя назвать новым, однако недавние события вызвали волну замешательства, вопросов о том, что происходит на самом деле, и какие последствия это может повлечь для процессоров AMD Ryzen. Чтобы прояснить эту ситуацию, мы решили сделать данный обзор.
Старомодные способы: методы расширения спектра, мультиядерные улучшения, PL2
За время работы редактором по материнским платам, а потом и по CPU, я постоянно сталкиваюсь с ухищрениями, на которые производители материнок готовы идти ради того, чтобы вырваться вперёд по быстродействию в гонке с конкурентами. Мы первыми рассказали о такой настройке, как «мультиядерное улучшение» [MultiCore Enhancement], появившейся в августе 2012 года, и выставляющей рабочую частоту всех ядер выше той, что указана в спецификациях, а иногда и откровенно разгоняющей рабочую частоту. Однако производители материнских плат занимались подстройкой разных свойств, связанных с быстродействием, и задолго до этого. Можно вспомнить метод расширения спектра с увеличением базовой частоты со 100 МГц до 104,7 МГц, благодаря которому увеличивалось быстродействие на поддерживающих его системах.
В последнее время на платформах Intel видны попытки производителей по увеличению пределов мощности с тем, чтобы материнские платы выдерживали турборежим работы как можно дольше – и только потому, что производители материнских плат перестраховываются при разработке обеспечения питания компонентов. За последние пару недель мы обнаружили примеры того, как некоторые производители материнских плат просто игнорируют новые требования Intel Thermal Velocity Boost.
Короче говоря, каждый производитель материнских плат хочет быть лучшим, и для этого часто размываются пределы того, что считается «базовыми спецификациями» процессора. Мы довольно часто писали о том, что граница между «спецификациями» и «рекомендуемыми настройками» может быть размытой. Для Intel мощность в режиме турбо, указанное в документации, является рекомендуемой настройкой, и любое значение, установленное на материнских платах, технически укладывается в спецификации. Судя по всему, Intel считает разгоном только увеличение частоты режима турбо.
Подстройка материнских плат с разъёмом AM4
Теперь мы переходим к новостям – производители материнских плат пытаются подстроить материнские платы Ryzen так, чтобы выжать из них больше быстродействия. Как подробно объяснялось на форумах HWiNFO, у платформ АМ4 обычно есть три ограничения: Package Power Tracking (PPT), обозначающее максимальную мощность, которую можно подавать на разъём; Thermal Design Current (TDC), или максимальный ток, подводимый к регуляторам напряжения в рамках тепловых ограничений; Electrical Design Current (EDC), или максимальный ток, который в принципе может подаваться на регуляторы напряжения. Некоторые из этих показателей сравниваются с метриками, получаемыми внутри процессора или снаружи, в сети подачи питания, с целью проверки превышения пороговых значений.
Чтобы подсчитать параметры программного управления питанием, с которым сравнивается РРТ, сопроцессор управления питанием получает значение тока от управляющего контроллера регулятора напряжения. Это не реальное значение силы тока, а безразмерная величина от 0 до 255, где 0 – это 0 А, а 255 – максимальное значение тока, которое может обработать модуль регулятора напряжения. Затем сопроцессор управления питанием проводит свои подсчёты (мощность в ваттах = напряжение в вольтах, умноженное на ток в амперах).
Этот безразмерный диапазон нужно калибровать для каждой материнской платы, в зависимости от её схемы и используемых компонентов – а также дорожек, слоёв и качества в целом. Чтобы получить точное значение коэффициента масштаба, производитель материнских плат должен тщательно замерить правильные показатели, а потом написать прошивку, которая будет использовать эту таблицу в подсчётах мощности.
Это означает, что в принципе существует способ поиграться с тем, как система интерпретирует пиковую мощность процессора. Производители материнских плат могут уменьшать это безразмерное значение тока, чтобы процессор и сопроцессор управления питанием считали, что на процессор подаётся меньше мощности, и в итоге ограничитель PPT не активировался. Это позволяет процессору работать в режиме турбо, превосходящем то, что изначально планировали в AMD.
У этого есть несколько последствий. Процессор будет потреблять больше энергии, в основном в виде увеличения тока. Это приведёт к повышению теплоотдачи. Поскольку процессор работает быстрее (потребляя больше энергии, чем считает ПО), он покажет лучшие результаты в тестах на быстродействие.
Если у вашего процессора базовая TDP 105 Вт, а PPT равняется 142 Вт, то при нормальных условиях стоит ожидать, что на заводских настройках процессора будет рапортовать о потреблении 142 Вт. Однако если установить безразмерный показатель тока на 75% от реального, то реально он будет потреблять в районе 190 Вт = 142/0,75. Если остальные ограничения не затронуты, то процессор будет рапортовать о 75% от PPT, что будет запутывать пользователя.
Выход ли это за рамки спецификаций?
Если считать, что PPT, TDC и EDC являются основой спецификаций AMD для потребления мощности и тока, то да, это выходит за рамки спецификаций. Однако PPT по своей природе выходит за рамки TDP, поэтому тут мы уже попадаем в загадочный мир определений понятия «турбо».
Как мы уже обсуждали ранее касательно мира Intel, пиковое потребление энергии в режиме турбо Intel сообщает производителям материнских плат только в качестве «рекомендованного значения». В итоге чипы от Intel примут любое значение в качестве пикового энергопотребления, как разумные величины типа 200 Вт или 500 Вт, так и безумные, типа 4000 Вт. Чаще всего (и в зависимости от процессора), чип упирается в другие ограничения. Но в случае с самыми мощными моделями этот параметр стоит отслеживать. Значение тау, обозначающее длительность нахождения в режиме турбо, и определяющее объём ведра с энергией, из которого режим турбо её черпает, тоже можно увеличить. Вместо значения по умолчанию из диапазона от 8 до 56 секунд, тау можно увеличивать практически до бесконечности. Согласно Intel, всё это укладывается в спецификации – если производители материнских плат могут делать материнские платы, обеспечивающие все эти показатели.
Intel считает, что настройки выходят за рамки спецификаций, когда частота работы процессора выходит за пределы таблиц турбо режима для Turbo Boost 2.0 (или TBM 3.0, или Thermal Velocity Boost). Когда процессор выходит за эти пределы, Intel считает это разгоном, и считает себя свободной от выполнения гарантийных обязательств.
Проблема в том, что если попытаться перенести те же правила на ситуацию с AMD, то у AMD нет турбо-таблиц как таковых. Процессоры AMD работают, предлагая наибольшую возможную частоту в зависимости от ограничений по току и мощности в любой момент времени. При увеличении количества задействованных в работе ядер уменьшается энергопотребление каждого отдельного ядра, и вслед за ним и общая частота. И тут мы углубляемся в детали по отслеживанию огибающей частоты, и всё усложняется из-за того, что AMD может менять частоту шагами по 25 МГц в отличие от Intel, использующей шаги по 100 МГц.
Также AMD использует возможности, выводящие частоту работы чипа за пределы турбо-частоты, описанные в спецификации. Если вы считаете, что это разгон, и судите только по цифрам на коробке – тогда, да, это разгон. AMD в данном случае специально запутывает ситуацию, однако плюсом можно считать некоторое повышение быстродействия.
Подвергается ли мой процессор опасности?
Сразу ответим на этот вопрос – нет, не подвергается. У обычных пользователей с достаточным уровнем охлаждения и на стоковых настройках в течение ожидаемого срока службы проекта никаких проблем быть не должно.
У большинства современных процессов х86 есть либо трёхгодовая гарантия для ритейл-версий в коробочках, либо годовая на ОЕМ. И хотя AMD и Intel не будут менять вам процессор по окончанию этого периода, ожидается, что большая часть процессоров будет работать не менее 15 лет. Мы до сих пор тестируем разные старые процессоры в старых материнских платах, несмотря на то, что их уже давно не обслуживают (и чаще всего проблема заключается во вздувшихся конденсаторах на материнской плате, а не в процессоре).
Когда с конвейера сходит подложка с процессора, компания получает отчёт о надёжности, что помогает определить потенциальное применение для этих процессоров. Сюда входят и такие показатели, как реагирование на изменение напряжения и частоты, а также подверженность электромиграции.
Кроме физического повреждения или перегрева при отключении предела нагрева, главным способом повредиться у современного процессора будет электромиграция. В этом процессе электроны пробираются через проводники процессора и сталкиваются с атомами кремния (и других элементов), в результате выбивая их из кристаллической решётки. Само по себе это редкое явление (вспомните, к примеру, как давно работает проводка в вашем доме), однако на мелких масштабах оно может влиять на работу процессора.
После смещения атома металла в проводнике с его места в кристаллической решётке сечение проводника в этом месте уменьшается. Это увеличивает его сопротивление, поскольку оно обратно пропорционально сечению. Если выбить достаточно атомов кремния, то проводник перестанет проводить ток, и процессор уже нельзя будет использовать. Этот процесс происходит и в транзисторах – там его называют старением транзистора, из-за чего транзистору с течением времени требуется всё большее напряжение («дрейф напряжения»).
При определённых условиях электромиграция идёт быстрее – всё зависит от температуры, использования компонента и напряжения. Один из основных способов справиться с увеличившимся сопротивлением – увеличить напряжение, что в свою очередь увеличивает температуру процессора. В итоге образуется замкнутый круг, из-за которого эффективность процессора со временем падает.
При повышении напряжения (и энергии электрона) и плотности тока (электронов на площадь сечения) шансы электромиграции возрастают. При повышении температуры ситуация может ухудшиться. Все эти факторы влияют на то, сколько электронов могут запастись энергией, достаточной для осуществления электромиграции.
Неблагоприятный процесс, не правда ли? Раньше так и было. При постепенном усовершенствовании производственного процесса и схем работы логических вентилей производители применяли контрмеры, уменьшающие уровень электромиграции. При уменьшении характерных размеров и напряжения этот эффект также становится всё менее заметным – ведь площадь сечения проводников также уменьшается.
Довольно долго большая часть потребительской электроники не страдала от электромиграции. Единственный раз, когда я лично столкнулся с электромиграцией – это когда у меня был процессор Core i7-2600K Sandy Bridge 2011 года, который я разгонял на соревнованиях до 5,1 ГГц с использованием серьёзного охлаждения. В итоге он дошёл до такого состояния, что через пару лет работы ему для нормального функционирования требовалось большее напряжение.
Но тот процессор я гонял в хвост и гриву. Современное оборудование разработано так, чтобы работать десятилетие или более. Судя по отчётам, увеличение нагрева с увеличением энергопотребление оказывается не таким уж и большим. В отчёте Стилта указано, что процессор, видя наличие доступной мощности, немного увеличивает напряжение, чтобы получить прирост в 75 МГц, что увеличивает напряжение с 1,32 до 1,38 во время прогона теста CineBench R20. Пиковое напряжение, значимое для электромиграции, увеличивается всего лишь от 1,41 до 1,42. Общая мощность растёт на 25 Вт – нельзя сказать, что на порядок.
Так что, если моя материнская плата каким-то образом подстроит это воспринимаемое значение тока, не превратится ли мой процессор в кирпич? Нет. Если только у вас не будет каких-то серьёзных ошибок при сборке (например, в системе охлаждения). Всё предполагаемое время жизни продукта, и ещё лет десять после этого, вряд ли эта подстройка будет иметь какое-то значение. Как уже упоминалось, если бы даже это влияло на электромиграцию, то производители процессора встроили механизмы для того, чтобы противодействовать ей. Единственный способ следить за развитием электромиграции – это отслеживать средние и пиковые значения напряжения годами, и смотреть, подстраивает ли процессор автоматически эти параметры для компенсации.
Стоит отметить, что безразмерный показатель силы тока конечный пользователь подстраивать не может – им управляет материнская плата через обновления в BIOS. Если вы занимаетесь разгоном, то вы влияете на электромиграцию гораздо сильнее, чем эта подстройка. Если кто-то из вас беспокоится о температурных режимах, я думаю, что это как раз те люди, которые уже отслеживают и подстраивают пределы параметров в BIOS.
Как узнать, занимается ли этим моя материнская плата
Во-первых, нужно использовать стоковую систему. Если параметры PPT/TDC/EDC изменены, то система уже подстроена по-другому, поэтому сконцентрируемся только на тех пользователях, которые работают со стоковыми системами.
Затем нужно установить последнюю версию HWiNFO и тест, загружающий систему на 100%, к примеру, CineBench R20.
В HWiNFO есть метрика под названием CPU Power Reporting Deviation [отклонение энергопотребления процессора]. Наблюдайте за этим числом, когда система находится под нагрузкой. У нормальной материнской платы число будет равно 100%, а у материнской платы с подстроенным током или регуляторами напряжения этот показатель будет меньше 100%.
Если это не так, то значение параметра Power Reporting Deviation ничего не значит. Если же эти условия выполнены, а показатель падает ниже 100%, то ваша материнская плата изменяет работу процессора.
Какие у меня есть варианты?
Если ваша материнская плата пытается выжать из процессора больше, чем надо, однако вас устраивает температурный режим и энергопотребление компьютера, то просто наслаждайтесь дополнительным быстродействием. Даже если это всего лишь дополнительные 75 МГц.
С AMD это никак не связано, поскольку вся ответственность ложится на производителей материнских плат. Пользователи могут захотеть обратиться к производителю материнских плат и попросить прислать обновление для BIOS. Если пользователь захочет вернуть такую материнскую плату в магазин, ему нужно уточнить этот вопрос у продавца.
Хотя такое поведение вроде бы нарушает спецификации PPT, на самом деле оно не выходит за (плохо обозначенные) пределы частот. Эта ситуация похожа на то, как производители материнских плат играются с ограничениями мощности на системах от Intel. Однако, возможно, было бы приятно иметь в BIOS опцию, которая позволяла бы включать и выключать такое поведение.
Разгонный потенциал системы класса «мейнстрим» при участии процессора AMD Ryzen 5 1600, платы от Gigabyte и комплекта памяти на чипах Micron объёмом 16 ГБ
Изучение разгонного потенциала DRAM и CPU
Поиск предельных возможностей тестового комплекта состоялся с привлечением стенда из обзора платы MSI B350I Pro AC, включая её саму. Первоначальные испытания я провёл, используя Ryzen 7 2700X, получая полный контроль над установкой различных вспомогательных переменных. Благодаря информации, изложенной на ресурсе reddit.com, можно соблазниться отметками 3333–3400 МГц. Подбирая только схему из первичных задержек и ставя во главу полностью стабильное функционирование системы, я уверенно могу заявить про цифры «3333» МГц, которые получилось подтвердить. Выставленный уровень SOC Volatge продиктован образцом нашего процессора, а вот 1,4 В (по факту — немного меньше) на модулях оказалось достаточно, дальнейший прирост не приводит к увеличению разгонных возможностей.
Под полностью стабильной системой я подразумеваю двадцатиминутный тест LinX с объёмом памяти в 5 ГБ. Частоту 3333 МГц дополнила экстравагантная схема задержек — 16-20-8-14-21-1T. Особо интересно выглядит восьмёрка (для tRCDWR), в источнике, указанном выше, приведён факт не мнимой, а полезной установки этого значения.
Оптимистичное начало, не так ли? Но что будет, когда лучший из ЦП серии Ryzen заменить на более слабый, из прошлого поколения? Хорошие новости — всё осталось на своих местах, та же конфигурация цифр и отметок. Мне лишь потребовалось подобрать достаточное напряжение SOC Voltage, чтобы тесты на стабильность были безошибочными. Оказалось, достаточно 0,975 вольт.
Отмечу функционирование в штатном режиме вычислительных ядер процессоров, из-за чего нагрев устройства оказался невысоким (напомню, в AIDA64 температура VRM отображается под видом датчика Motherboard). Ощутимо увеличилась латентность, но удивительным это не назвать.
Используя методику, изложенную в отдельных процессорных обзорах, включая и для модели Ryzen 5 1600, получился следующий набор из значений частот и напряжений, характеризующий её разгонный потенциал:
| Модель | Напряжение в UEFI, В | CPU VDD (действующее), В | Частота до сбоя wPrime, МГц |
|---|---|---|---|
| Ryzen 5 1600 | 1,3 | 1,3 | 4074 |
| Ryzen 5 1600 | 1,35 | 1,356 | 4149 |
| Ryzen 5 1600 | 1,4 | 1,4 | 4174 |
| Ryzen 5 1600 | 1,45 | 1,456 | 4199 |
| Ryzen 5 1600 | 1,5 | 1,5 | 4224 |
| Ryzen 5 1600 | 1,525 | 1,525 | 4224 |
Лишний раз напомню, такой тест является экспресс-проверкой возможностей конкретного экземпляра ЦП, для стабилизации его работы потребуется предпринять ряд дополнительных усилий. ОЗУ функционировала при этом в своём штатном режиме.
Оверклокерский потенциал используемого экземпляра CPU оказался намного лучше участвовавшего в общих тестах годичной давности, узнаем, каков его истинный предел при работе с разогнанной до 3333 МГц памятью. Использование хорошего кулера позволило проводить эксперименты вплоть до психологически критической отметки в 1,5 В, вышло стабилизировать поведение системы на частоте 4100 МГц, вместе с верхним уровнем LLC, в качестве переменной напряжения в UEFI оказалось число 1,4875 В.
Функционирование компонентов проходило в уже малоразумных температурных границах, и всё же вопросов к стабильному поведению ПК не было, доказательством выступает наш стресс-тест в утилите LinX. Ускорение ЦП немного улучшило показатель латентности DRAM.
Привлечение Gigabyte GA-AX370-Gaming. Формирование режимов работы для тестирования
Изучив предельные возможности процессора и памяти в комфортных условиях, самое время вернуться к более дешёвой плате и штатному кулеру. Эксперименты я вновь начал с разгона памяти. Оказалось, последняя сборка UEFI — не лучший выбор, а на предпоследней (F23) получилось добиться полной стабильности на частоте 3200 МГц. Работа на отметке 3333 МГц была возможна на обеих, но стабилизировать поведение системы в LinX у меня не вышло. Помимо фиксации частоты и конфигурации задержек вида 16-19-8-14-21-1T, понадобилось задавать уровень ProcODT вручную, выбирая отметку «53,3 Ом», в автоматическом режиме значение тут равно «60 Ом». Также пришлось нарастить напряжение DRAM — до 1,43 В, стабильность этого параметра оставляет желать лучшего. Величина напряжения SOC повышается автоматически, механизма для её снижения нет.
Как я уже отмечал, на платах от Gigabyte предусмотрена возможность замера температур в двух точках сектора VRM. Фирменный UEFI использует названия VRM MOS и VSOC MOS, ранние сборки AIDA64 — VRM и Aux, более новые — VRM и VSoC. Значения датчиков CPU и CPU diode на этой плате совпадают, что не может не радовать.
Без вмешательства в алгоритм управления системой охлаждения, функционирование ЦП даже с разогнанной ОЗУ (при повышенном уровне SOC Voltage) отмечается весьма скромными температурными величинами. При этом кулер работает при частоте вращения около 1500 об/мин. Это не бесшумный режим, но и навязчивым его тоже назвать нельзя. Средней действующей величиной напряжения на ядрах получилась отметка около 1,1 В.
Ограничивать оверклокинг ЦП будет множество факторов: температура его самого и VRM, штатный кулер плюс тип термопасты (я нарочно использовал преднанесённую), место расположения ПК и интенсивность продува (подачи охлаждённого воздуха) в корпусе. Учитывая всё вышесказанное, разумным компромиссом виделись 3850 МГц вместе уровнем питающего напряжения около 1,35 В, они достигались путём установки добавочных +0,114 В (в UEFI доступен исключительно режим offset). Интересно вспомнить, ровно до такого же значения мне удалось разогнать процессор в паре с недорогой ASRock AB350M.
В режиме открытого стенда прогрев VRM оказался даже бо́льшим, чем процессора, температура не превысила 87 °C, этим я оставил некоторый «запас» для плохо продуваемых корпусов, в них такой же режим работы будет сопровождаться увеличенными тепловыми показателями. Шум кулера нарастал уже до весьма значимого, его обороты приближались к 2500 об/мин. Но при этом сценарий оверклокинга — комплексный, а поведение ПК было полностью стабильным.
Когда известен точный, работоспособный режим ПК, можно приняться за тонкую подстройку подсистемы ОЗУ. Этот способ улучшения быстродействия требует огромного количества времени, учитывая массу переменных, каждая из которых влияет на поведение, обеспечивая системе то бесперебойную работу, то невозможность даже пройти этап POST. В качестве мерила условной стабильности я использовал «короткий» LinX — с объёмом 1 ГБ. В таком режиме нет проблем с прохождением POST, с загрузкой Рабочего Стола, с функционированием простых приложений вроде архивации. Но про более серьёзные стресс-нагрузки речь уже не идёт, нам же интересен, в первую очередь, привносимый уровень производительности, потому пожертвовать придётся стабильным поведением ПК. Настройки в UEFI оказались следующими:
Невысокая интенсивность нагрузки повлияла на степень нагрева, частотная формула и уровни напряжений оставались прежними.
Влияние разгона ОЗУ на общую производительность изучим, сравнив систему с аналогичной, где работа будет базироваться на активации XMP, для нашего комплекта это 2666 МГц вместе с задержками 16-18-18-18-38-1T. Напряжение на модулях равнялось 1,2 В. Снижение нагрузки на ЦП позволило, без снижения множителя, уровень компенсации напряжения выставить как +0,054 В, невысокой оказалась и переменная SOC Voltage.
Сниженное напряжение ощутимо сказалось на температурах CPU и VRM, вероятно, низким окажется и уровень потребления энергии.
Ещё одним вариантом работы будет эксплуатация ПК лишь с активированным XMP, а Ryzen 5 1600 покажет, на что способен при своих базовых настройках, так мы узнаем выигрыш от проведённого разгона лишь для ядер ЦП. Таким образом, активировался лишь профиль XMP, все напряжения остались в штатных позициях.
Частота ЦП при полной нагрузке равнялась 3,4 ГГц, устоявшийся уровень напряжения — 1,1 В. Это не замедлило сказаться на действующих температурах компонентов системы.
В качестве бонуса, своеобразного билета в будущее, протестируем Ryzen 7 2700X в режиме разгона памяти до 3200 МГц, тем самым определив, насколько ощутимым окажется возможный апгрейд в условной перспективе. Для функционирования максимального ускорения требуется позаботиться про минимальную температуру ядер, для этого лучше всего максимально снизить питающее напряжение, а не только установить производительную СО. Получилось без последствий уменьшить его, установив в качестве компенсации –0,024 В. Больше всего на снижение напряжения реагируют однопоточные задачи, демонстрируя нестабильное поведение, поскольку offset будет срабатывать в каждом варианте нагрузки, но, в конечном итоге, проблем не было и в LinX.
Сказать, что плата справляется со своими обязанностями, даже в штатном режиме функционирования мощного ЦП, можно с условной долей скепсиса. Без направленного обдува VRM греется до 100 °C и выше (работая над сценариями LinX), частота ядер при этом снижается вплоть до 3,6 ГГц, то есть даже ниже паспортного номинала Ryzen 7 2700X. При более щадящих нагрузках она выше, потому, в целом, можно говорить про возможность его работы на этом устройстве. С этим процессором использовался сторонний кулер башенной конструкции. Для его работы буквально напрашивается охладитель типа Top Flow, он косвенным образом улучшит охлаждение и для узла VRM.
Чтобы убедиться в разумности созданной нагрузки на подсистему питания, взглянем на финальную картину потребления энергии всем стендом. Цифры тут вышли вполне адекватными, уровень составил 52–187 Вт, для сравнения можно оценить поведение этого же ЦП в составе любой платы, прежде протестированной в нашей лаборатории, например, той же MSI B350I Pro AC.



































































































































