четверг, 15 ноября 2012 г.

Тюнинг для бульдозера. Обзор процессора AMD FX-8350


  С момента появления на рынке процессоров AMD FX с микроархитектурой Bulldozer прошёл уже почти год. И теперь со всей уверенностью можно говорить о том, что они пришлись не по душе не только нам, но и большинству потребителей. Покупатели предпочитают предложения конкурента, так как в подавляющем большинстве случаев процессоры семейств Core i5 и Core i7 не только заметно быстрее, но и существенно экономичнее. Конечно, примеры приложений, где применение Bulldozer может быть оправданно, существуют, но это по большей части сугубо узкоспециализированные задачи. В общеупотребительных же средах — и в первую очередь в играх — AMD FX выглядят весьма бледно.
  Причина такого положения дел кроется в особенностях микроархитектуры Bulldozer. Основная идея, заложенная в дизайне этих процессоров, не так уж и плоха. Упрощение отдельных вычислительных ядер в пользу наращивания их количества и увеличения тактовой частоты вполне имеет право на жизнь, ведь с каждым годом всё больше разработчиков программного обеспечения увереннее переходят на многопоточные алгоритмы. Однако первейший недостаток Bulldozer состоит в том, что его ядра оказались уж слишком простыми и низкопроизводительными, а создание большого количества равноправных вычислительных потоков возможно при решении далеко не каждой реальной задачи. Есть и другая проблема. Ядра в процессорах с микроархитектурой Bulldozer попарно скомпонованы в модули-сборки, разделяющие некоторые ключевые блоки. В результате загрузка работой более половины вычислительных ядер приводит к падению удельной производительности в пересчёте на одно ядро. По идее, все эти слабые места могли бы быть скомпенсированы высокой тактовой частотой, однако на пути такого естественного решения встали используемый AMD технологический процесс с 32-нм нормами и недостаточно отработанный дизайн полупроводникового кристалла. Поэтому-то и вышло, что блеснуть производительностью Bulldozer может исключительно за счёт своего превосходства в количестве ядер, то есть в тех немногих случаях, когда приложение способно создать восемь полностью равноправных вычислительных потоков. Однако даже в такой идеальной для микроархитектуры AMD ситуации скорость восьмиядерных Bulldozer не дотягивает до уровня быстродействия четырёхъядерных процессоров Core i7, которые тоже способны исполнять восемь потоков одновременно за счёт технологии Hyper-Threading.
  Слабые места собственной процессорной микроархитектуры осознают и в AMD. Поэтому в течение ближайших нескольких лет мы станем свидетелями выхода усовершенствованных модификаций Bulldozer, которые будут последовательно исправлять описанные недостатки. В данный момент наибольший оптимизм вызывает запланированная на 2013 год итерация с кодовым именем Steamroller. В ней AMD собирается пересмотреть свой подход к попарному объединению ядер в модули и вернуть каждому ядру собственный декодер, переделать объединённый блок операций с плавающей точкой, а также ввести в употребление динамическое распределение ресурсов разделяемой кеш-памяти. Однако микроархитектура Steamroller – это тема наших будущих исследований, целью же данного материала является изучение дизайна Piledriver, ведь именно эта версия микроархитектуры будет использоваться в процессорах AMD FX с сегодняшнего дня.
Можно подумать, что AMDпроизводит строительную технику, но бульдозер, копёр, каток и экскаватор – это всего лишь названия поколений процессорных микроархитектур
Микроархитектура Piledriver и процессоры Vishera
  Итак, Piledriver. С этой микроархитектурой мы уже знакомы. Именно она нашла своё место в гибридных процессорах Trinity, подробное рассмотрение которых мы проводили двумя неделями ранее. Несмотря на то, что тогда речь шла об APU, а сегодня мы рассматриваем CPU – процессоры без встроенной графики, строение вычислительных ядер у них одинаковое. Различия есть только в их количестве, а также в том, что в нацеленных на производительные системы CPU без встроенных графических ядер есть кеш-память третьего уровня.
Улучшений в новой микроархитектуре много, но все они имеют лишь косметический характер
  Это позволяет нам, не вдаваясь в подробности, просто повторить список усовершенствований микроархитектуры Piledriver, отличающих её от дизайна прошлого поколения – Bulldozer:
•          За счёт внедрения гибридного двухуровневого предсказателя улучшена точность предсказания переходов;
•          Набор инструкций расширен трёхоперандными 128- и 256-битными инструкциями FMA3 (fused multiply–add) и инструкциями из подмножества SSE5 – преобразованием вещественных данных с половинной точностью F16C;
•          Оптимизирована работа планировщиков;
•          За счет переделки соответствующего исполнительного устройства ускорено выполнение операций деления;
•          Увеличена L1 TLB;
•          Алгоритмы предварительной выборки данных в L1- и L2-кеши улучшены, теперь они позволяют работать с паттернами переменной длины, в том числе и находящимися на границах страниц;
•          Увеличена эффективность L2-кеша за счёт более агрессивного его освобождения от неиспользуемых данных, ошибочно загруженных вследствие работы алгоритмов предварительной выборки.
  Для более подробного знакомства с микроархитектурой Piledriver вы можете обратиться к нашим материалам о процессорах Trinity. Здесь же просто отметим, что все перечисленные улучшения в глобальном масштабе не столь существенны. Как мы уже имели возможность убедиться, новая микроархитектура повышает количество исполняемых за такт инструкций не более чем на 5 процентов. Ставит на второе место перечисленные оптимизации и сама AMD. Самое же главное, что, по мнению инженеров компании, им удалось сделать в Piledriver, – это улучшить компоновку полупроводникового кристалла и снизить его энергопотребление и тепловыделение. Результаты проведённого редизайна хорошо видны на снимке: полупроводниковый кристалл Piledriver имеет существенные отличия от кристалла Bulldozer. Поменялось не только взаимное расположение модулей и кеш-памяти, но и размещение функциональных блоков внутри вычислительных ядер
  При этом площадь и транзисторный бюджет по сравнению с Bulldozer совершенно не изменились: 32-нм полупроводниковый кристалл, включающий восемь ядер с микроархитектурой Piledriver и 8-мегабайтный кеш третьего уровня, состоит из 1,2 млрд транзисторов и имеет площадь 315 мм2.
  Благодаря проведённому редизайну полупроводникового кристалла, новые процессоры получили возможность работы на более высоких тактовых частотах без усовершенствования производственной технологии и без расширения рамок привычного теплового пакета. Именно это в первую очередь и дало жизнь второму поколению флагманских процессоров для настольных компьютеров AMD FX с кодовым именем Vishera, которые приходят на смену первопроходцам Zambezi.
  Сразу же хочется отметить, что Vishera не считают революционным продуктом ни в AMD, ни в 3DNews. Микроархитектура Piledriver совершила прорыв в области интегрированных систем: в APU она сменила старый дизайн Stars, но в настольных производительных платформах внедрение Piledriver представляет собой лишь эволюционное обновление Bulldozer. Поэтому по сравнению со старыми процессорами FX ждать какого-то существенного прогресса явно не следует.
  Отсутствие кардинальных технологических прорывов производитель подчёркивает и тем, что у новых представителей серии FX четырёхзначные модельные номера увеличились не столь значительно – лишь на пару сотен. Микроархитектуру Piledriver в номенклатуре CPU выдаёт цифра три на втором месте в номере. Всего же линейка обновлённых FX состоит из четырёх моделей, различающихся в первую очередь количеством ядер.
  
Процессоры AMD FX Piledriver

FX-8350
FX-8320
FX-6300
FX-4300
Число ядер
8 (4 модуля)
8 (4 модуля)  
6 (3 модуля)
4 (2 модуля)
Тактовая частота
4,0 ГГц
3,5 ГГц
3,5 ГГц
3,8 ГГц
Частота в турборежиме
До 4,2 ГГц
До 4,0 ГГц
До 4,1 ГГц
До 4,0 ГГц
L2-кеш           
4x2 Мбайт
4x2 Мбайт
3x2 Мбайт
2x2 Мбайт
L3-кеш
8 Мбайт
8 Мбайт
8 Мбайт
4 Мбайт
Частота северного моста
2,2 ГГц           
2,2 ГГц
2,0 ГГц
2,0 ГГц
Память
До DDR3-1866
До DDR3-1866
До DDR3-1866
До DDR3-1866
TDP
125 Вт
125 Вт
95 Вт  
95 Вт
Процессорное гнездо
Socket AM3+
Socket AM3+
Socket AM3+
Socket AM3+
Цена
$195
$169
$132
$122
  Преемники старых Bulldozer совместимы с той же самой платформой Socket AM3+ и имеют аналогичные характеристики расчётного тепловыделения, то есть способны превосходно работать в старых материнских платах, основанных на наборах системной логики девятисотой серии. К тому же компания AMD не стала сопровождать выход процессоров Vishera запуском какого-либо нового чипсета. Таким образом, внедрение микроархитектуры Piledriver в процессоры семейства FX – это фактически не модернизация платформы, а ординарное расширение линейки, выполненное в первую очередь за счёт увеличения тактовых частот. Они, к слову, по сравнению с показателями старых FX (Zambezi) подросли в среднем на 10-15 процентов. В сумме с небольшими микроархитектурными улучшениями это должно обеспечить Vishera преимущество в производительности на уровне 15-20 процентов.
  И всё-таки кое в чём AMD смогла удивить. Год назад, в момент анонса первых процессоров серии FX, старшие модели этой линейки позиционировались как конкуренты самым скоростным процессорам Intel Core i5 или даже Core i7. Теперь же производитель серьёзно поумерил свои амбиции: стоимость старшей модификации Vishera, модели FX-8350, оказалась даже ниже, чем у Core i5-3570K и Core i5-2500K. То есть мало того что AMD готова предложить потребителям самые дешёвые оверклокерские процессоры – все CPU серии FX обладают незафиксированными множителями и допускают простой разгон. К тому же, с учетом произошедших улучшений и роста частот, новинки имеют хорошие шансы стать привлекательными предложениями с точки зрения соотношения производительности и цены. Впрочем, это нам ещё предстоит проверить.
Описание тестовой системы
  Для проведения тестирования процессоров Vishera с микроархитектурой Piledriver AMD предоставила нам образец FX-8350 – старшего представителя в обновлённой линейке предложений компании для своей высокопроизводительной платформы Socket AM3+.

Это восьмиядерный процессор Vishera, собранный из четырёх условно двухъядерных модулей. Объём кеш-памяти третьего уровня остался таким же, как и у процессоров Zambezi, зато выросла тактовая частота. Номинально AMD FX-8350 работает на 4,0 ГГц, однако при любом удобном случае, когда это позволяет его температурный режим и энергопотребление, частота увеличивается до 4,2 ГГц. Технология Turbo Core 3.0 работает в новой версии AMD FX очень агрессивно. Прирост частоты до максимального значения возможен даже в тех ситуациях, когда работой загружены все ядра CPU.

  Учтя ту цену, которую выставил на свой AMD FX-8350 производитель, в качестве его основного соперника мы выбрали процессор Intel Core i5-3570K. Он немного дороже, но в своих материалах, разосланных прессе, в качестве конкурента для старшего Vishera AMD рекомендует использовать именно его. Более же низкая цена альтернативы AMD в этом ключе выступает ещё одним преимуществом новинки. Впрочем, сравнением FX-8350 с одним лишь только Core i5-3570K мы не ограничились. В тестах также приняли участие старший процессор предыдущего поколения Zambezi для Socket AM3+ – AMD FX-8150 — и старший четырёхъядерник Intel в LGA1155-исполнении, Core i7-3770K.
 В результате нами были задействованы следующие аппаратные и программные компоненты:
•          Процессоры:
o          AMD FX-8350 (Vishera, 8 ядер, 4,0-4,2 ГГц, 4 x 2 Мбайт L2, 8 Мбайт L3);
o          AMD FX-8150 (Zambezi, 8 ядер, 3,6-4,2 ГГц, 4 x 2 Мбайт L2, 8 Мбайт L3);
o          Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 4 x 256 Кбайт L2, 8 Мбайт L3);
o          Intel Core i5-3570K (Ivy Bridge, 4 ядра, 3,4-3,8 ГГц, 4 x 256 Кбайт L2, 6 Мбайт L3).

•          Процессорный кулер: NZXT Havik 140.
•          Материнские платы:
o          ASUS Crosshair V Formula (Socket AM3+, AMD 990FX + SB950);
o          ASUS P8Z77-V Deluxe (LGA1155, Intel Z77 Express).
•          Видеокарта: NVIDIA GeForce GTX 680 (2 Гбайт/256-бит GDDR5, 1006/6008 МГц).
•          Память: 2 x 4 Гбайт, DDR3-1866 SDRAM, 9-11-9-27 (Kingston KHX1866C9D3K2/8GX).
•          Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
•          Блок питания: Corsair AX1200i (80 Plus Platinum, 1200 Вт).
•          Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
•          Драйверы:
o          AMD Chipset Driver 12.8;
o          Intel Chipset Driver 9.3.0.1019;
o          Intel Graphics Media Accelerator Driver 15.26.12.2761;
o          Intel Management Engine Driver 8.1.0.1248;
o          Intel Rapid Storage Technology 11.2.0.1006;
o          NVIDIA GeForce 306.97 Driver.
  При тестировании процессоров для платформы Socket AM3+ патчи операционной системы KB2645594 и KB2646060, адаптирующие поведение планировщика под микроархитектуры Bulldozer и Piledriver, были установлены.
Разгон
  Прежде чем начать знакомиться с результатами бенчмарков, следует уделить внимание и ещё одному аспекту. Процессоры, подобные AMD FX-8350 или Intel Core i5-3570K, зачастую приобретаются не совсем обычными пользователями, а той категорией людей, которых мы называем энтузиастами. Они редко оставляют все настройки по умолчанию, а вместо этого эксплуатируют свои системы в разогнанном состоянии. Поэтому тестирование производительности мы проводили в том числе и с процессорами, частота которых увеличена до предела, достижимого при использовании воздушного охлаждения и без неоправданного завышения напряжений.
  Разгон процессоров Vishera по сути мало отличается от разгона их предшественников для Socket AM3+. Как и в Zambezi, их коэффициент умножения не заблокирован, так что для увеличения рабочей частоты достаточно просто изменить множитель в BIOS.
  Типичным уровнем разгона процессоров Zambezi при использовании воздушного охлаждения можно назвать частоту 4,6 ГГц. Новые Vishera имеют примерно такое же строение и выпускаются по той же самой 32-нм производственной технологии с SOI. Да и предельные рабочие частоты Trinity, согласно нашим опытам, не превышают те же самые 4,6 ГГц. Вроде бы прироста оверклокерского потенциала ждать особо неоткуда? Однако некоторый оптимизм всё же внушают увеличенные у Vishera по сравнению с предшественниками номинальные частоты, которые достигают 4-гигагерцевой отметки или даже превышают её с учётом турборежима.
  Выступает ли это симптомом оверклокерской привлекательности процессоров FX-8350? Наверное, ответить на этот вопрос следует положительно. Например, наш экземпляр FX-8350 оказался способен на стабильную работу на частоте 4,7 ГГц. Правда, для достижения стабильности его напряжение питания пришлось повысить до 1,5 В, но это, как уверяет AMD, совсем не опасно. Инженеры компании берутся утверждать, что при разгоне с воздушным охлаждением напряжение на процессоре вполне допустимо увеличивать до 1,4-1,55 В.
  В таком состоянии система оставалась совершенно стабильной, а температура процессора под нагрузкой не превышала 70-75 градусов.
  Разогнали мы и главного конкурента FX-8350 – процессор Intel Core i5-3570K. Достигнутая частота составила 4,6 ГГц – это вполне типичный результат для представителей семейства Ivy Bridge.
  Таким образом, на диаграммах производительности, помимо результатов процессоров в номинальном режиме, будут указаны и показатели производительности AMD FX-8350 и Intel Core i5-3570K при описанном выше разгоне.


Комментариев нет:

Отправить комментарий