Выбрать страницу

Мы протестировали на стенде Bulldozer: FX-8150 и три материнские платы 990FX.

Мы протестировали на стенде Bulldozer: FX-8150 и три материнские платы 990FX.

ТЕХНОЛОГИЯ

Чипы производятся на 32-нм узле SHP от GlobalFoundries. Для бульдозеров ранее представленный SOI был объединен с Intel HKMG (High-K Metal Gate), который может помочь в борьбе с током утечки. Архитектура хорошо спроектирована для достижения высоких тактовых частот («Speed ​​racer»), поэтому в модельном ряду, скорее всего, не будет продуктов с частотой ниже 3 ГГц. Все центральные блоки на старом языке - Black Edition, поэтому сейчас специально не обозначены.

На этом этапе давайте сделаем небольшой крюк и посмотрим на другую сторону медали. Самый быстрый четырехъядерный процессор Phenom II работает на частоте 3,7 ГГц, а 1100T на базе шестиядерного чипа Thuban - на частоте 3,3 ГГц. Для сравнения, 32-нм AMD FX-8150 имеет почти неутешительный базовый снимок, и приемлем только «уровень» Turbo Core 4,2 ГГц, что сразу же обещает 10-15% -ный избыток мощности (нет). Год назад XbitLabs сообщила, что Bulldozer пересекает тактовую частоту 3,5 ГГц, которая сошлась, но несмотря на серию промахов. Кажется правильным предположить, что по-прежнему существуют серьезные проблемы с производством и выпуском новой пушки, что существенно сказывается на характеристиках.

amd_bulldozer_six-скорость
Второе целое число увеличивает размер модуля только на 12 процентов. [+]

На основе многолетнего опыта родилась даже базовая концепция, основанная на следующем: центральные блоки выполняют операции с фиксированной точкой со средней скоростью более 80 процентов. Из этого видно, что вычисления с плавающей запятой в гораздо меньшей степени присутствуют в жизни «многоножек». Следовательно, в проекте подключены два целочисленных ядра, которые имеют свой собственный кэш первого уровня, но уже должны совместно использовать кеш второго уровня и блок с плавающей запятой. AMD назвала устройство модулем.

amd_bulldozer_one_module
Один модуль [+]

Согласно внутренним измерениям, второе целое число в основном увеличивает размер модуля в незначительной степени, напротив, в идеале оно может привести к увеличению производительности до 80%. Часть первичного кэша, отвечающая за данные, напрямую подключена к процессорам (размер 16 Кбайт, его задержка составляет 4 такта), но кэш размером 64 Кбайт, предназначенный для хранения инструкций, уже используется интегралами.

1_module_what_which
Копаем глубже [+]

Судя по результатам тестирования, кэш данных L1 не только слишком мал, но даже медленен, и вместе это не очень хорошая комбинация. Размер хранилища второго уровня, совместно используемого в модуле, является удовлетворительным, но его задержка высока, 25-27 циклов. Легко представить, что более крупный кэш L1 и более быстрый L2 (12-15 циклов) улучшат производительность процессора на 10-20%.

Неудивительно, что достижение 8 МБ L3 тоже не со скоростью света (65 циклов). Таким образом, кеш-система Bulldozer не будет восьмым чудом света.

инструкции
В наборе команд лабиринт [+]

В настоящее время Bulldozer поддерживает самый широкий набор инструкций: MMX, SSE, SSE2, SSE3, SSE4A, SSSE3, SSE4.1, SSE4.2, AVX, AES, FMA4, XOP, PCLMULQDQ и, конечно же, 64-битное расширение. Из двух нововведений (FMA4, XOP) FMA4 имеет большое значение на рынке высокопроизводительных вычислений, а XOP предлагает небольшое преимущество перед мультимедийными приложениями. Насколько нам известно, последняя версия x264 уже поддерживает новые наборы инструкций. Устаревший 3DNow! поддержка прекращена, думаю, это не вызывает у многих читателей бессонных ночей.

Известно использование Intel VT для доступа к виртуальной памяти x86. IOMMU значительно увеличивает производительность виртуализации системы, однако, что удивительно, высокопроизводительные решения Intel (Core i5-2600K, i7-2600K) не поддерживают эту технологию, и этот «черный круг» включает текущие решения Sandy Bridge E. Опять же, дополнительная услуга по сравнению с прямой конкуренцией, хотя ее полезность для обычного пользователя сомнительна.

40
Turbo Core в теории [+]

Turbo Core также был улучшен, теперь он работает с большим количеством стробов и еще лучше адаптируется к различным уровням использования. Если все ядра активны, но блоки с плавающей запятой в настоящее время не используются, тактовая частота Turbo Core 2.0 вступит в силу. Процедура динамически изменяет тактовые сигналы ядер в зависимости от нагрузки, неактивные ресурсы, модули и компоненты внутри модуля могут быть отключены, поэтому в этой области вы не поймете жалобу на фасад дома. К сожалению, программная сторона дела обстоит именно так.

на практике
Практическая реализация [+]

Планировщик Windows 7 - это, мягко говоря, не самый эффективный способ распределения задач, потому что он часто чередует распределение задач между ядрами. Следующая версия операционной системы устранит проблему, и в ближайшее время будет сделано исправление для этой системы, поэтому - в крайних случаях это может произойти на 15-25 процентов - мы скоро получим на 2-10% больше производительности. Еще одно очень приятное преимущество заключается в том, что энергопотребление в режиме ожидания может быть уменьшено на 4-5 Вт, поскольку модули могут дольше оставаться в режиме экономии.

бульдозервин8_and_bf3
«Не относитесь к своим зубам как к подарку» [+]

бульдозерbf3betafx

«Трансформация» во время Battlefield 3 [+]

Battlefield 3 также хорошо показывает, насколько оптимизация помогает процессору. В этой игре самый мощный на данный момент процессор серии FX может достичь производительности Core i7-2600k.

Процессоры серии FX поставляются в корпусе Socket AM3 + и размещаются в материнских платах AMD с набором микросхем 9-й серии. Ориентации также способствует цвет розетки, в основном черный. Для реализации бесконечно звуковой платформы Scorpius нам понадобится процессор серии FX, материнская плата с набором микросхем 9-й серии и видеокарта Radeon HD 6000-й серии. Bulldozer имеет двухканальный контроллер памяти DDR1866, поддерживающий модули 3 МГц.

phenomu_folulk

AMD FX-8150 с Phenom II X4 970 BE - сверху [+]

В заключение хотелось бы добавить еще одно интересное дополнение. Серьезные споры вызвал тот факт, что часовая работа (количество инструкций за цикл) процессорами на базе Bulldozer в среднем несколько уменьшилась по сравнению с его предшественником. Одни сразу представляют себе падение архитектуры, другие перечисляют аналогичные примеры из прошлого. В этой связи, как всегда, ограничимся фактами. Сегодня программисты все больше осознают преимущества многоядерной оптимизации. С 8-цилиндровым двигателем, который в основном обеспечивает хорошие характеристики, мы редко задумываемся о том, что он может сделать с 1-цилиндровым.

феномен

AMD FX-8150 с Phenom II X4 970 BE - снизу [+]

Пример не лучший, но он может пролить свет на суть дела. Мы не утверждаем, что мы будем оптимально использовать восемь целочисленных ядер плотно, но Turbo Core 2.0 в этом случае нацелен на максимально возможную тактовую частоту (4,2 ГГц). То, что доступно только в корпусе K10.5 по цене «кровавого пота», здесь считается «базовыми часами». Также нет сомнений в том, что реализация AVX, FMA и XOP стоила значительного набора транзисторов. Основы архитектуры используются в нескольких сегментах (сервер, настольный ПК), поэтому это казалось обязательным шагом, но сегодня мы видим еще меньше его преимуществ (особенно в настольной среде).

socket_2k

Лежа в постели [+]

В идеале (FMA4 + AVX) Bulldozer действительно выглядит очень элементарно, демонстрирует удивительную производительность и сразу же выставляет вещи в ином свете. Согласно измерениям немецкого HT4U, во время приложения рендеринга C-Ray 1.1 AMD FX-8150 работает за те же 15 секунд, что и Intel Core i7 990X. Это ровно половина времени, которое потребовалось процессору AMD Phenom II X6 1100T для выполнения этой работы. Отметим в скобках, что мы также взвесили другую крайность, Super PI.

Купонок

Womier 21 клавиша K21 Pad Механическая клавиатура 20% Numpad PCB CASE Переключатель с возможностью горячей замены Поддержка световых эффектов со светодиодным переключателем RGB

Womier 21 клавиша K21 Pad Механическая клавиатура 20% Numpad PCB CASE Переключатель с возможностью горячей замены Поддержка световых эффектов со светодиодным переключателем RGB

BGa6633c
[EU Direct] Gokwh 12.8 В 100 Ач LiFePO литиевая батарея 1280 Втч коробка для хранения энергии серия аккумуляторов ЖК-дисплей емкости встроенный BMS

[EU Direct] Gokwh 12.8 В 100 Ач LiFePO литиевая батарея 1280 Втч коробка для хранения энергии серия аккумуляторов ЖК-дисплей емкости встроенный BMS

BG171d07

баннер