Subscribe.ru

Процессор Intel Core i7-920 на ядре Bloomfield

Процессор Intel Core i7-920 на ядре Bloomfield

Политика компании Intel в отношении настольных процессоров заключается в ежегодном обновлении продуктовой линейки. Это осуществляется двумя способами - переходом на новый технологический процесс и сменой архитектуры. И то, и другое - весьма затратные операции, и поэтому каждый год Intel выбирает что-то одно. В частности, в прошлом году компания перешла на 45-нм техпроцесс и представила новые продукты на ядрах Yorkfield и Wolfdale. В 2008 году подошла очередь смены архитектуры и Intel представила свою последнюю разработку - Nehalem.

На первый взгляд, перед нами очередная революционная платформа, которая может поднять планку производительности на еще большую высоту. Начнем с главного, а именно с процессоров на ядре Bloomfield, которые отличаются встроенным контроллером памяти. Как мы помним, первые настольные процессоры со встроенным контроллером памяти представила компания AMD, и этот шаг привел к значительному росту производительности. Поэтому мы можем ожидать подобного эффекта и от новейшей разработки Intel. Впрочем, встроенный контроллер памяти - это главная, но не единственная инновация Intel. Архитектура процессора приобрела кардинально новую модульную структуру, которая характеризуется новым вычислительным ядром, новой процессорной шиной, встроенным трехканальным контроллером памяти DDR3, возможностью интеграции графического ядра, новой технологией многопоточности SMT и дополнительным контроллером PCU, который отвечает за управление напряжением и частотой каждого из ядер. Стоит ли говорить, что новая процессорная архитектура потребовала смены процессорного сокета, поэтому новые процессоры имеют упаковку LGA с 1366 контактами.

Итак, рассмотрим каждый из вышеперечисленных пунктов более подробно. Во-первых, новое вычислительное ядро основано на высокоэффективной и хорошо себя зарекомендовавшей архитектуре Core. Действительно, процессоры Core 2 Duo и Core 2 Quad демонстрируют прекрасное сочетание высокой производительности, разумного тепловыделения и оптимальной цены. Но у архитектуры Core есть несколько фундаментальных проблем, которые не видны обычному пользователю. Главная из них заключается в сложности масштабирования или, проще говоря, в проблемах, возникающих при увеличении количества ядер в одном процессоре. Изначально архитектура Core разрабатывалась для использования в двухъядерном исполнении. А когда возникла необходимость в 4-ядерных процессорах, единственным возможным решением стало объединение в одном корпусе двух двухъядерных кристаллов. Вот тут-то и проявилась проблема, связанная со взаимодействием ядер между собой. Дело в том, что процессорная шина Quad Pumped Bus уже давно исчерпала свой потенциал и не позволяла обмениваться данными между ядрами напрямую. К тому же, ее пропускная способность не соответствовала требованиям в многоядерных системах. И чем больше количество ядер, тем заметнее становились недостатки QPB. Понятно, что данная ситуация совершенно не устраивала Intel, которая взяла курс на активное увеличение количества ядер. Поэтому на свет появилась новая шина QPI (Quick Path Interconnects) с топологией "точка-точка". Передача данных осуществляется по двум соединениям шириной 20 бит, из которых 16 предназначены для передачи данных. Итоговая пропускная способность равна 25,6 Гб в секунду, что приблизительно равно пропускной способности шины HyperTransport v3.0.

Второе важное изменение в архитектуре процессора касается структуры и размера кэш-памяти. По сравнению с ядром Penryn, размер кэша L1 в Nehalem не изменился. Его объем равен 64 кб, из которых 32 кб отведено под данные, и 32 кб - под инструкции. А что касается кэш-памяти L2, то здесь изменения куда существеннее - вместо одного большого разделяемого кэша инженеры Intel оснастили каждое ядро собственным кэшем L2 объемом 256 кб. Также в Nehalem появилась разделяемая кэш-память третьего уровня объемом 8 Мб (для ядра Bloomfield).

Третье, и наиболее важное изменение касается модульной структуры процессора, которая позволяет инженерам Intel достаточно свободно изменять параметры процессоров, включая в него те или иные блоки. В частности, в процессор может быть интегрировано графическое ядро и контроллер памяти. Но если встроенную графику мы увидим только в 2009 году, то контроллер памяти есть уже в процессорах Bloomfield. Данный контроллер оптимизирован для работы с памятью DDR3 и поддерживает одно-, двух- и трехканальный режим доступа. В частности, при использовании 3-канального доступа пропускная способность памяти DDR3-1066 равна 25,6 Гб/с, что соответствует пропускной способности шины QPI. Следовательно, для платформы Socket LGA 1366 более скоростная память пока не нужна.

Также отметим, что на материнских платах с чипсетом X58 будет минимум три слота DIMM для DDR3, а стандартное количество слотов будет равно шести:

Помимо перечисленных особенностей архитектуры Nehalem, стоит упомянуть о незначительных модификациях самого вычислительного ядра. Инженеры Intel взяли за основу ядро Core и изменили некоторые из функциональных блоков, таких как декодеры простых (3) и сложных (1) команд, улучшили технологию Macrofusion (x32/x64) (исполнение нескольких команд (до пяти) как единую инструкцию), оптимизировали блок оптимизации циклов (Loop Stream Detector), улучшили блок предсказания переходов (Stack Buffer), увеличили объем буферов (Reorder Buffer / Reservation Station), предназначенных для технологии многопоточности SMT. Кстати, на последней технологии стоит остановиться и рассмотреть ее подробнее.

Во время использования архитектуры Netburst, инженеры Intel усиленно работали над оптимизацией загрузки и исполнения команд в довольно длинных конвейерах (отличительная особенность данной архитектуры). Одним из технических решений этой проблемы стала технология HyperThreading, позволяющая одновременно исполнять два потока команд одним процессорным ядром. В результате, пользователь видел в своей системе удвоенное количество процессоров, и данная технология давала некоторый прирост производительности в оптимизированных приложениях. Напротив, в неоптимизированных программах (например, в играх) пользователь сталкивался с ситуацией, когда система с включенной HyperThreading работала несколько медленнее. В новой архитектуре Nehalem инженеры Intel попытались ликвидировать все слабые места HyperThreading, и конечный результат получил название Simultaneous MultiThreading (или SMT). Одной из особенностей данной технологии является разделение ядер на реальные и виртуальные, что позволяет более эффективно их использовать (с точки зрения разработчика ПО).

Пара слов о физических параметрах нового ядра Nehalem. Первые процессоры Core i7 имеют площадь ядра 263 кв. мм, а само ядро состоит из 731 млн транзисторов. При этом, типичный уровень тепловыделения остается в рамках спецификаций Intel и составляет 130 Вт. Этот показатель можно считать вполне приемлемым, учитывая возросшую сложность ядра. Кстати, не последнюю роль в энергосбережении играет специальный блок PCU (Power Control Unit), который отвечает за текущую частоту и напряжение каждого из ядер, в зависимости от нагрузки. Более того, блок PCU способен полностью отключать неактивные ядра.

Интересно, что блок PCU довольно тесно связан с технологией Turbo Boost, которая также управляет частотами ядра, но она ориентирована на повышение частоты. Изменение частоты осуществляется путем изменения множителя, и, следовательно, множитель должен быть разблокирован в сторону увеличения. Инженеры Intel так и сделали, но с небольшой оговоркой: множитель может быть увеличен только на единицу от штатного. На практике это выглядит следующим образом:

Теперь подведем промежуточные итоги, и сравним параметры ядер Bloomfield и Yorkfield.

В нашем распоряжении оказался самый слабый процессор новой линейки - Core i7 920. Из-за увеличенного количества контактов, его размеры несколько превышают размеры процессоров LGA775: Производительность

Поскольку графики довольно объемные, посоветуем, на что стоит обратить внимание. Во-первых, мы сравнили собственно производительность процессора Core i7-920 с четырехъядерным процессором QX9650 на ядре Yorkfield. Нас, прежде всего, заинтересовала зависимость прироста производительности от смены архитектуры. Поэтому мы понизили частоту QX9650 до 2,66 ГГц. Во-вторых, нас интересует прибавка скорости от режима Turbo, в котором частота Core i7-920 наращивается до 2,8 ГГц. А в-третьих, мы проверили эффективность трехканального доступа к памяти по сравнению с двухканальным.

В тестовой системе было использовано следующее оборудование:

Судя по результатам, новая архитектура Nehalem показывает наилучшие результаты в приложениях, оптимизированных под многопоточность. Благодаря технологии SMT, в таких приложениях пользователь получает весьма ощутимый прирост скорости. Такая же ощутимая прибавка производительности есть в программах, скорость которых зависит от пропускной способности памяти. Кроме того, если мы запускаем совсем древнюю и "дубовую" программу, не использующую последние процессорные технологии, то архитектура Nehalem все равно оказывается чуть-чуть быстрее. Все дело в том, что вычислительное ядро Core также подверглось модификациям и улучшениям.

Что касается режима Turbo, то он дает пропорциональную (увеличению множителя CPU на 1) прибавку скорости в большинстве приложений. И, наконец, разница в скорости двухканального и трехканального режимов доступа к памяти довольно незначительная. Но это говорит не о плохой реализации 3-канального режима, а просто а замечательной реализации 2-канального. В частности, латентность памяти в 2-канальном режиме заметно меньше, что повышает общую производительность системы. Выводы

Итак, архитектура Nehalem является эволюционным шагом в развитии линейки Core. Причем количество изменений и новых технологий столь велико, что более уместным будет сочетание "эволюционный прыжок". Однако с практической точки зрения, чистый прирост скорости не столь велик, как в момент появления Core 2 Duo. Поэтому, на первых порах процессоры на ядре Bloomfield могут заинтересовать разве что энтузиастов и некоторых профессиональных пользователей. Энтузиастов, по определению, интересуют самые последние разработки, и для них есть две новости. Хорошая заключается в том, что смена платформы (LGA 1366 X58) позволит использовать технологии NVIDIA SLI и AMD CrossFire с новейшими процессорами Intel. Плохая новость - судя по тестовому экземпляру Intel Core i7-920, разгонный потенциал ядра Bloomfield относительно невелик. Впрочем, мы еще вернемся к этим темам в следующих материалах. Для профессиональных пользователей есть только хорошие новости. Во-первых, процессоры Bloomfield быстрее своих предшественников. А если используемое программное обеспечение имеет оптимизацию под многопоточность, или скорость работы зависит от пропускной способности памяти, или есть оптимизация под набор дополнительного набора инструкций SSE 4.2, то новые процессоры - намного быстрее.

---------