qpi l0s and l1 что это в биосе
Особенности системной шины QPI.
Особенности системной шины QPI.
Системная шина играет ключевую роль во взаимодействии CPU с остальными компонентами компьютера. Intel разработала для своих новых многоядерных процессоров скоростной и экономичный интерфейс QPI. Последовательная шина QPI позволила ликвидировать многие «узкие места. В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI.
Таким образом, в современных системах на процессорах Intel в Core i7 частота 133 МГц – это просто частота тактового генератора, формирующего все остальные частоты.
Аналогичным образом формируется и частота шины памяти, которая использует свой собственный набор множителей.Для частоты шины памяти процессоры Core i7 предложат несколько доступных множителей. Например, процессор Core i7-965 Extreme Edition предлагает выбор между 6x, 8x, 10x и 12x, что означает поддержку этим процессором памяти DDR3-800/1067/1333/1600 SDRAM.
Интерфейс QPI, связывающий процессор с северным мостом (и другими процессорами см. рис. 2), также использует эту частоту в качестве базовой, умножая её на свой собственный коэффициент. Частота интерфейса QPI будет варьироваться на разных моделях CPU. Так, в Core i7-965 Extreme Edition эта шина работает на частоте 3,2 ГГц, в то время как на Core i7-940 и i7-920 её частота понижена до 2,4 ГГц.
Значительного повышения эффективности новой шины удалось добиться за счёт динамического управления частотой и напряжением принимающего и передающего чипов, а также некоторых других нововведений. Кроме того, компания также разработала чип-диспетчер, который позволяет аппаратно распределять потоки между ядрами процессора. Производительность симулированного 64-ядерного процессора при его помощи удалось повысить в два раза. Все эти новые разработки Intel приведут к появлению еще более эффективных и экономичных многоядерных процессоров. Новая технологии приёма/передачи данных, которая будет использоваться в многопроцессорных системах следующего поколения, требующих не только повышенной пропускной способности канала ввода/вывода, но и более эффективного с точки зрения потребляемой мощности интерфейса передачи информации.
Шина QPI, является аналогом шины HyperTransport от AMD, и тоже предназначена для связи процессора с другими компонентами. Она призвана обеспечить согласованный обмен данными между небольшими группами локальных процессоров, а также взаимодействие между банками памяти (даже не обязательно одного типа) в распределенных системах, включающих не более 128 процессоров. QPI обеспечивает меньшие задержки и более высокую производительность, по сравнению с HyperTransport.
Шина QuickPath дебютировала в рамках серверной платформы Tylersburg, которая использует процессоры поколения Nehalem с разделяемым кэшем третьего уровня и поддержкой «виртуальной многоядерности», в частности, система на базе двух четырёхъядерных процессоров сможет имитировать работу шестнадцати процессорных ядер.
Ключевой особенностью новой архитектуры является применение концепции масштабируемой разделяемой памяти (scalable shared memory). В рамках новой архитектуры каждый CPU будет иметь собственную выделенную память, к которой он будет обращаться напрямую, через свой интегрированный контроллер памяти.
В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QuickPath Interconnect. Как и шина HyperTransport, применяемая в процессорах компании AMD, QPI будет использовать последовательную связь по схеме «точка-точка» (point-to-point), что обеспечит высокую скорость при малой латентности. Итак, основными ключевыми характеристиками Intel QuickPath Architecture являются:
— производительность каналов QuickPath Interconnect до 6,4 гигатранзакций в секунду (благодаря чему общая пропускная способность может достигать 25,6 Гбайт/сек)
— QPI уменьшает количество служебной информации, необходимой для функционирования многопроцессорных систем (что, соответственно, позволяет повысить скорость передачи полезных данных);
— реализация контроля при помощи циклического избыточного кода (CRC) и повторной передачи при обнаружении ошибок на канальном уровне (что позволяет обеспечить целостность данных без ощутимого влияния на производительность);
— возможность реализации высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability) благодаря реконфигурации каналов в случае повреждения отдельных участков, поддержке «горячей замены». При нарушении сигнала в одной или нескольких из линий контроллер шины может автоматически перенастроить QPI на ширину 15 и даже 5 бит, не теряя работоспособности, таким образом, серверы, например, на базе мощных процессоров Xeon 5500 будут обладать повышенной устойчивостью к сбоям шины (рис. 3). При организации шины с различной шириной линий, управлением потоком данных занимается специальный агент QPI, который распределяет поток данных перед тем, как отправить его по различным физическим линиям, а при приеме аналогичный агент собирает разные потоки данных в один (рис. 3).
Рис. 3. Пример конфигурирования 20 каналов в четыре группы по 5 каналов
В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI (рис. 2). Шина QPI использует последовательную связь по схеме «точка-точка» (point-to-point), что обеспечивает высокую скорость при малой латентности.
Рис. 4. Архитектурные особенности процессоров Core i7 с шиной QPI
Серверные модели оборудованы двумя (и более) линиями QPI (рис. 4), что позволяет выделить всем критичным направлениям (например, связь двух процессоров между собой и каждого из них с северным мостом) по собственному соединению. В любом случае, производительности QuickPath Interconnect вполне достаточно, чтобы обеспечить нормальную работу платформ с несколькими CPU. Интерфейс QPI в 2-3 раза эффективнее и к тому же не обременен взаимодействием с оперативной памятью (этим занимается встроенный контроллер памяти DDR3).
Рис. 5. Принципы организации шины QuickPath Interconnect (каждую отдельную дифференциальную пару называют линией. 20 линий для обмена плюс линии синхронизации в каждом направлении образуют 84-х контактный интерфейс)
Физический уровень содержит все необходимые схемы для выполнения интерфейсных операций обмена данными, включая драйвер и входные/входные буферы, параллельное-последовательное и последовательно-параллельное преобразование, схему(ы) ФАПЧ и схемs согласования импеданса. Кроме того, он включает также логические функции, связанные с инициализацией и поддержкой интерфейса.
Логическая часть физического уровня обеспечивает соединение со уровнем связи и управляет потоком информации между ними (вперед и назад). А также управляет инициализацией и конфигурированием канала связи и управляет шириной информационной магистрали в операции обмена.
Рис. 6. Общая блок-схема физического уровня
Физический интерфейс шины отличается простотой реализации, в нем используются низковольтные, дифференциальные сигналы (рис. 7). Для передачи сигналов используются две линии, по которым синхронно передается прямой и инверсный сигнал. Для мобильных систем могут использоваться сигналы снижающие энергопотребление шиной, на линиях шины обеспечивается низкий уровень перекрестных помех.
Рис. 7. Принципы физической реализации линий связи шины
Физический уровень разделен на две секции. Аналоговая (или электрическая) секция управляет передачей цифровых данных. Эта секция формирует соответствующие аналоговые уровни сигналов с надлежащим выбором времени относительно сигнала синхронизации и затем принимает сигналы данных на другом конце и преобразовывает их обратно в цифровые данные. Этот уровень ответственен за сигналы и специфические детали выполнения операции обмена между двумя агентами. Этот уровень непосредственно управляет передачей сигналов данных на проводах шины, включает электрические уровни, рассчитывая аспекты, и решает логические проблемы, возникающие при посылке и получении каждого бита информации по параллельным шинам. Передача сигналов в обе стороны выполняется на высокой скорости в дифференциальном виде по 20 отдельным парам в одном цикле шины, реализующем одну операцию обмена. Отдельная линия синхронизации сопровождает свой набор из 20 пар линий передачи данных.
Интерфейс Intel® QuickPath чтобы для обеспечения передачи всей номенклатуры сигналов одной шины QPI, работающей в ее полной ширине, на физическом уровне использует восемьдесят четыре линии и соответственно 84 контакта. В некоторых случаях, связь может осуществляться в половине или четверти ширины шины, например, чтобы уменьшить расход энергии или из-за отказов на линии. Единицу информации, переданной в каждой единице времени физическим слоем называют phit, который является акронимом для физической единицы. Например, каждый phit может содержать 20 бит информации. Типичные скорости передачи сигналов связи в текущих продуктах обеспечивают в операциях обмена в 6.4 GT/s для систем с короткими связями между компонентами, и 4.8 GT/s для более длинных связей, используемых в больших мультипроцессорных системах. Управлением потоком данных занимается специальный «агент», который распределяет поток данных перед тем, как отправить его по различным физическим линиям, а при приеме аналогичный агент собирает разные потоки данных в один.
Для обмена информацией между компонентами системы используются пакеты. Пакетная связь начинается на канальном уровне для реализации функций управления каналом. Пакеты формируются для того, чтобы надежно перенести информацию от передающего к принимающему компоненту. Поскольку пакеты передаются через соответствующие уровни, они дополняются вспомогательной информацией, необходимой для обработки пакета на соответствующем уровне. На принимающей стороне происходит обратный процесс, и пакет преобразовывается обратно, начиная с физического уровня и далее, до формата, в котором он может быть обработан принимающим устройством.
Рис. 8. Типовая обобщенная структура пакета и состав пакета для разных уровней
Физический уровень принимает с линий связи кадр проверяет его корректность и выделяет из него пакет. Физическим уровнем биты phits и биты контроля циклического избыточного кода не контролируются. Физический уровень объединяет phits в пакеты, и передает пакеты на уровень связи. Каждый пакет, состоит из 80 бит (рис. 8). Рис. 9 иллюстрирует возможности физического уровня передачи информации кадра по шине QPI.
Рис. 9. Физический уровень Intel® QPI (Phit) требует для передачи 20 физических линий передач.
Поддержка ассиметричных связей и хорошая масштабируемость по скорости, по ширине шины, частоте и направлению, позволяет разработчикам систем выбирать решение полностью соответствующее их задачам. Широкая полоса пропускания позволяет в проектируемых многопроцессорных системах легко добавлять новые высокопроизводительные компоненты. Использование шины QPI позволяет сократить время на разработку этих проектов, так как добавление в систему новых чипов не вызывает проблем.
Системная шина QPI для серверов на многоядерных процессорах Core iX.
Системная шина QPI для серверов на многоядерных процессорах Core iX.
Итак, кристалл процессора Core i7 (Nehalem) с другими компонентами системы пока связывают два архитектурных блока (рис. 1):
— QuickPath Interconnect (QPI) – связь с чипсетом (и другим процессором в многопроцессорных вариантах);
— Integrated Memory Controller (IMC) – связь с модулями памяти.
Рис. 1. Внешние и внутренние связи процессора Cоre iX
Таким образом, в современных системах на процессорах Intel в Core iX частота 133 МГц – это просто частота тактового генератора, формирующего все остальные частоты. Частота процессора получается как произведение этой величины на коэффициент умножения (например, частота Core i7-920 получается умножением коэффициента 20х на 133 МГц). Интерфейс QPI, связывающий процессор с северным мостом (и другими процессорами), также использует эту частоту в качестве базовой, умножая её на свой собственный коэффициент. Частота интерфейса QPI будет варьироваться на разных моделях CPU (например, в Core i7-965 Extreme Edition эта шина работает на частоте 3,2 ГГц, а на Core i7-940 и i7-920 её частота понижена до 2,4 ГГц).
Значительного повышения эффективности новой шины удалось добиться за счёт динамического управления частотой и напряжением принимающего и передающего чипов, а также некоторых других нововведений. Кроме того, компания также разработала чип-диспетчер, который позволяет аппаратно распределять потоки между ядрами процессора. Производительность симулированного 64-ядерного процессора при его помощи удалось повысить в два раза. Все эти новые разработки Intel приведут к появлению еще более эффективных и экономичных многоядерных процессоров.
В первом квартале 2012 года были представлены серверные процессоры платформы Intel Romley, (модели серий Intel Xeon E5-1600 и Intel Xeon E5-2600).
Новые технологии приёма/передачи данных, которые будут использоваться в многопроцессорных системах следующего поколения, требуют не только повышенной пропускной способности канала ввода/вывода, но и более эффективного с точки зрения потребляемой мощности интерфейса передачи информации.
Технология шины QPI от Intel превосходит все современные аналоги как минимум втрое, потребляя при этом на 75% меньше энергии. Технология в основном используется в качестве интерфейса для нескольких процессоров в многопроцессорных вычислительных системах (рис. 2). Шина QPI, является аналогом шины HyperTransport от AMD, и тоже предназначена для связи процессора с другими компонентами. Она призвана обеспечить согласованный обмен данными между небольшими группами локальных процессоров, а также взаимодействие между банками памяти (даже не обязательно одного типа) в распределенных системах, включающих не более 128 процессоров. QPI обеспечивает меньшие задержки и более высокую производительность, по сравнению с HyperTransport.
Шина QuickPath дебютировала еще в рамках серверной платформы Tylersburg, которая использовала процессоры поколения Nehalem с разделяемым кэшем третьего уровня и поддержкой «виртуальной многоядерности» (в частности, система на базе двух четырёхъядерных процессоров сможет имитировать работу шестнадцати процессорных ядер).
Рис. 2. Архитектурные особенности систем процессоров с шиной QPI
Ключевой особенностью новой архитектуры является применение концепции масштабируемой разделяемой памяти (scalable shared memory). В рамках новой архитектуры каждый CPU имеет собственную выделенную память, к которой он будет обращаться напрямую, через свой интегрированный контроллер памяти. В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QuickPath Interconnect. Как и шина HyperTransport, применяемая в процессорах компании AMD, QPI будет использовать последовательную связь по схеме «точка-точка» (point-to-point), что обеспечит высокую скорость при малой латентности. Итак, основными ключевыми характеристиками Intel QuickPath Architecture являются:
— производительность каналов QuickPath Interconnect до 6,4 гигатранзакций в секунду (благодаря чему общая пропускная способность может достигать 25,6 Гбайт/сек)
— QPI уменьшает количество служебной информации, необходимой для функционирования многопроцессорных систем (что, соответственно, позволяет повысить скорость передачи полезных данных);
— реализация контроля при помощи циклического избыточного кода (CRC) и повторной передачи при обнаружении ошибок на канальном уровне (что позволяет обеспечить целостность данных без ощутимого влияния на производительность);
— возможность реализации высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability) благодаря реконфигурации каналов в случае повреждения отдельных участков, поддержке «горячей замены». При нарушении сигнала в одной или нескольких из линий контроллер шины может автоматически перенастроить QPI на ширину 15 и даже 5 бит, не теряя работоспособности, таким образом, серверы, например, на базе мощных процессоров Xeon 5500 будут обладать повышенной устойчивостью к сбоям шины (рис. 3). При организации шины с различной шириной линий, управлением потоком данных занимается специальный агент QPI, который распределяет поток данных перед тем, как отправить его по различным физическим линиям, а при приеме аналогичный агент собирает разные потоки данных в один (рис. 3).
Рис. 3. Пример конфигурирования 20 каналов в четыре группы по 5 каналов
Максимальная производительность QPI составляет 6,4 миллиарда передач в секунду, что в случае Nehalem соответствует пропускной способности 25,6 ГБ/с (но это не является пределом для шины QPI).
Многие разработчики чипсетов уже активно работают над решениями для серверов с использованием шин QPI. В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI (рис. 2). Шина QPI использует последовательную связь по схеме «точка-точка» (point-to-point), что обеспечивает высокую скорость при малой латентности.
Рис. 4. Архитектурные особенности процессоров с шиной QPI
Серверные модели оборудованы двумя (и более) линиями QPI (рис. 4), что позволяет выделить всем критичным направлениям (например, связь двух процессоров между собой и каждого из них с северным мостом) по собственному соединению. В любом случае, производительности QuickPath Interconnect вполне достаточно, чтобы обеспечить нормальную работу платформ с несколькими CPU (рис. 4). Интерфейс QPI в 2-3 раза эффективнее и к тому же не обременен взаимодействием с оперативной памятью (этим занимается встроенный контроллер памяти DDR3).
Многопроцессорные системы, построенные на процессорах со встроенными контроллерами памяти (рис. 6), должны использовать «распределенную» модель памяти NUMA (Non-Uniform Memory Access), а, следовательно, нуждаются в прямом и высокоскоростном соединении между процессорами. Появление прямой связи между процессорами позволило Intel реализовать архитектуру доступа к памяти NUMA, столь необходимую для критичных к быстродействию ОЗУ задач в многопроцессорных средах. Теперь оптимизированные под NUMA операционные системы и приложения смогут при генерации и распределении вычислительных потоков учитывать, в каком сегменте памяти размещать данные, чтобы не обращаться за ними в удаленную и, следовательно, намного менее быструю память. Благодаря этому оптимизированные приложения, генерирующие по одному потоку на ядро CPU, получат вплоть до 5,3-кратного прироста пропускной способности по сравнению с четырехканальной общей FB-DIMM. При этом оптимизацию под NUMA можно отключить в BIOS серверной материнской платы, вновь сделав всю установленную в системе RAM общей, впрочем, вряд ли многим потребителям это понадобится, так как большинство современных операционных систем поддерживают NUMA.
Рис. 6. Использование QPI в серверных платформах
Шина QPI имеет собственную многоуровневую модель. Архитектурой QPI определены (см. рис. 7) пять уровней:
Многоуровневая архитектура обеспечивает большую гибкость выполнения обмена и учитывает дальнейшее развитие в рамках стандарта Intel® QuickPath архитектуры.
Уровень связи является следующим уровнем стека протокола. Он ответственен за надежную передачу и контроль потока. Единица передачи на уровне связи имеет размер 80 бит (кадр для блока управления потоком).
Уровень маршрутизации обеспечивает структуру для пересылки пакетов через сеть.
Транспортный уровень – архитектурно определен, но не реализован в начальном
продукте, в дальнейших реализациях будет обеспечивать более высокий уровень производительности процесса маршрутизации для надежной сквозной передачи данных.
Рис. 8. Архитектурные уровни шины Intel® QuickPath (существующая архитектура шины QPI)
Особенности настройки систем c процессором Intel Core i7
Появление семейства новых процессоров Intel Core i7 (кодовое название Nehalem) ознаменовало собой новую эпоху в развитии компьютеров. Дело в том, что эти процессоры не просто имеют новую микроархитектуру — они несовместимы с предыдущими компьютерными платформами. Изменились и принципы разгона систем и настройки BIOS. В этой статье мы рассмотрим особенности настройки BIOS систем на базе процессоров семейства Intel Core i7.
Несмотря на глобальный экономический кризис, под конец года компания Intel все же порадовала своих поклонников и в полном соответствии с ранее намеченными планами приступила к массовому производству новых процессоров семейства Intel Core i7, известных также под кодовым названием Nehalem.
Увы, но даже топовым моделям процессоров предыдущего поколения семейств Intel Core 2 Duo и Intel Core 2 Quad конкурентам Intel было просто нечего противопоставить, что уж говорить о новом поколении процессоров. Так что о процессорах компании AMD теперь можно вспоминать только как об основе разве что для самых дешевых компьютеров начального уровня.
В настоящее время компания Intel производит несколько моделей четырехъядерного процессора Intel Core i7 с кодовым названием Bloomfield для сегмента высокопроизводительных настольных ПК, а в следующем году собирается расширить модельный ряд процессоров Intel Core i7.
В этой статье мы не будем рассматривать микроархитектуру процессоров Intel Core i7 (о ней подробно рассказывается в статье «Процессоры семейства Intel Core i7», опубликованной в данном номере журнала), а сконцентрируемся на особенностях настройки BIOS компьютеров на базе новых процессоров. Дело в том, что настройка BIOS новых систем имеет ряд принципиальных отличий от настройки BIOS систем на базе процессоров предыдущего поколения, что связано с кардинальным изменением микроархитектуры процессора.
Отличия процессора Intel Core i7 от процессоров предыдущего поколения
Прежде чем переходить к обсуждению особенностей настройки BIOS систем на базе новых процессоров Intel Corei7, вкратце рассмотрим принципиальные отличия новых процессоров Intel от процессоров предыдущих поколений на примере четырехъядерного процессора Bloomfield.
Все процессоры Bloomfield изготавливаются по 45-нанометровой технологии, а их TDP составляет 130 Вт. Конструктивно процессор Bloomfield представляет собой четыре ядра на одном кристалле, то есть является истинно четырехъядерным и содержит 731 млн транзисторов.
Забегая вперед, отметим, что в настоящее время производится три варианта процессора Bloomfield: Intel Core i7-965 Extreme Edition, Intel Core i7-940 и Intel Core i7-920. Процессор Intel Core i7-965 Extreme Edition имеет тактовую частоту 3,2 ГГц и скорость QPI 6,4 GT/s; процессор Intel Core i7-940 — тактовую частоту 2,93 ГГц и скорость QPI 4,8 GT/s, а процессор Intel Core i7-920 — 2,66 ГГц и скорость QPI 4,8 GT/s. Для всех трех моделей процессоров Bloomfield размер L3-кэша составляет 8 Мбайт.
Сегодня процессоры Bloomfield совместимы только с чипсетом Intel X58 Express (кодовое название Tylersburg), который представляет собой двухчиповое решение (северный мост в паре с южным мостом). В качестве южного моста используется ICH10R.
Основные особенности процессора Bloomfield, кардинально отличающие его от процессоров предыдущего поколения, следующие:
При этом, говоря об отличиях процессора Bloomfield, мы, как уже отмечалось, не рассматриваем особенности микроархитектуры ядра процессора.
Новый разъем процессора LGA 1366
Одна из особенностей четырехъядерного процессора Bloomfield заключается в том, что он оснащен новым разъемом LGA 1366, то есть имеет уже не 775, а 1366 контактов. Собственно, даже по своим размерам новый процессор Bloomfield превосходит процессоры предыдущих поколений. Так, если процессоры семейств Intel Core 2 Duo и Intel Core 2 Quad с разъемом LGA 775 имели размер упаковки 37,5×37,5 мм, то упаковка процессора Bloomfield — 42,5×45 мм.
Изменение типа разъема процессора повлекло за собой изменение системы крепления кулера — для процессоров Bloomfield потребуется кулер с системой крепления под разъем LGA 1366, а вот кулеры для процессоров с разъемом LGA 775 уже не подойдут.
Интегрированный трехканальный контроллер памяти DDR3
Пожалуй, главной особенностью процессора Bloomfield является наличие в нем интегрированного трехканального контроллера памяти DDR3, то есть теперь контроллер памяти интегрируется не в северный мост чипсета, а в процессор.
С памятью DDR2 процессоры Bloomfield несовместимы и поддерживают только память DDR3-1333, DDR3-1066 и DDR3-800. Причем контроллер памяти может использовать до двух DIMM-слотов на каждый канал, то есть на материнских платах для процессоров Intel Core i7 будет располагаться шесть слотов памяти. Платы с шестью слотами памяти позволяют устанавливать максимум 12 Гбайт памяти DDR3 с учетом того, что в настоящее время на рынке максимальный объем одного модуля памяти DDR3 составляет 2 Гбайт. Естественно, применение такого объема памяти в системе возможно только при наличии 64-битной операционной системы. В случае 32-битной операционной системы оптимальный объем памяти DDR3 будет равен 3 Гбайт. Дело в том, что 32-битные операционные системы могут адресовать до 4 Гбайт памяти, однако адресное пространство от 4 Гбайт и ниже зарезервировано для системных устройств, поэтому, даже если в системе устанавливается 4 Гбайт памяти, реально для приложений и операционной системы оказывается доступным чуть более 3 Гбайт памяти. Соответственно устанавливать 4 Гбайт памяти бессмысленно.
При использовании 3 Гбайт DDR3-памяти в случае 32-битных операционных систем оптимальным будет применение трех модулей памяти емкостью по 1 Гбайт каждый. Дело в том, что именно в этом случае можно добиться максимальной производительности подсистемы памяти, поскольку память будет функционировать в трехканальном режиме.
Важно отметить, что никакой особой трехканальной DDR3-памяти для новых процессоров не потребуется. Сегодня на рынке появилась трехканальная DDR3-память для процессоров Intel Core i7. Это означает лишь то, что если ранее для двухканальных контроллеров памяти продавались наборы, состоящие из двух одинаковых модулей памяти, то для процессоров Intel Core i7 теперь будут продаваться наборы DDR3-памяти, состоящие из трех одинаковых модулей. В принципе, никто не запрещает использовать один или два модуля DDR3-памяти в ПК на базе процессора Intel Core i7, но в этом случае память будет работать в одно- и двухканальном режимах соответственно.
Контроллер памяти процессора Intel Core i7 поддерживает память DDR3-1333, DDR3-1066 и DDR3-800, а также спецификацию XMP, что при использовании соответствующих модулей обеспечивает эффективный разгон памяти. Важно отметить, что различные модели процессоров семейства Intel Core i7 рассчитаны на поддержку разных типов памяти. Причем тип памяти (DDR3-1333, DDR3-1066 или DDR3-800) определяется скоростью QPI, о чем будет рассказано далее.
Связь с северным мостом чипсета по новой шине QPI
Следующая особенность процессоров семейства Intel Core i7 заключается в том, что связь процессора с северным мостом чипсета осуществляется не по традиционной шине FSB, а по новой шине QPI (Intel QuickPath Interconnect).
Шина QPI является последовательной высокоскоростной двунаправленной шиной с шириной 20 бит в каждую сторону (на прием и передачу). При этом 16 бит отводится для передачи данных, две линии зарезервированы для передачи служебных сигналов и еще две — для передачи кодов коррекции ошибок CRC. Теоретическая пропускная способность шины QPI составляет 25,6 Гбайт/с, однако такая единица измерения, как Гбайт/с, более не будет служить характеристикой QPI-шины. Вместо этого будет использоваться термин «трансферы в секунду» (GT/s), то есть количество передач запакетированных данных по шине в секунду.
Скорость QPI является характеристикой самого процессора, а не чипсета. Для процессоров Bloomfield скорость QPI может составлять 6,4; 4,8 и 3,2 GT/s.
Как уже отмечалось, скорость QPI процессоров Bloomfield определяет и тип поддерживаемой ими памяти. Процессор с QPI 6,4 GT/s поддерживает память DDR3-1333, процессор с QPI 5,8 и 4,8 GT/s — память DDR3-1066, ну а процессор с QPI 3,2 GT/s — память DDR3-800.
Привязка скорости QPI к типу поддерживаемой процессором памяти объясняется модульной двухуровневой структурой процессора. Четырехъядерный процессор Bloomfield состоит из нескольких конструктивных модулей: на уровне Core Logic располагаются четыре ядра процессора, а на уровне Uncore Logic — такие компоненты процессора, как L3-кэш, контроллер памяти и интерфейсы QPI. При этом все компоненты уровня Uncore Logic работают на одной частоте, но не синхронизированы по частоте с ядрами процессора. Фактически это означает, что контроллер памяти синхронизован по частоте с шиной QPI, чем и объясняется жесткая привязка скорости QPI к типу поддерживаемой памяти.
Через настройки BIOS можно разгонять по частоте элементы Uncore Logic, но разгон будет производиться синхронно для всех элементов Uncore Logic.
Наличие кэша L3 и изменение иерархии кэш-памяти процессора
С точки зрения настройки системы наличие кэша L3, равно как и изменение иерархии кэш-памяти процессора, значения не имеет. В то же время нужно отметить, что, поскольку кэш L3 находится на уровне Uncore Logic, его частота не совпадает с частотой работы ядра процессора, а следовательно, с частотой кэшей L2 и L1. Частота работы кэша L3 неизвестна (точно так же, как не указывается частота работы контроллера памяти и шины QPI), но, поскольку все элементы уровня Uncore Logic синхронизованы по частоте, разгон шины QPI автоматически приведет и к увеличению частоты работы L3-кэша.
В качестве справочных данных укажем, что в процессоре Bloomfield размер L3-кэша составляет 8 Мбайт. Кэш L3 по своей архитектуре по отношению к кэшам L1 и L2 является инклюзивным (inclusive), то есть в нем всегда дублируется содержимое кэшей L1 и L2. В процессоре Bloomfield каждому ядру процессора отводится кэш L2 размером 256 Кбайт.
Поддержка режима Hyper-Threading
Процессор Bloomfield, как и все процессоры семейства Intel Core i7, поддерживает технологию многопоточной обработки Hyper-Threading. Эта технология отнюдь не нова — она использовалась в процессорах Intel Pentium 4 с микроархитектурой NetBurst. К настройке системы на базе процессора Bloomfield сам факт поддержки процессором этой технологии отношения не имеет, однако напомним, что с учетом технологии Hyper-Threading операционная система будет видеть четырехъядерный процессор как восемь отдельных логических процессоров. Одни версии BIOS позволяют отключить использование технологии Hyper-Threading, а другие — нет.
Поддержка режима Turbo Mode
Еще одна особенность процессоров Bloomfield заключается в том, что они поддерживают новый режим Turbo Mode. Поскольку этот режим оказывает существенное влияние на производительность системы и полностью настраивается через BIOS, остановимся на нем подробнее.
Смысл режима Turbo Mode заключается в динамическом разгоне тактовых частот ядер процессора, причем уровень такого разгона каждого ядра процессора задается по отдельности в настройках BIOS.
Динамический разгон ядер процессора происходит в том случае, если его энергопотребление не превышает заданного в BIOS значения. То есть в BIOS можно устанавливать максимальное значение энергопотребления, до достижения которого будет производиться динамический разгон ядер процессора. Уровень разгона каждого ядра задается коэффициентом умножения. Для процессора Bloomfield опорная частота (частота системной шины) составляет 133,33 МГц, а частота ядра процессора вычисляется умножением опорной частоты на соответствующий коэффициент. Отметим, что в настройках BIOS режим Turbo Mode может быть отключен.
Настройка BIOS системы
Настройка параметров процессора Bloomfield, равно как и его разгон, реализуется через настройки BIOS. Далее на примере процессора Intel Core i7-965 Extreme Edition мы рассмотрим, каким образом можно настраивать частоту процессора (а также реализовывать разгон частоты) и производить настройки памяти. Естественно, материнские платы различных производителей имеют разные варианты настройки BIOS, и отнюдь не факт, что все возможности по настройке, о которых речь пойдет далее, будут реализованы на той или иной плате. Мы будем ориентироваться на платы самой компании Intel на базе чипсета Intel X58 Express.
Сразу отметим, что процессор Intel Core i7-965 Extreme Edition обладает особой функциональной возможностью, которая существенно отличает его от всех остальных процессоров Bloomfield — только этот процессор имеет разблокированный коэффициент умножения, что предоставляет пользователю широкие возможности по разгону.
Настройка частоты процессора Bloomfield
Существует два основных способа установки частоты процессора Bloomfield:
Изменение коэффициента умножения
Как уже отмечалось, для процессора Bloomfield опорной является частота 133,33 МГц (частота по умолчанию). Частоты всех компонентов процессора получаются умножением опорной частоты на соответствующий коэффициент. Для того чтобы задать тактовую частоту процессора, необходимо выбрать соответствующий коэффициент умножения, выбор которого осуществляется в BIOS посредством настройки, которая может иметь названия Maximum Non-Turbo Ratio, CPU Ratio Setting или им подобные. К примеру, для процессора Intel Core i7-965 Extreme Edition номинальная тактовая частота составляет 3,2 ГГц, что соответствует коэффициенту умножения 24 (133,33 МГц x 24 = 3,2 ГГц). Если у процессора разблокирован коэффициент умножения не только вниз, но и вверх (как у процессора Intel Core i7-965 Extreme Edition), то можно разогнать процессор по тактовой частоте, выбрав более высокий коэффициент умножения. К примеру, если для процессора Intel Core i7-965 Extreme Edition задать коэффициент умножения 29, то его тактовая частота станет равной 3,86 ГГц. Конечно, не факт, что процессор «заведется» с такими установками и будет стабильно работать, но попробовать всегда можно. Отметим, что изменение коэффициента умножения процессора отражается на изменении тактовой частоты всех четырех ядер процессора, но никак не сказывается на тактовой частоте элементов Uncore Logic, то есть частота работы кэша L3, скорость QPI-шины и частота контроллера памяти при этом остаются неизменными.
Следующий важный аспект, связанный с коэффициентом умножения процессора, — это настройка режима Turbo Mode. Прежде в BIOS нужно разрешить использование режима Turbo Mode (настройке Turbo Mode присваивается значение Enable). Затем необходимо задать максимальное значение энергопотребления процессора в ваттах и максимальное значение силы тока в амперах. В случае если текущее значение энергопотребления процессора и значение силы тока будут меньше заданных максимальных значений, то будет реализован динамический разгон ядер процессора.
Для задания максимального значения энергопотребления процессора необходимо в настройках BIOS найти параметр TDP Power Limit Override (Watts) (название может быть другим) и присвоить ему значение максимально допустимого энергопотребления процессора в ваттах. Номинальное значение максимального энергопотребления процессора Bloomfield составляет 130 Вт. Это значение можно увеличить или уменьшить.
Для задания максимального значения силы тока необходимо в настройках BIOS найти параметр TDC Current Limit Override (Amps) (название может быть другим) и присвоить ему значение максимально допустимого значения силы тока в амперах. Номинальное значение максимальной силы тока процессора Bloomfield составляет 110 А.
Далее для каждого из четырех ядер процессора Bloomfield необходимо задать коэффициент умножения для режима Turbo Mode. Тогда, если не достигнуты заданные максимальные значения энергопотребления и силы тока, для ядер процессора реализуется динамический разгон. Повышение частоты каждого ядра процессора производится в соответствии с установленным для этого ядра коэффициентом умножения.
Рассмотрим, к примеру, вариант настройки режима Turbo Mode для процессора Intel Core i7-965 Extreme Edition. Для него номинальный коэффициент умножения, определяющий тактовую частоту процессора без режима Turbo Mode, составляет 24. Максимальному значению энергопотребления и силы тока можно присвоить номинальные значения (130 Вт и 110 А соответственно), а для каждого ядра процессора задать коэффициент 30. В этом случае до тех пор, пока не превышено энергопотребление процессора в 130 Вт, а сила тока не достигла значения в 110 А, все четыре ядра процессора будут работать на частоте 4 ГГц.
Изменение опорной частоты
Установку тактовой частоты процессора, а также разгон процессора можно производить за счет изменения опорной частоты, значение которой по умолчанию, как уже отмечалось, составляет 133,33 МГц. К примеру, если для процессора Intel Core i7-965 Extreme Edition с номинальным коэффициентом умножения равным 24 значение опорной частоты задать равным 155 МГц, то тактовая частота процессора составит 3,72 МГц (по умолчанию значение тактовой частоты процессора Core i7-965 Extreme Edition равно 3,2 ГГц).
Важно отметить, что изменение опорной частоты повлечет за собой изменение не только тактовой частоты ядер процессора, но и частоты работы памяти. Кроме того, изменение опорной частоты отразится и на режиме Turbo Mode динамического разгона процессора.
Разумеется, разгон процессора Bloomfield можно реализовать и путем одновременного изменения опорной частоты и коэффициента умножения.
Задание напряжения питания процессора
При разгоне процессора путем увеличения опорной частоты или коэффициента умножения важно и значение напряжения питания процессора. Более высоким значениям тактовой частоты процессора должно соответствовать и более высокое напряжение питания. Естественно, что повышать напряжение питания процессора нужно только в том случае, если достигнуто значение тактовой частоты, при котором процессор не «стартует» или работает нестабильно.
В настройках BIOS имеется несколько параметров, позволяющих задавать напряжение процессора. Прежде всего можно изменить статическое значение напряжения питания. Параметр Static CPU Voltage Override позволяет задавать значение превышения напряжения процессора по отношению к номинальному значению. Данный параметр имеет смысл задействовать только в том случае, если используется статический разгон процессора путем установки более высокого (в сравнении с номинальным) значения коэффициента умножения или более высокого значения опорной частоты.
Также возможно реализовать динамическое изменение напряжения питания процессора. Параметр Dynamic CPU Voltage Offset позволяет в милливольтах (мВ) задавать значение напряжения, на которое будет динамически (в зависимости от загрузки) увеличиваться напряжение питания процессора.
Еще один параметр, касающийся напряжения питания процессора, — это Enhanced Power Slope. Он задает процент уменьшения напряжения питания процессора в том случае, если достигнуто максимальное значение силы тока.
Настройка памяти
Контроллер памяти в процессоре Bloomfield находится на уровне Uncore Logic. Как мы уже отмечали, элементы уровня Uncore Logic не синхронизованы по частоте с элементами уровня Core Logic (ядрами процессора). Контроллер памяти находится на уровне Uncore Logic, и для его настройки необходимо использовать коэффициенты умножения уровня Uncore Logic.
Поэтому для настройки памяти в разделе Memory Optimization необходимо прежде всего установить значение коэффициента UCLK Multiplier, то есть коэффициента умножения для элементов уровня Uncore Logic. Для процессора Intel Core i7-965 Extreme Edition по умолчанию значение коэффициента UCLK Multiplier составляет 20. Это означает, что для элементов уровня Uncore Logic базовой является частота 2,66 ГГц (133,33 МГц x 20 = = 2,66 ГГц). Однако из этого не следует, что все элементы уровня Uncore Logic (контроллер памяти, контроллер QPI, кэш L3) функционируют на данной частоте, поскольку для элементов Uncore Logic могут использоваться и внутренние коэффициенты умножения. Кроме того, нужно учитывать, что внутренняя частота работы контроллера и внешняя частота, которую контроллер «выдает» на шину (к примеру, частота работы памяти), — это не одно и то же. При этом очень может быть, что коэффициент UCLK Multiplier определяет частоту работы кэша L3 или, во всяком случае, его изменение влияет на частоту кэша L3.
В принципе, можно поэкспериментировать со значениями коэффициента Uncore Logic, но прямого влияния на настройку памяти его величина не имеет. Частота работы памяти задается коэффициентом Memory Multiplier. При этом опорной частотой для памяти является частота в 133,33 МГц. Следовательно, если мы хотим задать частоту DDR3-памяти 1333 МГц, то коэффициенту Memory Multiplier необходимо присвоить значение 10. При значении 12 частота памяти станет равной 1600 МГц, значение 8 соответствует частоте 1066 МГц, а 6 — частоте 800 МГц. При задании значения коэффициента Memory Multiplier необходимо руководствоваться правилом, что оно должно быть как минимум в два раза меньше, чем значение коэффициента UCLK Multiplier. То есть при значении коэффициента UCLK Multiplier равном 20 максимальное значение коэффициента Memory Multiplier может составлять не более 10 (соответствует памяти DDR3-1333). Таким образом, поддержка более скоростной памяти возможна только в условиях разгона, при котором требуется изменить значение коэффициента UCLK Multiplier. Так, коэффициент Memory Multiplier может иметь значение 12 (для поддержки памяти DDR3-1600) только в том случае, если коэффициенту UCLK Multiplier присвоено значение не ниже 24.
Кроме задания частоты памяти, можно настраивать тайминги памяти и задавать напряжение питания. Правда, ничего нового в данном случае нет. Тайминги памяти настраиваются точно так же, как и раньше, что вполне логично, поскольку в системах с процессором Intel Core i7 используется самая обычная DDR3-память.
Для справки напомним, что настройке подлежат следующие тайминги:
Кроме возможности изменения частоты и таймингов памяти, через настройки BIOS можно также изменить напряжение питания модулей памяти. Напомним, что для памяти DDR3 номинальным является напряжение питания 1,5 В. В то же время при разгоне памяти иногда требуется увеличить напряжение питания. Кроме того, некоторые производители выпускают разогнанные модули памяти, требующие более высокого напряжения. В принципе, при изменении напряжения памяти в системах с процессором Intel Core i7 нужно руководствоваться только одним правилом: напряжение не должно превышать значения 1,6 В (даже в том случае, если BIOS позволяет это сделать). Установка более высокого напряжения питания модулей памяти может вывести процессор из строя.
Настройка скорости QPI
Как уже отмечалось, каждый процессор Bloomfield привязан к определенной скорости QPI, то есть точно так же, как раньше поддерживаемая процессором частота FSB являлась его характеристикой, теперь его характеристикой служит поддерживаемая им скорость QPI. И точно так же, как раньше можно было разгонять частоту FSB, теперь можно разгонять скорость QPI. Правда, сам принцип разгона несколько иной. Напомним, что ранее увеличение частоты системной шины автоматически приводило к увеличению частоты FSB. Однако в процессорах Bloomfield изменение опорной частоты не отражается на изменении скорости QPI.
Для того чтобы изменить скорость QPI, необходимо в настройках BIOS установить подходящее из трех (6,4; 5,866 и 4,8 GT/s) значений параметра QPI Data Rate. Выбор небогатый, и если процессор, к примеру, поддерживает скорость QPI 6,4 GT/s, то увеличить эту скорость не получится.