sandy bridge что это
Intel Sandy Bridge: в новый год с новой процессорной микроархитектурой
Мы открываем цикл статей про новую процессорную микроархитектуру Intel Sandy Bridge. В первом материале мы коснемся теории ― расскажем про изменения и нововведения. В недалеком будущем на страницах блогов появятся результаты тестов новой платформы и много чего интересного.
Придуманная в недрах Intel концепция Tick-Tock продолжает работать ― каждый год производитель представляет измененную процессорную микроархитектуру. Фаза «Tick» подразумевает совершенствование предыдущих наработок (уменьшение техпроцесса, внедрение не слишком революционных новых технологий и так далее). Примерно через год после «Tick» случается «Tock» ― релиз процессоров на основе полностью новой микроархитектуры.
В начале 2010 года Intel представила линейку чипов под кодовым именем Westmere/Clarkdale ― технологическое совершенствование самых первых моделей Core i3/i5/i7 (Nehalem). Настала очередь Tock. Встречайте революционную микроархитектуру Sandy Bridge, на основе которой построены процессоры под общим названием Core 2011 ― полностью новые модели Core i3, Core i5, Core i7, а также бюджетные модели Pentium и Celeron.
На этот раз производитель решил не мелочиться и сходу анонсировал множество моделей для мобильных и настольных компьютеров во всех ценовых диапазонов. Правда, в продажу поступили лишь некоторые, далеко не самые доступные версии, но об этом чуть позже.
Пресса называет Sandy Bridge одной из самых существенных микроархитектур Intel за последние годы ― производитель сделал все возможное, чтобы вывести свои процессоры на новый уровень производительности, довел до ума представленные ранее технологии, предложил невероятную интеграцию вычислительных блоков и контроллеров. По сравнению с Sandy Bridge представленные ранее модели кажутся детским лепетом. Давайте рассмотрим изменения Core 2011 более подробно.
Особенности новой микроархитектуры
Блок-схема, изображающая микроархитектуру Sandy Bridge, вряд ли расскажет много о внедренных технологиях и общих изменениях. Однако стоит знать, что все компоненты новых процессоров существенно отличаются от компонентов тех же Westmere/Clarkdale. Главное, что нужно понимать перед изучением особенностей Sandy Bridge ― архитектурные доработки позволяют новым процессорам работать на 10-50% быстрее по сравнению с поколением Core 2010.
Инженеры Intel переработали блок предсказывания ветвлений, изменили препроцессор, внедрили продвинутый декодированный кэш, скоростную кольцевую шину, блок продвинутых векторных расширений AVX, переработали интегрированный контроллер оперативной памяти и линки с шиной PCI Express, изменили интегрированный графический чип до неузнаваемости, ввели фиксированный блок для аппаратного ускорения транскодирования видео, довели до ума технологию авторазгона Turbo Boost и так далее. Теперь вы, вероятно, поверили в то, что изменений действительно очень и очень много? Мы попробуем вкратце пробежаться по каждому из них, чтобы составить определенную картину перед тем, как в наших блогах появится полноценное тестирование.
Для начала, 4-ядерные модели Sandy Bridge состоят из 995 миллионов транзисторов, произведенных по отлаженному 32-нанометровому техпроцессу. Около 114 миллионов отведено под нужды графического чипа, каждое ядро занимает по 55 миллионов транзисторов, остальное уходит под дополнительные контроллеры. Для сравнения, полноценный 4-ядерный процессор AMD Phenom II X4 содержит 758 миллионов транзисторов, а 4-ядерные Nehalem использовали 731 миллион транзисторов. При всем при этом, полноценный процессорный кристалл Sandy Bridge занимает площадь 216 квадратных миллиметров ― кристалл одного из первых 4-ядерных процессоров Intel (Core 2 Quad) занимал аналогичную площадь при намного меньшем числе транзисторов и, соответственно, предлагал несоизмеримо меньшую производительность.
Теперь, позвольте рассказать о ключевых нововведениях микроархитектуры по порядку.
Кэш декодированных инструкций (micro-op cache) ― представленный в Sandy Bridge механизм micro-op cache сохраняет инструкции по мере их декодирования. При выполнении расчетов процессор определяет, попадала ли очередная инструкция в кэш. Если да, то препроцессор и вычислительный конвейер обесточиваются, что позволяет экономить электроэнергию. При этом 1,5 Кб декодированной кэш-памяти полностью интегрированы с кэшем первого уровня (L1).
Переработанный блок предсказания ветвлений может похвастаться увеличенной точностью работы. Все это стало возможным благодаря нескольким существенным инновациям в дизайне.
Кольцевая шина ― для объединения многочисленных архитектурных блоков в процессорах Sandy Bridge используется продвинутая и очень скоростная кольцевая шина. Своим появлением интерфейс обязан интегрированному графическому ядру и транскодеру видео ― необходимость общаться с кэшем третьего уровня сделала предыдущую схему соединения (около 1000 контактов для каждого ядра) неэффективной. К переработанной шине подключены все важные компоненты процессора ― графика, х86-совместимые ядра, транскодер, Системный Агент, кэш-память L3.
Под названием «Системный Агент» (System Agent) скрывается блок, ранее известный, как un-core ― здесь объединены контроллеры, которые раньше были вынесены в северный мост на материнской плате. В состав агента входят 16 линков для соединения с шиной PCI Express 2.0, двухканальный контроллер оперативной памяти DDR3, интерфейс для соединения с общей системной шиной DMI, блок управления питанием и графический блок, ответственный за вывод картинки.
Одним из самых важных нововведений Sandy Bridge принято считать переработанный с нуля графический чип. Начнем с того, что теперь графика интегрирована с другими блоками в едином кристалле (ранее под металлической крышкой процессоров Clarkdale скрывалось два разрозненных чипа). Инженеры Intel хвастаются двойным увеличением пропускной способности компонентов графического чипа по сравнению с предыдущим поколением Intel HD Graphics благодаря изменению архитектуры унифицированных шейдерных процессоров, появлению доступа к кэш-памяти L3 и другим улучшениям. При этом в новых процессорах можно будет обнаружить сразу две существенно отличающиеся модели графического ядра ― HD Graphics 2000 и HD Graphics 3000. Первая предлагает шесть унифицированных шейдерных процессоров, вторая ― двенадцать. По заявлениям Intel и профильной прессы, новая графика делает самые дешевые дискретные видеокарты излишними, но в этом нам еще предстоит убедиться в рамках отдельного обзора. Чуть не забыли сказать, новые модели HD Graphics поддерживают DirectX 10, переход к более современным графическим технологиям состоится уже в следующих поколениях процессоров.
Кроме того, в новом графическом чипе предусмотрен отдельный блок Media Engine, состоящий из двух частей для транскодирования и декодирования видео. Инженеры Intel решили не испытывать судьбу ― раньше декодированием и кодированием видео занимались унифицированные шейдерные процессоры и, частично, маломощные фиксированные блоки. По словам очевидцев, фиксированный Media Engine справляется со своей задачей быстрее и качественнее, чем даже монструозные видеокарты высшего ценового диапазона.
Измененные алгоритмы авторазгона Turbo Boost теперь позволяют процессору слегка переваливать за нормы прописанного энергопотребления на короткое время ― на практике это означает, что процессор сможет совершать скоростные забеги на малые дистанции. Разумеется, автоматика не даст перейти рубеж надежности. Напомним, Turbo Boost автоматически увеличивает частоту одного, двух, трех или четырех ядер при необходимости. Так, самая мощная модель Intel Core i7 2600 умеет увеличивать частоту одного ядра до 3,8 ГГц при работе с неоптимизированными под многоядерную архитектуру приложениями.
Со времен Pentium II компания Intel начала продавать процессоры с заблокированными множителями, чтобы пользователи не могли играть с частотой, а сама компания всегда имела возможность продавать одни и те же модели в разных ценовых диапазонах. Но оверклокеры всегда имели возможность регулировать частоту FSB. К сожалению, с приходом Sandy Bridge все снова меняется ― множитель в большинстве моделей наглухо заблокирован, а генератор частоты шины интегрирован в единственный мост чипсетов 6-й серии и заблокирован на частоте 100 МГц.
Единственной оверклокерской отдушиной остаются модификации с разблокированными множителями ― таких моделей в новой линейке немного, но они есть и стоят вполне адекватных денег.
Линейка
Настало время рассказать о процессорах, которые были представлены в первую очередь ― разобраться в новых названиях и понять, какой именно процессор стоит выбрать для своих целей.
Во время релиза Sandy Bridge компания Intel представила 29 (двадцать девять!) новых моделей Core iX ― четырнадцать для настольных и пятнадцать для мобильных компьютеров.
Производитель перешел на новую, еще более замутненную схему обозначениях процессоров, в которой и предстоит покопаться.
Итак, название каждого нового процессора настольной линейки состоит из обозначения бренда (Intel Core), названия конкретной линейки (i3, i5, i7), индекса (2600) и суффикса (K). Для настольной линейки предусмотрено всего три суффикса ― К (разблокированный множитель), S (энергопотребление 65 Вт) и T (энергопотребление 34-45 Вт). Теперь, самое странное ― мощный графический чип HD Graphics 3000 входит только в состав моделей с разблокированным множителем (К), остальные процессоры довольствуются заметно более слабым HD Graphics 2000.
Изначальная линейка Core 2011 для настольных компьютеров достаточно красиво разбивается по названию линейки. Так, процессоры Core i7 ― это четырехъядерные чипы с поддержкой Hyper Threading (4 ядра, 8 потоков), Core i3 ― простенькие двухъядерные чипы без поддержки Turbo Boost, но с поддержкой Hyper Threading (2 ядра, 4 потока), Core i5 ― в первую очередь четырехъядерные модели с поддержкой Turbo Boost, но без Hyper Threading. К сожалению, в будущем в рамках линейки Core i5 появятся и двухъядерные модели, однако они будут доступны в первую очередь для сборщиков готовых систем.
Еще один повод для дальнейшей дифференциации линейки ― авторазгон встроенного графического ядра. Изначально обе модели графики работают на частоте 850 МГц, однако процессоры Core i5 и Core i3 могут разгонять его до частоты 1100 МГц. Старшие Core i7 ― до 1350 МГц. Подумайте сами, каким образом подобное скажется на конечной производительности.
С мобильными модификациями Sandy Bridge все немного сложнее. Для начала, абсолютно все мобильные процессоры в новой линейке задействуют мощный графический чип HD Graphics 3000 (даже самые экономичные модели). По непонятным причинам компания Intel решила нарушить негласный закон маркетинга и разгуляться в индексах ― как мы будем разбираться в моделях с индексами 2657, 2537, 2410 и 2720 мы пока не решили. С точки зрения индексов здесь есть обозначения XM, QM, M, указывающие на ноутбуки для разных задач. Соответственно, ХМ ― это экстремальные модели для геймерских систем, М ― двухъядерные процессоры для экономичных ноутбуков, QM ― четырехъядерные процессоры для мэйнстримовых ноутбуков.
Разумеется, это далеко не все модели на ближайший год ― Intel продолжит экспериментировать и будет изредка радовать поклонников новыми модификациями. Главное, чтобы не нарушали придуманную собственными силами логику линеек.
Платформа
Вместе с Sandy Bridge были представлены чипсеты 6-й серии с необходимым процессорным разъемом LGA1155 ― первыми ласточками стали Intel P67 и Intel H67. Разобраться в двух модификациях проще простого. Intel P67 подходит для конфигураций, где будет использоваться дискретная видеокарта, при этом платформа поддерживает средства разгона. Плюс, платы на основе P67 предлагают 2х8 линий PCI Express 2.0 для конфигураций с несколькими видеокартами в режима AMD CrossFire или NVIDIA SLI. Intel H67, напротив, малопригодна для разгона, поддерживает только один порт PCI Express x16, зато умеет выводить видеосигнал.
Всем тем, кто мечтает получить все возможности на одной плате, придется немного подождать ― где-то во втором квартале 2011 года разработчики представят чипсет Intel Z68. Материнки на основе этого чипсета будут поддерживать встроенное в процессор графическое ядро, а также все особенности Intel P67.
Пару слов о новом процессорном разъеме ― Intel переделала схематику и структуру гнезда, так что старые модели Core 2010 для LGA 1156 использовать уже не получится. К счастью, размер сокета остался прежним, сюда можно установить многочисленные кулеры для LGA 1156 и не мучиться с поиском самых новых моделей.
В чипсетах все еще не появилась врожденная поддержка интерфейса USB 3.0, хотя рынок, вроде бы, вполне готов к подобным «инновациям». Поклонникам всего самого лучше придется ориентироваться на продвинутые материнские платы, куда производители встраивают сторонние контроллеры USB 3.0.
Благо, про новую версию интерфейса SATA компания Intel не забыла ― новые платформы поддерживают SATA3 с пропускной способностью до 6 Гбит/с. Понятно, что для классических шпиндельных винчестеров все эти скоростные прибавки не нужно, но накопители на основе флэш-памяти оценят скоростное окно по достоинству. К примеру, один из представленных на выставке CES флэш-винчестер раскроет свои скоростные способности только в паре с SATA3 ― в рамках SATA2 ему тесно (речь о Crucial RealSSD C300). Что важно, порты SATA3 на новых материнских платах соседствуют с SATA2, хотя новый интерфейс и предлагает полную обратную совместимость с предыдущим поколением ― при подключении своего супер-дорогого SSD будьте внимательнее.
В новых чипсетах производители наконец-то начинают избавляться от главного архаизма ― интерфейса BIOS. На замену топорному синему экрану из прошлого приходит UEFI ― новая оболочка поддерживает управление мышью (или тачпадом), предлагает заметно более современный и удобный интерфейс. Из других особенностей UEFI можно отметить врожденную поддержку жестких дисков объемом свыше 2,2 Тб.
Что мы имеем в итоге?
Среди экспертов распространено мнение, что Sandy Bridge ― это всего лишь эволюция предыдущих микроархитектур и ничего кардинально нового компания не представила. Мы же сходимся во мнении с другой частью аналитиков. Несмотря на то, что новая линейка не предлагает по-настоящему революционных возможностей, проделанная компанией Intel работа достойна всяческих похвал. Производитель довел все свои начинания до идеала ― провел полную интеграцию всех компонентов, улучшил графический чип до приемлемого уровня, доделал кольцевую шину, переработал функции препроцессора, пересмотрел возможности авторазгона Turbo Boost, внедрил фиксированный блок для обработки видео и так далее. В итоге перед нами совершенно новые процессоры, которые на голову опережают предыдущие поколения с точки зрения технических характеристик.
Дальше нам предстоит убедиться в том, что реальная производительность новых моделей не отстает от того, что мы видим на бумаге.
В скорейшем будущем в блогах DNS появится тестирование нового процессора в играх и популярных программах, обзор возможностей разгона с использованием воздушного охлаждения, тест графического чипа против бюджетных дискретных видеокарт. Не пропустите.
Буря в песках. Изучаем новую процессорную архитектуру Intel Sandy Bridge
Компания Intel продолжает следовать стратегии развития «Тик-так» (Tick-Tock), принятой в 2006 году. Согласно этой стратегии, цикл разработки делится на два этапа, «тик» и «так»: в один год (на счет «тик») процессоры переводят на новые нормы производства, а еще через год (на «так») выпускают новую архитектуру.
В этом году часики Intel сделали «так»: на CES 2011 компания представила процессоры Sandy Bridge. Производитель подробно рассказал о новой архитектуре, похвалился достижениями и объявил сразу три линейки кристаллов. Сейчас мы будем с ними разбираться и тестировать — но для начала вспомним, в каком ключе Intel развивала процессоры последнюю пару лет.
Вчера
В 2008 году компания представила переработанные Core 2 — Core i7-9х0 на архитектуре Nehalem. С них Intel начала эксперименты с интеграцией, перенеся контроллер памяти с материнской платы на кристалл.
В 2009 году вышла линейка Lynnfield, бюджетная версия Nehalem. В ней под крышку кристалла переместили северный мост чипсета: к контроллеру памяти подселили чип PCIe 2.0.
В начале 2010-го появилось семейство Clarkfield. С ним Intel перешла с 45— на 32-нм техпроцесс и добавила в процессор самую настоящую видеокарту. Графика делалась по 45-нм нормам, стояла отдельно от процессорных ядер и с грехом пополам запускала игры пятилетней давности, но впечатление производила будь здоров.
Sandy Bridge — логическое развитие идей Intel. Множество улучшений в ядрах, более быстрая графика, гибкое управление энергопотреблением и разгоном. В общем, традиционное обновление архитектуры: вроде то же самое, но работает лучше. Глобальных изменений почти нет. Просто сказать «вот тут стало больше, поэтому работает быстрее» не получится, надо разбираться с каждой мелочью и залезать в основы работы компьютера. Чтобы облегчить восприятие статьи, мы подготовили множество поясняющих врезок, к которым и рекомендуем обращаться во время чтения основного текста.
Новая память
Начнем с процессорных ядер. Первое изменение сделали в блоке Front-End (см. врезку «С немецким педантизмом») — добавили кэш-память L0. Стоит она сразу после декодеров и записывает все входящие микрооперации с блока Front-End. Приступая к работе над новой задачей, процессор обращается к кэшу L0 и проверяет, нет ли там нужных инструкций. Если есть, то забирает их напрямую из кэш-памяти. Если нет, то дает сигнал блоку Front-End — и работает по старой схеме. Прелесть подхода в том, что, когда нужная микрооперация найдена, Front-End отключается. В итоге экономится и время, и энергопотребление.
Никакого алгоритма работы у L0-кэша нет. Сюда записывается все подряд, но за счет того, что L0-кэш хранит до 1500 микроопераций, шанс попадания, по словам Intel, составляет порядка 80%.
С немецким педантизмом | |
Блок Front-End также называется блоком предварительной выборки. Он отвечает за общение программы с процессором, своевременно загружает нужные данные и объясняет кристаллу, что надо делать. Положим, вы сказали процессору перемножить два числа. Блок предварительной выборки загрузит из памяти и переведет на понятный процессору язык нужные числа, расшифрует, что такое умножение, и покажет, на каких блоках нужно сделать эту операцию. Последние пару пунктов он запишет в виде микроопераций, которые в Sandy Bridge теперь хранятся в памяти L0. ЯсновидящийВслед за блоком Front-End переработали блок предсказания ветвлений (см. врезку «На кофейной гуще»): увеличили объем памяти и придумали новую систему записи удачных предсказаний. Если в Nehalem каждую ветку программы помечали в таблице двумя битами (правильно/неправильно), то теперь на одно «правильно» записывают несколько веток. То есть объем таблицы тот же, а полезной информации больше. Экономнее стали обращаться и с кэш-памятью. Раньше на адрес ветки место в L1-кэше выделяли с запасом — теперь, в Sandy Bridge, каждый адрес занимает ровно столько, сколько ему нужно, ни одного байта не тратится зря. Все это — увеличенная память, новый метод записи и отказ от фиксированного размера адреса — должно повысить процент удачных предсказаний и снизить частоту сброса памяти. А это значит, что ядра станут реже считать ненужные ветки и программа будет выполняться быстрее. Без очередиСильнее всего в Sandy Bridge переделали блок Out-of-Order (см. врезку «Первый пошел»), добавив физический регистр файлов — такой шкаф с ящиками. Перед входом в Out-of-Order инструкции складывают в него свои данные, а на выходе их забирают. Таким образом разгружается шина данных, а инструкции проскакивают Out-of-Order налегке. Эта схема значительно ускорила работу блока внеочередного исполнения и позволила Intel подключить поддержку инструкций AVX (Advanced Vector Extensions). Новый набор должен заменить устаревшие инструкции SSE (Streaming SIMD Extensions) и расширить возможности SIMD-блоков. В отличие от SSE, инструкции AVX работают не с 128-, а с 256-бит регистрами. Это увеличивает точность вычислений и позволяет одновременно работать с большим количеством данных. Иными словами, программистам будет проще писать программы, а у нас будут быстрее работать графические, звуковые, видео— и тому подобные проигрыватели или редакторы. Сейчас AVX поддерживают лишь несколько программ, но Intel возлагает на технологию большие надежды и всячески поощряет ее использование. Интересно, что для введения AVX не пришлось менять SIMD-блоки — они все так же работают с 128-битными регистрами, а для расчета AVX просто объединяют усилия. То же самое происходит и с памятью L1, в которой расположены регистры. Как и в Nehalem, в Sandy Bridge память связана с блоком Front-End двумя шинами. В старой архитектуре одна отвечала за передачу, а вторая — за прием данных. Теперь они работают в обе стороны: когда нужно передать сразу 256-бит информации, объединяются и загружают в SIMD нужное количество данных. На этом изменения в процессорных ядрах заканчиваются. Как видите, никакой революции: тут добавили, там улучшили, и все вместе стало работать быстрее. Давайте теперь посмотрим, что Intel придумала в остальной части процессора. Блок предсказания ветвлений — одна из важнейших частей современного процессора. Он не дает простаивать блоку Front-End. Предсказатель угадывает, какую ячейку памяти и инструкцию может запросить программа в следующий момент, и заставляет процессор просчитывать ее заранее. Возьмем для примера автомобильный конвейер. Каждый раз, когда заканчивается сборка кузова, рабочие устанавливают в него сиденья. Блок предсказаний улавливает такие закономерности и, пока автомобиль еще собирается, отправляет заказ на кресла, выдает рабочим инструкции. Конечно, бывает, что в автомобиль требуются не простые сиденья, а с обогревом, и тогда время на заказ и сборку тратится зря. Но по сравнению с тем, что удается сэкономить на верных заказах, эта ошибка кажется мелочью. Чтобы реже ошибаться, предсказатель переходов ведет две таблицы: в одной хранит информацию о том, откуда берутся кресла, во второй — возможные инструкции. Каждый прогноз предсказатель помечает двумя битами (правильно/неправильно), а затем сверяет таблицы и выводит закономерности — скажем, о том, что подогрев нужен только на каждую третью машину, а кресла — каждый раз. Чем дольше предсказатель наблюдает за программой, тем реже он ошибается. ГрафикаГрафическое ядро на процессорах Clarkdale вызывало противоречивые чувства. С одной стороны, процессор и видеокарта в одном флаконе — это круто: торжество технологий. С другой — игровому компьютеру с дискретной видеокартой встроенное ядро как собаке пятая нога, а платить за него все равно приходится. С Sandy Bridge все то же самое: новые процессоры по умолчанию оснащены графическим ядром. Только теперь оно создается по 32-нм технологии и стоит на одном кристалле с процессорными ядрами. Intel представила два графических процессора — HD Graphics 2000 и HD Graphics 3000. Различие между ними — в количестве потоковых ядер (Execution Units). У младшей версии их шесть, у старшей — двенадцать. К сожалению, сравнить HD Graphics не с чем, слишком они отличаются от карт NVIDIA и AMD. Тут нет видеопамяти — используется кэш L3. Ядра работают только с жестко заданными функциями — никакого GPGPU. Пожалуй, единственная понятная нам здесь характеристика — это тактовая частота. Новая графика работает на скорости 650 или 850 МГц и может разгоняться до 1100, 1250 и 1350 МГц. Хотя Intel утверждает, что новое графическое ядро в два раза быстрее встроенного в Clarkdale, будущее HD Graphics нам видится смутно. С дискретными видеокартами ей не соревноваться — проиграет. Поддержки DirectX 11 нет, только DirectX 10.1. До офисных компьютеров Sandy Bridge доберется не скоро. Пожалуй, единственное, где HD Graphic придется к месту, — это ноутбуки. Мобильные процессоры оснащают HD Graphics 3000, топовой версией, а значит, поиграть можно будет даже на слабом ноутбуке. Блок Out-of-Order (блок внеочередного исполнения операций) следит за тем, чтобы операции выполнялись только при наличии нужных данных и процессор не простаивал почем зря. Представьте себе супермаркет. Вы взяли бутылочку воды и хотите ее оплатить. Подходите к кассе, а там стоит человек с доверху набитой тележкой. И вы ждете, пока он выложит все продукты, наберет жвачек, конфет. в общем, тратите время. А если бы рядом стоял специальный человек — Out-of-Order, — то он бы вам сказал: «Проходите, оплачивайте свою воду». И касса бы не простаивала, и вы свое время не теряли. С программами то же самое. Блок Out-of-Order разбирается, что уже можно считать, а что пока следует отложить. При этом он не видит разницы между началом или серединой программы. Главное — не давать простаивать вычислительным ядрам, а уж собрать полученные данные и выстроить их в нужном порядке можно и потом. Агент СмитПомимо графического ядра, под крышкой кристалла стоит еще и северный мост. Теперь он называется System Agent, а не un-core, как в Lynnfield и Clarkdale. В него входит двухканальный контроллер памяти, PCIe 2.0, шина FDI для вывода изображения с графического ядра и чип управления питанием (Power Control Unit). Изменений немного. Контроллер памяти научили работать с планками DDR3 на частоте до 1333 МГц и через множитель разгонять их до 2133 МГц. Шина FDI теперь поддерживает DisplayPort 1.2 и HDMI 1.4 — можно смотреть Blu-ray 3D. Чип PCIe 2.0 оставили прежним: доступно 16 линий, которые можно разделить на два слота PCIe x8. Контроллер PCU умеет гибко регулировать частоту и питание как процессора, так и графического ядра, поддерживать баланс температуры и экономить энергопотребление любыми возможными способами. Третье транспортноеЧтобы собрать такое количество компонентов в одно целое, Intel пришлось отказаться от перекрестных шин и придумать кое-что новое. Решение подсмотрели в серверных процессорах Nehalem EX, в которых используется кольцевая шина (Ring Bus). Принцип ее работы можно сравнить с транспортным кольцом. Данные непрерывно двигаются по дороге и делают остановки в нужных местах: у процессорного ядра, в системном агенте, кэш-памяти L3, видеокарте и так далее. Прелесть в том, что количество остановок не ограничено, дополнительные пункты можно добавлять до бесконечности. В Sandy Bridge шина разделена на четыре кольца: данные, запросы, мониторинг состояния и подтверждение. Каждое может переносить по 32 байта за такт и работать на частоте процессора. Пиковая пропускная способность составляет 96 Гбит/с. К сожалению, при простое и снижении частоты ядер скорость шины падает, и из-за этого может пострадать работа графического процессора. То же самое касается и L3-кэша. Заставить процессор считать быстрее сложно. Да, можно вводить всякие предсказатели, внеочередное исполнение и тому подобное, но скорость работы все равно зависит от времени выполнения одной операции. Долгое время производительность увеличивали, наращивая частоту работы или количество выполняемых в секунду операций. Этот метод эффективный, но тупиковый: бесконечно увеличивать скорость невозможно. Поэтому придумали новый способ — параллельные вычисления. Очередной пример. Вам дали калькулятор и попросили сложить три пары чисел. Вы берете одну пару, складываете и записываете результат, другую — складываете и записываете результат, третью — складываете и записываете результат. Способ верный, но долгий. Чтобы ускорить процесс, можно позвать еще двух человек, вручить каждому по паре чисел и сложить все одновременно. Так за один такт вам удастся выполнить всю задачу. Главное в такой ситуации позаботиться, чтобы команда «складывать» и числа были доступны одновременно всем действующим лицам. Такой способ увеличения производительности называется SIMD (Single Instruction — Multiple Data, «Одна инструкция — много данных»). В ядра процессора ставят несколько вычислительных блоков и с помощью специальных инструкций (SSE, AVX) заставляют их работать параллельно. Таблицу с числами для них хранят в специальной ячейке памяти — регистре. ЗапомниВ Sandy Bridge L3-кэш переименовали в Last Level Cache (LLC) и разделили на части — по количеству процессорных ядер в кристалле. Каждый кусочек L3-кэша управляется независимо и для экономии энергии может быть переведен в спящий режим. Компоненты системы связаны с LLC кольцевой шиной, а процессорные ядра — прямым контактом. За заполнение L3-кэша отвечает системный агент, который следит за распределением свободного места, деля его между основными и графическим ядрами. Как и кольцевая шина, кэш-память L3 работает на частоте процессора. При максимальной нагрузке пропускная способность взлетает до небес, при простое — падает, и в этом случае опять страдает графическое ядро. Большая идеяПонятное дело, Sandy Bridge — это не только изменения и улучшения. Intel не была бы собой, если не придумала что-нибудь эдакое. Речь идет о Quick Sync, также известном как Intel Media Engine, встроенном движке для работы с видео. Все мы знаем, что Full HD-видео — это злейший враг процессора, потому что загружает его на 100% и тормозит всю систему. Этим грамотно пользовались NVIDIA и AMD: потоковые процессоры их видеокарт забирали на себя задачи декодирования и разгружали кристалл. Та же ситуация была и с перекодированием видео в другой формат: процессор тратил на это дело по полтора часа, видеокарты справлялись с задачей за 20-30 минут. В итоге сложилось мнение: хочешь работать с видео — покупай видеокарту. Технология Turbo Boost впервые появилась в процессорах Nehalem — Core i7-9×0. Принцип у нее простой: если часть ядер простаивает, то у активных автоматически поднимается частота. Делается это за счет того, что при простое ядра не потребляют энергию и создается запас по энергопотреблению (TDP). Его-то и используют для увеличения частоты работы. Intel решила с этим бороться. В графический движок Sandy Bridge встроили специальные ядра с жестко заданными алгоритмами декодирования MPEG-2, H.264 (AVC), VC-1 и других популярных форматов. Обработку движений, деинтерлейсинг, цветокоррекцию взвалили на плечи потоковых ядер (тех самых Execution Units). И — вуаля! — процессор научился проигрывать до пяти Full HD-потоков без нагрузки на основные ядра. Правда, он округляет скорость воспроизведения до 24 кадров в секунду, что на больших телевизорах может приводить к эффекту мыльной оперы, когда актеры двигаются рывками, но это уже мелочи. За счет огромной скорости декодирования Sandy Bridge отлично справляется и с переводом фильмов в другой формат, делая это практически на лету. Единственная проблема состоит в том, что Quick Sync работает только при активном графическом ядре. Когда изображение подается с дискретной видеокарты, медиадвижок недоступен. Будем надеяться, Intel это исправит. РазогналсяОтдельно поговорим о разгоне. Как обычно, есть два варианта — автоматический и через BIOS. Начнем с первого, а именно с технологии Turbo Boost, которую в Sandy Bridge обновили до версии 2.0. В первом Turbo Boost ядра процессора разгонялись в зависимости от запаса TDP. Скорость удавалось повысить всего лишь на 200-300 МГц, что практически не ощущалось. Turbo Boost 2.0 работает по новому принципу. Она отслеживает текущую температуру процессора и, как только появляется определенный запас, повышает частоту на 400-500 МГц. В таком режиме кристалл работает, пока не нагреется, а затем выходит на стандартную скорость. Дальше все повторяется: разгон, нагрев, понижение частот. По словам Intel, череда кратковременных прибавок скорости дает больший прирост производительности, чем постоянная работа с учетом TDP. Intel не стала менять названия процессорных линеек, оставив Sandy Bridge знакомые нам Core i3, i5 и i7. Отличить старые кристаллы от новых не составляет труда: у первого поколения процессоров маркировка трехзначная (например, Intel Core i5-661), а у второго — четырехзначная (Intel Core i5-2500). Правда, небольшая путаница все равно остается, потому что нумерация у настольных и мобильных моделей сквозная. Скажем, настольный процессор с клеймом «2400» относится к линейке Core i5, а мобильный с индексом «2410M» — уже к Core i3. В остальном маркировка свеженьких Sandy Bridge очевидная: 2 — Указывает на второе поколение серии Core i-Х, у всех процессоров Sandy Bridge одинаково. 3 — Косвенно свидетельствует о положении процессора в серии. Чем старше цифра, тем быстрее процессор. Не влияет на поддерживаемые технологии. ОплакиваниеС ручным разгоном все не так радужно. Как известно, частота процессора — это произведение скорости шины (BCLK) и множителя ядра. Соответственно, разгонять процессор можно, либо увеличивая значение BCLK, либо изменяя множитель. В прошлых процессорах Intel множитель был разблокирован только в дорогих моделях линейки Extreme Edition. Поэтому все работали с шиной, и результаты всегда были отличными: даже младшие Core i7 легко поднимались с 2,66 до 4 ГГц. С Sandy Bridge про это можно забыть, разгон по шине Intel заблокировала. Компания завязала все компоненты системы на один генератор частоты (BCLK), и теперь при разгоне процессорных ядер вверх ползут частоты встроенной видеокарты, кольцевой шины, L3-кэша, контроллера памяти, шин PCIe и так далее. В общем, всего того, что для разгона никак не предназначено и при малейшей попытке поднять частоту сбрасывает настройки. Обойти это невозможно. Теперь единственный вариант — работать с множителем. Intel уже объявила о выпуске соответствующих процессоров под разгон и продает их на 700-900 рублей дороже стандартных моделей. Intel представляетНа CES 2011 Intel представила 29 процессоров на новой архитектуре. Пятнадцать из них анонсированы для ноутбуков, четырнадцать — для настольных компьютеров. Intel не стала придумывать новые линейки и оставила известные Core i3, i5 и i7. Изменилась только маркировка: название модели теперь записывается не тремя, а четырьмя цифрами (см. врезку «Циферки»). Самый дешевый настольный процессор Sandy Bridge, Core i3-2100, продают за 4000 рублей, самый дорогой, Core i7-2600K, за 12 000 рублей. Кристаллов по 1000 евро за штуку нет. В верхнем ценовом диапазоне Intel оставила старые Nehalem под чипсет X58 Express. Помимо стандартных моделей, Intel представила два процессора с разблокированным множителем — Core i7-2600K и Core i5-2500K. И это почему-то единственные кристаллы с топовой HD Graphics 3000, хотя что с ней делать оверклокерам — непонятно. Как и непонятно, зачем Intel придумала для Sandy Bridge новый сокет. Чем не подошел LGA1156, толком не объясняют — просто предлагают купить новую материнскую плату с LGA1155. ПродолжимСейчас в продаже есть два чипсета — H67 Express и P67 Express. По сравнению с пятой серий изменений немного: портов USB 2.0 теперь не 12, а 14 штук, появились два контакта SATA Rev. 3, исчезла поддержка PCI. Все остальное по-старому: есть LAN и 8 линий PCIe. Чипсет P67 Express позиционируется для игровых систем. Он не работает со встроенной в процессор графикой, но может разделить 16 линий PCIe 2.0 на два слота PCIe x8. H67 Express этого не умеет, зато оснащен шиной FDI и видеовыходами DisplayPort, HDMI, DVI и VGA. Разгонять процессоры разрешают только на P67 Express, H67 разблокированного множителя не видит. Почему — неясно, ведь только кристаллы с суффиксом «K» оснащены топовой HD Graphics. Все эти несуразности Intel должна разрешить в чипсете Z68 Express, информация о котором недавно утекла в интернет. Это будет копия H67, но уже с поддержкой разгона и двух слотов PCIe x8. В теории Sandy Bridge выглядит многообещающе. Огромное количество доработок должно обеспечить ощутимый прирост производительности. Встроенное графическое ядро — отличное решение для офисных компьютеров и ноутбуков. Ответ AMD и NVIDIA в работе с видео — вообще выше всяких похвал. Одним словом, в Sandy Bridge нет ничего революционного, но количество и качество переработок впечатляет. Картину портит только странная политика Intel. Зачем оверклокерским процессорам HD Graphics 3000? Была ли необходимость в смене сокета? Почему H67 Express не видит разблокированного множителя и не может работать с двумя видеокартами? Все эти мелочи немного портят общее впечатление, но не будем делать поспешных выводов, сначала — тесты.
|