Вход в систему

Рассказ в данной статье пойдет о том, каким образом получаются многоядерные процессоры, и зачем Intel и AMD с каждой новой моделью процессора стараются увеличить количество кэш в своих процессорах, впрочем, как и производители винчестеров.Поехали....

Эффективность многоядерных процессоров

Не следует забывать, что на сегодняшний день для работы с двухъядерными процессорами более или менее оптимизировано в основном только профессиональное программное обеспечение (включая работу с аудио, графикой и видеоданными), тогда как для офисного или домашнего пользователя второе процессорное ядро иногда приносит пользу, но гораздо чаще остается не задействованым.
Польза двухъядерных процессоров в этом случае видна невооружённым взглядом только тогда, когда на компьютере запущены какие-либо фоновые задачи (проверка на вирусы, дефрагментация, ...).
Не отрицаю, что когда просто работаете с офисными программами, то пользы вам от четырёх ядер и более будет мало, если, конечно, вы не любитель компьютерных игр.
Загружает все ядра процессора, по крайней мере, четыре, как у меня, ABBYY FineReader (начиная с девятой версии), VirtualDub (при использовании некоторых кодеков),: Adobe Photoshop (начиная с CS4).
Некоторые программы имеют возможность,выбора, на какое ядро будет основная нагрузка. Также некоторые конвекторы могут одновременно конвертировать несколько видеофайлов (2 ядра -2 файла, 4 ядра - 4 файла).

Те, кто хочет начать работать с Windows 7 должны учесть, что 64-разрядная система функционирует быстрее и даже может требовать меньше оперативной памяти, чем привычная альтернатива с ее максимальным определением ОЗУ в 3,25,Гбайт.Но перед переходом на 64 бита необходимо учесть; чтобы “семёрка” по максимуму использовала мощный процессор, необходимо подходящее программное обеспечение.Больше всего пользы можно получить от утилит для редактирования изображений, работы с аудио и видео, поскольку им требуется много оперативной памяти, а их алгоритмы поддерживают 64-битный набор команд. При этом быстродействие увеличивается на 16-67%. И даже не нужно делать апгрейд. Кстати 64-битная версия Windows 7 уже “видит" до 128 Гб ОЗУ!
В какой-то степени исправить ситуацию с использованием нескольких ядер должна технология типа Intel Turbo Boost, которые автоматически увеличивают частоту наиболее загруженных процессорных ядер. AMD предлагает похожую технологию в своих топовых процессорах, так что можно говорить о заинтересованности обоих ведущих производителей процессоров.
Процессоры Intel с технологией Turbo Boost переходят в режим разгона автоматически и самостоятельно повышают частоту ядер, когда в вычислениях задействованы не все ядра (простаивает хотя бы одно ядро).
Нем больше ядер свободно от вычислений, тем сильнее имеют шанс разогнаться работающие вычислительные блоки. Если же Нагрузка на ядра равномерна, процессор продолжает работу на паспортной частоте. Даже для недорогих процессоров Core i3 предусмотрены три ступени разгона.
Кроме того, специальные запорные транзисторы Intel могут полностью (физически) отключать отдельные ядра, что позволяет устранить их из теплового пакета процессора.
Именно поэтому технология Turbo Boost может увеличивать тактовую частоту других ядер, поскольку меньшее число ядер могут работать на более высокой тактовой частоте, прежде чем они упрутся в тот же тепловой пакет.
В теории это должно дать меньшее энергопотребление, а вместе с возможностью динамически ускорять одно или несколько ядер и более высокую производительность в целом.
У Intel есть ещё одно преимущество, которое следует упомянуть снова: если шестиядерные процессоры AMD вот-вот получат 6 Мбайт L3, то нынешняя архитектура Intel уже предоставляет существенный объем 12 Мбайт L3. Это должно дать преимущество для приложений, работающих с ограниченным количеством данных и с малым числом потоков.
В случае AMD похожая технология Turbo Core во всех моделях процессоров повышает частоту активных ядер на одну ступень разгона и то только когда простаивает как минимум половина имеющихся ядер. Т.е. если четырехъядерный процессор, то для повышения частоты должно простаивать два ядра, а в случае 6 ядер - три.
AMD просто снижает тактовую частоту и напряжение для неактивных ядер (за это несёт ответственность операционная система, поскольку технология действует программно).
Кстати, в прошлом пользовался некоторыми программками-шутками, которые заменяли стандартный диспетчер задач. Шуточный диспетчер отличался только тем, что на закладке быстродействия в хронологии загрузки центральных процессоров можно было продублировать отображение до четырёх графиков центрального процессора.
Также можно было настроить количество доступной физической ОЗУ. Приятно было попугать деток тем, что старенький ПК (процессор Celeron 667 МГц с ОЗУ - 64 Мб под Windows 2000) имел в диспетчере 4 ядра и ровно 8 Гб ОЗУ:).

Побольше бы ядер!

Итак, мультиядерность может быть нескольких вариантов:
1. Независимые процессорные ядра, каждое со своей кэш-памятью, расположены на одном кристалле и просто используют общую системную шину (первые двухъядерные процессоры Intel).
2. Похожий вариант, когда несколько одинаковых ядер расположены на разных кристаллах, но объединены вместе в одном корпусе процессора (много-чиповый процессор).
3. Наконец, ядра могут быть тесно переплетены между собой на одном кристалле, и использовать некоторые общие  ресурсы кристалла, скажем, шину и кэш-память.

Некоторые процессоры с четырьмя И больше ядрами сделаны объединением двух двухъядерных кристаллов в одном корпусе, т.е. имеем одновременное использование двух вариантов. Так первый четырехьядерный процессор Intel Core 2 Quad представлял собой Сборку из двух кристаллов Conroe в одном корпусе.

Компания AMD пошла тогда по собственному пути, изготавливая первые четырехъядерные процессоры единым кристаллом, как и двухъядерные процессоры.

Теперь расскажу о скрытых возможностях многоядерных процессоров AMD. В конце концов победил более честный способ многоядерной архитектуры, когда на одном монолитном кристалле проектировали максимальное число ядер.

И тут сложилась любопытная ситуация.С одной стороны, проектировать и развивать разную логику для двух и четырехъядерных чипов - дорогое удовольствие. Но, с другой стороны, нужно выпускать процессоры с разным числом ядер, чтобы "поработать" во всех ценовых категориях.

Когда же Intel воскресила технологию Hyper-Threading в виде Simultaneous Multi Threading в своих новых процессорах Core i3 - i7, от AMD, в ответ, просочилась в Интернет информация, что можно разблокировать отключённые кэш и ядра в процессорах с ХЗ в названии.
В AMD тогда решили "сэкономить". Сделали удачный кристалл Deneb на четырёх ядрах и увлеклись обрезанием. После изготовления партии процессоров они проходят несколько тестов, по худшим результатам которых маркируется вся партия.Другими словами, в упомянутой партии часть процессоров легко может работать на большей частоте, чем другие, менее удачные экземпляры. Блокируем одно ядро - получаем Heka (Phenom II ХЗ), блокируем второе - получаем Callisto (Phenom IIХ2), хрясть L3 - вот вам основа для процессорного семейства Athlon II.При этом “под шумок” ;) реализуя дефектные крис-' таллы Deneb (проблемы с кэш и ядрами) под упомянутыми названиями. С течением времени процесс производства постоянно совершенствуется, в результате чего процент менее удачных процессоров планомерно снижается, хоть и не исчезает полностью.Кроме того, по маркетинговым соображениям очень часто партия моделей, способных работать на частоте 3200 МГц может быть промаркирована как 2800 МГц и выпущена в розничную продажу.Кстати, данная ситуация мне напоминает историю одного контракта по закупке СССР полупроводников у Японии, в котором с нашей стороны было указано процент брака в поставляемых деталях.Японцы данного пункта не поняли и поставили обусловленное количество полупроводников и плюс 3% нерабочих деталей сверх количества рабочих, т.е. на каждую тысячу годных деталей поставлялись дополнительно отдельной коробочкой тридцать изначально негодных.Если утрировать, то вся ключевая информация о процессорах зашита в них самих, но чтобы распознать всю сущность центрального процессора (CPUID) в системной плате должна быть исчерпывающая информация.
Когда появились первые двухъядерные процессоры AMD, то компания разослала производиелям платформ соответствующий микрокод, и с новыми прошивками в операционке заработало второе ядро.
В момент инициализации системы во внутреннюю память процессора в зависимости от номера CPUID процессора грузится так называемая карта функций из того самого кода для центрального процессора. Там есть ключи, активизирующие те или иные компоненты кристалла.Наиболее сообразительные производители материнских плат догадались хранить разные варианты микрокода. В результате на свой страх и риск можно включать заблокированные ядра и L3.

Круг из монокристаллического кремния
У разных производителей технологии ядерной разблокировки зовутся по-разному. У Gigabyte это AutoUnlock, у плат AsRock, Biostar, DFI, Foxconn, Asus функция называется AdvancedClock-Calibration, в MSI нужно использовать метод UnlockCPUCore и т.д.
Данные функции позволяют изменять процесс проверки центрального процессора на ошибки на режим АСС, увеличивая устойчивость к ошибкам и снижая шанс сбоя при определённых условиях.
Если взять модели AMD Phenom IIХ4 820/810/805, то можно "нарастить" L3 с 4 Мбайт до 6 Мбайт. Приобретя модели AMD Phenom II ХЗ 740/720/705/700, стоит попытаться разблокировать четвёртое ядро (в комплекте с L2 512 Кбайт). А с процессорами AMD Phenom II Х2 555/550/545 можно поработать над разблокировкой сразу двух ядер и заодно нарастить суммарный объем L2 до 2 Мбайт.
Что касается группировки AMD Athlon IIХ4 - здесь есть шанс включить 6 Мбайт L3. Самым выгодным делом представляется работа с моделями AMD Athlon II ХЗ. Тут можно активизировать четвёртое ядро с приложенным L2 512 Мбайт и включить L3 (если он есть физически). Внутри Athlon II Х2 нет ничего лишнего - эти процессоры построены на специальном кристалле Regor.
Некоторое время назад на фабрике AMD наладили выпуск упрощённых кристаллов на четырёх ядрах без L3. Кроме того, производители системных плат легко могут исключить работу с заблокированными ядрами в последних версиях своих прошивок.AMD даже признавалась, что специально распространяет "трансформируемые" процессоры для подогрева интереса к собственной продукции.При этом чипы, делятся на которые разблокируются и работают стабильно; чипы, которые разблокируются, но работают нестабильно; чипы, которые не разблокируются совсем.Но в новых прошивках BIOS с последним микрокодом для южного моста на материнских платах данная функция может отсутствовать ;( При этом хорошую рекламу себе сделала ASRock,так как можно наити альтернативный BIOS с поддержкой технологии АСС.В продаже также появилась четырехъядерная модель Phenom II Х4 960Т с двумя заблокированные ми ядрами, которую при должном везении можно превратить в щестиядерную, ну если не повезет, то хотя бы пятиядерник.
Компания Intel в ответ AMD планирует наделить некоторые свои процессоры возможностью включать поддержку Hyper-Threading и дополнительный мегабайт L2 при помощи процедуры програм! мной модернизации.
Блокировка Hyper-Threading и отключение четверти L2 снимаются программным образом. Вся ирония заключается в том, что пользователю подобная трансформация, по замыслу Intel, должна обойтись ё $50, т.е. нужно купить карточку со спрятанным под стираемым покрытием кодом активации.

Быстродействие процессора и кэш

Нельзя сравнивать разные процессоры, не учтя размер их кэшей. Так, к при! меру, процессор с тактовой частотой 2,5 ГГц и объёмом кэш-памяти 512 КБ будет работать быстрее, чем аналогичный ему процессор с немного большей тактовой частотой, но меньшим объёмом кэш.
Демьянишин верно подметил, что кэш играет большую роль в быстродействии, чем частота процессора. Кэш делится на несколько уровней.Наиболее быстрый, но относительно небольшой по объёму -кэш первого уровня, обозначаемый как L1, с которым работает ядро процессора и, чаще всего, делится на две половины: кэш инструкций и кэш данных.
С L1 взаимодействует кэш второго уровня ~ 12, который, как правило, гораздо больше по объёму и является смешанным без разделения на кэш команд и кэш данных.

У последних процессоров L2 работает на частоте ядра процессора. В ряде случаев большой кэш весьма полезен. С одной стороны, чем больше кэш, тем лучше, но с другой стороны, при увеличении кэша увеличивается время доступа к нему.
Некоторые десктопные процессоры, по примеру серверных процессоров, также порой обзаводятся кэш третьего уровня L3, который обычно ещё больше по размеру, хотя и несколько медленнее, чем L2 (за счёт того, что шина между L2 и L3 более узкая, чем шина между L1 и L2).
Однако его скорость в любом случае несоизмеримо выше, чем скорость системной памяти. Зато L3 может быть общим для всех ядер для нескольких ядер или разделяемым между ядрами и реализовывать эффективное взаимодействие между ядрами.

Его объем обычно больше суммарного объёма кэшей всех подключённых к нему ядер и может достигать 12 Мбайт (у топовой модели Intel Core i7 980Х, цена которых $999). При этом флагманские шестиядерные процессоры AMD Phenom II Х6 1090Т (цена $289) с частотой 3.0 ГГц (рис. 1) имеют на 6 Мбайт кэш меньше по сравнению с Core i7 980Х (рис. 2).
AMD Phenom 2 X6 1090T
Так что решать вам. Но, приобретая Phenom  II Х6 1090Т в качестве замены предыдущему, нет необходимости менять платформу целиком и, в большинстве случаев, достаточно просто обновить BIOS материнской платы.
Процессор предназначен для установки в Socket АМЗ и при этом обратно совместим с Socket АМ2+. Это потому, что AMD, пока что, не делала серьёзных изменений в процессорах, что позволяет устанавливать процессор под сокет АМЗ на AM 2+ и АМ2.
Intel Core i7 980X
Сокеты имеют одинаковое расположение контактов, но некоторые из них в АМЗ используются для соединения с памятью DDR3, в то время как в АМ2 они предназначены для DDR2. К счастью контроллер памяти расположен непосредственно в процессоре и совместим и с DDR2, и DDR3. Но при этом есть определённые ограничения в работе процессора.

Аналогично обстоит дело и с поддержкой скоростного интерфейса HyperTransport 3.1 (скорость передачи данных уже 51,6 Гбайт/с) в AMD. Благодаря его обратной совместимости с HyperTransport на Socket АМ2, эта шина будет функционировать лишь в “упрощённом” режиме, не обеспечивая прироста пропускной способности.

Фактически, владельцы Socket АМ2 платформ смогут вначале обновить лишь процессор, а смену материнской платы и памяти отложить на следующий этап совершенствования собственной системы. Такая же ситуация и с АМ2+, это практически АМЗ и возможно отличия АМ2+ от АМЗ лишь маркетинговый ход.

В Socket АМЗ+ AMD приняла решение наделить процессоры Zambezi конструктивным исполнением, требующим использования новых материнских плат.

Изначально AMD хотела обеспечить такую совместимость, но по мере разработки процессоров Zambezi выяснилось, что на платформе Socket АМЗ все функциональные возможности новых ядер реализовать не удастся.

Т.е. процессоры АМЗ+ не смогут работать на предыдущих разъёмах: АМ2, АМ2+, АМЗ. Зато материнские платы с разъёмом Socket АМЗ+ смогут приютить старые процессоры в исполнении Socket АМЗ, достаточно только обновить BIOS.

Кстати, есть ещё одно преимущество в процессорах архитектуры Sandy Bridge от Intel. Вдобавок к привычному L1 был добавлен кэш нулевого уровня (L0), который, кстати, не использовался в процессорах Intel со времён Pentium 4.

L0 позволяет хранить микрокоманды, преобразованные из инструкций, что существенно разгружает декодер, позволяя ему не обрабатывать уже обработанные инструкции команд, которые обнаруживаются во входном потоке. Т.е. декодированные микрокоманды берутся из L0.

Быстродействие винчестера

Seagate Barracuda SATA 3Когда-то звучала реклама, слоган которой был такой: “все по 2: 2 ядра, 2 Gb ОЗУ”. Ага. У знакомого недавно в таком компьютере отказал винчестер и, чтобы как-то перебиться до покупки нового, он достал из “закромов Родины” старенького ПК винчестер на 2 гигабайта. Действительно получился ПК, где все по 2, кроме одного DVD±RW.
К чему я привёл этот пример? Все просто. Из-за более медленного винчестера Windows ХР загружается медленнее, потому что на запуск операционной системы влияет также кэш винчестера.
Объясню популярно. Эффект от большего кэша виден при работе с большим количеством маленьких файлов. Скорость чтения и записи в винчестере зависит не только от интерфейса, но и от размера кэш. Объем внутреннего кэш влияет на скорость чтения/записи данных с жёсткого диска.
Если в старых моделях считался нормой 2-мегабайтный кэш, то в современных это как минимум 8 Мбайт. Чем больше кэш памяти в жёстком диске, тем больше система сможет поместить во временное хранилище наиболее важной информации, тем самым, ускоряя считывание информации в 10-1000 раз, обращение к которой было произведено повторно. Есть винчестеры с кэш-памятью до 64 Мбайт.
Если же вы хотите просто хвастаться какой у вас крутой ПК, то сразу купите винчестер с SAS-интерфейсом (его еще называют «быстрый SCSI»). Плюс к нему докупите контроллер, если мате-
ринка, которую вы избрали, не имеет SAS-разъема (поддержка такого интерфейса - редкость на материнских платах). Зато к SAS-разъёму можно подключать и SATA-устройства. Хотя проще все же приобрести SATA 3, которая не уступает в скорости SAS, зато при меньшей цене имеет больший объем.
А назначение SAS - это всё-таки серверы, станции графики, видеомонтажа и прочие устройства, требующие высокой производительности и надежности.

 

Немного истории:
История винчестера

 

 

Первый винчестер (слово "винчестер" вошло в обиход в 90-х годах прошлого века) был создан и продан в далеком 1956 году компанией IBM. Он носил имя IBM 350 RAMAC и обладал в те времена рекордной емкостью - 5 MB. Он был "легким" на то время - весил около тонны. Для его транспортировки приходилось использовать целый самолет и специальный погрузчик (Рис.3). И это ради пяти мегабайт данных! Теперь взгляните на своего домашнего 3.5"-го "малыша" и прикиньте, сколько бы он стоил в 1960-х годах?