Процессор AMD. История развития
| Категория реферата: Рефераты по информатике, программированию
| Теги реферата: методы изложения, психологические рефераты
| Добавил(а) на сайт: Даная.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 | Следующая страница реферата
. Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами.
Всего 45 команд
. Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время
Однако таким простым процессор AMD Athlon кажется только лишь на
первый взгляд. На самом же деле за этими несколькими строками скрываются
многочисленные архитектурные инновации, которые мы рассмотрим позднее.
Однако и простые характеристики AMD Athlon впечатляют. Например, как
нетрудно заметить, Athlon превосходит Intel не только по максимальной
тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом
он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша
первого уровня, который у Intel Pentium III всего 32 Кбайта.
[pic]
[pic]
Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.
Системная шина
Прежде чем углубляться в сам процессор, посмотрим, чем же отличается
системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее
сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных
платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый
на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium
III и AMD Athlon совершенно различны. Более того, различно даже число
задействованных сигналов - Athlon использует примерно половину из 242
контактов, в то время как Pentium III всего четверть. Внешняя похожесть
вызвана тем, что AMD просто хотела облегчить жизнь производителям системных
плат, которым не придется покупать особенные разъемы для установки на Slot
A системные платы. Только и всего.
На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача
данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому
фактическая частота передачи данных составляет 200 МГц. Если учесть тот
факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ECC
(контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц
= 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100
МГц в два раза меньше - 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает
увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось
бы, как в случае с GTL+, так и с EV6 получаются внушительные значения
пропускной способности. Однако, только современная PC100 память может
отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x - до 528
Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что
GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6
же в этом случае все в порядке, потому эта шина более перспективна.
При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133
(266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться -
реализовать работу на материнской плате EV6, требующую большего количества
контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя
если у AMD все получится, пропускная способность системной шины может
достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно
применять в Athlon-системах, например, высокопроизводительную 266-
мегагерцовую DDR SDRAM.
Кеш
Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.
Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.
Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512
Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon
может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и
1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков
SRAM определенной скорости, особенно при выпуске более быстрых моделей.
Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.
[pic]
Архитектура. Общие положения
Вот мы и подошли к рассказу о том, как же, собственно, работает
Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все
CISC-команды, обрабатываемые процессором, сначала раскладываются на простые
RISC-операции, а потом только начинают обрабатываться в вычислительных
устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть
зачем. Сравнительно простые RISC-инструкции могут выполняться процессором
по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего
параллелизма. Говоря более просто, тот производитель, который сделает более
"параллельный" процессор, имеет шанс добиться превосходства в
производительности гораздо меньшими усилиями. AMD при проектировании
Athlon, по-видимому, руководствовалась и этим принципом.
Однако перед тем, как начать работу над параллельными потоками
инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD
Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд
одновременно. Современные интеловские процессоры могут также обрабатывать
до трех команд, однако если для Athlon совершенно все равно, какие команды
он расщепляет, Pentium III хочет, чтобы две из трех инструкций были
простыми и только одна - сложной. Это приводит к тому, что если Athlon за
каждый процессорный такт может переварить три инструкции независимо ни от
чего, то у Pentium III отдельные части дешифратора могут простаивать из-за
неоптимизированного кода.
Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction
Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72
инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась
добиться того, чтобы дешифратор команд не простаивал из-за переполнения
Instruction Control Unit.
Еще один момент, заслуживающий внимания - вчетверо большая, чем у
Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой
сохраняются предыдущие результаты выполнения логических операций. На
основании этих данных процессор прогнозирует их результаты при их повторном
выполнении. Благодаря этой технике AMD Athlon правильно предсказывает
результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если
учесть, что аналогичная характеристика у Intel Pentium III всего 90%.
Посмотрим теперь, что же происходит в Athlon, когда дело доходит непосредственно до вычислений.
Целочисленные операции
С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия.
Рекомендуем скачать другие рефераты по теме: ответы, мировая экономика.
Категории:
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 | Следующая страница реферата