Архитектура IA-32
| Категория реферата: Рефераты по информатике, программированию
| Теги реферата: зимнее сочинение, реферат на тему образование
| Добавил(а) на сайт: Приходько.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата
В этой работе проводиться обзор основных моментов необходимых для
оптимизации программного обеспечения для текущего поколения процессоров
основанных на технологии IA-32, таких как Intel Pentium 4, Intel Xeon и
Intel Pentium M. Работа дает базу для понимания правильного подхода к
кодированию для технологии IA-32.
Ключевые моменты, повышающие производительность процессоров текущего поколения на базе IA-32:
. Расширение инструкций SIMD поддерживающих технологию MMX, потоковые расширения инструкций SIMD (SSE), потоковые расширения инструкций
SIMD второй редакции (SSE2) и потоковые расширения инструкций SIMD третьей редакции (SSE3)
. Микроархитектуры позволяющие выполнение большего количества инструкций на высоких тактовых частотах, иерархия высокоскоростных
КЭШей и возможность получать данные по высокоскоростной системной шине
. Поддержка технологии Hyper Threading
Процессоры Intel Pentium 4 и Intel Xeon построены на микроархитектуре
NetBurst. Микроархитектура процессора Intel Pentium M основывается на
балансе производительности и низкого энергопотребления.
Технология SIMD
Один из путей к увеличению производительности процессора – это использование технологии вычислений основанной на том, что одна команда оперирует многими данными (single-instruction, multiple data (SIMD)).
Вычисления с помощью SIMD (рисунок 1) представлены в архитектуре IA-32 технологией MMX.Технология MMX позволяет вычислениям SIMD производиться над упакованными целыми числами в виде байтов, слов и двойных слов. Эти целые содержаться в наборе из восьми 64-битных регистрах называемых MMX регистрами (рисунок 2).
В процессоре Intel Pentium III технология SIMD была расширена с помощью потоковых расширений SIMD (SSE). SSE позволяет производить вычисления SIMD над операндами, содержащими четыре упакованных элемента с плавающей точкой одинарной точности. Эти операнды могут храниться как в памяти, так и в одном из 128-битных регистров называемых XMM регистрами (рисунок 2). SSE также расширяет вычислительные способности SIMD, путем добавления дополнительных 64-битных MMX команд.
Рисунок 1 показывает типичную схему вычислений SIMD. Два блока по четыре упакованных элемента данных (X1, X2, X3, X4 и Y1, Y2, Y3,Y4), обрабатываемых параллельно с помощью одной операцией над каждой парой элементов данных (X1 и Y1, X2 и Y2, X3 и Y3 и X4 и Y4). Результаты четырех параллельных вычислений сортируются в набор из четырех элементов данных.
[pic]
Рисунок 1. Схема вычислений SIMD
В процессорах Pentium 4 и Intel Xeon модель вычислений SIMD была далее расширена с помощью SSE2 и SSE3.
SSE2 работает с операндами, хранящимися в памяти или в XMM регистрах.
Технология SSE2 расширяет вычисления SIMD для работы с упакованными
элементами данных с плавающей точкой двойной точности и 128-битными
упакованными целыми числами. В SSE2 введены 144 дополнительные команды для
работы с двумя элементами данных с плавающей точкой двойной точности или
над упакованными целыми числами в виде шестнадцати байтов, восьми слов, четырех двойных слов и двух четверных слов.
SSE3 улучшает x87, SSE и SSE2 с помощью добавления тринадцати инструкций, позволяющих повысить производительность приложений в специфичных областях.
Таких как: обработка видео, комплексная арифметика синхронизация потоков.
SSE3 дополняет SSE и SSE2 с помощью команд ассиметричной обработки данных
SIMD, команд позволяющих горизонтальные вычисления, а так же команд
позволяющих избежать загрузки в кэш разделенных нитей.
Полный набор технологий SIMD (MMX, SSE, SSE2, SSE3) в технологии IA-32 дает возможность программисту разрабатывать алгоритмы, совмещающие операции над упакованными 64-битными и 128-битными целыми, и операндами с плавающей точкой одинарной и двойной точности.
[pic]
Рисунок 2. Регистры SIMD
SIMD улучшает выполнение 3D графики, распознавание речи, обработки изображений, научных приложений и приложений удовлетворяющих следующим характеристикам:
. Внутренняя параллельность
. Рекурсивный доступ к областям памяти
. Локальные рекурсивные операции над данными
Рекомендуем скачать другие рефераты по теме: цель реферата, ответы по контрольной.
Категории:
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата