Тест на быстродействие микропроцессора
| Категория реферата: Рефераты по информатике, программированию
| Теги реферата: контрольные работы 9 класс, банк курсовых работ бесплатно
| Добавил(а) на сайт: Мананников.
Предыдущая страница реферата | 1 2 3 4 5 6 7 | Следующая страница реферата
. усовершенствованная 64-разрядная шина данных;
. средства обеспечения целостности данных;
. SL-технология со средствами управления энергопотреблением;
. поддержка многопроцессорности;
. мониторинг производительности;
. поддержка различных страниц памяти.
Рассмотрим эти новшества более подробно.
I. Суперскалярная архитектура
Два конвейера процессора могут выполнять две команды одновременно. Команды
выполняются в 5 этапов:
1. предвыборка;
2. декодирование 1;
3. декодирование 2;
4. выполнение;
5. запись результатов;
При этом несколько команд могут находиться на разных этапах выполнения.
Однако два конвейера не являются независимыми. При остановке одного
останавливается и другой.
Раздельные кэш-памяти команд и данных
Каждая кэш память процессора имеет размер 8 Кбайт (для версий Pentium I) и
16 Кбайт (для версий Pentium II, MMX, III). Кэш памяти являются частично
ассоциативными. Поиск требуемой информации выполняется в стандартных 32-
байтовых строках.
Буфер трансляции адресов (TLB) преобразует ячейки внешней памяти в
соответствующий адрес данных в кэш памяти.
Предсказание переходов
Процессор Pentium – первый х86 совместимый микропроцессор. Выполняет
утверждение переходов, используя буфер BTB (Branch Target Buffer) и два
буфера предварительной выборки.
Алгоритм упреждения переходов процессора Pentium не только прогнозирует
выбор простых ветвей, но поддерживает и более сложное прогнозирование. Это
делается с помощью хранения в буфере BTB нескольких адресов переходов. BTB
хранит до 256 результатов переходов, что позволяет выполнять правильное
предсказание с вероятностью не менее 0,8.
II. Высокопроизводительный блок операций с плавающей точкой
В процессоре применяется блок вычислений с плавающей точкой, использующий
сложные восьмиступенчатые конвейеры и внутренние функции. Большинство
команд с плавающей точкой начинают выполняться в одном из целочисленных
конвейеров, а затем передаются на конвейеры с плавающей точкой. Умножение и
деление реализованы как внутренние функции.
2.3. Архитектурные особенности микропроцессоров
Типы команд микропроцессора.
В ходе эволюционного развития архитектур процессоров в состав системы
команд вводились и закреплялись сложные команды, которые, по мнению
разработчиков, соответствовали решаемым задачам. Мерой этого соответствия
чаще всего был объём двоичного кода программы.
Команды бывают разных типов: «регистр, регистр(регистр»; «память, память(память»; «регистр(память» и др. Сложные команды модифицируют
содержимое групп регистров и ячеек памяти, и для их реализации при
приемлемых затратах оборудования, как правило, применяется
микропрограммирование.
Команды называются скалярными, если входные операнды и результаты являются
числами (скалярами).
Команды называются векторными, если входные операнды и, возможно, результаты являются вектором (массивом) чисел, а для преобразования данных
массива (вектора) используется одна векторная команда.
Само появление векторных команд обусловлено стремлением ускорить обработку
массивов данных за счёт исключения затраты времени на выборку и дешифрацию
команд обработки, одинаковых для всех компонент входных массивов.
При сохранении последовательных программ для ускорения обработки
применяются суперскалярные процессоры, в которых за счёт параллельной
работы функциональных устройств процессора в одном такте вырабатывается
несколько скалярных результатов.
Структурный параллелизм микропроцессоров.
Повышение производительности микропроцессоров достигается за счёт
увеличения тактовой частоты, совершенствования параллельной и конвейерной
обработки данных, а так же уменьшения времени доступа к памяти. Современные
микропроцессоры содержат десять и более обрабатываемых устройств, каждое из
которых предоставляет собой конвейер. Эффективная загрузка параллельно
функционирующих конвейеров обеспечивается либо аппаратурой процессора, либо
компилятором, на вход которого поступают программы на последовательном
языке программирования, либо совместно с аппаратурой и компилятором.
В компиляторах используется изощрённая техника извлечения параллелизма из
последовательных программ. Аппаратура микропроцессоров ориентированна на
выделение более простых форм параллелизма, в том числе естественного.
Стремление использовать присущий большинству программ естественный
параллелизм вычисления целочисленных адресных выражений и собственно
обработки данных в формате с плавающей точкой привело к появлению
разнесенных структур (decoupled architecture). Условно микропроцессоры с
разнесённой архитектурой называются А - процессорами и Е- процессорами.
Разнесённая архитектура позволяет достигать при скалярной обработке
производительности, характерной для векторных процессоров, за счёт
предвыборки данных из памяти и автоматической развёртки нескольких
последовательных витков цикла в А – процессоре. Проблемы расщепления
программы на подпрограммы для А - и Е- процессора решаются на уровне
компилятора или специальным блоком-расщепителем.
Структурные методы уменьшения времени доступа к памяти.
Совершенствование архитектуры микропроцессоров и механизма доступа к
памяти не может происходить без принятия совокупности соглашений о
структуре программ и обрабатываемых данных. Это обусловлено, например, тем, что время доступа в основную память в десять и более раз больше, чем время
выполнения преобразования данных в регистрах процессора. Поэтому необходимо
находить решения по уменьшению времени доступа, учитывающие этот факт.
Иерархическая структура памяти. Идеальная память должна обеспечивать
процессор командами так, чтобы не вызывать простоев процессора. При этом
память должна иметь большую емкость. В современных условиях уменьшение
времени доступа достигается введением многоуровневой иерархии памяти. Время
доступа зависит от объема и типа используемой памяти.
Современная типовая иерархия памяти имеет следующую структуру:
. регистры 64 – 256 слов со временем доступа 1 такт процессора;
. кэш 1 уровня – 8к слов со временем доступа 1 – 2 такта;
. кэш 2-го уровня – 256к слов со временем доступа 3 – 5 тактов;
Рекомендуем скачать другие рефераты по теме: сочинение 6 класс, шпаргалки по истории россии.
Категории:
Предыдущая страница реферата | 1 2 3 4 5 6 7 | Следующая страница реферата