Архитектура IA-32
| Категория реферата: Рефераты по информатике, программированию
| Теги реферата: зимнее сочинение, реферат на тему образование
| Добавил(а) на сайт: Приходько.
Предыдущая страница реферата | 2 3 4 5 6 7 8 9 10 11 12 | Следующая страница реферата
[pic]
Рисунок 5. Технология Hyper-Threading на SMP
Производительный потенциал НТ основывается:
. на факте, что операционная система и пользовательские приложения могут закреплять потоки или процессы за логическими процессорами каждого из физических процессоров.
. Возможности к использованию исполнительных ресурсов кристалла на более высоком уровне, чем когда один поток потребляет все исполнительные ресурсы
Ресурсы процессора и технология Hyper-Threading
Большинство микроархитектурных ресурсов физического процессора делятся между логическими процессорами. Только некоторые небольшие структуры данных дублируются для каждого логического процессора. В этом разделе описывается, как ресурсы разделяются, делятся или реплицируются.
Реплицированные ресурсы
Архитектурная модель дублируются для каждого логического процессора.
Архитектурная модель состоит из регистров используемых операционной
системой и программного кода контролирующего взаимодействие программ и
хранение данных для вычислений. Эта модель включает восемь регистров
специального назначения, контролирующие регистры, регистры отладки и т.д.
За исключением MTRRs – регистров (memory type range registers) и ресурсов
мониторинга за производительностью
Остальные ресурсы, такие как указатели инструкций, таблицы переименований регистров, реплицируются для одновременного слежения за выполнением и изменениями в логических процессорах. Предсказатель стека возвратов реплицируется для улучшения предсказания ветвлений инструкций возврата.
В дополнение реплицируются несколько буферов (например, двух входные буферы потоковых инструкций), для снижения нагрузки.
Разделенные ресурсы
Несколько буферов делятся пополам между процессорами. Они относятся к разделенным ресурсам. Причины этого деления:
. Операционная равнодоступность
. Возможность операций одного логического процессора не зависеть от зависших операций другого логического процессора
Промах кэша, неверное предсказание ветвления или зависимости инструкций могут помешать логическому процессору работать на полной мощности в течение некоторого числа циклов. Разделение предотвращает зависший логический процессор от блокирования.
Главное, буфера инструкций очередей для главного конвейера делятся между процессорами. Эти буфера включают очереди микрокоманд после исполнительного кэша трасс, очереди после стадии переименования регистра, разупорядочивающий буфер, который хранит очередь инструкций для изъятия и загрузочные и хранящие буфера.
В случае буферов загрузки и хранения, деление так же производиться в легком варианте, для получения реорганизации памяти для каждого логического процессора и для определения ошибок организации памяти.
Разделяемые ресурсы
Большинство ресурсов в физическом процессоре полностью разделяются для улучшения динамического использования ресурсов, включая кэши и все исполнительные блоки. Некоторые разделяемые ресурсы, адресованные линейно, например DTLB, включают бит идентификации логического процессора, для определения какому логическому процессору принадлежит информацию.
Микроархитектура конвейера и технология НТ
В этой части описывается микроархитектура НТ, и как инструкции из двух логических процессоров распределяются между блоком начальной и конечной загрузки конвейера.
Так как инструкции, передаваемые из двух программ или процессов, выполняются одновременно, нет необходимости в жестком программном порядке в
исполнительном ядре и иерархии памяти, блоки начальной и конечной загрузки
содержат несколько выборных точек для выбора между инструкциями из двух
логических процессоров. Все выборные точки работают между двумя логическими
процессорами, за исключением случаев, когда один из логических процессоров
не может использовать текущее состояние конвейера. В этом случае другой
логический процессор использует каждый цикл конвейер в полном объеме.
Причины, по которым один из логических процессоров не может использовать
конвейер – это промахи загрузки кэша, не верное предсказание ветвлений и
зависимость инструкций.
Блок начальной загрузки конвейера
Исполнительный кэш трасс разделяется между двумя логическими процессорами. Доступ к исполнительному кэшу трасс произвольно делиться между двумя логическими процессорами каждый такт. Если нить кэша выбрана для одного логического процессора в одном цикле, в следующем цикле нить будет выбрана для другого логического процессора. Таким образом, оба логических процессора запрашивают доступ к кэшу трасс.
Рекомендуем скачать другие рефераты по теме: цель реферата, ответы по контрольной.
Категории:
Предыдущая страница реферата | 2 3 4 5 6 7 8 9 10 11 12 | Следующая страница реферата