Assembler для Windows

             

Приложение 2. Справочник по командам и архитектуре Pentium

В литературе при описании команд микропроцессоров часто встречаются досадные ошибки. Стараясь избежать таких ошибок, автор выверял описание команд по нескольким источникам [3,5,6,8,9,10]. Часть команд была проверена программным путем.

Список регистров микропроцессора Pentium

Регистры общего назначения

EAX = (16+AX=(AH+AL))
EBX = (16+BX=(BH+BL))
ECX = (16+CX=(CH+CL))
EDX = (16+DX=(DH+DL))
ESI = (16+SI)
EDI = (16+DI)


EBP = (16+BP) ESP = (16+SP)

Регистры EAX, EBX, EDX, ECX называют рабочими регистрами. Регистры EDI, ESI - индексные регистры, играют особую роль в строковых операциях. Регистр EBP обычно используется для адресации в стеке параметров и локальных переменных. Регистр ESP - указатель стека, автоматически модифицируется командами PUSH, POP, RET, CALL. Явно используется реже.

Регистр флагов. Содержит 32 бита. Вот используемые значения битов.

  • 0-й бит, флаг переноса (CF), устанавливается в 1 если был перенос из старшего бита;
  • 1-й бит, 1;
  • 2-й бит, флаг четности (PF). Устанавливается в 1, если младший байт результата содержит четное число единиц.
  • 3-й бит, 0;
  • 4-й бит, флаг вспомогательного переноса (AF). Устанавливается в 1, если произошел перенос из третьего бита в четвертый.
  • 5-й бит, 0;
  • 6-й бит, флаг нуля (ZF). Устанавливается в единицу, если результат операции ноль;
  • 7-й бит, флаг знака (SF). Равен старшему биту результата;
  • 8-й бит, флаг ловушки (TF). Установка в единицу этого флага приводит к тому, что после каждой команды вызывается INT 3. Используется отладчиками в реальном режиме;
  • 9-й бит, флаг прерываний (IF). Сброс этого флага в 0 приводит к тому, что микропроцессор перестает воспринимать прерывания;
  • 10-й бит, флаг направления (DF). Данный флаг учитывается в строковых операциях. Если флаг равен 1, то в строковых операциях адрес автоматически уменьшается;
  • 11-й бит, флаг переполнения (OF). Устанавливается в единицу, если результат операции над числом со знаком вышел за допустимые пределы;
  • 12,13-й биты, уровень привилегий ввода-вывода (IOPL);
  • 14-бит, флаг вложенной задачи (NT);
  • 15-й бит, 0;
  • 16-й бит, флаг возобновления (RF). Используется совместно с регистрами точек отладочного останова;
  • 17-й бит, в защищенном режиме включает режим виртуального режима 8086 (VM);
  • 18-й бит, флаг контроля выравнивания (AC). При равенстве этого флага 1 и при обращении к невыровненному операнду вызывает исключение 17;
  • 19-й бит, виртуальная версия флага IF (VIF). Работает в защищенном режиме;
  • 20-й бит, виртуальный запрос прерывания (VIP);
  • 21-й бит, флаг доступности команды идентификации;
  • 22-31-й, 0;

Сегментные регистры

CS - сегмент кода,
DS - сегмент данных,
SS - сегмент стека,
ES,GS,FS - дополнительные регистры. Сегментные регистры 16-битны.

Управляющие регистры

Регистр CR0.

  • 0-й бит, разрешение защиты (РЕ). Переводит процессор в защищенный режим.
  • 1-й бит, мониторинг сопроцессора (МР). Вызывает исключение 7 по каждой команде WAIT.
  • 2-й бит, эмуляция сопроцессора (ЕМ). Вызывает исключение 7 по каждой команде сопроцессора.
  • 3-й бит, бит переключения задач (TS). Позволяет определить, относится данный контекст сопроцессора к текущей задаче или нет. Вызывает исключение 7 при выполнении следующей команды сопроцессора.
  • 4-й бит, индикатор поддержки инструкций сопроцессора (ЕТ).
  • 5-й бит, разрешение стандартного механизма сообщений об ошибке сопроцессора (NE).
  • 5-15-й бит, не используются.
  • 16-й бит, разрешение защиты от записи на уровне привилегий супервизора (WP).
  • 17-й бит, не используется.
  • 18-й бит, разрешение контроля выравнивания (AM).
  • 19-28-й бит, не используются.
  • 29-й бит, запрет сквозной записи кэша и циклов аннулирования (NW).
  • 30-й бит, запрет заполнения кэша (CD).
  • 31-й бит, включение механизма страничной переадресации.

Регистр CR1 пока не используется.

Регистр CR2 хранит 32-битный линейный адрес, по которому был получен последний отказ страницы памяти.

Регистр CR3 - в старших 20 битах хранится физический базовый адрес таблицы каталога страниц.

Остальные биты.

  • 3-й бит, кэширование страниц со сквозной записью (PWT).
  • 4-й бит, запрет кэширование страницы (PCD).

Регистр CR4

  • 0-й бит, разрешение использования виртуального флага прерываний в режиме V8086 (VME).
  • 1-й бит, разрешение использования виртуального флага прерываний в защищенном режиме (PVI).
  • 2-й бит, превращение инструкции RDTSC в привилегированную (TSD).
  • 3-й бит, разрешение точек останова по обращению к портам ввода-вывода (DE).
  • 4-й бит, включает режим адресации с 4-мегабайтными страницами (PSE).
  • 5-й бит, включает 36-битное физическое адресное пространство (РАЕ).
  • 6-й бит, разрешение исключения МС (МСЕ).
  • 7-й бит, разрешение глобальной страницы (PGE).
  • 8-й бит, разрешает выполнение команды RDPMC (РМС).
  • 9-й бит, разрешает команды быстрого сохранения/восстановления состояния сопроцессора (FSR).

Системные адресные регистры

GDTR - 6-байтный регистр, в котором содержится линейный адрес глобальной дескрипторной таблицы.
IDTR - 6-байтный регистр, содержащий 32-битный линейный адрес таблицы дескрипторов обработчиков прерываний.
LDTR - 10-байтный регистр, содержащий 16-битный селектор (индекс) для GDT и 8-байтный дескриптор.
TR - 10-байтный регистр, содержащий 16-битный селектор для GDT и весь 8-байтный дескриптор из GDT, описывающий TSS текущей задачи.

Регистры отладки
DR0...DR3 - хранят 32-битные линейные адреса точек останова.
DR6 (равносильно DR4) - отражает состояние контрольных точек.
DR7 (равносильно DR5) - управляет установкой контрольных точек.

Команды пересылки данных

MOV dest,src Пересылка данных в регистр из регистра, памяти или непосредственного операнда. Пересылка данных в память из регистра или непосредственного операнда. Например, MOV AX,10; MOV EBX,ESI; MOV AL, BYTE PTR MEM.
XCHG r/m,r Обмен данными между регистрами или регистром и памятью. Команда "память - память" в микропроцессоре Intel не предусмотрена.
BSWAP reg32 Перестановка байт из порядка "младший - старший" в порядок "старший - младший". Разряды 7-0 обмениваются с разрядами 31-24, а разряды 15-8 с разрядами 23-16. Команда появилась в 486-м микропроцессоре.
MOVSXB r,r/m Пересылка байта с его расширением до слова или двойного слова с дублированием знакового бита: MOVSXB AX,BL; MOVSXB EAX,byte ptr mem. Команда появилась с 386-ого процессора.
MOVSXW r,r/m Пересылка слова с расширением до двойного слова с дублированием знакового бита: MOVSXW EAX,WORD PTR MEM. Команда появилась с 386-ого процессора.
MOVZXB r,r/m Пересылка байта с его расширением до слова или двойного слова с дублированием нулевого бита: MOVSXB AX,BL; MOVSXB EAX,byte ptr mem. Команда появилась с 386-ого процессора.
MOVZXW r,r/m Пересылка слова с расширением до двойного слова с дублированием нулевого бита: MOVZXW EAX,WORD PTR MEM. Команда появилась с 386-ого процессора.
XLAT Загрузить в AL байт из таблицы в сегменте данных, на начало которой указывает EBX (ВХ), при этом начальное значение AL играет роль смещения.
LEA r,m Загрузка эффективного адреса. Например, LEA EAX,MEM; LEA EAX,[EBX]. Данная команда обладает магичаскими свойствами, позволяющими эффективно выполнять арифметические действия. Например, команда LEA EAX,[EAX*8] умножает содержимое EAX на 8, LEA EAX,[EAX][EAX*4] на 5, Команда LEA ECX,[EAX][ESI+5] эквивалента 3(!) командам MOV ECX,EAX/ADD ECX,ESI/ADD ECX,5.
LDS r,m Загрузить пару DS:reg из памяти. Причем вначале идет слово (или двойное слово), а в DS - последующее слово.
LES r,m Аналогично предыдущему, но для пары ES:reg.
LFS r,m Аналогично предыдущему, но для пары FS:reg.
LGS r,m Аналогично предыдущему, но для пары GS:reg.
LSS r,m Аналогично предыдущему, но для пары SS:reg.
SETcc r/m Проверяет условие "cc", если выполняется, то первый бит байта устанавливается в 1, в противном случае в 0. Условия аналогичны в условных переходах (je, jc). Например, SETE AL. Команда появилась с 386-ого микропроцессора.
LAHF Загрузить флаги в АН (устарела).
SAHF Сохранить АН в регистре флагов (устарела).

Команды ввода-вывода

IN AL(AX,EAX),Port
IN AL(AX,EAX),DX
Ввод в аккумулятор из порта ввода-вывода. Порт адресуется непосредственно или через регистр DX.
OUT port,AL(АХ,EAX)
OUT DX,AL(АХ,EAX)
Вывод в порт ввода-вывода. Порт адресуется непосредственно или через регистр DX.
[REP] INSB
[REP] INSW
[REP] INSD
Выводит данные из порта, адресуемого регистром DX в ячейку памяти ES:[EDI/DI]. После ввода байта, слова или двойного слова производится коррекция EDI/DI на 1,2,4. При наличии префикса REP процесс продолжается, пока содержимое СХ не станет равным 0.
[REP] OUTSB
[REP] OUTSW
[REP] OUTSD
Выводит данные из ячейки памяти, определяемой регистрами DS:[ESI/SI], в выходной порт, адрес которого находится в регистре DX. После вывода байта, слова, двойного слова производится коррекция указателя ESI/SI на 1,2,4.

Инструкции работы со стеком

PUSH r/m Поместить в стек слово или двойное слово. Поскольку при включении в стек слова нарушается выравнивание стека по границам двойных слов, рекомендуется в любом случае помещать в стек двойное слово.
PUSH const Поместить в стек непосредственный 32-битный операнд.
PUSHA Поместить в стек регистры EAX, EBX, ECX, EDX, ESI, EDI, EBP, ESP. Команда появилась с 386-ого процессора.
POP reg/mem Извлечь из стека слово или двойное слово.
POPА Извлечение из стека данных в регистры EAX, EBX, ECX, EDX, ESI, EDI, EBP, ESP. Команда появилась, начиная с 386-ого процессора.
PUSHF Помещение в стек регистра флагов.
POPFИзвлечь данные в регистр флагов.

Инструкции целочисленной арифметики.

ADD dest,src Сложение двух операндов. Первый операнд может быть регистром или ячейкой памяти, второй - регистром, ячейкой памяти, константой. Невозможно только, когда оба операнда являются ячейками памяти.
XADD dest,src Данная операция производит в начале обмен операндами, а затем выполняет операцию ADD. Начиная 486-ого.
ADC dest,src Сложение с учетом флага переноса - в младший бит добавляется бит (флаг) переноса.
INC r/m Инкремент операнда.
SUB dest,src Вычитание двух операндов. Остальное аналогично сложению (команда ADD).
SBB dest,src Вычитание с учетом бита переноса. Из младшего бита вычитается бит (флаг) переноса.
DEC r/m Декремент операнда.
CMP r/m,r/m Вычитание без изменения операндов (сравнение).
CMPXCHG r,m,a Сравнение с обменом. Воспринимает три операнда (регистр-операнд-источник, ячейка памяти-операнд- получатель, аккумулятор, т.е. AL,AX или EAX) Если значения в операнде-получателе и аккумуляторе равны, операнд-получатель заменяется операндом-источником, исходное значение операнда-получателя загружается в аккумулятор. Начиная с 486-ого.
CMPXCHG8B r,m,a Сравнение и обмен восьми байт. Начиная с Pentium.
NEG r/m Изменение знака операнда.
ААА Коррекция после ASCII-сложения. Коррекция результата двоичного сложения двух неупакованных десятичных чисел. Например, АХ содержит число 9H. Пара команд ADD AL,8/AAA приводит к тому, что в АХ будет содержаться 0107, т.е. ASCII-число 17.
AAS Коррекция после ASCII-вычитания. Например:
MOV AX,205H; загрузить ASCII 25 SUB AL,8; двоичное вычитание AAS ;теперь АХ содержит 107Н, т.е. 17.
ААМ Коррекция после ASCII-умножения. Для этой команды предполагается, что в регистре АХ находится результат двоичного умножения двух десятичных цифр (диапазон от 0 до 81). После выполнения команды образуется двухбайтное произведение в регистре АХ в ASCII-формате.
AAD Коррекция перед ASCII-делением. Предполагается, что младшая цифра находится в AL, а старшая - в АН.
DAA Коррекция после BCD-сложения.59
DAS Коррекция после ВСD-вычитания.
MUL r/m Умножение АL(AX,EAX) на целое беззнаковое число. Результат, соответственно, будет содержаться в АХ, DX:AX, EDX:EAX.
IMUL r/m Знаковое умножение (аналогично MUL). Все операнды считаются знаковыми. Команда IMUL имеет также двухоперандный и трехоперандный вид. Двухоперандный вид IMUL r,src r<-r*src. Трехоперандный вид IMUL dst,src,imm dst<-src*imm.
DIV r/m (src) Беззнаковое деление. Аналогично беззнаковому умножению. Осуществляет деление аккумулятора и его расширения (AH:AL, DX:AX, EDX:EAX) на делитель src. Частное помещается в аккумуляторе, а остаток - в расширении аккумулятора.
IDIV r/m Знаковое деление. Аналогично беззнаковому.
CBW Расширение байта (AL) в слово с копированием знакового бита.
CWD Расширение слова (АХ) в двойное слово (DX:AX) с копированием знакового бита.
CWDE Расширение слова (АХ) в двойное слово (EAX) с копированием знакового бита.
CDQ Преобразование двойного слова (EAX) в учетверенное слово (EDX:EAX).

59 Напоминаю, что ASCII-число предполагает одну цифру на один байт, BCD-число - одну цифру на половину байта. Т.о. скажем в регистре АХ, может находиться двухразрядное ASCII-число и четырехразрядное BCD-число.


Логические операции.

AND dest,src Логическая операция "AND". Обнуление бит dest, которые равны нулю у src.
TEST dest,src Аналогична "AND", но не меняет dest. Используется для проверки ненулевых бит.
OR dest,src Логическая "ИЛИ". В dest устанавливаются биты, отличные от нуля в src.
XOR dest,src Исключающее "ИЛИ".
NOT dest Переключение всех бит (инверсия).

Сдвиговые операции.

Начиная с 386-ого микропроцессора, непосредственный операнд src может быть не только 1, но произвольным числом. В ранних версиях для количества сдвигов использовался регистр CL.

RCL/RCR dest,src Циклический сдвиг влево/вправо через бит переноса CF. Src может быть либо CL, либо непосредственный операнд.
ROL/ROR dest,src Аналогично командам RCL/RCR, но по другому, работает с флагом CF. Флаг не участвует в цикле, но в него попадает бит, перешедший с начала на конец или наоборот.
SAL/SAR dest,src Сдвиг влево/право. Называется еще арифметическим сдвигом. При сдвиге вправо дублируется старший бит. При сдвиге влево младший бит заполняется нулем. Ушедший бит помещается в CF.
SHL/SHR dest,src Логический сдвиг влево/вправо. Сдвиг вправо отличается от SAR тем, что и старший бит заполняется нулем.
SHLD/SHRD dest,src,count Трехоперандные команды сдвига влево/вправо. Первым операндом, как обычно, может быть либо регистр, либо ячейка памяти, вторым операндом должен быть регистр общего назначения, третьим - регистр CL или непосредственный операнд. Суть операции заключается в том, что dest и src в начале объединяются, а потом производится сдвиг на количество бит count. Результат снова помещается в dest.

Строковые операции

REP Префикс, означающий повтор строковой операции до обнуления ECX. Префикс имеет также разновидности REPZ (REPE) - выполнять, пока не нуль (ZF=1), REPNZ (REPNE) - выполнять, пока нуль.
MOVS dest,src Команда передает байт, слово или двойное слово из цепочки, адресуемой DS:[ESI], в цепочку dest, адресуемую ES:[EDI]. При этом EDI и ESI автоматически корректируются согласно значению флага DF. Допускается явная спецификация MOVSB (byte), MOVSW (word), MOVSD (dword). Dest и src можно явно не указывать.
LODS src Команда загрузки цепочки в аккумулятор. Имеет разновидности LODSB, LODSW, LODSD. При выполнении команды байт, слово, двойное слово загружается соответственно в AL,AX,EAX. При этом ESI автоматически изменяется на 1 в зависимости от значения флага DF. Префикс REP не используется.
STOS dest Команда, обратная LODS, т.е. передает байт, слово или двойное слово из аккумулятора в цепочку и автоматически корректирует EDI.
SCAS dest Команда сканирования цепочки. Команда вычитает элемент цепочки dst из содержимого аккумулятора (AL\AX\EAX) и модифицирует флаги. Префикс REPNE позволяет найти в цепочке нужный элемент.
CMPS dest,src Команда сравнения цепочек. Данная команда производит вычитание байта, слова или двойного слова цепочки dst из соответствующего элемента цепочки src. В зависимости от результата вычитания модифицируются флаги. Регистры EDI и ESI автоматически продвигаются на следующий элемент. При использовании префикса REPE команда означает - сравнивать, пока не будет, достигнут конец цепочки или пока элементы не будут равны. При использовании префикса REPNE команда означает - сравнивать, пока не достигнут конец цепочки или пока элементы будут равны.

Команды управления флагами

CLC Сброс флага переноса.
CMC Инверсия флага переноса.
STC Установка флага переноса.
CLD Сброс флага направления.
STD Установка флага направления.
CLI Запрет маскируемых аппаратных прерываний.
STI Разрешение маскируемых аппаратных прерываний.
CTS Сброс флага переключения задач.

Команды передачи управления

JMP target Имеет пять форм, различающихся расстоянием назначения от текущего адреса, и способом задания целевого адреса. При работе в Windows используется в основном внутрисегментный переход (NEAR) в пределах 32-битного сегмента. Адрес перехода может задаваться непосредственно (в программе это метка) или косвенно, т.е. содержаться в ячейке памяти или регистре (JMP [EAX]).
Другой тип перехода - короткий переход (SHORT), занимает всего 2 байта. Диапазон смещения, в пределах которого происходит переход: -128 ... 127. Использование такого перехода весьма ограниченно.
Межсегментный переход может иметь следующий вид: JMP FWORD PTR L, L - указатель на структуру, содержащую 48-битный адрес, в начале которого 32-й адрес смещения, затем 16-й селектор (сегмента, шлюза вызова, сегмента состояния задачи). Возможен также и такой вид межсегментного перехода:
JMP FWORD ES:[EDI].
Условные переходы JA/JNBE - перейти, если выше.
JAE/JNB - перейти, если выше или равно.
JB/JNAE - перейти, если ниже.
JBE/JNA - перейти, если ниже.
JC - перейти, если перенос.
JE/JZ - перейти, если нуль.
JG/JNLE - перейти, если больше.
JGE/JNL - перейти, если больше или равно.
JL/JNGE - перейти, если меньше.
JLE/JNG - перейти, если меньше или равно.
JNC - перейтИ, если нет переноса.
JNE/JNZ - перейти, если меньше или равно.
JNO - перейти, если нет переполнения.
JNP/JPO - перейти, если нет паритета.
JNS - перейти, если нет знака.
JO - перейти, если есть переполнения.
JP/JPE - перейти, если есть паритет.
JS - перейти, если есть знак.
JCXZ - переход, если СХ=0.
JECXZ - переход, если ECX=0.
В плоской модели команды условного перехода осуществляют переход в пределах 32-битного регистра.
Команды управления циклом. Все команды этой группы уменьшают содержимое регистра ECX. LOOP - переход, если содержимое ECX не равно нулю.
LOOPE (LOOPZ) - переход, если содержимое ECX не равно нулю и флаг ZF=1.
LOOPNE (LOOPNZ) - переход, если содержимое ECX не равно нулю и флаг ZF=0.
CALL target Передает управление процедуре (метке) с сохранением в стеке адреса, следующей за CALL командой. В плоской модели адрес возврата представляет собой 32-битное смещение. Межсегментный вызов предполагает сохранение в стеке селектора и смещения, т.е. 48-битной величины (16 бит - селектор и 32 бита - смещение).
RET [N] Возврат из процедуры. Необязательный параметр N предполагает, что команда также автоматически чистит стек (освобождает N байт). Команда имеет разновидности, которые выбираются ассемблером автоматически, в зависимости от того, является процедура ближней или дальней. Можно, однако, и явно указать тип возврата (RETN или RETF). В случае плоской модели по умолчанию берется RETN с четырехбайтным адресом возврата.

Команды поддержки языков высокого уровня

ENTER par1,par2 Подготовка стека при входе в процедуру (см. главу 1.2.).
LEAVEПриведение стека в исходное состояние.
BOUND REG16,MEM16 или BOUND REG32,MEM32 Предполагается, что регистр содержит текущий индекс массива, а второй операнда определяет в памяти два слова или два двойных слова. Первое считается минимальным значением индекса, а второе - максимальным. Если текущий индекс оказывается вне границ, то генерируется команда INT 5. Используется для контроля нахождения индекса в заданных рамках, что является важным средством отладки.

Команды прерываний

INT n Двухбайтная команда. В начале в стек помещается содержимое регистра флагов, затем полный адрес возврата. Кроме того, сбрасывается флаг TF. После этого осуществляется косвенный переход через n-й элемент дескрипторной таблицы прерываний. Однобайтная команда INT 3 называется прерыванием контрольного останова и используется в программах-отладчиках.
INTO Равносильна команде INT 4, если флажок переполнения OF=1,
если OF=0 - команда не производит никакого действия.
IRETКоманда возврата из прерываний. Извлекает из стека сохраненные в нем адрес возврата и регистр флажков. Бит уровня привилегий будет модифицироваться только в том случае, если текущий уровень привилегий равен 0.

Команды синхронизации процессора

HLT Останавливает процессор. Из такого останова процессор может быть выведен внешним прерыванием.
LOCK Представляет собой префикс блокировки шины. Он заставляет процессор сформировать сигнал LOCK# на время выполнения находящейся за префиксом команды. Этот сигнал блокирует запросы шины другими процессорами в мультипроцессорной системе.
NOP Холостая команда. Не производит никаких действий.
WAIT (FWAIT) Синхронизация с сопроцессором. Большинство команд сопроцессора автоматически вырабатывают эту команду.

Команды обработки цепочки бит.

Эти команды появились в 386-м процессоре

BSF(BSR) dest,src dest - 16-битный или 32-битный регистр. src - регистр или ячейка памяти. При выполнении команды BSF операнд src просматривается с младших, а в команде BSR - со старших бит. Номер первого встречного бита, находящегося в состоянии 1, помещается в регистр dest, флажок ZF сбрасывается в 0. Если src содержит 0, то ZF=1, а содержимое dest не определено.
ВТ dest,src Тестирование бита с номером из src в dest и перенос его во флаг CF.
ВТС dest,srcПроверка и инвертирование бита из src в dest.
BTR dest,srcПроверка и сброс бита из src в dest.
BTS dest,srcПроверка и установка бита из src в dest.

Команды управления защитой

LGDT src Загрузка GDTR из памяти. Src указывает на 6-байтную величину.
SGDT destСохранить GDTR в памяти.
LIDT srcЗагрузить IDTR из памяти.
SIDT destСохранить IDTR в памяти.
LLDT srcЗагрузить LDTR из памяти (16 бит).
SLDT destСохранить LDTR в регистре или памяти (16 бит).
LMSW srcЗагрузка MSW.
SMSW destСохранить MSW в регистре или памяти (16 бит).
LTR srcЗагрузка регистра задачи из регистра или памяти (16 бит).
STR destСохранение регистра задачи в регистре или памяти (16 бит).
LAR dest,srcЗагрузка старшего байта dest байтом прав доступа дескриптора src.
LSL dest,srcЗагрузка dest лимитом сегмента, дескриптор которого задан src.
ARPL r/m,rВыравнивание RPL в селекторе до наибольшего числа из текущего уровня и заданного операндом.
VERR segВерификация чтения: установка ZF=1, если задаче позволено чтение в сегменте SEG.
VERW segВерификация чтения: установка ZF=1, если задаче позволена запись в сегменте SEG.

Команды обмена с управляющими регистрами

MOV CRn,srcЗагрузка управляющего регистра CRn.
MOV dest,CRnЧтение управляющего регистра CRn.
MOV DRn,srcЗагрузка регистра отладки DRn.
MOV dest,DRnЧтение регистра отладки DRn.
MOV TRn,srcЗагрузка регистра тестирования TRn.
MOV dest,TRnЧтение регистра тестирования TRn.
RDTSCЧтение счетчика тактов.

Команды идентификации и управления архитектурой

CPUID Получение информации о процессоре. Требует параметр в регистре EAX.
EAX=0, процессор в регистрах EBX,EDX,ECX возвращает символьную строку, специфичную для производителя. Процессоры AMD возвращают строку "AuthenticAMD", процессоры Intel - "Genuinelntel".
EAX=1, в младшем слове регистра EAX возвращает код идентификации.
EAX=2, в регистрах EAX, EBX, ECX, EDX возвращаются параметры конфигурации процессора.
RDMSR r/mЧтение модельно-специфического регистра в ECX.
WRMSR r/mЗапись ECX в модельно-специфический регистр.

Команды управления кэшированием

Внутренний кэш появился в процессоре, начиная с 486-ого. Процессоры 486 и Pentium имеют внутренний кэш первого уровня, Pentium Pro и Pentium II имеют уже и вторичный кэш.

INVDАннулирование данных в первичном КЭШе без обратной записи.
WBINVDОбратная запись модифицированных строк и аннулирование кэш-памяти.
INVLPG r/mАннулирование элемента таблицы трансляции TLB (TLB - буфер ассоциативной трансляции таблиц каталогов и страниц памяти).

Команды арифметического сопроцессора.

Описание работы арифметического сопроцессора см. [1,5]. Здесь мы коснемся основных положений работы арифметического сопроцессора.60

1. Арифметический сопроцессор работает со своим набором команд и своим набором регистров. Однако выборку команд сопроцессора осуществляет процессор.

2. Арифметический сопроцессор выполняет операции со следующими типами данных: целое слово (16 бит), короткое целое (32 бита), длинное слово (64 бита), упакованное десятичное число (80 бит), короткое вещественное число (32 бита), длинное вещественное число (64 бита), расширенное вещественное число (80 бит).

3. При выполнении операции сопроцессором, процессор ждет завершения этой операции. Другими словами, перед каждой командой сопроцессора ассемблером автоматически генерируется команда, проверяющая, занят сопроцессор или нет. Если сопроцессор занят, процессор переводится в состояние ожидания. Иногда программисту требуется вручную ставить команду ожидания (WAIT) после команды сопроцессора.

4. Сопроцессор имеет восемь 80-битных рабочих регистров, представляющих собой стековую кольцевую структуру. Регистры называются R0,R1, ... R7, но доступ к ним напрямую невозможен. Каждый регистр может занимать любое положение в стеке. Название стековых (относительных) регистров - ST(0), ST(1), ST(2), ST(3), ST(4), ST(5), ST(6), ST(7). Кроме того, имеется еще регистр состояния, по флагам которого можно, в частности, судить о результате выполненной операции. Регистр управления содержит в себе биты, влияющие на выполнение команд сопроцессора.

5. Регистр тэгов содержит 16 бит, описывающих содержание регистров сопроцессора: по два бита на каждый рабочий регистр. Тэг говорит о содержимом регистре данных. Вот значение тэгов: 00 - действительное ненулевое число, 01 - истинный нуль, 10 - специальные числа, 11 - отсутствие данных.

6. При вычислении с помощью команд сопроцессора большую роль играют исключения или особые ситуации. Типичной особой ситуацией является деление на 0. Биты особых ситуаций хранятся в регистре состояний. Учет особых ситуаций необходим для получения правильных результатов.

7. Список особых ситуаций.

  1. Неточный результат (округление).
  2. Недействительная операция.
  3. Деление на ноль.
  4. Антипереполнение (слишком маленький результат).
  5. Переполнение (слишком большой результат).
  6. Денормализованный операнд.

8. Регистр состояния.

  • 0-й бит, флаг недопустимой операции.
  • 1-й бит, флаг денормализованной операции.
  • 2-й бит, флаг деления на ноль.
  • 3-й бит, флаг переполнения.
  • 4-й бит, флаг антипереполнения.
  • 5-й бит, флаг неточного результата.
  • 6-й бит, ошибка стека.
  • 7-й бит, общий флаг ошибки.
  • 8,9,10-й, флаги условий.
  • 11,12,13-й, число, показывающее, какой регистр является вершиной.
  • 14-й бит, условный флаг.
  • 15-й бит, флаг занятости.

9. Регистр управления.

  • 0-й бит, маска недействительной операции.
  • 1-й бит, маска денормализованного операнда.
  • 2-й бит, маска деления на ноль.
  • 3-й бит, маска переполнения.
  • 4-й бит, маска антипереполнения.
  • 5-й бит, маска неточного результата.
  • 6,7-й бит, резерв.
  • 8-9-й биты, управление точностью.
  • 10,11-й биты, управление округлением.
  • 12-й, управление бесконечностью.
  • 13,14,15-й, резерв.

Команды передачи данных

FLD src Загрузить вещественное число в ST(0) (вершину стека) из области памяти. Область памяти может быть 32-, 64-, 80-битная.
FILD src Загрузить целое число в ST(0) из памяти. Область памяти может быть 16-, 32-, 64-битной.
FBLD src Загрузить BCD-число в ST(0) из 80-битной области памяти.
FLDZ Загрузить 0 в ST(0).
FLD1 Загрузить 0 в ST(0).
FLDPI Загрузить PI в ST(0).
FLDL2T Загрузить LOG2(10) в ST(0).
FLDTL2E Загрузить LOG2(e) в ST(0).
FLDLG2 Загрузить LG(2) в ST(0).
FLDLN2 Загрузить LN(2) в ST(0).
FST dest Запись вещественного числа из ST(0) в память. Область памяти 32-, 64- или 80-битная.
FSTP dest Запись вещественного числа из ST(0) в память. Область памяти 32-, 64- или 80-битная. При этом происходит выталкивание вершины из стека.
FBST dest Запись BCD-числа в память. Область памяти 80-битная.
FBSTP dest Запись BCD-числа в память. Область памяти 80-битная. При этом происходит выталкивание вершины из стека.
FXCH st(i) Обмен значениями вершины стека и регистра i.

Команды сравнения данных

FCOM Сравнение вещественных чисел ST(0) и ST(1). Флаги устанавливаются, как при операции ST(0)-ST(1).
FCOM src Сравнение ST(0) с операндом в памяти. Операнд может быть 32- или 64-битным.
FCOMP src Сравнение вещественного числа в ST(0) с операндом с выталкиванием ST(0) из стека. Операнд может быть регистром и областью памяти.
FCOMPP Сравнение ST(0) и ST(1) с двойным выталкиванием из стека.
FICOM src Сравнение целых чисел в ST(0) с операндом. Операнд может быть 16- или 32-битным.
FICOMP src Сравнение целых чисел в ST(0) с операндом. Операнд может быть 16- или 32-битной областью памяти или регистром. При выполнении операции происходит выталкивание ST(0) из стека.
FTST Проверка ST(0) на нуль.
FUCOM ST(i) Сравнение ST(0) с ST(i) без учета порядков.
FUCOMP ST(i) Сравнение ST(0) с ST(i) без учета порядков. При выполнении операции происходит выталкивание из стека.
FUCOMPP ST(i) Сравнение ST(0) с ST(i) без учета порядков. При выполнении операции происходит двойное выталкивание из стека.
FXAM Анализ содержимого вершины стека. Результат помещается в биты С3-С0.
000 - неподдерживаемый формат.
001 - не число.
010 - нормализованное число.
011 - бесконечность.
100 - нуль.
101 - пустой операнд.
110 - денормализованное число.

Арифметические команды

FADD src
FADD ST(i),ST
Сложение вещественных чисел. ST(0)<-ST(0)+src, src - 32- или 64-битное число ST(i)<-ST(i)+ST(0)
FADDP ST(i),ST Сложение вещественных чисел, ST(i)<-ST(i)+ST(0). При выполнении операции происходит выталкивание стека.
FIADD src Сложение целых чисел. ST(0)<-ST(0)+src, src - 16- или 32-битное число.
FSUB src
FSUB ST(i),ST
Вычитание вещественных чисел. ST(0)<-ST(0)-src, src - 32- или 64-битное число. ST(i)<-ST(i)-ST(0).
FSUBP ST(i),ST Вычитание вещественных чисел, ST(i)<-ST(i)-ST(0). При выполнении операции происходит выталкивание стека.
FSUBR ST(i),ST Обратное вычитание вещественных чисел. ST(0)<-ST(i)-ST(0)
FSUBRP ST(i),ST Обратное вычитание вещественных чисел. ST(0)<-ST(i)-ST(0). При выполнении операции происходит выталкивание стека.
FISUB src Вычитание целых чисел. ST(0)<-ST(0)-src, src - 16- или 32-битное число.
FISUBR src Вычитание целых чисел. ST(0)<-ST(0)-src, src - 16- или 32-битное число. При выполнении операции происходит выталкивание из стека.
FMUL
FMUL ST(i)
FMUL ST(i),ST
Умножение двух операндов.
В первом случае ST(0)<-ST(0)*ST(1).
Во втором случае ST(0)<-ST(i)*ST(0).
В третьем случае ST(i)<-ST(i)*ST(0).
FMULP ST(i),ST(0) ST(i)<-ST(i)*ST(0) умножение и выталкивание из стека.
FIMUL src Умножение ST(0) на целое число. ST(0)<-ST(0)*src. Операнд может быть 16- и 32-битным числом.
FDIV
FDIV ST(i)
FDIV ST(i),SY
ST(0)<-ST(0)/ST(1)
ST(0)<-ST(0)/ST(i)
ST(i)<-ST(0)/ST(i)
FDIVP ST(i),ST Деление с выталкиванием из стека. ST(i)<-ST(0)/ST(i).
FIDIV src Деление целых чисел. ST(0)<-ST(i)/src. Делитель может быть 16- и 32-битным числом.
FDIVR ST(i),ST Обратное деление вещественных чисел. ST(0)<-ST(i)/ST(0)
FDIVRP ST(i),ST Обратное деление вещественных чисел и выталкивание из стека. ST(0)<-ST(i)/ST(0)
FIDIVR src Обратное деление целых чисел. ST(0)<-src/ST(0).
FSQRT Извлечь корень из ST(0) и поместить обратно.
FSCALE Масштабирование. ST(0)<-ST(0)*2^ST(1)
FEXTRACT Выделение мантиссы и порядка из числа ST(0). В ST(0) помещается порядок, в ST(1) - мантисса.
FPREM Нахождение остатка от деления. ST(0)<-ST(0)MODST(1).
FPREM1 Нахождение остатка от деления в стандарте IEEE.
FRNDINT Округление до ближайшего целого числа, находящегося в ST(0). ST(0)<-int(ST(0))
FABS Нахождение абсолютного значения. ST(0)<-ABS(ST(0))
FCSH Изменение знака ST(0)<- -ST(0)

Трансцендентные функции

FCOS Вычисление косинуса. ST(0)<-COS(ST(0)). Содержимое в ST(0) интерпретируется как угол в радианах.
FPTAN Частичный тангенс. Содержимое в ST(0) интерпретируется как угол в радианах. Значение тангенса возвращается на место аргумента, а затем в стек включается 1.
FPATAN Вычисление арктангенса. Вычисляется функция Arctg(ST(1)/ST(0)). После вычисления функции происходит выталкивание из стека, после чего значение функции помещается в вершину.
FSIN Вычисление синуса. ST(0)<-SIN(ST(0)). Содержимое в ST(0) интерпретируется как угол в радианах.
FSINCOS Вычисление синуса и косинуса. ST(0)<-SIN(ST(0)) и ST(1)<-COS(ST(0))
F2XM1 Вычисление 2^X-1. ST(0)<-2^ST(0)-1.
FYL2X Вычисление Y*LOG2(X). ST(0)=Y, ST(1)=X. Происходит выталкивание из стека, и только потом в вершину стека помещается результат вычисления.
FYL2XP1 Вычисление Y*LOG2(X). ST(0)=Y, ST(1)=X. Происходит выталкивание из стека, и только потом в вершину стека помещается результат вычисления.

Команды управления сопроцессором

FINIT Инициализация сопроцессора.
FSTSW АХ Запись слова состояния в АХ.
FSTSW dest Запись слова состояния в dest.
FLDCW src Загрузка управляющего слова (16 бит) из dest.
FSTCW dest Сохранение управляющего слова в dest.
FCLEX Сброс исключений.
FSTENV dest Сохранение состояния оборудования (SR, CR, TAGW, FIP, FDP) в памяти.
FLDENV src Загрузка состояния оборудования из памяти.
FSAVE dest Сохранение состояния оборудования и файла регистров в памяти.
FRSTOR src Загрузка состояния оборудования и файла регистров в памяти.
FINCSTP Инкремент указателя стека.
FDECSTP Декремент указателя стека.
FFREE ST(i) Освобождение регистра - пометка ST(i) как свободного.
FNOP Холостая операция сопроцессора.
WAIT (FWAIT) Ожидание процессором завершение текущей операции сопроцессором.

Расширение MMX.

Расширение MMX ориентировано в основном на использование в мультимедийных приложениях. Основная идея MMX заключается в одновременной обработке нескольких элементов данных за одну инструкцию. Расширение MMX появилось в процессорах модификации Pentium P54C и присутствует во всех последних модификациях этого процессора.

Расширение MMX использует новые типы упакованных данных: упакованные байты (восемь байт), упакованные слова (четыре слова), упакованные двойные слова (два двойных слова), учетверенное слово. Расширение MMX включает восемь регистров общего пользования (MM0-MM7). Размер регистров составляет 64 бита. Физически эти регистры пользуются младшими битами рабочих регистров сопроцессора. Команды MMX "портят" регистр состояния и регистр тэгов. По этой причине совместное использование команд MMX и команд сопроцессора может вызвать определенные трудности. Другими словами, перед каждым использованием команд MMX Вам придется сохранять контекст сопроцессора, а это может весьма замедлить работу программы. Важно отметить также, что команды MMX работают непосредственно с регистрами сопроцессора, а не с указателями на элементы стека.

Команды MMX расширения (по книге [3])

EMMS Очистка стека регистров. Установка всех единиц в слове тегов.
MOVD mm,m32/ir32 Пересылка данных в младшие 32 бита регистра MMX с заполнением старших бит нулями.
MOVD m32/ir32,mm Пересылка данных из младших 32 бит регистра MMX.
MOVQ mm,mm/m64 Пересылка данных в регистр MMX.
MOVQ mm/m64,mm Пересылка данных из регистра MMX.
PACKSSDW mm,mm/m64 Упаковка со знаковым насыщением двух двойных слов, расположенных в mm, и двух двойных слов mm/m64 в четыре слова, расположенных в mm.
PACKSSWB mm,mm/m64 Упаковка со знаковым насыщением четырех слов, расположенных в mm, и четырех слов mm/m64 в восемь байт, расположенных в mm.
PACKUSWB mm,mm/m64 Упаковка с насыщением четырех знаковых слов, расположенных в mm, и четырех слов mm/m64 в восемь беззнаковых байт, расположенных в mm.
PADDB mm,mm/m64
PADDW mm,mm/m64
PADDD mm,mm/m64
Сложение упакованных байт (слов или двойных слов) без насыщения (с циклическим переполнением).
PADDSB mm,mm/m64
PADDSW mm,mm/m64
Сложение упакованных байт (слов) со знаковым насыщением.
PADDUSB mm,mm/m64
PADDUSW mm,mm/m64
Сложение упакованных байт (слов) с беззнаковым насыщением.
PAND mm,mm/m64 Логическое "И".
PANDN mm,mm/m64 Логическое "И-НЕ".
PCMPEQB mm,mm/m64
PCMPEQD mm,mm/m64
PCMPEQW mm,mm/m64
Сравнение (на равенство) упакованных байт (слов, двойных слов). Все биты элемента результата будут единичными (true) при совпадении соответствующих элементов операндов и нулевыми (false) - при несовпадении.
PCMPGTB mm,mm/m64
PCMPGTD mm,mm/m64
PCMPGTW mm,mm/m64
Сравнение (по величине) упакованных знаковых байт (слов, двойных слов). Все биты элемента результата будут единичными (true), если соответствующий элемент операнда назначения больше элемента операнда источника, и нулевыми (false) в противном случае.
PMADDWD mm,mm/m64 Умножение четырех знаковых слов операнда источника на четыре знаковых слова операнда назначения. Два двойных слова результатов умножения младших слов суммируются и записываются в младшее двойное слово операнда назначения. Два двойных слова результатов умножения старших слов суммируются и записываются в старшее двойное слово операнда назначения.
PMULHW mm,mm/m64 Умножение упакованных знаковых слов с сохранением только старших 16 бит элементов результата.
PMULLW mm,mm/m64 Умножение упакованных знаковых или беззнаковых слов с сохранением только младших 16 бит результата.
POR mm,mm/m64 Логическое "ИЛИ".
PSHIMD mm,imm
PSHIMQ mm,imm
PSHIMW mm,imm
PSHIMD представляет инструкции PSLLD, PSRAD и PSRLD с непосредственным операндом-счетчиком.
PSHIMW представляет инструкции PSLLW, PSRAW, PSRLW.
PSHIMQ представляет инструкции PSLLQ и PSRLQ с непосредственным операндом-счетчиком.
PSLLD mm,mm/m64
PSLLQ mm,mm/m64
PSLLW mm,mm/m64
Логический сдвиг влево упакованных слов (двойных, учетверенных) операнда назначения на количество бит, указанных в операнде-источнике, с заполнением младших бит нулями.
PSRAD mm,mm/m64
PSRAW mm,mm/m64
Арифметический сдвиг вправо упакованных двойных (учетверенных) знаковых слов операнда назначения на количество бит, указанных в операнде-источнике, с заполнением младших бит битами знаковых разрядов.
PSRLD mm,mm/m64
PSRLQ mm,mm/m64
PSRLW mm,mm/m64
Логический сдвиг вправо упакованных слов (двойных, учетверенных) операнда назначения на количество бит, указанных в операнде-источнике, с заполнением старших бит нулями.
PSUBB mm,mm/m64
PSUBW mm,mm/m64
PSUBD mm,mm/m64
Вычитание упакованных байт (слов или двойных слов) без насыщения (с циклическим антипереполнением).
PSUBSB mm,mm/m64
PSUBSW mm,mm/m64
Вычитание упакованных знаковых байт (слов) с насыщением.
PSUBUSB mm,mm/m64
PSUBUSW mm,mm/m64
Вычитание упакованных беззнаковых байт (слов) с насыщением.
PUNPCKHBW mm,mm/m64 Чередование в регистре назначения байт старшей половины операнда-источника с байтами старшей половины операнда назначения.
PUNPCKHWD mm,mm/m64 Чередование в регистре назначения слов старшей половины операнда-источника со словами старшей половины операнда назначения.
PUNPCKHDQ mm,mm/m64 Чередование в регистре назначения двойного слова старшей половины операнда-источника с двойным словом старшей половины операнда назначения.
PUNPCKLBW mm,mm/m64 Чередование в регистре назначения байт младшей половины операнда-источника с байтами младшей половины операнда назначения.
PUNPCKLWD mm,mm/m64 Чередование в регистре назначения слов младшей половины операнда-источника со словами младшей половины операнда назначения.
PUNPCKLDQ mm,mm/m64 Чередование в регистре назначения двойного слова младшей половины операнда-источника с двойным словом младшей половины операнда назначения.
PXOR mm,mm/m64 Исключающее "ИЛИ".

60 Мы пользуемся несколько устаревшим названием. Правильнее было бы это назвать числовым процессором.