Организация и основные характеристики памяти компьютера. Ячейки памяти, порты и регистры

За последнюю неделю дважды объяснял людям как организована работа с памятью в х86, с целью чтобы не объяснять в третий раз написал эту статью.

И так, чтобы понять организацию памяти от вас потребуется знания некоторых базовых понятий, таких как регистры, стек и тд. Я по ходу попробую объяснить и это на пальцах, но очень кратко потому что это не тема для этой статьи. Итак начнем.

Как известно программист, когда пишет программы работает не с физическим адресом, а только с логическим. И то если он программирует на ассемблере. В том же Си ячейки памяти от программиста уже скрыты указателями, для его же удобства, но если грубо говорить указатель это другое представление логического адреса памяти, а в Java и указателей нет, совсем плохой язык. Однако грамотному программисту не помешают знания о том как организована память хотя бы на общем уровне. Меня вообще очень огорчают программисты, которые не знают как работает машина, обычно это программисты Java и прочие php-парни, с квалификацией ниже плинтуса.

Так ладно, хватит о печальном, переходим к делу.
Рассмотрим адресное пространство программного режима 32 битного процессора (для 64 бит все по аналогии)
Адресное пространство этого режима будет состоять из 2^32 ячеек памяти пронумерованных от 0 и до 2^32-1.
Программист работает с этой памятью, если ему нужно определить переменную, он просто говорит ячейка памяти с адресом таким-то будет содержать такой-то тип данных, при этом сам програмист может и не знать какой номер у этой ячейки он просто напишет что-то вроде:
int data = 10;
компьютер поймет это так: нужно взять какую-то ячейку с номером стопицот и поместить в нее цело число 10. При том про адрес ячейки 18894 вы и не узнаете, он от вас будет скрыт.

Все бы хорошо, но возникает вопрос, а как компьютер ищет эту ячейку памяти, ведь память у нас может быть разная:
3 уровень кэша
2 уровень кэша
1 уровень кэша
основная память
жесткий диск

Это все разные памяти, но компьютер легко находит в какой из них лежит наша переменная int data.
Этот вопрос решается операционной системой совместно с процессором.
Вся дальнейшая статья будет посвящена разбору этого метода.

Архитектура х86 поддерживает стек.

Стек это непрерывная область оперативной памяти организованная по принципу стопки тарелок, вы не можете брать тарелки из середины стопки, можете только брать верхнюю и класть тарелку вы тоже можете только на верх стопки.
В процессоре для работы со стеком организованны специальные машинные коды, ассемблерные мнемоники которых выглядят так:

Push operand
помещает операнд в стек

Pop operand
изымает из вершины стека значение и помещает его в свой операнд

Стек в памяти растет сверху вниз, это значит что при добавлении значения в него адрес вершины стека уменьшается, а когда вы извлекаете из него, то адрес вершины стека увеличивается.

Теперь кратко рассмотрим что такое регистры.
Это ячейки памяти в самом процессоре. Это самый быстрый и самый дорогой тип памяти, когда процессор совершает какие-то операции со значением или с памятью, он берет эти значения непосредственно из регистров.
В процессоре есть несколько наборов логик, каждая из которых имеет свои машинные коды и свои наборы регистров.
Basic program registers (Основные программные регистры) Эти регистры используются всеми программами с их помощью выполняется обработка целочисленных данных.
Floating Point Unit registers (FPU) Эти регистры работают с данными представленными в формате с плавающей точкой.
Еще есть MMX и XMM registers эти регистры используются тогда, когда вам надо выполнить одну инструкцию над большим количеством операндов.

Рассмотрим подробнее основные программные регистры. К ним относятся восемь 32 битных регистров общего назначения: EAX, EBX, ECX, EDX, EBP, ESI, EDI, ESP
Для того чтобы поместить в регистр данные, или для того чтобы изъять из регистра в ячейку памяти данные используется команда mov:

Mov eax, 10
загружает число 10 в регистр eax.

Mov data, ebx
копирует число, содержащееся в регистре ebx в ячейку памяти data.

Регистр ESP содержит адрес вершины стека.
Кроме регистров общего назначения, к основным программным регистрам относят шесть 16битных сегментных регистров: CS, DS, SS, ES, FS, GS, EFLAGS, EIP
EFLAGS показывает биты, так называемые флаги, которые отражают состояние процессора или характеризуют ход выполнения предыдущих команд.
В регистре EIP содержится адрес следующей команды, которая будет выполнятся процессором.
Я не буду расписывать регистры FPU, так как они нам не понадобятся. Итак наше небольшое отступление про регистры и стек закончилось переходим обратно к организации памяти.

Как вы помните целью статьи является рассказ про преобразование логической памяти в физическую, на самом деле есть еще промежуточный этап и полная цепочка выглядит так:

Логический адрес --> Линейный (виртуальный)--> Физический

Все линейное адресное пространство разбито на сегменты. Адресное пространство каждого процесса имеет по крайней мере три сегмента:
Сегмент кода. (содержит команды из нашей программы, которые будут исполнятся.)
Сегмент данных. (Содержит данные, то бишь переменные)
Сегмент стека, про который я писал выше.

Линейный адрес вычисляется по формуле:

линейный адрес=Базовый адрес сегмента(на картинке это начало сегмента) + смещение

Сегмент кода

Базовый адрес сегмента кода берется из регистра CS. Значение смещения для сегмента кода берется из регистра EIP, в котором хранится адрес инструкции, после исполнения которой, значение EIP увеличивается на размер этой команды. Если команда занимает 4 байта, то значение EIP увеличивается на 4 байта и будет указывать уже на следующую инструкцию. Все это делается автоматически без участия программиста.
Сегментов кода может быть несколько в нашей памяти. В нашем случае он один.

Сегмент данных

Данные загружаются в регистры DS, ES, FS, GS
Это значит что сегментов данных может быть до 4х. На нашей картинке он один.
Смещение внутри сегмента данных задается как операнд команды. По дефолту используется сегмент на который указывает регистр DS. Для того чтобы войти в другой сегмент надо это непосредственно указать в команде префикса замены сегмента.

Сегмент стека

Используемый сегмент стека задается значением регистра SS.
Смещение внутри этого сегмента представлено регистром ESP, который указывает на вершину стека, как вы помните.
Сегменты в памяти могут друг друга перекрывать, мало того базовый адрес всех сегментов может совпадать например в нуле. Такой вырожденный случай называется линейным представлением памяти. В современных системах, память как правило так организована.

Теперь рассмотрим определение базовых адресов сегмента, я писал что они содержаться в регистрах SS, DS, CS, но это не совсем так, в них содержится некий 16 битный селектор, который указывает на некий дескриптор сегментов, в котором уже хранится необходимый адрес.

Так выглядит селектор, в тринадцати его битах содержится индекс дескриптора в таблице дескрипторов. Не хитро посчитать будет что 2^13 = 8192 это максимальное количество дескрипторов в таблице.
Вообще дескрипторных таблиц бывает два вида GDT и LDT Первая называется глобальная таблица дескрипторов, она в системе всегда только одна, ее начальный адрес, точнее адрес ее нулевого дескриптора хранится в 48 битном системном регистре GDTR. И с момента старта системы не меняется и в свопе не принимает участия.
А вот значения дескрипторов могут меняться. Если в селекторе бит TI равен нулю, тогда процессор просто идет в GDT ищет по индексу нужный дескриптор с помощью которого осуществляет доступ к этому сегменту.
Пока все просто было, но если TI равен 1 тогда это означает что использоваться будет LDT. Таблиц этих много, но использоваться в данный момент будет та селектор которой загружен в системный регистр LDTR, который в отличии от GDTR может меняться.
Индекс селектора указывает на дескриптор, который указывает уже не на базовый адрес сегмента, а на память в котором хранится локальная таблица дескрипторов, точнее ее нулевой элемент. Ну а дальше все так же как и с GDT. Таким образом во время работы локальные таблицы могут создаваться и уничтожаться по мере необходимости. LDT не могут содержать дескрипторы на другие LDT.
Итак мы знаем как процессор добирается до дескриптора, а что содержится в этом дескрипторе посмотрим на картинке:

Дескрипторы состоит из 8 байт.
Биты с 15-39 и 56-63 содержат линейный базовый адрес описываемым данным дескриптором сегмента. Напомню нашу формулу для нахождения линейного адреса:

линейный адрес = базовый адрес + смещение

С помощью такой нехитрой операции процессор может обращаться по нужному адресу линейной памяти.
Рассмотрим другие биты дескриптора, очень важным является Segment Limit или предел, он имеет 20битное значение от 0-15 и 48-51 бит. Предел задает размер сегмента. Для сегментов данных и кода доступными являются все адреса, расположенные в интервале:

[база; база+предел)

В зависимости от 55 G-бита(гранулярити), предел может измеряться в байтах при нулевом значении бита и тогда максимальный предел составит 1 мб, или в значении 1, предел измеряется страницами, каждая из которых равна 4кб. и максимальный размер такого сегмента будет 4Гб.
Для сегмента стека предел будет в интервале:

(база+предел; вершина]

Кстати интересно почему база и предел так рвано располагаются в дескрипторе. Дело в том что процессоры х86 развивались эволюционно и во времена 286х дескрипторы были по 8 бит всего, при этом старшие 2 байта были зарезервированы, ну а в последующих моделях процессоров с увеличением разрядности дескрипторы тоже выросли, но для сохранения обратной совместимости пришлось оставить структуру как есть.
Значение адреса «вершина» зависит от 54го D бита, если он равен 0, тогда вершина равна 0xFFF(64кб-1), если D бит равен 1, тогда вершина равна 0xFFFFFFFF (4Гб-1)
С 41-43 бит кодируется тип сегмента.
000 - сегмент данных, только считывание
001 - сегмент данных, считывание и запись
010 - сегмент стека, только считывание
011 - сегмент стека, считывание и запись
100 - сегмент кода, только выполнение
101- сегмент кода, считывание и выполнение
110 - подчиненный сегмент кода, только выполнение
111 - подчиненный сегмент кода, только выполнение и считывание

44 S бит если равен 1 тогда дескриптор описывает реальный сегмент оперативной памяти, иначе значение S бита равно 0.

Самым важным битом является 47-й P бит присутствия. Если бит равен 1 значит, что сегмент или локальная таблица дескрипторов загружена в оперативку, если этот бит равен 0, тогда это означает что данного сегмента в оперативке нет, он находится на жестком диске, случается прерывание, особый случай работы процессора запускается обработчик особого случая, который загружает нужный сегмент с жесткого диска в память, если P бит равен 0, тогда все поля дескриптора теряют смысл, и становятся свободными для сохранения в них служебной информации. После завершения работы обработчика, P бит устанавливается в значение 1, и производится повторное обращение к дескриптору, сегмент которого находится уже в памяти.

На этом заканчивается преобразование логического адреса в линейный, и я думаю на этом стоит прерваться. В следующий раз я расскажу вторую часть преобразования из линейного в физический.
А так же думаю стоит немного поговорить о передачи аргументов функции, и о размещении переменных в памяти, чтобы была какая-то связь с реальностью, потому размещение переменных в памяти это уже непосредственно, то с чем вам приходится сталкиваться в работе, а не просто какие-то теоретические измышления для системного программиста. Но без понимания, как устроена память невозможно понять как эти самые переменные хранятся в памяти.
В общем надеюсь было интересно и до новых встреч.

Ячейка памяти Память компьютера состоит из отдельных «частиц» битов, объединенных в группы (регистры) по 8 бит (байт). 1 байт элементарная единица памяти. Каждый байт имеет свой помер (адрес), и содержимое двоичный код. Когда процессор обрабатывает информацию, он находит по адресу в памяти нужную ячейку, читает из содержимое, выполняет необходимые действия и записывает результат в другую ячейку памяти. Ячейка памяти группа последовательных байтов внутренней памяти. Машинное слово содержимое ячейки памяти Разрядность ячейки памяти и размер машинного слова в битах равны разрядности процессора

Быстродействующее ЗУ, реализованное в виде электронной схемы. ОЗУ доступно для чтения и для записи информации. Именно в ОЗУ хранится выполняемая в текущий момент программа и необходимые для нее данные, в ОЗУ данные можно редактировать, удалять, добавлять. Это память временного хранения. ОЗУ хранит информацию лишь в течение сеанса работы с ЭВМ – после выключения ЭВМ из сети, данные, хранимые в ОЗУ, теряются безвозвратно. ОЗУ энергозависимое устройство. Емкость современных моделей колеблется от 512 до 1024 Мбайт. ОЗУ – оперативное ЗУ (RAM – random access memory - память с произвольным доступом).

ПЗУ – постоянное ЗУ (ROM – read only memory - память только для чтения). Во многих ЭВМ ПЗУ реализуется отдельной микросхемой, в которой при изготовлении помещаются основные команды, осуществляющие первоначальное взаимодействие аппаратного и программного обеспечения. Этот вид памяти доступен лишь для чтения. После выключения ЭВМ информация сохраняется. ПЗУ – энергонезависимое устройство. В ПЗУ находится часть операционной системы BIOS (Basic Input- Output System).

КЭШ-память – промежуточная память между ОЗУ и ПЗУ «Сache» - тайник, склад (англ. слово). Используется для увеличения быстродействия компьютера. «Секретность» КЭШа заключается в том, что он невидим для пользователя и данные, хранящиеся там, недоступны для прикладного программного обеспечения. Использование этого вида внутренней памяти сокращает число обращений к жесткому диску. Отсутствие кэш-памяти может существенно (20-30%) снизить общую производительность компьютера.

Энергонезависимая память (CMOS-память, Complementary Metal-Oxid-Semicondactor) Различные параметры конфигурации компьютера, например количество и тип дисковых накопителей, тип видеоадаптера, наличие сопроцессора и некоторые другие данные, хранятся в так называемой CMOS- памяти. Микросхема CMOS-памяти также содержит обыкновенные электронные часы. Благодаря ним в любой момент можно узнать текущую дату и время. Чтобы при отключении питания компьютера содержимое CMOS-памяти не стиралось, и часы продолжали отсчитывать время, микросхема CMOS- памяти питается от специальной маленькой батарейки или аккумулятора, которые также находятся на системной плате

Данные в ЭВМ - это наборы битов, байтов и записей, которые должны быть записаны в памяти машины.

В современных ЭВМ данные размещаются не только в оперативной, но и в долговременной памяти.

В долговременной памяти могут размещаться данные больших объемов, а также целые комплексы программ, используемых для управления работой ЭВМ и автоматизированных систем.

Как устроена память компьютера

Память компьютера лучше всего представить себе в виде последовательности ячеек. Количество информации в каждой ячейке – один байт.

Любая информация сохраняется в памяти компьютера в виде последовательности байтов. Байты (ячейки) памяти пронумерованы один за другим, причем номер первого от начала памяти байта приравнивается к нулю. Каждая конкретная информация, которая сохраняется в памяти, может занимать один или несколько байтов. Количество байтов, которые занимает та или иная информация в памяти, являются размером этой информации в байтах.

Например, целое плюсовое число от 0 до 2 8 -1=255 занимает 1 байт памяти. Для хранения целого плюсового числа от 2 8= 256 до 2 16 -1=65536 нужно уже два последовательных байта.

Основная задача при работе с памятью состоит в том, чтобы найти место в памяти, где находится необходимая информация.

Для того, чтобы найти человека в большом городе, необходимо знать его точный адрес. Так же, чтобы найти место той или иной информации в памяти, введено понятие адреса в памяти.

Например, если слово "информатика", которое состоит из 11 букв, занимает байты с номерами от 1234 до 1244 (всего 11 байтов), то адрес этого слова равняется 1234.

Чем больше объем памяти, тем больше файлов и программ она может вместить, тем больше задач можно развязать с помощью компьютера.

Чем же определяется объем доступной памяти компьютера или какое наибольшее число можно использовать для указания адреса?

Адрес, как и любая информация в компьютере, подается в двоичном виде. Значит, наибольшее значение адреса определяется количеством битов, которые используются для его двоичной подачи. В одном байте (8 битов) можно сохранять 2 8 (=256) чисел от 0 до 255, в двух байтах (16 битов) - 2 16 чисел от 0 до 65536, в четырех байтах (32 бита) – 2 32 чисел от 0 до 4294967295.

Виды памяти

Оперативная память

Оперативная память (ОЗУ или англ.RAM от Random Access Memory – память с произвольным доступом) – это быстро запоминающее устройство не очень большого объема, которое непосредственно связанное с процессором и предназначенное для записи, считывания и хранения выполняемых программ и данных, которые обрабатываются этими программами.

Оперативная память используется только для временного хранения данных и программ, так как, когда машина выключается то все, что находилось на ОЗУ, пропадает. Доступ к элементам оперативной памяти прямой – это значит, что каждый байт памяти имеет свой индивидуальный адрес.

Объем ОЗУ обычно составляет от 32 до 512 Мбайт. Для не сложных административных задач бывает достаточно и 32 Мбайт ОЗУ, но сложные задачи компьютерного дизайна могут потребовать от 512 Мбайт до 2 Гбайт ОЗУ.

Обычно ОЗУ исполняется из интегральных микросхем памяти SDRAM (синхронное динамическое ОЗУ). Каждый информационный бит в SDRAM запоминается в виде электрического заряда крохотного конденсатора, образованного в структуре полупроводникового кристалла. Из-за утечки токов такие конденсаторы быстро разряжаются и их периодически (примерно каждые 2 миллисекунды) подзаряжают специальные устройства. Этот процесс называется регенерацией памяти (Refresh Memory). Микросхемы SDRAM имеют емкость от 16 до 256 Мбит и более. Они устанавливаются в корпусе и собираются в модули памяти. Большинство современных компьютеров комплектуются модулями типа DIMM (Dual-In-line Memory Module - модуль памяти с двухрядным расположением микросхем). В компьютерных системах на самых современных процессорах используются

Высокоскоростные модули Rambus DRAM (RIMM) и DDR DRAM.

Сразу после включения компьютера начинают "тикать" электронные "часы" основной шины. Их импульсы расталкивают заспавшийся процессор, и тот может начинать работу. Но для работы процессора нужны команды.

Точнее говоря, нужны программы, потому что программы - это и есть упорядоченные наборы команд. Таким образом, где-то в компьютере должна быть заранее, заготовлена пусковая программа, а процессор в момент пробуждения должен твердо знать, где она лежит.

Хранить эту программу на каких-либо носителях информации нельзя, потому что в момент включения процессор ничего не знает ни о каких устройствах. Чтобы он о них узнал, ему тоже нужна какая-то программа, и мы возвращаемся к тому, с чего начали. Хранить ее в оперативной памяти тоже нельзя, потому что в ней в обесточенном состоянии ничего не хранится.

Выход здесь существует один-единственный. Такую программу надо создать аппаратными средствами. Для этого на материнской плате имеется специальная микросхема, которая называется постоянным запоминающим устройством - ПЗУ. Еще при производстве в нее "зашили" стандартный комплекс программ, с которых процессор должен начинать работу. Этот комплекс программ называется базовой системой ввода-вывода.

По конструкции микросхема ПЗУ отличается от микросхем оперативной памяти, но логически это те же самые ячейки, в которых записаны какие-то числа, разве что не стираемые при выключении питания. Каждая ячейка имеет свой адрес.

После запуска процессор обращается по фиксированному адресу (всегда одному и тому же), который указывает именно на ПЗУ. Отсюда и поступают первые данные и команды. Так начинается работа процессора, а вместе с ним и компьютера. На экране в этот момент мы видим белые символы на черном фоне.

Одной из первых исполняется подпрограмма, выполняющая самотестирование компьютера. Она так и называется: Тест при включении (по-английски - POST - Power-On Self Test). В ходе ее работы проверяется многое, но на экране мы видим только, как мелькают цифры, соответствующие проверенным ячейкам оперативной памяти.

Программных средств BIOS достаточно, чтобы сделать первичные проверки и подключить стандартные устройства, такие как клавиатура и монитор. Слово стандартные мы выделили специально. Дело в том, что монитор и клавиатура у вас могут быть очень даже нестандартными. Но на данном этапе это не имеет значения - просто компьютер пока рассматривает их как стандартные. Ему еще не ведомы все их свойства, и он полагает, что клавиатура и монитор у нас такие, какие были в ходу двадцать лет назад, во времена первых компьютеров. Этим обеспечивается гарантия того, что вы хоть что-то увидите на экране, вне зависимости от той модели монитора, какая имеется в вашем распоряжении. BIOS предполагает, что монитор у нас черно-белый - именно поэтому первые сообщения на экранет проходят в черно-белом режиме.

Однако долго работать лишь только со стандартными устройствами компьютер не может. Ему пора бы узнать о том, что у него есть на самом деле. Истинная информация об устройствах компьютера записана на жестком диске, но и его еще надо научиться читать. У каждого человека может быть свой жесткий уникальный диск, не похожий на другие. Спрашивается, откуда программы BIOS узнают, как работать именно с вашим жестким диском?

Для этого на материнской плате есть еще одна микросхема - CMOS-память. В ней сохраняются настройки, необходимые для работы программ BIOS. В частности, здесь хранятся текущая дата и время, параметры жестких дисков и некоторых других устройств. Эта память не может быть ни оперативной (иначе она стиралась бы), ни постоянной (иначе в нее нельзя было бы вводить данные с клавиатуры). Она сделана энергонезависимой и постоянно подпитывается от небольшой аккумуляторной батарейки, тоже размещенной на материнской плате. Заряда этой батарейки хватает, чтобы компьютер не потерял настройки, даже если его не включать несколько лет.

Настройки CMOS, в частности, необходимы для задания системной даты и системного времени, при установке или замене жестких дисков, а также при выходе из большинства аварийных ситуаций. Настройкой BIOS можно, например, задать пароль, благодаря которому посторонний человек не сможет запустить компьютер. Впрочем, эта защита эффективна только от очень маленьких детей.

Для изменения настроек, хранящихся в CMOS-памяти, в ПЗУ содержится специальная программа - SETUP. Чтобы ее запустить, надо в самый первый момент после запуска компьютера нажать и удерживать клавишу DELETE. Навигацию в системе меню программы SETUP выполняют с помощью клавиш управления курсором. Нужные пункты меню выбирают клавишей ENTER, а возврат в меню верхнего уровня - клавишей ESC. Для изменения установленных значений служат клавиши Page Up и Page Down.

Кэш-память

Кэш-память - это высокоскоростная память произвольного доступа, используемая процессором компьютера для временного хранения информации. Она увеличивает производительность, поскольку хранит наиболее часто используемые данные и команды "ближе" к процессору, откуда их можно быстрей получить.

Кэш-память напрямую влияет на скорость вычислений и помогает процессору работать с более равномерной загрузкой. Представьте себе массив информации, используемой в вашем офисе. Небольшие объемы информации, необходимой в первую очередь, скажем список телефонов подразделений, висят на стене над вашим столом. Точно так же вы храните под рукой информацию по текущим проектам. Реже используемые справочники, к примеру, городская телефонная книга, лежат на полке, рядом с рабочим столом. Литература, к которой вы обращаетесь совсем редко, занимает полки книжного шкафа. Компьютеры хранят данные в аналогичной иерархии. Когда приложение начинает работать, данные и команды переносятся с медленного жесткого диска в оперативную память произвольного доступа, откуда процессор может быстро их получить. Оперативная память играет роль КЭШа для жесткого диска. Для достаточно быстрых компьютеров необходимо обеспечить быстрый доступ к оперативной памяти, иначе микропроцессор будет простаивать, и быстродействие компьютера уменьшится. Для этого такие компьютеры могут оснащаться кэш-памятью, т.е. "сверхоперативной" памятью относительно небольшого объема (обычно от 64 до 256 Кбайт), в которой хранятся наиболее часто используемые участки оперативной памяти. Кэш-память располагается "между" микропроцессором и оперативной памятью, и при обращении микропроцессора к памяти сначала производится поиск нужных данных в кэш-памяти. Поскольку время доступа к кэш-памяти в несколько раз меньше, чем к обычной памяти, а в большинстве случаев необходимые микропроцессору данные содержаться в кэш-памяти, среднее время доступа к памяти уменьшается. Для компьютеров на основе intel-80386dx или 80486sx размер кэш-памяти в 64 кбайт является удовлетворительным, 128 кбайт - вполне достаточным. Компьютеры на основе intel-80486dx и dx2 обычно оснащаются кэш-памятью емкостью 256 Кбайт.

Адресация операндов в командах программы может быть:

l непосредственной;

l косвенной;

l ассоциативной;

l неявной.

Непосредственная адресация заключается в указании в команде самого значения операнда, а не его адреса.

Прямая адресация состоит в указании в команде непосредственно абсолютного или исполнительного адреса операнда. Прямая адресация регистра состоит в указании его имени.

Косвенная адресация имеет в виду указание в команде регистра или адреса ячейки памяти, в которых находятся абсолютный, исполнительный адрес операнда или их составляющие.

Ассоциативная адресация - указание в команде не адреса, а идентифицирующего содержательного признака операнда, подлежащего выборке (применяется в ассоциативных запоминающих устройствах).

Неявная адресация - адреса операнда в команде не указано, но он подразумевается кодом операции.

Адресация ячеек основной памяти ПК имеет две важных разновидности: относительную и стековую.

Относительная адресация

Абсолютный (A инд) адрес формируется как сумма адресов исполнительного (Aисп) и сегментного (A сегм):

A абс = A сегм + A исп.

A сегм - 20-битовый начальный адрес сегмента , который является увеличенным в 16 раз (сдвинутым на 4 бита влево) 16-битовым адресом сегмента A" сегм, хранящемся в одном из 16-битовых сегментных регистров. Начальный адрес сегмента в таком варианте всегда кратен 16 байтам, и он может быть полностью идентифицирован значением A" сегм (сегмент всегда состоит из целого числа параграфов, а параграф равен 16, то есть:

A сегм = 16 · A" сегм = A" сегм 0000.

16-битовый исполнительный адрес может в ПК представлять собой сумму 3-х адресов:

A исп = A смещ [+A баз ][+A инд ]

l A смещ - 16-битовый адрес смещения относительно начала сегмента (или относительно базы, если есть A баз);

l A баз - 16-битовый адрес смещения базы адреса операнда относительно начала сегмента;

l A инд - адрес индекса (или просто индекс) - дополнительная составляющая адреса операнда, использующаяся часто при программировании циклических процессов с массивами и таблицами. Индекс должен быть непосредственно задан в соответствующем регистре МПП.

При адресации данных могут использоваться все составляющие адреса:

A абс данных = A сегм + A исп = A сегм + A смещ [+A баз ][+A инд ]

A сегм = 16 A" сегм, A" сегм берется из регистра DS по умолчанию или из регистра ES, если это указано в программе. A баз и A инд берутся, соответственно, из регистров BX и индексных (SI или DI), а A смещ в явном или неявном виде указываются в программе.

При адресации команд программы могут использоваться только две составляющие адреса:

A абс команд = A сегм + A исп = A сегм + A смещ

A" сегм берется из регистра CS, а A смещ - из регистра IP.

Стековая адресация

В стековой памяти (стеке) доступ к ячейкам памяти не произвольный, а по принципу «последний записанный операнд первым считывается» (FILO).

A абс стека = A сегм + + A смещ

16-битовый адрес сегмента A" сегм берется из регистра SS, смещения относительно начала сегмента стека автоматически считываются из регистров BP (смещение базы стека - A баз) и SP (смещение активной ячейки стека, в которую записывается или из которой считывается информация, - «вершины стека» относительно базы - A смещ).

В защищенном (многопрограммном) режиме работы микропроцессора начальные адреса сегментов хранятся в таблицах дескрипторов и имеют длину 24 или 32 бита (в зависимости от типа МП) В сегментных регистрах в этом режиме хранятся селекторы, содержащие адресные ссылки на соответствующие таблицы дескрипторов.

Вопросы для самопроверки

1. Сформулируйте основные свойства алгоритма.

2. Рассмотрите способы записи алгоритма.

3. Приведите и поясните типовой состав машинных команд.

4. Рассмотрите возможные структуры машинных команд.

5. Поясните назначение системного и прикладного программного обеспечения.

6. Назовите основные режимы работы компьютеров и дайте им краткую характеристику.

7. Что такое прерывания работы программы и каково их назначение?

8. Назовите и поясните виды прерываний.

9. Рассмотрите последовательность действий машины при выполнении прерывания.

10. Назовите виды и особенности адресации ячеек памяти в ПК.

11. Напишите формулу для расчета абсолютного адреса данных.

12. Какие регистры микропроцессорной памяти используются для адресации данных?

13. Напишите формулу для расчета абсолютного адреса команды программы.

14. Какие регистры микропроцессорной памяти используются для адресации команд программы?

15. Напишите формулу для расчета адреса стека.

16. Какие регистры микропроцессорной памяти используются для адресации ячеек стековой памяти?

Глава 19.Элементы программирования на языке Ассемблер

После изучения главы студент должен знать:

· -назначение и области использования языка Ассемблера;

· -основные компоненты языка;

· -основные команды, директивы, модификаторы;

· -адресацию регистров МПП и ячеек памяти в ассемблере;

· -программирование процедур вывода информации на дисплей и ввода информации с клавиатуры;

· -структуру ассемблерной программы;

· -процедуры формирования программы формата EXE;

· -назначение, команды и варианты использования отладчика программ Debug.

Пользователь компьютера, равно как и прикладной программист, программы составляет, как правило, на машинно-независимом алгоритмическом языке высокого уровня (Basic, Pascal, FORTRAN, C, PROLOG и др.), однако иметь представление об основах программирования и на машинно-ориентированных языках грамотному пользователю весьма полезно для:

l лучшего понимания архитектуры ПК и более грамотного использования компьютеров; для разработки более рациональных структур алгоритмов и программ решения прикладных задач;

l возможности просмотра и корректировки исполняемых программ с расширениями EXE и COM, компилированных с любых языков высокого уровня, в случае утраты исходных программ (вызвав указанные программы в отладчик программ DEBUG и деассемблировав их, можно получить их отображение на языке Ассемблера);

l составления программ решения наиболее ответственных задач (машинная программа, подготовленная на машинно-ориентированном языке, обычно эффективнее (короче и быстрее на 30–60%) программ, полученных в результате трансляции с языков высокого уровня) и для реализации процедур, включаемых в основную программу в виде отдельных фрагментов в том случае, если они не могут быть реализованы ни на используемом языке высокого уровня.

Основные компоненты языка ассемблер

Алфавит языка

Алфавит языка составляют символы ASCII:

l буквы от А до Z (или от а до z, строчные и прописные буквы в ассемблере не различаются);

l цифры от 0 до 9;

l специальные символы: @, $, ?, ., _,–, +, *, ", “, ; ,: и др.

Из букв, цифр и символов: @, $, ?, .,_ формируются:

l простые сообщения: имена (идентификаторы) процедур (подпрограмм), переменных, директив, команд (метки), значения констант и переменных;

l составные сообщения: команды (операторы);

l директивы (псевдооператоры);

l модификаторы (операции).

Имена меток, переменных, идентификаторов могут быть длиной до 31 символа и начинаться должны обязательно не с цифры.

Константы (числа и строки)

Только целые числа

Различают:

l двоичные числа; заканчиваются буквой В;

l десятичные числа; без специального окончания или заканчиваются буквой D;

l шестнадцатеричные числа; заканчиваются буквой Н.

Для обозначения цифр 10, 11, 12, 13, 14, 15 в шестнадцатеричной системе счисления используются, соответственно, буквы A, B, C, D, E, F; но начинаться шестнадцатеричные числа должны обязательно с цифры, например: выражение F19Н - не число, а идентификатор, правильно число надо записать так: 0F19Н.

Запись отрицательных чисел:

l десятичные числа записываются обычным образом, просто со знаком: –32, –32D;

l двоичные числа записываются только в дополнительном модифицированном коде: –32D ® 11.100000B, –19D ® 11.01101B;

l шестнадцатеричные числа записываются только в дополнительном коде:

l –32D выглядит как 1.E0H, –119D - как 1.89H.

Строки (литералы)

Строки символов: включают в себя любые буквы, цифры и символы, но заключаются в кавычки: "ПК IBM PC с микропроцессором Pentium D ".

Команды (операторы)

Формат команды:

[Метка [:]] КОП [Операнд] [,Операнд] [;Комментарий].

Между элементами команды вставлены пробелы. Здесь и далее элементы, заключенные в квадратные скобки, необязательны.

КОП (Код ОПератора) - мнемокод команды (состоит из 2–6 букв). Может быть до 256 различных кодов (в ассемблере IBM PC их число изменяется в зависимости от типа МП).

Операнд - явно заданный адрес (прямой или косвенный); имя метки, переменной; само значение переменной; ассоциативный признак. Количество необходимых в команде операндов ассемблер узнает по КОП. В большинстве двухадресных команд присутствуют операнды приемника (dst - destination) и источника (src - source); источник не изменяет своего содержания, в приемнике 1-е число, участвующее в операции, заменяется результатом.

Общая структурная схема процессора

Принцип фон Неймана

Лекция 3

Принцип фон Неймана. АЛУ. Программа как последовательность кодов команд. Адрес ячейки памяти. Регистры процессора. Как процессор складывает два числа.

Большинство современных ЭВМ строится на базе принципов, сформулированных американским ученым, одним из отцов кибернетики Джоном фон Нейманом. Впервые эти принципы были опубликованы фон Нейманом в 1945 г. в его предложениях по машине EDVAC. Эта ЭВМ была одной из первых машин с хранимой программой, т.е. с программой, запомненной в памяти машины, а не считываемой с перфокарты или другого подобного устройства. В целом эти принципы сводятся к следующему:

1) Основными блоками фон-неймановской машины являются блок управления, арифметико-логическое устройство, память и устройство ввода-вывода.

2) Информация кодируется в двоичной форме и разделяется на единицы, называемые словами.

3) Алгоритм представляется в форме последовательности управляющих слов, которые определяют смысл операции. Эти управляющие слова называются командами. Совокупность команд, представляющая алгоритм, называется программой.

4) Программы и данные хранятся в одной и той же памяти. Разнотипные слова различаются по способу использования, но не по способу кодирования.

5) Устройство управления и арифметическое устройство обычно объединяются в одно, называемое центральным процессором. Они определяют действия, подлежащие выполнению, путем считывания команд из оперативной памяти. Обработка информации, предписанная алгоритмом, сводится к последовательному выполнению команд в порядке, однозначно определяемом программой.

Компьютеры, построенные на этих принципах, называются машинами фон‑Неймановского типа.

Процессор - центральная микросхема ЭВМ, осуществляющая операции по обработке информации и управляющая работой остальных устройств ЭВМ.

Процессор представляет собой микросхему с большим числом контактов, имеющую прямоугольную или квадратную форму и легко помещающуюся на ладони.

Изобретателем микропроцессора как схемы, в которую собрана практически вся основная электроника компьютера, стала американская фирма INTEL, выпустившая в 1970 году процессор 8008. С их появления и началась история ЭВМ четвертого поколения.

В своей работе процессор использует регистры - ячейки памяти, находящиеся внутри процессора. На рисунке приведена общая схема процессора.

Общая структурная схема процессора

Процессор разделен на две части:

операционное устройство (ОУ) и шинный интерфейс (ШИ) .

Назначение ОУ - выполнение команд, а ШИ подготавливает команды и данные для выполнения. ОУ содержит:

арифметико-логическое устройство (АЛУ) - "отвечает" за выполнение команд,

устройство управления (УУ) - осуществляет выборку команд из памяти, пересылку их на АЛУ и перемещение полученных результатов в требуемую ячейку памяти;

10 регистров - применяются при вычислениях.

Эти устройства обеспечивают выполнение команд, арифметические вычисления и логические операции.

Три элемента ШИ - блок управления шиной, очередь команд и сегментные регистры - осуществляют следующие функции:

передачу данных на ОУ, в память и на внешние устройства ввода/вывода ;

адресацию памяти с помощью четырех сегментных регистров ;

выборку команд, требуемых для выполнения, из памяти в очередь команд .

Компьютер имеет два типа внутренней памяти. Постоянная память (ПЗУ или ROM - read-only memory). Она представляет собой специальную микросхему, из которой возможно только чтение, так как данные в ней специальным образом "прожигаются" и не могут быть модифицированы. Ее основное назначение: поддержка процедур начальной загрузки, выполнение различных проверок и т.д. Для целей программирования наиболее важным элементом ПЗУ является BIOS (Basic Input/Output System) - базовая система ввода/вывода.

Память, с которой имеет дело программист, называется ОЗУ (RAM - random access memory) - оперативное запоминающее устройство. Ее содержимое доступно как для чтения, так и для записи. Здесь хранятся программы и данные во время работы компьютера.

Основным устройством обработки информации в ЭВМ является арифметико-логическое устройство (АЛУ). Его основой является электронная схема, составленная из большого числа транзисторов, называемая сумматором. Сумматором выполняются простейшие логические и арифметические операции над данными, представленными в виде двоичных кодов (нулей и единиц). К логическим операциям относятся логическое умножение (операция "И"), логическое сложение (операция "ИЛИ") и логическое отрицание (операция "НЕ"). Результатом операции логического умножения является 1, если все переменные, являющиеся исходными данными равны 1, и 0, если хотя бы одна из них равна 0. Вспоминая, что 1 моделируется электрическим сигналом, а 0 - отсутствием сигнала, можно сказать, что на выходе устройства будет электрический сигнал тогда и только тогда, когда сигнал будет иметься на каждом входе:

Результатом операции логического сложения является 0, если все исходные переменные равны нулю, и 1, если хотя бы одна из них равна 1. Результатом операции логического отрицания является 1, если на входе- 0, и 0, если на входе -1.

На основе этих трех операций можно производить арифметические действия над числами, представленными в виде нулей и единиц. Теоретической основой для этого являются законы, разработанные еще в 1847 году ирландским математиком Джорджем Булем, известные как Булева алгебра, в которой используются только два числа- 0 и 1. Ранее считалось, что эти работы Буля никому не нужны, и их автор подвергался насмешкам. Однако, в 1938 году американский инженер Клод Шеннон положил Булеву алгебру в основу теории электрических и электронных переключательных схем- сумматоров, создание которых и привело к появлению ЭВМ, способных автоматически производить арифметические вычисления.

Все остальные операции, производимые ЭВМ, сводятся к большому числу простейших арифметических и логических операций, аналогично тому, как операцию умножения можно свести к большому числу операций сложения.

В современных ЭВМ арифметико-логическое устройство объединяется с управляющими устройствами в единую схему - процессор .

В компьютерных системах работа с памятью основывается на очень простых концепциях. В принципе, все, что требуется от компьютерной памяти, - это сохранять один бит информации так, чтобы потом он мог быть извлечен оттуда.

Одним из основных элементов компьютера, позволяющим ему нормально функционировать, является память. Внутренняя память компьютера - это место хранения информации, с которой он работает. Внутренняя память компьютера является временным рабочим пространством; в отличие от нее внешняя память, такая как файл на дискете, предназначена для долговременного хранения информации. Информация во внутренней памяти не сохраняется при выключении питания.

Каждая ячейка памяти имеет адрес, который используется для ее нахождения. Адреса - это числа, начиная с нуля для первой ячейки, увеличивающиеся по направлению к последней ячейке памяти. Поскольку адреса - это те же числа, компьютер может использовать арифметические операции для вычисления адресов памяти.

Архитектура каждого компьютера накладывает собственные ограничения на величину адресов. Наибольший возможный адрес определяет объем адресного пространства компьютера или то, какой объем памяти он может использовать. Обычно компьютер использует память меньшего объема, чем допускается его возможностями адресации. Если архитектура компьютера предусматривает наибольшее адресное пространство, это накладывает суровые ограничения на возможности такого компьютера. Адреса в 8088 имеют длину 20 бит, следовательно, процессор позволяет адресовать два в двадцатой степени байта или 1024 К.