WikiDer > Язык программирования низкого уровня
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
А язык программирования низкого уровня это язык программирования что дает мало или нет абстракция с компьютера архитектура набора команд- команды или функции на языке соответствуют инструкциям процессора. Обычно это относится либо к Машинный код или язык ассемблера. Из-за низкой (отсюда и самого слова) абстракции между языком и машинным языком низкоуровневые языки иногда описываются как «близкие к оборудованию». Программы, написанные на языках низкого уровня, как правило, относительно непереносной, поскольку он оптимизирован для определенного типа системной архитектуры.
Низкоуровневые языки могут преобразовываться в машинный код без компилятора или интерпретатора - языки программирования второго поколения используйте более простой процессор, называемый ассемблер - и полученный код запускается непосредственно на процессоре. Программу, написанную на языке низкого уровня, можно заставить работать очень быстро, с небольшим объем памяти. Эквивалентная программа в язык высокого уровня может быть менее эффективным и использовать больше памяти. Языки низкого уровня просты, но считаются сложными в использовании из-за многочисленных технических деталей, которые программист должен помнить. Для сравнения: язык программирования высокого уровня изолирует семантику выполнения компьютерной архитектуры от спецификации программы, что упрощает разработку.
Машинный код
Машинный код это единственный язык, который компьютер может обрабатывать напрямую без предварительного преобразования. В настоящее время программисты почти никогда не пишут программы непосредственно в машинном коде, потому что это требует внимания ко многим деталям, которые язык высокого уровня обрабатывает автоматически. Более того, он требует запоминания или поиска числовых кодов для каждой инструкции, и его чрезвычайно трудно изменить.
Истинный Машинный код это поток сырых, обычно двоичный, данные. Программист, кодирующий "машинный код", обычно кодирует инструкции и данные в более удобочитаемой форме, например десятичный, восьмеричный, или же шестнадцатеричный который переводится во внутренний формат программой, называемой грузчик или переключился в память компьютера из Передняя панель.
Хотя мало программ написано на машинном языке, программисты часто становятся искусными в чтении, работая с дампы керна или отладка с лицевой панели.
Пример: функция в шестнадцатеричном представлении 32-битной x86 машинный код для расчета пth Число Фибоначчи:
8B542408 83FA0077 06B80000 0000C383FA027706 B8010000 00C353BB 01000000B9010000 008D0419 83FA0376 078BD989C14AEBF1 5BC3
язык ассемблера
Языки второго поколения предоставляют один уровень абстракции поверх машинного кода. В первые дни программирования на таких компьютерах, как TX-0 и PDP-1, первое, что сделали хакеры из Массачусетского технологического института, - это написали ассемблеры.[1]язык ассемблера мало семантика или формальная спецификация, являющаяся лишь отображением удобочитаемых символов, включая символьные адреса, на коды операций, адреса, числовые константы, струны и так далее. Обычно один машинная инструкция представлен в виде одной строки ассемблерного кода. Сборщики производят объектные файлы это может ссылка на сайт с другими объектными файлами или быть загружен самостоятельно.
Большинство сборщиков предоставляют макросы для генерации общих последовательностей инструкций.
Пример: то же самое Число Фибоначчи калькулятор, как указано выше, но на языке ассемблера x86-64 с использованием Синтаксис AT&T:
_fib: движение $1, % eax.fib_loop: cmpl $1, % edi jbe .fib_done движение % eax, % ecx добавить % ebx, % eax движение % ecx, % ebx subl $1, % edi jmp .fib_loop.fib_done: Ret
В этом примере кода аппаратные особенности процессора x86-64 (его регистры) называются и управляются напрямую. Функция загружает свой ввод из % edi в соответствии с Система V ABI и выполняет свои вычисления, манипулируя значениями в EAX, EBX, и ECX регистрируется до завершения и возвращается. Обратите внимание, что в этом ассемблере нет концепции возврата значения. Результат сохранен в EAX зарегистрироваться, RET просто перемещает обработку кода в место кода, хранящееся в стеке (обычно это инструкция сразу после той, которая вызвала эту функцию), и автор вызывающего кода должен знать, что эта функция сохраняет свой результат в EAX и получить его оттуда. язык ассемблера x86-64 не устанавливает стандарта для возврата значений из функции (и поэтому фактически не имеет понятия функции); вызывающий код проверяет состояние после возврата из процедуры, если ему нужно извлечь значение.
Сравните это с той же функцией в C:
беззнаковый выдумать(беззнаковый п) { если (!п) вернуть 0; еще если (п <= 2) вернуть 1; еще { беззнаковый а, c; за (а = c = 1; ; --п) { c += а; если (п <= 2) вернуть c; а = c - а; } }}
Этот код очень похож по структуре на пример на языке ассемблера, но есть существенные различия с точки зрения абстракции:
- Вход (параметр п) - это абстракция, которая не указывает место хранения на оборудовании. На практике компилятор C следует одному из многих возможных соглашения о вызовах чтобы определить место хранения ввода.
- Версия на языке ассемблера загружает входной параметр из стека в регистр и на каждой итерации цикла уменьшает значение в регистре, никогда не изменяя значение в ячейке памяти в стеке. Компилятор C может загрузить параметр в регистр и сделать то же самое или обновить значение везде, где оно хранится. Какой из них он выбирает, это решение о реализации, полностью скрытое от автора кода (и одно без побочные эффекты, благодаря стандартам языка C).
- Локальные переменные a, b и c являются абстракциями, которые не определяют какое-либо конкретное место хранения на оборудовании. Компилятор C решает, как на самом деле хранить их для целевой архитектуры.
- Функция возврата указывает значение, которое нужно вернуть, но не указывает как он возвращен. Компилятор C для любой конкретной архитектуры реализует стандарт механизм возврата значения. Компиляторы для архитектуры x86 обычно (но не всегда) используют регистр EAX для возврата значения, как в примере на языке ассемблера (автор примера на языке ассемблер имеет выбранный чтобы скопировать соглашение C, но язык ассемблера этого не требует).
Эти абстракции делают код C компилируемым без изменений на любой архитектуре, для которой был написан компилятор C. Код языка ассемблера x86 специфичен для архитектуры x86.
Низкоуровневое программирование на языках высокого уровня
В конце 1960-х гг. языки высокого уровня такие как PL / S, Блаженство, BCPL, расширенный АЛГОЛ (за Большие системы Берроуза) и C включает некоторую степень доступа к функциям программирования низкого уровня. Один из способов для этого - Встроенная сборка, в котором код сборки встроен в язык высокого уровня, поддерживающий эту функцию. Некоторые из этих языков также позволяют директивы оптимизации компилятора чтобы настроить способ использования компилятором архитектуры целевого процессора.
Рекомендации
- ^ Леви, Стивен (1994). Хакеры: Герои компьютерной революции. Книги пингвинов. п. 32. ISBN 0-14-100051-1.