252 56 191KB
Russian Pages 9
О. А. Плисс, К. Д. Волошин
.
УСТРАНЕНИЕ ЛОКАЛЬНЫХ GOTO Введение Некоторые из языков программирования придерживаются доктрины радикального устранения неструктурных операторов [1], в том числе и операторов безусловных локальных переходов (GOTO). При конвертации программ в такие языки возникает проблема моделирования неструктурных операторов посредством структурных. При этом обычно требуется сохранить структуру программы возможно более близкой к исходной. К сожалению, операторы GOTO способны интерферировать с содержащимися в исходной программе структурными конструкциями (блоками, условными и циклическими операторами, операторами выбора по метке). Логика работы таких операторов оказывается нарушенной, их невозможно сохранить в прежнем виде. Нашей целью является устранение всех операторов GOTO и сохранение максимально возможного числа структурных операторов. Для простоты будем предполагать, что все структурные операторы входного языка могут быть прямо транслированы в соответствующие структурные операторы выходного языка. Например, в качестве входного языка можно рассматривать Си [2], а в качестве выходного — Java [3]. Тем не менее предлагаемый алгоритм с минимальными вариациями применим для большинства современных языков, в том числе не столь синтаксически близких. Сущность алгоритма В каждый момент времени алгоритм имеет дело ровно с одной программной единицей (подпрограммой, процедурой, функцией). Прежде всего нужно определить, какие из структурных операторов интерферируют с локальными GOTO. Затем эти операторы должны быть сведены к низкоуровневым операторам условных и безусловных переходов. Наконец, низкоуровневые операторы моделируются посредством структурных операторов.
.
© О. А. Плисс, К. Д. Волошин, 2000
Выявление поврежденных структурных операторов Структура управления интерферирует с оператором перехода, если при переходе поток управления начинается вне данной структуры, а заканчивается внутри одного из вложенных в нее блоков. Будем называть такие структуры управления поврежденными. Для обнаружения поврежденных структур можно воспользоваться следующим алгоритмом. Предварительно каждую структурную конструкцию необходимо снабдить парой флагов — Path и Damaged. Сначала все такие флаги сброшены. Кроме этого каждая такая конструкция должна содержать информацию о минимальной конструкции, ее объемлющей. Исполнение алгоритма состоит в поочередном анализе процедур исходной программы. В рамках каждой процедуры перебираются все операторы перехода GOTO. Для каждого такого оператора строится путь наверх по минимальным объемлющим структурам до самой внешней. У всех структур из этого пути устанавливается флаг Path. Далее рассматривается целевая метка текущего оператора GOTO. Для нее также строится путь наверх, но лишь до первой структуры с установленным флагом Path (эта структура частью пути не считается). Все структуры из этого пути помечаются как Damaged. После этого сбрасываются ранее установленные флаги Path и рассматривается следующий оператор GOTO. В результате проведения такого анализа поврежденными окажутся те и только те структуры, у которых флаг Damaged установлен. Например, в следующей программе комментариями /*Damaged*/ отмечены поврежденные структурные операторы, а на поясняющем рисунке показаны пути наверх от оператора GOTO и от соответствующей ему метки перехода (рис. 1).
{ while( … ) /* Damaged */ { if( … ) /* Damaged */ { Label : } } switch( … ) { case …: goto Label; }
while if Label:
switch goto
} Рис. 1. Выявление поврежденных операторов.
Редукция поврежденных структурных операторов Поврежденные структурные операторы необходимо свести к низкоуровневым операторам переходов. Низкоуровневые операторы переходов состоят из безусловных (GOTO) и условных (COND) операторов переходов. При этом подразумевается, что логика работы условного оператора перехода COND(Условие,Метка) эквивалентна IF(Условие) GOTO Метка. В качестве примера рассмотрим сведение к низкоуровневым переходам оператора цикла FOR: for ( int a = 1; a < 6; a++ )
{ ... }
В результате сведения получим int a = 1; LoopStart : if ( ! (a < 6) ) …… a++; goto LoopStart; LoopEnd :
goto LoopEnd;
Аналогично редуцируются и остальные виды структурных конструкций. В результате такой деятельности каждая пара (”goto ;”, ”:”) в программе станет удовлетворять следующему условию: Пусть метка встречается среди набора операторов (в том числе и структурных) в некотором блоке. Тогда соответствующий оператор перехода либо сам окажется в том же наборе операторов, либо будет текстуально содержаться в одном из структурных операторов этого набора. Моделирование низкоуровневых переходов посредством структурных операторов Для каждого из операторов GOTO нужно определить его область действия. Будем считать, что областью действия данного оператора является наименьший объемлющий блок, текстуально содержащий сам оператор перехода и описание соответствующей метки. В пределах каждой из областей действия все метки переходов нумеруются (будем считать, что те из них, которые не используются в операторах переходов, устранены). При этом один из номеров должен быть зарезервирован для обозначения незаданного адреса перехода. Заметим, что между двумя такими метками может находиться только линейный фрагмент программы, т. е. фрагмент, не содержащий в себе структур управления либо содержащий их целиком. Все не удовлетворяющие этому условию структуры управления были редуцированы на этапе устранения поврежденных структур. Переходы моделируются с помощью оператора выбора по метке, вложенного в объемлющий оператор цикла. В качестве меток используются номера получателей переходов, в качестве ветвей — соответствующие линейные фрагменты программы. При этом
сохраняется естественный порядок расположения линейных фрагментов в теле исходной программы. Будем называть такую конструкцию диспетчером переходов. Каждый диспетчер локален в соответствующем блоке. Конкретный вид проекции диспетчера переходов и самих переходов в целевой язык определяется его операторами выбора по метке и цикла. В разных целевых языках эти средства существенно варьируются. Проекции в язык Java В языке Java, следующем традициям языка Си, но не содержащем операторов локальных переходов, диспетчер имеет следующий вид: for ( int GotoAddr = 1; GotoAddr != 0; ) { const int Tmp = GotoAddr; GotoAddr = 0; Dispatch: switch( Tmp ) { case 1: Фрагмент1; ... case N: ФрагментN; } }
При этом оператор GOTO переходит в GotoAddr = ; break Dispatch;
Здесь существенно используется возможность указать при операторе BREAK конструкцию, которая должна быть завершена. Операторы GOTO могут быть вложены в сохранившиеся структурные операторы (в том числе цикла и выбора по метке). Возможная альтернатива Существует другой подход к устранению локальных GOTO. Его можно описать на примере обработки одного оператора перехода. В процессе работы алгоритма сначала происходит пошаговое движение оператора GOTO (goto-movement). Назовем содержащим блоком тот блок, одним из операторов которого, на данном шаге, является рассматриваемый оператор перехода. На каждом шаге оператор GOTO либо выносится из содержащего блока в его объемлющий блок, либо вносится в один из блоков, текстуально вложенных в содержащий блок, либо переносится на другое место в своем блоке. По окончании этих передвижений оператор перехода оказывается непосредственно перед его целевой меткой, после чего он может быть просто удален. В результате подобных перемещений сохраняются все существующие программные конструкции, но при каждом перемещении они объединяются в попутно создаваемые новые структуры. Также иногда добавляются служебные переменные, выступающие в роли управляющих флагов. Можно рассмотреть следующий простейший случай работы предложенного алгоритма (рис. 2). stmt_1; if ( cond ) goto L_1; stmt_2; ... L_1: stmt_n;
stmt_1; if ( ! cond ) { stmt_2; ... } L_1: stmt_n;
Рис. 2. Простейший случай работы предложенного алгоритма.
К сожалению, не все случаи применения данного алгоритма ведут к столь же красивым результатам. Подробнее о таких преобразованиях и их оптимизациях можно прочесть в статье [4].
В каком-то смысле этот подход противоположен предыдущему. Действительно, предыдущий подход направлен на разрушение существующих структур операторов, а этот стремится объединить исходные операторы в более сложные структуры. Более того, если мы возьмем в качестве исходной программу, не содержащую операторов GOTO, произведем в ней редукцию (сведение к низкоуровневым операторам переходов) нескольких произвольно выбранных структурных конструкций и к полученной программе применим данный алгоритм, то он попытается привести ее к исходному виду. Благодаря этому в будущем может оказаться интересным сравнить результаты применения рассмотренных подходов. Также можно попытаться комбинировать эти подходы для улучшения внешнего вида и повышения читаемости получаемых результатов. Заключение В данной работе рассмотрен способ моделирования операторов перехода средствами структурных конструкций. Предложенный алгоритм осуществляет частичную реструктуризацию исходной программы с последующим моделированием операторов переходов с помощью диспетчеров. Дополнительным условием при трансляции ставится требование сходства исходной и получаемой программ. В качестве примера показан способ трансляции из Си в Java. Тем не менее предложенный алгоритм с незначительными изменениями применим также для большинства современных языков программирования. Если из алгоритма исключить моделирование низкоуровневых пе-
реходов посредством структурных операторов, то он может применяться для преобразования программ, написанных на Си. В этом случае его действие ограничит использование операторов GOTO переходами лишь в объемлющие блоки. Подобный стиль программирования является предпочтительным по сравнению с использованием операторов перехода безо всяких ограничений. Следует отметить, что при отказе от использования оператора GOTO возникают издержки в производительности. Однако подобные издержки неизбежны, что связано с необходимостью эмулировать механизм переходов. В результате применения описанного алгоритма императивная часть исходной программы станет строго структурированной. Автоматический анализ таких программ проводить значительно легче, существенно упрощается написание их анализаторов. Таким образом, предложенный алгоритм может стать необходимой составной частью любого транслятора. Указатель литературы 1. 2. 3. 4.
Dijkstra E. W. Go to statement considered harmful // Comm. ACM. 1968. Vol. 11. N 3. P. 147–148. Kernighan B.W., Ritchie D.M. The C Programming Language. Englewood Cliffs, New Jersey: Prentice-Hall, 1978. 274 p. Gosling J., Joy B., Steele G. The Java Language Specification. Reading: Addison-Wesley, 1996. 825 p. Erosa A., Hendren L. Taming control flow: a structured approach to eliminating Goto statements // Proc. of the 1994 IEEE International Conference on Computer Languages. IEEE Computer Society, 1994. P. 229–240.