Что такое адаптивные системы управления. Адаптивные системы управления

Первый способ адаптивного управления, в котором используется адаптивное моделирование, имеет следующий принцип действия. С помощью адаптивного моделирования формируется модель управляемой системы, которая используется для определения ее входных сигналов, приводящих к необходимым сигналам: на ее выходе.

Затем эти входные сигналы управления подаются на вход действительной управляемой системы, в результате чего сигналы на ее выходе являются близкими к требуемым. Такой вид управления в некотором смысле не имеет обратной связи, НО в действительности петля обратной связи замыкается через адаптивный процесс.

Для иллюстрации этого метода рассмотрим систему регуляции кровяного давления, приведенную на рис. 11.3. Ее экспериментальные исследования проводились студентами Станфордского университета. Цель этих исследований - разработка системы управления с петлей обратной связи для регуляции кровяного давления пациента. В этом случае, как показано на рис. 11.3, входной сигнал управляемой системы - поток лекарства, а выходной сигнал - кровяное давление. Опыты проводились с собаками.

Для управления кровяным давлением животному вводят сильно действующее лекарство арфонад. Это лекарство влияет на естественную систему регуляции кровяного давления и приводит к состоянию, аналогичному продолжительному состоянию шока. При этом кровяное давление может упасть до нуля, вызвав у животного необратимые процессы. Чтобы предотвратить это явление, медленно, в течение многих часов, для повышения кровяного давления вводится стимулирующее мышцу лекарство норепинефрин; ЭВМ непрерывно фиксирует кровяное давление и регулирует дозу вводимого лекарства. Конечная цель этой работы - разработка адаптивных систем управления.

На рис. 11,4 приведены характерные динамические характеристики реакции среднего кровяного давления животных на изменения дозы вводимого лекарства. Форма кривой зависит от размеров, вида и особенно состояния животного.

Рис. 11.3. Система управления с замкнутой обратной связью для регуляции кровяного давления

Рис. 11.4. Характерные отклики среднего кровяного давления на скачкообразные изменения дозы вводимого стимулятора

Животное с хорошим состоянием здоровья реагирует на небольшое увеличение дозы лекарства установлением в конечном итоге первоначального уровня кровяного давления. Больные животные не в состоянии компенсировать даже умеренное увеличение дозы, и, следовательно, кровяное давление возрастает известным образом и уровень его остается высоким. У животных наблюдается большой разброс характеристик реакции на стимулятор мышечной деятельности. Обычно время начала реакции животного составляет 10... 20 с, а кровяное давление устанавливается в течение 50... 100 с.

Приведенная на рис. 11.3. система не является, как это может показаться, обычной системой управления с обратной связью. Динамическая характеристика реакции животного (включая задержку до начала реакции) часто имеет слишком большой разброс, чтобы ею управлять с использованием обычной обратной связи.

На рис. 11.5 приведена структурная схема адаптивной системы управления. Описанные ниже функции, выполняемые устройством вычисления сигнала управления и адаптивной моделью, а также функции обработки данных, не приведенные на рис. 11.5, но необходимые для лабораторной установки, реализованы с помощью мини-ЭВМ.

Рис. 11.5. Структурная схема адаптивной модели для системы управления, показанной на рис. 11.3

Буферное устройство, в котором запоминаются и хранятся значения каждого отсчета на время интервала между отсчетами, является частью электронной системы сопряжения ЭВМ и сделанного из соленоида клапана для ввода лекарства. Интервал между отсчетами составляет 5 с. В течение каждого интервала адаптивная модель подстраивается, и, как описано ниже, производится вычисление новой дозы (выражаемой числом капель в минуту).

Адаптивная модель на рис. 11.5 представляет собой фильтр с конечной импульсной характеристикой, имеющей 20 весовых коэффициентов (L= 19) и общей временной задержкой 95 с. Чтобы учесть среднее кровяное давление при отсутствии лекарства, вводится весовой коэффициент смещения . Из рис. 11.5 следует, что адаптивная модель является моделью, описанной в гл. 9. Вместо заданного линейного компенсатора, значения весовых коэффициентов которого не зависят от параметров входного сигнала, здесь используется адаптивный процесс автоматической перестройки весовых коэффициентов, осуществляемый таким образом, чтобы для данных параметров входного сигнала эта модель обеспечивала минимальную СКО относительно отсчетов последовательно включенных буферного устройства и управляемой системы. При проведении опытов использован метод наименьших квадратов.

Снова обратимся к рис. 11.5. При правильной работе система приводит к тому, что кровяное давление животного изменяется в соответствии с сигналом управления кровяным давлением . На основе этого сигнала, а также вектора весовых коэффициентов и вектора входных сигналов (отражающего состояние адаптивной модели) формируется сигнал управления .

Рассмотрим теперь принцип действия устройства вычисления сигнала управления.

Предположим, что в результате адаптивного процесса значение сведено к нулю, т. е. это устройство должно из получить такое при котором были бы равны. Тогда при их равенстве (и при малом значении ) сигнал на выходе управляемой системы приближенно равен Таким образом, в схеме на рис. 11.5 устройство вычисления сигнала управления по существу должно стать обратной адаптивной моделью. Поскольку в управляемой системе имеется задержка, обратная модель должна быть предсказывающей.

Обратная модель строится следующим образом. В соответствии с алгоритмом наименьших квадратов на каждой итерации перестраивается полный вектор весовых коэффициентов . В адаптивной модели, если считать, что равны, для итерации имеем

Следовательно, для устройства вычисления сигнала управления

Для обратной модели такого вида необходимо полагать, что так возбуждает управляемую систему, что возможно адаптивное моделирование. Если это не так, то в ее входной сигнал можно ввести небольшой сигнал возбуждения.

Кроме того, необходимо предположить, что в (11.1) не стремится к нулю, но это не гарантируется при использовании метода наименьших квадратов. В действительности, когда управляемая система имеет задержки, такие, как время до начала реакции на рис. 11.4, стремится к малому значению и является зашумленным, а вычисленное по (11.2) значение может быть очень большим и колебаться в широких пределах, так как при вычислениях необходимо деление на . Следовательно, в системе управления кровяным давлением, где нежелательны большие дозы лекарства и, вообще говоря, невозможны отрицательные дозы, адаптивная часть схемы видоизменяется с учетом задержки реакции.

Это видоизменение состоит в том, что несколько первых весовых коэффициентов адаптивной модели приравнивается нулю. Их число соответствует известному априори времени задержки (времени до начала реакции) управляемой системы. Предположим, например, что приравнены нулю первые два весовых коэффициента, . Тогда текущее и предыдущее значения входного сигнала адаптивной модели не влияют на ее выходкой сигнал, а значения влияют.

Выбирая входные сигналы такими, при которых текущий выходной сигнал модели равен имеем

На основании этого результата можно, как в (11.2), вычислить но фактически необходимо знать Поэтому осуществим в (11.3) сдвиг на два временных шага вперед, тогда

Положим теперь, что весовые коэффициенты меняются медленно, тогда вместо будущих можно брать текущие значения весовых коэффициентов. В этом случае, снова полагая равными, имеем

В этом соотношении необходимо знать входной сигнал управления на два временных шага вперед. Иногда известны будущие значения этого сигнала и можно использовать (11.5). Если известно только значение то (11.5) можно видоизменить:

При использовании (11.6) выходной сигнал модели соответствует сигналу управления, задержанному на два временных шага. Таким образом, эта задержка не связана с задержкой прохождения сигнала через управляемую систему.

Система на рис. 11.5 многократно применялась в экспериментах по регуляции среднего кровяного давления животных и управлению им. В этих экспериментах стандартное отклонение из-за шума в приборах, измеряющих кровяное давление, составляло от 5 до 10 мм рт. ст. Обычно среднее кровяное давление регулируется с точностью до 2 ... 4 мм рт. ст. в установившемся состоянии, а в экстремальных условиях точность может превысить 5 ... 10 мм рт. ст. Характерное время установления составило порядка 2 мин, что несколько превышает общий временной интервал, перекрываемый адаптивной моделью управляемой системы. Для возможно более быстрого запуска системы начальные значения весовых коэффициентов в процессе моделирования обычно выбирают на основании предыдущего опыта. Выбор этих начальных значений не является критичным.

На рис. 11.6-11.9 представлены результаты экспериментов по управлению кровяным давлением животных. В ходе экспериментов нормальной собаке был введен арфонад, после чего кровяное давление поднялось, как показано на рис. 11.6.

Рис. 11.6. Фактические зависимости, полученные для здоровой и больной собак при ручном и автоматическом управлении

Две верхние кривые показывают соответственно действительное среднее кровяное давление и выходной сигнал модели, которые очень близки друг к другу даже в моменты таких сильных стрессов, которые возникают после введения арфонада.

В начале эксперимента доза лекарства (нижняя зависимость на рис. 11.6) устанавливалась вручную на уровне 10 капель/мин. После введения арфонада эта доза доведена до 20 капель/мин. При падении кровяного давления доза лекарства возрастает. После этого и далее управление дозировкой лекарства было передано автоматической системе (на кривой этот момент помечен крестиком). Уровень давления задавался с клавиатуры ЭВМ, этот уровень помечен крестиком на верхних кривых. Далее система управления должна была поднять кровяное давление животного до этого значения и поддерживать его при наличии естественных возмущений.

Рис. 11.7. Фактические зависимости, полученные при управлении кровяным давлением больной собаки

Рис. 11.8. Фактические зависимости, полученные при управлении кровяным давлением относительно его установленного значения

Средняя кривая отражает ход среднего значения СКО (по логарифмической шкале), являющейся разницей между сигналами управляемой системы и адаптивной модели.

Длительность выборки, обрабатываемой адаптивной моделью, равна 95 с. Эта модель представляет собой адаптивный трансверсальный фильтр с 20 отводами с задержкой между ними 5 с. После включения автоматического управления кровяное давление устанавливается примерно за 5 мин. Таким образом, это время приблизительно в 3 раза больше длительности выборки, что является достаточно коротким интервалом для адаптивной системы управления.

На рис. 11.6 фактически приведена часть кривой длительного наблюдения в течение нескольких часов, когда ЭВМ управляла кровяным давлением животного, находящегося под различной степенью воздействия арфонада. С точки зрения управления результаты оказались положительными и характерные кривые приведены на рис. 11.7 и 11.8.

Записи данных на рис. 11.6-11.8, которые несколько перекрываются по времени, представляют собой реакции на изменяющиеся значения давления.

Рис. 11.9. Импульсная характеристика модели на рис. 11.5 в различные моменты времени

В каждом случае давление устанавливалось примерно за 5 мин. На рис. 11.9 показаны значения весовых коэффициентов модели с конечной импульсной характеристикой, снятые в некоторые моменты времени в процессе наблюдения. Значения весовых коэффициентов соответствуют значениям сигнала на отводах фильтра и поэтому совпадают с импульсной характеристикой. Весовой коэффициент смещения на рис. 11.5 является двадцать первым. Импульсная характеристика на верхнем графике рис. 11.9 снята перед введением арфонада; как видно, животное очень чувствительно к лекарству, стимулирующему мышечную деятельность. Следующий график снят после введения арфонада перед включением автоматического управления, Форма характеристики несколько изменилась и существенно изменился уровень чувствительности. С течением времени в импульсной характеристике животного не произошло других сильных изменений, что также рассматривается как важный результат.

Итак, описана система управления с ЭВМ в реальном времени, предназначенной для регуляции кровяного давления животного, находящегося в состоянии продолжительного шока. Система управляет дозой вводимого лекарства стимулирующего действия и фиксирует кровяное давление. Для формирования требуемого входного сигнала управления значениями кровяного давления использована адаптивная модель реакции кровяного давления животного на лекарство. В качестве модели использован адаптивный линейный сумматор, а сигнал управления вычисляется на основе импульсной характеристики модели. Этот метод управления основан на методе адаптивного моделирования неизвестной системы.

Большинство методов управления манипулятором робота предназначено для управления конечным звеном манипулятора или сочленениями. В них уделено внимание компенсации нелинейностей от сил взаимодействия между различными сочленениями. Эти управляющие алгоритмы могут быть неадекватными, потому что требуют наличия точной модели динамики манипулятора и не учитывают изменения нагрузки в процессе выполнения манипулятором работы. Такие изменения в объекте управления часто оказываются достаточно значительными и снижают эффективность управления по обратной связи. В результате ухудшается динамика и демпфирование системы, что ограничивает точность и скорость позиционирования конечного звена. Значительное улучшение точности формирования желаемой траектории во времени для широкого диапазона движений манипулятора и для различных нагрузок достигается при использовании адаптивных методов управления.

Адаптивное управление по заданной модели

Наиболее легко реализуется адаптивное управление по заданной модели. Идея этого метода основана на выборе соответствующей заданной модели и алгоритма адаптации, по которым изменяются коэффициенты передач обратных связей на двигатели в реальной системе. Алгритм адаптации проводится на основе информации об ошибках между выходами заданной модели и выходами реальной системы. Общая блок-схема адаптивного управления системой по заданной модели приведена на рис. 18.2.

Рисунок 18.2.Общая блок-схема адаптивного управления системой

по заданной модели

В качестве заданной модели для каждой степени свободы манипулятора робота выбирается линейное дифференциальное уравнение второго порядка, не зависящее от времени. Манипулятор управляется путем настройки коэффициентов передачи обратной связи по положению и по скорости при отслеживании модели таким образом, чтобы его рабочие характеристики при замкнутом управлении совпадали с желаемыми рабочими характеристиками заданной модели. В результате такая схема адаптивного управления требует небольшого объема вычислений, которые могут выполняться с помощью недорогих микропроцессоров. Этот алгоритм адаптивного управления не требует ни сложных математических моделей динамической системы, ни предварительного знания внешних воздействий, таких, как величина нагрузки и др. Адаптивная схема, построенная по заданной модели, стабильно функционирует в широком диапазоне движений и нагрузок.

После определения вектора
, описывающего динамику заданной модели, и вектора
, описывающего динамику манипулятора,i -е сочленение заданной модели может быть описана следующим образом:

Коэффициенты и определяются из частоты собственных колебаний
и коэффициента демпфированиялинейной системы второго порядка:

и
. (18-10)

Учитывая, что членами высоких порядков можно пренебречь, уравнение динамики манипулятора для i -го сочленения может быть записано в виде:

где
и
- медленно изменяющиеся во времени параметры системы.

Переходя к рассмотрению третьего этапа синтеза адаптивного регулятора - выбору алгоритма адаптации, отметим, что в зависимости от объема априорной информации о параметрах объекта, внешних возмущениях и помехах, можно выделить две группы методов, с помощью которых строятся алгоритмы адаптации.

Первую группу составляют градиентные методы, которые используются при малых объемах информации о параметрах объекта, когда они являются неопределенными, ограниченными функциями, удовлетворяющими неравенствам (6.1.9). При этом сведения о внешних возмущениях и помехах могут быть различными. Это могут быть неопределенные ограниченные функции, удовлетворяющие неравенствам (6.2.10), и случайные процессы с известными или неизвестными законами распределения.

Вторую группу составляют методы, основанные на теории статистических решений. Они применяются, когда имеются априорные сведения о законе распределения параметров объекта. Эта плотность распределения уточняется в процессе работы системы. При этом предполагаются известными законы распределения случайных внешних воздействий и помех.

Наиболее полное изложение первой и второй групп методов можно найти соответственно в книгах .

Здесь и в последующих главах основное внимание будет уделено градиентным методам построения алгоритма адаптации, причем здесь приведены эвристические соображения по применению этих методов, а в последующих главах получены условия и определены параметры алгоритмов адаптации, при которых эти алгоритмы приводят к достижению цели управления. Отметим, что наиболее трудным из всех этапов синтеза адаптивного регулятора является четвертый этап.

Интерпретация задачи оптимального адаптивного управления .

Рассмотрим устойчивую адаптивную систему, описываемую уравнениями (6.2.1), (6.2.18), (6.2.19) при известных функциях в правых частях уравнений (6.2.18) и известных (заданных) функциях . При некоторой функции в (6.2.19) и фиксированных начальных условиях на движениях адаптивной системы функционал

(6.3.1)

является функцией некоторого вектора чисел , к которому сходятся решения уравнения (6.2.19).

Требуется найти такую функцию , чтобы функция достигала своего наименьшего значения.

Для этого построим процедуру нахождения минимума функции . Экстремальное значение аргумента этой функции удовлетворяет уравнениям

Алгоритм решения уравнений (6.3.2), основанный на методе градиента, имеет вид

где - некоторая функция (параметр алгоритма), выбираемая из условий сходимости

Алгоритм (6.3.3) позволяет найти настраиваемые параметры после того, как процесс управления объектом закончился, поскольку значение критерия было определено при . Для устранения этого недостатка заметим, что значение не зависит от траектории , входящей в функцию , и поэтому в алгоритм (6.3.3) подставляют вместо не предельное, а текущее значение , и тогда (6.3.3) принимает вид

(6.3.5)

В тех случаях, когда выражения имеют явную (аналитическую) форму, как, например, уравнения (6.1.41) в примере (6.1.2), уравнения (6.3.5) являются уравнениями алгоритма адаптации (6.2.19). Таким образом, интерпретация задачи оптимального адаптивного управления как задачи о минимуме функции приводит при детерминированных внешних возмущениях и помехах к искомому алгоритму адаптации. Этот алгоритм содержит не определенный пока параметр .

Покажем, что для идентификационного, адаптивного управления можно указать явный вид правой части алгоритма адаптации (6.3.5).

Рассмотрим объект (6.2.1), описанный уравнением в форме «вход-выход»:

где - заданная функция своих аргументов.

Допустим, что эта функция с достаточной точностью может быть аппроксимирована конечной суммой

(6.3.7)

где - линейно независимые известные функции; - неизвестные числа.

промышленными роботами.

В соответствии с различными определениями термина «адаптация», в задачах робототехники различают два типа адаптивных систем управления.

1. Адаптивные (очувствленные) системы управления, имеющие в своем составе сенсорные устройства, обеспечивающие получение информации о состоянии среды и (или) свойствах отдельных объектов. Полученная от сенсоров информация перерабатывается с целью решения различных задач, связанных с формированием управляющих сигналов (адаптация в широком смысле).

2. Адаптивные (обучающиеся) системы управления, в которых для обработки информации о состоянии среды и (или) о состоянии отдельных звеньев или подсистем робота применяются адаптивные алгоритмы, т.е. алгоритмы, способные изменяться под воздействием текущей или обучающей информации с целью оптимизации качества решения задачи в условиях неопределенности (адаптация в узком смысле).

Роботы, основанные на применении первого из указанных типов управления, называются адаптивными . Системы управления роботами, реализующими второй способ адаптивного управления, называют системами управления с адаптивными (или обучающимися) алгоритмами обработки информации .

Основным признаком для адаптивных систем управления первого типа является наличие сенсорной системы, получающей информацию о внешнем мире. Для адаптивной системы управления (или адаптивной системы переработки информации) главным признаком служит использование приспосабливающихся (адаптивных алгоритмов) обработки информации в изменяющихся условиях. Для реализации обучающихся систем управления (переработки информации) необходимым условием является наличие «учителя» и процесса обучения.

Возможно применение обоих принципов адаптации, когда в системе управления имеется сенсорная подсистема, и в одной или нескольких подсистемах применяются адаптивные алгоритмы переработки информации.

Рассмотрим классификацию адаптивных (очувствленных) систем управления первого типа (адаптация в широком смысле).

По функциональному назначению самого робота эти системы могут быть разделены на адаптивные системы управления манипуляционными и подвижными роботами. Классификация подвижных роботов будет рассмотрена позже.

Наиболее важными признаками для классификации рассматриваемых адаптивных систем управления являются характеристики применяемых сенсорных устройств.

По признаку моделирования функций биосенсоров технические сенсоры можно классифицировать на визуальные, слуховые, тактильные и кинестетические.

Визуальные сенсоры обеспечивают дистанционное получение информации о геометрических и, возможно, некоторых физических характеристиках внешней среды (цвет, свойства грунта). Существует большое число технических средств, которые могут быть применены для решения этой задачи: телевизионные системы различного типа, оптико-электронные приборы с зарядовой связью (ПЗС) и фотодиодные матрицы и линейки, различные локационные устройства.

Слуховые (акустические) сенсоры предназначены для восприятия звуковых колебаний и идентификации на их основе соответствующего акустического образа. Важное значение звуковые устройства имеют для организации речевой связи между человеком-оператором и роботом.

Тактильные сенсоры позволяют фиксировать контакт с объектами внешней среды. Они широко применяются для очувствления схвата манипулятора и корпуса робота.

Кинестетические сенсоры в живых организмах формируют мышечное чувство, позволяющее получить информацию о положении отдельных органов и усилиях в них.

Аналогичные задачи решаются в технике с помощью датчиков положения , скорости, измерителей усилий и моментов. По информации от датчиков усилий и моментов в шарнирах манипулятора могут быть определены и силомоментные характеристики взаимодействия с внешними объектами.

Для решения разнообразных задач адаптивные роботы должны иметь соответствующие «радиусы очувствления », т.е. воспринимать сенсорную информацию на требуемом расстоянии от ее источника. Биосенсоры по этому признаку делятся на дистантные (рецепторы зрения, слуха и обоняния) и контактные , определяющие параметры самой среды или процесса взаимодействия с ней только при непосредственном соприкосновении рецептора со средой (рецепторы осязания и вкуса).

Технические сенсоры по указанному признаку можно разделить на сверхближние (контактные), ближние, дальние и сверхдальние. Сверхближними сенсорными устройствами являются тактильные и кинестетические сенсоры, датчики пройденного пути, измерители плотности.

Сенсорные устройства ближнего и дальнего действия позволяют получать бесконтактным способом информацию о внешней среде вблизи робота (например, с помощью локационных сенсоров схвата) и в объеме всей рабочей зоны соответственно. Наиболее важное значение среди сенсоров дальнего действия имеют различные визуальные системы (системы технического зрения).

Сенсорные устройства сверхдальнего действия могут применяться для управления транспортными и исследовательскими роботами в составе различных навигационных систем.

Перейдем к рассмотрению областей применения и классификации систем управления с адаптивными алгоритмами обработки информации (адаптация в узком смысле). Адаптивные алгоритмы и системы, разрабатываемые для решения различных робототехнических задач (восприятия внешней среды, управления и планирования), могут классифицироваться в зависимости от типа структур, реализующих выбранные способы представления априорной, текущей и обучающей информации. Существенное значение для характеристики различных адаптивных систем имеют объем и структура памяти, реализующей модель среды, а также быстродействие процессов адаптации.

Рассмотрим некоторые задачи адаптации и обучения, которые могут возникать при создании алгоритмического обеспечения подсистем робота.

1. Исполнительный уровень . На исполнительный уровень поступают сигналы, определяющие необходимые изменения обобщенных координат, степеней подвижности эффекторной системы. Исполнительный уровень обычно представляет собой привод - электрический, пневматический или гидравлический, с помощью которого обеспечиваются требуемые усилия в каждой из степеней подвижности. Эти усилия определяются весовыми и геометрическими характеристиками объектов, которые робот должен перемещать. В зависимости от этих характеристик изменяется нагрузка привода, причем качество работы привода может при этом существенно ухудшиться. Кроме того, изменение трения и зазоров в шарнирах кинематической цепи эффекторной системы также влияет на динамические характеристики привода. Поэтому в ряде случаев необходимо применять принципы адаптации для построения привода, обеспечивающего требуемое качество работы исполнительного уровня в условиях указанных изменений характеристик «внешней среды».

2. Тактический уровень . Тактический уровень «раскладывает» требуемое движение рабочего органа на соответствующие перемещения степеней подвижности. В живых организмах при нарушении работы одного из суставов (или одной конечности) происходит соответствующее изменение режима работы других суставов (или конечностей) с целью выполнения требуемого движения. Обычно робот (манипуляционный или локомоционный) обладает избыточным числом степеней подвижности, что обеспечивает принципиальную возможность построения адаптивного тактического уровня, автоматически перестраивающего работу приводов исполнительного уровня при резком ухудшении характеристик или выходе из строя одного из них.

3. Распознавание объектов и анализ сцен. Как правило, адаптивный робот взаимодействует с трехмерными объектами, которые могут быть произвольно ориентированы и расположены в различных местах зоны действия робота. Сигналы, поступающие от сенсорной системы, для каждого случая расположения объектов будут различны. Для построения системы восприятия может оказаться целесообразным применение принципов построения обучающихся систем распознавания образов, теория которых интенсивно развивается.

4. Система планирования . Процессы обучения в системе планирования обычно тесно связаны с преобразованием информации в модели среды. Это процессы рассматриваются обычно как характерная черта искусственного интеллекта. Один из возможных вариантов процесса обучения в системе планирования может заключаться в следующем. Положим, что робот может по определенным правилам формировать план действий в некоторой ситуации. Кроме того, существует возможность изменения этих правил на основе приобретения опыта. Например, если робот должен составлять последовательно планы для ряда ситуаций, в какой-то степени подобных друг другу, то при наличии механизма обучения составление плана после рассмотрения ряда ситуаций может протекать существенно быстрее, чем это имело место для первоначальной ситуации. Таким образом, робот приобретает некоторый «навык» для выполнения ряда операций, «близких» в каком-то отношении друг к другу.

5. Система связи с внешней средой. Эта система может иметь различные уровни сложности и разную физическую природу сигналов, которые она способна воспринимать от человека или автомата и передавать им. Задача организации диалога с роботом может рассматриваться в рамках общей проблемы построения диалоговых систем.

Здесь также возможна постановка задач адаптации и обучения на различных уровнях, начиная от задач распознавания акустических или визуальных сигналов и кончая задачей понимания смысла отдельных предложений и (или) достаточно сложной графической информации (чертежей, схем и т.д.).

Адаптивные алгоритмы обработки информации, разрабатываемые применительно к различным робототехническим задачам, могут также классифицироваться в соответствии с математическими методами , положенными в основу их формирования. В соответствии с этим признаком адаптивные алгоритмы могут быть разделены на аналитические, логические, структурные и реляционные . Указанные математические подходы также могут быть применены и для формирования описаний внешней среды, необходимых для решения различных задач обработки информации в робототехнической системе.

Аналитические методы применяются при формировании адаптивных алгоритмов функционирования эффекторной и сенсорной подсистем. Логические, структурные и реляционные методы могут применяться для построения адаптивных алгоритмов обработки информации в сенсорной подсистеме и подсистеме планирования.

В некоторых случаях оказывается целесообразным применять адаптивные алгоритмы только для обработки информации на этапе создания алгоритмического и программного обеспечения, т.е. в качестве одного из подходов при формировании автоматизированной системы проектирования этого обеспечения. Целесообразность такого применения методов адаптации (в узком смысле) применительно, например, к сенсорной подсистеме определяется следующими обстоятельствами.

В ряде случаев изменения в проблемной среде робототехнической системы возникают только при изменении номенклатуры транспортируемых или изготавливаемых изделий. Поэтому адаптация имеющегося в системе управления алгоритмического и программного обеспечения к обработке вновь поступающей информации может осуществляться не в ЭВМ нижнего уровня, непосредственно вырабатывающей сигналы управления, а в ЭВМ более высокого уровня, где может производиться необходимая модификация программ (или выбор оптимальных параметров в алгоритмах обработки информации). Один из методов автоматизации этого процесса модификации программного обеспечения может быть основан на применении соответствующих адаптивных алгоритмов. После необходимой коррекции программы с ЭВМ высшего уровня передаются по линии связи на ЭВМ нижнего уровня.

ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

А.В. Воронин

АДАПТИВНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

Издательство

Томского политехнического университета

Пособие подготовлено на кафедре интегрированных систем управления и предназначено для студентов ИДО, обучающихся по направлению 220700 «Автоматизация технологических процессов и систем».

УДК 681.3

ББК 32.97

© ФГБОУ ВПО НИ ТПУ, 2014

© Воронин А.В., 2014

© Оформление. Издательство Томского
политехнического университета, 2014

ВВЕДЕНИЕ

Назначение адаптивных систем управления.

Как отмечалось выше, необходимость адаптивного управления возникает, когда недостаточна априорная информация или динамические характеристики объекта в процессе функционирования системы управления изменяются в широких пределах. Такая ситуация возникают во многих производствах.

Аэродинамические характеристики самолетов зависят от скорости и высоты полета, от атмосферных условий, в которых происходит полет. И во время полета отдельные параметры, определяющие динамические свойства самолета, могут изменяться в десятки раз. В этих условиях с задачей качественного управления самолетом обычные автопилоты могут не справиться.

Модели технологических процессов в металлургии, химии, нефтехимии являются сложными. Их параметры и, возможно, структуры из-за недостаточной априорной информации не всегда известны .

Кроме того, эти параметры могут изменяться во время протекания технологического процесса в указанных отраслях. Поэтому обычные системы управления во многих случаях не могут обеспечить качественного, а иногда и просто устойчивого управления такими технологическими процессами .

При разработке унифицированных регуляторов для широкого класса объектов параметры регуляторов заранее не могут быть точно рассчитаны и установлены. Достаточно напомнить о том, что процедура линеаризации всегда проводится в некоторой точке и полученный регулятор является работоспособным в малой окрестности точки линеаризации. Поэтому, если эти регуляторы являются неадаптивными, то при их использовании в каждом конкретном случае они требуют настройки . Использование адаптивных регуляторов избавит пользователей от этой процедуры, что позволит сэкономить их время и «силы».



В большинстве случаев адаптивное управление преследует цель нейтрализации параметрической неопределенности или неизбежных изменений параметров объекта. Однако в некоторых случаях, в особенности при управлении технологическим процессами, где могут присутствовать сотни управляющих контуров, адаптивное управление также используется, чтобы уменьшить число конструктивных параметров ручной настройки и тем самым увеличить эффективность и практичность системы управления.

Резюмируя изложенное, можно утверждать, что применение принципов адаптивного управления позволяет :

Обеспечить оптимальный режим работы системы управления в условиях неполной информации;

Обеспечить работоспособность системы управления в условиях изменения динамических свойств объекта в широких пределах;

Создать унифицированные регуляторы для широкого класса объектов;

Снизить технологические требования к изготовлению отдельных узлов и элементов;

Сократить сроки разработки и наладки систем.

Два подхода к синтезу САУ для объектов с

Неопределенными параметрами

В настоящее время в ТАУ существуют два подхода, позволяющие решить задачу управления объектами с переменными и неопределенными параметрами.

Первый подход базируется на использовании регуляторов, алгоритмы работы которых напрямую не зависят от меняющихся или неизвестных параметров. Идея подхода состоит в том, чтобы на этапе синтеза сделать систему максимально нечувствительной к изменяющимся или неопределенным параметрам. В основе подхода лежит свойство обратных связей устранять влияние неопределенностей, либо, по крайней мере, уменьшать это влияние до некоторой величины. Почти любой обычный регулятор, рассчитанный для рабочей точки, благодаря заложенным в нем запасам сохраняет работоспособность и при изменении параметров объекта в некотором диапазоне. Но если не используются специальные методы, этот диапазон оказывается небольшим.



Во многих случаях путем выбора более сложной структуры регулятора удается существенно расширить диапазон изменения параметров, в котором обеспечивает неизменное или малое изменение показателей качества управления. Такие системы, имеющие пониженную чувствительность к изменяющимся параметрам объекта управления, называются грубыми системами . В настоящее время существует несколько подходов к синтезу грубых систем.

Один из них заключается в выборе такой структуры системы, при которой место включения объекта управления соответствует достижению минимальной чувствительности регулируемой переменной к вариациям параметров.

В основу другого подхода положено использование в системе избыточных элементов, представляющих специальные корректирующие устройства, которые рассчитываются так, чтобы снизить чувствительность системы к изменениям параметров объекта управления.

Таким образом, в грубых системах обеспечение требуемого качества управления в условиях меняющихся или неопределенных параметров достигается за счет увеличения объема рабочей (апостериорной) информации. В этих системах при формировании управляющего сигнала кроме информации о регулируемой величине используются измерения других, доступных для измерения величин, и эти данные подвергаются преобразованию с помощью более сложных линейных и нелинейных законов. Часто грубые системы называют системами с пассивной адаптацией.

Другой подход связан с разработкой собственно адаптивных систем, реализующих подстройку параметров и\или структуры регулятора под изменяющиеся параметры объекта.

1.6. Структура и типы адаптивных систем управления .

Адаптивные системы управления включают объект, регулятор и адаптор (блок адаптации) (рис.1.3). Объект и регулятор, вырабатывающий управляющее воздействие на объект, образуют основной контур. Регулятор содержит варьируемые параметры. Адаптор на основе обработки доступной ему информации вырабатывает управляющее воздействие, производящее подстройку варьируемых параметров регулятора. Регулятор совместно с адаптором образуют адаптивный регулятор.

Таким образом, адаптивная система обладает способностью «приспосабливаться» к изменениям параметров объекта. В ней автоматически производятся такие же изменеия, какие бы внес проектировщик, если бы имел возможностьполучить дополнительную информацию о поведении системы.

Как видим, адаптивная система управления имеет иерархическую структуру : она имеет, по крайней мере, два уровня. Основной контур образует первый (низший) уровень, а контур, содержащий адаптор и называемый контуром адаптации , - второй уровень.

На нижнем уровне решается обычная задача регулирования. Структура контура регулирования зависит от характера изменения . Это могут быть задачи стабилизации, слежения или программного управления. Обычно реализуется принцип регулирования по отклонению или комбинированного управления.

Рис. 1.3 Простейшая блок- схема адаптивной системы

Задача верхнего уровня состоит в стабилизации или оптимизации характеристик основного контура системы в условиях изменения и . В качестве объекта управления контура адаптации выступает основной контур системы, при этом управляемой величиной является некоторый показатель, характеризующий динамические свойства основного контура, а управляющим воздействием – вектор параметров регулятора, к которым относятся настраиваемые параметры и параметры, определяющие структуру регулятора.

Задачу стабилизации или поиска экстремума указанного показателя решает блок БА, который работает по измерениям , меняя вектор параметров .

В частном случае, адаптация может работать, как и обычная система управления, по разомкнутому, замкнутому и комбинированному принципу.

Следует заметить, что в блок адаптации не заводится информация о параметрических возмущениях. Дело в том, что измерения и это задачи разного уровня сложности. Если часто доступны для измерения (хотя и эта задача может быть весьма непростой), то параметрические возмущения обычно не измеряемы. Их можно оценить только методами идентификации.

В общем случае в АС возможны три и больше уровней. В частности, если для синтеза адаптора в завершенном виде априорной информации недостаточно и, допустим, какие-либо его параметры должны уточняться в процессе функционирования системы, потребуется третий уровень - контур адаптации адаптора. Адаптор выполняет двоякую функцию: изучение объекта и настройку регулятора.

Экстремальные,

самонастраивающиеся (СНС),

самоорганизующиеся (СОС),

Самообучающиеся.

Самые старые и самые простые АС, этоэкстремальные системы . В экстремальных системах обеспечивается оптимальный режим (точнее квазиоптимальный, т.к. обычно ЭС являются поисковыми, а поисковые сигналы возбуждают систему), соответствующий экстремуму статической характеристики объекта при ее «дрейфе», за счет автоматического регулирования сигналов на входе экстремального объекта.

Достоинство такой системы - простота, скромные требования к информации и точное поддержание экстремума. Недостатком является квазиоптимальность и медленность работы при поисковой реализации, требования к наличию у объекта экстремальной характеристики.

К самонастраивающимся системам относятся те адаптивные системы, в которых структура основного регулятора задана и для достижения требуемого качества управления в основном контуре перестраиваются коэффициенты закона управления, реализуемого в регуляторе.

ЭКСТРЕМАЛЬНЫЕ СИСТЕМЫ

Принцип действия ЭС

Как уже отмечалось, в зависимости от количества координат, характеризующих экстремальный статический режим объекта управления, ЭС делят на одномерные и многомерные. Начнем с одномерной ЭС, обобщенная структура которой представлена на рис. 2.9. В основном, ЭС содержит те же обязательные функциональные элементы, что и любая САР.

Рис. 2.9 Структура экстремальной системы

В частности, на рис. 2.9:

ИУ – исполнительное устройство,

УПУ – усилительно-преобразовательное устройство,

ИОЭ – измеритель отклонения от экстремума.

Основной интерес представляет ИОЭ.

Пусть исходное расположение статистической характеристики объекта задано кривой 1 на рис. 2.10, которая имеет максимальное значение при . Пусть далее произошло смещение характеристики по оси и значение упало с до .

При этом ясно, что измеряя только и нельзя определить направление смещения.

А вот если бы мы знали еще и скорость , то проблема была бы решена.

Рис.2.10 Рис.2.11

Из рисунка 2.11 следует, что закон экстремального управления должен удовлетворять условию

при поиске максимума.

Таким образом, чтобы принять решение о том, куда двигаться, нужно менять и определять .

Отсюда следует правило: чтобы определить направление движения к экстремуму необходимо изменить входную величину и проанализировать реакцию на это изменение.

В отличие от обычных САР управление в ЭС носит дуальный характер, т.е. служит и для определения направления движения и для осуществления самого движения к экстремуму. Поэтому его часто делят на два вида – пробное и рабочее. Эти движения связаны между собой по- разному. Можно выделить три случая.

1) Пробное и рабочее движения разделены.

2) Пробное и рабочее движения совпадают.

3) Пробное и рабочее движение существуют одновременно.

Типы экстремальных систем

Замечание.

Градиентом называют векторную функцию скалярного аргумента. Компонентами вектора градиента являются частные производные аргумента по пространственным координатам. Градиент переменной записывается .

Обычно для определения проекций градиента используется следующий прием .

Шаговые ЭС.

Как уже отмечалось, для определения направления движения к экстремуму нужно знать . В шаговых ЭС бесконечно малые и заменяются малыми конечными приращениями и . Соответственно .

Алгоритм включает следующие шаги:

● даем приращение ,

● определяем ,

● по отношению этих приращений определяем рабочие точки относительно экстремума.

Существует 2 типа ШЭС:

а) с разделенными пробными и рабочими шагами, как это показано на рис. 2.15,

б) с совмещенными пробными и рабочими шагами.

Основной элемент ШЭС – устройство определяющее приращение входной или выходной величины.

Техническая реализация может быть весьма разнообразной. Чтобы повысить помехозащищенность и улучшить работу шаговой системы, часто используют дискретные системы шагового типа, в которых используют импульсные элементы, как это показано на рис. 2.16, 2.17.

Рис. 2.16 ШЭС с импульсными элементами.

Достоинства ШЭС.

● Очень удобно при регулировании медленно протекающих процессов. Вместо медленного изменения управляющего воздействия использована импульсная перестановка управляющего элемента.

● Хорошо работают с объектами с запаздыванием

Многомерные ЭС

Многомерные ЭС предполагают наличие объекта управления с экстремальной характеристикой, состояние которого зависит от нескольких входных переменных. На рис. 2.27 показана общая структура многомерных ЭС.

Рис. 2.27. Структура многомерной ЭС

Особенности данной системы связаны с блоками УПУ и Изм.У.

Пусть имеем зависимость . Изобразим на плоскости линиями уровня для значений …

Рис. 2.28 Постановка задачи двумерного экстремального поиска

Пусть начальная точка состояния системы соответствует . Алгоритм поиска может быть следующим.

: а) получить информацию о поведении функции в окрестности рабочей точки;

б) организовать движение системы (формулирование управляющих воздействий) в требуемом направлении.

Градиентные методы

Среди детерминированных способов наиболее эффективными в системах адаптивного управления являются градиентные методы. Градиентные методы основаны на использовании градиента целевой функции. Указанные методы носят итеративный характер, так как компоненты градиента являются, как правило, нелинейными функциями управляемых переменных.

Основная идея всех градиентных методов состоит в том, чтобы двигаться к минимуму в направлении наиболее быстрого убывания функции, которое определяется антиградиентом. Эта идея может реализоваться, например, следующим образом.

Выберем каким-либо способом начальную точку, вычислим в ней градиент рассматриваемой функции и сделаем небольшой шаг в обратном, антиградиентном направлении. В результате мы придем в точку, в которой значение функции будет меньше первоначального. В новой точке повторим процедуру: снова вычислим градиент функции и сделаем шаг в обратном направлении. Продолжая этот процесс, мы будем двигаться в сторону убывания функции.

Наглядной интерпретацией задачи градиентного спуска можно считать положение человека, который хочет максимально быстро спуститься на дно котловины, заросшей лесом, но видит перед собой лишь ограниченный участок местности. В такой ситуации логичным алгоритмом действия является движение в ту сторону, где местность наиболее круто идет вниз, т.е. в сторону антиградиента функции высоты.

Далее везде будем предполагать, что , существуют и непрерывны. Предполагается, что компоненты градиента могут быть записаны в аналитическом виде или с достаточно высокой точностью вычислены при помощи численных методов.

Замечание. В практических задачах найти значения производных целевых функций вида аналитически, как правило, не удается и их вычисляют приближенно:

Выбор величин приращений по координатам зависит от возможностей используемой ЭВМ и необходимой точности вычислений.

Все градиентные методы поиска минимума основаны на итерационной процедуре, реализуемой в соответствии с формулой

где – текущее приближение к решению ;

– параметр, регулирующий длину -го шага;

– направление поиска в - мерном пространстве управляемых переменных , .

Способ определения и на каждой итерации связан с особенностями применяемого метода.

Ранее уже отмечалось, что градиент функции в точке − это вектор

,

проекции которого являются производными по координатам и вычислены для . Длина вектора градиента

характеризует скорость возрастания функции в этой точке, а направление соответствует направлению быстрейшего возрастания функции. Антиградиент - это вектор такой же длины, направленный в противоположную сторону (рис. 2.29). В точке минимума градиент функции равен нулю.

Единичный вектор градиента определяется как

.

Рис. 2.29. Градиент и антиградиент функции

При поиске минимума каждая следующая точка поиска (каждый новый член минимизирующей последовательности) получается в результате перемещения из предыдущей точки по направлению антиградиента целевой функции по формуле

.

Если в результате этого перемещения наблюдается увеличение значения целевой функции, то значение рабочего шага поиска уменьшается. Поиск прекращается, когда выполняется необходимое условие , например, длина вектора градиента становится меньше требуемой точности:

Различают методы градиента с переменным шагом и с постоянным шагом (рис. 2.30). При использовании метода градиента с переменным шагом изменение значений производится согласно выражению

, i =1,2,...,n , k =0,1,2…, (2.3)

а останов поиска - при выполнении неравенства (2.2). При возникновении ситуации значение параметра h уменьшается, например, делится на число . Характер изменения значений , согласно (2.3), зависит от величины и знака соответствующих частных производных целевой функции.

Рис. 2.30. Методы с постоянным и переменным шагом

К недостаткам метода можно отнести то, что, во-первых, на каждом шаге необходимо определять значение градиента. Это может быть не просто, если градиент определяется экспериментально. Во-вторых, по мере приближения к точке абсолютные величины частных производных уменьшаются, следовательно, и шаг поиска является переменным – уменьшается по мере приближения к искомой точке. Такой характер поиска требует иногда весьма значительных затрат времени.

Второй из отмеченных недостатков может быть устранен применением метода градиента с постоянным шагом. Метод позволяет сократить затраты времени, но требует несколько большего объема вычислений при изменении значений аргументов целевой функции. Его основное соотношение:

, i =1,2,...,n ; k =0,1,2,... . (2.4)

Метод использует вектор градиента единичной длины, который определяет лишь направление градиента, поэтому движение по осуществляется с постоянной скоростью, зависящей от величины шага . Если изменение аргументов целевой функции в соответствии с (2.4) приводит к увеличению ее значения, параметр поиска уменьшается. Останов поиска по методу градиента с постоянным шагом осуществляется при выполнении неравенства .

Метод Коши (Наискорейшего спуска)

Вычисление градиента на каждом шаге, позволяющее все время двигаться в направлении наиболее быстрого убывания целевой функции, может в то же время замедлить вычислительный процесс. Дело в том, что подсчет градиента - обычно гораздо более сложная операция, чем подсчет самой функции, особенно если аналитическое выражение градиента отсутствует. Поэтому часто пользуются модификацией градиентного метода, получившей название метода наискорейшего спуска или метода Коши (рис.2.31).

Рис. 2.31. Иллюстрация к методу наискорейшего спуска

Согласно этому методу после вычисления градиента функции в начальной точке делают в направлении антиградиента не маленький шаг, а движутся до тех пор, пока функция убывает. Достигнув точки минимума на выбранном направлении, снова вычисляют градиент функции и повторяют описанную процедуру. При этом градиент вычисляется гораздо реже, только при смене направлений движения.

Хотя траектория ведет к цели не так быстро, как на рис. 2.30, экономия машинного времени за счет более редкого вычисления градиента может быть весьма существенной.

Метод может быть реализован в нескольких вариантах. Простейшим является использование формулы

для последовательного движения к экстремуму, пока будет выполняться условие . Нарушение данного условия означает прохождение точки минимума и говорит о том, что необходимо изменить направление движения. В достигнутой точке производится новый расчет вектора градиента и процесс повторяется.

Другой вариант состоит в том, что значение шага оптимизации вычисляется путем решения задачи минимизации вдоль направления с помощью того или иного метода одномерного поиска. Этот вариант реализации алгоритма более сложный, но обычно требует меньшего количества итераций.

Пусть функция дифференцируема по и вектор градиента может быть записан аналитически. Тогда поиск минимума функции с использованием процедуры одномерной минимизации включает следующие этапы.

Этап 1. Определение аналитических соотношений для вычисления градиента функции , длины вектора градиента и единичного вектора градиента .

Этап 2. Выбор исходной точки при (начальных значений аргументов функции).

Этап 3. Выбор шага a изменения координат текущей точки . Осуществляется из условия достижения экстремума функции одного аргумента в соответствии с уравнением

.

Корень этого уравнения, соответствующий минимуму функции , обозначим .

Этап 4. Следующее приближение вычисляется по формуле . где является решением задачи одномерной минимизации функции:

Если , то поиск минимума заканчивается, причем:

Иначе и переходим к шагу 2.

Методы случайного поиска

При определенных условиях методы случайного поиска могут оказаться более эффективными, чем регулярные. Рассмотрим некоторые наиболее распространенные методы случайного поиска.

БАС с эталонной моделью

БАС с использованием анализатора характеристик требует наличия специальной процедуры (программной, аппаратной) определения характеристик, что усложняет систему и увеличивает время самонастройки. Вместе с тем, если есть возможность построить модель, описывающую желаемое поведение системы, уже по разности выходных сигналов модели и реальной системы можно судить о настройке регулятора и использовать эту разность для целенаправленной коррекции параметров.

К наиболее популярным в классе АС прямого действия относятся АС с эталонной моделью, функциональная схема которых представлена на рис. 4.5.

К достоинствам этого типа систем можно отнести:

● Формирование алгоритмов адаптации на основании измеряемых (а не вычисляемых) величин и относительная простота реализации;

● Возможность исключения пробных движений.

ЭМ может использоваться для решения следующих задач:

● Формирование эталонной траектории, реализующей желаемые динамические и статические характеристики;

● Формирование желаемой параметрической модели основного контура;

● Обучение регулятора адаптаций с помощью изменяемой ЭМ, что позволяет унифицировать алгоритмы адаптивного управления для изменяющихся ситуаций;

● Адаптивное управление по неполным данным на основе использования наблюдателей состояния;

● Восстановление работоспособности системы.

Адаптивные системы управления с эталонной моделью содержат динамическую модель системы, обладающую требуемым качеством и называемую эталонной моделью . Адаптивная система управления с эталонной моделью (ЭМ), кроме основного контура, содержащего регулятор (Р) и объект (О), включает контур с ЭМ и вычислительно-исполнительное устройство (ВИУ). Эталонная модель вырабатывает желаемый (эталонный) выходной сигнал. Эталонная модель и основной контур соединены параллельно.

Рис. 4.5. БАС с эталонной моделью

Вычислительно-исполнительное устройство (его также называют механизмом адаптации) обрабатывает разностный сигнал (разность между фактическим и эталонным сигналами) и подает его на алгоритм адаптации АА, который производит подстройку параметров регулятора. Выбор эталонной модели является частью процесса синтеза адаптивной системы управления.

Эталонная модель должна удовлетворять двум требованиям:

● с одной стороны, она должна отражать все требования к качеству синтезируемой системы,

● с другой стороны, эталонная реакция должна быть достижима для основного контура.

Последнее требование накладывает ограничения на структуру эталонной модели, определяемой предполагаемой структурой основного контура.

Регулятор должен обладать идеальной следящей способностью. Другими словами, закон (алгоритм) управления должен быть таким, чтобы существовали такие значения его параметров, называемые идеальными, при которых передаточная функция основного контура относительно задающего воздействия и выхода равна передаточной функции эталонной модели. Принцип работы адаптивной системы с ЭМ состоит в том, чтобы адаптор обеспечивал сходимость к нулю ошибки слежения - разность между выходными сигналами основного контура



Открытие бизнеса