Управляемость системы управления. Наблюдаемость и управляемость системы

Постановка и решение задачи оптимального управления для конкретного объекта имеет смысл только в том случае, если существует принципиальная возможность перевода его из заданного начального состояния в требуемое конечное состояние за ограниченное время с использованием допустимого управления. Определение возможности такого перевода составляет содержание понятия управляемости, которое впервые было введено Р. Калманом.

Рассмотрим линейную стационарную систему, описываемую уравнением

- n - мерный вектор системы

- m - мерный вектор управления

A и B - постоянные матрицы порядка и соответственно.

Стационарная система, описываемая уравнением (1), называется управляемой, если для любых состояний и существует ограниченное измеримое управление U(t), заданное на конечном интервале , такое, что соответствующая траектория X(t) удовлетворяет условиям и .

Критерий полной управляемости системы (1), предложенный Р. Калманом, имеет простую и компактную форму. Пусть заданы матрицы A и B системы. Составим матрицу размером , в которой первые m столбцов совпадают со столбцами матрицы B, вторые m столбцов совпадают со столбцами матрицы AB и т. д., а последние m столбцов есть столбцы матрицы . Матрицу записывают так:

Управляемость линейной стационарной системы связывается со свойствами матрицы в виде следующего утверждения.

Для того, чтобы линейная стационарная система (1) была полностью управляемой, необходимо и достаточно, чтобы ранг матрицы управляемости был равен n, т.е.

Если вместо матрицы B в правой части уравнения (1) стоит матрица-столбец , т.е. m=1 и управление является скалярной функцией времени, то для полной управляемости системы необходимо и достаточно, чтобы ранг матрицы

(4) ,

имеющей размерность , был равен n, т.е. . Для полной управляемости системы в этом случае требуется, чтобы определитель матрицы не равнялся нулю, т.е. .

Если матрица A диагональна и все диагональные элементы ее различные, то система полностью управляема при условии, что матрица B не содержит нулевых строк.

Таким образом, свойство управляемости системы полностью определяется алгебраическими свойствами пары матриц {A,B}. Поэтому понятие управляемости часто относят к эти матрицам и говорят, что пара {A,B}вполне управляема или неуправляема.

Заметим, что критерий полной управляемости системы (1) никоим образом не связан с устойчивостью системы. Неустойчивая система может быть полностью управляемой и, наоборот, устойчивая система - неуправляемой. Полня управляемость означает возможность стабилизации системы, т.е. возможность построения устойчивой замкнутой системы путем присоединения соответствующего регулятора.

В случае нелинейных систем и при наличии ограничений на управление U(t) свойство управляемости может выполнятся не во всем фазовом пространстве, а критерии управляемости включают некоторые дополнительные условия. В частности доказано, что система (1), в которой на управление наложены ограничения вида

вполне управляема относительно начала координат во всем фазовом пространстве, если она при отсутствии ограничений вполне управляема и матрица A устойчива, т.е. корни уравнения имеют отрицательные вещественные части.

Рассмотрим далее понятие наблюдаемости. Чтобы управлять объектом, необходимо иметь информацию о его текущем состоянии, т.е. знать значение переменных состояния в каждый момент времени. Однако некоторые из переменных , являясь абстрактными переменными, которые вводятся для удобства и полноты описания объекта, не имеют физического аналога в реальном объекте и поэтому не могут быть измерены. Не могут быть измерены и производные высокого порядка, используемые в качестве координат состояния. Измеряются в реальном объекте некоторые переменные , которые образуют вектор Y выходных координат. Вектор Y связан определенной зависимостью с вектором состояния X. Следовательно, возникает задача восстановления текущих значений переменных состояния по результатам наблюдения за выходными переменными системы на конечном интервале времени, а также задача определения условий, при которых такое восстановление возможно. Решение этих задач и составляет содержание проблемы наблюдаемости.

Рассмотрим линейную стационарную систему

(5)

X - n - мерный вектор состояния;

U - m - мерный вектор управления;

Y - r - мерный вектор выхода, компоненты которого представляют собой реальные выходные координаты объекта;

C,D - постоянные матрицы размерностью и соответственно.

Состояние системы (5) называется полностью наблюдаемым, если можно однозначно определить по данным измерений Y(t) и U(t) на конечном интервале времени . Система (5) называется полностью наблюдаемой, если наблюдаемы все ее состояния в любые моменты времени.

Условия наблюдаемости линейной стационарной системы (5) формулируются на основе алгебраических свойств пары матриц {A,C}.

Для того, чтобы линейная стационарная система (5) была полностью наблюдаема, необходимо и достаточно, чтобы матрица

имела ранг, равный n. Если это условие не выполняется (ранг ), то система не вполне наблюдаема. Если матрица A диагональная и все диагональные элементы ее различны, то система полностью наблюдаема при условии, что матрица C не содержит нулевых столбцов.

Наиболее легко судить об управляемости и наблюдаемости объекта, если его математическая модель представлена в канонической форме.

Для примера рассмотрим математическую модель одномерного объекта в виде канонических уравнений состояния:

В скалярной форме

В векторной форме

Из этих уравнений видно, что выход объекта U(t) не оказывает влияния на переменные и . Поэтому переменные и не управляемы.

Управляемыми являются только переменные состояния и .

Переменные и не участвуют в формировании выхода Y(t). Косвенно, через переменные и , они также не влияют на выход Y(t). Поэтому переменные и не наблюдаемы на выходе, а наблюдаемыми являются только переменные состояния и .

Очевидно, что и управляемой и наблюдаемой переменной состояния является :

Этот пример показывает, что в общем случае математическая модель объекта может иметь четыре части:

1) управляемую, но не наблюдаемую часть; 2) полностью управляемую и наблюдаемую часть; 3) неуправляемую и ненаблюдаемую часть; 4) неуправляемую, но наблюдаемую часть.

Рассмотрим два случая:

а) случай неполной управляемости, но полной наблюдаемости.

На приведенной ниже схеме видно, что на часть координат не влияют входные воздействия , ни другие переменные . В данном случае часть 2 системы является неуправляемой, но наблюдаемой.

б) случай неполной наблюдаемости системы, но полной управляемости

Как видно, здесь можно найти такую систему координат, что часть из них X(2) не влияет на выходные переменные ни непосредственно, ни через другие переменные состояния X(1). В данной схеме часть 2 системы является управляемой, но не наблюдаемой.

Для определения управляемости и наблюдаемости линейных систем с обратной связью, разделяющихся на две линейные подсистемы (неизменяемая часть - объект и регулятор ),очень удобна теорема Гилберта.

Пусть линейные подсистемы и образуют систему с обратной связью согласно приведенной структурной схемы. Пусть последовательное соединение представляет собой полностью управляемую и наблюдаемую систему, а последовательное соединение неуправляемую, но полностью наблюдаемую систему. Тогда:

1) порядок системы n равен сумме порядков и , т.е. ; 2) необходимым и достаточным условием управляемости (наблюдаемости) системы с обратной связью является управляемость (наблюдаемость) ; 3) необходимым, но недостаточным условием управляемости (наблюдаемости) системы с обратной связью является управляемость (наблюдаемость) и и ; 4) если и управляемы (наблюдаемы), то любые из неуправляемых (ненаблюдаемых) координат системы с обратной связью являются неуправляемыми (ненаблюдаемыми) координатами и порождаются .

Важность данной теоремы состоит в том, что управляемость и наблюдаемость могут устанавливаться на основе исследования отдельных разомкнутых подсистем.

В случае линейных систем свойство управляемости не зависит от конкретной области в пространстве состояний.

В случае нелинейных систем и при наличии ограничений модуля вектора управления U(t) управляемость зависит от начального состояния системы и от значения составляющих вектора управления.

Рассмотренные выше понятия управляемости и наблюдаемости представляют большой интерес при синтезе оптимальных систем.

Видимо, нецелесообразно решать задачу синтеза оптимальной системы по тем координатам управления , относительно которых модель неуправляема.

С практической точки зрения наблюдаемыми переменными будут те, которые можно непосредственно измерить. Если какая-либо переменная является функцией физически наблюдаемых переменных и времени, но для ее вычисления требуются сложные вычислительные устройства, то ее считают практически наблюдаемой, хотя она по теории Калмана. Наблюдаемые на практике переменные - это те переменные, которые можно и измерять непосредственно, не используя связи, выраженные в уравнениях объекта. Этот вывод важен при решении задачи реализации закона оптимального управления.

Накладываемые на параметры Динамической системы условия, при выполнении которых система обладает свойствами управляемости и наблюдаемости. Эти свойства заключаются в следующем: пусть уравнения движения системы заданы в пространстве состояний след. обр.:

где - некоторые, в общем случае нелинейные ф-ции координат простр. состояний и входных (управляющих) воздействий простр. состояний выделены два мн-ва: . Система управляемой относительно если существует такое допустимое управление которое может перевести систему из любой точки мн-ва в одну из точек мн-ва Система полностью наблюдаемой, если существует преобразование (алгоритм, закон), по которому наблюдаемой на интервале траектории при известном и ставится во взаимно однозначное соответствие точка Указанное определение Н. и у. у. справедливо и для линейных, и для нелинейных систем.

Понятия управляемости и наблюдаемости можно распространить на любые управляемые системы (бесконечномерные и конечномерные, динамические, стохастические системы, автоматы конечные и др.). В случае конечного автомата эквивалентными управляемости и наблюдаемости являются свойства связанности и распознаваемости автомата. Автомат с мн-вом состояний сильносвязным, если существует входная последовательность, которая переводит автомат из любого заданного состояния в любое заданное состояние (Ту (г может равняться ). Характерные свойства сильносвязного автомата заключаются в том, что его всегда можно установить в любое заданное конечное состояние и всегда можно распознать.

Задача распознавания автомата представляет собой задачу определения его состояния (в том числе и начального) при помощи измерений (наблюдений) его выходов. Важной разновидностью задачи распознавания автомата является определение (с точностью до изоморфизма) его миним. формы путем измерений на его внеш. выводах.

Для линейных динамических систем ур-ние (1) перепишется в виде:

где X - -мерный вектор состояний системы, вектор входных сигналов (управления), Y - -мерный вектор выходных координат (реакций) системы; А, В, С - матрицы размерностей соответственно, определяемые параметрами системы. Определение управляемости в этом случае сужается: система полностью управляемой, если мн-во представляет собой все простр. состояний, а мн-во стягивается в точку (начало координат). Впервые необходимые и достаточные Н. и у. у. линейных систем сформулировал амер. кибернетик Р. Калман так: ранг матрицы полной управляемости) и ранг матрицы полной наблюдаемости) должны быть равны (штрих означает транспонирование).

Управляемость систем вида (2) можно установить с помощью различных эквивалентных критериев. Напр., система (2) вполне управляема, если: а) не существует инвариантного подпространства матрицы А размерности меньше , которое одновременно содержало бы все векторы-столбцы матрицы В; или б) не существует собственных векторов V матрицы А ортогональных пространству векторов матрицы В, т. е. ни для какого V. Необходимые и достаточные условия наблюдаемости также можно сформулировать для системы (2) различными эквивалентными способами; напр., система (2) вполне наблюдаема, если не существует ни одного собственного вектора матрицы А, для которого . Известны и другие определения и критерии управляемости и наблюдаемости-, сформулированные в алгебр, и геом. форме, в терминах функционального анализа, в форме проблемы отделимости мн-в и др. Различают понятия управляемости по состоянию и по выходу системы. Существенно, что понятия управляемости и наблюдаемости являются внутр. свойствами системы и сохраняются при любых эквивалентных преобразованиях ее модели математической. В частности, управляемость системы (4) не зависит от выбора системы координат.

Важным свойством конечномерных управляемых систем является независимость их свойств управляемости - от класса допустимых управлений. В случае бесконечномерных управляемых систем аналогичное свойство не установлено, равно как и сама проблема управляемости и наблюдаемости таких систем еще далека от завершения.

Полная управляемость или наблюдаемость системы нарушается при динамич. коррекции, если при введении корректирующих звеньев происходит компенсация полюсов передаточных функций звеньев системы нулями корректирующих устр-в. Тогда может оказаться,

что координаты X состояний системы разбиваются на 2 группы, причем координаты 1-й группы зависят от управления U, а координаты 2-й группы не зависят ни от U, ни от координат 1-й группы и образуют т. н. неуправляемую часть. В другом случае, если координаты 1-й группы связаны с реакцией Y, а координаты 2-й группы не связаны ни с Y, ни с координатами 1-й группы, они образуют ненаблюдаемую часть. Это явление нельзя проанализировать при описании системы передаточными ф-циями, где вследствие компенсации полюсы и нули исключаются из рассмотрения. Анализ Н. и у. у. необходим при рассмотрении задач инвариантности, автономности, синтезе оптим. фильтров и оптим. регуляторов и анализе устойчивости таких систем. Так, Р. Калман доказал теорему: решение задачи синтеза оптим. регулятора (в смысле минимума квадратичного функционала качества) возможно тогда и только тогда, когда объект полностью управляем.

Связь Н. и у. у. определяется принципом дуальности, сформулированным Р. Калманом. Назовем сопряжённой по отношению к (1) такую систему, которую описывает сопряженная по отношению к (1) система ур-ний, где Тогда, если система (1) полностью управляема, то сопряжённая система полностью наблюдаема и наоборот. Поскольку ур-ние дискретной системы в простр. состояний можно записать в виде

то все сказанное выше остается справедливым и для дискретных систем с заменой А, В, С на соответственно.

Управляемость и наблюдаемость линейных систем регулирования относится к основным понятиям теории автоматического регулирования, с помощью которых можно оценивать структурные схемы систем и выполнять преобразование путем ввода дополнительных сигналов или за счет их исключения. Если в системе автоматического регулирования сигнал управления сформированный в задатчике, представляет собой некоторую совокупность его составляющих превышает число степеней свободы системы, описанной уравнением то система является неуправляемой. Действительно, в этом случае систему регулирования нельзя перевести из начального состояния в любое конечное состояние под действием некоторого входного сигнала При системы автоматического регулирования именуют вполне управляемыми.

Линейную стационарную систему автоматического регулирования называют полностью управляемой, если из любого начального состояния ее можно перевести в конечное состояние при помощи входного сигнала в течение конечного интервала времени. Необходимое и достаточное условие полной управляемости линейной стационарной системы, описываемой уравнением

таково: матрица

размера первые столбцов которой состоят из элементов матрицы В, а следующие столбцов - из элементов матрицы и т. д., должна иметь ранг .

С понятием управляемости связано понятие наблюдаемости системы. Наблюдаемость позволяет установить начальное состояние системы автоматического регулирования по результатам измерений одного выходного сигнала.

Линейная стационарная система автоматического регулирования, описываемая уравнениями

полностью наблюдаема, если можно определить начальное состояние системы по следующий данным;

а) матрица А и С;

б) выходному сигналу от начальных условий при заданному на конечном интервале времени

Необходимое и достаточное условие полной наблюдаемости линейной стационарной системы заключается в том, что сопряженная матрица 1

типа должна иметь ранг

Рассмотрим два типа систем автоматического регулирования.

Первый тип - система имеет лишь один выходной сигнал

Для этой системы необходимым и достаточным условием полной наблюдаемости является отличие от нуля всех коэффициентов.

Второй тип - система имеет несколько выходных сигналов:

Тогда необходимым и достаточным условием полной наблюдаемости является то, что для каждого один из коэффициентов Он, не должен равняться нулю.

Пример IX. 15. Определить, является ли линейная стационарная система автоматического регулирования (рис. IX. 19, а) полностью неуправляемой и наблюдаемой. Составим уравнение состояния для этой системы в виде

Из уравнения (IX.253) следует, что матрица А имеет размерность

В этом случае формула (IX.251), по которой определяется управляемость, примет вид

Определитель матрицы (IX.255) будет что соответствует рангу матрицы К, меньщему 2. Для полной управляемости системы регулирования ранг матрицы К должен быть равен 2. Поэтому рассматриваемая система является неуправляемой.

Определим наблюдаемость системы регулирования. Для этого воспользуемся формулой (IX.252). В нашем случае

Рис. IX.19. Структурные схемы системы автоматического регулировании для примера IX.15

Подставив соответствующие сопряженные значения матриц в формулу (IX.256), получим

Определитель матрицы (IX.252) что соответствует рангу, меньшему 2. Для получения полной наблюдаемости системы регулирования ранг матрицы должен быть равен 2. Поэтому рассматриваемая система регулирования является ненаблюдаемой.

Этот результат становится очевидным из анализа передаточной функции замкнутой системы

Если сократить нуль в прямой цепи, когда полюс находится в цепи обратной связи, то получим

Из выражения (IX.259) можио найтн характеристическое уравнение замкнутой системы в виде

что указывает на неустойчивость системы регулирования.

Управляемость и наблюдаемость системы автоматизированного управления

Рассмотрим случай, когда все переменные состояния могут быть измерены, а результаты этих действий могут быть использованы для управления системой. Однако такой случай не всегда технически реализуем. Поэтому для систем автоматического управления вводится понятие управляемости.

Рассмотрим:

где - матрицы с постоянными коэффициентами.

При этом управление полагается скалярным, т.е. управление объектом осуществляется по одной координате.

Заданы начальная и конечная точка, и. Задача состоит в том, чтобы перевести систему из заданного начального положения в некоторую точку, совпадающую с началом координат. При этом никаких ограничений на величину управляющего воздействия и время регулирования не накладывается. Если такая задача решается при любых начальных и конечных условиях, то такая система является управляемой.

Система называется управляемой, если существует такое управление, которое из любого начального состояния в любое конечное положение. При каких условиях система является управляемой. Попытаемся выяснить причины неуправляемости. Это удобно сделать с помощью геометрического представления движения системы. Как отмечалось выше решение линейного однородного уравнения имеет вид:

Если какой-нибудь из коэффициентов, а остальные отличны от нуля, то движение происходит в инвариантном подпространстве матрицы. С геометрической точки зрения все траектории лежат в плоскости S, т.е. вектор также направлен вдоль этой плоскости. Предположим, что вектор тоже лежит в плоскости. Очевидно, что добавка к вектору величины оставляет вектор в той же плоскости, хотя и деформирует траекторию движения вектора состояния. Следовательно, если начальная точка лежит в плоскости, а конечная -- нет, то попасть в точку с заданными координатами нельзя, так как не существует управления, которое переводит состояние системы с заданными параметрами из начальной точки в конечную. Такая система неуправляема по определению.

Условия управляемости в терминах исходной системы получены Калманом и имеют вид:

Для управляемости системы (1) необходимо и достаточно, чтобы выполнялось условие вида

Это условие выполняется, если матрица U вида

имеет ранг, равный N.

Рангом матрицы называется наибольший порядок ее определителя, отличный от нуля.

Рассмотрим поведение системы в пространстве состояний собственных векторов матрицы А (для простоты будем полагать, что собственные значения матрицы А -- действительные и различные). Как мы убедимся в дальнейшем, в этом пространстве условия управляемости становятся практически очевидными. Введем неособое преобразование вида

Выше отмечалось, что и существует. Поэтому вектора X и Y связаны однозначной зависимостью. Следовательно, задачи об управляемости в пространствах этих переменных эквивалентны.

В пространстве новых переменных

поведение САУ описывается уравнением

Рассмотрим произведение

Следовательно, уравнение (4) приводится к виду

Вектор столбец с компонентами.

Так как матрица Р диагональная, то

и если хотя бы одно, то координата -- неуправляема. Поэтому можно предположить, что, если все, то система управляема.

Рассмотрим n-мерное пространство состояния Х, в котором каждому состоянию системы соответствует некоторое положение изображающей точки, определяемое значениями фазовых координат.

Пусть в пространстве состояния заданы два множества и. Рассматриваемая система будет управляемой, если существует такое управление, определенное на конечном интервале времени, которое переводит изображающую точку в пространстве Х из подобласти в подобласть.

Можно сузить определение управляемости и понимать под ней возможность перевода изображающей точки из любой области пространства состояний Х в начало координат. Система будет управляемой, если каждое состояние управляемо в этом смысле.

От пространства состояний Х перейдем к другому пространству посредством неособого преобразования, причем, где -- матрица коэффициентов.

Тогда вместо уравнения вида

где j -- матрица возмущающих и задающих воздействий,

u -- матрица-столбец управляющий величин,

y -- матрица-столбец регулируемых величин,

x- матрица-столбец фазовых координат,

будем иметь

Здесь использованы преобразованные матрицы коэффициентов:

Введение новых фазовых координат посредством неособого преобразования

приводит к эквивалентным системам различной структуры. При некотором преобразовании может оказаться, что часть управляющих величин не входит в некоторые дифференциальные уравнения (7) или часть фазовых координат не участвует в формирование вектора выходного сигнала. В первом случае система не будет полностью управляемой, а во втором -- полностью наблюдаемой.

В случае не полностью управляемой системы ее исходное уравнение могут быть представлены в виде

Это иллюстрирует рис. 7. Набор фазовых координат соответствует управляемой части фазовых координат, а набор -- неуправляемой части.

Рис. 1.

Калманом был доказан критерий управляемости, который гласит, что размерность управляющей части системы, то есть порядок первой группы уравнений (7) совпадает с рангом матрицы

где k -- размерность управляющего вектора.

При система полностью управляема, при -- система не полностью управляема, при -- система полностью не управляема.

Рис. 2.

На рис. 8 представлен простейший пример. Если рассматривать выходную величину при нулевых начальных условиях, то можно записать

определяются начальными условиям до приложения входного сигнала, а -- вынужденная составляющая. Система устойчива при.

Если начальные условия до приложения управляющего сигнала были нулевыми, то поведение системы может быть рассчитано по передаточной функции

В этом случае переходный процесс в системе определяется как

управляемость наблюдаемость автоматизированный калман

Как следует из последнего выражения, во втором случае система описывается дифференциальным уравнением не третьего, а второго порядка. Система будет устойчивой даже при.

Рассмотренная система будет не полностью управляемой. В ней оказывается, а.

При введении второй составляющей управления система оказывается полностью управляемой, и ей будет соответствовать матрица-строка передаточный функций по управлению

В случае не полностью наблюдаемой системы ее уравнения могут быть представлены в виде

Эти уравнения отличаются от (7) тем, что фазовые координаты группы не входят ни в выражения для и, ни в первое уравнение, куда входят фазовые координаты группы. Группа фазовых координат относится к ненаблюдаемым.

Калманом показано, что порядок первой группы уравнений совпадает с рангом матрицы V вида

При система полностью наблюдаема, при -- система не полностью наблюдаема, при -- система полностью ненаблюдаемая.

На рис. 9 изображен простейший пример. Для него легко показать, что в формировании выхода участвуют только две фазовые координаты из трех.


Рис. 3.

В общем случае система может содержать четыре группы фазовых координат:

управляемую, но ненаблюдаемую часть,

управляемую и наблюдаемую часть,

неуправляемую и ненаблюдаемую часть,

неуправляемую но наблюдаемую част.

Исходные уравнения системы (7) можно для самого общего случая записать следующим образом:

Левая часть характеристического уравнения

где Е -- единичная матрица размера, системы в этом случае содержит четыре сомножителя:


Управляемость и наблюдаемость системы в изложенном смысле не всегда совпадает с практическими представлениями. Даже если какая-либо фазовая координата и может быть вычислена по доступным для измерения выходным величинам обработка измеренных величин может быть, во-первых, сложной и, во-вторых, она может быть затруднена наличием помех. Поэтому практически наблюдаемыми координатами обычно считаются те из них, которые могут быть измерены датчиками различных типов.



Открытие бизнеса