Евразийский
научный
журнал
Заявка на публикацию

Срочная публикация научной статьи

+7 995 770 98 40
+7 995 202 54 42
info@journalpro.ru

Оценка степени адаптации особого управления для автономных динамических систем

Поделитесь статьей с друзьями:
Автор(ы): Иванов Владимир Петрович
Рубрика: Физико-математические науки
Журнал: «Евразийский Научный Журнал №12 2015»  (декабрь 2015)
Количество просмотров статьи: 2744
Показать PDF версию Оценка степени адаптации особого управления для автономных динамических систем

Иванов Владимир Петрович,

старший научный сотрудник, Санкт-Петербургский научный центр,
Санкт-Петербургский институт информатики и автоматизации РАН,
Россия, г. Санкт-Петербург
E-mail: vpivanov.spb.su@gmail.com

В статье рассматривается метод оценки степени особого управления для автономных динамических систем. Так как траектория динамических систем в общем случае является огибающей семейства параметрических поверхностей, то по степени деформации параметрической поверхности можно судить о степени адаптации управления. Такой подход в ряде случаев позволяет дать оценку достоверности используемой математической модели управляемого объекта и, следовательно, сферы ее практического использования.

Ключевые слова: оптимальное управление, адаптивное управление, особое управление, автономные динамическое системы, огибающие.


Введение

К настоящему времени существует достаточно разработанная общая теория оптимального управления, которая позволяет решить задачу «в принципе». Однако известно, что от общих воззрений до конкретного результата зачастую лежит достаточно большая дистанция, в том числе и в случае численного решения поставленной задачи. Причина заключается в проблемах устойчивого решения краевой задачи, «машинного нуля», вычислительной устойчивости используемых методов и т.д. Поэтому требуется искать подходы, основанные на иной интерпретации известных теорий. Один из таких основан на представлении траектории в фазовом пространстве как огибающей семейства параметрических поверхностей. Управление в этом случае ищется на указанном семействе как функция от некоторого параметра. Изменение параметра во времени отражает степень деформации параметрической поверхности. Если задаться ее определенной нормой, то по отклонению от нее можно судить о степени полноты используемой математической модели и, следовательно, о необходимости ее корректировки и, соответственно о необходимости синтеза управления в другой форме.


1. Постановка задачи

Рассмотрим автономную динамическую систему вида:


(1)


где: ‑ действительная переменная; ; ‑ открытое множество вещественной оси ; ; ‑ вектор состояния действительного ‑мерного пространства; и ‑ заданные вектор-функции; ; ‑мерный вектор управления; ; ‑ заданное множество допустимых управлений; .

Задан терминальный функционал:

(2)

определенный на решениях системы уравнений (1). ‑ некоторая функция; .

В момент могут быть заданы дополнительные условия вида

(3)

которые могут быть включены в функционал (2) через дополнительные множители Лагранжа.

Так как система уравнений (1) автономная, то множество допустимо сузить до отрезка , где ‑ начальное значение аргумента . Момент времени не фиксирован.

Значения полагаются известными.

Для построения управления, минимизирующего функционал (2), введем вектор-функцию множителей Лагранжа и составим гамильтониан задачи оптимизации :

(4)

С использованием функции в пространстве переменных , уравнения для и запишутся в следующей канонической форме:

(5)

Отметим, что и на оптимальном решении непрерывны и к этому же приводит аналог условия Эрдмана–Вейерштрасса классического вариационного исчисления. Непрерывность сохраняется и в том случае, когда правые части уравнений (1) терпят разрыв.

Для оптимального управления и фазовой траектории в рамках принципа максимума необходимо существование такого ненулевого вектора , что выполняются следующие условия [1, 2]:

1) Функция переменного при каждом , т.е. при фиксированных , достигает при минимума:

. (6)

Таким образом, оптимальное управление определяется как:

. (7)

2) Выполняются условия трансверсальности:

, (8)

где ‑ произвольные вариации соответствующих переменных; — вектор констант.

Обобщенные условия трансверсальности в силу независимости вариаций приводят к соотношениям:

(9)

Непосредственным следствием системы уравнений (5) и условия (6) является выполнение соотношения: .

С учетом (9) для автономных динамических систем при незаданном явно аргументе имеем:

(10)

Из выражений (6) для внутренних точек множества допустимых управлений получим:

Из чего следует, что формально любое управление удовлетворяет условию первой вариации функционала. Такая неопределенность порождает особый случай нахождения оптимального управления. В работе [2] доказывается, что особое управление для динамических систем вида (1) может быть найдено из соотношений:

(11)

( ‑ порядок сингулярности) при выполнении следующих необходимых условий оптимальности:

(12)

если .

Из системы уравнений (11) с учетом соотношений (12) следует, что особое оптимальное управление определяется как

Отметим, что если в начальный момент времени значения известны (или могут быть оценены), то вектор определен (с точностью до констант) лишь на правом конце фазовой траектории. Возникает специфическая краевая задача, после решения которой («в принципе») тем или иным способом можно найти , а, следовательно, и . Однако, вычислительные трудности, стоящие на этом пути, методические ошибки численных методов и ошибки округлений делают процесс нахождения достоверных значений весьма трудным, а зачастую (например, при выполнении требования реального масштаба времени) и невозможным. Поэтому представляется желательным использовать нетрадиционные методы синтеза оптимального управления, одним из которых, в частности, является метод огибающих.

В статье [] доказывается, что оптимальная траектория динамической системы в фазовом пространстве, определяемая в смысле минимизации функционала (2), является огибающей семейства параметрических поверхностей с выделением на них семейства так называемых мгновенных решений, проведенных из каждой ее точки, и что оптимальное управление может быть найдено на семействе мгновенных решений.

Представим уравнение (10) в следующем виде:

. (13)

Введем непрерывную функцию такую, что и , и приведем уравнение (13) к уравнению Гамильтона-Якоби:

. (14)

Так как функция входит в уравнение (14) только своими частными производными, то она определяется с точностью до аддитивной постоянной ., т.е.: , где ‑ вектор независимых параметров, а ‑ решение уравнения (14).

Для построения огибающих (см.[]), потребуем, чтобы


(15)

где ‑ параметры, такие, что .

Построим огибающие относительно параметров .

Если , то уравнение (14) будет иметь решения:

. (16)

С другой стороны, если ‑ полный интеграл уравнения (14), то по теореме Якоби имеем:

. (17)

Потребуем, чтобы и удовлетворяли преобразованию гамильтониана в гамильтониан , а также каноническим уравнениям, которые, ввиду (14), запишутся как

. (18)

Из (14-18) следует, что оптимальные траектории являются огибающими ‑параметрического семейства поверхностей.

Представим функцию в виде суммы функций, каждая из которых зависит только от одной из переменных , т.е.:

. (19)

Определим канонические переменные :

. (20)

Согласно выражениям (20), переменные оказываются функциями только одной и , в то время, как уравнения (1), (5), (17) говорят о том, что в общем случае должны быть функциями всех и остальных . Это противоречие может быть устранено, если приравнять некоторые определенные комбинации переменных , «замороженных» в данный момент времени, т.е.:

. (21)

Из полученных выражений следует, что и управление , можно определить на параметрическом семействе поверхностей, которое огибает оптимальная траектория, если в качестве параметров соответствующим образом взять фазовые координаты. Фиксируя в качестве параметров «замороженные» в текущий момент времени значения фазовых координат, мы тем самым на семействе поверхностей определим семейство кривых. Назовем их мгновенными решениями, поскольку они определяются функцией , являющейся решением уравнения (14).

С другой стороны, соотношения (16)‑(21) говорят о том, что для построения мгновенных решений можно следующий подход, а именно производить условное разделение переменных в уравнении Гамильтона-Якоби (см. [3]).

Отметим, что мгновенные решения должны удовлетворять условию минимизации функционала (2) относительно используемых параметров.

Таким образом, оптимальная траектория динамической системы в фазовом пространстве является огибающей семейства мгновенных решений, проведенных из каждой ее точки.

Представим уравнения (5) для в следующей форме:

(22)

Преобразуем это уравнение к виду:

, (23)

где: , .

Проинтегрировав уравнение (25), получим:

, (24)

Постоянные находятся из условий трансверсальности (9).

Первоначально рассмотрим случай, когда порядок сингулярности равен единице. Тогда особое управление можно найти из системы уравнений (см. [2]):

. (25)

Из первых двух уравнений системы (25) следует, что . Разрешим это уравнение относительно переменной . Если корень существует, то:

. (26)

Тогда третье уравнение системы (25) после преобразований запишем как:

.

Из последнего соотношения можно найти особое управление:

(27)

при выполнении необходимых условий оптимальности в следующей форме:

. (28)

Отметим, что корень уравнения необязательно может быть единственным. Тогда каждый корень проверяется на выполнение необходимых (30) и достаточных (2) условий оптимальности.

Отметим также, что на мгновенном решении .

В некоторых случаях параметр увязывается с геометрическими соотношениями на плоскости или в пространстве.

В случае нулевого порядка сингулярности (см. (26)) либо сохраняет знак, либо становится равным нулю лишь в одной точнее на конце отрезка. Дополнив условие условиями первого порядка сингулярности, мы приходим к аналогичному выражению.

В случае, когда порядок сингулярности превышает единицу, то, выделив условие сингулярности первого порядка , или, соответственно, , а затем, продифференцировав его раз, можно найти особое управление как:

. (29)

Следовательно, особое оптимальное управление в рамках заданного терминального критерия оптимальности можно найти на семействе мгновенных решений. Можно утверждать, что производные адаптируют мгновенные решения к динамической системе или (в более широком смысле) к неточным описаниям динамической системы.

Ведущей является производная первого порядка и по ней удобно производить различные оценки качества управления в виде (29). Если реальные правые части системы уравнений (1) отличаются от модельных, т.е. заданных этими уравнениями, то такое отличие будет приводить к появлению производной , отличающейся от полученной на «эталонной» математической модели динамической системы. Обозначим ее как . Если значения производных существенно превышают норму , то это в свою очередь означает, что математическая модель, динамической системы вида (1) не совсем адекватно описывает ее поведение во времени. Следовательно, требуется ее корректировка и, соответственно, новый синтез управления динамической системой. Таким образом, норму можно считать оценкой достоверности математической модели динамической системы, а отклонение от нормы в абсолютном или относительном значении за оценку степени адаптации особого управления к неточным описаниям модели автономных динамических систем вида (1).

Заключение

Обобщая полученные выше результаты, можно сделать следующие выводы:

  1. оптимальную траекторию динамической системы в фазовом пространстве можно представить как огибающую семейства мгновенных решений, проведенных из каждой ее точки;

  2. оптимальное управление может быть найдено на семействе мгновенных решений из конкретных соотношений, складывающихся на тот или иной момент времени.

Литература

  1. Болтянский В.Г. Математические методы оптимального управления. – М.: Наука, 1969. – 408 с.

  2. Габасов Р., Кириллова Ф.М. Особое оптимальное управление. – М.: Наука, 1973. – 256 с.

  3. Иванов В.П. Метод синтеза особого оптимального управления для автономных динамических систем. //Вестник Бурятского государственного университета. Математика, информатика. 2015, №2. – С.62-70.



Иванов Владимир Петрович, кандидат технических наук, Санкт-Петербургский научный центр, доцент Санкт-Петербургского института, информатики и автоматизации РАН, e-mail: vpivanov.spb.su@gmail.com, тел. 8(911) 918–5719.