Рассматривается численный алгоритм для поиска субоптимального управления для систем, заданных разностными уравнениями. С использованием численного метода удается найти изобеллы уровня 1 и 0, нахождение которых позволяет найти субоптимальное управление, не решая систему, в которой присутствует функция Беллмана, вычисление которой затруднительно. С использованием описанной численной процедуры решается пример, полученный результат сравнивается с аналитически найденым оптимальным управлением.
1. ВВЕДЕНИЕ
Задачи оптимального управления по вероятностным критериям качества составляют предмет изучения специального раздела теории стохастического оптимального управления. Основным алгоритмом решения данного типа задач является метод динамического программирования (МДП). Использование данного метода сопряжено с сложностью получения аналитического решения. Это подтверждается тем, что для достаточно простых систем получаемые решения имеют сложную структуру и их вычисление затруднительно, например, в работах [1, 2].
В данной статье предложен численный алгоритм для поиска субоптимального управления для задач с вероятностным точностным функционалом, который позволяет получать решение без вычисления функции Беллмана.
2. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ


3. ОПРЕДЕЛЕНИЕ ИЗОБЕЛЛ И ТЕОРЕМА О ДВУХСТОРОННЕЙ ОЦЕНКЕ ФУНКЦИИ БЕЛЛМАНА



4. ЧИСЛЕННЫЙ МЕТОД РЕШЕНИЯ ЗАДАЧ СТОХАСТИЧЕСКОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИСКРЕТНЫМИ СИСТЕМАМИ ПО ВЕРОЯТНОСТНОМУ КРИТЕРИЮ



5. ПРИМЕР
Теория синтеза оптимального управления используется для решения задач из аэрокосмической отрасли, например, задача импульсной коррекции траектории космического аппарата (КА) на геостационарной орбите с помощью корректирующей установки малой тяги. Отклонение КА возникает из-за внешних возмущений и неопределенных факторов, возникающих из-за погрешности и ошибок в вычисление координат и различных параметров системы.
Проверим сформулированный алгоритм на подобной упрощенной модели и сравним с известным оптимальным управлением.


Рис 1. Множество U1I (x1)

Рис 2. Множество U0I (x0)
Приведем сравнения значения управления аналитического и численного значения при k=1 и количество итераций 10000:
Таблица 1. Сравнение аналитического и численного значения управления при k=1
|
x |
Аналитическое |
Численное |
Погрешность |
|
25 |
-23,333333 |
-23,310258 |
0,023075 |
|
30 |
-26,666667 |
-26,665936 |
0,000731 |
|
35 |
-30,000000 |
-30,015987 |
0,015987 |
|
40 |
-33,333333 |
-33,372321 |
0,038987 |
|
45 |
-36,666667 |
-36,645617 |
0,021050 |
|
50 |
-40,000000 |
-39,934600 |
0,065400 |
|
55 |
-43,333333 |
-43,312343 |
0,020990 |
|
60 |
-46,666666 |
-46,656306 |
0,010360 |
|
65 |
-50,000000 |
-49,945092 |
0,054908 |
|
70 |
-53,333333 |
-53,330231 |
0,003102 |
|
75 |
-56,666666 |
-56,663306 |
0,003360 |
|
80 |
-60,000000 |
-59,999230 |
0,000770 |
|
85 |
-63,333333 |
-63,333223 |
0,000110 |
|
90 |
-66,666666 |
-66,621266 |
0,045400 |
|
95 |
-70,000000 |
-69,932910 |
0,067090 |
|
100 |
-73,333333 |
-73,290328 |
0,043005 |
Следует отметить, что численные результаты достаточно близки к аналитическим значениям.