Достаточные условия существования Н∝ -наблюдателя состояния линейных непрерывных динамических систем

56

Аннотация

В статье рассматривается проблема нахождения Н- наблюдателя вектора состояния линейных непрерывных нестационарных динамических систем при наличии неопределенности задания начальных условий, ограниченных внешних воздействий и погрешностей измерения на конечном промежутке времени. Сформулированы и на основе принципа расширения доказаны достаточные условия существования наблюдателя. Получены соотношения для нахождения параметров наблюдателя и наихудших законах изменения внешних воздействий и погрешностей измерений. Как предельный случай рассмотрена задача синтеза наблюдателя для стационарных линейных динамических систем на полубесконечном промежутке времени. Решены две прикладные задачи оценивания вектора состояния самолета по результатам неполных и неточных измерений.

Общая информация

Ключевые слова: робастное оценивание, наблюдатель состояния, условия проживания, специальные условия, принцип расширения, структурированный игровой подход

Рубрика издания: Анализ данных

Тип материала: научная статья

DOI: https://doi.org/10.17759/mda.2023130202

Получена: 12.04.2023

Принята в печать:

Для цитаты: Пантелеев А.В., Яковлева А.А. Достаточные условия существования Н∝ -наблюдателя состояния линейных непрерывных динамических систем // Моделирование и анализ данных. 2023. Том 13. № 2. С. 36–63. DOI: 10.17759/mda.2023130202

Полный текст

Введение

Задачи и методы нахождения управления составляют основу современной теории управления [1-6]. Они дополняют классические постановки задач синтеза оптимальных законов управления по различным критериям. При решении различных задач в данной области обычно применяется метод пространства состояний, частотный подход и метод линейных матричных неравенств [7-13]. Задача робастного оценивания координат вектора состояния по результатам измерений изучалась в [14-22]. Среди них выделим работу [19] , в которой с помощью применения принципа максимума и игрового подхода найдены соотношения, определяющие матрицу коэффициентов усиления наблюдателя и наихудшие законы изменения возмущений и погрешностей как функции времени. В [23] для решения игровой задачи предложено использовать обучение с подкреплением. Приложение теории построения робастных наблюдателей в задачах управления летательными аппаратами рассмотрено в [24,25].

В данной статье сформулированы достаточные условия синтеза наблюдателя. Доказательство построено на основе принципа расширения [26-28]. Это позволило получить выражения для управления процессом оценки вектора состояния и законы наихудшего противодействия со стороны внешних воздействий и погрешностей измерения в форме обратных связей по ошибкам оценивания. С применением полученных соотношений решены две задачи оценивания вектора состояния самолетов для нестационарной модели с конечным временем функционирования и для стационарной модели с полубесконечным временем [13].

Постановка задачи

Заданы математическая модель объекта управления

                                                (1)

и модель измерительной системы

                                                                                    (2)

где вектор состояния,  вектор возмущений,  вектор выхода (вектор измерений),  вектор ошибок и погрешностей измерений,  время,  заданное положительное число. Заданы непрерывные  матрицы , размеров    соответственно. 

Предполагается, что:

а), ,

б) ;

в)  невырожденная матрица.

Ставится задача о нахождении оценки  вектора состояния  по результатам накопленной информации, полученной от измерительной системы, т.е. . При этом требуется минимизировать величину ошибки оценивания  в условиях неопределенности информации о векторе начальных состояний , законах изменения векторов возмущений и ошибок измерений.

Предположим, что структура наблюдателя состояния описывается уравнением

                                         , (3)

где  вектор оценок координат вектора состояния,  неизвестная непрерывная матрица размеров вектор начальных значений оценок координат вектора состояния, задаваемый исходя из имеющейся априорной информации о возможных начальных состояниях модели объекта управления (1). Матрица  выполняет функцию управления процессом наблюдения.

Получим уравнение, описывающее изменение ошибки оценивания, вычитая из уравнения (1) уравнение (3) с учетом (2) и обозначения :                                   

                ,

                            , .                                                       (4)

Далее для упрощения записи зависимость матриц математической модели от времени опущена. Также будет использоваться обозначение взвешенной нормы  где  заданная положительно полуопределенная симметрическая матрица.

Требуется обеспечить (если это возможно) выполнение неравенства:                                                          

                                (5)

где  симметрические положительно определенные матрицы соответствующих размеров,  заданное неотрицательное число. При этом желательно найти минимальное значение , при котором указанные свойства еще справедливы, минимизируя значение числителя дроби при одновременной максимизации знаменателя.

Иными словами, функционал качества управления наблюдателем состояния должен удовлетворять условию

            ,           (6)

которое будет выполняться при минимизации затрат на управление процессом оценивания при наихудшем влиянии возмущений, начального состояния и ошибок измерений. Множитель ½ добавлен для уменьшения громоздкости записи после дифференцирования.

Требуется найти наилучшую матрицу  наблюдателя (3), наихудшие законы управления внешним воздействием  и погрешностью измерений , наихудший вектор начальных состояний , обеспечивающие выполнение условия (6).

Синтез  наблюдателей состояния

Сформулируем поставленную задачу как игровую, где первый игрок – матрица , выбирается при каждом  из условия минимизации значения функционала, а второй игрок ‑ составной вектор , из условия его максимизации:

                                                      . (7)

Будем считать, что второй игрок при фиксированном действии первого игрока стремится максимизировать величину функционала, характеризующую интегральную ошибку оценивания. Поэтому сначала рассмотрим задачу максимизации функционала по , или, что то же самое, минимизации функционала, отличающегося знаком:

             (8)

Будем использовать достаточные условия оптимальности В.Ф.Кротова [26,27] для задачи

,

где  – вектор состояния системы,   – вектор управления,   – некоторое заданное множество; – время,  – промежуток времени функционирования системы, моменты времени  и  заданы, ; внешние воздействия на объект управления отсутствуют,  – непрерывно дифференцируемая функция;  множество допустимых процессов, т. е. множество пар  образуемых траекториями  и управлениями  , в которых , функции  непрерывны и кусочно-дифференцируемы, а  кусочно-непрерывны, удовлетворяют дифференциальному уравнению системы и начальному условию.

Утверждение (частный случай достаточных условий оптимальности [26,27]). Для того чтобы элемент  был минималью, достаточно существования такой функции , чтобы выполнялись два условия:

  1.  
  2. ,

где

                                      (9)

                                                            (10)

Функцию  и величину  без ограничения общности можно положить равными нулю. При этом минимальное значение функционала .

Доказательство. Применим принцип расширения [26-28]. Определим множество  пар  где элементы пар по сравнению с входящими в множество  необязательно связаны дифференциальным уравнением , , допускаются разрывы первого рода функций  на множестве . Таким образом, множество  и расширение построено.

Доопределение функционала  на множестве  производится с помощью задания функции . На множестве  определим функционал:               .

На множестве , где между функциями  существует дифференциальная связь, с учетом равенства  справедливо               

и поэтому     

Таким образом, на множестве  функционалы  и  совпадают. Поведение функционала  на множестве  полностью определяется выбором функции .

Пусть имеется функция . Найдем минимум функционала  на множестве . Операции нахождения экстремума в первых двух слагаемых могут быть выполнены по отдельности в силу свойств функций , образующих пары . Тогда                             .

Из условий 1) и 2) следует, что , т.е. .Поскольку , то . Но на множестве  справедливо тождество . Поэтому , что соответствует определению минимума функционала  на множестве .

Если существует функция , удовлетворяющая условиям 1), 2) утверждения при  то, применяя прямую подстановку в , , можно показать, что функция  также удовлетворяет этим условиям при , . В этом случае из доказанного утверждения и выражения для  следует                                .

Доказательство закончено.

Замечание 1. В решаемой задаче   .

Пусть имеется функция . Составим конструкции (9),(10) для функционала (8) и модели динамической системы, описываемой уравнением (4) для ошибки оценивания:

                                                              (11)                                                

где .

Используем правила векторного дифференцирования [29]:   (если матрица  симметрическая, то ),  и свойства операции транспонирования .

Найдем максимум функции  по переменным , используя необходимые условия безусловного экстремума:                                          ,           .

Отсюда

            ,       .            (12)

Проверим выполнение достаточных условий максимума:                                         ,

так как , , а определитель блочно-диагональной матрицы равен произведению определителей блоков.

Тогда                   

Так как для матриц-столбцов справедливо равенство , то можно использовать правила нахождения матричных градиентов [30]:                                        .

Заметим, что                                                      .          

Тогда 

Отсюда                  

                                     (13)

Будем искать функцию  в форме

                                                             ,      (14)

где неизвестная симметрическая матрица порядка .

Тогда  и из (12),(13) получаем

                                                       ,       ,            (15)

                         (16)

Запишем равенство 1) из достаточных условий оптимальности с учетом , подставляя в выражение  вместо  формулу (16), т.е.                                                              

Используя условие равенства нулю квадратичной формы , получаем                       

С учетом равенства  имеем  и . Тогда, умножая уравнение на матрицу  слева и справа, получаем               

или                                          (17)

Выпишем условие 2) из достаточных условий оптимальности      

Отсюда следует граничное условие для уравнения (17):

                                                                        .                 (18)

Частный случай (линейные стационарные системы с полубесконечным промежутком функционирования).

Рассмотрим случай, когда матрицы системы (1),(2) не зависят от , а момент окончания процесса функционирования системы :                                                         

Структура наблюдателя состояния (3) имеет вид                             .            

Требуется обеспечить (если это возможно) выполнение неравенства:                         

где  симметрические положительно определенные матрицы соответствующих размеров,  заданное неотрицательное число.

Тогда

                                   (19)

                        ,    ,               

где матрица  положительно определенное решение алгебраического уравнения Риккати

                                                (20)

Замечание 2. В правую часть математической модели объекта (1) может входить слагаемое с управлением:                               

при этом модель измерительной системы остается без изменений:                                                        

где вектор состояния,  вектор возмущений, вектор управлений;  вектор выхода (вектор измерений),  вектор ошибок и погрешностей измерений,  время,  заданное положительное число. Заданы непрерывные матрицы , размеров      соответственно.

Тогда структура наблюдателя состояния описывается уравнением

                     .            (21)

При этом уравнение, описывающее изменение ошибки оценивания, не изменяется, и сохраняются формулы для нахождения .

Пример 1

Рассмотрим задачу синтеза наблюдателя в системе управления самолетом L-1011 [13], описываемой моделью нестационарной системы на конечном промежутке времени.                             В рассматриваемой задаче , , .

Тогда уравнение модели объекта управления (1) имеет вид

Уравнение измерительной системы (2):                                

где погрешности измерений описываются выражением:                   

Закон управления самолетом  имеет вид [13]                                                 

где функция  удовлетворяет дифференциальному уравнению                     

Уравнение для синтеза наблюдателя с учетом замечания 2 принимают форму

При решении задачи предлагается применить следующую методику.

  1. Найти матрицу решение дифференциального уравнения Риккати              

2.Найти матрицу коэффициентов усиления наблюдателя

  1. Найти наихудшие законы изменения возмущения и погрешности измерений:                                    .
  2. Оценить эффективность наблюдателя, исследуя динамику изменения ошибки наблюдения:

Для этого моделировать работу наблюдателя при ограниченных возмущениях и погрешностях измерений вида

где  положительные числа.

Матрицы ,  и  в (5) подбираются таким образом, чтобы обеспечивать корректный синтез наблюдателя в системе, а также желаемый вид переходных процессов в системе. Вид внешних воздействий и погрешностей измерения, а также подобранные матрицы, представлены в табл. 1.

Таблица 1

Параметры моделировани

На рис. 1-3 отражены результаты моделирования системы управления совместно с наблюдателем состояния при различных начальных условиях:

а) , б) .

Начальные условия для оценки вектора состояния: .

   

а)

б)

Рис.1 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.2 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.3 Переходные процессы для координаты  и ее оценки  

 

На рис. 4-6 представлены результаты моделирования системы с двумя различными начальными условиями для вектора состояния объекта и вектора его оценок:

а) , ;

б) , .

   

а)

б)

Рис.4 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.5 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.6 Переходные процессы для координаты  и ее оценки  

 

На рис. 7-9 представлены результаты моделирования системы с двумя различными начальными условиями: а) , б) .

Начальные условия для оценки вектора состояния: .

   

а)

б)

Рис.7 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.8 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.9 Переходные процессы для координаты  и ее оценки  

Анализ полученных результатов моделирования позволяет судить о стремлении ошибки оценивания к нулю при различных начальных условиях движения (при изменении параметра М переходные процессы аналогичны представленным).

Пример 2

Рассмотрим задачу синтеза наблюдателя в системе управления самолетом L-1011 [13], описываемой моделью стационарной системы на полубесконечном промежутке времени.             В рассматриваемой задаче , , .

Тогда уравнение модели объекта управления (1) имеет вид.

Уравнение измерительной системы (2):                                   .

Возмущение , а погрешность измерений:                              

Закон управления [13] имеет вид                 ,

где                          

При решении задачи предлагается применить следующую методику.

  1. Найти матрицу положительно определенное решение алгебраического уравнения Риккати                
  2. Найти матрицу коэффициентов усиления наблюдателя
  3. Найти наихудшие законы изменения возмущения и погрешности измерений:    ,    .            (22)
  1. Оценить эффективность наблюдателя, исследуя динамику изменения ошибки наблюдения:          , .

Для этого моделировать работу наблюдателя при ограниченных возмущениях и погрешностях измерений вида:                                          

где  положительные числа.

Матрицы ,  и  в (5) подбираются таким образом, чтобы обеспечивать корректный синтез наблюдателя в системе, а также желаемый вид переходных процессов. Вид внешних воздействий и погрешностей измерения, а также подобранные матрицы, представлены в табл. 2.

                                                                                                                                                    Таблица 2

Параметры моделирования    

На рис. 10-13 представлены результаты моделирования системы с различными начальными условиями: а) , б) .

Начальные условия для оценки вектора состояния: .

   

а)

б)

Рис.10 Переходные процессы для координаты  и ее оценки  

 

   

а)

б)

Рис.11 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.12 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.13 Переходные процессы для координаты  и ее оценки  

На рис. 14-17 представлены результаты моделирования системы с различными начальными условиями для вектора состояния и его оценки:

а)

б)

   

а)

б)

Рис.14 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.15 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.16 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.17 Переходные процессы для координаты  и ее оценки  

На рис. 18-21 представлены результаты моделирования системы при воздействии на систему наихудших возмущений и погрешностей измерений (22). Начальные условия для вектора состояния объекта и оценки вектора состояния:

а)

б)

   

а)

б)

Рис.18 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.19 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.20 Переходные процессы для координаты  и ее оценки  

 

   

а)

а)

Рис.21 Переходные процессы для координаты  и ее оценки  

На основании рис. 10-21 можно сделать вывод, что предложенный подход к синтезу наблюдателя системы позволяет получить достаточно точную оценку координат вектора состояния и желаемое качество переходных процессов в условиях неполной информации о состоянии объекта,  ограниченных начальных условиях, внешних воздействиях и погрешностях измерений.

Для произведения вычислений и моделирования использовалась система компьютерной математики MATLAB.

Заключение

В статье сформулированы и на основе принципа расширения доказаны достаточные условия существования наблюдателя. Получены соотношения для нахождения параметров наблюдателя и наихудших законов изменения внешних воздействий и погрешностей измерений. Решены две прикладные задачи оценивания вектора состояния самолета по результатам неполных и неточных измерений. На основании полученных результатов можно сделать вывод, что предложенный подход к синтезу наблюдателя позволяет получить достаточно точную оценку вектора состояния, обеспечивает желаемое качество переходных процессов и обеспечить асимптотическую устойчивость системы в условиях неполной информации. Предложенный метод оценивания вектора состояния может быть применен к различным задачам управления, например, при проектировании автопилотов или систем автоматической навигации летательных аппаратов.

Литература

  1. Koobloch H. W., Isidori A.. Flockerzi D. Topics in control theory. DMV-Seminar; Bd. 22, Basel; Springer, 1993.
  2. Doyle J., Francis B., Tannenbaum A. Feedback Control Theory. Macmillan Publishing Co, 1990.
  3. Skogestad S., Postlethwaite I. Multivariable Feedback Control: Analysis and Design. John Wiley and sons, 2005.
  4. Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. М.: Наука, 2002.
  5. Green M., Limebeer D.J.N. Linear Robust Control. Dover Publications, 2012.
  6. Simon D. Optimal State Estimation. Kalman, , and Nonlinear Approaches. John Wiley and sons, 2006.
  7. Курдюков А. П., Андрианова О. Г., Белов А. А., Гольдин Д. А. Между и  теориями управления // Автоматика и телемеханика. 2021. № 4, C. 8–76.
  8. Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных матричных неравенств. М.: Физматлит, 2007.
  9. Поляк Б.Т., Хлебников М.В., Щербаков П.С. Управление линейными системами при внешних возмущениях: Техника линейных матричных неравенств. М.: URSS/ЛЕНАНД, 2014.
  10. Хлебников М.В., Поляк Б.Т., Кунцевич В.М. Оптимизация линейных систем при ограниченных внешних возмущениях (техника инвариантных эллипсоидов) // Автоматика и телемеханика. 2011. № 11, С. 9–59.
  11. Поляк Б.Т., Хлебников М.В., Рапопорт Л.Б. Математическая теория автоматического управления. М.: URSS/ЛЕНАНД, 2019.
  12. Gadewadikar J., Lewis F.L., Abu-Khalaf M. Necessary and Sufficient Conditions for H-infinity Static Output-Feedback Control // Journal of Guidance, Control, and Dynamics. Vol.29, no. 4, 915–920 (2006).
  13. Chang J.-L., Wu T.-C. Dynamic Compensator-Based Output Feedback Controller Design for Uncertain Systems with Adjustable Robustness // Journal of Control Science and Engineering. Vol. 2018, Article ID 5806787.
  14. Баландин Д.В., Коган М.М. Минимаксный подход к синтезу оптимального управления при неопределенных начальных условиях // Автоматика и телемеханика. 2009. № 11, C. 3–12.
  15. Баландин Д. В., Коган М. М. Минимаксная фильтрация: -оптимальные наблюдатели и обобщенные -оптимальные фильтры // Автоматика и телемеханика. 2013. № 4, С. 43–58.
  16. Баландин Д. В. , Коган М. М. Управление и оценивание в линейных нестационарных системах на основе эллипсоидальных множеств достижимости // Автоматика и телемеханика. 2020. №8, C. 8–28.
  17. Basar T., Bernhard P. H∞-Optimal Control and Related Minimax Design Problems: a Dynamic Game Approach. Birkhauser: Boston, 1995.
  18. Shaked U.,Theodor Y. -optimal estimation: a tutorial // Proc. 31st IEEE Conf. Decision Contr., New York, NY, USA, Vol.2, 2278–2286 (1992).
  19. Banavar R. N , Speyer J. L. A linear-quadratic game approach to estimation and smoothing // Proceedings of the American Control Conference, Evanston, IL, USA, 2818–2822 (1991).
  20. Yaesh I., Shaked U. Game theory approach to optimal linear state estimation and its relation to the minimum H1-norm estimation // IEEE Trans. Automat. Contr., Vol. 37, no. 6, 828–831 (1992).
  21. Wu A., Dong H., Duan G. Improved robust H-infinity estimation for uncertain continuous-time systems // J. Syst. Sci. Complex., Vol. 20, no. 3, 362–369 (2007).
  22. Li H., Fu M. A linear matrix inequality approach to robust H1 filtering // IEEE Trans. Signal Processing, Vol. 45, no. 9, 2338–2350 (1997).
  23. Li J., Li S. E., Tang K., Lv Y., Cao W. Reinforcement solver for H-infinity filter with bounded noise // 2020 15th IEEE International Conference on Signal Processing (ICSP), Vol. 1, 62–67 (2020).
  24. Shue S., Agarwal R.K. Design of automatic landing systems using mixed control // J. of Guidance, Control and Dynamics, 22, 103–114 (1999).
  25. Lungu R., Lungu M. Control of the aircraft lateral-directional motion during landing using the control and the dynamic inversion // Proc. Of the Romanian Academy Ser. A, Vol. 16 , no.64, 547-555 (2015).
  26. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.
  27. Гурман В.И. Принцип расширения в задачах управления. М.: Наука, 1985.
  28. Пацюков В.П. Дифференциальные игры при различной информированности игроков. М.: Советское радио, 1976.
  29. Бортаковский А.С., Пантелеев А.В. Линейная алгебра в примерах и задачах. М.: Высшая школа, 2010.
  30. Гроп Д. Методы идентификации систем. М.: Мир, 1979.

Информация об авторах

Пантелеев Андрей Владимирович, доктор физико-математических наук, профессор, заведующий кафедрой математической кибернетики института «Информационные технологии и прикладная математика», Московский авиационный институт (национальный исследовательский университет), Москва, Россия, ORCID: https://orcid.org/0000-0003-2493-3617, e-mail: avpanteleev@inbox.ru

Яковлева Александра Алексеевна, студент магистратуры, Московский авиационный институт (национальный исследовательский университет) (МАИ (НИУ)), Москва, Россия, e-mail: ayakovleva982@gmail.com

Метрики

Просмотров

Всего: 88
В прошлом месяце: 9
В текущем месяце: 0

Скачиваний

Всего: 56
В прошлом месяце: 4
В текущем месяце: 0