Системные методы анализа и синтеза интеллектуально-адаптивного управления.

Ознакомиться

Системные методы анализа и синтеза интеллектуально-адаптивного управления.

Покупка

Основная коллекция

Тематика: Кибернетика

Издательство: РИОР

Авторы: Крамаров Сергей Олегович, Смирнов Юрий Александрович, Соколов Сергей Викторович, Таран Владимир Николаевич

Год издания: 2021

Кол-во страниц: 238

Дополнительно

Вид издания: Монография

Уровень образования: Дополнительное профессиональное образование

ISBN: 978-5-369-01571-1

ISBN-онлайн: 978-5-16-105045-3

Артикул: 633630.02.01

Доступ онлайн

от 288 ₽

В корзину

Как еще получить доступ?

Студенту или преподавателю

Отправьте заявку на получение ключа доступа в библиотеку Вашего учебного заведения

Представителю организации

Отправьте заявку на подключение к Znanium по договору

Купить в составе основной коллекции от 899 ₽

Купить печатную версию за 1 289 ₽

Аннотация
Коллекции
Классификаторы
Доп. материалы
Аффилиация
Бибзапись
Фрагменты

В монографии предлагаются методы системного анализа стохастических обыкновенных и распределенных дифференциальных систем, а также системного синтеза интеллектуально-адаптивного управления на основе принципов Р. Беллмана и Л.С. Понтрягина. Предназначена для научных работников, аспирантов, магистров и инженеров, специализирующихся в области интеллектуально-адаптивного управления.

Основная коллекция ЭБС

Тематика:

240501: Кибернетика

ББК:

328: Кибернетика. Общая радиотехника. Электроника. Электроакустика. Элетросвязь. Радиосвязь

УДК:

519: Комбинатор. анализ. Теория графов. Теория вер. и мат. стат. Вычисл. мат., числ. анализ. Мат. кибер..

ОКСО:

ВО - Бакалавриат
09.03.03: Прикладная информатика
12.03.04: Биотехнические системы и технологии
27.03.05: Инноватика
ВО - Магистратура
10.04.01: Информационная безопасность
20.04.01: Техносферная безопасность
38.04.01: Экономика
38.04.02: Менеджмент
38.04.05: Бизнес-информатика

ГРНТИ:

Только для владельцев печатной версии книги: чтобы получить доступ к дополнительным материалам, пожалуйста, введите последнее слово на странице №171 Вашего печатного экземпляра.

Ввести кодовое слово

ЭБС\
- Приложение 1.pdf
- Приложение 2.pdf
- Приложение 3.pdf
- Приложение 4.pdf

Крамаров Сергей Олегович

Межрегиональная ассоциация образовательных организаций высшего образования

Южный университет (ИУБиП)

Сургутский государственный университет

Соколов Сергей Викторович

Южный университет (ИУБиП)

Таран Владимир Николаевич

Ростовский государственный университет путей сообщения

Системные методы анализа и синтеза интеллектуально-адаптивного управления : монография / С. О. Крамаров, Ю. А. Смирнов, С. В. Соколов, В. Н. Таран. — Москва : РИОР : ИНФРА-М, 2021. — 238 с. — (Научная мысль). - ISBN 978-5-369-01571-1. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1243846 (дата обращения: 02.06.2024). – Режим доступа: по подписке.

Скопировать запись

Экспорт списка

Excel

RUSMARC .iso

win-1251

UTF-8

RUSMARC .txt

win-1251

UTF-8

IRBIS .txt

win-1251

UTF-8

Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.


    НАУЧНАЯ МЫСЛЬ

СЕРИЯ ОСНОВАНА В 2008 ГОДУ


Министерство образования и науки Российской Федерации Межрегиональная ассоциация образовательных организаций высшего образования



            С.О. Крамаров, Ю.А. Смирнов, С.В. Соколов, В.Н. Таран


СИСТЕМНЫЕ МЕТОДЫ АНАЛИЗА И СИНТЕЗА ИНТЕЛЛЕКТУАЛЬНОАДАПТИВНОГО УПРАВЛЕНИЯ





                Монография





онлайн znanlum.com

Москва РИОР ИНФРА-М

стр. 1

УДК 519.7:303.732.4:330.44
ББК 32.81+22.18+65.05
     К77


   ФЗ    Издание не подлежит маркировке  
№ 436-ФЗ в соответствии с п. 1 ч. 2 ст. 1

          Научные редакторы:
          Соколов Сергей Викторович — д-р техн. наук, профессор;
          Крамаров Сергей Олегович — д-р физ.-мат. наук, профессор

          Рецензенты:
          Колесников А.А. — д-р техн. наук, профессор, заслуженный деятель науки и техники РФ;
          Безуглов Д.А. — д-р техн. наук, профессор, заслуженный деятель науки РФ




       Крамаров С.О., Смирнов Ю.А., Соколов С.В., Таран В.Н.
К77       Системные методы анализа и синтеза интеллектуально-адаптивного управ-
       ления : монография / С.О. Крамаров, Ю.А. Смирнов, С.В. Соколов, Таран В.Н. — Москва : РИОР : ИНФРА-М, 2021. — 238 с. + Доп. материалы [Электронный ресурс]. — (Научная мысль). — DOI: https://doi.org/10.12737/19591

           ISBN 978-5-369-01571-1 (РИОР)
           ISBN 978-5-16-012195-6 (ИНФРА-М, print)
           ISBN 978-5-16-105045-3 (ИНФРА-М, online)

           В монографии предлагаются методы системного анализа стохастических обыкновенных и распределенных дифференциальных систем, а также системного синтеза интеллектуально-адаптивного управления на основе принципов Р. Беллмана и Л.С. Понтрягина.
           Предназначена для научных работников, аспирантов, магистров и инженеров, специализирующихся в области интеллектуально-адаптивного управления.

УДК 519.7:303.732.4:330.44
ББК 32.81+22.18+65.05







Материалы, отмеченные знаком , доступны в электронно-библиотечной системе ZNANIUM по адресу http://znanium.com.
Ссылку для доступа вы можете получить при сканировании QR-кода, размещенного на обложке






ISBN 978-5-369-01571-1 (РИОР)                 © Крамаров С.О.,
ISBN 978-5-16-012195-6 (ИНФРА-М, print) Смирнов Ю.А.,
ISBN 978-5-16-105045-3 (ИНФРА-М, online) Соколов С.В., Таран В.Н.

стр. 2

ВВЕДЕНИЕ
     Несмотря на бурные успехи теории адаптивного и стохастического управления за последнее тридцатилетие, создающие зачастую иллюзию ее завершенности, за рамками полного теоретического разрешения остаются еще многие вопросы управления динамическими системами в условиях неопределенности.
     Представленная работа предназначена для восполнения существующего пробела в направлении развития как теории управления стохастическими нелинейными объектами на основе общих форм вероятностных критериев, так и аналитического синтеза общих объективных законов процессов управления нелинейными многомерными и многосвязными системами. Это - законы обратных связей, синтезируемых на основе наиболее полных нелинейных моделей систем с непосредственным учетом их естественных закономерностей, физических (химических и др.) критериев и ограничений.
     Существующие подходы к синтезу стохастического и адаптивного управления формируют его в функции текущего состояния объекта управления и не учитывают его структурные изменения. Решение этой проблемы возможно только при комбинированном синтезе адаптивного управления с прогнозированием в «малом» и оптимального управления в «большом». При этом принципиально необходимо использовать текущие системные стохастические оценки состояния и управления объекта изменяемой структуры.
     В монографии рассмотрен системный синтез интеллектуальноадаптивного управленияна основе принципов Беллмана и Понтрягина, подробно изложены методы системного анализа, управления и оценки состояния сосредоточенных и распределенных стохастических систем по различным критериям.
     Изложенные в книге результаты могут найти практическое применение при создании перспективных систем управления, навигации, связи и т.д., т.е. широкого класса динамических нелинейных систем, функционирующих в условиях возмущений различной физической природы.

3

стр. 3

1.        СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ НА ОСНОВЕ ОБОБЩЕННЫХ ВЕРОЯТНОСТНЫХ КРИТЕРИЕВ

    1.1. Математическое описание объекта управления
     В современной теории оптимального стохастического управления основными объектами исследования являются нелинейные стохастические системы, описываемые векторными дифференциальными уравнениями вида
k = f ⁽k,U, t⁾⁺ f0 ⁽k,U, t)nt>

где k — N-мерный вектор состояния системы;
f, f) - известные нелинейные векторная и матричная функции размер-
        ности N и N*M соответственно;
nₜ  - M- мерный вектор нормированного белого гауссовского шума;
U - K<N-мерный вектор управления (здесь и далее использована симметризованная форма записи уравнений).
     В большинстве практических случаев функция f₀ от UT не зависит, а f может быть представлена как f (k, U, t) = f (k, t) + U(k, t), т.е. система уравнений, используемая далее для описания исследуемых объектов, имеет следующий вид:


k = f (k, t)+ U (k, t)+ fо (k, t) nt.            (1.1)


     В силу теоремы Дуба вектор k является марковским [160], а плотность его распределения p(k ,t) описывается известным уравнением Фокке-ра-Планка-Колмогорова (ФПК), которое для удобства последующего использования запишем в виде:


      дР⁽^ = L{p(k, t)} = — div/ + U + ¹f(f))⁽V) p ■

(1.2)

+ — div 2

где L{U, f, f), p} =Lo{p} - div[Up] - оператор ФПК, Lo{p} = L {0,f, f ,, p};
                         (A)⁽V⁾ - операция преобразования матрицы A размерности n*m в вектор (A) , формируемый из ее элементов следующим образом:
            A )= |й 11a21'''am1a 12a22'am2'a 1 na2n■■■ amn\ ,     ⁽¹.³⁾

4

стр. 4

            div - символ операции дивергенции строки матрицы.
      Если возможно наблюдение управляемого вектора ^ с помощью измерителя, описываемого в общем случае нелинейным стохастическим уравнением вида
Z = H($, t) + Wt,                     (1.4)


где Z   - L <N- мерный вектор выходных сигналов измерителя;
H(t,t) - известная нелинейная вектор-функция наблюдения размерности L;
Wₜ  - белый гауссовский вектор-шум измерения размерности L с нуле-
         вым средним и матрицей интенсивности Dw (t);
то для вероятностного описания вектора состояния ^ более целесообразно использование апостериорной плотности вероятности (АПВ) pz(c,,t), задаваемой уравнением Стратоновича:


~Z^~= = L {p Z (£> t⁾}⁺[ F (£> t⁾⁻F⁽t ⁾]p Z (£> t ) = L {p Z } ⁺ S{p Z> & t }> (1.5)
d t                                                         v ⁷


где

                                                                             ^
           F (f, t ) = - 2 [Z - H (f, t)] D.' [Z - H (f, t)], F⁽t) = J F&, t р & t
                                                                             -^


в силу того, что энтропия апостериорного сообщения меньше энтропии априорного.
      Так как аналитических методов решения уравнений (1.2), (1.5) в настоящее время не существует, а реализация численных методов с использованием существующих вычислительных средств при N> 3 не представляется достаточно эффективной [147], то наибольшее распространение при анализе вероятностных характеристик вектора состояния ^ получили методы функциональной аппроксимации плотности [28]. И наиболее распространенный среди них - метод аппроксимации гауссовской плотностью


    р&t⁾⁼ - \—expI⁻2&⁻&)TP&⁻&)}, (j[2п) detP   I ²          J


(1.6)

где = = ((t) - математическое ожидание вектора состояния ^;
P = P (t)  - матрица ковариаций,
позволяющий сформировать аппроксимацию решений уравнений с частными производными вида (1.2, 1.5) в виде решений систем обыкновенных дифференциальных уравнений относительно параметров £, , P искомых плотностей.


5

стр. 5

     Наряду с традиционными достоинствами метода гауссовской аппроксимации [160], следует также отметить свойство плотности (1.6) минимизировать информационный функционал Фишера при условии существования конечной матрицы P [119]. Это, в свою очередь, позволяет решать на основе аппроксимации (1.6) задачи стохастического управления и оценивания в минимаксной постановке - искать оптимум заданного функционала при минимуме информации о векторе состояния ^ [119].
     В самом распространенном на практике варианте уравнений оценки, так называемом обобщенном (расширенном) нелинейном гауссовском фильтре, уравнения оценки вектора состояния (1.1) имеют вид


1 = f + и + K (^,t)(z - H (£t)),                 (1.7)



                  K ("'• t ) = P^H D-,
                  P = P — (.f + U)T + — (.f + U) P + f 0 fT - KD,K’. ^                  ^


(1.8)

     При аналогичной аппроксимации решения уравнения ФПК, т.е. априорной плотности вероятности, уравнения векторных параметров плотности получаются из (1.7, 1.8) при H = 0.
     Приведенные уравнения являются исходными при последующем синтезе оптимальных управлений.
     Для возможности окончательной постановки задачи синтеза рассмотрим далее виды критериев оптимальности, обеспечивающих формирование стохастических управлений в наиболее общем случае оптимизации процесса управления системой.

1.2. Критерии оптимизации
     Решение проблемы синтеза оптимального управления стохастическими объектами осуществляется в настоящее время на основе использования методов, изначально разработанных для детерминированных систем [1]. Данное обстоятельство неизбежно приводит к стохастическому характеру известных критериев оптимизации и функций оптимальности (Гамильтона или Беллмана) и, как следствие, к необходимости рассмотрения средних значений [1, 28]. Это, в свою очередь, определяет интегральную зависимость оптимального управления от плотности распределения вектора состояния, требуя, в конечном итоге, решения двухточечной краевой задачи для системы уже не обыкновенных дифференциальных, а интегро-дифференциальных уравнений совместно с интегро-дифференциальным уравнением в частных производных для неизвестной плотности распределения параметров состояния. Очевидные трудности решения такой систе-6

стр. 6

мы привели к использованию единственной на сегодняшний день возможности ее приближенного интегрирования на основе гауссовской аппроксимации функции плотности. Но подобная аппроксимация порождает ошибки не только в определении самой плотности распределения, но и требует статистической линеаризации уравнений объекта, приводящей к дополнительным ошибкам решения двухточечной краевой задачи. Кроме того, существующие подходы не позволяют использовать в качестве критериев оптимизации обобщенные формы вероятностных критериев, нелинейно зависящих непосредственно от плотности распределения (критерий минимума энтропии вектора состояния, критерий Кульбака и др.) и определенных в общем случае в замкнутой области существования параметров состояния.
     В связи с этим возникает проблема разработки такого подхода к синтезу оптимального управления стохастическими объектами, который, во-первых, позволял бы построить закон управления в замкнутой форме при самой общей нелинейной зависимости критерия оптимизации от плотности распределения вектора состояния, и, во-вторых, позволил бы избежать ошибок статистической линеаризации уравнений объекта.
     Для возможности дальнейшего решения задачи поиска подобного оптимального управления критерий оптимизации запишем в следующей наиболее общей форме:

J = J J ф[р(£,t),U(£,t)]%dt = J W*(t)dt,       (1.9)
T                       T

где Ф - известная нелинейная функция, учитывающая в общем случае возможные аналитические ограничения на вектор управления;
T = [ 1₀, tₖ] - временной интервал оптимизации;
^«   - некоторое ограниченное множество параметров состояния.

     На практике чаще используется более простая форма критерия оптимальности

     J = J |ф₁[р(^,t)]dt + J Jo2[U(£,t)]dt = J W*(t)dt,       (1.10)
         T 5(1)            T 5(2)              T

где Фi, i =1,2 - известные нелинейные аналитические функции;
     ^ i    - области пространства состояний, в которых определяется
               оптимальное управление;
достаточно адекватно отражающая естественное формирование условия, обеспечивающего оптимальность исследуемой системы как в смысле точности, так и затрат на управление.


7

стр. 7

     При этом различные вариации вида функции Ф₁ позволяют охватить достаточно широкий класс условий оптимальности по точности:
     -        максимума (минимума) вероятности существования вектора £ в области £,(1): Ф1(р) = ±р;
     -        минимума отклонения искомой плотности вероятности р от заданной g: Ф1(р) = (р-g)2, Ф1(р) = |р-g, Ф1(р) = -рln^g) (критерий Куль-бака) и т.д.;
     -      максимума информации о векторе состояния £:

Ф1(р) = р

д ln р

д ln р

д£ JL д£

(критерий Фишера) и др.,

а функции Ф2 - условий оптимальности по текущим затратам на регулирование (энергетическое обеспечение) процесса (как правило, функция Ф2 выбирается возрастающей положительно определенной: квадратичной Ф2(U) = UTDU или экспоненциальной Ф2(U) =exp (aTU), где D, а - матрица и вектор известных постоянных коэффициентов [147]).
     Наряду с критерием (1.10) далее будем использовать его модификацию, обеспечивающую синтез оптимального управления не на конечном (замкнутом) интервале времени Т, а в реальном (текущем) масштабе времени движения t
J1 = |Ф1[р(£,t)]d£ +J |ф2[U(£,t)]d£dt.            (1.11)
               £(1)          10 £( 2)

     Данный критерий традиционен для задач управления в реальном времени (например, подвижными объектами) и называется локальным [28] (в отличие от терминального (глобального) критерия (1.10)). Оптимальное управление U, формируемое на его основе, называется локальнооптимальным . Существенным преимуществом применения критерия (1.11) является простота синтезируемого на его основе управления, позволяющая легко реализовать алгоритмы локально-оптимального управления непосредственно на борту подвижного объекта. В заключение следует также отметить, что форма критериев (1.10), (1.11) охватывает одну из возможных постановок задачи управления процессами самоорганизации -при выборе в качестве первой составляющей критерия энтропии системы или критерия Фишера. В этом случае поиск управления, оптимизирующего энтропию системы, представляет собой, по существу, формирование ее параметров, обеспечивающих оптимальное протекание процесса самоорганизации.

8

стр. 8

1.3.   Априорное оптимальное управление вектором состояния
1.3.1. Постановка задачи
     В отличие от традиционной постановки задачи синтеза стохастического оптимального управления - на основе усредненного функционала и дифференциальных моделей математического ожидания вектора состояния, использование критерия типа (1.9) предполагает поиск управления уже не самим процессом, а его плотностью распределения р(£,t). В свою очередь, функция р в отличие от вектора ^ описывается дифференциальным уравнением с частными производными (а в случае (1.5) даже интегро-дифференциальным), что требует привлечения математического аппарата синтеза управления системами уже с распределенными параметрами. Теория подобного синтеза в настоящее время разработана достаточно подробно [18] и базируется, в основном, на применении двух методов - динамического программирования и принципа максимума, обобщенных на случай распределенных систем. Для дальнейших построений используем метод динамического программирования: во-первых, в силу его более общего характера, а, во-вторых, большей универсальности и простоты синтеза оптимального управления.
     Кроме того, процедуру формирования оптимального управления рассмотрим в двух принципиально различных случаях - для ненаблюдаемого объекта управления (1.1) и наблюдаемого с использованием нелинейного измерителя вида (1.4), когда решение задачи синтеза является, по существу, решением проблемы дуального управления [171] в наиболее общем (замкнутом) виде.
     Для простоты последующего изложения управление в первом случае определим как априорное, во втором - как апостериорное.


1.3.2. Синтез априорного оптимального управления
     Для иллюстрации общности предложенного подхода к синтезу стохастического управления рассмотрим формирование вектора U, оптимизирующего нелинейный функционал J (1.9).
     Оптимальное управление будем искать в классе ограниченных непрерывных функций со значениями из открытой области U*. Для его построения используем метод динамического программирования, согласно которому задача сводится к решению функционального уравнения [18]


. Гdv .   1 Л
min 1--+ W* > = 0
UeU* I dt  J


(1.12)

при конечном условии V(tK) = 0 относительно оптимального функционала V, параметрически зависящего от времени t e T и определенного на множестве функций р, удовлетворяющих уравнению (1.2).


9

стр. 9

     Для линейных систем с распределенными параметрами, к классу которых относятся уравнения типа (1.2), функционал отыскивается в виде интегральной квадратичной формы [18]


V = fv(j,{)Р2 {) dj, j

откуда имеем


  'V + W* =4~TP2 + 2vpL0{р}+ф[р,U]-²vpsffr-P + ui З^-'lldj> ⁽¹.¹³⁾ dt |[ dt                            i (dji   dji )\


где индекс “ i ” используется для обозначения компонентов соответствующих векторов.
     Анализ полученного выражения показывает, что определение вектора U(j,t) из решения функционального уравнения (1.12) сводится к классической задаче отыскания вектор-функции, реализующей минимум определенного интеграла (1.13). При этом вектор-функция U(j,t), являющаяся решением данной задачи, должна удовлетворять системе уравнений Эйлера
              dr   21 дФ      др
-—|2vp²1- — + 2vp^ = 0        i = 1,2,..., N,
             dji L J dUi      dj i

или


(1.14)


     В общем случае (1.14) представляет собой систему нелинейных уравнений относительно компонентов вектора управления, допускающую аналитическое разрешение только в некоторых частных случаях, например, когда функция Ф[р, U] имеет следующий вид:

Ф = Ф1[р] + Ф 2 [ U ],


где Ф₂(1) - аналитические функции, первые производные которых допускают обращение,
или, например,

ф = Ф1 [р] + [ u (j, t)- u о (j, t)]T Du (j, t)[ u (j, t)- u о (j, t)],

где DU( j ,t) - известная симметричная квадратная матрица;
U₀(j ,t) - известный вектор.


10

стр. 10

Доступ онлайн

от 288 ₽

В корзину

Как еще получить доступ?

Студенту или преподавателю

Отправьте заявку на получение ключа доступа в библиотеку Вашего учебного заведения

Представителю организации

Отправьте заявку на подключение к Znanium по договору

Купить в составе основной коллекции от 899 ₽

Купить печатную версию за 1 289 ₽