Создан новый универсальный подход к обучению роботов

Математики разработали теорию для изучения устойчивости систем с итеративным обучением, чтобы научить роботизированные системы лучше выполнять рутинные действия. Созданные на основе этой теории алгоритмы универсальны и позволят значительно улучшить управление транспортными системами, автоматизированными системами в области наноиндустрии, а также ускорить процессы обучения роботов, обслуживающих конвейеры. Работа поддержана грантом Российского научного фонда (РНФ) и опубликована в SIAM Journal on Control and Optimization.

Людям постоянно приходится доводить выполнение различных однотипных действий до совершенства, при этом результат достигается при помощи тренировок, за счет которых человек запоминает и эффективно учитывает прошлый опыт. При создании роботов аналогичную задачу выполняет так называемое управление с итеративным обучением. Оно использует как текущую информацию, так и информацию с предыдущего повторения, то есть память.

С этих позиций управление с итеративным обучением — простейшая форма интеллектуального управления. В этом случае естественным образом выделяется два процесса: повторяющееся выполнение однородных действий и их последовательная корректировка. Так, баскетболист многократно бросает мяч в корзину, наблюдает за его полетом, и с каждым разом точность попадания увеличивается. Математические модели, описывающие такие процессы, получили название 2D-моделей.В новой работе авторы предложили рассматривать энергетические составляющие системы в виде векторного поля — пространства со «стрелками», указывающими, каково направление каждой силы. Для удобства расчетов они использовали аналогию с хорошо изученными физическими полями. Если представить, что система — это бочка с дырявыми стенками, наполненная водой, то у векторного поля есть только стоки, но нет источников. Рано или поздно уровень жидкости сравняется с самым нижним отверстием, и течение прекратится — система придет в равновесное устойчивое состояние. Аналогичного исхода ученые ожидали и для своей «сточной» системы. Предположение подтверждается точными расчетами, свойства векторного поля определяются на основе анализа его дивергенции — способности векторов расходиться из конкретной точки пространства. Для 2D-систем она определяется без нахождения их решений. Таким образом, математики предложили метод исследования устойчивости различных классов 2D-систем общего вида, что дает возможность конструктивного подхода к проектированию их управления.