Команда ученых из Латвии создала технологию, которая позволяет роботу понимать и интерпретировать вербальные команды. Что дает возможность давать их в реальном времени и без дополнительного программирования. Это — одно из достижений года, которое отметила Академия наук, рассказывает Латвийское радио.
Ученые института электроники и компьютерных наук создали технологию, которая позволяет роботам понимать и интерпретировать команды, высказанные словами словах. Это трехмерное описание окружающей среды или семантическая карта, которая помогает сотрудничеству робота и человека, пояснил директор института Модрис Грейтанс.
«Сделано это так, что робот смотрит на мир почти как человек. Мы видим в трехмерном пространстве, которое состоит из объектов, которые находятся на разных позициях. Робот создает в своем мозге семантическую карту, и привязывает к каждому пункту пространства некое понятие — дерево, стол или другой объект.
Мы проводим интеграцию с искусственным интеллектом, с моделями речи и языка. Мы не разрабатывали их сами, а пользуемся тем, что уже создали крупные компании. Сами мы изучаем то, как сделать робота мобильным. Ему придется возить все эти знания с собой. Это не то же самое, что сделать снимок и послать его куда-то искусственному интеллекту, чтобы тот прислал его обратно. Это все должно проходить в реальном времени, сразу на месте, и с нашими ограниченными ресурсами это амбициозная задача», — рассказал ученый.
В течение двух лет были проведены два исследования, в которых роботы «мыслят» с помощью новой технологии.
Один тест был нацелен на работу в помещении — вместе с роботехнической компанией ABB Latvija. Научный сотрудник института Петерис Рачинскис объясняет, как робот выполняет команды, полученные на естественном языке: «Допустим, на изображении видны какие-то очки. Вписываем “очки” на английском, и это слово отправляется текстовой модели. Создается вектор и с его помощью на трехмерной карте мы ищем похожие точки. Там, где обнаружено похожее, там и будет этот объект. Далее идет математический расчет, где находится центр объекта, с какой стороны подъехать и что с ним делать. Допустим, я пишу “белая бутылка”, и он должен ее найти. Вот, он ее нашел. Это показывает, какова должна быть геометрическая ориентация механизма руки робота, чтобы ее поднять».
Грейтанс указал, что особенно важно и второе исследование института, обучение робота действиям в неизвестной среде: «Мы сотрудничаем с командой NATRIX, которая производит в Латвии роботов двойного назначения, для военных и гражданских нужд. Например, роботизированные носилки, на которые можно положить человека и автоматически доставить больного или раненого в нужное место. Важно, чтобы робот понимал возможности проехать из пункта А в пункт Б. Потому что можно запланировать прямой путь, но на дороге могут оказаться препятствия. Соответственно, робот туда отправляется и распознает окружение. […] И да, общий сценарий таков: мы можем сказать ему, чтобы он ехал по дороге, пока не увидит большой дуб, которого мы в данный момент не видим, и он едет, смотрит и видит — да, вот тот большой дуб — берет там коробку и несет ее обратно».
До сих пор применение роботов в различных отраслях было ограничено тем, что их нужно отдельно программировать для каждой задачи. Однако с новой технологией можно человеческим языком поручать роботу разные задачи, и он сможет сам распознавать разные объекты и выполнять задачи. Это можно использовать не только в военной сфере или на производстве, но и, например, в уходе за молодыми лесопосадками.