18.10 - 07:29

Алгоритм OpenAI научился собирать кубик Рубика одной рукой


 

Исследователи из OpenAI создали алгоритм для роборуки, позволяющий ей собирать кубик Рубика, переворачивая и скручивая его пальцами. Сначала алгоритм обучался методом проб и ошибок в виртуальной среде, а затем его перенесли на реальное устройство. Из максимально сложных конфигураций, требующих 26 поворотов, роборука собирает кубик в 20 процентах случаев, а для конфигураций, требующих 15 поворотов, успешность составляет 60 процентов, рассказывают исследователи в блоге OpenAI.

В области роботизированных рукоподобных манипуляторов основное внимание разработчиков сконцентрировано на протезах или телеуправляемых человекоподобных роботах. Сами по себе эти конструкции зачастую уже достаточно ловки и позволяют проводить сложные манипуляции, но алгоритмы управления роборуками пока отстают от электромеханической составляющей. Для улучшения уровня алгоритмов некоторые компании концентрируют внимание на своих прикладных задачах, а исследователи зачастую решают трудноприменимые на практике «детские» задачи. Однако в процессе их решения зачастую рождаются технологии, которые впоследствии можно применить во многих областях.

Программисты из некоммерческой организации OpenAI в 2017 году поставили перед собой в качестве такой задачи сборку кубика Рубика одной роборукой. В 2018 году они показали промежуточный результат своей работы, научив роборуку переворачивать кубик нужной стороной до 50 раз подряд. Теперь исследователи показали, что достигли конечной цели, используя похожие алгоритмы и принципы их обучения.

 

Поскольку авторы ставили перед собой задачу создать алгоритм для ловких манипуляций с объектами, для расчета ходов в процессе решения они использовали доступную реализацию двухфазного алгоритма Коцембы. Кроме того, они использовали коммерческий доступную роборуку Shadow Dexterous Hand.

Основные алгоритмы можно разбить на две основные части. Первая основана на архитектуре сверточной нейросети и отвечает за визуальное восприятие кубика. Она получает три изображения руки с кубиком с разных ракурсов и рассчитывает на их основе положение кубика, а также углы между его плоскостями. Во втором алгоритме используется архитектура рекуррентной нейросети с долгой краткосрочной памятью (LSTM). Она получает данные от первой и на их основе, а также последовательности сборки, рассчитанной алгоритмом Коцембы, создает последовательность движений для пальцев.

Как и в прошлой работе, исследователи использовали для обучения не множество реальных роборук, а виртуальную среду с их копиями. Это позволило, во-первых, распараллелить процесс обучения и тем самым ускорить его, а, во-вторых, повысить качество алгоритмов, меняя параметры среды. В процессе обучения алгоритмы обучались путем проб и ошибок, и постепенно достигали порогового уровня успешности, после которого среда автоматически меняла параметры, к примеру, размеры и массу кубика. Из-за этого алгоритм был вынужден снова адаптироваться к условиям. Именно это позволило подготовить алгоритмы к переносу на реальную роборуку, без необходимости абсолютно точно симулировать все аспекты взаимодействия кубика и руки.

https://nplus1.ru

 

Ключевые слова:
Читайте также:
12.11 - 21:02

4 лучших растения для детской спальни

Здесь ребенок не только спит, но и много времени проводит за играми.
Подробнее »»

12.11 - 20:49

Как правильно сочетать крема между собой – рассказывает косметолог из США

Секрет правильного ухода за кожей не только в косметических средствах, но в последовательности их нанесения.
Подробнее »»

12.11 - 20:36

Назван орех, снижающий артериальное давление

Орех кешью оказался очень полезным для здоровья.
Подробнее »»

12.11 - 19:49

Лечим хронический гайморит

Хронический гайморит характеризуется воспалительным процессом в придаточных гайморовых пазухах носа. Они расположены в верхней челюсти, в норме заполнены воздухом, являются парным анатомическим образованием.
Подробнее »»

12.11 - 19:33

Как сердце предупреждает о развитии рака

Учёные из клиники Майо, США, установили, что один и тот же признак указывает на риск развития как сердечно-сосудистых, так и онкологических заболеваний.
Подробнее »»

12.11 - 18:38

Насколько надёжна ваша память: секрет когнитивного искажения 

Разбирая вопросы, связанные с памятью человека, ученые останавливаются на понятии «когнитивное искажение», объясняющем процесс обработки информации и ее дальнейшее сохранение в нашем мозге.
Подробнее »»

12.11 - 18:31

Диетологи назвали идеальный завтрак для тех, кто на диете

Американские ученые из Корнельского университета в ходе множества проведенных исследований и опросов выяснили, что утренний рацион людей со стройной фигурой богат фруктами и орехами.
Подробнее »»

12.11 - 17:59

Как спасти испортившиеся продукты: даем еде второй шанс

Почерневшие бананы, черствый хлеб, «уставшие» фрукты и овощи. Не спешите отправлять их в мусорное ведро.
Подробнее »»

12.11 - 16:45

5 стран, в которых полные девушки на вес золота

Пока в нашей стране идёт культ стройности и фитоняшек, в некоторых других странах худощавых девушек наоборот презирают.
Подробнее »»

12.11 - 16:27

Почему мясо и рыбу лучше покупать замороженными?

Как считают исследователи, только заморозка и хорошая термическая обработка полностью уничтожают опасные бактерии.
Подробнее »»

12.11 - 15:46

Настойка пиона: успокаиваем нервы

В современном стремительном мире, где каждый день встречаешься с маленькими и большими проблемами и хлопотами, поднимается жизненно важный вопрос о том, как бороться с различными нервными расстройствами, бессонницей, повышенной эмоциональной чувствительно
Подробнее »»

12.11 - 15:21

Главный витамин, который поможет сохранить красоту

Ученые рассказали о витамине, который поддержит кожу в тонусе и придаст ей здоровый вид
Подробнее »»

12.11 - 14:34

Препарируем сны: почему нам снятся секс, ужасы и ушедшие из нашей жизни люди

Известный психиатр Карл Густав Юнг считал, что наши сны — это послания нам, отправленные нашим же бессознательным.
Подробнее »»

12.11 - 14:12

Диета Кейт Миддлтон: что ест и пьет герцогиня Кембриджская

Меню Кейт Миддлтон не всегда хэлси на сто процентов
Подробнее »»

12.11 - 13:57

Работа в шумной обстановке повышает риск гипертонии

Ученые выяснили, что шум влияет не только на слух.
Подробнее »»


Загрузка...
Loading...

Справочная информация

Загрузка...