Американские разработчики представили ViperLib— датасет, содержащий почти семь тысяч изображений различных оптических иллюзий. Предполагается, что он поможет обучить компьютерные алгоритмы создавать подобные иллюзии самостоятельно. Тем не менее, у самих разработчиков, которые натренировали на ViperLib генеративно-состязательную сеть, эффективную модель построить не удалось. Препринт статьи опубликован на arXiv.
Оптическая иллюзия возникает при ошибке зрительного восприятия: статичные объекты кажутся движущимися, двухмерные объекты — объемными, а ровные фигуры — искаженными. Ее появление напрямую зависит от формы и содержания изображения: к примеру, при восприятии объектов на контрастном фоне наблюдается явление иррадиации, когда сам объект кажется больше из-за своего фона. Механизмы восприятия оптических иллюзий изучены плохо, но считается, что их причина — несоответствие между глазом (органом, который принимает информацию) и зрительной корой (отделом мозга, который эту информацию обрабатывать).
Именно из-за того, что механизм появления и восприятия оптических иллюзий плохо изучен, задача их обработки с помощью методов компьютерного зрения сильно усложняется. Решить эту задачу попробовали Роберт Уилльямс (Robert Williams) и Роман Ямпольский (Roman Yampolskiy) из Университета Луизианы. Они собрали датасет из 6725 изображений различных оптических иллюзий, разделенных на категории.
На собранном датасете ученые также обучили генеративно-состязательную сеть — разновидность нейросети, архитектура которой лучше всего подходит для создания новых объектов на основе определенных данных. Результаты, однако, мало походят на настоящие оптические иллюзии.
Причиной может быть неоднородность и недостаточное количество данных в датасете: например, недавно разработчикам из NVIDIA на гораздо большей базе с фотографиями знаменитостей удалось при помощи генеративно-состязательной сети создать реалистичные портреты людей. Тем не менее, ученые планируют учесть недостатки полученных изображений для дальнейшего обучения. Полный датасет доступен на сайте разработчиков.
Оптические иллюзии находят свое место и в искусстве. О том, что такое оп-арт и кинетическое искусство вы можете прочитать в нашем материале «Мир в движении», который мы выпустили вместе с музеем современного искусства Garage.
Иллюстрация к статье:
Обсуждение