NVIDIA представила ИИ, генерирующий картинку по описанию

Одна картинка, стоящая тысячи слов, теперь может быть создана описанием в три-четыре слова. Это стало возможно благодаря инструменту GauGAN2, свежему проекту NVIDIA Research, который использует искусственный интеллект.

Посмотреть, как он работает можно в ролике на YouTube, а также можно опробовать его самостоятельно на NVIDIA AI Demos, на котором посетителям предлагаются все свежие разработки компании, использующие искусственный интеллект.

Эскизирование с помощью GauGAN
Эскизирование с помощью GauGAN

Модель глубокого обучения, стоящая за GauGAN, позволяет каждому воплотить свои мечтания в фотореалистичный шедевр, и теперь это проще, чем когда-либо. Просто напишите фразу, типа «закат на пляже», и ИИ сгенерирует сцену в реальном времени. Можно добавлять и прилагательные, например «закат на галечном пляже», или заменить «закат» на «полдень» или пасмурный день. И модель моментально модифицирует картинку.

Paint Me a Picture: NVIDIA Research Shows GauGAN AI Art Demo Now Responds to Words
Paint Me a Picture: NVIDIA Research Shows GauGAN AI Art Demo Now Responds to Words

Нажав на кнопку, пользователи могут сгенерировать сегментную карту, высокоуровневый план, отображающий размещение объектов на сцене. Оттуда можно изменить схему, подстроить сцену, добавив наброски меток, типа положения неба, деревьев, скал и рек. Таким образом, смарт-кисть работает совместно со словесным описанием при генерации сцены.