Нейросетка от Сбера, генерящая картинки по текстовому описанию

Сбер представил свою новую разработку — нейросеть ruDALL-E, которая умеет создавать изображения по текстовому описанию на русском языке. «Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ», — хвастается Сбер. Кстати, о ссылках. Не первый раз наблюдаю, что любые ссылки, ведущие на Сбер, все без исключения по первому разу редиректят на страницу рекрутинга. Видать, так им не хватает операторов в контактном центре… И только кликнув на ссылку второй раз, попадешь куда надо. Мерзко это и мелко, господа сберовцы!

Так вот, значит, ruDALL-E. Вдохновляют примеры в демо-галерее: они выглядят весьма заманчиво и привлекательно.

Галерея ruDALL-E

Итак, народ уже вовсю начал развлекаться и делиться своими достижениями. А я что, рыжая, что ли.

Воодушевившись успехами, продемонстрированными в галерее, я вообразила, что мы, люди, с этой сеточкой практически на равных, и заказала ей описание комнаты гоголевской Коробочки. Сетка думала 25 минут и выдала вот что.

Описание комнаты Коробочки
«комната была обвешана старенькими полосатыми обоями; картины с какими-то птицами; между окон старинные маленькие зеркала с темными рамками в виде свернувшихся листьев; за всяким зеркалом заложены были или письмо, или старая колода карт, или чулок; стенные часы с нарисованными цветами на циферблате…»

Мне при виде этого стало что-то совсем не смешно, а вовсе даже грустно: результат уж слишком разошелся даже с самыми скромными ожиданиями.

Второе задание было попроще. Через 28 минут я получила такое.

Манул по версии ruDALL-E
Манул на Северном полюсе с красным шарфом на шее

После этого я в новинке полностью разочаровалась и стала давать ей простенькие задания. Первое — «Колбаса Брауншвейгская».

ruDALL-E: брауншвейгская колбаса

А дальше я переключилась на любезно предложенный бот в Телеграме. Было обещано, что он работает быстрее. Не могу сказать, что он более шустрый, но привлек тем, что выдает сразу три варианта за то же время. Напрягать его сильно мне более не хотелось, и я ему предложила для начала изобразить (простите великодушно!) Олю Бузову.

ruDALL-E: Оля Бузова. Вариант 3

ruDALL-E: Оля Бузова. Вариант 2

ruDALL-E: Оля Бузова. Вариант 1

Видимо, сеточка решила попробовать себя в роли Бога и создать Бузову с нуля. Тогда я ее спросила, как она видит Маркса-Энгельса-Ленина. Вот так:

ruDALL-E: Маркс - Энгельс - Ленин

Тут, надо сказать, я окончательно сдалась, и сделала совсем уж элементарный запрос: «Котики».

Вот вам котики от ruDALL-E — два кривоглазых и один красноносый.

ruDALL-E: котик

ruDALL-E: котик

НуruDALL-E: котик

Ну вот, уже хоть что-то. Хотя к нормальным здоровым глазам сетка явно относится плохо.

«Ну, погоди!»:

ruDALL-E: Ну, погоди!

ruDALL-E: Ну, погоди!

ruDALL-E: Ну, погоди!

Этакие фантазии на тему… Но весьма порадовали тем, что с цветовой гаммой очень даже угадали, прямо в точку.

Напоследок решила помучить сеточку англоязычными запросами, хотя в анонсе особо отмечался русский язык.

Wuthering Heights (Грозовой перевал) у сеточки ассоциируется с Экзюпери,  мегаполисами и полковником, которому никто не пишет.

ruDALL-E:: Wuthering Heights

ruDALL-E:: Wuthering Heights

ruDALL-E:: Wuthering Heights

Знаменитое I’ll be back она видит так.

ruDALL-E: I;ll be back

ruDALL-E: I;ll be back

ruDALL-E: I;ll be back

А Мadonna в ее представлении — это

ruDALL-E: Madonna

ruDALL-E: Madonna

ruDALL-E: Madonna

Обидно, но предсказуемо.

По поводу области применения. Сбер считает, что

Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна.

Прямо скажем, до этого еще очень далеко. Но, наверно, достижимо. Тем более что open source доступен на GitHub. Так что, если она останется бесплатной, то, когда ее докрутят, можно будет, например, самим делать иллюстрации к статьям, не заботясь о копирайте. Но это вряд ли. Как только это станет выдавать что-то годное, создатели, наверно, захотят возместить траты на ее создание.

А пока что это все неудержимо вызывает воспоминания о 3 серии 5 сезона сериала «Доктор Хаус» про художника с нарушенным мировосприятием.

Доктор Хаус. Серия про художника, пишущего портреты с искаженными лицами

Попробовать ruDALL-E

Похожие записи:

Понравилась статья? Расскажите друзьям!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *