Сбер представил свою новую разработку — нейросеть ruDALL-E, которая умеет создавать изображения по текстовому описанию на русском языке. «Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ», — хвастается Сбер. Кстати, о ссылках. Не первый раз наблюдаю, что любые ссылки, ведущие на Сбер, все без исключения по первому разу редиректят на страницу рекрутинга. Видать, так им не хватает операторов в контактном центре… И только кликнув на ссылку второй раз, попадешь куда надо. Мерзко это и мелко, господа сберовцы!
Так вот, значит, ruDALL-E. Вдохновляют примеры в демо-галерее: они выглядят весьма заманчиво и привлекательно.
Итак, народ уже вовсю начал развлекаться и делиться своими достижениями. А я что, рыжая, что ли.
Воодушевившись успехами, продемонстрированными в галерее, я вообразила, что мы, люди, с этой сеточкой практически на равных, и заказала ей описание комнаты гоголевской Коробочки. Сетка думала 25 минут и выдала вот что.

Мне при виде этого стало что-то совсем не смешно, а вовсе даже грустно: результат уж слишком разошелся даже с самыми скромными ожиданиями.
Второе задание было попроще. Через 28 минут я получила такое.

После этого я в новинке полностью разочаровалась и стала давать ей простенькие задания. Первое — «Колбаса Брауншвейгская».
А дальше я переключилась на любезно предложенный бот в Телеграме. Было обещано, что он работает быстрее. Не могу сказать, что он более шустрый, но привлек тем, что выдает сразу три варианта за то же время. Напрягать его сильно мне более не хотелось, и я ему предложила для начала изобразить (простите великодушно!) Олю Бузову.
Видимо, сеточка решила попробовать себя в роли Бога и создать Бузову с нуля. Тогда я ее спросила, как она видит Маркса-Энгельса-Ленина. Вот так:
Тут, надо сказать, я окончательно сдалась, и сделала совсем уж элементарный запрос: «Котики».
Вот вам котики от ruDALL-E — два кривоглазых и один красноносый.
Ну вот, уже хоть что-то. Хотя к нормальным здоровым глазам сетка явно относится плохо.
«Ну, погоди!»:
Этакие фантазии на тему… Но весьма порадовали тем, что с цветовой гаммой очень даже угадали, прямо в точку.
Напоследок решила помучить сеточку англоязычными запросами, хотя в анонсе особо отмечался русский язык.
Wuthering Heights (Грозовой перевал) у сеточки ассоциируется с Экзюпери, мегаполисами и полковником, которому никто не пишет.
Знаменитое I’ll be back она видит так.
А Мadonna в ее представлении — это
Обидно, но предсказуемо.
По поводу области применения. Сбер считает, что
Использовать ее можно для создания вариантов дизайна интерьера, стоковых изображений или векторных иллюстраций, материалов для рекламы, копирайтинга, архитектурного и промышленного дизайна.
Прямо скажем, до этого еще очень далеко. Но, наверно, достижимо. Тем более что open source доступен на GitHub. Так что, если она останется бесплатной, то, когда ее докрутят, можно будет, например, самим делать иллюстрации к статьям, не заботясь о копирайте. Но это вряд ли. Как только это станет выдавать что-то годное, создатели, наверно, захотят возместить траты на ее создание.
А пока что все эти Франкенштейны неудержимо вызывают воспоминания о 3 серии 5 сезона сериала «Доктор Хаус» про художника с нарушенным мировосприятием.