Posted 17 августа 2022,, 16:00

Published 17 августа 2022,, 16:00

Modified 1 февраля, 19:06

Updated 1 февраля, 19:06

Нейросеть смоделировала и показала историю Земли и гибель человечества

17 августа 2022, 16:00
Теперь искусственный интеллект умеет очень многое.

Нейросети, создающие изображения на основе текстовых или голосовых описаний, стали появляться совсем недавно. Но уже прошли путь от причудливых абстракций до почти фотографических изображений, которые генерятся за считанные минуты.

Главной пока считается сеть DALL-E, она наиболее точно «рисует» по текстовому описанию. Вот, к примеру, образцы ее работы.

Есть и другие примечательные сервисы, которые можно протестировать уже сейчас. Но почти у всех у них было большое ограничение: на нейросетях стояли фильтры, не позволяющие создавать изображения с портретами общественных деятелей, а также разный «запрещенный» или «токсичный» контент — к примеру, сеющий расовую рознь, милитаристский, порнографический и т. д.

Появившаяся в середине августа 2022 года сеть Stable Diffusion генерирует изображения с разрешением 512×512 пикселей всего за несколько секунд при любых условиях. Эта система — более либеральная, чем все остальные, но не уступает им (а многие превосходит) в качестве.

Stable Diffusion более разнообразна, чем Midjourney, но имеет чуть более низкое разрешение, чем DALL-E 2.

Если раньше все такие нейросети не давали доступ сторонним людям к своему коду, а значит их нельзя было использовать по своему усмотрению, то Stable Diffusion разрешает это.

Дело в том, что Stable Diffusion не требует больших ресурсов. Она работает на одной видеокарте с 5,1 гигабайтами видеопамяти (как на вполне доступном игровом компьютере). Проект выводит технологию искусственного интеллекта на новый уровень, который ранее был возможен только с помощью облачных сервисов.

Таким образом, Stable Diffusion предлагает исследователям и заинтересованным сторонам, не имеющим доступа к большим вычислительным ресурсам, возможность экспериментировать с современными моделями создающего контент искусственного интеллекта (ИИ).

То есть в нейросетях, генерирующих изобразительное содержание (картинки, видео, инфографику и т. п.), наступает революционный этап, уже пройденный языковыми нейросетями: от монополии одного поставщика — к широкой доступности многочисленных альтернатив с открытым исходным кодом.

Одним из примеров работы Stable Diffusion стало появившееся на днях видео, показывающее историю всего сущего от начала до конца. Программист и цифровой художник из Бельгии Ксандер Стинбрюгге (Xander Steenbrugge) сгенерировал трехминутный ролик, рассказывающий о Вселенной от ее зарождения до гибели человечества.

Для создания видео Стинбрюгге использовал 36 последовательных фраз. По каждой из них генерировалось несколько изображений, дальше оставалось только склеить их в один большой ролик.

Трехминутное видео начинается с зарождения космического пространства, затем на 15 секунде на экране появляется Земля. Рядом с планетой расположены другие небесные тела, которые влияют на формирование земных рельефов.

Кстати, на 58-й секунде среди динозавров можно увидеть фигурку человека — то ли землянина, то ли пришельца, — рассматривающего огромных животных.

Это наглядный пример того, что сейчас любой человек буквально может снять свой собственный фильм или анимацию, просто надиктовав его нейросети.