Интернет наводнили изображения, сгенерированные Midjourney. Нейросеть используют маркетологи, веб-дизайнеры, фотографы и многие другие. Если вы еще не пробовали работать с Midjourney, самое время начать. А мы расскажем как. Читайте о том, чем полезна нейросеть, сколько она стоит и какие правила соблюдать, чтобы не попасть в бан.
Кто и для чего может использовать Midjourney
Права на изображения Midjourney
Как не попасться на удочку Midjourney
Что такое Midjourney
Midjourney — нейросеть, способная создавать реалистичные изображения по текстовому запросу. В основе работы лежат два важных научных достижения в области искусственного интеллекта: способность распознавать речь человека и генерировать изображения. Нейросеть использует глубокое обучение, чтобы установить связь между запросом пользователя и данными, загруженными в ее большую библиотеку. Разработкой генеративного ИИ занимается американская компания Midjourney. У истоков проекта стоит ученый Дэвид Хольц.
Кстати, вот результат работы нейросети по промту с именем ее создателя:
А вот так нейросеть видит саму себя:
Аналогичные программы создавались и ранее. Например, приложение Prisma позволяло превращать фотографии в «картины» в стиле работ различных художников. Однако, несмотря на успех Prisma, программа Midjourney превосходит ее как по популярности, так и по функциональным возможностям.
Нейросеть способна распознавать различные художественные стили, направления, подражать работам известных художников, иллюстраторов, дизайнеров и фотографов. Можно комбинировать разные стили в одном изображении, чтобы создавать сложные и креативные работы. Нейросеть продолжает развиваться, и с каждой новой версией повышается реалистичность генерируемых изображений. При этом все сложнее отличить фотографию или рисунок от созданной AI иллюстрации.
Кто и для чего может использовать Midjourney
Midjourney помогает решать множество задач: от составления раскадровок для фотосессии или съемки ролика до создания дизайна приложений и сайтов.
Чаще всего нейросеть используют дизайнеры и маркетологи.
Дизайнерам Midjourney помогает создавать уникальные и креативные макеты, концепт-арты, кейвижуалы и другие визуальные материалы. Нейросеть позволяет сэкономить время на поиске подходящих изображений, создании единого оформления (концепта), а также делает мудборды и проекты более креативными. Дизайнеры могут искать и создавать референсы, черпать вдохновение и экспериментировать.
Маркетологи часто используют нейросеть для подготовки рекламных материалов: баннеров, креативов для рекламных объявлений, изображений для постов в соцсетях и пр. Например, пользователи click.ru могут создать несколько изображений для объявлений, чтобы быстрее запустить рекламную кампанию или протестировать несколько гипотез.
Нейросеть помогает доработать контент, например с помощью дополнительных визуальных эффектов, чтобы он лучше соответствовал маркетинговым целям. Также благодаря Midjourney специалисты по рекламе могут быстро создать референсы для дизайнеров и иллюстраторов, найти связь между текстом и визуалом.
Иллюстрациями от Midjourney можно, например, заменить стоковые изображения.
Сколько стоит Midjourney
Первая бета-версия Midjourney появилась в 2022 году. Программа давала 25 бесплатных попыток, пока нейросеть тестировали пользователи. Но весной 2023 появились ограничения, и теперь пользоваться Midjourney бесплатно нельзя. На момент написания статьи есть четыре платных тарифных плана: два для обычных пользователей и два для крупных компаний, валовой доход которых превышает 1 млн долларов США в год.
При оплате за год есть скидка 20%. Каждый план включает доступ к галерее Midjourney, официальному Discord и многому другому. На корпоративных тарифных планах можно работать с нейросетью приватно – так, чтобы никто не увидел созданных изображений.
Сравнить тарифные планы можно на сайте Midjourney.
Midjourney использует графические процессоры (GPU) для обработки каждого запроса. Когда пользователь оплачивает подписку, он покупает время использования этих процессоров.
В каждом тарифном плане имеется определенное количество GPU-минут/часов. Midjourney может работать в трех режимах генерации изображений: Fast, Relax и Turbo. Простыми словами, количество GPU-минут в выбранном тарифе будет равно количеству действий в режиме Fast. Например, лимит в 200 GPU-минут на базовом тарифном плане означает, что можно сгенерировать до 200 изображений в месяц. В режиме Turbo картинки создаются в 4 раза быстрее, но на действия нужно в 2 раза больше GPU-минут, чем в режиме Fast. GPU-минуты расходуют любые команды, включая повторную генерацию. Докупить дополнительный GPU-час можно на любом тарифе за 4 доллара.
В режиме Relax GPU-минуты не тратятся, но нейросеть отвечает в течение 10 минут на любую команду по генерации. Режим не доступен в базовом тарифном плане.
Сегодня оплатить подписку картой российского банка невозможно. Но, например, можно воспользоваться услугами посредников на Авито или в социальных сетях, специальными сервисами, попросить друзей, у которых есть карта зарубежных банков. Важно понимать, что у любого способа оплаты есть риски. И вы сами несете ответственность за транзакции.
Права на изображения Midjourney
Некоторые считают, что если изображение сгенерировала нейросеть, то права автоматически переходят пользователю. По их мнению, что Midjourney не может ничего принадлежать, так как это технология. Однако это не совсем так. Создатели нейросети вложили в разработку немало сил и средств, а сама Midjourney принадлежит компании Midjourney Inc. Права на изображения, созданные с помощью нейросети, регулирует Пользовательское соглашение. Они зависят от типа подписки на сервис. При бесплатной подписке (которая была возможна ранее) на изображения, созданные нейросетью, действует лицензия Creative Commons Noncommerical 4.0 Attribution International. Это означает, что полученные работы можно распространять и изменять с указанием источника. Коммерческое использование запрещено. Пользоваться картинками в коммерческих целях можно только по платной подписке.
Что нельзя генерировать
Запрещено вводить запросы и отдельные слова, которые не соответствуют рейтингу PG13 – 13+. Нельзя упоминать алкоголь, наркотические вещества, использовать нецензурную лексику и сексуальные намеки. Если нарушать правила, сначала доступ к аккаунту ограничат на время, а потом могут заблокировать навсегда.
Кроме того, запрещено создавать изображения президента Китая Си Цзиньпина. Midjourney блокирует даже упоминание его имени в промте. Некоторые пользователи нашли способы обойти ограничение: можно использовать полный URL-адрес с фотографией Си Цзиньпина или команду /blend для смешивания двух изображений.
Между тем, журналист-расследователь Элиот Хиггинс рассказал, что его заблокировали в Midjourney после серии изображений ареста Дональда Трампа в Нью-Йорке. Картинки завирусились в социальных сетях. Хольц рассказал, что компания получала жалобы от пользователей из-за генерации контента по определенным темам в разных странах. Поэтому нейросеть блокирует многочисленные промты. Хольц признал, что ситуация с Китаем особенно остра. Из-за политического юмора местные пользователи сильно рискуют. Основатель не перечислил все запретные темы и термины, но отметил, что они связаны не только с Китаем.
Как не попасться на удочку Midjourney
Еще до появления Midjourney ученые заметили, что людям стало труднее различать реальные фотографии и изображения, созданные нейросетями. В 2022 году Хани Фарид, профессор Калифорнийского университета в Беркли, и Софи Найтингейл, специалист из Ланкастерского университета (Великобритания), провели исследование. Участники были должны определить, где настоящее фото человека, а где – сгенерированное нейросетью изображение. Испытуемые смогли ответить верно лишь в 48.2% случаев. Мы собрали несколько признаков, которые могут помочь отличить работу нейросети от человека.
На что стоит обратить внимание?
- На анатомию. Часто нейросети изображают руки, на которых больше либо меньше 5 пальцев. И располагаются они не так, как у людей. Эта проблема была частично решена только в последней версии Midjourney, а в более ранних версиях для устранения ошибки использовался сторонний плагин. Зубы на картинках нейросети тоже не всегда реалистичны. Их бывает слишком много. А вот обсчитаться в количестве глаз сложнее – только смотрят они практически всегда как будто в никуда: взгляд на большинстве портретов пустой и безжизненный.
- На симметрию. Пока что нейросети не полностью освоили создание симметричных объектов. Они не всегда понимают, что именно рисуют. За время обучения алгоритмы хорошо усвоили, как выглядят лица и тела людей и животных. Однако им еще сложно понять, как устроена, например, человеческая одежда. Часто пиджаки могут иметь полы разной длины или левая часть предмета может не соответствовать правой. Симметричные узоры тоже могут выглядеть идеально только на первый взгляд. Если посмотреть внимательно, то видны ошибки.
Тут явные проблемы с руками, глазами и с симметрией в одежде:
- На искажения в деталях. Нейросети успешно справляются с крупными планами, так как они содержат меньше деталей. Чем больше разнородных элементов на изображении, тем выше вероятность ошибки при генерации. Именно поэтому нейросети часто размывают фон позади главного героя.
Кроме того, нейросети сложно воспроизводить функциональные элементы, так как она «не понимает» их назначение. Предметы могут быть похожи на реальные, но в действительности бесполезны.
Размытый фон – один из признаков работы нейросети:
- На надписи, узоры. Искусственный интеллект не понимает символизм, логику знаков и то, что у надписей есть определенный смысл. Например, татуировки часто не имеют четко оформленного рисунка или сюжета, особенно если содержат надписи.
- На культурный контекст. Midjourney быстро обучается, но, не смотря на это, еще не полностью разбирается в исторических и культурных реалиях. И тут бывает много смешных ошибок. Например, ордена по всему мундиру, нелепая шляпка, которая не соответствует эпохе, и пр. Поэтому нейросеть лучше справляется с вымышленными, фантастическими сюжетами.