Как использовать Midjourney: пошаговая инструкция

Популярен миф, что Midjourney скоро сможет заменить представителей множества профессий, связанных с дизайном. Но любым искусственным интеллектом должен управлять человек. Так, например, пользователи click.ru могут за несколько минут создавать в Midjourney оригинальные креативы для своих целей и экономить время и деньги. Рассказываем, как работать с Midjourney, чтобы искусственный интеллект стал вашим другом, а не врагом.

Шаг 1: перейдите в Discord

Шаг 2: создайте сервер

Шаг 3: перейдите в чат

Шаг 4: подключите бота к серверу

Шаг 5: изучите команды

Шаг 6: настройте Midjourney

Шаг 7: создайте изображение

Надстройки

Синтаксис

Дополнительные параметры

Шаг 8: редактируем и сохраняем результат

Шаг 1: переходим в Discord

Чтобы начать пользоваться Midjourney, нужно зайти на сайт midjourney.com и нажать на кнопку Join the Beta в нижнем правом углу. На сайте также можно найти информацию про нейросеть, условия использования и галерею с работами пользователей, обновляющуюся в реальном времени.

Вы попадете на Discord-сервер и сможете взаимодействовать с нейросетью. Потребуется ввести логин и пароль или пройти быструю регистрацию.

Затем вы попадете в общее пространство. Можно без проблем работать и в нем. Но чтобы не потерять генерации, надо добавить бота на свой сервер. Там будут храниться все картинки.

Шаг 2: создаем сервер

Кликаем по кнопке со значком «+» на левой панели и создаем свой сервер. В окне Create a server выбираем «Свой шаблон» (Create My Own) → «Для меня и моих друзей» (For me and my friends). Указываем имя сервера.

Шаг 3: переходим в чат

Кликаем по белой иконке с кораблем в левом меню, чтобы перейти в чат Midjourney. Там будут сообщения разработчиков об обновлениях. Надо перейти в раздел Newcomer Room – блок для новых пользователей – и выбрать чат, наименование которого начинается с newbies.

Шаг 4: подключаем бота к серверу

В правой части экрана отображается список участников чата. Если их не видно, нужно нажать на значок с людьми в правой части верхней панели.

Сначала показываются члены команды, а под ними – подключенный к чату Midjourney Bot.

Нужно нажать на название бота, чтобы добавить его на созданный сервер.

В этом же окне видны основные команды, с помощью которых можно управлять ботом. О них мы еще расскажем подробно.

В открывшемся окне кликаем по кнопке «Добавить на свой сервер» (Add to Server) и выбираем его в выпадающем списке. Нужно согласиться с настройками и нажать «Продолжить» (Continue).

Значок сервера появится в столбце под иконкой личных сообщений.

На собственном сервере кликаем по значку «+» слева от поля ввода текста внизу экрана. А потом – по строчке «Использовать приложения» (Use Apps).

В открывшемся списке в столбце слева отображаются все подключенные боты, в т. ч. и Midjourney.

Шаг 5: изучаем команды

Т.к. Midjourney – бот, то нужно давать команды с помощью текстовых операторов. Подсказки появляются, если набрать в текстовой строке «/». Бот может сам достраивать слова-операторы по мере набора текста.

Команды служат для создания изображений, настройки параметров по умолчанию, получения информации о пользователе и выполнения прочих полезных действий.

/ask

Задает боту вопрос о нейросети. Например, /ask subscription показывает страницу с вариантами подписки, а /ask relax рассказывает о том, как использовать режим Relax.

/blend

Позволяет загружать несколько изображений и смешивать друг с другом. Текст не нужен.

/describe

Позволяет загрузить изображение и получить к нему четыре варианта промта. В конце каждого варианта – числа. Обозначают соотношение сторон изображения.

Под картинкой есть кнопки 1–4. Кликнув по кнопке, пользователь отправит на генерацию запрос под этим номером.

/fast

Переключает в «быстрый» режим генерации. Изображения создаются в течение 30–60 секунд, но тратятся минуты тарифа.

/help

Показывает список ссылок на документацию и FAQ на сайте Midjourney.

/imagine

Создает изображение на основе текстового запроса (промта). Мы еще расскажем подробнее о команде.

/info

Дает информацию об аккаунте.

Subscription – дата следующей оплаты и тип подписки.
Visibility Mode – режим приватности.
Fast Time Remaining – остаток времени по тарифу в минутах и процентах.
Lifetime Usage – статистика использования за все время в картинках и часах.
Relaxed Usage – та же статистика для генераций в режиме Relax.
Queued Jobs (Relax и Fast) – количество задач в очередях.
Running Job – количество задач в очередях и текущий запрос (если изображение генерируется прямо сейчас).

/invite

Генерирует ссылку для приглашения других пользователей.

/prefer option set

Позволяет сохранять комбинации параметров. Пресет можно вызвать по указанному при сохранении имени. Мы писали о пресетах в этой статье.

/prefer auto_dm

Включает и отключает функцию, при которой бот автоматически отправляет результаты запросов в личку.

/prefer option list

Показывает список всех сохраненных пресетов и их значения. Можно иметь до 20 сохранений.

/prefer suffix

Позволяет сохранить размер и соотношение сторон изображения (—ar), чтобы не писать каждый раз.

/prefer remix

Включает/выключает режим ремикса. В этом режиме до создания вариаций бот открывает окно с первоначальным запросом. Его можно изменить. Изображение, выбранное для создания вариаций, будет примером для нового запроса.

/prefer variability

Включает и отключает повышенную вариативность. Можно отключить режим, повторно выполнив эту же команд.

/public

Переключает в «публичный» режим генерации. Все генерации становятся доступны всем посетителям на сайте www.midjourney.com, даже если пользователь общается с ботом на своем сервере или в личных сообщениях. Включен для всех режимов, кроме корпоративных.

/private

Переключает из режима public.

/shorten

Анализирует promt и сокращает его. Предлагает несколько вариантов.

/show

Показывает выполненное задание на основе Job ID. Это идентификатор каждой задачи на генерацию. Его можно получить в ЛС, отправив реакцию с конвертом на созданное изображение.

Также Job ID доступен на сайте Midjourney в личном кабинете.

Ответом на команду будет точный запрос с параметрами и изображение.

/relax

Переключает в режим Relax, который не тратит GPU-минуты.

/settings

Открывает окно настроек Midjourney. Будут использоваться по умолчанию, пока пользователь не поменяет их. Подробно разберем в следующем шаге.

/stealth

Переключает в режим невидимости. Изображения не сохраняются в галерее, их не видят другие люди. Доступен только для корпоративных тарифов.

/subscribe

Создает ссылку на оплату.

/turbo

Переключает в турбо-режим.

/userid

Выводит ваш ID.

На сообщения бота можно также ответить с помощью emoji.

❌

Отменяет генерацию (если не завершена) или удаляет сгенерированные изображения из галереи в ЛК на сайте Midjourney.

✉

Позволяет получить текст запроса, Job ID, seed и все сгенерированные изображения в личку. Если запросили сохранить видео генерации, то в сообщении будет ссылка на ролик.

⭐

Добавляет работу в закладки.

Шаг 6: настраиваем Midjourney

Как мы сказали выше, команда /settings открывает поле с настройками генерации, качества, приватности и т. д.

В окне можно можно выбрать:

версию Midjourney. Лучше использовать 5.2 – последнюю на момент написания статьи: по сравнению с предыдущими версиями она выдает изображения с большей детализацией, более высокого разрешения и лучше понимает запросы. По умолчанию изображения генерируются именно в ней;
Niji – режим рисования в стиле манги и аниме. Niji – совместный алгоритм Midjourney и Spellbrush – создателей первого генератора аниме-персонажей с искусственным интеллектом. Стоит включать настройку, если необходимо создавать изображения только в таком стиле. Если модель нужна для одной генерации, лучше использовать в запросе параметр —niji 5;

Stylize – степень художественной выразительности изображения. Чем выше уровень выставлен в настройках, тем свободнее стилизация изображения. Доступны 4 значения: от низкого (Low) до очень высокого (Very High). При высоких значениях стилизации нейросеть создает красивые, композиционно верные картинки с хорошим светом и цветом (но может не точно следовать запросу). Эффект бывает интересным, но управлять фантазией Midjourney сложно. Лучше использовать Stylize Med или Stylize High;
Public mode – публичность. Public mode включен по умолчанию. Сделать работы недоступными для публичного просмотра можно только на корпоративных тарифах;
скорость генерации – Fast mode (включен по умолчанию), Turbo mode или Relax mode;
Remix mode – возможность изменить запрос при создании вариантов сгенерированного изображения. Позволяет получить на его основе похожую картинку с другими объектами;
High Variation mode и Low Variation mode – вариативность. Midjourney создает сразу четыре изображения, и этот параметр влияет на то, насколько они будет похожими друг на друга. Лучше оставить высокую вариативность (High Variation);
RAW mode – режим без обработки. В моделях Midjourney 5.1 и 5.2 можно генерировать красивые изображения даже по минималистичному запросу из двух слов и придерживаться «эстетики Midjourney». Для отключения функции предназначена кнопка RAW mode. Новичкам не рекомендуется включать настройку, а опытным пользователям нейросети – отключать ее.

Шаг 7: создаем изображение

Для создания изображения нужно ввести команду /imagine, а затем в появившемся поле prompt около командной строки написать запрос. Чем подробнее запрос, тем больше нужных деталей включит в изображение нейросеть.

Клик по клавише Enter отправит «задание». Запрос можно вводить только на английском языке.

Процесс создания изображения в реальном времени:

Мы не будем останавливаться подробно на основных требованиях к промту и общей логике построения запросов для нейросетей по генерации изображений. Об этом есть отдельная статья. Разберем только специфику Midjourney.

Надстройки

В Midjourney есть короткие команды, которые можно добавить к запросу и усилить стилизацию, быстро поменять разрешение сторон изображения, увеличить абстрактность и пр.

—Aspect Ratios

Параметр —aspect, или —ar, определяет соотношение сторон. По умолчанию изображения создаются 1:1. Но размер можно изменить и создать картинки в других форматах. Для этого надо прописать команды:

-‍-w – ширина картинки. Работает лучше, если значение кратно 64;
-‍-h – высота картинки. Аналогично, работает лучше, если значение кратно 64;
-‍-ar – желаемое соотношение сторон. Используется вместо ручной настройки высоты и ширины через -‍-h и -‍-w. Например, параметр -‍-ar 16:9 включает соотношение сторон 16:9.

Если нужно указать пользовательский размер картинки, можно использовать команду -‍-w Х -‍-h Y. Настроить любые соотношения нельзя. Можно выбрать стандартные значения разрешения.

Также можно задать выходное разрешение через слова вроде 4K, 8K, photoreal, ultra detail, ultra photoreal, intricate details и т. д.

—Chaos

Параметр —chaos повышает степень абстракции в запросе. Диапазон – от 0 до 100. Чем выше значение, тем оригинальнее результат.

Вот что создала нейросеть по запросу beautiful happy red cat with perfect fur sitting by the window, high detail fur, warm sunny day, illustration, wallpaper —ar 16:9 —chaos 100:

И кот не у окна, и не везде он рыжий. А на одном изображении заданные требования не соблюдены вообще.

А вот результат по промту со значением хаоса 0: beautiful happy red cat with perfect fur sitting by the window, high detail fur, warm sunny day, illustration, wallpaper —ar 16:9 —chaos 0:

Он совершенно иной.

—Niji

Параметр —Niji позволяет генерировать изображения в стиле аниме и манги. Мы уже упоминали его выше.

—Stylize

Параметр —stylize (число) влияет на степень применения художественного стиля к изображению. При низком значении стилизации результат будет более точно отвечать запросу, но иметь меньше художественной выразительности. При высоком значении стилизации изображение будет очень художественным, но менее связанным с подсказкой для стиля. Диапазон – от 0 до 60 000.

Например, beautiful happy red cat with perfect fur sitting by the window, high detail fur, warm sunny day, illustration, wallpaper —ar 16:9 —stylize 500:

—Quality

Параметр —q влияет на качество генераций и затрачиваемое время. Чем выше значение, тем дольше генерация, но детализированнее картинка. Также для создания изображения с высокой детализацией нужно больше минут вычислительной мощности графического процессора (GPU).

-‍-Iw

Если вы показываете нейросети пример, то команда -‍-iw <число> задает степень сходства изображений. Можно ввести значение от 0,5 до 2. Значение по умолчанию 1.

—Version

Подпись —v позволяет задать, какая версия Midjourney будет создавать картинку по промту. По умолчанию стоит последняя модель.

—No

При указании параметра —no Midjourney будет избегать заданных объектов. Например, в запросе fried chicken —no sauce система создаст изображение с жареной курицей без соуса.

—Video

Можно сохранять видео генерации изображения. Для этого надо добавить к промту —video, а потом с помощью эмодзи письма попросить нейросеть прислать ролик в личку.

—Weird

Параметр —weird или —w добавляет необычные особенности в создаваемые изображения, позволяет экспериментировать. Диапазон – от 0 до 3000. По умолчанию значение равно 0.

— Repeat

Параметр —repeat, или —r, позволяет запускать задание несколько раз.

—Seed

По умолчанию каждое изображение получает случайное значение seed. Но с помощью параметра —seed можно задать конкретное значение. Если использовать один и то же seed, то и результат будет примерно одинаковым или в одном стиле. Допустимы числа от 0 до 4294967295. Чтобы узнать, какой seed был в последней генерации, нужно отправить эмодзи ✉ в ответ на результат.

—Stop

Параметр —stop позволяет прервать процесс генерации на более раннем этапе и получить результаты с меньшей детализацией и четкостью. Диапазон – от 10 до 100. По умолчанию значение равно 100.

—Tilе

Параметр —tile можно добавить для создания бесшовных паттернов. Генерируется только одна плитка. Проверить результат можно на сайте.

Синтаксис

Запятая разделяет части предложения и помогает нейросети понять, где заканчивается одно условие и начинается другое. Когда пользователь ставит запятую, он позволяет нейросети быть более гибкой и по-своему интерпретировать каждую часть промта.

Двойное двоеточие :: указывает нейросети об изменении смысловой части запроса.

Например, про промту beautiful happy red cat with perfect fur sitting by the window, high detail fur, warm sunny day: : illustration style: : —ar 16:9 такой результат:

Кроме того, можно добавить число (вес) после двойного двоеточия и указать важность конкретного параметра относительно других параметров в запросе. По умолчанию вес каждого слова из запроса равен 0,25. Если, например, написать в запросе для нейросети red::.6 cat::.5, то у слова red вес будет больше, чем у cat. Если указать негативные веса, например red::.-1 cat::.1, то кот перестанет быть рыжим. Узнать больше о весах в Midjourney можно в документе.

Дополнительные параметры

В промте Midjourney можно задать стиль, настройки освещения, времени суток, камеры, погоды и пр. Параметров очень много. Разберем некоторые на промте: beautiful happy red cat with perfect fur playing on the grass, high detail fur, warm sunny day, wallpaper —ar 16:9.

Ракурс. Можно получить как вид с высоты птичьего полета, так и портрет.

Когда нужно получить изображение с прямой перспективой, стоит дополнительно указать looking into the camera или full-face. Однако Midjourney часто сама создает именно такие ракурсы.

Если нужен вид сверху, самые простые варианты birds-eye-view photo или drone shot photo of. Варианты похожи, но могут варьироваться исходя из запроса.

Добавили к промту birds-eye-view photo:

Угол. Можно немного приподнять угол обзора с помощью ввода указания high- angle photo of или опустить камеру через a hip/knee/ground level shot of (срабатывает чаще) или view from below.

Если нужен определенный угол обзора, можно использовать in profile, three quarter view, back view.

Добавили back view:

План. Можно сделать портрет, взять средний план, создать изображение в полный рост или издалека. Для этого нужно добавить к промту closeup shot или closeup photo, medium-full photo/shot, full body photo/shot или full photo/shot.

Если надо изобразить несколько объектов целиком или которые видно издалека, можно использовать view from afar, long photo/shot, a wide photo/shot.

Важно не добавлять в запрос противоречащие друг другу описания. Например, нельзя получить и вид издалека, и довольную мордочку с высокой детализацией шерсти.

Освещение. Тут все предельно просто. Надо указать в запросе источник света или временной интервал, который нужно получить, например: daylight, sunny afternoon, incandescent light, backlighting и т. д.

Шаг 8: редактируем и сохраняем результат

Под изображением есть кнопки. Кнопки U масштабируют картинку, создают увеличенную версию выбранного варианта.

Кнопки V создают новые варианты выбранного изображения. Картинки выполнены с той же композицией и в том же стиле, что и понравившийся вариант.

Кнопка «Обновить» создает новые изображения под тот же запрос.

После масштабирования изображения (U) появится новый набор параметров:

Web открывает изображение в галерее пользователя на сайте Midjourney;
❤️ отмечает понравившиеся изображения, чтобы легко найти их в галерее Midjourney;
Zoom Out позволяет «отдалить» созданное изображение, дорисовав ему края. Напоминает генеративную заливку в Adobe Photoshop. Нужно выбрать степень отдаления и нажать соответствующую кнопку. Кликать по кнопке можно сколько угодно раз. Но поскольку запрос не меняется, есть вероятность, что изображения начнут повторяться;

Custom Zoom позволяет не только задать степень отдаления, но и отредактировать запрос;

Make Square дорисовывает изображение и меняет его форму: делает квадратное из прямоугольного (если картинка и так квадратная, кнопки не будет);
Vary (Strong) и Vary (Subtle) создают варианты сгенерированного изображения с указанием, насколько сильно они будут отличаться от исходника. Vary (Strong) вносит более сильные изменения в вариации, а с Vary (Subtle) изменения почти незаметны;
Vary (Region) позволяет выделять и изменять конкретные области сгенерированного изображения, не затрагивая всю картинку.

Устроивший вас результат нужно открыть в новой вкладке браузера и сохранить.