Name: Blog Click - База знаний по цифровому маркетингу
Creator: Click.ru
Published: 2023-09-21
License: https://creativecommons.org/licenses/by/4.0/

Как составить промт для нейросети, генерирующей изображения

Если вы уже использовали нейросети, то знаете, как сложно получить результат, который бы вам понравился. Чтобы ожидание совпало с реальностью, важно правильно написать промт (промпт) – запрос. Общие принципы одинаковы в любых нейросетях. Рассказываем, как правильно составить промт для генерации изображений в нейросетях, чтобы искусственный интеллект вас понял корректно.

1 этап. Составляем несложный запрос

2 этап. Детализируем объект

3 этап. Задаем стилистику

4 этап. Добавляем примеры

5 этап. Настраиваем параметры

6 этап. Собираем запрос воедино

1 этап. Составляем несложный запрос

Научиться писать промты легко. Для создания изображения достаточно нескольких слов. Вы сможете получить результат высокого качества с минимальным количеством усилий. Но если ввести несколько слов без уточнений, нейросеть додумает сама недостающие детали. Поэтому, если вы точно знаете, какой результат хотите получить, сначала надо правильно составить максимально простой запрос для нейросети, а потом добавить к нему уточнения.

Нейросети принимают лучше всего промты на «родном» языке. Например, Midjourney – на английском, а Kandinsky, нейросеть об Сбера, – на русском. Если не вы не знаете английский, можете использовать переводчики. Например, нейросетевой переводчик DeepL хорошо определяет контекст.

Объект. Это основа фактически любого запроса для нейросети. Именно объект будет в центре всего изображения. Логично, что в сначала надо продумать именно его. Например, волшебник, кот, священник, ангел, некромант, император, город, королева, храм, дом, ферма, пейзаж, гора, машина, река.

Нейросети обучаются на огромной базе изображений из интернета. Поэтому легко выдадут результат по такому запросу. Но, если вписывать в команду только один объект, результаты будут однообразны. Поэтому, например, можно попробовать совместить два объекта: некромант-коммунист, кот-геймер, киберпанк-монах.

Также идеи можно совмещать через предлоги. Винни-Пух из глины, Винни-Пух как король Франции или Винни-Пух, похожий на Пятачка.

По промту Winnie the Pooh as King of France в Midjourney получился такой результат:

А вот такой – в «Кандинском»:

Вариант по промту от Leonardo.AI:

Еще один – от Stable Diffusion:

А вот так видит Винни Пуха в роли короля Франции DALL·E 2:

На примерах наглядно видно, насколько по-разному нейросети могут воспринимать один и тот же промт.

Нейросети позволяют использовать персонажей в качестве объектов. Героев легко узнать, даже если внешность не списана с актеров.

Чтобы на изображении находились несколько объектов, нужно указать количество. Вместо «маги в кафе» напишите «три мага в кафе». Если не указывать значение, нейросеть отобразит случайное количество магов.

Чем больше конкретных объектов на изображении, например больше пяти-шести, тем сложнее нейросети. В таких случаях лучше просить сгенерировать «толпу магов». Но важно помнить: чем больше объектов, особенно животных или людей, тем выше вероятность ошибки и хуже детализация.

Абстракции. Кроме реальных объектов нейросети способны генерировать абстрактные понятия вроде судьбы, времени, смысла жизни или счастья. Они это делают так, как подобные концепты изображают в искусстве или поп-культуре. Сгенерируйте создание времени или когнитивный резонанс – результаты будут удивлять каждый раз.

В то же время не желательно увлекаться и генерировать концепции, предполагающие самостоятельные выводы и обдумывание. Вы так запутаете нейросеть. Лучше выбирать конкретные запросы, где объекты заменяют абстрактные понятия. Например, вместо «оптимистичного будущего» лучше попросить создать по промту «киберпанк-город с голограммами», а вместо «моды в 3000 году» – «футуристичное платье с красочными и светящимися украшениями».

Сразу нужно отказаться:

от отрицаний. Избегайте слов «не», «без», «исключая», «кроме» и пр. Нейросети понимают все буквально и не видят отрицательных частиц. Например, по промту «мужчина без бороды» нейросеть генерирует изображение бородатого мужчины. Поэтому лучше создать запрос для нейросети «чисто выбритый мужчина», чтобы получить то, что требуется;
большого количества объектов. Есть высокая вероятность, что нейросеть ошибется. Особенно, если детализировать каждый объект;
желания точно передать реальный объект. Если вы укажете «Москва», то не получите реальную столицу России – это будет вариация нейросети с характерными элементами. Аналогично и с попытками создать образы конкретных людей. Да, они будут похожи, но это все равно вариант нейросети.

Для генерации картинок в запросе к нейросети стоит использовать архетипы. Например, вместо «человек, который держит лук и стрелы» лучше написать «лучник», вместо «человек в белом халате с документами и стетоскопом» – «врач». Если все равно не получается, можно найти в интернете, например на фотобанках или в Pinterest, похожее изображение и взять описание к нему. Так ИИ будет проще понять идею, ведь именно на подобных изображениях с описаниями он и обучался.

2 этап. Детализируем объект

Конкретизируйте. Например, придумайте, как на изображении будут расположены объекты. Укажите, что находится в центре картинки, а что на заднем плане.

Добавлять детали на изображение можно с помощью глаголов, существительных и прилагательных. Напишите не просто «маг», а «грустный маг в колпаке поздно вечером работает в офисе за компьютером». Не забывайте, что в нейросетях есть ограничение на количество знаков в промте. Например, у Midjourney – 4000 знаков, у Stable Diffusion – 75 слов, у DALL-E 2 – 400 символов.

К объекту можно добавить базовые детали.

Действия. Действие важно сформулировать так, чтобы оно наглядно отображалось на изображении. Глаголы «идет» или «стоит» помогают больше, чем «беспокоится» или «мечтает». Если необходимо изображение с неочевидным действием, лучше написать промт не просто «ностальгирует», а «сидит, вспоминает детство».

Результат Midjourney по промту аn adult who remembers his childhood, memories like clouds, something pleasant, airy, inspiring.

Нейросеть «Кандинский» поняла витиеватый запрос получше. Как минимум, сгенерировала действительно взрослого человека:

Цвета. Можно задать цвет деталей или полностью цветовую палитру. Например, что платье на девушке должно быть красным, а ваза на столе – синей.

Есть такие рабочие параметры:

базовые цвета – синий, красный, желтый и другие. С тонами дела сложнее, но можно попробовать уточнить;
художественные цвета – сепия, неон, черно-белая гамма, Kodachrome и пр.;
палетки – с радужными, пастельными тонами, цветами Pantone;
Duotone – двухцветные изображения для минималистичных генераций.

Результат по запросу blue kitten standing near magic jar with blue butterfly, glowing neon для Midjourney:

И Leonardo AI:

Описания. Значительно улучшить изображение помогают прилагательные. Они позволяют задать персонажу или сцене настроение.

Для усиления эффекта лучше не использовать слово «очень». Нужно подбирать синонимы. Например, «прекрасный» вместо «очень красивый». Подбирать синонимы сразу на английском помогает сайт losethevery.

Вот несколько прилагательных, которые можно использовать в запросе: ancient, angry, angelic, anxious, athletic, award-winning, beautiful, blurry, chaotic, clean, cold, complicated, complicated maximalist, cheerful, colorful, confusing, calm, creepy, cute, creepy, cozy, detailed, depressing, dirty, dreamy, disgusting, dry, older, expensive, ethereal, ecstatic, evil, eerie, excited, bold, flat, flat design, fancy, flat shading, fluffy, furry, friendly, good, gloomy, ghostly, gorgeous, hyperrealistic, hairy, happy, huge, impossible, incoherent, joyful, large, clear, luminous, solitary, massive, mini, massive scale, moody, mature, gentle, micro, minimalist, morbid, speckled, muted, nervous, nano, otherworldly, old, OCD, very detailed, powerful, photorealistic, priceless, pretty, psychedelic, refreshing, rainy, realistic, sad, strange, sleepy, simple, strong, smooth, surface detail.

Один из трендов – создание изображений животных в исторических костюмах. Например, по запросу с прилагательными german spitz dressing like pirate, muscle, huge, ferocious Midjourney генерирует такие картинки:

Leonardo.AI:

«Кандинский»:

Не бойтесь добавлять синонимы – так нейросеть сможет лучше понять, какой результат вам нужен. Например, если хочется передать мрачное настроение, то можно одновременно использовать слова «темно», «плохо освещено», «мрачно», «страшно», «хоррор».

Настройки кадра. Вы можете задать тип камеры, объектива, фокусное расстояние, расстояние до объекта, выдержку.

Вот несколько примеров:

расстояние до объекта – long shot, close-up, medium shot, extreme close-up, extreme long shot;
расположение камеры – low angle, aerial view, over-the-shoulder shot, dutch angle;
настройки камеры – fast shutter speed, bokeh, motion blur, slow shutter speed, fisheye;
объектив камеры – macro lens, telephoto lens, wide angle lens;
креативные стили – polaroid, go-pro selfie, camera obscura, CCTV.

Результат от Midjourney по промту eye-level, ultra-wide angle shot of a old man in a suit, looking to the right, angry, photograph taken on kodak camera, shot on 28 mm kodak camera, film vintage colors:

И Leonardo AI:

Отсылки к платформам. ИИ обучается на изображениях из интернета, поэтому упоминание конкретных сервисов позволит достичь похожего результата. Например, формулировка Trending on ArtStation стилизует изображение в духе артов с сайта.

Соблюдайте баланс. Есть ощущение, что чем детальнее и полнее будет запрос, тем лучше окажутся результаты. Но избыток деталей может перегрузить систему, поэтому итоговое изображение окажется далеко от задумки.

3 этап. Задаем стилистику

ИИ обучен на огромном количестве работ конкретных людей, художественных стилях, временных эпохах и различных эстетиках. Известны тысячи стилистик, которые вы можете указать в запросе и получить хороший результат. Например, создать изображение кошки-геймерши в эстетике готики, нуара, современного искусства, манги, фэнтези, сюрреализма, пиксель-арта или другого художественного стиля. Список стилей можно найти, например, в документации к Midjourney.

По промту watercolor painting style, German city view, Old town, White Background Midjourney сгенерировала неплохие иллюстрации:

Менее яркая версия от DALL·E 2:

А «Кандинский» решила добавить на фон водяной знак. Впрочем, результат тоже не самый плохой:

Дадим несколько советов.

Смешивайте стили. Чтобы получить необычный результат, можно добавить в промт для нейросети сразу два стиля. Например, пиксель-арт и киберпанк. Главное не объединять взаимоисключающие параметры. В этом случае нейросеть сгенерирует изображение либо в одном, либо в другом стиле.

Указывайте пример. Выберите конкретных людей, стиль которых вам понравился. Если быстро не можете вспомнить имена художников, воспользуйтесь таблицей, находящейся в свободном доступе и гуляющей по просторам интернета, с сотнями имен людей, стиль которых способны имитировать нейросети. Можно указывать имена классических художников, современных иллюстраторов, авторов комиксов, дизайнеров, архитекторов, фотографов, художников стрит-арта и пр. Также сработают названия студий, игровых проектов, режиссеров с узнаваемым визуальным стилем.

Вот что создала Midjourney по промту John watson’s Aliens, in the style of ethereal creatures, atmospheric shots, theatrical gestures, Future spaceship, gothcore, dissolving, otherworldly:

DALL·E 2 не поняла запрос и сгенерировала нечто максимально абстрактное:

А версия Leonardo.AI уже интереснее:

Задавайте форму искусства. Укажите в промте, какая форма искусства требуется – постер, иллюстрация, фотография, скульптура, татуировка, мозаика, пазл, кофе-арт, чертеж, вышивка, оригами, трехмерная модель или даже набор «Лего».

Результат от Midjourney по промту classicism oil painting, minimalist melancholy, renaissance:

Результат по аналогичному промту от Leonardo AI:

По промту photo retouching with hamburger, cola, potatoes on a dark background Midjourney выдала такой аппетитный результат:

А нейросеть «Кандинский» создала менее реалистичное фото:

Популярный жанр генераций – кадры из фильмов. Так, промт DVD Screengrab помогает воспроизвести сцены из кино: фантазировать на тему несуществующих фильмов и уже вышедших картин, но с новыми режиссерами, актерами и пр. Команда отлично работает в Midjourney.

Первоначальный вариант по промту DVD screengrab of the Daenerys and Khal Drogo from the Game of Thrones directed by Studio Ghibli, 1975 —ar 4:3 нуждается в доработке, но не очень далек от реальности:

А вот так популярные герои серии романов выглядели бы в аниме японской студии по версии «Кандинского»:

Leonardo AI этот промт не поняла вообще:

4 этап. Добавляем примеры

Промты можно не только прописывать текстом, но и добавлять изображения для примера. Например, если нужно воссоздать множество деталей: позу, фон, внешность и пр. Для этого нужно загрузить картинку или добавить ссылку на нее.

Есть и несколько других вариантов использования функции.

Стилизация реального фото. Вместе с изображением можно добавить любой запрос в виде текста. Например, Midjourney позволяет загрузить собственное фото и поэкспериментировать со стилям из предыдущего шага.

Смешивание нескольких изображений. Нейросеть автоматически смешает две картинки, взяв по половине характеристик от каждой из них. Настроить, какие именно элементы нужно позаимствовать из каждого изображения, нельзя.

Использование уже сгенерированных изображений в качестве референса для новых генераций. Примеры можно смешивать с готовыми изображениями или прописывать новые параметры, чтобы изменить детали.

Я делаю большие запуски онлайн-продуктов, школ, курсов, и все с помощью нейросетей. Использую связку ChatGPT + Midjourney. Плагин Photorealistic для ChatGPT в 80% случаев делает промт качественным.

1. Не перегружайте первичный запрос. Делайте фокус на основные (крупные) детали или сразу пишите через ChatGPT и плагин Photorealistic.

2. Дорабатывайте более мелкие детали в следующих запросах через кнопку V (варианты) и каждый раз прописывайте более четкое уточнение к первому промту.

3. Обязательно указывайте стиль, особенно если хотите получить максимально реалистичную картинку, похожую на реальное фото. Я обычно просто подписываю real photo, realistic.

4. Если хочется чего-то необычного, я хожу по сообществам Midjourney во ВКонтакте. Там можно найти интересные интересные картинки от нейросети и запросы к ним.

В личном проекте по работе с нейросетями для создания контента я использовала сгенерированный персонаж Нейрен, которую погрузила в несколько разных ситуаций. А потом добавила свое лицо (чтобы люди не забывали, кто на самом деле спикер 🙂).

Мой промт: красивая женщина с длинными коричневыми волосами в красном платье разговаривает с роботом в черном костюме. Она смотрит на него, он смотрит на нее. Робот стоит спиной к камере. Real photo, realistic.

Для Midjourney промт звучал так: A graceful woman with long brown hair, adorned in a vibrant red dress, engages in a conversation with a robot dressed in a sleek black suit. She gazes intently at him, while he reciprocates her gaze. The robot’s back is turned towards the camera, giving a mysterious aura. Medium: Photography. Style: Hyper-realistic with a touch of sci-fi elegance. Lighting: Soft ambient lighting highlighting the woman’s features and the metallic sheen of the robot. Colors: Rich and contrasting, with the red of the woman’s dress standing out against the robot’s matte black.

Результат использовался для авто-воронок в Telegram, постах в соцсетях и на сайте. У креатива с такой картинкой очень высокая кликабельность в Яндекс Директе.

5 этап. Настраиваем параметры

В нейросетях существуют короткие команды, которые позволяют усилить стилизацию, быстро поменять разрешение сторон изображения, добавить абстрактности и пр. В каждой нейросети они свои.

Например, в Midjourney можно настроить соотношение сторон, добавив к промту -‍-ar (x:x), задать степень стилизации – —s(x), выходное разрешение через слова вроде 4K, 8K, ultra detail и т. д.

В качестве примера приведем промт: Tourism illustration, a portait of a morden girl, close up, fashion outfit, sunglasses, 4k, Tsundere, simple shape, flat design, HQ, minimalistic:

Если добавить параметр —niji, то можно генерировать изображения в стиле аниме и манги.

Ниже результат по промту horror, in the style of light cyan and dark amber, crisp neo-pop illustrations, graphic, pop-art style, southern gothic —ar 4:5 —niji 5:

В Stable Diffusion также можно задать ряд настроек. Например, число шагов, которые пройдет нейросеть в процессе генерации изображения, точку старта, из которой ИИ начнет создание картинки, то, насколько вольно нейросеть будет интерпретировать запрос, и т. д. Есть подобные настройки и в других нейросетях. Как правило, они указаны в документации к ИИ.

Используйте различные инструменты для создания промтов: от ChatGPT и различных тренажеров-генераторов до самого функционала нейросети для изображений. Делайте до тех пор, пока не понравится.

Используйте слои для идеальной композиции в Midjourney. Простая деталь для эффекта глубины, о которой почти все забывают. Любую генерацию можно разбить на передний, средний и задний план. А потом добавить к нужному элементу в промте.

Вот так выглядит изображение с тремя слоями:

Промт для Midjourney: blonde woman in the foreground, people running frantically in the middle ground, alien space ships in the background, Kodak portra 800 —ar 16:9 —style raw.

Зарисовка: 👉🏻Так эксперт старается успеть на мастер-класс по Видеовизитке в TenChat 🤣🤣🤣🤣. Есть еще пять мест.

Второе изображение без переднего плана:

Промт для Midjourney: people in the middle ground, alien space ships in the background, Kodak portra 800 —ar 16:9 —style raw.

Midjourney предпочитает автоматически помещать основной объект на передний план. Вместо этого попробуйте установить средний план для нетипичных генераций.

Третье изображение с колесом обозрения на среднем плане:

Промт для Midjourney: people in the foreground, ferris wheel in the middle ground, buildings in the background, Kodak portra 800 —ar 16:9.

6 этап. Собираем правильный запрос для нейросети воедино

Перечисленные параметры важно правильно расположить. Слова в первой части запроса имеют больший вес, чем находящиеся в конце. Желательно придерживаться в запросе такой последовательности:

Главный параметр изображения: фото, иллюстрация, кадр из фильма, картинка-референс и пр.;
Объект;
Детали объекта: действие, описание;
Стилистика: цветовая палитра, эстетика, автор;
Дополнительные параметры: настройки освещения, камеры, времени суток, погоды, графика;
Надстройки сервиса: пропорции изображения, разрешение, стилизация, параметр хаоса и сид.

Разбивать интересные запросы для нейросети на части можно с помощью двойных двоеточий «::» или запятых.

Это не единственная схема – нужно экспериментировать с порядком параметров и слов. Получилось не очень мрачно? Переместите прилагательное «мрачный» в самое начало запроса. Получился перебор? Сдвиньте признак подальше к концу.

При генерации промтов старайтесь делать более четкие запросы и максимально раскрывайте суть того, что вы хотите получить. Добавляйте максимальное количество прилагательных.

Выстраивайте предложение. Как это делаю я: кто, как, где, стиль изображения. Благодаря такой последовательности у меня получаются максимально релевантные результаты.

Пример промта для проекта одежды: Barbie doll in retro black dress with a round collar and a white fabric belt, standing against the backdrop of beautiful architecture.

Интересные находки для качественного улучшения изображений для нейросети Midjourney:

1. К любому промту добавьте just look at this, I can’t believe how beautiful it is!

2. Используйте встроенный редактор различных частей изображений Vary (Region), но выделяйте при этом всю картинку полностью.

3. Сохраните в Midjourney и используйте быстрый вызов промтов по разным тематикам. Например, ice creame —food вызовет сохраненное описание и получится промт: ice creame ::5 Delicious Food Photography::4 well-lit, sharp-focus, high-quality, artistic, unique, award-winning photograph, Canon EOS 5D Mark IV DSLR, f/8 aperture, 1/125 second shutter speed, ISO 100, professional lighting setup, Adobe Photoshop, glibatree style, appetizing composition, attention to detail::3 dim, blurry, boring, generic, unappetizing, simple::-2 grainy, smokey::-1

Примеры лучших запросов для нейросетей в разных тематиках можно найти по ссылке.

Сохранить готовый запрос для нейросети можно так.

Ищем команду /prefer option set:

Указываем название и нажимаем Tab:

Кликаем по кнопке value:

Вводим шаблон промта в поле:

При создании промта добавляем в конец название шаблона:

Весь промт выглядит так:

Результат:

Помните про правило конкретики, о котором мы говорили выше. ИИ может не понять связи между объектами. Например, по промту «руководитель смотрит через плечо подчиненной» нейросеть способна сгенерировать просто стоящих рядом коллег. В этом случае нужно переформулировать запрос: «руководитель смотрит через плечо подчиненной, которая работает за столом».

Если результат все равно далек от задумки, убирайте или добавляйте фразы и слова. Попытайтесь выяснить опытным путем, почему нейросеть создает именно такую картинку. Всегда есть логика того, почему объекты размещены на изображении именно так, хотя эта логика может оказаться непостижимой для человека.

Нейросети позволяют за несколько минут создать оригинальное изображение, идея которого ограничена только вашей фантазией. Они помогают значительно сэкономить время и деньги на создании креативов. А автоматизировать другие задачи можно через сервис click.ru. Например, провести медиапланирование, спарсить метатеги и заголовки и пр. А если стать участником партнерской программы click.ru, можно получать до 16% расходов на рекламу.

#интернет-маркетинг #искусственный интеллект #Нейросети