OpenAI представила новую функцию создания изображений в ChatGPT, работающую на основе модели GPT-4o. Теперь она доступна всем пользователям, включая тех, кто использует бесплатный тариф.
Главные преимущества обновления — улучшенное понимание контекста диалога при создании изображений, обработка сложных запросов и возможность генерировать четкий текст на картинках. Благодаря этому пользователи получают более точные и соответствующие их запросам результаты.
GPT-4o учитывает контекст общения, текстовые промпты и даже загруженные изображения, которые можно использовать как источник вдохновения. Это позволяет добиться высокой точности при генерации визуального контента. Кроме того, пользователи могут редактировать созданные картинки, например добавлять или удалять отдельные элементы.
Поскольку функция встроена в GPT-4o, можно вносить изменения в изображения прямо в ходе общения, добиваясь визуальной согласованности. К примеру, если пользователь создает персонажа для игры, его внешний вид будет сохраняться в процессе итераций.
При этом в OpenAI признают, что модель пока не идеальна. Она может выдавать неверную информацию, испытывает сложности с нелатинскими символами и последовательностью при создании лиц. Кроме того, из-за высокой вычислительной нагрузки процесс генерации изображения занимает в среднем около одной минуты.
Ранее в ChatGPT появилась возможность искать информацию в интернете без входа в систему.
Инструмент AI Banner, которым можно воспользоваться через сlick.ru, также позволяет генерировать уникальные изображения и редактировать созданные вручную креативы.