Подписаться ВК
 21.07.2023 в 12:01   OpenAI

Обновления Midjourney 5.2 и Stable Diffusion SDXL 0.9 для творческого преобразования текста в изображение

Поделиться
с друзьями:

Stability AI выпустила новую версию Stable Diffusion SDXL 0.9, которая обещает улучшенное восприятие подсказок и более детализированные изображения. В Midjourney 5.2 представлены также новые функции, такие как Outpainting, команда /shorten, возможность настраивать варианты и преобразование изображений в масштабе 1:1 (Zoom Out). Ожидается, что эти обновления улучшат пользовательский опыт и помогут развить творческий потенциал при работе с графическими проектами. 

Обновления нейросети Midjourney 5.2.

Одним из значимых обновлений Midjourney 5.2.  является функция Zoom Out, которая напоминает Generative Fill от Adobe для Photoshop. Однако важно отметить, что функция Zoom Out в Midjourney не использует маски и результат зависит от параметра "do Out". В Midjourney 5.2 также представлены новые возможности, улучшающие взаимодействие с пользователем.

Изображение до применения Zoom Out

Результат после применения Zoom Out

Некоторые из основных обновлений в Midjourney 5.2:

  • Параметр Outpainting: теперь пользователи могут использовать функцию Outpainting с заданными параметрами 1.5, 2 и настраивать ее по своему усмотрению. При использовании этой функции несколько раз, результаты получаются впечатляющими.
  • Настраиваемые вариации: теперь возможно настраивать силу вариаций в Midjourney. Пользователи могут легко переключаться между слабыми и сильными вариациями, выбирая две кнопки. Это дает больше гибкости в процессе творчества.
  • Преобразование изображения 1:1: теперь пользователи Midjourney могут преобразовывать любое изображение в квадрат с соотношением сторон 1:1. Это позволяет гармонично вписывать изображение в различные контексты.

В Midjourney 5.2 появилось новое улучшение - функция парсера подсказок. Это позволяет пользователям создавать впечатляющие изображения еще проще. Теперь с помощью команды «/shorten [ваш промпт]» пользователи могут выделять важные слова и удалять ненужные, чтобы оптимизировать свои приглашения и добиться наилучших результатов. Синтаксический анализатор также присваивает вес каждому слову, чтобы пользователи могли выбрать наиболее подходящую подсказку из пяти вариантов. Проще говоря, это помогает преобразовывать нечеткие идеи в подсказки, которые лучше соответствуют намерениям и потребностям пользователей.

Промпт для синтаситечкого анализатора: wooden house with a glass veranda in a linden deciduous forest on the slope on a sunny day, realistic photo

Midjourney опережает своих конкурентов, когда дело доходит до контроля процессов. Однако Midjourney отстает в смысле удобства использования. Те, кто ищет удобство, а не гибкость, могут быть привлечены конкурирующей платформой Adobe Firefly, которая известна своими удобными функциями. С другой стороны, Stable Diffusion, к которой открыт доступ к исходному коду и расширениям, предлагает невероятную гибкость. Несмотря на периодические задержки StabilityAI и двусмысленные заявления, такие как «обучено на 50%» и «будет доступен в середине июля, но это неточно», как только веса станут доступны, все станет гладким. Благодаря этим усовершенствованиям Midjourney продолжает предлагать интересные функции для создания изображений простым и эффективным способом. Теперь пользователи могут лучше контролировать свои подсказки, что приводит к более качественным результатам.

Поскольку технологии продолжают развиваться, платформы, такие как Midjourney, стремятся улучшить пользовательский опыт и сделать творческие начинания доступными для всех. Кроме того, последняя версия Midjourney делает акцент на реализме, что особенно заметно в арт-генерации. Чтобы продемонстрировать эти улучшения, было проведено сравнение подсказок и начальных чисел в версиях 5.1 и 5.2 Midjourney.

Новые возможности нейросети Stable Diffusion SDXL 0.9 

StabilityAI запустила улучшенную модель Stable Diffusion SDXL 0.9, которая обещает более точное восприятие подсказок и детализацию изображений, позволяя пользователям создавать более захватывающие визуальные эффекты. К тому же, уже сейчас вы можете бесплатно опробовать новую модель на ClipDrop. С момента ее выпуска, модель Stable Diffusion SDXL 0.9 привлекла внимание от компании StabilityAI. Несмотря на то, что официальное подтверждение релиза имеется, ссылка пока не была предоставлена. В базовой версии модели SDXL 0.9 впечатляющее количество параметров составляет 3,5 миллиарда. Кроме того, в планах компании второй ансамбль, состоящий из двух моделей, общая сумма параметров которых составляет 6,6 миллиарда.

Для улучшения процесса генерации изображений алгоритм StabilityAI объединяет две модели CLIP: базовый клип от OpenAI и OpenCLIP ViT-G/14. Это объединение позволяет генерировать изображения с более точными деталями. Сравнение пары изображений между бета-версией SDXL и новой версией SDXL 0.9 ясно показывает значительное улучшение качества. Однако для использования модели SDXL 0.9 во время логического вывода необходима видеокарта с не менее чем 16 ГБ видеопамяти, чтобы обеспечить бесперебойную работу. Пользователи с нетерпением ждут полного сообщения в блоге со всеми подробностями и выпуском кода, они ожидают дальнейших улучшений и возможностей.

Свежесгенерированные примеры с помощью SDXL 0.9:

Комментарии: