Представляем DALL-E 3 внутри ChatGPT

С сегодняшнего дня DALL-E 3 доступен внутри ChatGPT . Вот почему DALL-E 3 будет улучшаться быстрее, чем MidJourney :

Многоходовой диалог

Многоходовой диалог — отличный пользовательский интерфейс для сбора отзывов людей. Люди будут объяснять, что не так со сгенерированным изображением, на языке свободной формы, давая очень подробные аннотации для каждого уточнения. Этот журнал чата изначально совместим с мультимодальным обучающим набором LLM.

Способность зрения GPT-4 (изображение -> внутреннее представление) также может быть улучшена с помощью тех же данных.

Значительно превосходящая алгоритмическая эффективность

MidJourney в основном игнорировала вопросы авторского права и раскручивала маховик данных гораздо дольше, а это означает, что у них, вероятно, гораздо больший набор данных для работы, чем у OpenAI. Но качество по-прежнему бледнеет.

OpenAI имеет гораздо более эффективные новые алгоритмы обработки данных (например, модель согласованности: https://arxiv.org/abs/2303.01469 ), чем стандартный стек диффузии. Улучшение модели на дополнительную единицу обучающих данных является превосходным. Это не «просто инженерия».

Экосистема

Интеграция с ChatGPT — такой убийственный ход. Добавить в DALLE 3 существующие части головоломки, такие как интерпретатор кода и браузер, почти тривиально. Хотите применить фильтр? Просто вызовите API OpenCV вместо запуска модели. Хотите эталонное изображение? Вызовите плагин поиска для эмуляции Bard (с интеграцией Google Lens).

Существующая база пользователей

У MidJourney 16 миллионов пользователей. У ChatGPT 100M. Распространение не является проблемой. Это такой неуклюжий и недружественный для новичков пользовательский интерфейс.

Нравится прочитанное? Пожалуйста, поделитесь с друзьями:
Чат GPT
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: