Обновлена функция генерации изображений ChatGPT

\n

Во время прямой трансляции во вторник генеральный директор OpenAI Сэм Альтман объявил о первом крупном обновлении возможностей генерации изображений ChatGPT за более чем год.

\n

Теперь ChatGPT может использовать модель GPT-4o компании для нативного создания и изменения изображений и фотографий. GPT-4o долгое время лежал в основе платформы чат-ботов, работающих на искусственном интеллекте, но до сих пор модель могла генерировать и редактировать только текст, а не изображения.

\n
\n\t
\n\t
\n
\n
\n\t
\n\t
\n
\n

Альтман сказал, что нативное создание изображений GPT-4o уже доступно сегодня в ChatGPT и Sora, продукте по генерации видео с использованием искусственного интеллекта от OpenAI, для подписчиков компании по ежемесячному тарифу Pro в размере $200. OpenAI сообщает, что функция в ближайшее время станет доступна и пользователям Plus и бесплатным пользователям ChatGPT, а также разработчикам, использующим услугу API компании.

\n

GPT-4o с изображениями как результат "думает" немного дольше, чем модель по генерации изображений, которую она эффективно заменяет, DALL-E 3, чтобы создавать более точные и детальные изображения, как описывает OpenAI. GPT-4o может редактировать существующие изображения, включая изображения с людьми — трансформируя их или заполняя детали, такие как объекты на переднем и заднем плане.

\n

Чтобы сделать новую функцию изображения доступной, OpenAI сообщила Wall Street Journal, что обучила GPT-4o на "публично доступных данных", а также на эксклюзивных данных от ее партнеров, таких как Shutterstock.

\n

Многие поставщики генеративного искусственного интеллекта считают данные обучения конкурентным преимуществом, поэтому они охраняют и связанную с ними информацию. Однако детали обучающих данных могут быть потенциальным источником судебных исков в области интеллектуальной собственности, что является еще одним доводом для компаний не раскрывать много информации.

\n

\"Мы уважаем права художников в отношении того, как мы выводим результат, и у нас есть политика, которая не позволяет нам создавать изображения, которые напрямую копируют работу живущих художников\", — заявил главный операционный директор OpenAI Брэд Лайткап журналу Journal.

\n
\n
\n

OpenAI предлагает форму отказа, которая позволяет создателям запросить удаление своих работ из обучающих наборов данных. Компания также заявляет, что уважает запросы о запрете ее ботов для сбора данных обучения, включая изображения, с веб-сайтов.

\n

Обновленная функция генерации изображений ChatGPT следует за экспериментальным естественным выводом изображений Google для Gemini 2.0 Flash, одной из флагманских моделей компании. Мощная функция вызвала волну в социальных сетях, но не всегда по лучшим причинам. Было выявлено, что изображения для компонента Gemini 2.0 Flash практически не имели ограничений, что позволяло людям удалять водяные знаки и создавать изображения с авторскими персонажами.

\n

Статья была обновлена в 12 часов по тихоокеанскому времени, чтобы включить заявление OpenAI для Wall Street Journal относительно данных обучения GPT-4o.