
Во время прямой трансляции во вторник генеральный директор OpenAI Сэм Альтман объявил о первом крупном обновлении возможностей генерации изображений ChatGPT за более чем год.
\nТеперь ChatGPT может использовать модель GPT-4o компании для нативного создания и изменения изображений и фотографий. GPT-4o долгое время лежал в основе платформы чат-ботов, работающих на искусственном интеллекте, но до сих пор модель могла генерировать и редактировать только текст, а не изображения.
\nАльтман сказал, что нативное создание изображений GPT-4o уже доступно сегодня в ChatGPT и Sora, продукте по генерации видео с использованием искусственного интеллекта от OpenAI, для подписчиков компании по ежемесячному тарифу Pro в размере $200. OpenAI сообщает, что функция в ближайшее время станет доступна и пользователям Plus и бесплатным пользователям ChatGPT, а также разработчикам, использующим услугу API компании.
\nGPT-4o с изображениями как результат "думает" немного дольше, чем модель по генерации изображений, которую она эффективно заменяет, DALL-E 3, чтобы создавать более точные и детальные изображения, как описывает OpenAI. GPT-4o может редактировать существующие изображения, включая изображения с людьми — трансформируя их или заполняя детали, такие как объекты на переднем и заднем плане.
\nЧтобы сделать новую функцию изображения доступной, OpenAI сообщила Wall Street Journal, что обучила GPT-4o на "публично доступных данных", а также на эксклюзивных данных от ее партнеров, таких как Shutterstock.
\nМногие поставщики генеративного искусственного интеллекта считают данные обучения конкурентным преимуществом, поэтому они охраняют и связанную с ними информацию. Однако детали обучающих данных могут быть потенциальным источником судебных исков в области интеллектуальной собственности, что является еще одним доводом для компаний не раскрывать много информации.
\n\"Мы уважаем права художников в отношении того, как мы выводим результат, и у нас есть политика, которая не позволяет нам создавать изображения, которые напрямую копируют работу живущих художников\", — заявил главный операционный директор OpenAI Брэд Лайткап журналу Journal.
\nOpenAI предлагает форму отказа, которая позволяет создателям запросить удаление своих работ из обучающих наборов данных. Компания также заявляет, что уважает запросы о запрете ее ботов для сбора данных обучения, включая изображения, с веб-сайтов.
\nОбновленная функция генерации изображений ChatGPT следует за экспериментальным естественным выводом изображений Google для Gemini 2.0 Flash, одной из флагманских моделей компании. Мощная функция вызвала волну в социальных сетях, но не всегда по лучшим причинам. Было выявлено, что изображения для компонента Gemini 2.0 Flash практически не имели ограничений, что позволяло людям удалять водяные знаки и создавать изображения с авторскими персонажами.
\nСтатья была обновлена в 12 часов по тихоокеанскому времени, чтобы включить заявление OpenAI для Wall Street Journal относительно данных обучения GPT-4o.