OpenAI официально представила обновлённый генератор изображений ChatGPT Images 2.0, который демонстрирует существенное улучшение качества и скорости создания визуального контента.
Новая модель значительно повышает фотореализм и точность воспроизведения деталей, в частности анатомии и текста на изображениях, а также лучше работает с пространственными связями между объектами. Разрешение увеличено до 2K, а время генерации сократилось почти вдвое, что открывает возможность использования в сервисах реального времени, сообщает OpenAI.
"Images 2.0 обеспечивает беспрецедентный уровень точности при создании изображений. Он может не только концептуализировать сложные изображения, но и эффективно воплощать это видение в жизнь, способен следовать инструкциям, сохранять запрашиваемые детали и отображать мелкозернистые элементы, которые часто нарушают модели изображений: мелкий текст, иконографию, элементы пользовательского интерфейса, плотные композиции и тонкие стилистические ограничения, и всё это с разрешением до 2K", - говорится в пресс-релизе компании.
Обновление также добавляет возможность контекстного редактирования изображений непосредственно в интерфейсе. Пользователи могут выделять отдельные области и изменять их с помощью текстовых инструкций, что интегрирует инструменты in-painting в обычный чат.
"Модель теперь лучше понимает сложные запросы и поддерживает широкий диапазон соотношений сторон, включая широкоформатные изображения, которые ранее были ограничены", - отметили в компании.
ЧИТАЙТЕ ТАКЖЕ: Искусственный интеллект усиливает нагрузку на работников - исследование
Images 2.0 доступна в двух версиях - Instant и Thinking, а также поддерживает более широкий спектр языков, включая те, которые не используют латиницу. Для разработчиков открыли новые возможности через API, в частности контроль повторяемости результатов с помощью параметра seed.
Среди технических обновлений - поддержка различных форматов и соотношений сторон с автоматической адаптацией композиции, а также выбор между стандартной генерацией и HD-режимом. Отдельное внимание уделили безопасности, обновив фильтры контента, которые работают на уровне латентного пространства и уменьшают количество ложных блокировок.
Модель уже доступна для пользователей Plus и Enterprise, а новые API-эндпоинты постепенно открывают для разработчиков с уровнем доступа Tier 1 и выше. Также предусмотрено использование API gpt-image-2 с оплатой в зависимости от качества и разрешения сгенерированных изображений.
Чат-бот под управлением искусственного интеллекта Copilot стал доступен в Telegram. Его разработала корпорация Microsoft. Там бота назвали "вторым пилотом" для Telegram. Copilot создан на базе GPT.




















Комментарии