← Вернуться к списку

GPT Image 2 потрясает своим рендерингом текста — вот точные промпты, которые я использовал для его тестирования (все сгенерировано в PhotoGen Studio).

Краткое содержание

OpenAI сегодня выпустила GPT Image 2, и я сразу же прогнала его через 4 запроса, разработанных для выявления слабых мест ИИ-моделей изображений: рендеринг текста, согласованность в нескольких панелях и детализированная типографика. Вот что я сгенерировала и какие именно запросы использовала: Image 1 — Меню ресторана (стресс-тест рендеринга текста). Результат: Каждое название блюда и цена были воспроизведены правильно. Ноль опечаток. Это раньше было совершенно невозможно с диффузионными моделями. Image 2 — Страница манги с японскими кандзи (несколько панелей + иностранный скрипт). Результат: Все 4 панели были отрисованы с правильной компоновкой, соответствующим стилем манги, а японский текст оказался действительно точным. Согласованность персонажей от панели к панели тоже сохранилась. Image 3 — Этикетка премиум-продукта (коммерческая упаковка). Результат: Каждая строка текста на этикетке получилась чистой и правильно написанной. Бутылка выглядит коммерчески жизнеспособной — я бы действительно включила это в презентацию макетов продукта. Image 4 — Ретро-анахронизм / Фотография эпохи (сложный текст на поверхностях). Результат: "NEURAL NET v2.0" и "GPT IMAG

Полный текст статьи пока не загружен.