close-btn

ИИ научился писать текст на изображениях: фото

Midjourney, Dall-E 2 от OpenAI и Stability AI’s Stable Diffusion часто имеют проблемы с воспроизведением текста на изображениях. Однако теперь появился молодой стартап Ideogram, который бросает вызов известным конкурентам. Самое главное, чем сумел выделиться проект, — научил ИИ создавать изображения с хорошо написанным текстом, который можно читать

AI

AI Фото: freepik.com, pngwing.com

Как и его конкуренты, Ideogram может создавать впечатляюще реалистичные изображения из коротких текстовых подсказок за считанные секунды. Но Ideogram, стартап из Торонто, который запустился в августе, может пойти еще дальше и воспроизводить текст внутри этих изображений.

Например, он может сгенерировать изображение протестующего с разборчивым плакатом или милого котика в футболке, на которой четко написано: «Спроси меня о моем стартапе с искусственным интеллектом».

Изображение, созданное различными ИИ, на запрос: «фотография милого котенка в футболке с надписью “спроси меня о моем стартапе с искусственным интеллектом”». По часовой стрелке слева направо: Ideogram, DALL-E 2 от OpenAI, Midjourney и Stability AI's Stable Diffusion XL.

Изображение, созданное различными ИИ, на запрос: «фотография милого котенка в футболке с надписью “спроси меня о моем стартапе с искусственным интеллектом”». По часовой стрелке слева направо: Ideogram, DALL-E 2 от OpenAI, Midjourney и Stability AI’s Stable Diffusion XL. Фото: bloomberg.com

Решение того, что может показаться узкоспециализированной технической проблемой, имеет широкие последствия для индустрии. Другие популярные ИИ-генераторы изображений, такие как Midjourney, Dall-E 2 от OpenAI и Stability AI от Stable Diffusion, часто показывают ерунду, когда их просят отобразить слова в картинках.

Запуск Ideogram имеет потенциал встряхнуть переполненное поле ИИ-генераторов изображений, а также указать на следующий этап развития этой стремительно совершенствующейся технологии.

Следует отметить, что новая версия Dall-E, которую OpenAI планирует выпустить в октябре, в настоящее время доступная через Bing Image Creator от Microsoft, кажется, имеет подобные возможности. OpenAI выпустил изображение, на котором пациент с авокадо без косточки говорит терапевту ложке: «Я просто чувствую такую пустоту внутри». Стабильный ИИ также может представлять текст на изображениях с помощью программного обеспечения под названием DeepFloyd IF, но оно не является легкодоступным для большинства людей.

Фото, созданное Dall-E

Фото, созданное Dall-E

Интересное по теме: Армия роботов, перспективы ИИ, стартапы: репортаж со львовской ІТ Arena

Команда Ideogram состоит из нескольких бывших сотрудников Google, которые помогали создавать сервис для генерации изображений Imagen, принадлежащий технологическому гиганту. Стартап, который привлек $16,5 млн начального финансирования в раунде, возглавляемом Andreessen Horowitz и Index Ventures, сосредоточен не только на создании изображений с текстом. Ideogram также пытается сделать использование искусственного интеллекта более доступным для любого, чтобы создавать убедительные изображения, не печатая сложные описания.

«Наша цель — сделать так, чтобы людям было как можно легче и проще заниматься творческой самореализацией», — сказал главный исполнительный директор и соучредитель компании Мохаммад Норузи в интервью Bloomberg News. По словам Норузи, с момента запуска бесплатного сервиса на него зарегистрировалось 1,1 млн человек, которые уже создали более 80 млн изображений (новым пользователям, возможно, придется записаться в лист ожидания). Пользователи вводят свои команды в Ideogram и сервис создает сразу четыре изображения.

Также стоит заметить, что благодаря своим возможностям Ideogram может со временем составить конкуренцию маркетологам и творческим работникам. Генерируя текст и облегчая создание разнообразных изображений с помощью ИИ, стартап также рискует быть использованным для распространения дезинформации, что еще больше подрывает доверие к изображениям в интернете.

Ранее мы писали о неэтичности использования искусственного интеллекта, — в соцсетях разгорелись новые ожесточенные баталии.

Ознакомьтесь с другими популярными материалами:

Meta дебютирует с функциями генеративного ИИ для рекламодателей

Adobe интегрирует ИИ в Photoshop: запущена веб-версия

YouTube запустил новые функции на основе ИИ

По материалам bloomberg.com.

google news