12.10.2024
Подписывайтесь на Telegram-канал по ссылке

Новая модель искусственного интеллекта может редактировать фото по текстовым подсказкам

MGIE image editing AI

В открытый доступ выложили модель MLLM-Guided Image Editing (MGIE) для редактирования изображений, которая использует мультимодальные модели больших языков, чтобы интерпретировать текстовые команды при редактировании изображений. То есть пользователю достаточно словами объяснить модели, что он хочет улучшить на снимках: обрезать, изменить размер, повернуть, добавить фильтры, скорректировать яркость. С помощью текстовых подсказок MGIE всё сделает сама. Человеку в технические нюансы программ редактирования вникать не придётся.

Сначала модель переводит на свой машинный язык подсказки пользователя, а затем «воображает», как будет выглядеть результат (например, запрос на более синее небо на фотографии приводит к увеличению яркости части изображения с небом). При редактировании фотографии с помощью MGIE пользователям просто нужно ввести то, что они хотят изменить в изображении. MGIE доступна на GitHub, где можно найти предварительно обученные модели и инструкцию, как использовать искусственный интеллект для различных задач редактирования.