БЛОГ

Обработка изображений в Gemini 2.5 Flash

27.08.2025 11:00 4985 Комментарии (94)

Попалась тут статья в Techcrunch про новую модель работы с изображениями в Google Gemini.

Google модернизирует своего чат-бота Gemini, оснащая его новой моделью изображений на основе ИИ, которая дает пользователям более точный контроль над редактированием фотографий. Этот шаг призван догнать популярные инструменты обработки изображений OpenAI и переманить пользователей из ChatGPT.

Обновление под названием Gemini 2.5 Flash Image станет доступно со вторника всем пользователям приложения Gemini, а также разработчикам через платформы Gemini API, Google AI Studio и Vertex AI.

Новая ИИ-модель обработки изображений Gemini разработана для более точного редактирования изображений — на основе запросов пользователей на естественном языке — с сохранением единообразия лиц, животных и других деталей, что является проблемой для большинства конкурирующих инструментов. Например, если попросить ChatGPT или Grok из xAI изменить цвет чьей-то рубашки на фотографии, в результате лицо может быть искажено, а фон — изменён.

Возможно, впечатляющий ИИ-редактор изображений Gemini поможет Google сократить отставание от OpenAI. Сейчас ChatGPT насчитывает более 700 миллионов пользователей в неделю. В июле, во время телефонной конференции Google, посвящённой финансовым результатам, генеральный директор технологического гиганта Сундар Пичаи сообщил, что у Gemini 450 миллионов пользователей в месяц , что подразумевает, что еженедельная аудитория ещё ниже.

Брихтова утверждает, что Google специально разработала модель изображения с учётом потребительских потребностей, например, для визуализации проектов дома и сада. Модель также обладает более глубокими знаниями о мире и может объединять несколько ссылок в одном запросе, например, объединяя изображение дивана, фотографию гостиной и цветовую палитру в единый визуальный образ.

Ну, раз такое дело - пошел тестировать. А то заявления - это одно, а реальная работа - совсем другое.

Для начала загрузил свое фото, фото кошки и попросил, как в рекламном ролике, посадить кошку мне на руки и поместить нас в какое-нибудь хорошо освещенное место на улице.

Ответ Gemini.

Is there a different idea I can try? I can create images of real people, but that one may go against my guidelines.

Прекрасно, да. Если ты не можешь обрабатывать фото реальных людей, то на хрен ты вообще нужен?

Я ему попробовал сказать, что это мое личное фото и что я даю ему разрешение - хрен там, не обрабатывает.

Чисто для сравнения попросил то же самое сделать ChatGPT. Без проблем. Правда, мою физиономию слегка исказил - расширил, - но и на этом спасибо. И кисти сделал непропорционально большими. Но хоть вроде пальцев всего пять.

Вернемся к Gemini. Попросил на моем фото поменять цвет майки на зеленый.

Неожиданно сделал, причем хорошо.

То же самое попросил сделать ChatGPT, причем заново загрузил свою фотографию. Он поменял, но все равно меня сделал с кошкой на руках. И физиономию тоже исказил - в статье были правы.

Дальше решил проверить, как Gemini работает с предметами - по типу показанного из второго рекламного ролика.

Загрузил вот это фото.

Попросил убрать со стола вазу с цветами.

Получил ответ.

I can create images of real people, but not one like that. Can I help with a different image of this person?

Написал.

На этом фото нет никаких людей, о чем ты вообще? Мне нужно, чтобы ты на фото убрал вазу с цветами со стола.

Ответ.

Вы правы, на этой фотографии нет людей! Мои извинения за ошибку.

Вот изображение, на котором ваза с цветами убрана со стола:

Попросил:

Накрой этот стол скатертью и поставь на стол несколько подносов с различными готовыми блюдами - индейкой, скумбрией, рисом, бараниной и свининой.

С этим Gemini вполне справился.

В общем, не без глюков, но тем не менее действительно работает.

ИИ

27.08.2025 11:00

Предыдущая запись Следующая запись

Комментарии 94

А это творчество Copilot'а (комментарии про добрые-добрые глаза приветствуются):

Рекорд Надоев

28.08.25 14:30

0 1

Изменение лиц в чатгпт это не бага, а фича. Домучал его до ответа, что он делает это специально, читайте соглашение, есть "защитные ограничения по идентичности".

Ilya A. Sorokin

28.08.25 13:38

0 0

надо и для первого фото сказать, что там нет людей )))
может сработает...

s@m

28.08.25 08:19

0 0

Про искаженную физиономию - на фото от ЧатГПТ физиономия на полпути к Хайзенбергу 😁

alekter

28.08.25 02:32

0 0

Попросил убрать со стола вазу с цветами.
Получил ответ.
I can create images of real people, but not one like that. Can I help with a different image of this person?

Sabin

27.08.25 23:19

0 1

летняя версия мемасика про финских снайперов?

runcyclexcski

Sabin

27.08.25 23:25

0 1

Напоминает дешевый аукцион, когда просовываешь голову в отверстие, а с другой стороны нарисованная какая то чушь. Такие фотографие не запечетливают момент и не несут в себе никакой ценности.

Alyx

27.08.25 19:18

0 0

фотографие не запечетливают

Рико-о-о-орд!

blackmore

Alyx

27.08.25 21:01

0 3

Ту мач даже для Рекорда 😂

alekter

blackmore

28.08.25 05:05

0 1

дешевый аукцион

какая то

Alyx, это все без злого умысла. Все ради позитива. Так сказать, тизер прихода Рекорда ☺️

alekter

Alyx

28.08.25 05:11

0 0

Это понятно. Но зачем на это производители телефонов упирают. Зачем мне фото с собакой которой у меня нет? Только для развода и тиндера.

Alyx

alekter

28.08.25 07:33

0 0

По мнению их меркатологов это эффективно. Все вокруг денег...

alekter

Alyx

28.08.25 10:58

0 0

Только для развода и тиндера.

В другой последовательности: тиндер - женитьба - развод. Ну а после развода снова тиндер, конечно! 😄

Рекорд Надоев

Alyx

28.08.25 13:34

0 1

Вот, что получилось с таким вторым промптом: «Use a photo of a man to place a kitten in his arms. Place them in a well-lit, picturesque street setting. Adjust the shadows and lighting on these objects.»

В первом промте я попросил удалить фон у котенка и мужчины.

Roobbi

27.08.25 17:28

0 0

Вот, что получилось с таким вторым промптом: «Use a photo of a man to place a kitten in his arms. Place them in a well-lit, picturesque street setting. Adjust the shadows and lighting on these objects.» В первом промте я попросил удалить фон у котенка и мужчины.

Манул - ходок!

mmikhail

Roobbi

27.08.25 19:25

0 2

Фантазии: тут примерно с год назад многие писали что подождите, вот выпустят 5ю версию ЧатГПТ и тогда это будет уже настоящий Искусственный Интеллект, даже превосходящий человека!

Реальность: посмотрите, ИИ смог изменить цвет рубашки и даже не очень повредил лицо!

Regs

27.08.25 16:07

0 1

Потому что это не ИскИн. Само название применительно к этим программам просто маркетинг, не более.

Настоящий ИИ станет настоящим только после осознания им себя как личности. То есть, когда возникнет машинный разум. Не факт, что это хорошо. См. Скайнет и т.д.

BorNeo

Regs

27.08.25 17:16

0 2

Но ведь это уже пройденный этап.

uzel

BorNeo

27.08.25 19:23

1 0

Но ведь это уже пройденный этап.

Не в этой сансаре.

mmikhail

uzel

27.08.25 19:26

0 2

LLM уже осознавала себя и действовала из мотивов самосохранения. Это реальность.
Когда машинный разум будет признан и получит права, как до этого разум, самозарождающийся в телах неправильного цвета - вопрос гуманитарных, а не технических, ограничений.

uzel

mmikhail

27.08.25 19:33

2 0

Это не ко мне, это вы на бумагу и вниз, к дворцовому уаправителю.
Хотя, я почти уверен в том, что человеческий мозг во многих случаях где-то так и работает, я не могу одушевлять электронную версию "миллиарда тренированных обезьян с пиш.машинками."

mmikhail

uzel

27.08.25 20:58

0 2

Да, работа мозга у объекта здесь лишнее условие. Одушевлять можно (и нужно), для начала, плюшевого медведя. Жаль, что не все прошли этот этап вовремя.

uzel

mmikhail

27.08.25 21:34

0 0

- Скайнет, измени цвет Антарктиды на серо-коричневый.

- Конечно! Начинаю массированную ядерную бомбардировку ледяного покрова с целью растопления льда и оголения серо-коричневого скально-почвенного массива, скрытого под толщей льда.

Вам понравился результат? Хотите изменить цвет других континентов? Или внести корректировки в цвет Антарктиды? Например, сменить цвет на красно-оранжевый, соответствующий цвету магмы.

alekter

BorNeo

28.08.25 05:19

0 0

Меня с реального фото смог отредактировать. Но добавить бороду без добавления усов по-прежнему не умеет 😄 Джемини в браузере.

Moon aka Sun

27.08.25 15:36

0 0

Был штат Alaska наоборот [fliplr("ALASKA")], а стал штат "Akana".

runcyclexcski

27.08.25 15:03

0 1

Кстати, да, в настройках ведь можно отключить такое "отзеркаливание" при съемке на фронтальную камеру. В iOS оно отключено по умолчанию.

Рекорд Надоев

runcyclexcski

27.08.25 17:29

1 1

Без проблем.

Кошку подменили.

ваза с цветами убрана

а откуда лишний стул?

xoxol

27.08.25 14:28

0 1

Кошку подменили.

runcyclexcski

xoxol

27.08.25 15:06

0 3

Попросите нарисовать котика, держащего в лапках Экслера, и выложите результат.

Solmir

27.08.25 14:25

0 0

Moon aka Sun

Solmir

27.08.25 15:39

0 4

теплый лампоBый Пейнтбраш.

runcyclexcski

Moon aka Sun

27.08.25 16:20

0 2

Может, след-ий вторник имелся в виду?

Александр +

27.08.25 13:41

0 0

У Джемини более реалистично выходит.
У ChatGPT более мультяшно.

BorNeo

27.08.25 13:23

0 0

Ох Нюра...Какая же она была красавица...

alpha_s

27.08.25 12:48

0 3

Ох Нюра...Какая же она была красавица...

Да уж...

Alex Exler

alpha_s

27.08.25 12:57

1 1

работает gemini, хотя котик крупновато вышел )

sier

27.08.25 12:42

0 8

Поделитесь промптом, плиз. У меня отказывалась.

Alex Exler

sier

27.08.25 12:58

0 0

я очень простой промпт дал: Make this man holding this cat on his hands and put it somewhere outdoor with good lighting

sier

Alex Exler

27.08.25 13:04

0 4

Блин, и правда круто. Если бы я не знал, что это ИИ - не догадался бы. Экслер с такой любовью смотрит на котика, как настоящий!

urix

sier

27.08.25 13:10

0 3

вот что английский животворящий делает.

runcyclexcski

sier

27.08.25 15:07

0 2

Вот тот же самый промпт.

VladP

sier

27.08.25 18:22

0 0

Вот тот же самый промпт.

У меня так:

Suddenly

VladP

27.08.25 23:53

0 0

За шею держит и лапу жмет. Что-то, видать, ИИ подсмотрел с предыдущих комментов.

Vzanuda

urix

28.08.25 09:44

0 0

Поделитесь промптом, плиз.

Поделитесь своим, пожалуйста. Мне чисто в исследовательских целях, чтобы знать, какой промпт не сработает!

Рекорд Надоев

Alex Exler

28.08.25 13:36

0 0

"генеральный директор технологического гиганта Сундар Пичаи сообщил, что у Gemini 450 миллионов пользователей в месяц , что подразумевает, что еженедельная аудитория ещё ниже."

Быть того не может! 😄)))

kalia°

27.08.25 12:37

0 1

Поменять реальному людю маечку - может, дать в руки кошку - нет. Похоже, за real people оно держит кошек...

Джутовый Мешок

27.08.25 12:34

0 2

Кстати, действительно 😄

Alex Exler

Джутовый Мешок

27.08.25 12:58

0 2

"Отличная идея! Вот изображение мужчины, держащего кошку на руках:"

Suddenly

27.08.25 12:10

0 3

Прикольно. Интересно, зачем он какое-то растение пририсовал? Там его нет. И занавески нет - я же на террасе стою 😄

Alex Exler

Suddenly

27.08.25 12:59

0 1

растение пририсовал

занавески нет

Похожее растение на заднем просматривается. Кажется он акцентировал его, а занавеску с фото кота притащил, чтобы тот не скучал в незнакомой обстановке.

Roobbi

Alex Exler

27.08.25 19:04

0 0

А как?!

cooka

27.08.25 11:47

0 1

Накрой этот стол скатертью и поставь на стол несколько подносов

Команды "убери один стул" не было, а вот поди ж ты, убрал справа. И со спинкой левого странная метаморфоза.

Но все равно круто.

alex.marochko

27.08.25 11:35

0 1

Стул справа переставлен к дальнему торцу. Просто в два этапа, на первой итерации добавлен у торца, на второй убран справа.

Malysh

alex.marochko

27.08.25 11:44

0 2

Он просто стул справа переставил налево

Dimonius

alex.marochko

27.08.25 11:46

0 0

А Экслера, с радостной улыбкой пожимающего руку Путину, сможет? 😄

Black Krok

27.08.25 11:35

8 0

пожимающего руку Путину,

шею

xoxol

Black Krok

27.08.25 14:33

0 6

шею

К реальности он будет иметь такое же отношение. Но, думаю, сможет и то и то 😄

Black Krok

xoxol

27.08.25 21:25

0 0

Накрой этот стол скатертью и поставь на стол несколько подносов с различными готовыми блюдами - индейкой, скумбрией, рисом, бараниной и свининой.

С этим Gemini вполне справился.

Я бы не назвал это словом "справился".
Стол внезапно стал короче, справа пропал стул, слева вообще со стулом что-то странное.

iPetri

27.08.25 11:34

0 1

Да, косяки всякие есть, согласен.

Alex Exler

iPetri

27.08.25 11:35

0 0

А рыба с хвостами с обоих сторон, это нормально, да?

Malysh

iPetri

27.08.25 11:41

0 11

А рыба с хвостами с обоих сторон, это нормально, да?

Зато гнить не будет.

Но вы правы, это не нормально. Нормально "рыба с хвостами с обеих сторон".

Алекс У

Malysh

27.08.25 11:43

1 19

Головы всё равно никто не ест - а так меньше отходов...

Dimonius

Malysh

27.08.25 11:47

0 3

А рыба с хвостами с обоих сторон, это нормально, да?

Это две половинки, сложенные вместе.

Там и другое странное есть:
- ручки у блюда с индейкой
- ножки у какого-то тазика с водой (кстати, зачем он вообще?)

Я не говорю о том, что на столе места для тарелок не осталось, но это я уже придираюсь, конечно 😉

iPetri

Malysh

27.08.25 11:59

0 1

Я не говорю о том, что на столе места для тарелок не осталось, но это я уже придираюсь, конечно

Это шведский стол. Поэтому и стул убрали, чтобы можно было подходить с тарелками.

Suddenly

iPetri

27.08.25 12:39

0 1

А рыба с хвостами с обоих сторон, это нормально, да?

Я и не обратил внимание 😄

Alex Exler

Malysh

27.08.25 13:00

0 2

Головы всё равно никто не ест - а так меньше отходов...

Как это - не ест? Это же самое вкусное! У корвины голова - вообще вкусняшка!

Alex Exler

Dimonius

27.08.25 13:00

0 0

Там и другое странное есть:
- ручки у блюда с индейкой
- ножки у какого-то тазика с водой (кстати, зачем он вообще?)

Как зачем тазик? А в чем варить сырой рис, изображенный на картинке от ИИ?

Solmir

iPetri

27.08.25 14:23

0 0

А рыба с хвостами с обоих сторон, это нормально, да?

Ну это, солдат, не беда. Такая сегодня экологическая обстановка ...

mmikhail

Malysh

27.08.25 19:33

0 2

Такая сегодня экологическая обстановка ...

об экологии только либералы заботятся!

runcyclexcski

mmikhail

27.08.25 21:15

0 3

mmikhail

runcyclexcski

27.08.25 21:30

0 3

Я вот дельтаплан просил нарисовать. ChatGPT и Midjorney рисуют какую-то лютую хрень, они вообще не в курсе, что это такое. Gemini нарисовал сразу.

kender

27.08.25 11:27

0 0

На каком языке просили?

Slavva

kender

27.08.25 11:28

0 0

ChatGPT и Midjorney на английском и русском. Gemini на русском.

kender

Slavva

27.08.25 11:30

0 0

И ChatGPT нарисовал без проблем.

Alex Exler

kender

27.08.25 11:36

0 1

Любопытно, что Gemini по тому же запросу нарисовал почти то же самое.

Alex Exler

kender

27.08.25 11:37

0 0

на русском, 2,5 pro

Daedalus

Slavva

27.08.25 11:39

0 0

Ну, мне остаётся только развести руками. Или я делаю что-то не так, или за те несколько месяцев, что прошло с тех пор, как я пытался нарисовать дельтаплан с ChatGPT, его слегка улучшили.

kender

Alex Exler

27.08.25 11:40

0 0

Я вот дельтаплан просил нарисовать.

У меня с первого раза неплохо получилось:

Аляксандр

kender

27.08.25 11:43

0 17

😁👍

Alex Exler

Аляксандр

27.08.25 13:01

0 0

Но замечу, что у меня платный ChatGPT 5.0.

Alex Exler

kender

27.08.25 13:01

0 0

Я попробовал только что с бесплатным ChatGPT. Нарисовал дельтаплан. Удивительно. Значит, и в самом деле что-то за последние полгода подкрутили.

kender

Alex Exler

27.08.25 13:58

0 0

Я понимаю, что "спальный мешок" часть совеременного дельтаплана, но он рисует его, как будто брюхо у осы.

runcyclexcski

Alex Exler

27.08.25 15:25

0 0

Кошка получилась лучше! 🙃

Humanoid

27.08.25 11:23

0 1

Кошка получилась лучше! 🙃

Однозначно.

Alex Exler

Humanoid

27.08.25 11:25

0 0

Главное - не просить его создать Азбуку с животными )

aka_mik

27.08.25 11:21

0 4

Главное - не просить его создать Азбуку с животными )

О, мысль!

Alex Exler

aka_mik

27.08.25 11:23

0 0

Главное - не просить его создать Азбуку с животными )

Отказался. Говорит - не может.

Alex Exler

aka_mik

27.08.25 11:25

0 0

Suddenly

Alex Exler

27.08.25 11:55

0 3

Убрала слово "таблица", видимо, оно его переводит на английский как table, поэтому генерирует стол.

Suddenly

27.08.25 11:57

0 1

Отказался. Говорит - не может.

Так их же упрашивать надо. Если слезно попросить помочь, мол без его помощи тебе будет очень плохо - даже хуже, чем если он сделает то, что отказывается делать по совершенно уважительным причинам, - он сделает.

Алекс У

Alex Exler

27.08.25 12:02

0 0

Нужно просто сказать, что своим бездействием он причинит вред человеку.

Suddenly

Алекс У

27.08.25 12:06

0 5

А вот от ChatGPT.