ИИ Google Gemini
Несколько дней назад Google опубликовал видеопрезентацию своего ИИ Gemini, и многие журналисты и аналитики, впечатленные увиденным, поспешили объявить о том, что ChatGPT, мол, умер, да здравствует Gemini.
Впрочем, среди специалистов неоднократно высказывались сомнения в том, что в ролике продемонстрирована реальная работа Gemini, а не результат неких манипуляций с реальными действиями. Например, в издании Bloomberg это подробно разбирали.
Судя по результатам «расследования», все показанные в ролике изображения, текстовые подсказки и ответы были тщательно подобраны заранее, а фактический процесс запроса был сильно сокращён для зрителей в угоду зрелищности и динамике происходящего. Один из сотрудников Google рассказал журналистам, что, по его мнению, видеоряд показывает нереалистичную картину. Другой отметил, что не был удивлён такой демонстрации, потому что привык к маркетинговой шумихе — по его словам, «все компании так делают». (Отсюда.)
В Google, кстати, признали, что ролик был постановочным, и что Gemini отвечал с помощью оставленных за кадром подсказок. Также в процессе монтажа итогового ролика задержка при обработке запроса нейросетью была уменьшена.
При этом в Google заявили, что их просто неправильно поняли - мол, они в ролике просто демонстрировали интерфейс Gemini, а приведенные примеры не следует воспринимать буквально.
После этого техноблогер Greg Technology решил повторить все запросы из нашумевшего видео без монтажа, но с использованием GPT-4. Он воссоздал несколько сценариев из оригинального ролика Google: попросил распознать жест, определить игру «Камень, ножницы, бумага» и сказать, что нарисовано на листе бумаги. Нейросеть без труда справилась со всеми задачами, не считая задержки в несколько секунд перед выдачей ответа. По словам блогера, он хотел показать, что «смонтированные» возможности Gemini уже доступны в GPT-4. Хоть и работают не так быстро, как в рекламных видео. Но зато безо всякого монтажа и без читерства.