Адрес для входа в РФ: exler.bar

Судя по всему, довольно скоро уже не понадобятся супер-мега-эксперты (которых в природе, к сожалению, не существует), способные с одного глотка произвольного вина определить марку и хозяйство, в котором это вино было произведено. Потому что это сможет делать искусственный интеллект.

Любопытная статья, в которой рассказывается о том, специальным образом обученный алгоритм смог со 100-процентной точностью определить, в каком именно шато было произведено то или иное вино. 

Конечно, алгоритм определял не любое вино, а одно из 80 бордосских вин, по которым производилось обучение, но это означает, что теоретически возможно охватить и все хозяйства мира.

Занимались этим Александр Пуже из Женевского университета и его коллеги: они использовали машинное обучение для анализа химического состава 80 красных вин 12-летней выдержки в период с 1990 по 2007 год. Все вина были получены из семи винодельческих хозяйств в регионе Бордо во Франции.

Они хотели выяснить, существует ли некая " химическая подпись", характерная для каждого из этих шато, которая не зависит от года урожая. Для этого они использовали машину для выпаривания каждого вина и разделения его на химические компоненты. Этот метод позволил получить для каждого вина хроматограмму, состоящую из 30 000 точек, представляющих различные химические соединения.

Исследователи использовали 73 хроматограммы для обучения алгоритма машинного обучения, а также данные о шато и годе происхождения. Затем они протестировали алгоритм на семи хроматограммах, которые были отложены.

Они повторили этот процесс 50 раз, каждый раз меняя используемые вина. Алгоритм правильно угадывал шато происхождения в 100 процентах случаев. Также алгоритм определял год с точностью до 50 процентов.

Построив график хроматограмм, алгоритм также смог разделить вина на группы, которые были более похожи друг на друга. Так, вина с правого берега реки Гаронны, называемые винами Помероля и Сент-Эмильона, были отделены от вин из левобережных хозяйств, называемых винами Медока.

Эта работа - еще одно доказательство того, что местная география, климат, микробы и методы виноделия, вместе называемые терруаром, действительно придают вину уникальный вкус. Однако какие именно химические вещества лежат в основе каждого вина, в данном исследовании не рассматривалось.

Ну и для тех, кого интересуют чисто технические подробности - вот статья группы Пуже в научном химическом издании. Там подробно рассказывается о том, как составлялись и анализировались хроматограммы.

Я сейчас изучаю возможности Foocus V2 (собственно, для этого я и покупал новую видеокарту)  - это нейросеть, создающая изображения по текстовому описанию (и, возможно, по другим изображениям), базирующаяся на Stable Diffusion XL. Система крайне интересная, однако генерация каждой картинки по не особенно сложному запросу занимает на моем компьютере примерно 25 секунд. Что, с одной стороны, очень недолго, но, с другой, там явно есть возможности для совершенствования процесса.

Так вот, буквально вчера компания Stability.ai, разработчик Stable Diffusion XL, представила новую модель Stable Diffusion XL Turbo, которая может генерировать и изменять изображение прямо в процессе набора текстового запроса.

Вот как это выглядит.

А вот здесь в онлайне вы можете попробовать самостоятельно сгенерировать изображение (на английском) наблюдая за тем, как картинка появляется в реальном времени (внимание: бесплатно дается только пара попыток).

Вот, например, моя попытка.

Ну вот что мне нарисовала Foocus V2 в реалистичной манере по тому же запросу (без уточнений) за 30 шагов.

Тот же запрос у Leonardo.ai.

Примеры изображений, созданных с помощью Stable Diffusion XL Turbo.

Главная инновация SDXL Turbo заключается в способности создавать изображения за один шаг, что значительно меньше, чем 20-50 шагов, которые требовались его предшественнику. Компания Stability приписывает этот скачок в эффективности технике, которую она называет Adversarial Diffusion Distillation (ADD).

Компания Stability подробно описала внутреннюю работу модели в опубликованном во вторник исследовательском документе, посвященном технике ADD.

Изображения SDXL Turbo не столь детализированы, как изображения SDXL, полученные при большем количестве шагов, поэтому его нельзя считать заменой предыдущей модели. Но за счет экономии скорости результаты получаются впечатляющими.

Скорость генерации SDXL Turbo - это то, что называется "реальным временем". Stability AI утверждает, что на Nvidia A100 (мощном GPU с поддержкой искусственного интеллекта) модель может генерировать изображение размером 512×512 за 207 мс, включая кодирование, один шаг шумоподавления и декодирование. Подобная скорость может привести к созданию генеративных видеофильтров ИИ в реальном времени.

Генерация высокоточных изображений за один шаг. Все образцы сгенерированы с помощью диффузионной дистилляции (ADD)

В ТГ "Безвольные каменщики" интересный пост о применении ChatGPT для изучения иностранного языка. Я как-то не задумывался о таком применении этого ИИ, а между тем, это может оказаться интересным и полезным. Надо будет попробовать.

А вы пробовали использовать ChatGPT для изучения иностранного языка? Если есть какой-то опыт, поделитесь в комментариях, плиз.

Итак, как можно использовать ChatGPT для занятий иностранным языком. Способ №1: углубленное чтение текстов. Предположим, вы хотите прочитать статью в Der Spiegel, The New York Times или Le Monde. Или книгу на иностранном языке. Или текст из учебника. Раньше вы бы делали это медленно, спотыкаясь о незнакомые слова, и либо каждый раз смотрели бы их в словаре, либо пытались понять смысл по контексту. Это важное и полезное дело, но ChatGPT может сделать его еще полезнее – и быстрее.

Для этого вам нужно обозначить ИИ задачу – написать промпт. Так как ChatGPT умеет понимать естественный язык, промпт для него выглядит не как код, а как обычное предложение. Например, такое: «Разбей на предложения, переведи каждое на русский, текст на немецком выдели жирным, дай пояснения по сложным грамматическим конструкциям и лексике». Вставьте в строку запросов этот промпт, потом ваш текст на иностранном языке – и вуаля.

Вам больше не нужно думать: «А вот это вот – это устойчивое выражение или нет», – нейросеть обозначит и пояснит вам все места, где они есть. И заодно объяснит смысл неочевидных грамматических и лексических конструкций, о которых вы вполне могли и не знать. Чтение текстов таким образом экономит массу времени: никого долгого поиска, вам нужно только прочитать и осознать.

Важно! Хотя ChatGPT, а особенно ChatGPT-4 (платная) – очень мощная штуковина, это не мудрец, который знает ответы на все вопросы. Она создает свои ответы, вставляя наиболее вероятное следующее слово в том контексте, в котором задан запрос. Так что иногда она глючит и выдает явно ошибочные пояснения или не совсем точный перевод. Чтобы понять это, необходимо параллельно с играми с ChatGPT заниматься с преподавателем грамматикой или разбираться с ней самому. Тогда вы сможете увидеть, где нейросетка налажала (и даже сказать ей об этом, она очень смешно извиняется). Лажает она не так часто, но тем не менее.

Способ №2. Отлично дополняет предыдущий. Итак, ChatGPT расписала вам интересные места в тексте. Вы прочли и поняли, но этого мало. Для того, чтобы использовать все это в речи, вам нужно а) хорошенько запомнить слова и конструкции и б) поупражняться, чтобы наработать автоматизм. Пишем промпт: «Дай мне 5 предложений на русском для перевода на [язык, который учите], в которых есть те конструкции, которые ты пояснял выше. Объясни мои ошибки».

ChatGPT сгенерит вам предложения и будет скрупулезно, но очень вежливо объяснять, где вы ошиблись. Если вы понимаете, что тренировки недостаточно, напишите: «Дай еще пять предложений» и повторяйте до тех пор, пока не запомните. Опять же, гениальная штука для репетиторов: больше не надо выдумывать однотипные примеры, ИИ сделает это за вас за несколько секунд.

Попался тут в Reddit ролик, где демонстрируется одна из функций NVIDIA Broadcast App - "Eye Contact". Это то, что уже умеют делать айфоны. Когда можно ставить камеру под углом, не смотреть в нее, а на выходе изображение будет таким, как будто камера стоит напротив глаз, и ваши глаза всегда будут смотреть прямо в камеру.

Само приложение можно скачать вот здесь (там есть всякая дополнительная информация), однако оно будет работать только с видеокартами NVIDIA RTX A2000, NVIDIA Quadro RTX 3000, GeForce RTX 2060, TITAN RTX или старше, на которых установлено не менее 8 ГБ памяти.

Ну и вот ролик, на котором рассказывается обо всяких других возможностях приложения. Впечатляет, да.

ИИ всё крутеет и крутеет. В ленте стали попадаться переводы на различные языки кусочков из стримов известных персонажей, и там создавалось почти полное впечатление того, что это именно данный персонаж самолично говорит на другом языке - до того четко сохранялись и воспроизводились его интонации.

Порылся, почитал - таких сервисов уже несколько, один из лучших, судя по всему, это HeyGen Labs.

Зарегистрировался, засунул туда демонстрационный ролик со мной из недавней статьи в "Ликбезе", заказал для экзотики перевод на немецкий - зацените результат. Там и качество перевода, насколько я могу судить по другим языкам, вполне пристойное, а уж голос и интонации - совершенно мои. Да и в артикуляцию практически точно попадают - фантастика просто!

В Midjorney создали Тематический парк развлечений по произведениям Стивена Кинга.

Смотрится достаточно жутковато. Но если бы его сделали на самом деле, он точно бы пользовался популярностью.

продолжение здесь

В Midjorney нарисовали комедийных (в основном) актеров и актрис в качестве персонажей "Игры престолов". Что-то получилось не сильно удачно и не сильно похоже, но некоторые вышли прям хорошо.

Вот несколько примеров.

Райан Рейнольдс

Уилл Феррелл.

Том Хэнкс.

продолжение здесь

Телеграм-канал "Данайские нейросети" сделал шикарную подборку героев "Властелина колец" в стиле "Если бы Средиземье было Россией 90-х". По-моему, получилось очень классно. Генерировали с помощью нейросети, но явно еще серьезно дорабатывали в Фотошопе для аутентичности.

продолжение здесь

Вот такое прочитал у френда по поводу Midjourney. Я как-то над этим не задумывался. А ведь похоже, что так оно и есть...

 Последнее время некоторые мои френды активно постят продукцию Midjourney и прочих "генераторов изображений" на основе Stable Diffusion. Видимо, мне придется писать подробный разбор этой технологии. А пока прошу вас всех этого не делать - не репостить "ИИ нарисовал картинку" и не пользоваться самим.

Основание - факты показывают, что под видом "ИИ" нам втюхивают нечто вроде фоторобота, в который заложены более полумиллиарда исходных изображений, взятых из интернета без спросу и с нарушением огромного количества авторских прав и лицензионных соглашений.

Каждый кусочек в любом "ИИ нарисовал" - на деле нарисовал художник, которого обокрали разработчики Stable Diffusion и составители базы LAION-5B, причем они открытым текстом заявляют, что их цель - устранить саму роль художника в создании искусства, то есть, читай, заменить искусство как форму самовыражения и коммуникации своей продукцией, состоящей в основном из ворованного материала. Спасибо вам заранее за понимание и содействие.

Подробный разбор (и, надеюсь, ссылки на способы поддержать судебный иск против разработчиков) будет позже, а пока, чтобы не быть голословным - вот вам пример художника, работу которого сплагиатили (и/или посодействовали плагиату) разработчики Stable Diffusion.

Теги
Сортировать по алфавиту или записям
BLM 20
Calella 142
exler.ru 249
авто 427
видео 3782
вино 348
еда 481
ЕС 57
игры 114
ИИ 19
кино 1545
попы 185
СМИ 2594
софт 907
США 82
шоу 6