Новости по теме «Google TPU обрабатывает данные в 15 раз быстрее обычных компонентов»

Google запускает ИИ-модель Gemini

После того, как OpenAI выпустил ChatGPT год назад, он поднял волну интереса к технологии, а потому очень быстро у него появились конкуренты. Первым значимым конкурентом стала Google с её моделью Gemini, которая была представлена на Google I/O 2023. И вот теперь компания с гордостью заявляет о выпуске Gemini 1.0.

По её словам, Gemini является наиболее большой и способной моделью на сегодня, с возможностью понимания и комбинирования текста, изображений, видео и кода. Модель Google Gemini создана в трёх различных вариантах: Ultra, Pro и Nano. Самой масштабной является версия Ultra, которая позволяет обрабатывать большие и сложные задачи. Версия Pro предназначена для задач среднего масштаба, а Nano, как эффективная модель, может быть использована непосредственно на устройстве.

Что касается производительности, то Gemini оказалась более быстрой, в сравненим с GPT-4. В тридцати из тридцати двух академических тестов, используемых для исследования LLM, Gemini Ultra работала быстрее. Кроме того, он стала первой моделью, которая смогла победить человеческих экспертов в MMLU (massive multitask language understanding) со счётом 90%.

Посмотреть на работу Gemini можно различными способами. К примеру, посредством Bard, который получит за счёт новой версии Gemini улучшенную функциональность. Также Gemini Nano появится в Pixel 8 Pro для обеспечения функции подготовки саммари, приложения записи и быстрого ответа в Gboard. В будущем Gemini появится в продуктах Search, Ads, Chrome и Duet AI.

Samsung поменяла поисковик в своих телефонах

Несколько месяцев назад компания Microsoft резко улучшила возможности своего поисковика Bing, внедрив нового помощника на базе искусственного интеллекта. И теперь компания Samsung решила использовать именно эти возможности, отойдя от решений Google.

В случае отказа Samsung от использования Google и перехода на Bing, первая, и её родительская компания Alphabet, потеряют порядка 3 миллиардов долларов ежегодно. По крайней мере таковы условия соглашения между ними. Безусловно, это вызовет проблемы у Google, которой придётся резко ускорить работы над своими сервисами ИИ.

И хотя 3 миллиарда долларов для Alphabet это не слишком большая сумма, потеря Samsung станет большим репутационным ударом. На этом фоне другой партнёр Google, компания Apple, также может отказаться от её услуг. Аналогичный контракт с Apple должен быть продлён в этом году, и сумма текущей сделки намного выше — 20 миллиардов.

Таким образом, передовая позиция Bing в области ИИ может привести Google к большим финансовым потерям и разрушить псеводмонополию последней. Google отчаянно нуждается в собственном средстве ИИ для поисковика, однако сможет ли компания быстро достичь со своим Bard тех же результатов, что и Bing с ChatGPT, пока совершенно не ясно.

Google хочет выпустить аналог ChatGPT

Сундар Пичаи, исполнительный директор Google, рассказал о планах компании по интеграции технологии искусственного интеллекта в поиске и прочих продуктах.

В ходе конференции по результатам IV квартала Пичаи сообщил, что в скором времени пользователи смогут напрямую взаимодействовать с новейшей и наиболее мощной моделью, как с компаньоном, для ведения поиска совершенно новым образом.

По словам директора, компания выпустит технологию чат-бота в общий доступ в «ближайшие недели и месяцы». В Google Search будет использоваться LaMDA (Language Model for Dialogue Applications), собственная языковая модель, которая обеспечит «фактажный» и традиционный ответ на запрос. Технологический гигант готовится продемонстрировать над чем они работают в плане ИИ нынешнего поколения, а также представил планы по интеграции технологии в серию продуктов, включая передовые ИИ-возможности для Gmail и Docs.

Таким образом Пичаи подчеркнул возможности искусственного интеллекта и то, как мир готов взаимодействовать с ним, отметив принятие энтузиастами возможностей ChatGPT от OpenAI.

Google внедряет в Android технологию наблюдения за сном

Компания Google в Android Developers Blog объявила о том, что делает доступным Sleep API для третьих разработчиков. Компания отметила, что Sleep API разработан для слежения за сном наиболее энергоэффективным образом, а открытый API могут использовать другие разработчики.

Для этого компания объединила усилия с Urbandroid, авторами приложения Sleep As Android. Комментируя Sleep API компания Urbandroid отметила: «Sleep as Android — это швейцарский армейский нож, позволяющий улучшить ночной отдых. Он отслеживает длительность сна, регулярность, фазы, храп и так далее. Длительность сна — один из важнейших параметров для мониторинга, который гарантирует хороший ночной отдых. Новый Sleep API даёт фантастическую возможность для отслеживания его автоматически наиболее энергоэффективным образом, из тех, что можно представить».

Android Sleep API

Когда пользователь на своём устройстве разрешает Sleep API, его устройство использует ИИ для анализа датчиков освещённости и движения. Это необходимо для определения момента засыпания.

Sleep API уже доступен для пользователей, как часть последней версии Google Play Services.

Google Translate получит синхронное стенографирование

Компания Google сообщила, что приложение Google Translate для Android получит возможность синхронного стенографирования речи. Данный функционал был продемонстрирован в офисе компании, а одно из мероприятий, посвящённое развитию искусственного интеллекта.

Инструмент будет стенографировать речь, как будто она записана пользователем на другом языке. Пока функция является прототипом и может работать лишь онлайн.

Google Translate

Функция работает только с произносимой речью, захваченной через микрофон смартфона и не поддерживает обработку ранее записанных файлов. При этом никто не запрещает воспроизвести этот файл через громкоговоритель и позволить расшифровать его на лету. В новом инструменте Google Translate будет получать целое предложение по мере захвата аудио. Это позволит корректировать пунктуацию и лучше подбирать слова. В дополнение, инструмент будет исправлять акценты и региональные диалекты.

В Google отмечают, что новая функция не даст идеальный перевод в текст. Однако ИИ будет обучаться, и по мере её использования качество перевода будет улучшаться. О том, когда функция появится в приложении Google Translate пока не сообщается.

Google запускает распознавание речи в режиме офлайн

Всем известно, что Google предоставляет сервисы распознавания речи, но для этого требуется интернет-подключение для связи с искусственным интеллектом, однако скоро всё может поменяться.

Компания Google анонсировала систему офлайн распознавания речи, пока только для смартфонов Pixel. Благодаря отсутствию необходимости передавать данные, распознавание должно проходить быстрее и точнее. В своём блоге фирма сообщила, что она хочет создать новую систему распознавания, «достаточно компактную для размещения в телефоне», и работоспособную при отсутствии сети.

Клавиатура Gboard

Традиционная схема распознавания речи представляет собой разделение слов на маленькие части под названием фонемы. Затем система распознавания анализирует порядок, палитру и контекст фонем, чтобы собрать предложение. Всё это приводит к задержкам в распознавании, поскольку зачастую ПО ожидает полного произношения предложения.

Однако в блоге Google сообщила, что её новый офлайн AI использует модель «вывода символов одного за другим, по речи, с пробелами в нужных местах». Иными словами, клавиатура Gboard будет распознавать отдельные буквы при произношении слов, а не фонемы.

Сравнение распозавания речи на сервере и в офлайн режиме

Пока обновление Gboard работает лишь на смартфонах Pixel и поддерживает «Американский английский» язык. В будущем же количество поддерживаемых языков должно увеличиться.

Машинное обучение Google блокирует спам с эффективностью 99,9%

В своём блоге компания Google сообщила об использовании машинного обучения на базе TensorFlow, которое блокирует попадание спама на Gmail.

Эта технология способна блокировать 99,9% спама, что в натуральном выражении означает 100 миллионов дополнительно отсеянных спам-сообщений каждый день.

Спам

«Где мы нашли эти 100 миллионов дополнительных спам-сообщений? Сейчас мы блокируем категории спама, которые раньше было очень тяжело выявить. Применение TensorFlow помогло нам блокировать сообщения с изображениями, письма со скрытым встроенным контентом и сообщения от свежесозданных доменов, которые пытаются спрятать малые объёмы спам-сообщений среди законного трафика.

Учитывая, что мы уже блокировали подавляющую часть спама на Gmail, блокировка дополнительных миллионов с такой точностью — это достижение. TensorFlow помогает нам ловить спамеров, которые пробирались через эти менее 0,1%, без случайной блокировки сообщений, важных для пользователей».

Google Lens научился распознавать миллиарды объектов

Компания Google сообщила, что её инструмент для фотографий с использованием искусственного интеллекта, Lens, теперь умеет идентифицировать более миллиарда объектов.

Это заметное увеличение возможностей по сравнению с первой версией утилиты, которая изначально умела определять около 250 тысяч объектов. Инструмент обучался в системе Google DeepMind.

Google Lens

При этом миллиард элементов был получен из тех, что представлены в Google Shopping. Это значит, что среди них нельзя найти вещи, которых нет в продаже. Даже игровые консоли из 90-х или первые редакции старых книг найти через Lens уже не получится. Однако среди современных товаров найти позицию будет просто.

Google Lens в действии

Google использует ИИ для предсказания задержек авиарейсов

Информация о задержках авиарейсов весьма полезна, однако оглашение о задержках часто зависит от авиакомпании, и они не всегда заинтересованы в быстром обновлении сведений. Теперь в этом поможет Google.

Компания обновила свой сервис Flights, в котором не только стала сообщать о возможной задержке рейса, но и оценивать вероятность. Для этого система машинного обучения использует исторические данные для прогноза задержек и подсвечивает рейсы, если вероятность задержки составляет более 80%. При этом Google отмечает, что вам всё равно не стоит опаздывать на самолёт, ведь даже вероятность 99% не означает, что самолёт не улетит по графику. Зато такой прогноз может подсказать, сколько лишнего времени вам придётся провести в аэропорту.

Также обновлённый сервис Google поможет вам сэкономить на перелёте. Пока он работает для 3 авиакомпаний: American, Delta и United. Благодаря новым возможностям можно оценить стоимость дополнительных сервисов в лоу-кост тарифах, таких как увеличенная ручная кладь или перевес багаж, а также сравнить эти траты со стоимостью обычных билетов.

А вы видите ламантина на снимке?

Компания Google использует искусственный интеллект не только для улучшения своих сервисов, но и для помощи экологам и учёным, в очередной раз подтверждая своё звание «корпорации добра».

Нейронная сеть TensorFlow с открытым исходным кодом стала сердцем проекта, который помогает сохранить популяцию морских коров или ламантинов.

Несмотря на их внушительные размеры, биологам бывает довольно трудно отследить их перемещения. Чтобы сделать это исследователи проводили аэрофотосъёмку океана с дронов, однако найти даже таких крупных животных — весьма сложная задача. Для человека.

Вот одна из таких фотографий, сделанных с дрона:

Вы видите на ней ламантина?

Прокрутите вниз для ответа.

Вот он:

Используя открытое ПО Google TensorFlow исследователь Аманда Ходгсон из университета Мердок со своей командой создала детектор, который находит ламантинов на снимках. Ранние версии детектора позволяли найти 80% этих животных на аэрофотоснимке, сделанном дроном. В будущем же, как надеются исследователи, AI улучшит свою работу.

Также учёные полагают, что искусственный интеллект может быть приспособлен и для поиска других крупных млекопитающих, таких как горбатые киты и даже дельфины.

Искусственный интеллект Google обошёл Bing и Siri в тесте IQ

Трое исследователей: Фен Лиу, Йон Ши и  Йин Лиу, разработали тест IQ, нацеленный на проверку различных систем AI.

По их результатам AI от Google оказался самым сообразительным, набрав 47,8 баллов. Для сравнения, показатель 18-летнего человека — 96 баллов, а шестилетнего — 55,5.

Главные конкуренты Google отстали от него весьма заметно. Так, Bing и Baidu набрали по 31,98 и 32,92 очка соответственно. Худшим был Apple Siri, его результат составил 23,9 баллов.

Исследователи отметили, что пока лучший искусственный интеллект не дотягивает даже до шестилетнего ребёнка, но они быстро сокращают разрыв. В 2014 году искусственные интеллекты Google и Baidu набирали по 26,5 и 23,5 очков соответственно. Это означает рост уровня интеллекта на 80% всего за два года (для Google), так что беспокойства Илона Маска о порабощении нас своими же компьютерами, возможно, не так уж и не обоснованы.

Исследование также разделяет искусственные интеллекты по градациям и типам в зависимости от направления использования. С полным исследованием можно ознакомиться по этой ссылке.

Google рассказала о втором поколении TPU

В ходе конференции Google I/O, организаторы продемонстрировали второе поколение тензорного процессора (TPU), который используется в искусственном интеллекте компании.

Новая модель процессора может быть использована как для обучения, так и для поиска взаимосвязей. А система из четырёх новых Cloud TPU обещает производительность системы машинного обучения на уровне 180 терафлопс. По словам Google, данный чип значительно производительнее решений на базе GPU, в связи с чем компания планирует предложить платформу Cloud коммерческим разработчикам.

Что касается производительности, то Google пояснила, что обучение большой модели языкового перевода занимает целый день на 32 топовых GPU. Та же работа длится 6 часов на одной восьмой кластера, или на 8 TPU.

Первое поколение TPU компания Google представила в 2015 году. Эти процессоры используются в широком спектре облачных сервисов компании, включая поиск, перевод и Google Photos.

Google обеспечит голливудское увеличение изображения

Концепция улучшения пикселизованного изображения нам известна из многих голливудских фильмов, но, как и почти всегда, реальные технологии далеки от кино. Однако инженеры в Google Brain придумали способ приблизить фантастику к реальности.

Новая технология использует пару нейронных сетей, которые перерабатывают изображения 8x8 пикселей, чтобы воссоздать лицо человека, спрятанное за ним. Конечно, нейронные сети не увеличивают изображение без пикселизации, а создают новое, которое могло бы выглядеть как оригинал.

Как сказано выше, в процессе воссоздания лица участвуют две нейронные сети. Первая картирует изображение разрешением 8х8 точек в аналогично выглядящее изображение, но с большим разрешением. Это изображение используется в качестве скелета для второй сети, которая добавляет к картинке больше деталей на основе уже существующих изображений со сходными пиксельными картами. Затем полученные изображения двух сетей комбинируются, создавая конечную картинку.

Конечно, воссозданная картинка далека от реальности, так что эта технология бесполезна для спецслужб, однако пригодится при обработке снимков при необходимости экстремального увеличения.

Технология Google RAISR снижает трафик картинок вчетверо

Практически все тарифы мобильных операторов предполагают лимитированное использование трафика, и компания Google задалась целью заметно снизить потребление, разработав технологию сжатия изображений RAISR — Rapid and Accurate Image Super-Resolution (быстрое и точное изображение супер разрешения).

По сути, эта технология не является традиционным методом сжатия, она больше похожа на вид искусства, которым занимается система машинного обучения. Так, RAISR увеличивает эскизы изображений, полученные в меньшем разрешении, используя специальные алгоритмы машинного обучения. В конечном счете, искусственный интеллект восстанавливает отсутствующие детали, приводя изображение к оригинальному виду. В результате трафик при передаче изображений можно снизить на 75%, по сравнению с оригиналом, при сохранении большинства обозримых деталей.

Пока Google предлагает эту технологию лишь для сервиса Google+ и лишь для изображений, размещённых на сервисе. «В ближайшие недели» компания расширит сферу действия технологии и на другие свои сервисы.

Неизвестно, станет ли Google использовать эту технологию только для своих служб, или распространит её, как Brotli, однако нам, несомненно, хотелось бы увидеть её в работе таких загруженных изображениями сайтов, как социальные сети и онлайн магазины.

Искусственный интеллект Google придумал свой язык

Паниковать не стоит, но искусственный интеллект Google случайно (или не очень) создал свой собственный секретный язык. И этот язык был придуман нейронной машиной перевода (Neural Machine Translation — NMT) самостоятельно, без участия человека.

Новую нейронную машину перевода компания Google представила в сентябре, а внедрена она была совсем недавно. Новая система позволяет переводить предложения целиком, не деля его на части и лучше передавая смысл. Система NMT является самообучаемой, что значит, что она самосовершенствуется по мере работы.

Впервые система была использована для улучшения перевода с английского на корейский и обратно, а затем — с английского на японский и обратно. Инженерам было интересно посмотреть, сможет ли  машина переводить текст с корейского на японский без английского языка между ними. И ответ оказался «да», машина перевела текст напрямую.

Как Google AI добился этого немного не ясно. Оказалось, что NMT создал свой собственный внутренний язык «interlingua». Он оперирует концепциями и структурами предложений, а не эквивалентными словами. В результате, NMT создаёт более точные переводы, чем раньше. Создатели нейронного машинного переводчика не уверены в принципах работы нейронной сети и не могут сказать, каким образом осуществлено обучение прямому переводу между языками. Иными словами искусственный интеллект Google создал свой собственный язык, который мы, люди, не можем полностью понять.

Google Translate стал умнее

Компания Google уверяет, что ей удалось сделать машинный перевод более естественным, предложив его для смартфонов и веб приложения.

Поисковый гигант отметил, что теперь используется «нейронный машинный перевод», что позволяет переводить предложение целиком, вместо разделения его на части и дальнейшего перевода. В результате полученный текст оказывается более естественным, имеет лучший синтаксис и грамматику.

«За одно изменение было достигнуто больше улучшений, чем за все 10 лет», — заявил лидер продукта Google Translate Барак Туровски.

Кроме английского новая система перевода доступна ещё для восьми из 103 языков, поддерживаемых системой. Так, «нейронный» перевод поддерживает французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий языки. В компании отметили, что эти языки составляют 35% всех переводов, выполняемых сервисом. По информации Туровски, данный метод позволяет снизить ошибки на величину от 55% до 85%.

Google научился отвечать на сложные вопросы

За последние пару лет виртуальные помощники стали стандартом мобильной среды и даже настольных устройств. К примеру, Siri по-прежнему является частью рекламной кампании Apple для iPhone и iPad, а Cortana рекламируется как ключевая функция в Windows 10.

Наряду с развитием интеллектуальных систем у Microsoft и Apple, помощник Google также демонстрирует прорыв. Так, компания в своём блоге сообщила, что теперь приложение Google стало намного сообразительнее, поскольку теперь оно понимает и отвечает на сложные вопросы, с которыми не могло справиться ранее.

Отныне Google может понимать смысл, стоящий за вопросом, а также понимать цель задаваемого вопроса.

К примеру, виртуальный помощник теперь понимает:

  • Сравнительную степень (самый высокий, крупнейший и т.п.);
  • Упорядоченные запросы (Кто является самым высоким игроком Maverick?);
  • Временные связи (Какую песню записала Тэйлор Свифт в 2014 году?);
  • Сложные комбинации (Каково было население США, когда родился Берни Сандерс?).

Если у вас есть соответствующее приложение Google на смартфоне или планшете, то вы уже можете позадавать ему подобные сложные вопросы. Конечно, поиск информации на смартфоне не слишком удобен, но если теперь с ним можно будет разговаривать как с человеком, то почему бы им не пользоваться чаще.

Google открывает исходный код системы машинного обучения

Чтобы привлечь как можно большее число разработчиков и ускорить развитие технологии, компания Google решила открыть исходный код движка искусственного интеллекта, известного под названием TensorFlow.

Над этим проектом компания уже работает некоторое время, и система смогла принести плоды, например, в Google Photos, позволяя выявлять на снимках людей и места. Также технология работает в почтовом клиенте Inbox, который сканирует почту для облегчения подготовки ответов.

Исполнительный директор Google Сундар Пичаи написал в своём блоге: «Всего пару лет назад вы не могли дать команду Google app в шуме улицы, или прочитать вывески на русском используя Google Translate, либо же мгновенно находить изображения своего лабрадуделя в Google Photos. Наши приложения не были достаточно умны. Но за короткий период времени они стали намного, намного умнее. Теперь, благодаря машинному обучению, вы можете делать все эти вещи довольно легко».

Директор отметил, что система «TensorFlow — быстрее, умнее и гибче, чем наша старая система, поэтому она может быть адаптирована к новым продуктам намного проще и богаче. Сегодня мы также открыли код TensorFlow. Мы надеемся, что это позволит сообществу машинного обучения, всем — от академических учёных до инженеров, до увлечённых, намного быстрее обмениваться идеями через работающий код, а не просто изучать документы».

Google улучшил распознавание речи

Среди всех больших компаний, использующих голосовые функции, компания Google стоит особняком. В отличие от Apple Siri и Microsoft Cortana, Google не персонифицирует свой голосовой помощник. Кроме того, Google обладает лучшим алгоритмом распознавания, который теперь получил дополнительные улучшения.

В недавнем сообщении в Google Research Blog, представитель команды исследователей речи рассказал о последних изменениях в алгоритме распознавания. Компания уже использует глубокую нейронную сеть, ту самую, с помощью которой получают странные картинки со «сновидениями» искусственного интеллекта, чтобы понять, что же именно вы пытаетесь сейчас сказать своему телефону. Теперь же фирма разработала и начала использовать рекурсивную нейронную сеть. Новый алгоритм моделирования речи позволяет учитывать временные зависимости, которые, по их словам, позволяют лучше анализировать каждый фрагмент аудио, ссылаясь на поступающие звуки.

В результате пользователи получат более быстрое и точное распознавание речи. Компания также уверяет, что новый алгоритм более устойчив к распознаванию в шумном окружении. Новый алгоритм распознавания речи уже запущен для приложений поиска в iOS и Android, а также для голосового набора текста.

Google разрабатывает алгоритм расчёта калорий по фотографии

Компания Google подала патент на технологию Im2Calories, которая анализирует фотографию пищи и оценивает примерное количество калорий в этой еде.

Технология Im2Calories основывается на серии алгоритмов искусственного интеллекта, а инструмент анализа фотографий, конечно, не слишком точно, оценит примерное количество калорий в еде на сделанном снимке.

Этот проект ещё находится в разработке, а его появление ожидается только через несколько лет. Вполне вероятно, что в будущем Im2Calories будет представлен в виде приложений для Android и iOS.

Ещё одним интересным местом использования алгоритма станут ресурсы Twitter и Instagram, ведь именно там люди чаще всего выкладывают фотоснимки своей еды. Использование средства в собственной сети Google+ маловероятно, поскольку поисковый гигант мало заинтересован в поддержке этой платформы.

Сейчас можно подобрать аналогичные приложения на обе популярные мобильные платформы, но нет сомнений в том, что Google сумеет сделать более качественный продукт, благодаря отличным системам искусственного интеллекта, разрабатываемым компанией.

Платформа Intel Core Ultra Lunar Lake предлагает производительность более 100 ТОПС

На конференции Vision 2024 компания Intel раскрыла некоторые сведения о процессорах Core Ultra Lunar Lake для ноутбуков.

По информации самой Intel пользователям стоит ожидать трёхкратного прироста производительности искусственного интеллекта благодаря новому NPU. Суммарно платформа обеспечит производительность более 100 ТОПС, а NPU обеспечит 45 ТОПС. Остальная часть производительности складывается из CPU и интегрированной графики Arc Xe2 Battlemage. Это заметный скачок, ведь NPU в Meteor Lake выдаёт лишь 10 ТОПС.

Intel Lunar Lake

Компания Intel уверяет, что ноутбуки на основе Core Ultra Lunar Lake появятся на полках магазинов до Рождества. Скорее всего, эти лэптопы будут оснащены отдельной кнопкой Copilot, которую так рекламирует Microsoft.

Для работы Microsoft Copilot офлайн требуется NPU производительностью 40 TOPS

Компания Microsoft активно развивает функционал искусственного интеллекта в своей операционной системе. После интеграции ИИ чат-бота Bing в браузер и Skype фирма создала сопилот, который в Windows 11 23H2 доступен всем и каждому.

Однако сейчас любой запрос к сопилоту обрабатывается в облаке. Это требует некоторого времени, а также несёт риски безопасности для предприятий. Решением является обработка запросов локально, однако для этого требуются ресурсы.

ПК с ИИ

Сообщается, что Copilot требует NPU, который предлагает производительность на уровне 40 TOPS. Однако NPU, имеющийся в чипах Intel Core Ultra Meteor Lake обладает производительностью лишь 10 TOPS. В то же время Ryzen 8040 Hawk Point предлагает AI NPU со скоростью 16 TOPS. И вот, совсем недавно, AMD анонсировала второе поколение Ryzen AI NPU Strix Point на базе архитектуры XDNA 2, который уже обладает достаточной производительностью в 40 TOPS. Новые решения Intel Arrow Lake или Lunar Lake также должны иметь сходную производительность ИИ, что позволит использовать функционал Copilot офлайн на широком спектре компьютеров.

Cerebras выпустила очередной гигантский процессор

Компания Cerebras Systems сбросила покрывало со своего нового процессора Wafer Scale Engine 3 (WSE-3) — и это гигантский чип с неимоверными возможностями.

Чип предназначен для задач, связанных с искусственным интеллектом, и он действительно гигантский. В нём содержится 4 триллиона транзисторов, собранных в 900 тысяч ИИ-ядер.

И это не просто демонстрационный процессор. Он лёг в основу суперкомпьютера CS-3 — монстра, способного обучать ИИ-модели с 24 триллионами параметров. Чип связан с 1,2 ПБ внешней памяти, что тоже впечатляет. Сам суперкомпьютер за день обрабатывает модель с 70 миллиардами параметров.

NVIDIA вместе с Ubisoft показали неигровых персонажей с ИИ

Компания NVIDIA в сотрудничестве с Ubisoft продемонстрировала работу искусственного интеллекта у неигровых персонажей в видеоигре.

Разработчики игр рассматривают ИИ для разных способов ускорения процессов разработки. Создание фоновых и неигровых персонажей находятся на первом месте. И новый инструмент NVIDIA ACE позволяет создателям игр быстро генерировать голоса NPC с полноценной лицевой анимацией.

Разговор с NPC

Такая демонстрация была проведена в ходе GDC. Используя InWorld Character Engine и технологии LLM разработчики могут создавать базу знаний и стиль разговора для отдельного NPC. Затем инструмент NVIDIA Audio2Face использовался для быстрой генерации в реальном времени лицевой анимации на основе голосовой дорожки.

Старший вице-президент Ubisoft по производственной технологии Жилеметт Пикар отметил: «Генеративный ИИ обеспечит игровой опыт, который ещё предстоит представить, с более умными мирами, проработанными персонажами и быстрыми и адаптивными нарративами. Благодаря партнёрству с NVIDIA в нашем NEO NPC прототипе решение NVIDIA Audio2Face помогло нам создать более глубокое погружение посредством анимации в реальном времени с поистине импровизируемым разговором с NPC».

Демонстрация призвана показать ИИ-инструменты, которые подготавливаются для разработчиков. Некоторые уже используют ИИ для озвучки. И нет сомнений, что скоро ИИ будет использован для создания фоновых персонажей и NPC, выдающих квесты.

AMD выпускает собственный ИИ-чат

Компания AMD выпустила собственный офлайн чат-бот на базе ИИ, который работает на основе процессоров Ryzen AI и видеокарты серии Radeon RX 7000.

Новый основанный на LLM GPT чат-бот может работать на различных платформах Ryzen AI, включая APU Ryzen 7000 и Ryzen 8000, которые содержат NPU XDNA, а также GPU серии Radeon RX 7000, которые также содержат ускорители ИИ.

Стоит отметить, что AMD не первая в подобном решении. Недавно NVIDIA выпустила «Chat with RTX» — ИИ чат-бот, работающий на ускорителях серии GeForce RTX 40 и RTX 30 с использованием набора функций TensorRT-LLM, предлагая локальную обработку данных.

Как настроить чат от AMD подобно расписано на сайте компании.