Новости про Google и искусственный интеллект

Google запускает распознавание речи в режиме офлайн

Всем известно, что Google предоставляет сервисы распознавания речи, но для этого требуется интернет-подключение для связи с искусственным интеллектом, однако скоро всё может поменяться.

Компания Google анонсировала систему офлайн распознавания речи, пока только для смартфонов Pixel. Благодаря отсутствию необходимости передавать данные, распознавание должно проходить быстрее и точнее. В своём блоге фирма сообщила, что она хочет создать новую систему распознавания, «достаточно компактную для размещения в телефоне», и работоспособную при отсутствии сети.

Клавиатура Gboard
Клавиатура Gboard

Традиционная схема распознавания речи представляет собой разделение слов на маленькие части под названием фонемы. Затем система распознавания анализирует порядок, палитру и контекст фонем, чтобы собрать предложение. Всё это приводит к задержкам в распознавании, поскольку зачастую ПО ожидает полного произношения предложения.

Однако в блоге Google сообщила, что её новый офлайн AI использует модель «вывода символов одного за другим, по речи, с пробелами в нужных местах». Иными словами, клавиатура Gboard будет распознавать отдельные буквы при произношении слов, а не фонемы.

Сравнение распозавания речи на сервере и в офлайн режиме
Сравнение распозавания речи на сервере и в офлайн режиме

Пока обновление Gboard работает лишь на смартфонах Pixel и поддерживает «Американский английский» язык. В будущем же количество поддерживаемых языков должно увеличиться.

Машинное обучение Google блокирует спам с эффективностью 99,9%

В своём блоге компания Google сообщила об использовании машинного обучения на базе TensorFlow, которое блокирует попадание спама на Gmail.

Эта технология способна блокировать 99,9% спама, что в натуральном выражении означает 100 миллионов дополнительно отсеянных спам-сообщений каждый день.

Спам
Спам

«Где мы нашли эти 100 миллионов дополнительных спам-сообщений? Сейчас мы блокируем категории спама, которые раньше было очень тяжело выявить. Применение TensorFlow помогло нам блокировать сообщения с изображениями, письма со скрытым встроенным контентом и сообщения от свежесозданных доменов, которые пытаются спрятать малые объёмы спам-сообщений среди законного трафика.

Учитывая, что мы уже блокировали подавляющую часть спама на Gmail, блокировка дополнительных миллионов с такой точностью — это достижение. TensorFlow помогает нам ловить спамеров, которые пробирались через эти менее 0,1%, без случайной блокировки сообщений, важных для пользователей».

Google Lens научился распознавать миллиарды объектов

Компания Google сообщила, что её инструмент для фотографий с использованием искусственного интеллекта, Lens, теперь умеет идентифицировать более миллиарда объектов.

Это заметное увеличение возможностей по сравнению с первой версией утилиты, которая изначально умела определять около 250 тысяч объектов. Инструмент обучался в системе Google DeepMind.

Google Lens
Google Lens

При этом миллиард элементов был получен из тех, что представлены в Google Shopping. Это значит, что среди них нельзя найти вещи, которых нет в продаже. Даже игровые консоли из 90-х или первые редакции старых книг найти через Lens уже не получится. Однако среди современных товаров найти позицию будет просто.

Google Lens в действии
Google Lens в действии

Google использует ИИ для предсказания задержек авиарейсов

Информация о задержках авиарейсов весьма полезна, однако оглашение о задержках часто зависит от авиакомпании, и они не всегда заинтересованы в быстром обновлении сведений. Теперь в этом поможет Google.

Компания обновила свой сервис Flights, в котором не только стала сообщать о возможной задержке рейса, но и оценивать вероятность. Для этого система машинного обучения использует исторические данные для прогноза задержек и подсвечивает рейсы, если вероятность задержки составляет более 80%. При этом Google отмечает, что вам всё равно не стоит опаздывать на самолёт, ведь даже вероятность 99% не означает, что самолёт не улетит по графику. Зато такой прогноз может подсказать, сколько лишнего времени вам придётся провести в аэропорту.

Задержка рейсов

Также обновлённый сервис Google поможет вам сэкономить на перелёте. Пока он работает для 3 авиакомпаний: American, Delta и United. Благодаря новым возможностям можно оценить стоимость дополнительных сервисов в лоу-кост тарифах, таких как увеличенная ручная кладь или перевес багаж, а также сравнить эти траты со стоимостью обычных билетов.

Цена на рейсы

А вы видите ламантина на снимке?

Компания Google использует искусственный интеллект не только для улучшения своих сервисов, но и для помощи экологам и учёным, в очередной раз подтверждая своё звание «корпорации добра».

Нейронная сеть TensorFlow с открытым исходным кодом стала сердцем проекта, который помогает сохранить популяцию морских коров или ламантинов.

Ламантины

Несмотря на их внушительные размеры, биологам бывает довольно трудно отследить их перемещения. Чтобы сделать это исследователи проводили аэрофотосъёмку океана с дронов, однако найти даже таких крупных животных — весьма сложная задача. Для человека.

Вот одна из таких фотографий, сделанных с дрона:

Аэрофотоснимок моря

Вы видите на ней ламантина?

Прокрутите вниз для ответа.

Вот он:

Аэрофотоснимок моря

Используя открытое ПО Google TensorFlow исследователь Аманда Ходгсон из университета Мердок со своей командой создала детектор, который находит ламантинов на снимках. Ранние версии детектора позволяли найти 80% этих животных на аэрофотоснимке, сделанном дроном. В будущем же, как надеются исследователи, AI улучшит свою работу.

Также учёные полагают, что искусственный интеллект может быть приспособлен и для поиска других крупных млекопитающих, таких как горбатые киты и даже дельфины.

Искусственный интеллект Google обошёл Bing и Siri в тесте IQ

Трое исследователей: Фен Лиу, Йон Ши и  Йин Лиу, разработали тест IQ, нацеленный на проверку различных систем AI.

По их результатам AI от Google оказался самым сообразительным, набрав 47,8 баллов. Для сравнения, показатель 18-летнего человека — 96 баллов, а шестилетнего — 55,5.

Главные конкуренты Google отстали от него весьма заметно. Так, Bing и Baidu набрали по 31,98 и 32,92 очка соответственно. Худшим был Apple Siri, его результат составил 23,9 баллов.

Нейроны и синапсы

Исследователи отметили, что пока лучший искусственный интеллект не дотягивает даже до шестилетнего ребёнка, но они быстро сокращают разрыв. В 2014 году искусственные интеллекты Google и Baidu набирали по 26,5 и 23,5 очков соответственно. Это означает рост уровня интеллекта на 80% всего за два года (для Google), так что беспокойства Илона Маска о порабощении нас своими же компьютерами, возможно, не так уж и не обоснованы.

Исследование также разделяет искусственные интеллекты по градациям и типам в зависимости от направления использования. С полным исследованием можно ознакомиться по этой ссылке.

Google рассказала о втором поколении TPU

В ходе конференции Google I/O, организаторы продемонстрировали второе поколение тензорного процессора (TPU), который используется в искусственном интеллекте компании.

Новая модель процессора может быть использована как для обучения, так и для поиска взаимосвязей. А система из четырёх новых Cloud TPU обещает производительность системы машинного обучения на уровне 180 терафлопс. По словам Google, данный чип значительно производительнее решений на базе GPU, в связи с чем компания планирует предложить платформу Cloud коммерческим разработчикам.

Платформа Google Cloud

Что касается производительности, то Google пояснила, что обучение большой модели языкового перевода занимает целый день на 32 топовых GPU. Та же работа длится 6 часов на одной восьмой кластера, или на 8 TPU.

Первое поколение TPU компания Google представила в 2015 году. Эти процессоры используются в широком спектре облачных сервисов компании, включая поиск, перевод и Google Photos.

Google TPU обрабатывает данные в 15 раз быстрее обычных компонентов

Два года назад компания Google создала собственную интегральную схему под названием Tensor Processing Unit, которая предназначена для вычислительной фазы задач машинного обучения.

Изначально компания сообщала, что TPU должен улучшить производительность на ватт в характерных задачах на величину до 10 раз, по сравнению с традиционными CPU и GPU. И теперь, получив опыт эксплуатации, фирма провела исследование влияния производительности чипов этого типа.

Оказалось, что 10-кратный прирост в энергоэффективность был слишком скромным. На самом деле производительность возросла от 30 до 80 раз по отношению к обычным решениям и в зависимости от сценария. Если говорить о прямой производительности, то по словам Google TPU в 15—30 раз быстрее стандартного аппаратного обеспечения.

Эффективность TPU

На этом процессоре работает специальное программное обеспечение, основанное на фреймворке машинного обучения TensorFlow, и некоторая доля этого ускорения связана именно с этим фреймворком. Авторы исследования отметили, что у программистов ещё есть запас по оптимизации.

Компания Google увидела необходимость TPU ещё 6 лет назад. Глубинное обучение компания использует в разных проектах, включая поиск изображений, фотографий и перевод. По своей природе, машинное обучение довольно требовательный к ресурсом процесс. К примеру, инженеры Google отметили, что если бы люди использовали распознавание речи по 3 минуты в день, и она выполнялась бы без TPU, то компании пришлось бы удвоить количество центров обработки данных.

Google обеспечит голливудское увеличение изображения

Концепция улучшения пикселизованного изображения нам известна из многих голливудских фильмов, но, как и почти всегда, реальные технологии далеки от кино. Однако инженеры в Google Brain придумали способ приблизить фантастику к реальности.

Новая технология использует пару нейронных сетей, которые перерабатывают изображения 8x8 пикселей, чтобы воссоздать лицо человека, спрятанное за ним. Конечно, нейронные сети не увеличивают изображение без пикселизации, а создают новое, которое могло бы выглядеть как оригинал.

Интеллектуальное увеличение от Google

Как сказано выше, в процессе воссоздания лица участвуют две нейронные сети. Первая картирует изображение разрешением 8х8 точек в аналогично выглядящее изображение, но с большим разрешением. Это изображение используется в качестве скелета для второй сети, которая добавляет к картинке больше деталей на основе уже существующих изображений со сходными пиксельными картами. Затем полученные изображения двух сетей комбинируются, создавая конечную картинку.

Конечно, воссозданная картинка далека от реальности, так что эта технология бесполезна для спецслужб, однако пригодится при обработке снимков при необходимости экстремального увеличения.

Технология Google RAISR снижает трафик картинок вчетверо

Практически все тарифы мобильных операторов предполагают лимитированное использование трафика, и компания Google задалась целью заметно снизить потребление, разработав технологию сжатия изображений RAISR — Rapid and Accurate Image Super-Resolution (быстрое и точное изображение супер разрешения).

По сути, эта технология не является традиционным методом сжатия, она больше похожа на вид искусства, которым занимается система машинного обучения. Так, RAISR увеличивает эскизы изображений, полученные в меньшем разрешении, используя специальные алгоритмы машинного обучения. В конечном счете, искусственный интеллект восстанавливает отсутствующие детали, приводя изображение к оригинальному виду. В результате трафик при передаче изображений можно снизить на 75%, по сравнению с оригиналом, при сохранении большинства обозримых деталей.

RAISR

RAISR

Пока Google предлагает эту технологию лишь для сервиса Google+ и лишь для изображений, размещённых на сервисе. «В ближайшие недели» компания расширит сферу действия технологии и на другие свои сервисы.

Неизвестно, станет ли Google использовать эту технологию только для своих служб, или распространит её, как Brotli, однако нам, несомненно, хотелось бы увидеть её в работе таких загруженных изображениями сайтов, как социальные сети и онлайн магазины.