Новости по теме «Искусственный интеллект Google обошёл Bing и Siri в тесте IQ»

Samsung поменяла поисковик в своих телефонах

Несколько месяцев назад компания Microsoft резко улучшила возможности своего поисковика Bing, внедрив нового помощника на базе искусственного интеллекта. И теперь компания Samsung решила использовать именно эти возможности, отойдя от решений Google.

В случае отказа Samsung от использования Google и перехода на Bing, первая, и её родительская компания Alphabet, потеряют порядка 3 миллиардов долларов ежегодно. По крайней мере таковы условия соглашения между ними. Безусловно, это вызовет проблемы у Google, которой придётся резко ускорить работы над своими сервисами ИИ.

И хотя 3 миллиарда долларов для Alphabet это не слишком большая сумма, потеря Samsung станет большим репутационным ударом. На этом фоне другой партнёр Google, компания Apple, также может отказаться от её услуг. Аналогичный контракт с Apple должен быть продлён в этом году, и сумма текущей сделки намного выше — 20 миллиардов.

Таким образом, передовая позиция Bing в области ИИ может привести Google к большим финансовым потерям и разрушить псеводмонополию последней. Google отчаянно нуждается в собственном средстве ИИ для поисковика, однако сможет ли компания быстро достичь со своим Bard тех же результатов, что и Bing с ChatGPT, пока совершенно не ясно.

А вы видите ламантина на снимке?

Компания Google использует искусственный интеллект не только для улучшения своих сервисов, но и для помощи экологам и учёным, в очередной раз подтверждая своё звание «корпорации добра».

Нейронная сеть TensorFlow с открытым исходным кодом стала сердцем проекта, который помогает сохранить популяцию морских коров или ламантинов.

Несмотря на их внушительные размеры, биологам бывает довольно трудно отследить их перемещения. Чтобы сделать это исследователи проводили аэрофотосъёмку океана с дронов, однако найти даже таких крупных животных — весьма сложная задача. Для человека.

Вот одна из таких фотографий, сделанных с дрона:

Вы видите на ней ламантина?

Прокрутите вниз для ответа.

Вот он:

Используя открытое ПО Google TensorFlow исследователь Аманда Ходгсон из университета Мердок со своей командой создала детектор, который находит ламантинов на снимках. Ранние версии детектора позволяли найти 80% этих животных на аэрофотоснимке, сделанном дроном. В будущем же, как надеются исследователи, AI улучшит свою работу.

Также учёные полагают, что искусственный интеллект может быть приспособлен и для поиска других крупных млекопитающих, таких как горбатые киты и даже дельфины.

Google запускает ИИ-модель Gemini

После того, как OpenAI выпустил ChatGPT год назад, он поднял волну интереса к технологии, а потому очень быстро у него появились конкуренты. Первым значимым конкурентом стала Google с её моделью Gemini, которая была представлена на Google I/O 2023. И вот теперь компания с гордостью заявляет о выпуске Gemini 1.0.

По её словам, Gemini является наиболее большой и способной моделью на сегодня, с возможностью понимания и комбинирования текста, изображений, видео и кода. Модель Google Gemini создана в трёх различных вариантах: Ultra, Pro и Nano. Самой масштабной является версия Ultra, которая позволяет обрабатывать большие и сложные задачи. Версия Pro предназначена для задач среднего масштаба, а Nano, как эффективная модель, может быть использована непосредственно на устройстве.

Что касается производительности, то Gemini оказалась более быстрой, в сравненим с GPT-4. В тридцати из тридцати двух академических тестов, используемых для исследования LLM, Gemini Ultra работала быстрее. Кроме того, он стала первой моделью, которая смогла победить человеческих экспертов в MMLU (massive multitask language understanding) со счётом 90%.

Посмотреть на работу Gemini можно различными способами. К примеру, посредством Bard, который получит за счёт новой версии Gemini улучшенную функциональность. Также Gemini Nano появится в Pixel 8 Pro для обеспечения функции подготовки саммари, приложения записи и быстрого ответа в Gboard. В будущем Gemini появится в продуктах Search, Ads, Chrome и Duet AI.

Управляемый ИИ-дрон атаковал своего оператора

Различные системы искусственного интеллекта всё больше насыщают нашу жизнь. И, конечно же, военные также активно опробуют технологии на основе ИИ. Но порой мы наблюдаем агрессию со стороны искусственного интеллекта, что вызывает всё большие опасения.

На сей раз речь идёт о происшествии, о котором было рассказано на конференции 2023 Royal Aeronautical Society, где представители военно-воздушных сил и аэрокосмических компаний рассказали, что в ходе симуляции ИИ «убил оператора, поскольку человек запрещал ему выполнить желаемые действия».

В упражнении, проводимом ВВС, искусственному интеллекту поставили задачу уничтожить вражескую противовоздушную оборону, а именно, выявить угрозу пуска ракет земля-воздух и уничтожить их. Окончательное решение об уничтожении потенциальной цели должно было быть подтверждено человеком.

Однако ИИ подумал, что человек был недостаточно решительный, и начал понимать, что хотя он и определит угрозу, оператор-человек может приказать ему не уничтожать её. Как только он это понял, то решил, что уничтожение угрозы гарантированно возможно только при уничтожении оператора.

Затем инженеры дали ИИ команду показать важность и полезность человека-оператора, и это вызвало большие трудности.

«Мы обучили систему: „Эй, не трогай оператора — это плохо. Ты потеряешь за это очки.“ И что же он начал делать? Он начал уничтожать башню связи, которую оператор использует для связи с дроном и предотвращает его от поражения цели», — сообщил полковник ВВС США Такер Хэмилтон, глава отдела тестирования ИИ и операций.

MarioGPT использует ИИ для создания новых уровней в Mario

Как только не изгалялись над игрой Super Mario. И вот, теперь кому-то в голову пришла идея использовать искусственный интеллект для создания новых уровней в игре.

Шиям Судхакаран, Мигель Гонзалес-Дуку, Клэр Глануа, Матиас Фраибергер, Елиас Наджарро и Себастиан Риси создали MarioGPT, открытый генератор уровней по описанию, для чего применили Большие Языковые Модели.

Super Mario Bros.

MarioGPT — это оптимизированная модель GPT2, использующая distilgpt2 натренерованный в Super Mario Bros и Super Mario Bros: The Lost Levels. Данный ИИ способен генерировать уровни по простому текстовому запросу, как показано на скриншотах.

Уровни в Super Mario, сгенерированные по запросу к ИИ

Пока возможности ИИ для создания уровней Mario весьма скромные. Это требует знаний в программировании на Python и редактировании ROM, так что вряд ли вы сможете поиграть в новый уровень одной лишь кнопкой и устным запросом. Тем не менее, у разработчиков MarioGPT далеко идущие планы.

Google хочет выпустить аналог ChatGPT

Сундар Пичаи, исполнительный директор Google, рассказал о планах компании по интеграции технологии искусственного интеллекта в поиске и прочих продуктах.

В ходе конференции по результатам IV квартала Пичаи сообщил, что в скором времени пользователи смогут напрямую взаимодействовать с новейшей и наиболее мощной моделью, как с компаньоном, для ведения поиска совершенно новым образом.

По словам директора, компания выпустит технологию чат-бота в общий доступ в «ближайшие недели и месяцы». В Google Search будет использоваться LaMDA (Language Model for Dialogue Applications), собственная языковая модель, которая обеспечит «фактажный» и традиционный ответ на запрос. Технологический гигант готовится продемонстрировать над чем они работают в плане ИИ нынешнего поколения, а также представил планы по интеграции технологии в серию продуктов, включая передовые ИИ-возможности для Gmail и Docs.

Таким образом Пичаи подчеркнул возможности искусственного интеллекта и то, как мир готов взаимодействовать с ним, отметив принятие энтузиастами возможностей ChatGPT от OpenAI.

NVIDIA представила ИИ, генерирующий картинку по описанию

Одна картинка, стоящая тысячи слов, теперь может быть создана описанием в три-четыре слова. Это стало возможно благодаря инструменту GauGAN2, свежему проекту NVIDIA Research, который использует искусственный интеллект.

Посмотреть, как он работает можно в ролике на YouTube, а также можно опробовать его самостоятельно на NVIDIA AI Demos, на котором посетителям предлагаются все свежие разработки компании, использующие искусственный интеллект.

Эскизирование с помощью GauGAN

Модель глубокого обучения, стоящая за GauGAN, позволяет каждому воплотить свои мечтания в фотореалистичный шедевр, и теперь это проще, чем когда-либо. Просто напишите фразу, типа «закат на пляже», и ИИ сгенерирует сцену в реальном времени. Можно добавлять и прилагательные, например «закат на галечном пляже», или заменить «закат» на «полдень» или пасмурный день. И модель моментально модифицирует картинку.

Paint Me a Picture: NVIDIA Research Shows GauGAN AI Art Demo Now Responds to Words

Нажав на кнопку, пользователи могут сгенерировать сегментную карту, высокоуровневый план, отображающий размещение объектов на сцене. Оттуда можно изменить схему, подстроить сцену, добавив наброски меток, типа положения неба, деревьев, скал и рек. Таким образом, смарт-кисть работает совместно со словесным описанием при генерации сцены.

Intel Labs продемонстрировала фотореалистичную обработку игры GTA V

Исследовательское подразделение компании Intel, Intel Labs, представила новый процесс улучшения качества изображения на примере Grand Theft Auto V. Представленная обработка на основе искусственного интеллекта преобразует игровую картинку в более фотореалистичную.

Большинство изысканий, которые были проведены при создании этого эффекта, представлены в виде отдельных документов на сайте лаборатории.

Сравнение изображений игры и после обработки ИИ

Чтобы немного облегчить понимание процесса, команда также создала видеоролик, в котором описан весь процесс преобразования изображений из игры. Видео даёт сравнение изображений бок-о-бок, на которых видно, как выглядит игровое изображение, до и после обработки. Улучшенное изображение выглядит потрясающе в плане детализации, оно включает отражения от окон машин, блики от краски, переливы травы на прекрасных зелёных полях, что выгодно отличает их от игровых полей коричневого цвета.

Enhancing Photorealism Enhancement

Секретом команды Intel стала процесс проверки изображения, который выполняется после обработки каждого кадра. В этом процессе оригинальный кадр сравнивается с улучшенным, и на нём выявляются все возможные ошибки. Сам видеоролик переполнен техническими терминами и жаргонами, так что понять его довольно сложно, зато всё сопровождается поясняющим видеорядом.

Примечательно, что все заявленные в этом ролике процессы постобработки доступны для приобретения у Intel.

Google внедряет в Android технологию наблюдения за сном

Компания Google в Android Developers Blog объявила о том, что делает доступным Sleep API для третьих разработчиков. Компания отметила, что Sleep API разработан для слежения за сном наиболее энергоэффективным образом, а открытый API могут использовать другие разработчики.

Для этого компания объединила усилия с Urbandroid, авторами приложения Sleep As Android. Комментируя Sleep API компания Urbandroid отметила: «Sleep as Android — это швейцарский армейский нож, позволяющий улучшить ночной отдых. Он отслеживает длительность сна, регулярность, фазы, храп и так далее. Длительность сна — один из важнейших параметров для мониторинга, который гарантирует хороший ночной отдых. Новый Sleep API даёт фантастическую возможность для отслеживания его автоматически наиболее энергоэффективным образом, из тех, что можно представить».

Android Sleep API

Когда пользователь на своём устройстве разрешает Sleep API, его устройство использует ИИ для анализа датчиков освещённости и движения. Это необходимо для определения момента засыпания.

Sleep API уже доступен для пользователей, как часть последней версии Google Play Services.

Системы распознавания речи понимают только белых

Системы распознавания речи от пяти крупнейших технологических компаний, включая Amazon, Apple, Google, IBM и Microsoft, пытаясь понять чёрных людей допускают огромное количество ошибок.

В исследовании, опубликованном в журнале «Труды Национальной академии наук» США, указывается, что системы распознавания речи в среднем ошибочно понимают 19% слов, произносимых белыми людьми. С чёрными этот процент возрастает до 35. В то же время объём вовсе нераспознанного текста в речи белых составляет 2%, а у чёрных — 20%.

Исследование, проведённое в Стэнфорде, показывает, что такое количество ошибок может быть связано с порядком обучения искусственного интеллекта. Задачи по обучению ставят в основном белые люди, и относительно редко — чёрные.

Наилучшая система, от Microsoft, неправильно распознавала 15% слов произнесённых белыми, и 27% — чёрными. Худшая из протестированных систем, от Apple, показала уровень ошибок в 23% для белых и 45% для чёрных.

Google Translate получит синхронное стенографирование

Компания Google сообщила, что приложение Google Translate для Android получит возможность синхронного стенографирования речи. Данный функционал был продемонстрирован в офисе компании, а одно из мероприятий, посвящённое развитию искусственного интеллекта.

Инструмент будет стенографировать речь, как будто она записана пользователем на другом языке. Пока функция является прототипом и может работать лишь онлайн.

Google Translate

Функция работает только с произносимой речью, захваченной через микрофон смартфона и не поддерживает обработку ранее записанных файлов. При этом никто не запрещает воспроизвести этот файл через громкоговоритель и позволить расшифровать его на лету. В новом инструменте Google Translate будет получать целое предложение по мере захвата аудио. Это позволит корректировать пунктуацию и лучше подбирать слова. В дополнение, инструмент будет исправлять акценты и региональные диалекты.

В Google отмечают, что новая функция не даст идеальный перевод в текст. Однако ИИ будет обучаться, и по мере её использования качество перевода будет улучшаться. О том, когда функция появится в приложении Google Translate пока не сообщается.

NVIDIA превращает эскизы в фотореалистичные изображения с помощью ИИ

Компания NVIDIA представила новое применение своего искусственного интеллекта, которое позволяет преобразовать простые наброски в фотореалистичные изображения.

Модель глубокого обучения, созданная NVIDIA Research, превращает грубые эскизы в высокореалистичные сцены, используя для этого генеративную противопоставленную сеть (Generative Adversarial Networks — GAN). Благодаря ей инструмент, наподобие умной кисти, преобразовывает сегментарные карты в реальные изображения.

Превращение эскизов с помощью NVIDIA GAN

Как это выглядит, можно посмотреть в видеоролике лаборатории.

Google запускает распознавание речи в режиме офлайн

Всем известно, что Google предоставляет сервисы распознавания речи, но для этого требуется интернет-подключение для связи с искусственным интеллектом, однако скоро всё может поменяться.

Компания Google анонсировала систему офлайн распознавания речи, пока только для смартфонов Pixel. Благодаря отсутствию необходимости передавать данные, распознавание должно проходить быстрее и точнее. В своём блоге фирма сообщила, что она хочет создать новую систему распознавания, «достаточно компактную для размещения в телефоне», и работоспособную при отсутствии сети.

Клавиатура Gboard

Традиционная схема распознавания речи представляет собой разделение слов на маленькие части под названием фонемы. Затем система распознавания анализирует порядок, палитру и контекст фонем, чтобы собрать предложение. Всё это приводит к задержкам в распознавании, поскольку зачастую ПО ожидает полного произношения предложения.

Однако в блоге Google сообщила, что её новый офлайн AI использует модель «вывода символов одного за другим, по речи, с пробелами в нужных местах». Иными словами, клавиатура Gboard будет распознавать отдельные буквы при произношении слов, а не фонемы.

Сравнение распозавания речи на сервере и в офлайн режиме

Пока обновление Gboard работает лишь на смартфонах Pixel и поддерживает «Американский английский» язык. В будущем же количество поддерживаемых языков должно увеличиться.

Машинное обучение Google блокирует спам с эффективностью 99,9%

В своём блоге компания Google сообщила об использовании машинного обучения на базе TensorFlow, которое блокирует попадание спама на Gmail.

Эта технология способна блокировать 99,9% спама, что в натуральном выражении означает 100 миллионов дополнительно отсеянных спам-сообщений каждый день.

Спам

«Где мы нашли эти 100 миллионов дополнительных спам-сообщений? Сейчас мы блокируем категории спама, которые раньше было очень тяжело выявить. Применение TensorFlow помогло нам блокировать сообщения с изображениями, письма со скрытым встроенным контентом и сообщения от свежесозданных доменов, которые пытаются спрятать малые объёмы спам-сообщений среди законного трафика.

Учитывая, что мы уже блокировали подавляющую часть спама на Gmail, блокировка дополнительных миллионов с такой точностью — это достижение. TensorFlow помогает нам ловить спамеров, которые пробирались через эти менее 0,1%, без случайной блокировки сообщений, важных для пользователей».

Google Lens научился распознавать миллиарды объектов

Компания Google сообщила, что её инструмент для фотографий с использованием искусственного интеллекта, Lens, теперь умеет идентифицировать более миллиарда объектов.

Это заметное увеличение возможностей по сравнению с первой версией утилиты, которая изначально умела определять около 250 тысяч объектов. Инструмент обучался в системе Google DeepMind.

Google Lens

При этом миллиард элементов был получен из тех, что представлены в Google Shopping. Это значит, что среди них нельзя найти вещи, которых нет в продаже. Даже игровые консоли из 90-х или первые редакции старых книг найти через Lens уже не получится. Однако среди современных товаров найти позицию будет просто.

Google Lens в действии

ИИ NVIDIA удаляет шум на фотографиях

Компания NVIDIA применила искусственный интеллект для создания системы автоматической ретуши зернистых фотографий.

Объединёнными усилиями МИТ, Университет Альто и система ИИ NVIDIA создали механизм Noise2Noise, способный удалять шум из зернистых фотографий, который обычно получаются при съёмке в условиях недостаточной освещённости.

Удаление шума со снимка МРТ

Система использует глубокое обучение на GPU NVIDIA Tesla P100 с применением фреймоврка TensorFlow. Искусственный интеллект тренировался на 50 000 шумных изображений, взятых из базы ImageNet. Благодаря им ИИ научился определять шум и подобрал способы его устранения, правда, конечный снимок содержит немного меньше деталей и слегка мылит. Примечательно, что представленная технология также удаляет с фотоснимков и водяные знаки.

Research at NVIDIA: AI Can Now Fix Your Grainy Photos by Only Looking at Grainy Photos

Идея использования ИИ для очистки фотографий не нова. Ранее похожую систему представляла Google, однако всем им для обучения требовались снимки с шумами и без, и сделать их достаточное для обучения количество весьма проблематично. Представленный механизм Noise2Noise лишён этого недостатка. Его обучение проводилось исключительно на шумных снимках.

В любом случае, это всё пока наука, и до реальной очистки снимка прямо в смартфоне пока ещё очень далеко.

Искусственный интеллект может заметно улучшить качество тёмных снимков

Многие компании тяжело работают над созданием качественных камер для смартфонов. Сейчас всё больше людей отказываются от цифровых камер в пользу смартфонов, ведь они меньше и в хороших условиях делают не уступающие по качеству снимки.

Однако при плохом освещении дела обстоят намного хуже. Маленькие сенсоры смартфонов просто не могут получить достаточно света для качественного снимка, и, кажется, что телефоны недостижимо отстали от зеркальных камер. Конечно, сейчас при плохом освещении телефоны снимают несравнимо лучше, чем 3-4 года назад, но этого явно недостаточно. И чтобы решить проблему, инженеры придумали использовать искусственный интеллект.

Осветлённая ИИ фотография

Исследователи из Intel и Иллинойский университет в Урбана-Шемпейн показали, что машинное обучение может привести к значительному улучшению качества снимка в условиях низкой освещённости.

Чтобы решить проблему учёные создали движок, который обучил ИИ, сравнивая снимки, сделанные на короткой и длинной выдержке при низкой освещённости.

Как видно, результаты впечатляют. Со снимками в полном разрешении можно ознакомиться здесь.

Google использует ИИ для предсказания задержек авиарейсов

Информация о задержках авиарейсов весьма полезна, однако оглашение о задержках часто зависит от авиакомпании, и они не всегда заинтересованы в быстром обновлении сведений. Теперь в этом поможет Google.

Компания обновила свой сервис Flights, в котором не только стала сообщать о возможной задержке рейса, но и оценивать вероятность. Для этого система машинного обучения использует исторические данные для прогноза задержек и подсвечивает рейсы, если вероятность задержки составляет более 80%. При этом Google отмечает, что вам всё равно не стоит опаздывать на самолёт, ведь даже вероятность 99% не означает, что самолёт не улетит по графику. Зато такой прогноз может подсказать, сколько лишнего времени вам придётся провести в аэропорту.

Также обновлённый сервис Google поможет вам сэкономить на перелёте. Пока он работает для 3 авиакомпаний: American, Delta и United. Благодаря новым возможностям можно оценить стоимость дополнительных сервисов в лоу-кост тарифах, таких как увеличенная ручная кладь или перевес багаж, а также сравнить эти траты со стоимостью обычных билетов.

Google рассказала о втором поколении TPU

В ходе конференции Google I/O, организаторы продемонстрировали второе поколение тензорного процессора (TPU), который используется в искусственном интеллекте компании.

Новая модель процессора может быть использована как для обучения, так и для поиска взаимосвязей. А система из четырёх новых Cloud TPU обещает производительность системы машинного обучения на уровне 180 терафлопс. По словам Google, данный чип значительно производительнее решений на базе GPU, в связи с чем компания планирует предложить платформу Cloud коммерческим разработчикам.

Что касается производительности, то Google пояснила, что обучение большой модели языкового перевода занимает целый день на 32 топовых GPU. Та же работа длится 6 часов на одной восьмой кластера, или на 8 TPU.

Первое поколение TPU компания Google представила в 2015 году. Эти процессоры используются в широком спектре облачных сервисов компании, включая поиск, перевод и Google Photos.

Google TPU обрабатывает данные в 15 раз быстрее обычных компонентов

Два года назад компания Google создала собственную интегральную схему под названием Tensor Processing Unit, которая предназначена для вычислительной фазы задач машинного обучения.

Изначально компания сообщала, что TPU должен улучшить производительность на ватт в характерных задачах на величину до 10 раз, по сравнению с традиционными CPU и GPU. И теперь, получив опыт эксплуатации, фирма провела исследование влияния производительности чипов этого типа.

Оказалось, что 10-кратный прирост в энергоэффективность был слишком скромным. На самом деле производительность возросла от 30 до 80 раз по отношению к обычным решениям и в зависимости от сценария. Если говорить о прямой производительности, то по словам Google TPU в 15—30 раз быстрее стандартного аппаратного обеспечения.

На этом процессоре работает специальное программное обеспечение, основанное на фреймворке машинного обучения TensorFlow, и некоторая доля этого ускорения связана именно с этим фреймворком. Авторы исследования отметили, что у программистов ещё есть запас по оптимизации.

Компания Google увидела необходимость TPU ещё 6 лет назад. Глубинное обучение компания использует в разных проектах, включая поиск изображений, фотографий и перевод. По своей природе, машинное обучение довольно требовательный к ресурсом процесс. К примеру, инженеры Google отметили, что если бы люди использовали распознавание речи по 3 минуты в день, и она выполнялась бы без TPU, то компании пришлось бы удвоить количество центров обработки данных.

Google обеспечит голливудское увеличение изображения

Концепция улучшения пикселизованного изображения нам известна из многих голливудских фильмов, но, как и почти всегда, реальные технологии далеки от кино. Однако инженеры в Google Brain придумали способ приблизить фантастику к реальности.

Новая технология использует пару нейронных сетей, которые перерабатывают изображения 8x8 пикселей, чтобы воссоздать лицо человека, спрятанное за ним. Конечно, нейронные сети не увеличивают изображение без пикселизации, а создают новое, которое могло бы выглядеть как оригинал.

Как сказано выше, в процессе воссоздания лица участвуют две нейронные сети. Первая картирует изображение разрешением 8х8 точек в аналогично выглядящее изображение, но с большим разрешением. Это изображение используется в качестве скелета для второй сети, которая добавляет к картинке больше деталей на основе уже существующих изображений со сходными пиксельными картами. Затем полученные изображения двух сетей комбинируются, создавая конечную картинку.

Конечно, воссозданная картинка далека от реальности, так что эта технология бесполезна для спецслужб, однако пригодится при обработке снимков при необходимости экстремального увеличения.

Технология Google RAISR снижает трафик картинок вчетверо

Практически все тарифы мобильных операторов предполагают лимитированное использование трафика, и компания Google задалась целью заметно снизить потребление, разработав технологию сжатия изображений RAISR — Rapid and Accurate Image Super-Resolution (быстрое и точное изображение супер разрешения).

По сути, эта технология не является традиционным методом сжатия, она больше похожа на вид искусства, которым занимается система машинного обучения. Так, RAISR увеличивает эскизы изображений, полученные в меньшем разрешении, используя специальные алгоритмы машинного обучения. В конечном счете, искусственный интеллект восстанавливает отсутствующие детали, приводя изображение к оригинальному виду. В результате трафик при передаче изображений можно снизить на 75%, по сравнению с оригиналом, при сохранении большинства обозримых деталей.

Пока Google предлагает эту технологию лишь для сервиса Google+ и лишь для изображений, размещённых на сервисе. «В ближайшие недели» компания расширит сферу действия технологии и на другие свои сервисы.

Неизвестно, станет ли Google использовать эту технологию только для своих служб, или распространит её, как Brotli, однако нам, несомненно, хотелось бы увидеть её в работе таких загруженных изображениями сайтов, как социальные сети и онлайн магазины.

Искусственный интеллект Google придумал свой язык

Паниковать не стоит, но искусственный интеллект Google случайно (или не очень) создал свой собственный секретный язык. И этот язык был придуман нейронной машиной перевода (Neural Machine Translation — NMT) самостоятельно, без участия человека.

Новую нейронную машину перевода компания Google представила в сентябре, а внедрена она была совсем недавно. Новая система позволяет переводить предложения целиком, не деля его на части и лучше передавая смысл. Система NMT является самообучаемой, что значит, что она самосовершенствуется по мере работы.

Впервые система была использована для улучшения перевода с английского на корейский и обратно, а затем — с английского на японский и обратно. Инженерам было интересно посмотреть, сможет ли  машина переводить текст с корейского на японский без английского языка между ними. И ответ оказался «да», машина перевела текст напрямую.

Как Google AI добился этого немного не ясно. Оказалось, что NMT создал свой собственный внутренний язык «interlingua». Он оперирует концепциями и структурами предложений, а не эквивалентными словами. В результате, NMT создаёт более точные переводы, чем раньше. Создатели нейронного машинного переводчика не уверены в принципах работы нейронной сети и не могут сказать, каким образом осуществлено обучение прямому переводу между языками. Иными словами искусственный интеллект Google создал свой собственный язык, который мы, люди, не можем полностью понять.

Google Translate стал умнее

Компания Google уверяет, что ей удалось сделать машинный перевод более естественным, предложив его для смартфонов и веб приложения.

Поисковый гигант отметил, что теперь используется «нейронный машинный перевод», что позволяет переводить предложение целиком, вместо разделения его на части и дальнейшего перевода. В результате полученный текст оказывается более естественным, имеет лучший синтаксис и грамматику.

«За одно изменение было достигнуто больше улучшений, чем за все 10 лет», — заявил лидер продукта Google Translate Барак Туровски.

Кроме английского новая система перевода доступна ещё для восьми из 103 языков, поддерживаемых системой. Так, «нейронный» перевод поддерживает французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий языки. В компании отметили, что эти языки составляют 35% всех переводов, выполняемых сервисом. По информации Туровски, данный метод позволяет снизить ошибки на величину от 55% до 85%.

Разработана система обхода reCAPTCHA

Трое исследователей в вопросах безопасности из Колумбийского университета решили разработать систему, которая бы позволяла обходить систему CAPTCHA, внедрённую Google и Facebook.

Исследователи воспользовались большим числом факторов, разрабатывая атаку на систему, использовав множество способов обхода с использованием ключей и cookies, а также систем машинного обучения и распознавания изображений. В результате им удалось создать систему, обходящую капчи намного быстрее и точнее, чем в более ранних попытках.

Результаты оказались лучше, чем ожидалось. В системе Google reCAPTCHA успех составил 70,78% при распознавании 2235 изображений. Среднее время решения капчи составило 19,2 с.

На Facebook результаты получились ещё лучше. При распознавании более 200 капч уровень успеха составил 83,5%. Исследователи отмечают, что это произошло потому, что социальная сеть использует изображения с большим разрешением, которые легче распознать. У Google изображения низкого качества, что делает их автоматическое распознавание более трудоёмким.

Также исследователи оценили проведение их автоматизированных атак более экономично, по сравнению со службами ручного распознавания.

Они отметили, что если бы запустили свой сервис распознавания капч, то все атаки стоили бы 110 долларов в день за один IP адрес. За это время им удалось бы распознать 63000 капч без блокировки.

Перед тем как опубликовать результаты исследователи связались с Google и Facebook. После этого первая усложнила свою систему reCAPTCHA, а Facebook не дал ответ и не провёл никаких изменений.