Новости про open-source

Проект Moziila по распознаванию речи набрал 20 000 часов контента

Организация Moziila сообщила, что набор данных проекта Common Voice превысил 20 000 часов контента, что позволяет кому угодно на планете создавать собственное ПО для распознавания речи.

За год объём этих данных увеличился вдвое. Последний добавленный набор данных для английского языка составляет гигантские 71 ГБ, а поддержка языков выросла ещё сильнее. Теперь к списку добавились такие редкие языки, как тигре, тайваньский (миннан), марийский, бенгальский, токипона и кантонский.

Mozilla Common Voice

По информации Mozilla, проект Common Voice важен, поскольку позволяет каждому вложить свой голос в его развитие, чтобы позволить виртуальным помощникам лучше понимать акценты. В дополнение, крупные технологические компании становятся не единственными держателями больших объёмов данных, что позволяет мелким разработчикам создавать собственные конкурентные продукты в сфере распознавания речи.

Среди важных изменений в свежем наборе данных Common Voice компания Mozilla отметила поддержку новых шести языков (перечислены выше); 27 языков, которые теперь имеют более 100 часов начитки (бенгальский, тайский, баскский, кантонский); 9 языков с более чем 500 часов начитки (киняруанда, каталанский и суахили).

Если вы хотите внести свой вклад, то это можно сделать на сайте проекта. Вам будет предложено прочитать текст, или послушать его и дать собственную оценку его правильности.

Microsoft открыла исходный код языка Power Fx

В марте этого года компания Microsoft официально представила новый малокодовый язык программирования для платформы Power Platform.

Этот язык получил название Power Fx. Он позволяет клиентам Power Platform создать и построить логику приложений в малокодовом окружении. По сути, подход к программированию похож на применяемый в Excel.

Позднее, в мае, компания объявила об интеграции языка с моделями OpenAI GPT-3, что позволило использовать для расчётов естественные языки, вместо сложных формул.

Microsoft Power Platform

При этом Microsoft открыла документацию к языку, планируя открыть в будущем сам исходный код, и вот, это свершилось. Отныне исходный код проекта Power Fx доступен на GitHub.

Проект выложен под лицензией MIT, а вносить изменения в него можно, если согласиться с лицензией Microsoft Contributor License Agreement (CLA), которая позволит компании применять внесенные изменения в своих продуктах.

Открытое ПО имеет проблемы с безопасностью

Похоже, что идея безопасности открытого ПО по сравнению с проприетарным, является несостоятельной.

Согласно исследованию «Тёмная реальность Open Source», опубликованному RiskSense, за последний год количество уязвимостей в 54 самых популярных проектах с открытым исходным кодом удвоилось. В 2019 году исследователи выявили 968 ошибок, а в 2018 — 421.

За период с 2015 по март 2020 года было выявлено 2694 ошибки в популярных проектах с открытым исходным кодом. Исследование не включало такие проекты как Linux, WordPress, Drupal, поскольку к ним привлечено огромное внимание и ошибки в их безопасности исправляются очень быстро.

Исследователи обратили внимание на другие популярные проекты, которые не так широко известны, но имеют огромную поддержку технологического и программистского сообществ. К ним относятся Jenkins, MongoDB, Elasticsearch, Chef, GitLab, Spark, Puppet и другие.

Компания отметила, что основной проблемой, выявленной при исследовании, было то, что большое количество найденных ошибок в безопасности, были переданы в национальную базу данных уязвимостей (National Vulnerability Database) через много недель после их публичного открытия. Исследователи отметили, что в среднем между нахождением ошибки и передачей её в NVD проходило 54 дня. Рекордсменом стал проект PostgreSQL, в котором передача сведений об уязвимости заняла 8 месяцев.

Khronos хочет стандартизировать трассировку лучей

В настоящее время в мире существует лишь одна игра, обеспечивающая трассировку лучей посредством Vulkan. Это Wolfenstein Youngblood. Ещё есть Quake II RTX, которая не продаётся в рознице. Проблема заключается в том, что API Vulkan не имеет официальной поддержки трассировки. Компания NVIDIA подготовила специальное расширение своего эксклюзивного аппаратного решения, но оно не мультиплатформенное, которое обеспечивается Microsoft DXR (DirectX Raytracing).

Для решения проблемы Khronos Group планирует провести обсуждение «Трассировка лучей в Vulkan» в ходе GDC 2020 с инженерами всех трёх игроков на рынке графики: AMD, Intel и NVIDIA. Как будет реализована поддержка трассировки лучей, Khronos пока не сообщает. Однако учитывая, что недавно Khronos принял Vulkan 1.2, можно допустить, что будет реализовано видение DXR от Microsoft. Дело в том, что Vulkan 1.2 уже поддерживает HLSL (язык шейдеров DirectX) с поддержкой Shader Model 6.2. Версия Shader Model 6.3 выйдет с кодом DXR HLSL, и именно этот код может быть применён для реализации трассировки лучей в Vulkan.

Vulkan 1.2

Почему Khronos идёт таким путём? Ответ прост. Чтобы обеспечить мультиплатформенность игр, которые смогут появиться в консоли Microsoft Xbox Series X, где применяется рендер DirectX 12. Такая совместимость заметно упростит разработку игр и сделает их если и не полностью совместимыми, то хотя бы легко адаптируемыми.

GitHub готовит хранилище кода в Арктике

На фоне постоянного ускорения технологий мы практически перестали сохранять информацию для потомков. И некто задался вопросом, а что если все наши разработки исчезнут без следа? По этой причине GitHub решил открыть подземное хранилище в условия вечной мерзлоты — GitHub Arctic Code Vault.

Второго февраля GitHub сделал образ всех активных общественных репозиториев, которые он сохранит в убежище. В них входят все репозитории с минимум 250 звёздами, независимо от времени их последнего редактирования. Также в хранилище попадёт код, в который внесены изменения в период между 13 ноября 2019 года и 2 февраля 2020, а также все изменённые за год репозитории с минимум одной звездой.

Хранилище Arctic World Archive

Строительство Arctic Code Vault будет длиться около двух месяцев. Весной его направят в Савльбард, норвежский архипелаг в Северном Ледовитом океане, где и поместят его под землю в Arctic World Archive. Целью проекта является сохранение открытого исходного кода для будущих поколений. Для этого данные записывают на кадры плёнки из галогенида серебра по 8,8 миллионов пискселей на каждом. Эти кадры могут храниться более 1000 лет. Для сравнения, нынешние жёсткие диски и CD пригодны для хранения данных в течение нескольких десятилетий.

Arctic World Archive — это специальное место, предназначенное для хранения данных. Оно расположено рядом с Svalbard Global Seed Vault, хранилищем семян, защищающем наши растения от внезапного уничтожения. Архив находится на глубине 150 м внутри заброшенной угольной шахты внутри горы. А поскольку это зона вечной мерзлоты, температура внутри шахты всегда держится ниже нуля.

GitHub Arctic Code Vault

Вместе с данными в хранилище будут помещены также инструкции по их восстановлению и схема с их размещением. Возможно, историки будущего найдут эти сведения интересными.

Free Software Foundation «требует» открыть код Windows 7

Организация Free Software Foundation (FSF), та же группа, что стояла за кампанией против использования Windows 7 в 2009 году, обвиняя ОС во всех грехах, начала новую инициативу, требованием которой является открытие этой же операционной системы.

Группа FSF запустила петицию по «переработке Windows 7» с фактическим требованием сделать её бесплатной и открытой.

«14 января Windows 7 официально достигла конца жизненного цикла, завершив обновления, а также десятилетие токсичного образования, внедрения в приватность и пользовательских угроз. Конец жизненного цикла Windows 7 даёт Microsoft отличную возможность исправить прошлые ошибки и использовать её повторно», — говорится в петиции.

Повторное использование Windows 7

Конечно, большинство пользователей согласится, что как раз Windows 7 и исправляет прошлые ошибки Microsoft, допущенные в Windows Vista. Тем не менее, дальше петиция требует от компании выпустить Windows 7 в качестве бесплатного ПО, для «изучения и улучшения». Данная петиция повторяет идею Microsoft Calculator, который появился на GitHub, и уверяет, что таким шагом Microsoft «ничего не потеряет», поскольку срок жизни системы уже прошёл.

На самом же деле им есть что терять. Не смотря на статус, правительственные организации многих стран продлили техническую поддержку до 2023 года, и стоило это не мало. Кроме того, огромные части кода в виде наследства перешли в Windows 10, и разработчикам явно не захочется их раскрывать. Так что, скорее всего, открытия кода Win 7 мы не дождёмся ещё очень долго.

Калькулятор Windows получит режим построения графиков

После того, как компания Microsoft открыла исходный код своего калькулятора для Windows, многие разработчики GitHub решили присоединиться к расширению функционала приложения.

Из более чем 30 предложенных сообществом изменений, инженеры компании пока выбрали одно под названием «Графический режим». Как гласит название, этот режим позволит строить графики на основе математических функций, подобно тому, как это происходит в Matlab. Конечно, в калькуляторе всё будет намного проще.

Графический режим калькулятора Windows

Предложение было внесено инженером компании Дэйвом Грочоки, который также входит в команду Windows Calculator. По его словам, данны режим позволит школьникам более эффективно изучать алгебру.

Epic Games сворачивает разработку Unreal Tournament

Компания Epic Games объявила о том, что было понятно давно. Студия сообщила, что приостанавливает разработку Unreal Tournament.

Последний выпуск будет бесплатным и доступным в игровых онлайн магазинах. При этом игра не будет обновляться. Игра Unreal Tournament по-прежнему находится на этапе пред-альфа тестирования.

Данную информацию сообщил исполнительный директор Epic Games Тим Свини. Также он сообщил, что некоторые старые игры будут продаваться через GOG.com.

Unreal Tournament

В своём интервью Свини отметил, что «Unreal Tournament оставалась доступной в магазине, но активно не разрабатывалась. Недавно мы работали с GOG над выпуском классических игр Epic Games, и мы планируем выпустить в магазин их большее количество, во всей их оригинальной славе».

Игра Unreal Tournament стала девятым воплощением франчайза, созданного Epic Games и Digital Extremes в 1999 году. Последний вариант шутера был анонсирован в 2014 году как вариант с открытым исходным кодом. Однако успех Fortnite привёл к тому, что разработчики полностью переориентировались на этот проект.

Последнее обновление Unreal Tournament получила в 2017 году.

NVIDIA использует ИИ для отрисовки реального мира

Компания NVIDIA сообщила, что её новая модель искусственного интеллекта позволяет отрисовывать новые миры без использования традиционного моделирования или рендера с применением графического движка.

Для этого компания использует глубокое обучение нейронной сети, которая анализирует существующее видео, а затем применяет эти элементы окружения в новой трёхмерной среде.

Хотя компания уверяет, что её новая технология может обеспечить революционный прорыв в создании 3D миров, с технологией ещё есть ряд проблем. Она позволяет автоматически создавать здания, деревья, транспорт и объекты в трёхмерном мире вместо рутинного процесса моделирования элементов сцены, однако результат ещё далёк от идеала.

Рендер с помощью ИИ NVIDIA

На картинке, изображение справа сгенерировано искусственным интеллектом на карте NVIDIA Titan V с применением тензорных ядер. И выглядит она довольно блеклой и холодной. Однако эта сцена генерируется в реальном времени, и выглядит всё равно лучше рисованной сцены.

Кроме этого компания использует технологию для моделирования движений, например, танцевальных, и накладывания их на других персонажей в реальном времени. Это значит, что создание фейковых видео становится вполне реальным.

Research at NVIDIA: The First Interactive AI Rendered Virtual World

В NVIDIA предупреждают, что продукт пока не готов, но в будущем он предлагается для улучшения качества старых видеоигр. Этот проект имеет открытый исходный код, так что каждый может присоединиться к улучшению технологии.

NVIDIA открывает исходный код PhysX

Физический движок NVIDIA PhysX получает лицензию открытого кода. По словам NVIDIA это сделано в связи с большой важностью этого движка в описании процессов различных отраслей, от ИИ до вычислений.

По этому случаю в компании заявили, что строили движок более 10 лет, постоянно вкладывая в него ресурсы, чтобы симулировать мир с максимальной точностью, с непрекращающимися исследованиями и разработками, чтобы отвечать требованиям людей, работающих в индустриях робототехники и автопилотируемых автомобилей.

NVIDIA PhysX

Технология PhysX позволяет решать ряд проблем:

  • В ИИ исследователям нужны искусственные данные, искусственное воплощение реального мира для обучения нейронных сетей.
  • В робототехнике исследователям нужно обучать разум роботов в окружении, будто они работают с настоящими объектами.
  • Для самоуправляемых автомобилей PhysX предоставляет транспортным средствам миллионы миль симуляции, повторяющей реальные условия.
  • В разработке игр жестяная анимация не выглядит органично, и технология позволяет вывести её на новый уровень.
  • В высокопроизводительных расчётах эмуляция физики выполняется на мощнейших машинах, обеспечивая превосходный уровень точности.

Технология NVIDIA PhysX уже находится в открытом виде и распространяется под простой лицензией BSD-3.