Команда Microsoft Research AI объявила,
что планирует открыть исходный код оптимизированной версии модели Google BERT, созданной для работы с движком
ONNX Runtime.
В настоящее время использование ONNX Runtime позволяет
сократить задержки в работе BERT
при реализации языкового представления для поисковой системы Bing.
Теперь разработчики смогут внедрять BERT, используя ONNX Runtime и
графический процессор Nvidia V100
с задержкой всего лишь 1,7 миллисекунды, что ранее было доступно только для
крупных технологических компаний.
Оптимизированная модель Google BERT, созданная Microsoft, является результатом сотрудничества между командами Azure AI и Microsoft Research AI.
Подробнее об открытом обмене нейронными сетями (ONNX) можно прочитать здесь.
Напомним, что Google объявил о запуске BERT Update, который помогает поисковой системе лучше понимать запросы на естественном языке, в октябре минувшего года. При этом Bing начал использовать подобные BERT модели ещё в апреле 2019 года.