Microsoft откроет исходный код оптимизированной модели BERT

Команда Microsoft Research AI объявила,
что планирует открыть исходный код оптимизированной версии модели Google BERT, созданной для работы с движком
ONNX Runtime.

В настоящее время использование ONNX Runtime позволяет
сократить задержки в работе BERT
при реализации языкового представления для поисковой системы Bing.

Теперь разработчики смогут внедрять BERT, используя ONNX Runtime и
графический процессор Nvidia V100
с задержкой всего лишь 1,7 миллисекунды, что ранее было доступно только для
крупных технологических компаний.

Оптимизированная модель Google BERT, созданная Microsoft, является результатом сотрудничества между командами Azure AI и Microsoft Research AI.

Подробнее об открытом обмене нейронными сетями (ONNX) можно прочитать здесь.

Напомним, что Google объявил о запуске BERT Update, который помогает поисковой системе лучше понимать запросы на естественном языке, в октябре минувшего года. При этом Bing начал использовать подобные BERT модели ещё в апреле 2019 года.

По материалам: www.searchengines.ru