ML-инженер (Эффективный рантайм и инференс)

Т-Банк
от 250 000 ₽ Удалённо Middle Москва Опубликовано 16 ч назад

Описание вакансии

Оптимизировать производительность моделей машинного обучения, работать с фреймворками для ускорения вычислений, писать производительный низкоуровневый код на C++. Т-Банк — онлайн-экосистема с 50 млн клиентов по всей России.

Технологический стек

pytorchjaxtensorflowtensorrttrt-llmtriton inference server

Как откликнуться

Эта вакансия опубликована в одном из Telegram-каналов, которые мониторит JobTurbo. Вы можете откликнуться напрямую по ссылке ниже — или настроить автоотклик на HH.ru и аналогичные вакансии будут откликаться автоматически.