ML-инженер (Online RL) / Post-Training LLM

Сбер
350 000 – 550 000 ₽ Удалённо Россия Опубликовано 2 ч назад

Описание вакансии

Разрабатывать и улучшать методы online RL, строить и развивать инфраструктуру обучения, работать с данными и системой оценки качества.

Технологический стек

pythonpytorch

Как откликнуться

Эта вакансия опубликована в одном из Telegram-каналов, которые мониторит JobTurbo. Вы можете откликнуться напрямую по ссылке ниже — или настроить автоотклик на HH.ru и аналогичные вакансии будут откликаться автоматически.