[ Детали ] Вакансия
ML-инженер (Online RL) / Post-Training LLM
Сбер
Описание вакансии
Разрабатывать и улучшать методы online RL, строить и развивать инфраструктуру обучения, работать с данными и системой оценки качества.
Технологический стек
pythonpytorch
Как откликнуться
Эта вакансия опубликована в одном из Telegram-каналов, которые мониторит JobTurbo. Вы можете откликнуться напрямую по ссылке ниже — или настроить автоотклик на HH.ru и аналогичные вакансии будут откликаться автоматически.