Online RL (General) / Post-Training LLM

Сбер
700 000 – 1 300 000 ₽ Удалённо Россия Опубликовано 19 ч назад

Описание вакансии

Развивать направление online RL для general-сценариев, разрабатывать и улучшать методы обучения, писать ключевой код и развивать инфраструктуру. Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов.

Технологический стек

pythonpytorch

Как откликнуться

Эта вакансия опубликована в одном из Telegram-каналов, которые мониторит JobTurbo. Вы можете откликнуться напрямую по ссылке ниже — или настроить автоотклик на HH.ru и аналогичные вакансии будут откликаться автоматически.