Смотреть видео: Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexG