练习两天半,教你如何使用verl的multi-turn tool agent(agent训练开发必备,顶会在向你招手),从数据处理、配置文件修改到源码debug

猜你喜欢
返回顶部