【[77星]Tool-Star:通过强化学习为LLM驱动的多工具推理器赋能。亮点

爱生活爱珂珂 2025-05-27 13:29:31

【[77星]Tool-Star:通过强化学习为LLM驱动的多工具推理器赋能。亮点:1. 集成六种推理工具,提升复杂任务处理能力;2. 提供54K SFT数据集和10K RL数据集,助力模型训练;3. 支持多种开源模型,如Qwen2.5-3B-Instruct,适用性广泛】

'Tool-Star: Empowering LLM-brained Multi-Tool Reasoner via Reinforcement Learning'

GitHub: github.com/dongguanting/Tool-Star

多工具推理 强化学习 LLM优化 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注