【[77星]Tool-Star:通过强化学习为LLM驱动的多工具推理器赋能。亮点:1. 集成六种推理工具,提升复杂任务处理能力;2. 提供54K SFT数据集和10K RL数据集,助力模型训练;3. 支持多种开源模型,如Qwen2.5-3B-Instruct,适用性广泛】
'Tool-Star: Empowering LLM-brained Multi-Tool Reasoner via Reinforcement Learning'
GitHub: github.com/dongguanting/Tool-Star
多工具推理 强化学习 LLM优化 AI创造营