【[43星]picoDeepResearch:一个开源的“迷你版”深度研究框架,让语言模型通过工具使用和强化学习生成高质量的研究报告。亮点:1. 模拟OpenAI深度研究,用“竞技场”模式训练模型;2. 支持多轮工具调用,提升模型信息获取能力;3. 仅需Python 3.10+环境,快速上手】
'picoDeepResearch: A Framework for Training LLM Agents with Tool Use and GRPO'
GitHub: github.com/brendanhogan/picoDeepResearch
开源框架 强化学习 语言模型 AI创造营