【国金计算机孟灿/李忠宇团队】 🤖AI新闻周报|2025Week18

丹萱谈生活文化 2025-05-11 15:11:56

【国金计算机孟灿/李忠宇团队】 🤖AI新闻周报 | 2025 Week 18 🌟 国内AI要闻 阿里开源 Qwen3 系列模型,DeepSeek 开源 Prover-V2 强推理模型 1⃣4月29日,阿里通义千问团队近日开源 Qwen3系列模型,Qwen3 在一个模型中整合了「快思考」与「慢思考」能力,具备混合推理模式、多语言支持和优化的智能体能力,多项能力表现优于 DeepSeek R1和 OpenAl-o1 等领先模型。该模型包含两款 MoE 模型以及六款稠密模型,可在Hugging Face、ModelScope 和 GitHub 等平台免费下载并商用。 2⃣5月1日,DeepSeek近期开源了其数学推理模型DeepSeekProver-V2,该模型专注于形式化定理证明任务,基于数学编程语言 Lean 4 开发。研究团队还发布了 ProverBench 基准数据集,用于评估模型在不同难度数学问题上的表现。实验结果显示,DeepSeek-Prover-V2-671B在MiniF2F-test 上的通过率为88.9%,并在PutnamBench 数据集中解决了 49 道题目。 🌟 海外AI要闻 OpenAl 更新 GPT-4o后回滚,并任命新 CEO,Cursor团队完成9亿美元融资,Google DeepMind 发布 Gemini 2.5 Pro 1⃣4月27日,OpenAl近期对 GPT-4o模型进行了多项升级,重点提升模型的智力水平、个性表达以及对话引导能力,旨在优化用户体验并拓展模型的应用场景。4月30日,由于发现 GPT-4o「过于谄媚」的问题,OpenAl 回滚了最新版本的 GPT-4o。5月8日,OpenAl 宣布任命 Fidii Simo 为应用 CEO,向山姆奥特曼直接汇报。山姆·奥特曼将继续担任 OpenAICEO但未来将专注于研究、算力与安全。 2⃣5月6日,AI 编程工具 Cursor 的母公司 Anysphere 近期完成了一轮 9 亿美元的融资,其估值增长至约90 亿美元。该轮融资由 Thrive Capital 领投,a16z、Accel等风投公司参投。Anysphere 计划利用本轮融资加速技术研发,优化 AI模型,并进一步拓展企业级市场和全球业务。 3⃣5月7日,Google DeepMind 近日发布了 Gemini 2.5 Pro的更新版本 Gemini 2.5 Pro (l/O edition),该版本在编程能力上有所提升。在编程能力方面,用户可以通过单一提示词生成完整的Web 应用、游戏或模拟程序,能够基于手绘草图和功能描述自动生成带有自定义 U的应用程序,该版本同样具备将自然图像转换为动态代码的能力。除了编程能力的提升,Gemini 2.5 Pro 在多模态推理和长上下文理解方面仍保持优势。用户实测显示,该模型能够快速生成功能完整的应用,例如记忆配对游戏、星球飞行模拟、书架管理系统以及3D 虚拟博物馆等。

0 阅读:42
丹萱谈生活文化

丹萱谈生活文化

感谢大家的关注