游戏百科

机器之心的文章

老牌Transformer杀手在ICLR悄然更新:Mamba-3三大改进趋近完全体

老牌Transformer杀手在ICLR悄然更新:Mamba-3三大改进趋近完全体

老牌Transformer杀手在ICLR悄然更新:Mamba-3三大改进趋近完全体
VAE时代终结?谢赛宁团队RAE登场,表征自编码器或成DiT训练新基石

VAE时代终结?谢赛宁团队RAE登场,表征自编码器或成DiT训练新基石

VAE时代终结?谢赛宁团队RAE登场,表征自编码器或成DiT训练新基石
景不动人动,OST-Bench揭示多模态大模型在线时空理解短板

景不动人动,OST-Bench揭示多模态大模型在线时空理解短板

景不动人动,OST-Bench揭示多模态大模型在线时空理解短板
蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌
NeurIPS 25 | GRPO进阶版来了,GVPO重构大模型后训练范式

NeurIPS 25 | GRPO进阶版来了,GVPO重构大模型后训练范式

NeurIPS 25 | GRPO进阶版来了,GVPO重构大模型后训练范式
阿里高德提出Tree-GRPO,高效破解智能体RL难题

阿里高德提出Tree-GRPO,高效破解智能体RL难题

阿里高德提出Tree-GRPO,高效破解智能体RL难题
斯坦福、英伟达和伯克利提出具身Test-Time Scaling Law

斯坦福、英伟达和伯克利提出具身Test-Time Scaling Law

斯坦福、英伟达和伯克利提出具身Test-Time Scaling Law
OpenAI、Anthropic、DeepMind联手发文:现有LLM安全防御不堪一击

OpenAI、Anthropic、DeepMind联手发文:现有LLM安全防御不堪一击

OpenAI、Anthropic、DeepMind联手发文:现有LLM安全防御不堪一击
100美元、8000行代码手搓ChatGPT,Karpathy最新开源项目爆火

100美元、8000行代码手搓ChatGPT,Karpathy最新开源项目爆火

100美元、8000行代码手搓ChatGPT,Karpathy最新开源项目爆火
刚刚,OpenAI官宣自研造芯,联手博通开发10吉瓦规模的AI加速器

刚刚,OpenAI官宣自研造芯,联手博通开发10吉瓦规模的AI加速器

刚刚,OpenAI官宣自研造芯,联手博通开发10吉瓦规模的AI加速器
蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
LLaVA-OneVision-1.5开源,8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5开源,8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5开源,8B模型预训练只需4天、1.6万美元
GeoSVR:稀疏体素的新潜力——超越3DGS系列的高精度三维表面重建

GeoSVR:稀疏体素的新潜力——超越3DGS系列的高精度三维表面重建

GeoSVR:稀疏体素的新潜力——超越3DGS系列的高精度三维表面重建
改变强化学习范式,Meta新作呼应Sutton「经验时代」预言

改变强化学习范式,Meta新作呼应Sutton「经验时代」预言

改变强化学习范式,Meta新作呼应Sutton「经验时代」预言
「微调已死」再添筹码,谷歌扩展AI自我进化范式,成败双向学习

「微调已死」再添筹码,谷歌扩展AI自我进化范式,成败双向学习

「微调已死」再添筹码,谷歌扩展AI自我进化范式,成败双向学习