Grok4比DeepSeek强吗太炸裂了,就在昨天被马斯克夸下海口能重写整个人类

依瑶搞笑 2025-07-11 18:19:27

Grok4比DeepSeek强吗太炸裂了,就在昨天被马斯克夸下海口能重写整个人类知识库的Grok-4来了。

Grok-4在HLE(人类终极考试)得分高达45,全球第一,是上一代最强的谷歌相关模型的2倍。HLE横跨一百多个学科,包含近3000道由全球专家联合打造的高难度试题,专为挫败大模型锐气而设计,答题时不允许AI联网,只能依靠自身理解和推理能力。

Grok-4拿下高分,意味着它闯过了AI测试领域最难的关卡之一。

其数学能力更是惊人,在AIME竞赛题中直接达到满分水平,吊打人类博士。用马斯克的话讲,Grok-4就是世界上最聪明的人工智能。

马斯克的第一性原理出现在了AI模型上,这使得AI显现出人类级别的创新思考能力,这是Grok-4最大的突破,也是能拿到HLE高分的核心基础。

例如,当Grok-4被要求优化火箭发动机时,它会结合热力学定律和材料学原理推导出全新设计方案,而非依赖现有人类知识从数据库抄袭;当其他AI模型还在用来源可疑的数据“一本正经说瞎话”时,Grok-4能从物理、化学等自然科学基础原理出发,形成互联网上从未有过的原创解答,不依赖任何现有知识框架和行业标准。

未来,人类科技中大量需要创新解决方案的难题,Grok-4或许都能提供新的解决思路。

按照马斯克的设想,Grok-4具备的高级推理能力将用来重写整个人类知识库,包括添加缺失信息、删除错误内容等,再基于这个“纯净版”知识库重新训练模型自身。

同时,Grok-4主动强化了自由发言倾向,允许基于自我理解对争议性话题发表看法,并新增50万条争议话题的平衡语料库,用来减少人类彼此的偏见。但这一举措也引发了伦理争议。

总的来说,Grok-4不仅是一次AI产品和技术的革新,还可能引发科技、社会、经济、文化等多层面的蝴蝶效应。人工智能的终点还有多远?人类未来会因它发生什么变化?你觉得呢?[吃瓜]ai生活指南

0 阅读:7

猜你喜欢

依瑶搞笑

依瑶搞笑

感谢大家的关注