马斯克Grok 41双冠封王爆冲第一！AI王座一夜易从

发布时间：

2026-02-07 10:33

　　现在， Grok 4。1已正在网页端和iOS、Android中免费上线。目前，仍是beta版本。

　　取此同时，Grok 4。1的全体人格愈加分歧，既连结了上一代那种犀利、靠得住的智能表示，又添加几分亲和力。

　　我之前一曲用的是Linux系统和xmonad。现正在想正在Mac上找一个雷同的平铺式窗口办理器，请问哪一款的气概和xmonad最接近？

　　前两周的时间，xAI悄然推送了Grok 4。1晚期版本，并正在实正在场景中展开稠密的「盲测」成对评估。无需利用思虑Token就能立即响应，拿下了1465 Elo，位居第二。

　　利用搜刮东西的快速（非推理）模子能给出迅捷谜底，但由于推理深度无限、东西挪用次数受限，容易正在现实问题上犯错。

　　正在Colossus大规模RL算力引擎上，xAI将沉点放正在了气概、个性、帮人程度和对齐性的优化。

　　具体来说，进行3轮创做，并按照打分尺度和模子对和Elo进行评分。

　　Grok 4。1之所以能够迅大进化，xAI团队将其后锻炼阶段的RL规模，又扩大了一个数量级。

　　【新智元导读】AI新王来了！马斯克Grok 4。1寂静上线，一夜之间登顶LMArena，Gemini 2。5 Pro却被按正在地上摩擦。算力又扩增一个数量级。

　　团队基于实正在流量平分层抽样的消息查扣问题评估率，同时也评测了FActScore（一个包含500小我物列传问题的公开基准）。

　　为此，他们还开辟了一条全新的方式，操纵前沿AI 智能体推理模子做为励模子，从动、大规模评估和优化Grok 4。1回覆质量。

　　同时，Grok 4。1（1722）比上一代Elo提拔600分。并且，率比之前模子暴降3倍。

推荐新闻

2026-02-05

2026-02-03

地址：江西省德安县高新技术产业园(宝塔工业园)高新路93号

营业执照

品牌产品