🦄aj九游会官网【极速线路】进入【欧洲杯官方合作网站】华人市场最大的线上娱乐服务供应商这要归功于一支不成想议的团队的粗重责任-九游会J9·(china)官方网站-真人游戏第一品牌
发布日期:2025-08-07 10:59 点击次数:81
2 月 16 号🦄aj九游会官网【极速线路】进入【欧洲杯官方合作网站】华人市场最大的线上娱乐服务供应商,马斯克在 X 上发布了一条自家 Grok 3 模子的发布预报。
并配文"地球上最聪慧的 AI "要来了。
北京本领 2025 年 2 月 18 日中午,马斯克如约指导着 xAI 的工程师和辩论团队开启了 Grok 3 的首发直播。
此次发布会主要分为三个部分,先容了 Grok 3 在考验上比 Grok 2 多过问了 10 倍的算计资源,解锁了更强盛的算计才能,展示了基于 Grok 3 的 AI Agent,展现了 xAI 团队在自主智能体边界的最新进展。
各项才能一骑绝尘
"咱们极度餍足大略推出 Grok3,咱们以为,在很短的本领内,它的功能比 Grok2 强盛一个数目级。这要归功于一支不成想议的团队的粗重责任,我很庆幸能与这么一支优秀的团队合营。"马斯克在发布会上说谈。
马斯克还裸露,Grok 3 由 Colossus 超等算计机考验完成,这台算计机是在短短八个月内建成的,搭载了 10 万颗英伟达 H100 GPU,提供了高出 2 亿 GPU 小时的算计资源——是 Grok 2 的 10 倍。
据 xAI 团队先容,xAI 最开动搭建这个 10 万 GPU 集群用了 122 天,后续拓展到 20 万 GPU 集群仅用了 92 天。显贵的算力素养让 Grok 3 大略更高效地处理浩大数据集,缩小考验本领。立时他们便晒出了一组和 ChatGPT 的数据对比图,并示意天然 Grok 起步较晚,但在 MMLU 得分上以超快地速率追上了 ChatGPT。
何况 Grok3 在 LMSYS(大模子竞技场)中的名次亦然一骑绝尘。
其中 Grok-3 和 Grok-3 mini 在多方面性能上齐高出或比好意思 Gemini、DeepSeek 和 ChatGPT 等敌手。
发布会列出的数据娇傲,Grok-3 和 Grok-3 mini 在数学、科学和编程的基准测试中,推崇越过了所有这个词主流模子,包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro 等。
而 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 这两个版块,则凭借强盛的推理才能,越过了像 DeepSeek-R1 和 OpenAI o3 mini 等推理模子。
此外,xAI 团队还现场演示了一个任务,条目 Grok-3 在现场生成一段对于天际辐照的 3D 动画代码。在轻便两分钟的想考后,Grok 3 生成了可平直运行的 Python 代码,得胜展示了不错运行的 3D 动画。
除此以外团队还条目 Gork-3 制作一款相同于俄罗斯方块和坚持迷阵的游戏。在 Grok-3 想考了数分钟后,给出了谜底。
临了,xAI 团队演示了一个全新的产物,基于 Grok 3 的搜索引擎 —— DeepSearch 。
它不仅大略搜索网页并查找现存贵府,还能"推测用户的着实意图"并进行想考。通过交叉对比多个信息源,它大略确保"复返最准确的谜底"。
Grok 3 搅拌 AI 大模子容颜
直播放胆后,不少网友纷繁发声。
AI 大牛卡帕西回归了一下我方的"先行版"使用体验:
最初 Grok 3 的"想考"功能极度先进,大略出色地措置复杂问题,如创建《卡坦岛》立场的棋盘游戏网页。比拟之下,其他顶级模子(如 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude)未能措置交流问题。除此以外,Grok 3 也能尝试措置如黎曼假定等辛苦。
其次 Grok 3 还具备相同"深度辩论"的搜索功能,大略提供高质地的辩论问题谜底。举例,它大略回复 Apple 新品发布、Palantir 股价高涨等问题。但在某些情况下,它会额外地产生幻觉(如额外的 URL 或不准确的事实)。
临了在测试一些浅近的"罗网"问题时,Grok 3 推崇考究,大略正确回复一些逻辑谜题。但在幽默停战德问题方面,它仍然存在一些问题,如生成叠加见笑和对复杂伦理问题过于敏锐等。
但总的来说 Grok 3 合座推崇接近 OpenAI 的 o1-pro 模子,并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。
Imarena.ai 官方更是在历程测试后发文称:
Grok-3 是首个打破 1400 分的模子,在所有这个词类别中名步骤一,这是一个越来越难以完了的里程碑。
更有网友直呼:Grok 3 可能是践诺宇宙中在物理层面处理得最佳的基础空话语模子了!天然也有网友在测试之后,以为 Grok 3 在编程方面并不是很擅长。
值得一提的是,Grok 3 第一批取得拜谒权限的东谈主将最初从 X 上的 Premium+ 订阅者开动,而庸俗用户何时能用上,他们也并不明晰。
但基于网友们对 Grok 3 驳倒不一的评价,雷峰网不禁猜测,这被 "钞才能" 重振旗饱读砸出来的的 " no.1 " 在权限全面放开之后会不会口碑南北极回转,亦或是依旧好评如潮,稳坐 AI 大模子王座?
本领还早,让枪弹再飞一会。
参考聚合:https://x.com/i/broadcasts/1gqGvjeBljOGB?t=SX_aTsBoXc07lfSR_Aw8AQ&s=09🦄aj九游会官网【极速线路】进入【欧洲杯官方合作网站】华人市场最大的线上娱乐服务供应商