2月18日中午 美-太平洋时间 19:00, 马斯克的 xAI举行了Grok 3 的直播发布会,超过500万人在线观看,马斯克发文称赞其为“地球上最聪明的人工智能”,“聪明到让人感到可怕”。

如果想使用的话需要前往官网,目前免费账号默认是 Grok 2模型,Grok 3 大模型很快会向所以免费用户开放使用!

Grok 3 官网:https://grok.com


发布会上演示显示,在数学推理、科学逻辑推理等多方面的性能表现上,Grok3和Grok-3 mini都超过或媲美Gemini、DeepSeek和ChatGPT等对手,此外xAI还推出功能更为强大的Grok3 Thinking推理模式(自动纠错)

除了计算能力方面,在理解力和创造力方面,Grok3也表现同样出色。演示包括实时解决复杂的物理问题,例如绘制行星际轨迹,构思视频游戏……

马斯克透露,Grok-3最佳体验“大约一周之后”,语音交互功能还在开发中,一周后用户就可以拥有对话体验,并且X上的Premium Plus用户,将是首批获得访问权限的群体,同时用户也可以通过Super Grok单独订阅服务。

并且为了支持Grok3训练,xAI在短短三个月将数据中心训练集群翻倍20万块GPU,并且xAI与戴尔达成50亿美元协议,戴尔或将今年向xAI交付搭载英伟达GB200芯片的服务器。


地球上最聪明的AI

据悉,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。据悉,目前Grok 3已经在内部稳定运行了两周。

工程师介绍,虽然Grok起步较晚,但在MMLU得分上以超快地速度追上了ChatGPT!

马斯克及其团队表示,Grok 3也将具有类似DeepSeek R1和OpenAI o3 Mini的推理能力大约一个月前,Grok 3的预训练已经完成,从那时起其一直在努力将推理能力融入Grok 3模型中。Grok 3推理迷你版的训练时间更长,表现略优于Grok 3推理模型,这表明Grok 3推理模型具有巨大的潜力。

从各项指标来看grok 3一举超越所有模型,排名世界第一,有推理模式,有deep research功能


具体演示来看,Grok3现场为太空发射生成动画3D图,展现了其理解复杂物理知识的能力。

马斯克团队输入提示要求,要求Grok-3现场生成代码,运行代码后画面上显示出了飞船在地球和火星间往返的动画。

另一段演示中,Gork-3制作一款类似于俄罗斯方块和宝石迷阵的游戏,展现了其出色的创造力

xAI通过修改 Grok3的训练过程(而不仅仅是硬件改进)为Grok3实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习,以提高其性能


xAI与戴尔达成50亿美元协议,三个月将数据中心容量翻倍

xAI即将与戴尔科技达成协议收购价值超过50亿美元的配备英伟达GB200芯片的AI优化服务器,旨在满足Grok 3和其他AI应用程序日益增长的计算需求。

若达成交易,戴尔将今年向xAI交付搭载英伟达GB200芯片的服务器,用于优化AI工作。

在发布会上,马斯克团队还透露,xAI在短短三个月将数据中心容量翻倍,使用了20万个英伟达H100 GPU打造出最佳AI。

网友对于Gork-3的发布也满怀激动,AI大佬Andrej Karpathy试用后称赞说,Grok3+Thinking大概和 OpenAI 最强的模型(比如 o1-pro,月费 200 美元)相当,比 DeepSeek-R1和 Gemini 2.0 Flash Thinking 略好一些。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐