Grok大模型是马斯克旗下的xAI公司推出的新一代人工智能模型,2023年11月,xAI发布第一款大模型Grok-1,迈出了在大模型领域探索的第一步。2024年3月18日,xAI团队又推出了参数量高达3140亿的Grok-1模型,这一参数量远超OpenAI GPT-3.5的1750亿,成为当时参数量最大的开源大语言模型。
2024年8月,Grok 2大模型发布 。Grok 2主要应用于训练AI聊天机器人。与Grok 1相比,它在训练数据的使用上有所改进。Grok 1在训练时未完全依赖真实世界数据,采用了大量合成数据,导致在处理真实世界中的细微差别和复杂性时表现欠佳。而Grok 2虽然依旧使用了大规模合成数据集,但同时融入了少量高质量的真实世界数据,在一定程度上弥补了初代模型在处理真实场景方面的不足。
而此次即将发布的Grok 3,其最大的特点在于引入了“思维链”(ChAIn Of Thought)推理能力。该能力让Grok 3能够像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应的能力。Grok 3模型在推理、编程能力以及文本和图像分析等多模态功能方面有了显著的提升。
去年夏天,马斯克便在社交平台X上高调宣布,Grok-3将依托10万张英伟达H100 GPU的超强算力进行训练,彼时计划在2024年底推出,并称赞其 “将会是非常特别的”。但现实却事与愿违,Grok-3的发布进程受阻。业内分析,xAI团队规模相对较小,在人力、资源调配等方面可能面临诸多挑战,这在一定程度上拖慢了项目的推进速度。
在人工智能大模型领域,竞争态势瞬息万变,每一次新品发布都可能重塑市场格局。在Grok 3推迟发布期间DeepSeek异军突起,迅速抢占市场份额,成为AI领域的一匹黑马。 此次Grok-3姗姗来迟,如今市场格局已发生变化,Grok-3能否在竞争激烈的市场中分得一杯羹还未可知。
越来越快。。。。。