Grok-1

拥有3140亿参数的混合专家开源模型

训练模型 10 个月前 1216 61 0

Grok-1是一个拥有3140亿参数的混合专家模型，它的开源包括了模型的权重和网络架构。这一模型的发布，立即引起了广泛的关注和讨论，不仅因为它的规模，更因为它所代表的开放性和合作精神。

Grok-1的诞生与特点

Grok-1的命名灵感来源于道格拉斯·亚当斯的科幻小说《银河系漫游指南》中的一个概念，意指对事物的深刻理解。正如其名，Grok-1旨在成为一个能够回答几乎所有问题的AI，甚至能够建议用户应该提出什么问题。Grok-1在回答问题时带有一丝幽默和叛逆，这使得它在众多AI模型中独树一帜。

Grok-1的基础模型是基于大量文本数据训练而成，没有针对任何具体任务进行微调。这种通用性使得Grok-1具有广泛的应用潜力。它的MoE（混合专家）模型在给定token上的激活权重为25%，这表明模型在处理不同数据时能够灵活调整其内部结构。

Grok-1的训练始于2023年10月，xAI使用了JAX库和Rust语言组成的自定义训练堆栈。这一训练过程从头开始，没有依赖于任何现有的模型或数据集，确保了Grok-1的原创性和独立性。

免责声明：本网站仅提供网址导航服务，对链接内容不负任何责任或担保。

NewAPI

集中管理多种大模型API

916 0

Mercury Coder

首款扩散语言模型（dLLMs）

1827 248

OpenRouter

大模型API路由器

1753 125

Unsloth

高效的模型训练和微调工具

2130 191

Luminous

世界级语义表示模型

1278 77

Cosmos世界基础模型

Nvidia世界基础模型

1388 0

MaskGCT

语音合成大模型

1236 125

MarsCode

字节公司智能代码工具

1321 146

面壁智能

为大模型加速与应用落地赋能

1381 115

Mini-Omni

开源多模态大型语言模型

1375 122

Grok-1

NewAPI

Mercury Coder

OpenRouter

Unsloth

Luminous

Cosmos世界基础模型

MaskGCT

MarsCode

面壁智能

Mini-Omni

OpenAI即将发布GPT-4o的升级版GPT-4.1

预训练语言模型 BERT

如何集合多种大模型API并提供开发者服务

Scaling Law: 缩放定律

阶跃星辰开源两款多模态模型 -- Step - Video - T2V 和 Step - Audio

工业AI：ZeTa模型接入DeepSeek R1

清华大学KTransformers 开源项目：低成本本地运行大模型

腾讯混元大模型的技术原理

为什么中国最好语言大模型产生在杭州？

AI比较：基于API调用费用的10大语言大模型价格比较

分类

热门网址

GET笔记

Mermaid.Live

腾讯元宝

LatentBox

Monica

OfficeAI助手

AskManyAI

法行宝

ChatGPT

橙篇

最新评论

标签