Llama 3.1的405B模型终于等来了首个微调版本!

这个模型名为Hermes 3,来自初创公司Nous Research,是一个相当小型且低调的团队。

虽然公司低调,但技术实力相当强悍。Hermes系列已经微调了Mistral、Yi、Llama等多个开源模型,下载量超过3300万次。

进行实验并突破个体协调、人工智能、开源软件和去中心化的界限——以大型企业和政府不敢尝试的方式。

现已推出:

  1. Hermes 3 技术报告

  2. Hermes 模型集

  3. Hermes 3 函数调用

  4. 边界自由:Hermes 3

  5. Lambda Labs 计算合作伙伴

Hermes 3 包含先进的长期上下文保留和多轮对话能力、复杂的角色扮演和内心独白能力以及增强的代理函数调用。我们的训练数据积极鼓励模型以自适应的方式准确遵循系统和指令提示。

Hermes 3 是通过微调 Llama 3.1 8B、70B 和 405B 并在主要由合成生成的响应组成的数据集上进行训练而创建的。该模型拥有与 Llama 3.1 相当且更出色的性能,同时释放了更深层次的推理和创造力能力。

免责声明:本网站仅提供网址导航服务,对链接内容不负任何责任或担保。