MiniMind

低成本训练 AI 语言模型

训练模型 3 个月前 960 385 0

Minimind是一个开源的轻量级大语言模型项目。2小时完全从0训练26M的小参数GPT！

以下是关于MiniMind开源项目的介绍：

项目目标：旨在让用户以极低的成本和时间，在个人设备上快速训练和运行语言模型。通过仅花费极少的GPU服务器租赁成本和时间成本，就能从零基础训练出一个超小的语言模型。
模型特点：MiniMind系列模型极其轻量，最小版本仅为25.8M，是GPT - 3大小的1/7000，能在普通个人GPU上快速训练。
功能优势：提供了从模型结构、数据处理到训练、优化等全流程的代码，支持单卡和多卡训练，兼容主流AI框架如transformers、trl等。还能在本地设备上快速训练和部署，满足个性化需求，可作为教学和研究工具帮助理解大语言模型原理和应用。
技术实现：基于GPT架构，通过精简模型参数和优化训练算法，实现低资源条件下的快速训练。其核心技术涵盖数据预处理、模型设计、训练优化和推理加速等。
项目内容：包括MiniMind - llm结构的代码、分词器训练代码、预训练、监督微调、LoRA微调、直接偏好优化算法和模型蒸馏算法的完整训练代码，以及高质量的开源数据集。

目前，MiniMind主要通过本地部署，未来计划增加多语言支持、模型压缩和优化等功能，以满足更广泛的应用场景。

免责声明：本网站仅提供网址导航服务，对链接内容不负任何责任或担保。