语言模型 - AI平台 | AI工具集｜AI资讯站

谷歌开源小模型Gemma 2：2B参数跑赢GPT-3.5-Turbo
从谷歌 Gemma 2 2B 的强大性能也可以看到一种趋势，即「小」模型逐渐拥有了与更大尺寸模型匹敌的底气和效能优势。
11 个月前
LoRA微调技术
LoRA 通过低秩近似的方式，在保持模型性能的同时，显著降低了微调大语言模型的计算和存储成本，提高了训练效率和灵活性。
11 个月前
Transformer的结构特点和优缺点
Transformer是一种基于自注意力机制的深度神经网络架构，它完全基于注意力机制，摒弃了之前广泛使用的循环和卷积网络结构。应用于多个领域，包括自然语言处理(NLP)和计算机视觉(CV)中取得了显著
11 个月前
Meta推出开源大模型：Llama3.1
据称，Llama3.1开源大模型的表现能力优于ChatGPT-4o。
11 个月前
字节跳动：云雀模型
云雀模型基于字节神经网络加速器开发，通过便捷的自然语言交互，能够高效地完成互动对话、信息获取、协助创作等任务，还提供了简单的 API 调用，可基于大模型快速搭建属于自己的 AI 应用，进行业务创新。
11 个月前
Mixtral 8x7b-instruct 聊天模型
Mixtral 8x7b-instruct 是基于 Mixtral 8x7b 模型进行微调得到的指令遵从版本聊天模型。
11 个月前
LangChain：构建您自己的 GPT 驱动的应用程序
LangChain 是一个 Python 库，可帮助您利用大型语言模型来构建自定义 NLP 应用程序。
11 个月前
法国Mistral AI公司发布的AI模型的应用场景
Mistral AI 公司在多模态、检索增强生成（RAG）等大模型突破方向有着丰富经验，有理由期待 Mistral AI 成为 game changer 。
11 个月前
法国Mistral AI公司AI技术平台介绍
Mistral AI 是一家位于法国巴黎的人工智能初创公司。成立于 2023 年 5 月，其愿景是把开源的人工智能模型带到前沿。
11 个月前
调用AI大模型的输入和输出费用是怎么计算的？
在调用大模型时，输入价格和输出价格是指在使用大模型进行文本生成或其他任务时，对于输入文本和输出文本所收取的费用。
11 个月前
GPT-4o mini：OpenAI推进具有成本效益的智能
OpenAI宣布推出 GPT-4o mini，这是一个最具成本效益的小型AI模型。
11 个月前
OpenAI 发布迷你 AI 模型 GPT-4o mini，有什么特点？
OpenAI发布一款价格更为低廉的大模型GPT-4o mini
11 个月前
怎样开发调用大模型的AI聊天网站
如果你想开发一个能够调用大模型的聊天网站，CSDN作为国内知名的开发者社区，你可以在这里找到许多相关的资源和建议。以下是一些步骤和建议：技术选型：首先，你需要选择适合的后端语言和技术栈，如Pyt
11 个月前
全新 NVIDIA NIM 可适用于 Mistral 和 Mixtral 模型并为您的 AI 项目赋能
NVIDIA NIM 提供一整套预构建云原生微服务，使企业能够在数据中心、云、工作站和 PC 等任何位置运行 AI 模型。
11 个月前
解读AI大模型，从了解token开始
在自然语言处理（NLP）中，token是指文本中最小的语义单元。比如，一个句子可以被分割成若干个单词，每个单词就是一个token。
11 个月前
OpenAI API介绍
OpenAI API 可应用于几乎任何涉及理解或生成自然语言、代码或图像的任务，它提供了一系列具有不同功能和不同价格点的基础模型。
11 个月前
推荐6款AI聊天工具API
如果想开发一个AI聊天工具，可以调用多种AI工具的API进行集成。本文推荐一些常见的AI聊天工具的API文档。
11 个月前
开发AI聊天工具的6个开源项目
开发 AI 聊天工具涉及到自然语言处理、机器学习、编程等多方面的知识和技能。这里推荐6个AI聊天工具开发的开源项目。
11 个月前
HuggingFace提供的AI开源内容
HuggingFace这家具有巨大潜力的AI开源独角兽，由一位出身法国小镇，在都柏林大学上学的极客ClemDelangue创立。
11 个月前
语言模型：全新架构TTT或将超越Transformer
一种全新的大语言模型架构TTT线性模型有望代替Transformer架构方法。
11 个月前
OmniParse：全能解析非结构化数据成易处理的结构化格式
OmniParse：一个人工智能平台，可将任何非结构化数据提取/解析为针对 GenAI (LLM) 应用程序优化的结构化、可操作数据。
12 个月前
如何使用LangChain?
要使用 LangChain，要导入必要的组件和工具，这些组件组合起来创建一个可以理解、处理和响应用户输入的应用程序。
12 个月前
LangChain技术入门：软件框架
LangChain是一个基于大型语言模型（LLM）开发应用程序的框架，提供了开源的构建模块、组件、集成和部署工具。
12 个月前
ChatGPT大语言模型的基础理论
基于 Generative Pre-trained Transformer 架构的自然语言处理神经网络模型，是Transformer这个编码-解码模型的解码部分。
1 年前

1 2