AI技术 - AI平台 | AI工具集｜AI资讯站

AI免费生成PPT：一句话、一分钟、一键搞定
AiPPT: 一句话、一分钟、一键搞定
23 天前
怎么搭建和使用 Ralph 循环
Ralph 就是一个让 AI "自己干活直到做完"的循环机制，特别适合复杂的编程任务，解放人力。这里介绍具体怎么搭建和使用 Ralph 循环。 📋 前置准备你需要准备以下内容：
1 个月前
为什么非专业人士很难自己安装 OpenClaw 智能体？
OpenClaw 本质是“开发者基础设施”，而非面向大众的 SaaS 产品。
1 个月前
如何用 OpenClaw 搭建一个真正可用的本地 Agent 中枢
用 OpenClaw 搭建一个本地 Agent 中枢（完整方案）不是再做一个 ChatGPT，而是建立一个真正“可控、可组合、可扩展”的本地 AI Agent 中枢。当越来越多团队开始意识到：
2 个月前
Asking User Question Tool
Asking User Question Tool（AI智能体版）这是AI智能体必备的交互式工具，让Agent在执行任务时主动向用户提问、澄清需求、收集信息，避免瞎猜、减少返工、提升准确率。一、核
2 个月前
怎么本地部署 OpenClaw ?
部署本地 OpenClaw 主要有两种主流且资料详尽的方式，你可以根据自己的技术背景和需求来选择。我把这两种方式的流程整理成了一个概览表格，方便你快速对比和决策：特性方案一：Docker
2 个月前
小米开源机器人VLA模型：Xiaomi-Robotics-0
Xiaomi-Robotics-0 预训练了大量跨身体机器人轨迹和视觉语言数据，使其能够获得广泛且可推广的动作生成知识，同时保持强大的VLM能力。
2 个月前
在开发 AI 产品时，怎么构建生产级 RAG 系统？
在2026年开发AI产品时，搭建一个生产级（production-grade）RAG系统已经不再是“简单接个向量数据库就行”，而是需要系统性工程化思维。以下是从0到1再到生产可用的完整路径，按实际优先
2 个月前
运行 AI Agent 应用为什么要先安装 Node.js 和 Git ？
Node.js 和 Git 是支持 AI Agent 开发、依赖管理和协作的基础工具。
2 个月前
大模型、Memory、RAG、MCP、SKILLS在Agent中的相互关系与核心作用
AI Agent 的真正智能，来自于知识获取（RAG） + 协作协议（MCP） + 执行能力（SKILLS）的统一协同，而不是单一大模型孤立输出。
3 个月前
用 LangGraph 驱动 Agent，解决Agent的状态管理、循环分支与持久执行问题
Agent是具备自主决策、工具调用与状态感知的智能体概念，LangGraph则是LangChain生态下的图驱动有状态Agent编排框架，专门解决复杂Agent的状态管理、循环分支与持久执行问题，是
3 个月前
如何用用语言描述物理运动，让AI生成物理真实运动的视频
这正是当前 AI 视频生成领域最前沿的突破方向。你提出的这个问题，本质上是在问如何让 AI 从“画皮”进阶到“画骨”——即不仅画面好看，运动逻辑也要符合现实世界的物理法则。结合最新的技术进展（如 2
3 个月前
利用大语言模型构建虚拟的“世界模型”
利用大语言模型（LLM）构建虚拟的“世界模型”（World Models），以此作为 KI 智能体（AI Agents）积累经验和训练的场所。核心概念：让 LLM 成为 AI 的“模拟练习场” 目前
4 个月前
YOLO 计算机视觉目标监测算法
YOLO（You Only Look Once），这确实是目前计算机视觉领域最热门、应用最广泛的目标检测算法之一。简单来说，如果把计算机看作一个学生，传统的检测算法像是让学生“拿着放大镜，一点点扫描
4 个月前
腾讯EdgeOne Pages AI图片生成集成指南：从API到SDK的完整实现路径
AI图片生成集成指南：从API到SDK的完整实现路径在腾讯EdgeOne Pages模版详情页面点击“Deploy”按钮，填写必要的API密钥，点击“开始部署”——短短几分钟内，一个完整的AI图
4 个月前
从“人肉敏捷”到“智能涌现”：大数据AI时代的敏捷开发范式转移
答案不是简单地增加人手，而是将AI植入敏捷的DNA，构建“数据智能混合驱动”的敏捷2.0。
4 个月前
PostgreSQL和 MongoDB, 哪个工具更适合做数据库？
MongoDB 和 PostgreSQL 都是当今最顶尖的数据库，但它们的设计哲学截然不同。没有绝对的“赢家”，只有更适合我们场景的工具。为了帮助我们做出决定，本文将从核心差异、适用场景和决策建议三
4 个月前
亚马逊推出新一代基础模型 Nova2
Nova 2是亚马逊于2025年12月在re:Invent 全球大会上推出的新一代基础模型家族，共包含4款模型，均需通过Amazon Bedrock平台使用，兼顾行业领先的性价比与多场景适配性，具体介
4 个月前
Gemini 3：真的是 AI 领域的重大进步吗？
Gemini 3 标志着AI模型从“增量优化”向“范式转变”的重大跃进。
5 个月前
一图胜千言：DeepSeek 发布开源视觉语言模型 DeepSeek OCR
DeepSeek OCR 介绍 DeepSeek OCR 是由中国 AI 公司 DeepSeek AI 于 2025 年 10 月 20 日发布的开源视觉语言模型（VLM），旨在探索“光学上下文压缩”
6 个月前
DeepGPT：融合 DeepSeek 和 ChatGPT 双模型，创造更强大的 AI 助手
将 DeepSeek 的深度推理、代码能力与 ChatGPT 的语言创造力、通用对话能力相结合，设计一个名为 DeepGPT 的 AI 工具，这确实是一个极具潜力的构想。它代表了一种“强强联合”的思
11 个月前
谷歌大模型与人脑语言处理机制研究发现惊人的一致性
谷歌大模型与人脑语言处理机制研究由谷歌研究院与普林斯顿大学、纽约大学等合作开展。3 月上旬，谷歌的研究成果表明大模型竟意外对应人脑语言处理机制。他们将真实对话中的人脑活动与语音到文本 LLM 的内部嵌
1 年前
AI 的三大核心基础设施：数据、算力、大模型构架
从传统认知来看，算力、算法和数据被认为是人工智能的核心三大要素。当大模型出现后，大模型在当前人工智能发展中占据着极其重要的地位。大模型与算法的关系：从属而非取代。传统算法的定位：算法本质是解决问题的
1 年前
智能体摩尔定律：每7个月能力翻番
根据《Nature》最新发表的研究，非营利研究机构METR发现了一项被称为“智能体摩尔定律”的规律，即AI智能体（Agent）在完成长期任务方面的能力每7个月翻一番。这一发现揭示了AI在任务完成时间跨
1 年前
语言模型中100万Token是个什么概念？
在自然语言处理和人工智能领域，token通常是指文本中的基本单元，比如一个单词、一个标点符号或者一个子词等。100万token的输入输出量是一个较大的数据规模，以下从不同角度来理解这一概念：从文本长
1 年前
文心一言4.0和文心一言4.5的功能区别
文心一言4.0和文心一言4.5的功能区别主要体现在以下几个方面：多模态能力文心一言4.0：具备一定的多模态能力，但可能在模态融合的深度和广度上存在一定限制，例如在处理多模态任务时可能需要更多的人
1 年前
阿里发布开源推理模型千问 QwQ-32B
3月6日凌晨，阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B：模型性能媲美大参数模型：拥有320亿参数，性能可与具备6710亿参数（其中370亿被激活）的DeepSeek - R1媲美
1 年前
Manus是真正的 AGI 到来还是噱头？
判断 Manus 是否是“真正的 AGI”（通用人工智能）问世，还是仅仅一个噱头，需要从多个角度审视：AGI 的定义、Manus 的实际能力、当前 AI 技术边界，以及开发团队的宣传策略。以下是逐步分
1 年前
Inception Labs 推出第一个基于 Diffusion 的商业语言模型：Mercury
由斯坦福大学教授 Stefano Ermon 创立的初创公司 Inception Labs 推出了 Mercury Coder，这是第一个大规模基于扩散的语言模型（dLLM）。与按顺序生成文本的传
1 年前
开源版和商业不开源版大语言模型（LLM）的区别
开源版和商业不开源版的大语言模型（LLM）在多个方面存在显著区别，包括访问方式、性能、定制化能力、数据安全性、技术支持、成本等。以下是详细对比： 1. 访问方式开源版：通常提供模型权重、训练
1 年前
DeepSeek开源首个代码库 FlashMLA
DeepSeek FlashMLA是国产AI公司DeepSeek于2025年2月24日开源的首个代码库。这里的MLA是 Multi-Head Latent Attention 的缩写，指的是多头潜在注
1 年前
怎样合法克隆网站？
我们在开发网站的时候，往往有想克隆别人网站的想法。那么在技术上怎么才能实现呢？ ⚠️ 重要提示确认目标网站的版权和合法性：如果你没有目标网站的授权，直接克隆并使用可能会侵犯版权或违反法律。如
1 年前
预训练语言模型 BERT
BERT（Bidirectional Encoder Representations from Transformers）是由Google于2018年发布的一种预训练语言模型，基于Transforme
1 年前
如何集合多种大模型API并提供开发者服务
如何整合大模型API并提供开发者服务随着人工智能技术的快速发展，越来越多的开发者希望在自己的应用中集成AI能力，如自然语言处理、图像生成、语音识别等。如果你计划搭建一个AI平台，并向开发者（B2C）
1 年前
阶跃星辰开源两款多模态模型 -- Step - Video - T2V 和 Step - Audio
2月18日，阶跃星辰联合吉利汽车集团开源了两款阶跃Step系列多模态大模型——Step - Video - T2V视频生成模型和Step - Audio语音模型，采用MIT协议，支持免费商用、任意修改
1 年前
双模融合：DeepSeek R1与ChatGPT合并使用将会突破技术边界
结合DeepSeek R1和ChatGPT的合并使用，理论上可以通过互补优势提升整体性能，但实际效果取决于具体实现方式、任务类型及资源优化能力。以下是综合分析：一、合并使用的潜在优势任务性
1 年前
Replit 推出一款 AI 程序员：Replit Agent
Replit Agent 是由 Replit 2024年9月推出的一款基于人工智能的编程工具，旨在通过自然语言提示帮助用户自动构建应用程序。它覆盖了从代码编写、开发环境配置到调试和部署的整个软件开发
1 年前
GPT-5: 致力于创建一个“统一智能”系统
OpenAI 对 GPT-5 的愿景集中于创建一个“统一智能”系统，无缝整合多种 AI 功能。这种方法旨在消除用户在不同模型之间进行选择的需求，而是提供一个单一且强大的 AI，能够轻松处理各种任务。
1 年前
Adobe推出全新 AI 视频生成工具：Firefly Video Model
Adobe 最近推出了全新的 AI 视频生成工具 Firefly Video Model，这一工具旨在通过人工智能技术帮助用户快速生成高质量的视频内容。以下是关于该工具的主要功能和特点： 1. 核心
1 年前
杭州AI“六小龙”是哪6家公司？
杭州AI“六小龙”是2024年底至2025年初涌现的六家代表性人工智能企业，它们凭借技术创新和全球化影响力，被誉为“神秘的东方力量”，成为杭州乃至中国人工智能领域的先锋力量。以下是这六家企业的详细介
1 年前
德国大语言模型公司Aleph Alpha无分词器技术创新
Aleph Alpha无分词器LLM架构创新与应用解析 1️⃣ 创新架构：突破传统分词限制德国Aleph Alpha公司推出无分词器（tokenizer-free）LLM架构，通过分层字符-词语
1 年前
腾讯混元大模型的技术原理
腾讯混元大模型的数学原理主要基于深度学习和自然语言处理领域的相关技术，以下是其核心要点：神经网络与Transformer架构多层神经网络：混元大模型采用多层神经网络结构，通过模拟人脑神经元之间的
1 年前
Build a Large Language Model (From Scratch)：从零开始构建自己的大型语言模型
由机器学习专家 Sebastian Raschka 撰写的一本实用指南，帮助读者从零开始构建自己的大型语言模型（LLM）。
1 年前
腾讯公司有哪些智能体（AI 代理）平台？
腾讯两大智能体平台：腾讯元器和 AppAgent。
1 年前
大语言模型中三个不同的概念：字节、字符和Token的区别
在语言大模型中，字节（Byte）、字符（Character）和Token是三个不同的概念，它们在文本处理中扮演着不同的角色。以下是它们的详细区别： 1. 字节（Byte）定义：字节是计算机存储和传
1 年前
与AI聊天"上下文长度"是什么意思？
AI聊天上下文长度是指在一次对话中，AI模型能够记住并参考的最大文本量。这包括用户输入和AI回复的总字数或 token 数（AI 模型处理文本的基本单位，类似于单词或字符片段）。 📚 上下文长度的关键
1 年前
物理AIGenesis：开启智能物理模拟新纪元
Genesis是一个全面的物理模拟平台，专为通用机器人、具身AI和物理AI应用而设计。
1 年前
Anthropic 发布《Building effective agents》详细探讨如何构建高效的 AI 代理系统
Anthropic 于2024年12月发布的文章《Building effective agents》详细探讨了如何构建高效的大语言模型（LLM）代理系统。Anthropic 与数十个团队合作构建了跨
1 年前

1 2 3 4