logo AI平台
  • 首页
  • AI简讯
    • 国内
    • 国际
  • AI技术
    • 机器学习
    • 深度学习
    • 神经网络
    • 语言模型
    • 语音视觉
    • 机器人
    • 专家系统
    • 流程智能化
  • AI硬件
    • 计算核心
    • 语音视觉
    • 传感器
    • 智能终端
    • 智能机器人
  • AI教培
    • 教育
    • 培训
    • 会议
    • 观点
    • 专家
  • AI百科
  • 合作咨询
  • AI工具收录
  • 登录
  1. 首页
  2. AI技术
  • 如何用用语言描述物理运动,让AI生成物理真实运动的视频

    如何用用语言描述物理运动,让AI生成物理真实运动的视频

    这正是当前 AI 视频生成领域最前沿的突破方向。你提出的这个问题,本质上是在问如何让 AI 从“画皮”进阶到“画骨”——即不仅画面好看,运动逻辑也要符合现实世界的物理法则。 结合最新的技术进展(如 2

    25 天前

  • 利用大语言模型构建虚拟的“世界模型”

    利用大语言模型构建虚拟的“世界模型”

    利用大语言模型(LLM)构建虚拟的“世界模型”(World Models),以此作为 KI 智能体(AI Agents)积累经验和训练的场所。 核心概念:让 LLM 成为 AI 的“模拟练习场” 目前

    28 天前

  • YOLO 计算机视觉目标监测算法

    YOLO 计算机视觉目标监测算法

    YOLO(You Only Look Once),这确实是目前计算机视觉领域最热门、应用最广泛的目标检测算法之一。 简单来说,如果把计算机看作一个学生,传统的检测算法像是让学生“拿着放大镜,一点点扫描

    1 个月前

  • 腾讯EdgeOne Pages AI图片生成集成指南:从API到SDK的完整实现路径

    腾讯EdgeOne Pages AI图片生成集成指南:从API到SDK的完整实现路径

    AI图片生成集成指南:从API到SDK的完整实现路径 在腾讯EdgeOne Pages模版详情页面点击“Deploy”按钮,填写必要的API密钥,点击“开始部署”——短短几分钟内,一个完整的AI图

    1 个月前

  • 从“人肉敏捷”到“智能涌现”:大数据AI时代的敏捷开发范式转移

    从“人肉敏捷”到“智能涌现”:大数据AI时代的敏捷开发范式转移

    答案不是简单地增加人手,而是将AI植入敏捷的DNA,构建“数据智能混合驱动”的敏捷2.0。

    1 个月前

  • PostgreSQL和 MongoDB, 哪个工具更适合做数据库?

    PostgreSQL和 MongoDB, 哪个工具更适合做数据库?

    MongoDB 和 PostgreSQL 都是当今最顶尖的数据库,但它们的设计哲学截然不同。没有绝对的“赢家”,只有更适合我们场景的工具。 为了帮助我们做出决定,本文将从核心差异、适用场景和决策建议三

    1 个月前

  • 亚马逊推出新一代基础模型 Nova2

    亚马逊推出新一代基础模型 Nova2

    Nova 2是亚马逊于2025年12月在re:Invent 全球大会上推出的新一代基础模型家族,共包含4款模型,均需通过Amazon Bedrock平台使用,兼顾行业领先的性价比与多场景适配性,具体介

    1 个月前

  • Gemini 3:真的是 AI 领域的重大进步吗?

    Gemini 3:真的是 AI 领域的重大进步吗?

    Gemini 3 标志着AI模型从“增量优化”向“范式转变”的重大跃进。

    2 个月前

  • 一图胜千言:DeepSeek 发布开源视觉语言模型 DeepSeek OCR

    一图胜千言:DeepSeek 发布开源视觉语言模型 DeepSeek OCR

    DeepSeek OCR 介绍 DeepSeek OCR 是由中国 AI 公司 DeepSeek AI 于 2025 年 10 月 20 日发布的开源视觉语言模型(VLM),旨在探索“光学上下文压缩”

    3 个月前

  • DeepGPT:融合 DeepSeek 和 ChatGPT 双模型,创造更强大的 AI 助手

    DeepGPT:融合 DeepSeek 和 ChatGPT 双模型,创造更强大的 AI 助手

    将 DeepSeek 的深度推理、代码能力与 ChatGPT 的语言创造力、通用对话能力相结合,设计一个名为 DeepGPT 的 AI 工具,这确实是一个极具潜力的构想。它代表了一种“强强联合”的思

    8 个月前

  • 谷歌大模型与人脑语言处理机制研究发现惊人的一致性

    谷歌大模型与人脑语言处理机制研究发现惊人的一致性

    谷歌大模型与人脑语言处理机制研究由谷歌研究院与普林斯顿大学、纽约大学等合作开展。3 月上旬,谷歌的研究成果表明大模型竟意外对应人脑语言处理机制。他们将真实对话中的人脑活动与语音到文本 LLM 的内部嵌

    10 个月前

  • AI 的三大核心基础设施:数据、算力、大模型构架

    AI 的三大核心基础设施:数据、算力、大模型构架

    从传统认知来看,算力、算法和数据被认为是人工智能的核心三大要素。当大模型出现后,大模型在当前人工智能发展中占据着极其重要的地位。 大模型与算法的关系:从属而非取代。传统算法的定位:算法本质是解决问题的

    10 个月前

  • 智能体摩尔定律:每7个月能力翻番

    智能体摩尔定律:每7个月能力翻番

    根据《Nature》最新发表的研究,非营利研究机构METR发现了一项被称为“智能体摩尔定律”的规律,即AI智能体(Agent)在完成长期任务方面的能力每7个月翻一番。这一发现揭示了AI在任务完成时间跨

    10 个月前

  • 语言模型中100万Token是个什么概念?

    语言模型中100万Token是个什么概念?

    在自然语言处理和人工智能领域,token通常是指文本中的基本单元,比如一个单词、一个标点符号或者一个子词等。100万token的输入输出量是一个较大的数据规模,以下从不同角度来理解这一概念: 从文本长

    10 个月前

  • 文心一言4.0和文心一言4.5的功能区别

    文心一言4.0和文心一言4.5的功能区别

    文心一言4.0和文心一言4.5的功能区别主要体现在以下几个方面: 多模态能力 文心一言4.0:具备一定的多模态能力,但可能在模态融合的深度和广度上存在一定限制,例如在处理多模态任务时可能需要更多的人

    10 个月前

  • 阿里发布开源推理模型千问 QwQ-32B

    阿里发布开源推理模型千问 QwQ-32B

    3月6日凌晨,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B: 模型性能 媲美大参数模型:拥有320亿参数,性能可与具备6710亿参数(其中370亿被激活)的DeepSeek - R1媲美

    10 个月前

  • Manus是真正的 AGI 到来还是噱头?

    Manus是真正的 AGI 到来还是噱头?

    判断 Manus 是否是“真正的 AGI”(通用人工智能)问世,还是仅仅一个噱头,需要从多个角度审视:AGI 的定义、Manus 的实际能力、当前 AI 技术边界,以及开发团队的宣传策略。以下是逐步分

    11 个月前

  • Inception Labs 推出 第一个基于 Diffusion 的商业语言模型:Mercury

    Inception Labs 推出 第一个基于 Diffusion 的商业语言模型:Mercury

    由斯坦福大学教授 Stefano Ermon 创立的初创公司 Inception Labs 推出了 Mercury Coder,这是第一个大规模基于扩散的语言模型 (dLLM)。与按顺序生成文本的传

    11 个月前

  • 开源版和商业不开源版大语言模型(LLM)的区别

    开源版和商业不开源版大语言模型(LLM)的区别

    开源版和商业不开源版的大语言模型(LLM)在多个方面存在显著区别,包括访问方式、性能、定制化能力、数据安全性、技术支持、成本等。以下是详细对比: 1. 访问方式 开源版:通常提供模型权重、训练

    11 个月前

  • DeepSeek开源首个代码库 FlashMLA

    DeepSeek开源首个代码库 FlashMLA

    DeepSeek FlashMLA是国产AI公司DeepSeek于2025年2月24日开源的首个代码库。这里的MLA是 Multi-Head Latent Attention 的缩写,指的是多头潜在注

    11 个月前

  • 怎样合法克隆网站?

    怎样合法克隆网站?

    我们在开发网站的时候,往往有想克隆别人网站的想法。那么在技术上怎么才能实现呢? ⚠️ 重要提示 确认目标网站的版权和合法性:如果你没有目标网站的授权,直接克隆并使用可能会侵犯版权或违反法律。 如

    11 个月前

  • 预训练语言模型 BERT

    预训练语言模型 BERT

    BERT(Bidirectional Encoder Representations from Transformers)是由Google于2018年发布的一种预训练语言模型,基于Transforme

    11 个月前

  • 如何集合多种大模型API并提供开发者服务

    如何集合多种大模型API并提供开发者服务

    如何整合大模型API并提供开发者服务 随着人工智能技术的快速发展,越来越多的开发者希望在自己的应用中集成AI能力,如自然语言处理、图像生成、语音识别等。如果你计划搭建一个AI平台,并向开发者(B2C)

    11 个月前

  • 阶跃星辰开源两款多模态模型 -- Step - Video - T2V 和 Step - Audio

    阶跃星辰开源两款多模态模型 -- Step - Video - T2V 和 Step - Audio

    2月18日,阶跃星辰联合吉利汽车集团开源了两款阶跃Step系列多模态大模型——Step - Video - T2V视频生成模型和Step - Audio语音模型,采用MIT协议,支持免费商用、任意修改

    11 个月前

  • 双模融合:DeepSeek R1与ChatGPT合并使用将会突破技术边界

    双模融合:DeepSeek R1与ChatGPT合并使用将会突破技术边界

    结合DeepSeek R1和ChatGPT的合并使用,理论上可以通过互补优势提升整体性能,但实际效果取决于具体实现方式、任务类型及资源优化能力。以下是综合分析: 一、合并使用的潜在优势 任务性

    11 个月前

  • Replit 推出一款 AI 程序员:Replit Agent

    Replit 推出一款 AI 程序员:Replit Agent

    Replit Agent 是由 Replit 2024年9月推出的一款基于人工智能的编程工具,旨在通过自然语言提示帮助用户自动构建应用程序。它覆盖了从代码编写、开发环境配置到调试和部署的整个软件开发

    11 个月前

  • GPT-5: 致力于创建一个“统一智能”系统

    GPT-5: 致力于创建一个“统一智能”系统

    OpenAI 对 GPT-5 的愿景集中于创建一个“统一智能”系统,无缝整合多种 AI 功能。这种方法旨在消除用户在不同模型之间进行选择的需求,而是提供一个单一且强大的 AI,能够轻松处理各种任务。

    11 个月前

  • Adobe推出全新 AI 视频生成工具:Firefly Video Model

    Adobe推出全新 AI 视频生成工具:Firefly Video Model

    Adobe 最近推出了全新的 AI 视频生成工具 Firefly Video Model,这一工具旨在通过人工智能技术帮助用户快速生成高质量的视频内容。以下是关于该工具的主要功能和特点: 1. 核心

    11 个月前

  • 杭州AI“六小龙”是哪6家公司?

    杭州AI“六小龙”是哪6家公司?

    杭州AI“六小龙”是2024年底至2025年初涌现的六家代表性人工智能企业,它们凭借技术创新和全球化影响力,被誉为“神秘的东方力量”,成为杭州乃至中国人工智能领域的先锋力量。以下是这六家企业的详细介

    11 个月前

  • 德国大语言模型公司Aleph Alpha无分词器技术创新

    德国大语言模型公司Aleph Alpha无分词器技术创新

    Aleph Alpha无分词器LLM架构创新与应用解析 1️⃣ 创新架构:突破传统分词限制 德国Aleph Alpha公司推出无分词器(tokenizer-free)LLM架构,通过分层字符-词语

    12 个月前

  • 腾讯混元大模型的技术原理

    腾讯混元大模型的技术原理

    腾讯混元大模型的数学原理主要基于深度学习和自然语言处理领域的相关技术,以下是其核心要点: 神经网络与Transformer架构 多层神经网络:混元大模型采用多层神经网络结构,通过模拟人脑神经元之间的

    1 年前

  • Build a Large Language Model (From Scratch):从零开始构建自己的大型语言模型

    Build a Large Language Model (From Scratch):从零开始构建自己的大型语言模型

    由机器学习专家 Sebastian Raschka 撰写的一本实用指南,帮助读者从零开始构建自己的大型语言模型(LLM)。

    1 年前

  • 腾讯公司有哪些智能体(AI 代理)平台?

    腾讯公司有哪些智能体(AI 代理)平台?

    腾讯两大智能体平台:腾讯元器和 AppAgent。

    1 年前

  • 大语言模型中三个不同的概念:字节、字符和Token的区别

    大语言模型中三个不同的概念:字节、字符和Token的区别

    在语言大模型中,字节(Byte)、字符(Character)和Token是三个不同的概念,它们在文本处理中扮演着不同的角色。以下是它们的详细区别: 1. 字节(Byte) 定义:字节是计算机存储和传

    1 年前

  • 与AI聊天"上下文长度"是什么意思?

    与AI聊天"上下文长度"是什么意思?

    AI聊天上下文长度是指在一次对话中,AI模型能够记住并参考的最大文本量。这包括用户输入和AI回复的总字数或 token 数(AI 模型处理文本的基本单位,类似于单词或字符片段)。 📚 上下文长度的关键

    1 年前

  • 物理AIGenesis:开启智能物理模拟新纪元

    物理AIGenesis:开启智能物理模拟新纪元

    Genesis是一个全面的物理模拟平台,专为通用机器人、具身AI和物理AI应用而设计。

    1 年前

  • Anthropic 发布《Building effective agents》详细探讨如何构建高效的 AI 代理系统

    Anthropic 发布《Building effective agents》详细探讨如何构建高效的 AI 代理系统

    Anthropic 于2024年12月发布的文章《Building effective agents》详细探讨了如何构建高效的大语言模型(LLM)代理系统。Anthropic 与数十个团队合作构建了跨

    1 年前

  • 为什么中国最好语言大模型产生在杭州?

    为什么中国最好语言大模型产生在杭州?

    杭州在AI领域崛起有城市“基因密码”,使得杭州在人工智能技术,特别是语言大模型领域引领全球。

    1 年前

  • 不用写代码就可以开发自己的APP :AnyChat + Gemini Coder

    不用写代码就可以开发自己的APP :AnyChat + Gemini Coder

    AnyChat 和 Gemini Coder 的结合为开发者提供了一种高效、灵活且低成本的 APP 开发方式。

    1 年前

  • 结合 VS Code 和 Cline 实现无代码开发网站或App

    结合 VS Code 和 Cline 实现无代码开发网站或App

    通过结合 VS Code 和 Cline,用户可以轻松实现无代码开发网站。

    1 年前

  • Scale AI 的创始人兼 CEO Alexandr Wang 深入分析中美 AI 行业的竞争格局

    Scale AI 的创始人兼 CEO Alexandr Wang 深入分析中美 AI 行业的竞争格局

    中美 AI 竞争已进入白热化阶段,技术差距的缩小、数据瓶颈的突破以及地缘政治的影响将成为未来 AI 发展的关键因素。

    1 年前

  • 东京3D数字孪生项目:一个栩栩如生的数字城市

    东京3D数字孪生项目:一个栩栩如生的数字城市

    东京3D数字孪生项目旨在创建一个高度详细的东京市数字副本。

    1 年前

  • AI比较:基于API调用费用的10大语言大模型价格比较

    AI比较:基于API调用费用的10大语言大模型价格比较

    以下是基于API调用费用的10大语言大模型价格比较表格,整理自最新公开信息: 模型名称 提供商 输入价格($/1M tokens) 输出价格($/1M tokens) 上下文长度 备注

    1 年前

  • DeepSeek推出的数款AI产品

    DeepSeek推出的数款AI产品

    DeepSeek(深度求索)是一家专注于大语言模型(LLM)和相关技术研发的创新型科技公司,成立于2023年7月,由知名量化私募巨头幻方量化创立。DeepSeek的AI产品主要包括以下几类: 语言模型

    1 年前

  • AI智能体开发框架:Amazon Bedrock 代理

    AI智能体开发框架:Amazon Bedrock 代理

    通过与企业系统、API 和数据来源无缝连接,使生成式人工智能应用程序能够自动执行多步任务。

    1 年前

  • AI代理开发框架有哪些?

    AI代理开发框架有哪些?

    LangChain, Amazon Bedrock, Rivet, Vellum.

    1 年前

  • 谷歌Gemini 2.0 :为了人工智能代理时代的新AI模型

    谷歌Gemini 2.0 :为了人工智能代理时代的新AI模型

    Gemini 1.0是为了组织和理解信息,Gemini 2.0则是为了让信息变得更有用。

    1 年前

  • 模块化的简介框架:智能体开发的新工具Atomic Agents

    模块化的简介框架:智能体开发的新工具Atomic Agents

    不同于其他复杂抽象层的框架,Atomic Agents 追求的是简洁和直观。

    1 年前

1 2 3 4 下一页

帮你写代码、读文件、写作各种创意内容

分类

  • AI简讯 (7)
  • 国内 (20)
  • 国际 (74)
  • AI+行业 (22)
  • 智能家居 (3)
  • 艺术娱乐 (12)
  • 健康医疗 (22)
  • 人力资源 (9)
  • 金融科技 (13)
  • 法律服务 (8)
  • 工业制造 (27)
  • 能源能效 (9)
  • 仓储物流 (6)
  • 市场分析 (15)
  • 环境气候 (4)
  • 安全监控 (3)
  • AI技术 (47)
  • 机器学习 (11)
  • 深度学习 (9)
  • 神经网络 (5)
  • 语言模型 (77)
  • 语音视觉 (20)
  • 机器人 (2)
  • 专家系统 (2)
  • 流程智能化 (3)
  • AI硬件 (0)
  • 计算核心 (21)
  • 语音视觉 (1)
  • 传感器 (5)
  • 智能终端 (13)
  • 智能机器人 (14)
  • AI教培 (1)
  • 教育 (19)
  • 培训 (2)
  • 会议 (9)
  • 观点 (8)
  • 专家 (15)
  • AI百科 (52)

热门文章

  • 豆包推荐9个国外AI工具平台网站

    豆包推荐9个国外AI工具平台网站

    0.78万
  • AI比较:基于API调用费用的10大语言大模型价格比较

    AI比较:基于API调用费用的10大语言大模型价格比较

    0.64万
  • 杭州AI“六小龙”是哪6家公司?

    杭州AI“六小龙”是哪6家公司?

    0.6万
  • 介绍10个法律AI应用工具

    介绍10个法律AI应用工具

    0.57万
  • 蚂蚁集团百灵大模型HI

    蚂蚁集团百灵大模型HI

    0.53万
  • 字节跳动:云雀模型

    字节跳动:云雀模型

    0.44万
  • 开发AI聊天工具的6个开源项目

    开发AI聊天工具的6个开源项目

    0.43万
  • 字节跳动旗下豆包和小悟空两款AI应用工具的区别

    字节跳动旗下豆包和小悟空两款AI应用工具的区别

    0.37万
  • 海光DCU算力加速卡

    海光DCU算力加速卡

    0.35万
  • 千问启用全新AI Chat域名及界面:chat.qwen.ai

    千问启用全新AI Chat域名及界面:chat.qwen.ai

    0.34万

最新评论

  • minimax minimax 8 个月前

    Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。

    海螺AI

标签

关于本站 合作咨询 联系本站

本站由emlog pro驱动 Theme by AI资源网址导航模版

sitemap