华为盘古气象大模型是首个精度超过传统数值预报方法的AI模型,速度相比传统数值预报提速10000倍以上。
盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景,欧洲中期预报中心和中央气象台等都在实测中发现盘古预测的优越性。
今年5月,台风“玛娃”走向受到广泛关注。中央气象台表示,华为云盘古气象大模型在“玛娃”的路径预报中表现优异,提前五天预报出其将在台湾岛东部海域转向路径。
在第19届世界气象大会上,欧洲中期预报中心也指出,华为云盘古气象大模型在精度上有不可否认的能力,纯数据驱动的AI天气预报模型,展现出了可与欧洲中期天气预报中心业务数值模式媲美的预报实力。
华为盘古大模型研发团队发现,AI气象预报模型的精度不足主要有两个原因:
第一,原有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据;
第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。
为此,团队创造性地提出了适应地球坐标系统的三维神经网络(3D Earth-Specific Transformer)来处理复杂的不均匀3D气象数据,并且使用层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。通过在43年的全球天气数据上训练深度神经网络,盘古气象大模型在精度和速度方面超越传统数值预测方法。
未来,华为云将联合全球气象机构,继续探索并发挥AI在气象领域的应用潜力,为农林牧渔、航空航海等各行业提供支持。
了解更多华为云盘古大模型:https://www.huaweicloud.com/product/pangu.html

29 天前
Xiaomi-Robotics-0 预训练了大量跨身体机器人轨迹和视觉语言数据,使其能够获得广泛且可推广的动作生成知识,同时保持强大的VLM能力。

1 个月前
AI Agent 的真正智能,来自于知识获取(RAG) + 协作协议(MCP) + 执行能力(SKILLS)的统一协同,而不是单一大模型孤立输出。

1 个月前
命令优先,而非图形界面。

2 个月前
这正是当前 AI 视频生成领域最前沿的突破方向。你提出的这个问题,本质上是在问如何让 AI 从“画皮”进阶到“画骨”——即不仅画面好看,运动逻辑也要符合现实世界的物理法则。 结合最新的技术进展(如 2025 年的相关研究),要让 AI 生成符合真实规律的视频,我们可以通过以下几种“高级语言描述法”来与模型沟通: 1. 使用“力提示”技术:像导演一样指挥物理力 🎬 这是谷歌 DeepMind 等团队提出的一种非常直观的方法。你不需要懂复杂的物理公式,只需要在提示词中描述“力”的存在。 描述力的方向与强度: 你可以直接告诉 AI 视频中存在某种力。例如,不只是写“旗帜飘动”,而是写“旗帜在强风中剧烈飘动”或“气球被轻轻向上吹起”。 区分全局力与局部力: 全局力(风、重力): 影响整个画面。例如:“Global wind force blowing from left to right”(从左到右的全局风力)。 局部力(碰撞、推力): 影响特定点。例如:“A ball rolling after being kicked”(球被踢后滚动)。 效果: AI 模型(如 CogVideoX 结合特定模块)能理解这些力的矢量场,从而生成符合动力学的运动,比如轻的物体被吹得更远,重的物体移动缓慢。 2. 调用“思维链”与物理常识:让 LLM 当质检员 🧠 有时候直接描述很难精准,我们可以借助大型语言模型(LLM)作为“中间人”来审核物理逻辑。这种方法(如匹兹堡大学的 PhyT2V)利用 LLM 的推理能力。 分步描述(Chain-of-Thought): 你可以在提示词中要求 AI “思考过程”。例如,不只是生成“水倒入杯子”,而是引导它:“首先,水从壶嘴流出,形成抛物线;然后,水撞击杯底,产生涟漪;最后,水位上升,流速减慢。” 明确物理规则: 在提示词中直接嵌入物理常识。例如:“根据重力加速度,球下落的速度应该越来越快”或“流体具有粘性,流动时会有拉丝效果”。 回溯修正: 如果第一版视频不符合物理规律(比如球浮在空中),你可以通过反馈指令让系统进行“回溯推理”,识别出视频与物理规则的语义不匹配,并自动修正提示词重新生成。 3. 参数化控制:像物理老师一样给定数值 📏 如果你需要极其精确的物理运动(例如做科学实验模拟或电影特效),可以使用类似普渡大学 NewtonGen 框架的思路,直接给定物理参数。 设定初始状态: 在语言描述中包含具体的物理量。 位置与速度: “一个小球从坐标 (0, 10) 以初速度 5m/s 水平抛出”。 角度与旋转: “一个陀螺以角速度 10rad/s 旋转”。 质量与材质: “一个轻质的泡沫块”与“一个沉重的铁球”在相同力作用下的反应是不同的。 指定运动类型: 明确指出是“匀速直线运动”、“抛物线运动”还是“圆周运动”。AI 会根据这些语义,调用内置的“神经物理引擎”来计算轨迹,确保视频中的物体运动轨迹符合牛顿定律。 4. 结合物理引擎的混合描述:虚实结合 🧩 更高级的方法是让语言描述直接驱动物理模拟器(如 Blender, Genesis),然后将结果渲染成视频。 描述物理属性: 在提示词中指定物体的密度、弹性系数、摩擦力等。 事件驱动描述: 描述物体间的相互作用。例如:“一个刚性的小球撞击一个柔软的布料,布料发生形变并包裹住小球”。 通用物理引擎: 像 Genesis 这样的新模型,允许你用自然语言描述复杂的物理场景(如“一滴水滑落”),它能直接生成符合流体动力学的模拟数据,而不仅仅是看起来像视频的图像帧。 📝 总结:如何写出“物理级”提示词? 为了更直观地掌握这种描述方式,这里总结了一个对比表: 一句话总结: 要用语言描述物理运动,关键在于将“视觉结果”转化为“物理过程”。多用描述力(风、推力)、属性(重力、粘性)、参数(速度、角度)的词汇,甚至直接告诉 AI 要遵循某种物理规律,这样生成的视频才会有真实的“重量感”和“真实感”。

2 个月前
利用大语言模型(LLM)构建虚拟的“世界模型”(World Models),以此作为 KI 智能体(AI Agents)积累经验和训练的场所。 核心概念:让 LLM 成为 AI 的“模拟练习场” 目前,开发能在现实世界执行复杂任务的 AI 智能体(如机器人、自动化软件助手)面临一个巨大挑战:获取实际操作经验的成本极高且充满风险。 如果让机器人在物理世界中通过“试错”来学习,不仅效率低下,还可能造成硬件损毁。 研究人员提出的新思路是:利用已经掌握了海量人类知识的大语言模型(LLM),由它们通过文字或代码生成一个模拟的“世界模型”。 1. 什么是“世界模型”? 世界模型是一种模拟器,它能预测特定行为可能产生的结果。 传统方式: 需要开发者手动编写复杂的代码来定义物理法则和环境规则。 LLM 驱动方式: 预训练的大模型(如 GPT-4 或 Claude)已经具备了关于世界运行逻辑的知识(例如:知道“推倒杯子水会洒”)。研究人员可以利用 LLM 自动生成这些模拟环境的逻辑。 2. 研究的具体内容 来自上海交通大学、微软研究院、普林斯顿大学和爱丁堡大学的国际研究团队对此进行了深入研究。他们测试了 LLM 在不同环境下充当模拟器的能力: 家庭模拟(Household Simulations): 模拟洗碗、整理房间等日常任务。 电子商务网站(E-Commerce): 模拟购物行为、库存管理等逻辑。 3. 关键发现: 强结构化环境表现更佳: 在规则清晰、逻辑严密的场景(如简单的文本游戏或特定流程)中,LLM 驱动的模拟效果非常好。 开放世界的局限性: 对于像社交媒体或复杂的购物网站这类高度开放的环境,LLM 仍需要更多的训练数据和更大的模型参数才能实现高质量的模拟。 真实观察的修正: 实验显示,如果在 LLM 模拟器中加入少量来自现实世界的真实观察数据,模拟的质量会显著提升。 对 AI 行业的意义 加速 AI 智能体进化: 这种方法让 AI 智能体可以在几秒钟内完成数千次的虚拟实验,极大加快了学习速度。 降低训练门槛: 开发者不再需要搭建昂贵的物理实验室,只需要调用 LLM 接口就能创建一个“训练场”。 2026 年的趋势: 这预示着 2026 年及以后,“自主智能体”将成为 AI 发展的核心,而这种“基于模拟的学习”将是通往通用人工智能(AGI)的关键一步。 总结 该研究证明,LLM 不仅仅是聊天机器人,它们可以演变成复杂的“数字世界创造者”。在这个虚拟世界里,新一代的 AI 智能体可以安全、低成本地反复磨练技能,最终再将学到的能力应用到现实生活和工作中。 ( 根据海外媒体编译 )

2 个月前
AI 技术在“三资三化” (资金、资产、资源;制度化、规范化、信息化) 以及债务改革中的应用,正从简单的“线上化”向“智能化”深度跨越。这其中蕴含着巨大的市场机会,主要集中在以下四个维度: 1. 存量债务的“智能穿透与预警” (风险管控市场) 由于农村债务往往涉及多方主体(银行、私人、工程方),账目错综复杂,AI 在此处有核心应用: 机会点: 知识图谱分析债务链: 利用 AI 构建债务关联图谱,识别“连环债”、“隐性担保”和非法集资风险,防止虚假债务入账。 动态预警系统: 结合村集体现金流预测模型,AI 可以自动识别哪些村庄即将进入债务违约高风险期,并自动生成化债建议(如减债谈判、展期建议)。 商业价值: 地方政府(县、乡级)对于能够“防雷”和“化雷”的智能监管平台有极强的采购意愿。 2. 沉睡资源的“精准估值与盘活” (资产运营市场) “三资”改革最大的难点在于资源(土地、林权、水面)价值难以评估,导致流转效率低。 机会点: 卫星遥感 + AI 估值: 利用计算机视觉(CV)技术识别农田、林地的实时质量、作物生长情况或违章占用,结合市场大数据自动生成资产估值报告。 智能匹配平台: 类似于“农村版链家”。AI 学习投资方的需求,自动匹配最适合的闲置村集体厂房或土地,提升招商引资的成功率,直接产生还债所需的现金流。 商业价值: 数字化资产交易平台的运营佣金和评估咨询服务。 3. 非结构化数据的“自动录入与审计” (SaaS 服务市场) 基层“三资”数据大量存在于纸质合同、发票和手写账本中,人工录入成本极高。 机会点: 多模态 OCR + 智能审计: 批量扫描村级合同,AI 自动提取关键条款(租金、租期、违约责任),并自动比对是否符合国家标准、是否存在“廉价合同”或“人情合同”。 大模型政务助手: 针对财务专业知识匮乏的村干部,提供生成式 AI 助手,通过语音对话即可查询“本村还欠多少钱”、“这笔报销合不合规”。 商业价值: 针对政府和代账机构的 B 端/G 端 SaaS 工具订阅费。 4. 农村金融场景的“信用画像” (金融服务市场) 债务改革的终极目标之一是让农村集体经济具备健康的融资能力。 机会点: 集体经济信用评分模型: 基于“三资”平台的真实流水、资产储备和债务比率,AI 为村集体或合作社生成信用画像,帮助银行开发“三资贷”、“化债贷”等金融产品。 数字凭证流转: 利用 AI 验证合同真实性,结合区块链技术,将村集体的确权资产转化为可融资的数字凭证。 商业价值: 金融机构的技术服务费或融资撮合分成。 总结:市场竞争格局 目前的市场机会已不再属于纯粹的“软件外包商”,而是属于“行业理解 + AI 能力”的集成商: 省/市级平台商: 负责数据基座(信息化)。 AI 算法专家: 提供穿透式审计、遥感估值等高附加值模块。 金融科技运营方: 负责将盘活后的资产与资本市场对接。 欢迎与我们一起探讨,如何利用现代技术助力国家的改革发展! aipintai.com

3 个月前
Nova 2是亚马逊于2025年12月在re:Invent 全球大会上推出的新一代基础模型家族,共包含4款模型,均需通过Amazon Bedrock平台使用,兼顾行业领先的性价比与多场景适配性,具体介绍如下 : 1. Nova 2 Lite: 主打快速、高性价比的日常推理任务,可处理文本、图像和视频输入并生成文本。能通过调节“思考”深度平衡智能、速度与成本,适合客服聊天机器人、文档处理等场景。在基准测试中,它对标Claude Haiku 4.5、GPT - 5 Mini等模型,多数项目表现持平或更优。 2. Nova 2 Pro(预览版): 是该家族中智能度最高的推理模型,可处理文本、图像、视频和语音输入并生成文本。适配代理编码、长期规划等复杂任务,还能作为“教师模型”向小型模型传递能力,在与Claude Sonnet 4.5、Gemini 2.5 Pro等主流模型的对比中,多项基准测试表现出色。 3. Nova 2 Sonic: 专注端到端语音交互的模型,能实现类人化实时对话。它支持多语言与丰富音色,拥有100万token上下文窗口,可支撑长时交互,还能与Amazon Connect等语音服务、对话框架无缝集成,适配客服、AI助手等语音场景。 4. Nova 2 Omni: 业内首款统一多模态推理与生成模型,可处理文本、图像等多种输入,还能同时生成文本和图像。它能一次性处理海量多格式内容,比如数百页文档、数小时音频等,适合营销素材一站式制作等需要整合多类信息的场景。 这4款模型均具备100万token上下文窗口,且内置网页查找和代码执行能力,能保障回答的时效性与实用性 。

3 个月前
LoRA(Low-Rank Adaptation)是一种对大模型进行“轻量级微调”的技术。
Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。
海螺AI