海光DCU是海光信息公司研发的协处理器,属于GPGPU(通用图形处理单元)的一种,具有强大的并行计算能力和较高的能效比,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。以下是它的一些特点和优势:
海光DCU目前已经实现了与包括文心一言等国内大模型的全面适配,性能达到国内领先水平,可广泛应用于大数据处理、人工智能、商业计算等应用领域。例如,在2023年三季度发布的“深算二号”,相较“深算一号”性能提升超100%,并实现了在大数据处理、人工智能等领域的商业化应用。
14 天前
华为昇腾推出的Atlas 900 SuperCluster成为国产AI算力的重要突破,标志着华为在超大规模AI训练集群领域的领先地位。 1. 技术突破与性能表现 超大规模算力支持:Atlas 900 SuperCluster 采用创新的超节点架构,支持超万亿参数大模型训练,单集群可管理数十万张昇腾AI加速卡(如昇腾910B),并实现高可用性设计,包括超高速互联、高效液冷散热和瞬时爆发供电。 性能对标英伟达A100:实测数据显示,昇腾AI集群在训练Meta Llama、BloomGPT等模型时,效率可达英伟达A100的1.1倍,并在部分场景实现10倍领先于其他国产方案。 国产化算力标杆:科大讯飞等企业已采用昇腾万卡集群,训练效率达到英伟达A100的0.8~1.2倍,证明其在国产大模型训练中的竞争力。 2. 架构与生态创新 全栈自主可控:从硬件(昇腾芯片、鲲鹏CPU)、架构(达芬奇架构)、软件(MindSpore框架)到开发工具(CANN异构计算),华为构建了完整的AI计算产业链。 昇腾910B芯片升级:相比前代昇腾910,910B在FP32性能上显著提升,支持多NPU模组互联,提供更高带宽和算力密度,进一步缩小与英伟达高端GPU的差距。 生态挑战与机遇:尽管昇腾算力已对标英伟达,但CUDA生态的成熟度仍是竞争短板。华为通过开源MindSpore、适配主流框架(如PyTorch、TensorFlow)及开发者扶持计划(如15亿美元生态投入)加速生态建设。 华为Atlas 900 SuperCluster的推出,不仅提升了国产AI集群的竞争力,也为全球AI算力格局注入了新变量。随着生态完善,昇腾有望在AI训练与推理市场占据更关键地位。 (根据资讯整理)
1 个月前
从传统认知来看,算力、算法和数据被认为是人工智能的核心三大要素。当大模型出现后,大模型在当前人工智能发展中占据着极其重要的地位。 大模型与算法的关系:从属而非取代。传统算法的定位:算法本质是解决问题的步骤规则,如SVM、随机森林等,是AI的底层方法论。 大模型的本质:大模型是算法的一种高级形态,依托深度学习(尤其是Transformer架构)实现,其核心仍是算法逻辑的演进。例如,GPT的生成能力源于自注意力机制(算法创新),而非脱离算法的新存在。 大模型为何需要独立强调? 尽管大模型属于算法范畴,但其独特性使其具备基础设施属性: 平台化能力:如GPT-4可作为基础平台,支撑多样下游任务(写代码、客服、科研),类似操作系统。 资源门槛:训练大模型需超算集群和千亿级数据,远超传统算法,成为独立的技术-资源综合体。 生态影响:催生模型即服务(MaaS),改变行业分工(如企业无需自研模型,调用API即可)。 AI的核心能力确实高度依赖于数据、算力和大模型,但这三者并非全部。它们是推动现代AI发展的基础设施,但真正的核心能力还需结合其他关键要素,以下分层次解析: 1. 数据、算力、大模型的角色 数据:AI的“燃料”,尤其是监督学习和自监督学习依赖海量标注或无标注数据(如GPT-4训练用了数万亿词元)。 算力:硬件(如GPU/TPU集群)支撑大规模训练和推理,例如训练GPT-4需数万块GPU和数月时间。 大模型:通过参数量的增加(如千亿级参数)实现更强的泛化和多任务能力,如Transformer架构的涌现能力。 2. 被忽视的核心要素 算法创新: 数据与算力的价值需通过算法释放。例如,Transformer(2017)相比RNN的突破、扩散模型对生成任务的改进,均源于算法设计。 小样本学习(Few-shot Learning)、强化学习的策略优化(如PPO算法)证明:算法效率可弥补数据或算力的不足。 工程能力: 分布式训练框架(如Megatron、DeepSpeed)、模型压缩(量化、蒸馏)等技术,决定大模型能否实际落地。 领域知识: 医疗AI依赖专家标注和病理学知识,自动驾驶需融合传感器物理模型,说明垂直场景的壁垒远超大模型本身。 3. 未来趋势:超越“大力出奇迹” 高效训练与推理: 低功耗芯片(如神经拟态计算)、MoE架构(如Mixtral 8x7B)正降低对算力的依赖。 数据质量 vs 数量: 合成数据(如NVIDIA Omniverse)、数据清洗技术逐步减少对纯数据量的需求。 可解释性与安全: 模型对齐(Alignment)、因果推理等能力将成为下一代AI的竞争焦点(如Anthropic的Claude 3)。 4. 总结:AI的核心能力是“系统级创新” 短期:数据、算力、大模型是入场券; 长期:算法设计、跨学科融合(如神经科学)、工程优化、伦理治理等系统性能力才是关键。 类比:如同火箭需要燃料(数据)、引擎(算力)、设计(模型),但真正的突破来自材料科学(算法)与控制系统(工程)。 未来AI的竞争将不仅是资源的堆砌,而是如何用更少的资源解决更复杂的问题,这需要多维度的创新能力。
4 个月前
中美 AI 竞争已进入白热化阶段,技术差距的缩小、数据瓶颈的突破以及地缘政治的影响将成为未来 AI 发展的关键因素。
4 个月前
中国政府对美国半导体巨头NVIDIA采取了一系列反制措施,这不仅直接冲击了NVIDIA在中国市场的业务,也引发了市场对人工智能(AI)领域领军企业NVIDIA繁荣时代是否即将结束的广泛担忧。 中国的反击措施包括但不限于加强对外国半导体技术的出口限制、加大对本土半导体产业的财政和政策支持,以及推动国内企业在高端芯片技术领域的自主研发。这些措施的核心目的是减少对外国技术的依赖,特别是在关键的AI和高性能计算领域。 作为全球最大的AI芯片供应商之一,NVIDIA在中国市场拥有显著的份额。中国不仅是NVIDIA产品的重要销售市场,也是其研发和创新的重要基地之一。然而,随着中国政府政策的转向,NVIDIA在这一关键市场的前景变得不确定。 分析师指出,中国的这一系列举措可能会导致NVIDIA在中国的收入显著下降,从而对其整体财务表现产生负面影响。此外,这也可能加速中国本土半导体企业的崛起,如中芯国际和紫光国微等,这些企业正致力于在高端芯片领域与NVIDIA竞争。长远来看,这种竞争可能会挑战NVIDIA在全球AI芯片市场的领导地位。 市场对这一消息的反应迅速而强烈。NVIDIA的股票在消息公布后迅速下跌,跌幅超过了5%,投资者对于NVIDIA未来在中国市场的前景以及整个AI行业的发展趋势感到不确定。一些投资者甚至开始重新评估其在NVIDIA股票上的投资组合,担心这一事件可能是一个更广泛市场动荡的前兆。 这一事件标志着中美在高科技领域竞争的加剧,特别是在关键的半导体和人工智能技术领域。双方的政策博弈不仅影响到企业的商业运营,也可能对全球技术发展和产业格局产生深远影响。市场和业界都在密切关注接下来的发展,以评估这些政策变化对NVIDIA和整个AI行业的长期影响。 中国的反击措施使得NVIDIA股票受压,市场对其繁荣时代是否结束产生担忧。这一事件反映了中美在高科技领域的激烈竞争,也可能预示着全球半导体和AI产业格局的重大调整。未来,随着双方政策的进一步演变和市场的自我调整,NVIDIA及其竞争对手将面临新的挑战和机遇。投资者和企业都需要保持高度警惕,密切关注相关动态,以做出明智的决策。 新闻来源:MSN德语财经频道
4 个月前
Google宣布了其新型量子计算芯片Willow,这是在量子计算领域长达十年的征程中迈出的重要一步!
7 个月前
海光处理器属于GPGPU架构,通用且场景支撑能力强,这是国内唯一具备全精度浮点数据计算能力的厂商。
8 个月前
每秒1832token极限推理速度
8 个月前
观察者网今日发表了一篇题为《中企这么做,正让美国限制变得毫无意义》的文章。 这篇文章介绍了中国公司如何在美方限制先进芯片的情况下开发自己的AI技术。它讨论了这些公司提高效率和创建更小、更专业的模型的方式。 该文章还强调了中国公司开发的AI应用数量不断增长。一些重要观点是,中国在AI专利申请方面处于世界领先地位,中国公司正在开发自己的芯片以减少对外国技术的依赖。 文章详细介绍了中国公司在AI领域取得的进展,包括: 开发了新的训练方法,例如使用更少的数据和更小的模型,以提高效率。 开发了自己的AI芯片,以减少对外国技术的依赖。 在应用AI到现实世界问题方面处于领先地位。 中国在AI领域取得的进展是其科技实力不断增强的体现。
8 个月前
北京苹芯科技有限公司是一家智能计算架构的革新者,致力于通过创新的存算一体解决方案,为 AI 的广泛应用提供技术动力。
8 个月前
2024年8月8日,苹芯科技发布了基于存算一体技术的28nm及22nm节点的PIMCHIP-N300存算一体NPU和PIMCHIP-S300多模态智能感知芯片,成为中国首颗能量产的端侧28nm存算一体AI芯片。 此次发布的两款芯片可支持智能可穿戴设备、智能安防、具身智能、AI大模型、健康数据分析等领域,尤其支持AI与大模型推理加速等各类计算任务场景。 PIMCHIP-S300多模态智能感知芯片基于自研异构架构所研制,实现了数据处理的“零搬运”,在大幅提升运算效率的同时,显著降低能耗,将应用于智能可穿戴设备、智能安防、具身智能、AI大模型、健康数据分析等领域的计算效率提升。 PIMCHIP-N300则是专为机器学习和人工智能领域设计的新一代存算一体神经网络处理单元(NPU),它能够以更高的效率、更低的能耗处理人工神经网络等机器学习算法和深度学习模型。 存算一体芯片是一种将存储和计算功能融合在同一个芯片上的技术架构。该芯片的成功发布标志着中国在存算一体AI芯片领域取得了重要突破,有望为人工智能技术的发展和应用带来新的机遇。 资讯来源:苹芯科技