Etched 是一家专注于制Transformer芯片的初创公司,该公司刚刚宣布推出 Sohu,这是一款专用集成电路 (ASIC),据称在 AI LLM 推理方面超越了 Nvidia 的 H100。据说一台 8xSohu 服务器的性能相当于 160 个 H100 GPU,这意味着如果 Sohu 达到预期,数据处理中心可以节省初始成本和运营成本。
据该公司称,当前的 AI 加速器(无论是 CPU 还是 GPU)都是为与不同的 AI 架构配合使用而设计的。这些不同的框架和设计意味着硬件必须能够支持各种模型,如卷积神经网络、长短期记忆网络、状态空间模型等。由于这些模型针对不同的架构进行了调整,因此大多数当前的 AI 芯片将其计算能力的很大一部分分配给可编程性。
大多数大型语言模型 (LLM) 使用矩阵乘法来完成大部分计算任务,而 Etched 估计 Nvidia 的 H100 GPU 仅将 3.3% 的晶体管用于这一关键任务。这意味着剩余的 96.7% 硅用于其他任务,这对于通用 AI 芯片来说仍然是必不可少的。
几年前,Etched 启动搜狐项目时,在 transformer 上下了很大的赌注。这款芯片将 transformer 架构嵌入硬件中,从而允许它为 AI 计算分配更多晶体管。我们可以将其与处理器和显卡进行比较——假设当前的 AI 芯片是 CPU,它可以做很多不同的事情,那么 transformer 模型就像游戏标题的图形需求。当然,CPU 仍然可以处理这些图形需求,但它不会像 GPU 那样快速或高效地完成。专门处理视觉效果的 GPU 将使图形渲染更快、更高效,这是因为它的硬件是专门为此设计的。
Etched 没有制造一款可以适应每种 AI 架构的芯片,而是制造了一款仅适用于 transformer 模型的芯片。当它在 2022 年启动该项目时,ChatGPT 甚至还不存在。但随后它在 2023 年爆红,现在看来,该公司的赌注即将获得巨大回报。
来源:tomshardware.com
11 天前
2005年成立的美国老牌服务器厂商Database Mart正推出春季大促活动,低至5折,超40款GPU服务器套餐配备独立英伟达显卡,如NVIDIA P1000, GTX 1650, RTX 3060, A5000, A6000, H100等,满足各等级预算。支持AI渲染/推理/训练,3D渲染,直播,模拟器多开,指纹浏览器,区块链,爬虫,音视频编辑,深度学习等多种用途。 查看显卡服务器主站:GPU Mart 查看中文网: 鹄望云官网 推荐Database Mart的理由 🛠️ 核心优势解析: 【独占计算资源】专属美国IP+独享GPU:告别共享云GPU的资源争抢问题,GPU VPS与GPU独立服务器均配备独立显卡与固定IP,确保高性能计算环境零干扰,推理训练更稳定。 【开箱即用】预集成AI开发套件:内置Ollama、Stable Diffusion等工具链,一键部署机器学习/AI开发环境。 【全天候智囊支持】多场景KB支持,7×24小时中英文专家护航:GPU架构师团队随时待命,零额外成本获取专业技术支持。 【无瓶颈数据传输】全系方案标配无限流量通道,保障大规模数据吞吐。 【企业级安全防护】智能DDoS防火墙,多层分布式防御体系 🚨GPU服务器春季限时特惠: 精选机型立省50%,算力采购成本触底! 👉 立即抢购 备注试用(free trial)提交订单即可免费测试。非促销款还可享受本站特别折扣,用折扣码下单,立享永久8折优惠。 折扣码 鹄望云折扣码:TC1ONYWD GPU Mart折扣码:TC12U2ZS 选型建议: 学习/测试:选GT730/P620 中小模型:RTX 2060/T1000/A4000 VPS 企业级AI:A5000/A6000/A100 客户常见问题 Q:是否支持Windows系统? A:全系列支持Windows/Linux,可自由重装 Q:GPU服务器能否跑Llama3? A:RTX A4000可流畅运行7B/13B模型,A6000支持70B参数 Q:是否支持使用? A:提供24小时免费测试 点击查看更多爆款 ! 如需中文和支付宝付款服务,查看鹄望云官网,联系客服获取同等促销价。
14 天前
华为昇腾推出的Atlas 900 SuperCluster成为国产AI算力的重要突破,标志着华为在超大规模AI训练集群领域的领先地位。 1. 技术突破与性能表现 超大规模算力支持:Atlas 900 SuperCluster 采用创新的超节点架构,支持超万亿参数大模型训练,单集群可管理数十万张昇腾AI加速卡(如昇腾910B),并实现高可用性设计,包括超高速互联、高效液冷散热和瞬时爆发供电。 性能对标英伟达A100:实测数据显示,昇腾AI集群在训练Meta Llama、BloomGPT等模型时,效率可达英伟达A100的1.1倍,并在部分场景实现10倍领先于其他国产方案。 国产化算力标杆:科大讯飞等企业已采用昇腾万卡集群,训练效率达到英伟达A100的0.8~1.2倍,证明其在国产大模型训练中的竞争力。 2. 架构与生态创新 全栈自主可控:从硬件(昇腾芯片、鲲鹏CPU)、架构(达芬奇架构)、软件(MindSpore框架)到开发工具(CANN异构计算),华为构建了完整的AI计算产业链。 昇腾910B芯片升级:相比前代昇腾910,910B在FP32性能上显著提升,支持多NPU模组互联,提供更高带宽和算力密度,进一步缩小与英伟达高端GPU的差距。 生态挑战与机遇:尽管昇腾算力已对标英伟达,但CUDA生态的成熟度仍是竞争短板。华为通过开源MindSpore、适配主流框架(如PyTorch、TensorFlow)及开发者扶持计划(如15亿美元生态投入)加速生态建设。 华为Atlas 900 SuperCluster的推出,不仅提升了国产AI集群的竞争力,也为全球AI算力格局注入了新变量。随着生态完善,昇腾有望在AI训练与推理市场占据更关键地位。 (根据资讯整理)
15 天前
2005年成立的美国老牌服务器厂商Database Mart正推出春季大促活动,低至5折,超40款GPU服务器套餐配备独立英伟达显卡,如NVIDIA P1000, GTX 1650, RTX 3060, A5000, A6000, H100等,满足各等级预算。支持AI渲染/推理/训练,3D渲染,直播,模拟器多开,指纹浏览器,区块链,爬虫,音视频编辑,深度学习等多种用途。 查看显卡服务器主站:GPU Mart 查看中文网: 鹄望云官网 点击查看多种爆款 ! 如需中文和支付宝付款服务,查看鹄望云官网,联系客服获取同等促销价。 Database Mart Database Mart 是一家成立于2005年的美国服务器厂商。主要提供独立的GPU显卡服务器、物理专用服务器和VPS虚拟机的租赁托管服务,也提供VPS、域名、SSL等多种托管服务。 (信息来源:美国 Database Mart 公司 )
4 个月前
中美 AI 竞争已进入白热化阶段,技术差距的缩小、数据瓶颈的突破以及地缘政治的影响将成为未来 AI 发展的关键因素。
4 个月前
中国政府对美国半导体巨头NVIDIA采取了一系列反制措施,这不仅直接冲击了NVIDIA在中国市场的业务,也引发了市场对人工智能(AI)领域领军企业NVIDIA繁荣时代是否即将结束的广泛担忧。 中国的反击措施包括但不限于加强对外国半导体技术的出口限制、加大对本土半导体产业的财政和政策支持,以及推动国内企业在高端芯片技术领域的自主研发。这些措施的核心目的是减少对外国技术的依赖,特别是在关键的AI和高性能计算领域。 作为全球最大的AI芯片供应商之一,NVIDIA在中国市场拥有显著的份额。中国不仅是NVIDIA产品的重要销售市场,也是其研发和创新的重要基地之一。然而,随着中国政府政策的转向,NVIDIA在这一关键市场的前景变得不确定。 分析师指出,中国的这一系列举措可能会导致NVIDIA在中国的收入显著下降,从而对其整体财务表现产生负面影响。此外,这也可能加速中国本土半导体企业的崛起,如中芯国际和紫光国微等,这些企业正致力于在高端芯片领域与NVIDIA竞争。长远来看,这种竞争可能会挑战NVIDIA在全球AI芯片市场的领导地位。 市场对这一消息的反应迅速而强烈。NVIDIA的股票在消息公布后迅速下跌,跌幅超过了5%,投资者对于NVIDIA未来在中国市场的前景以及整个AI行业的发展趋势感到不确定。一些投资者甚至开始重新评估其在NVIDIA股票上的投资组合,担心这一事件可能是一个更广泛市场动荡的前兆。 这一事件标志着中美在高科技领域竞争的加剧,特别是在关键的半导体和人工智能技术领域。双方的政策博弈不仅影响到企业的商业运营,也可能对全球技术发展和产业格局产生深远影响。市场和业界都在密切关注接下来的发展,以评估这些政策变化对NVIDIA和整个AI行业的长期影响。 中国的反击措施使得NVIDIA股票受压,市场对其繁荣时代是否结束产生担忧。这一事件反映了中美在高科技领域的激烈竞争,也可能预示着全球半导体和AI产业格局的重大调整。未来,随着双方政策的进一步演变和市场的自我调整,NVIDIA及其竞争对手将面临新的挑战和机遇。投资者和企业都需要保持高度警惕,密切关注相关动态,以做出明智的决策。 新闻来源:MSN德语财经频道
4 个月前
Google宣布了其新型量子计算芯片Willow,这是在量子计算领域长达十年的征程中迈出的重要一步!
7 个月前
海光处理器属于GPGPU架构,通用且场景支撑能力强,这是国内唯一具备全精度浮点数据计算能力的厂商。
8 个月前
Tesla Cortex是特斯拉的超级计算机,拥有约10万颗英伟达H100和H200芯片,这些芯片将用于训练全自动驾驶(FSD)和人形机器人擎天柱(Optimus)的神经网络。
8 个月前
每秒1832token极限推理速度
8 个月前
在语言模型领域如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,AI巨头们也在“以小博大”。