DeepSeek - AI平台 | AI工具集｜AI资讯站

网站

DeepClaude

结合 DeepSeek R1 的推理功能和 Claude 的代码生成功能

DeepSeek Artifacts

DeepSeek Artifacts

App无代码开发工具

DeepSeek

最好用价格最低的语言大模型

文章

DeepGPT：融合 DeepSeek 和 ChatGPT 双模型，创造更强大的 AI 助手
将 DeepSeek 的深度推理、代码能力与 ChatGPT 的语言创造力、通用对话能力相结合，设计一个名为 DeepGPT 的 AI 工具，这确实是一个极具潜力的构想。它代表了一种“强强联合”的思
16 天前
欧洲银行纷纷尝试 DeepSeek
自 1 月份 DeepSeek 推出 R1 推理模型后，欧洲包括汇丰银行等主要金融机构一直在将其与其他 AI 模型一起测试，而美国银行拒绝使用。
3 个月前
DeepSeek开源首个代码库 FlashMLA
DeepSeek FlashMLA是国产AI公司DeepSeek于2025年2月24日开源的首个代码库。这里的MLA是 Multi-Head Latent Attention 的缩写，指的是多头潜在注
3 个月前
DeepSeek等大模型为普通人带来的十大新机遇
随着人工智能技术的飞速发展，像DeepSeek这样的大模型正在以前所未有的方式改变我们的生活、工作和社会。这些先进的AI工具不仅服务于企业和专家，也为普通人提供了前所未有的机会，让他们能够突破传统限制
3 个月前
工业AI：ZeTa模型接入DeepSeek R1
随着DeepSeek-R1的出现，相较于以往的大模型，带来了更先进的语义理解和数据处理能力，AI技术迎来了新的里程碑。喆塔科技作为国产领先的数智化平台领跑者，其“喆学大模型”通过融合行业Know-H
3 个月前
原生稀疏注意力机制: Native Sparse Attention (NSA）
DeepSeek提出的原生稀疏注意力机制（Native Sparse Attention, NSA）是一种针对Transformer模型注意力计算的高效优化技术，旨在降低计算复杂度的同时保持模型性能，
3 个月前
DeepSeek发表新论文：原生稀疏注意力机制 NSA
DeepSeek团队近日发布了一篇题为《原生稀疏注意力：硬件对齐且可原生训练的稀疏注意力机制》的技术论文，介绍了他们提出的NSA（Natively Sparse Attention）机制。 NSA结合
3 个月前
双模融合：DeepSeek R1与ChatGPT合并使用将会突破技术边界
结合DeepSeek R1和ChatGPT的合并使用，理论上可以通过互补优势提升整体性能，但实际效果取决于具体实现方式、任务类型及资源优化能力。以下是综合分析：一、合并使用的潜在优势任务性
3 个月前
清华大学KTransformers 开源项目：低成本本地运行大模型
2月10日，清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目公布更新：一块24G显存的4090D，就可以在本地运行DeepSeek-R1、V3的671B“满血版”。
4 个月前
SAP集成DeepSeek语言大模型, 提升SAP软件的智能化水平
SAP宣布集成DeepSeek，对企业管理和工业软件市场的影响在探讨SAP等企业管理软件巨头的发展前景时，我们不得不提到DeepSeek这样的AI大模型。DeepSeek作为新一代的人工智能技术，正在
4 个月前
为什么中国最好语言大模型产生在杭州？
杭州在AI领域崛起有城市“基因密码”，使得杭州在人工智能技术，特别是语言大模型领域引领全球。
5 个月前