2024 年 6 月 10 日新闻稿: 个人智能化系统 Apple Intelligence 为 iPhone、iPad 和 Mac 引入强大的生成式模型
Apple Intelligence 为人工智能隐私树立了新标准,它能够理解个人背景,从而提供有用且相关资讯
加利福尼亚州,库比提诺 Apple发布面向 iPhone、iPad 和 Mac 的个人智能化系统 Apple Intelligence,基于个人场景发挥生成式模型的强大功用,结合用户情况提供有助益且相关的智能化功能。Apple Intelligence 深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 中,充分运用 Apple 芯片对语言和图像的理解与创作能力,可做出多种跨 app 操作,同时结合个人场景,为用户简化和加快日常任务流程。通过 Private Cloud Compute,Apple 为 AI 的隐私功能树立了全新标准,并能在设备端进程和搭载 Apple 芯片的更大型、基于服务器的模型之间灵活配置和扩充计算资源。
“我们十分激动地向大家展示 Apple 创新的全新篇章。Apple Intelligence 将会彻底改变用户使用我们产品的方式,以及我们的产品如何在用户手中发挥功用。”Apple 首席执行官 Tim Cook 表示,“我们使用独特的方式将生成式 AI 与个人使用场景相结合,实现真正有助益的智能化功能。 而且它能以完全私密安全的方式调用此类信息,协助用户完成最重要的任务。这就是 Apple 所开发出的独一无二的 AI,我们迫不及待地想让用户体会它的强大之处。”
理解和创造语言的全新能力
Apple Intelligence 为用户解锁提高写作和沟通的新方式。iOS 18、iPadOS 18 和 macOS Sequoia 内置可以全系统调用的新工具 Writing Tools,让用户能在几乎任何场景下对文本进行改写、校对和摘要,包括邮件、备忘录、Pages 文稿和各类第三方 app。
无论是整理课堂笔记,检查博客文章是否通顺,亦或确保电子邮件行文得体,Writing Tools 能够帮助用户提升对于文字表达的信心。Apple Intelligence 的改写工具可以让用户选择不同的版本,根据受众和文稿诉求调整文风。无论是对求职信进行润色,还是为派对请柬添加几分幽默和创意,改写功能总能辅助用户写出最得体的文字。Proofread 工具能为用户检查语法、措辞和语句结构,还能同时给出修改建议,以及对修改建议的说明,方便用户查看或快速采纳。Summarize 工具可在用户选中文本后,以易于理解的段落、要点罗列、表格或列表的形式对其进行归纳总结。
最新的邮件 app 新增格外便利的电子邮件置顶功能。Priority Messages 功能会在收件箱的最上方单独划出一个区域,显示最紧急的电子邮件,例如仅限当日有效的晚餐邀请或登机牌。此外,用户在收件箱的界面上所能看到的,不再只是每封邮件第一行文字的预览,而是邮件全文的摘要,完全无需打开邮件。对于已回复多次的邮件,用户也只需轻点一下便可查看具体内容。Smart Reply 功能可为用户生成快速答复文本建议,还能识别出邮件中提出的所有问题,确保用户全部给予答复。
对语言的深层次理解能力同样被应用在通知功能中。Priority Notifications 会出现在分组通知的最上方,向用户提示最为重要的事项,还有内容摘要帮助用户快速浏览大量或已分组的通知,直接在锁定屏幕上显示详细信息,例如一些格外活跃的群组聊天。而为了帮助用户保持对当前任务的专注,全新专注模式“Reduce Interruptions”仅会显示可能需要即刻被看到的通知,例如通知提前接孩子的短信等。
最新的备忘录 app 和电话 app 可让用户录制音频,将音频转写成文本,以及生成内容摘要。在通话期间开启录制功能时,通话双方均会自动收到提示。通话结束后,Apple Intelligence 会生成一份内容摘要,帮助用户回顾通话要点。
Image Playground 为交流和自我表达增添乐趣
Apple Intelligence 为用户提供乐趣无穷的图像创作功能,帮助用户用全新方式进行交流和表达自我。借助于 Image Playground,用户可在数秒间创作出有趣的图像,且有动画、插画、手绘三种样式可以选择。Image Playground 使用简单,并且直接内置在信息等多款 app 中。它也可作为一款单独的 app 进行安装和使用,非常适合试验不同的创意和风格。所有图像均在设备端创建生成,让用户可以不受图像数量限制,尽情尝试。
使用 Image Playground 时,用户可根据不同的分类从大量的创意中进行选择,例如题材、扮装、配饰、地点等,也可自行输入对图像的自定义描述,从照片图库中选取任意人物添加在图像内,还可挑选喜爱的样式。
在信息 app 中使用 Image Playground,可让用户快速创作出趣味图像发送给朋友,甚至还会看到基于当前对话生成的个性化创意推荐。例如用户正在群组聊天中讨论有关徒步的话题,此时便会看到与自己朋友、目的地、活动相关的创意推荐,让用户能够用更短时间创作出更应景的图像。
而在备忘录 app 中,用户则可通过 Apple Pencil 工具盘中新增的 Image Wand 工具调用 Image Playground,为笔记添加更多视觉表达上的趣味性。手绘的草图可以转化成精美的图像,用户还可选中其中的空白区域,利用基于周围元素生成的场景信息生成新图像。此外,诸如 Keynote 讲演、无边记、Pages 文稿等 app,以及各类已集成全新 Image Playground API 的第三方 app,皆可调用 Image Playground 的功能。
创建应景的 Genmoji
表情符号全新进化,用户现可创建原创 Genmoji 来表达自我。 只需输入描述文本,便可生成相应的 Genmoji,连同若干附加选项。甚至还可直接使用亲朋好友的照片生成 Genmoji。同表情符号一样,Genmoji 可直接用在任意消息文本内,也可作为贴纸或回复使用点回功能发送。
照片新功能让用户更得心应手
在 Apple Intelligence 的辅助下,查找照片和视频变得更加便捷。用户可直接使用日常语言查找特定的照片,例如“Maya 穿着一件扎染衬衫在玩滑板”,或者“Katie 脸上贴着贴纸”。能在视频片段中查找特定情景,也让现在的查找视频功能变得格外好用,用户将可以直接跳转至视频中的相关片段处。除此之外,新增的 Clean Up 工具还能够识别并删除照片背景中无关紧要的物体,但不会随意影响主体。
利用回忆功能,用户只需输入一段描述文本,便可快捷地创作出自己想要看到的故事。Apple Intelligence 将运用对语言和图像的理解,根据描述文本挑选出最适合的照片和视频,依据识别出的照片题材,设计出一段分为不同章节的剧情,然后将这些素材整理成一段叙事结构完整的影片。用户甚至还能从 Apple Music 曲库中获得适合这段回忆的配曲推荐。而在使用以上各种 Apple Intelligence 功能时,用户的照片和视频将全程以私人文件的形式保存在设备端,不会共享给 Apple 或任何第三方。
Siri 迈入新时代
在 Apple Intelligence 的助力下,Siri 与系统体验的结合更加浑然一体。更深层次的语言理解能力,让 Siri 表现得更自然,更契合场景,更贴合用户个人需求,还能简化和加快日常任务流程。它能理解用户的碎片化表述,还会为连续的请求沿用语境场景。用户也可与 Siri 文字交流,在文本和语音之间任意切换,用最适合当时需要的方式与 Siri 沟通。Siri 还采用了全新设计,在已激活状态下,会在显示屏的外边缘处亮起优美的柔光。
Siri 现可随处随地为用户提供设备支持,回答数千个有关如何使用 iPhone、iPad 和 Mac 的问题。用户可以向它了解各类知识,例如如何在邮件 app 中定时发送电子邮件,或者如何从浅色模式切换至深色模式。
经过一段时间的积累后,具备屏幕感知能力的 Siri 将能够理解用户在更多 app 中的内容,并据其进行相应操作。例如,用户在信息 app 中收到朋友发来的新地址时,只需说一句“把这个地址加到他的联系人名片里”即可。
配合 Apple Intelligence,Siri 还将有能力在各类 Apple 及第三方 app 中完成数百种新操作。例如,用户只需说出“从我的阅读列表里调出那篇关于蝉的文章”,或者“把周六那天的烧烤照片发给 Malia”,Siri 便会执行。
Siri 将有能力实现完全基于用户个人和设备端信息的智能化。例如,用户只需说出“播放 Jamie 推荐的那条播客”,Siri 便会自行定位到相应的播客单集进行播放,完全不需要用户自己回想这条播客是短信消息还是电子邮件里提到的。用户也可以提问:“我妈妈的飞机几点落地?”Siri 便会自行查询航班详情,然后与航班的实时执飞轨迹交叉对比,给出抵达时间。
AI 隐私功能的新标准
为了发挥实际功用,Apple Intelligence 在理解深层次个人场景的同时,也会做到对用户隐私的保护。Apple Intelligence 的一条底层逻辑就是在设备端处理任务,所用到的模型也有很多全程仅在设备端运行。但在处理更加复杂、需求更多处理能力的请求时,Private Cloud Compute 会将 Apple 设备的隐私与安全性覆盖至云端,进一步拓展智能化能力。
Private Cloud Compute 能够帮助 Apple Intelligence 灵活配置和扩充计算资源,运用容量更大型的基于服务器的模型处理更复杂的请求。这些模型在采用 Apple 芯片的服务器上运行,为 Apple 确保数据永远不会被保留或泄露提供了基础。
独立专家均可自行检测 Apple 芯片服务器上运行的代码,核验隐私保护情况,Private Cloud Compute 则会通过加密手段确保 iPhone、iPad 和 Mac 设备不会与软件没有公开日志可查的服务器交换信息。通过 Private Cloud Compute,Apple Intelligence 为 AI 的隐私功能树立了全新标准,向用户提供可信任的智能化功能。
ChatGPT 整合至 Apple 全平台
Apple 正在将 ChatGPT 整合至 iOS 18、iPadOS 18 和 macOS Sequoia 的操作体验中,让用户能够直接使用 ChatGPT 的特殊功能,包括它对图像和文档的理解能力,为用户省去在不同工具间来回切换的麻烦。
Siri 可根据需要直接调用 ChatGPT 的特殊功能。它会在先行征得用户同意后,才将用户的问题发送至 ChatGPT,连同任何文档或照片,最后直接答复用户。
不仅如此,ChatGPT 也将被集成至 Apple 提供的可以全系统调用的 Writing Tools 工具内,协助用户根据当前主题生成内容。使用 Compose 功能时,用户还可运用 ChatGPT 的图像工具生成多种多样的图像,做到图文并茂。
相应的隐私保护措施也已为使用 ChatGPT 的用户部署到位,用户的 IP 地址会被隐藏,发出的请求也不会保存在 OpenAI 的记录里。对于选择绑定已有账号的用户,则会适用 ChatGPT 的数据使用政策。
ChatGPT 将于今年晚些时候登陆 iOS 18、iPadOS 18 和 macOS Sequoia,使用 GPT-4o 模型。用户无需创建账号便可免费使用,ChatGPT 订阅用户则可在绑定已有账号后直接使用付费功能。
推出时间
Apple Intelligence 面向用户免费提供,测试版将于今年秋季作为 iOS 18、iPadOS 18 和 macOS Sequoia 的内置功能推出,仅支持英语(美国)。部分功能、软件平台和其他语言支持将于明年陆续推出。Apple Intelligence 将仅支持 iPhone 15 Pro、iPhone 15 Pro Max 以及搭载 M1 或后续芯片的 iPad 和 Mac 设备,需将 Siri 和设备的语言设置为英语(美国)。如需了解更多信息,请访问 apple.com/apple-intelligence。
资讯来源:Apple中国
2 天前
OpenAI在2025年4月29日为ChatGPT添加了购物功能。以下是具体信息: 运作方式 这一购物功能深度整合了第三方供应商的产品数据以及合作伙伴的实时内容。用户能够通过自然语言对话完成产品价格比较、个性化推荐以及直接购买。例如,输入“我需要一个用于露营的轻便帐篷,预算为500美元”,ChatGPT就会列出符合条件的产品,并附上价格比较链接、用户评价以及购买入口,还会自动调用合作电商平台的库存信息。 产品类别 目前,该功能仅适用于有限的一些产品类别,包括电子产品、时尚产品、美妆产品和家居用品。OpenAI计划在未来扩展到更多类别。 用户群体 该功能最初向ChatGPT Plus和团队订阅用户开放,未来将逐步扩展到免费用户。 特色之处 个性化体验:它不像传统搜索那样基于关键词匹配,而是侧重于理解用户的评价和讨论,分析产品的优缺点,并提供个性化推荐。例如,如果用户表明偏好从特定零售商处购买黑色衣服,ChatGPT会记住这一点,并相应地推荐相关产品。 无付费广告:OpenAI强调产品结果是独立挑选的,并非广告或赞助内容。该公司不会从交易中获利。 此外,OpenAI还为ChatGPT搜索添加了诸如改进引用、热门话题、自动补全以及WhatsApp搜索等新功能,进一步提升了用户体验。
2 个月前
AI 国际简讯 2025年02月18日 微软发布OmniParser V2.0工具,用于识别和解析屏幕上的可交互图标,新版本提升交互图标解析能力。 Meta Reality Labs 的研究团队推出"Pippo"模型,可从普通照片生成1K分辨率的多视角视频。 苹果将在Vision Pro头戴设备中推出Apple Intelligence系统,提供书写工具、Genmojis表情和图像功能。 JetBrains更新"AI Assistant"应用,支持本地大语言模型调用,可直接使用DeepSeek等离线模型。
2 个月前
结合DeepSeek R1和ChatGPT的合并使用,理论上可以通过互补优势提升整体性能,但实际效果取决于具体实现方式、任务类型及资源优化能力。以下是综合分析: 一、合并使用的潜在优势 任务性能互补 DeepSeek R1的优势: 逻辑推理与效率:基于混合专家(MoE)架构,R1在数学推理、代码生成和复杂逻辑分解任务中表现突出,例如在数学竞赛中准确率超过GPT-4o,且生成代码时能快速整合异常处理机制。 成本效益:训练成本仅为ChatGPT的十分之一,运行时能耗低23%,适合长期高负载任务。 ChatGPT的优势: 通用性与创造力:在创意写作、多模态任务(支持图像输入)和用户交互体验上更具优势,例如生成广告文案或设计多幕式剧本结构。 互补场景: R1处理技术性分解(如代码框架生成),ChatGPT优化最终输出(如代码注释和用户界面设计)。 增强输出多样性 通过多模型集成(如投票机制或加权融合),可生成更全面的答案。例如,R1提供结构化逻辑步骤,ChatGPT补充自然语言解释,适用于教育和复杂问题解答场景。 风险分散与容错性 若某一模型在特定领域表现不稳定(如R1可能混淆多义词语境,而ChatGPT在长文本生成中易重复观点),合并使用可通过交叉验证减少错误率。 二、可行的合并实现方式 任务路由(Task Routing) 根据任务类型动态分配模型: 技术任务(如编程、数学证明)优先调用R1; 创意任务(如文案生成、对话设计)优先调用ChatGPT。 支持工具:通过开源框架(如Modular MAX平台或Ollama)实现模型动态切换。 混合生成(Hybrid Generation) 结合两者的输出,例如: R1生成代码框架,ChatGPT添加注释和用户交互逻辑; ChatGPT生成创意文案初稿,R1优化逻辑结构和数据准确性。 强化学习优化 利用用户反馈数据,训练一个“调度模型”自动选择最佳输出或调整权重。例如,在客服场景中,R1处理技术投诉,ChatGPT生成情感化回复。 三、挑战与限制 资源与成本压力 同时运行两个大型模型需要更高的计算资源,尤其是ChatGPT的密集参数架构可能增加部署成本。 输出一致性难题 两者的响应风格差异显著(R1结构化、ChatGPT对话式),需额外设计后处理模块统一输出格式。 调优复杂度 需平衡模型间的权重分配,例如在代码生成任务中,R1的快速生成与ChatGPT的调试建议需协调优先级。 四、实际应用案例参考 DeepClaude项目 类似思路:通过集成DeepSeek R1与Claude 3.5 Sonnet,结合前者的推理能力和后者的创造力,在跨语言编程任务中达到64%的新SOTA成绩。 开源替代方案 使用Browser Use工具链,将R1与ChatGPT的API结合,构建支持Web自动化和多步问题解决的AI代理,成本仅为专有方案的10%。 五、结论与建议 合并使用DeepSeek R1和ChatGPT在技术可行性和性能提升潜力上具备显著优势,尤其适合需要兼顾逻辑严谨性与创意灵活性的场景(如教育、企业级应用)。 但需注意: 优先场景:复杂技术问题解答、多模态任务协作、长流程自动化; 规避场景:单一领域任务(如纯创意写作)或资源受限环境。 若需实际部署,建议参考开源工具链(如Ollama或Modular MAX)进行初步验证,再逐步优化集成策略。
2 个月前
OpenAI 对 GPT-5 的愿景集中于创建一个“统一智能”系统,无缝整合多种 AI 功能。这种方法旨在消除用户在不同模型之间进行选择的需求,而是提供一个单一且强大的 AI,能够轻松处理各种任务。主要目标包括: 将语音交互、画布操作、搜索功能和深度研究能力等高级功能整合到一个统一的系统中。 增强自然语言处理和推理能力,以在特定任务中实现“博士级智能”。 改进多模态处理,更好地理解和生成基于文本、图像以及可能的视频的响应。 扩展上下文窗口,以便处理和记住来自先前交互的更多信息。 简化用户体验,通过移除模型选择器并在不同订阅层级中提供不同的智能水平。 链式思维模型的介绍 OpenAI 即将推出的 GPT-5 预计将引入先进的链式思维(CoT)能力,大幅提升其推理和解决问题的能力。这个新模型可能会具备改进的多模态处理功能,整合文本、图像,甚至可能包括视频输入。Sam Altman 暗示,GPT-5 将展现出更好的推理能力,犯错更少,并且输出更加可靠。这些 CoT 提示的进步旨在通过结构化的思维过程引导 AI,将复杂任务分解为可管理的步骤,从而生成更准确和连贯的响应。 增强的多模态处理能力 GPT-5 将通过增强的多模态处理能力彻底改变人工智能交互,这是 Sam Altman 强调的一个关键重点。这一进步将使模型能够无缝集成文本、图像、音频和视频的输入和输出。主要功能包括: 语音到语音功能,实现更自然的对话交互。 改进的图像处理和生成,基于之前集成的成功经验。 视频支持,标志着人工智能在理解和生成视听内容方面的重大飞跃。 多种数据类型的统一处理,创造更统一且具有上下文感知的人工智能体验。 这些改进预计将为人工智能在各个行业的应用打开新的可能性,从创意内容生成到医疗和教育等领域更复杂的问题解决。
4 个月前
微软研究院表示,现在的AI具备更强的推理能力,AI模型很快将能够处理更复杂的任务。未来将比ChatGPT等传统的聊天机器人更强大,微软正在利用AI代理来连接整个组织的员工,而且透过硬体升级AI将变得更加节能。 周四OpenAI也表示,将推出高价版的聊天机器人ChatGPT Pro新订阅服务,专门为工程和研究板块设计,月费达到200美元。 AI应用持续往前推动,华尔街方面也正密切关注硅谷,在AI上的巨额投资能否带来营收增长。
8 个月前
Fal.ai通过为生成模型提供最快的推理,使开发人员能够创建响应式、沉浸式且经济高效的体验。
8 个月前
DCLM-Baseline-7B是在DCLM-Baseline数据集上训练的70亿参数语言模型。
8 个月前
英伟达在AI和计算领域的多项创新应用与解决方案,涵盖了从数字人类构建、生成式AI集成、到药物发现模拟等多个方面。
8 个月前
对于 Alexa 来说,这意味着它有机会突破传统的语音指令响应模式,能够像人类一样进行创造性的对话,更好地满足用户日益复杂和多样化的需求。
9 个月前
一款由前字节跳动前员工创立的AI伴侣产品——CrushOn在海外市场小有成绩。