智能手机领域的两大竞争对手苹果和三星,纷纷在 AI 领域又有新动向。
苹果计划在今年下半年大幅提高新款手机 iPhone 16的出货量,至少达到9000万部,主要认为其新推出的“苹果智能”系统或提振新款手机的需求。
而三星于7月9日推出了新款的 AI 折叠屏手机,主打更轻、更薄,且搭载人工智能。三星押注消费者会愿意为更高端的 AI 智能机付出更高的价格,因此此次三星也提高了两款新手机的起售价,分别为1900美元和1100美元,较上一代机型均高出了100美元。
新闻来源:央视财经

3 个月前
2025年10月29日,苹果公司发布了名为Pico-Banana-400K的大规模研究数据集,旨在推动文本引导图像编辑技术的发展。 数据集概况:Pico-Banana-400K包含40万张图像,其研究论文题为《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》。该数据集采用非商业性研究许可发布,学术机构和研究人员可免费使用。 构建过程:研究团队首先从OpenImages数据集中选取大量真实照片,以确保图像内容的多样性,涵盖人物、物体及含文字场景等。然后设计了35种不同类型的图像修改指令,将其归入像素与光度调整、以人为中心的编辑、场景构成与多主体编辑等八大类别。接着,把原始图像与编辑指令输入至Nanon-Banana模型进行图像编辑,生成结果由Gemini 2.5-Pro模型进行自动评估,只有通过双重验证的结果才会被纳入最终数据集。 数据集构成: 单轮监督微调整子集:包含25.8万个成功的单轮图像编辑示例,涵盖了35种编辑分类法的全部范围,为模型训练提供强大的监督信号。 多轮编辑集:包含7.2万个按顺序进行的编辑交互示例,序列长度从2到5轮不等,用于研究连续修改中的顺序编辑、推理与规划。 偏好集:包含5.6万个示例,由原始图像、指令、成功编辑和失败编辑组成的三联体,可用于训练奖励模型和应用直接偏好优化等对齐技术。 长短指令配对集:用于发展指令重写与摘要能力。 发布意义:尽管Nanon-Banana在精细空间控制、布局外推和文字排版处理方面仍存在局限,但Pico-Banana-400K为下一代文本引导图像编辑模型提供了一个坚实、可复现的训练与评测基础。目前,相关研究论文已发布于预印本平台arXiv,完整的Pico-Banana-400K数据集也已在GitHub上向全球研究者免费开放。 (新闻来源:github.com/apple/pico-banana-400k )

11 个月前
AI 国际简讯 2025年02月18日 微软发布OmniParser V2.0工具,用于识别和解析屏幕上的可交互图标,新版本提升交互图标解析能力。 Meta Reality Labs 的研究团队推出"Pippo"模型,可从普通照片生成1K分辨率的多视角视频。 苹果将在Vision Pro头戴设备中推出Apple Intelligence系统,提供书写工具、Genmojis表情和图像功能。 JetBrains更新"AI Assistant"应用,支持本地大语言模型调用,可直接使用DeepSeek等离线模型。

1 年前
谷歌举办了 made by google 2024 大会,pixel 9 手机采用了 g4 ai 芯片和支持 12/16g 的内存,可更顺滑地运行 gemini/gemma 语言模型,从而更好地支持 AI 使用场景,这是谷歌的第一款语言模型原生手机。 同时,谷歌推出了类似数月前 OpenAI 演示过的 AI 语音助手 gemini live,其可以直接用语音和用户流畅交流,但在一些功能上不如 OpenAI 被演示过的产品。 美国当地时间8月13日,谷歌正式拉开2024年度“Made by Google”大会序幕,旨在全面展示谷歌在硬件与软件领域的最新成果与创新。

1 年前
DCLM-Baseline-7B是在DCLM-Baseline数据集上训练的70亿参数语言模型。

1 年前
具有Apple AI功能的iOS 18 预览版发布, 让iPhone更个性、更强大、更智能。

1 年前
个人智能化系统 Apple Intelligence 为 iPhone、iPad 和 Mac 引入强大的生成式模型 Apple Intelligence 为人工智能隐私树立了新标准,它能够理解个人背景,从而提供有用且相关资讯。

1 年前
苹果推出“苹果智能”系统或提振新款手机的需求。 而三星推出了新款的 AI 折叠屏手机,主打更轻、更薄,且搭载人工智能。

1 年前
Home Accessory 产品不一定是 HomePod,改款硬件产品可能是一款类似于 iPad 的家庭机器人。
Minimax(海螺AI)已由大模型名Minimax替换原海螺AI。现海螺AI为Minimax视频生成产品名。
海螺AI