今夜,库克终极绝唱!25亿苹果设备用AI重生
type
status
date
slug
summary
tags
category
icon
password
网址

就在刚刚,Siri借谷歌的1.2万亿参数Gemini「重生」了!
在今夜的苹果WWDC 2026上,Siri彻底迎来新生。
结合设备端小模型,苹果打造了混合智能架构,让Siri在各个APP之间无缝穿梭。
从此,全球25亿台苹果设备,将被注入真正的上下文理解能力。
而且,这也是库克最后一次对我们说「早安」。
据说,在退役前库克深度介入,疯狂打磨Siri的各种细节。
今天,库克交卷了。
令人惊喜的是,苹果把Siri AI部署到了整个生态中,根据每个平台进行了定制。
iPhone、Mac、iPad、Apple Watch和Vision Pro中,都可以使用Siri AI了。
这一次,苹果凭借卖向全球的25亿设备,凭借自己对消费者意图的了解,走出了一条世界上绝无仅有的路。
可以说,从今天开始,苹果终于成为一家真正的AI公司!
今夜,苹果AI史诗级重构
此前,苹果就被曝出干了一件震动硅谷的大事——秘密联手宿敌谷歌,直接引入了Gemini和强大的云端算力支撑。
彻底重构后的Siri,究竟是什么样?
今天的WWDC上,它的神秘面纱彻底被揭开。
苹果AI全新架构,联手谷歌
首先,苹果为Apple Intelligence打造了全新架构。
它的核心是苹果基础模型,由端侧模型、私有云计算、系统调度器等共同组成。
这次,苹果跟谷歌展开深度合作,充分利用Gemini模型背后的技术,打造了全新一代的Apple Intelligence基础模型。
针对高频、低延迟、日常隐私敏感的任务,端侧模型能够直接在设备上直接运行,快速给出响应。
而针对复杂的推理和大规模任务,系统则会转向私有云计算,确保算力充足。
并且,为了充分发挥苹果芯片的潜能,苹果还在端侧设备上更进一步,设计了两种端侧模型。
标准端侧模型:满足绝大多数日常基础智能任务。
高级端侧模型(第二代高效端侧模型):专为配备高性能苹果芯片的系统而优化。
其中,高级端侧模型不仅能够高效理解文本与图像,语音理解和生成也很强大。
它实现了极高准确度的系统解听写 ,更强的自然语言理解能力,甚至人声也能传递更细腻的情感。
此外,新架构中还引入了系统调度器,成为整个系统的指挥官。它的工作流,有以下三个核心。
Spotlight语义索引:全新的语义索引,能真正理解内容背后的含义。多年前的照片,前几天随手的笔记,都能通过语义关联快速检索。
应用动作箱:调度器可以「工具箱」中抽取合适工具,来完成复杂的请求,比如读取特定邮件、编辑一组照片,用户无需在不同应用之间手动切换。
屏幕感知:实时感知当前屏幕上正在显示什么、用户在做什么,在恰当的时刻提供帮助。
Siri AI诞生!
重建语音助理,智商飞跃
今天,Siri AI上线了!
基于强大的 Apple Intelligence 底层,苹果把Siri AI全新升级了。
这一次,Siri AI彻底摆脱了「人工智障」的称号,它能理解情境,深层交互,还能自主行动,真正成为了你的AI助理!
而且,它还能跨平台应用。
场景一:查询音乐会并自动创建提醒
以前,要去听某个歌手的演唱会,我们要分别打开浏览器搜索日程、打开买票应用、手动记下日程。
现在,你可以直接和Siri AI对话,它会用世界知识来回答。
比如,旧金山那场Suki Waterhouse的演出是什么时候?怎么买票?
你可以命令它:抢票开始时提醒我报名。甚至,只要你下指令,它还能播放这位歌手的新单曲。
整个过程中,Siri AI的对话极度自然,毫不割裂。
场景二:屏幕感知与信息检索
接下来,是Siri对屏幕内容的感知。
比如,你想问一位朋友的新地址。你可以给Siri相册中的海岸照片,问它这是哪里?
Siri展现出强大的能力,识别出了照片的地标!「这里是美丽的圣克鲁斯海岸,具体位置是 Natural Bridges State Beach。」
你告诉它,我朋友最近搬到这附近了,Jeff的新家在哪儿?
要知道,Jeff只发了一条信息,但Siri在后台通过语义抖音,快速找到了这条信息,找到了地址。
接下来你可以命令Siri,「帮我导航到海岸边的这个拱门地标,中途在Jeff家停一下。」它调用了地图,一键生成了路线。
多个复杂的跨应用操作,Siri一气呵成。
场景三:零手操照片分类
假设你刚从度假地回来,相册里积累了上百张照片,想要找出特定的照片分享给家人,直接找Siri就可以了。
「帮我找出上周末在沙斯塔山拍的照片」,Siri会瞬时检索相册,展示出符合时间与地理位置的大量图片。
再下命令,「只把里面有 Bryce、Madison 和 Quinn 的照片挑选出来,加到我们共享的家庭相册里」。
这时,Siri会自动人脸识别,找到照片,直接后台推送到共享相册。这个过程中,完全不用打开相册。
Siri的听觉体验,华丽蜕变
而且,这次Siri AI的升级不仅在大脑上,也在声音和耳朵上。
因为端侧语言和语音模型的融合,新版Siri的发音情绪起伏极为丰富,非常像真人。
你还可以微调它的发音风格、语调、语速,独家定制自己喜欢的声音。
它的听写能力也大幅提升,无论是在嘈杂地铁上给朋友发短信,还是用日记长篇口述,它都能实现高精度的拼写、标点符号及大小写判定,几乎不用二次修改。
多轮对话,情境整合
iOS端的Siri AI,具备极强的多轮对话和情境整合能力。
比如可以问它:世界杯开幕的赛程是什么样的?它会给出赛程列表。
用户看到巴西对摩洛哥的比赛,决定举办一次观赛派对,让Siri介绍两国的特色菜肴。
Siri结合世界知识,给出了经典菜品,还附带了食物照片。
用户问:我女儿想贡献个倡议,她最近提到的甜点是什么?
Siri在后台搜索了手机短信和聊天记录,找到了答案——椰子饼干。
最终,Siri把这些元素整合到一起,自动整理好一切信息,拟好派对邀请,用户只要点击发送,就能通知到所有好友了。
MacOS里的Siri生产力大提升
在 Mac 平台上,通过将 Siri AI 内置在 Spotlight 搜索中,让我们的日常效率大大提升。
现在,我们想为学校或社区建立一个创客空间。
首先,可以在Spotlight 中直接输入:「如何在棚屋里建造创客空间」?
搜索框会自动识别,转为 Siri 交互,在侧边对话框给出方案。
我们有三份不同厂商的报价单,可以直接让Siri来对比。它立刻生成对比表格,清晰列出各方面优劣。
儿子提过学校原先的方案有电路故障,问Siri:「Luke 提到过一个电学问题,哪一个能解决?」(就算拼错单词,它都能自动容错)。
Siri AI 随即在后台搜索邮件和短信,找到儿子发过的故障描述,给出明确的选购建议。
最后,它给厂商写好了邮件,自动抓取了厂商联系人名字和具体选购理由。
而且,Siri在整个产品中都是通用的。
你可以把它在iPhone上打开,在iPad上继续中断的工作,在Mac上还继续可用。
更是神奇的是,在Vision Pro上,你不需要说嘿siri,只要看着Siri,就可以开始说话。
视觉智能,看你所看
多模态的终极奥义,是让AI实时理解外部物理世界,和屏幕上的画面。
Siri AI这一次带来的视觉智能,将这一愿景落地了!
首先,在iPhone上,视觉智能被整合进原生相机APP中,成为全新的「Siri Mode」。
在iPhone相机里,按下快门就能让它「看你所看」——
对着一盘菜能给营养分析,对着账单能帮你AA分账。
Mac、iPad上,Siri也都能用快捷键或截图唤起。
比如,在iPad上,想要查看日程安排,打开可视化界面,一次性将多个事件添加到日历。
在 Vision Pro 上,视觉智能更是跟「空间计算」和「注视点追踪」完美结合。
Vision OS直接让交互彻底变成科幻电影!看一眼,Siri 就懂了。
得益于强大的空间感知与多模态理解能力,Siri不仅能精准识别眼前事物,还能无缝融合你的个人上下文背景。
比如只需一个眼神,Siri 就能秒算物理空间告诉你,「那双靴子能放进那个牌子的背包,不过会挤爆」。
随时随地,Siri写作
不仅如此,在任何能打字的地方,你都能让Siri帮你起草、润色;
它甚至会模仿你跟特定同事/朋友的沟通风格——你平时给老板发简短要点,它就给你简短要点。
全系统还加了自动校对,连大多数第三方App都覆盖了。
顺便提一句,在国内完成监管期间,Siri AI暂不可用。
苹果AI,灌进每一个APP
如果说Siri是主角,那这次真正「润物细无声」的,是Apple Intelligence钻进了所有App里。
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)