今夜,库克终极绝唱!25亿苹果设备用AI重生

type
status
date
slug
summary
tags
category
icon
password
网址
notion image
就在刚刚,Siri借谷歌的1.2万亿参数Gemini「重生」了!
在今夜的苹果WWDC 2026上,Siri彻底迎来新生。
结合设备端小模型,苹果打造了混合智能架构,让Siri在各个APP之间无缝穿梭。
从此,全球25亿台苹果设备,将被注入真正的上下文理解能力。
而且,这也是库克最后一次对我们说「早安」。
据说,在退役前库克深度介入,疯狂打磨Siri的各种细节。
今天,库克交卷了。
令人惊喜的是,苹果把Siri AI部署到了整个生态中,根据每个平台进行了定制。
iPhone、Mac、iPad、Apple Watch和Vision Pro中,都可以使用Siri AI了。
这一次,苹果凭借卖向全球的25亿设备,凭借自己对消费者意图的了解,走出了一条世界上绝无仅有的路。
可以说,从今天开始,苹果终于成为一家真正的AI公司!
今夜,苹果AI史诗级重构
此前,苹果就被曝出干了一件震动硅谷的大事——秘密联手宿敌谷歌,直接引入了Gemini和强大的云端算力支撑。
彻底重构后的Siri,究竟是什么样?
今天的WWDC上,它的神秘面纱彻底被揭开。
苹果AI全新架构,联手谷歌
首先,苹果为Apple Intelligence打造了全新架构。
它的核心是苹果基础模型,由端侧模型、私有云计算、系统调度器等共同组成。
这次,苹果跟谷歌展开深度合作,充分利用Gemini模型背后的技术,打造了全新一代的Apple Intelligence基础模型。
针对高频、低延迟、日常隐私敏感的任务,端侧模型能够直接在设备上直接运行,快速给出响应。
而针对复杂的推理和大规模任务,系统则会转向私有云计算,确保算力充足。
并且,为了充分发挥苹果芯片的潜能,苹果还在端侧设备上更进一步,设计了两种端侧模型。
标准端侧模型:满足绝大多数日常基础智能任务。
高级端侧模型(第二代高效端侧模型):专为配备高性能苹果芯片的系统而优化。
其中,高级端侧模型不仅能够高效理解文本与图像,语音理解和生成也很强大。
它实现了极高准确度的系统解听写 ,更强的自然语言理解能力,甚至人声也能传递更细腻的情感。
此外,新架构中还引入了系统调度器,成为整个系统的指挥官。它的工作流,有以下三个核心。
Spotlight语义索引:全新的语义索引,能真正理解内容背后的含义。多年前的照片,前几天随手的笔记,都能通过语义关联快速检索。
应用动作箱:调度器可以「工具箱」中抽取合适工具,来完成复杂的请求,比如读取特定邮件、编辑一组照片,用户无需在不同应用之间手动切换。
屏幕感知:实时感知当前屏幕上正在显示什么、用户在做什么,在恰当的时刻提供帮助。
Siri AI诞生!
重建语音助理,智商飞跃
今天,Siri AI上线了!
基于强大的 Apple Intelligence 底层,苹果把Siri AI全新升级了。
这一次,Siri AI彻底摆脱了「人工智障」的称号,它能理解情境,深层交互,还能自主行动,真正成为了你的AI助理!
而且,它还能跨平台应用。
场景一:查询音乐会并自动创建提醒
以前,要去听某个歌手的演唱会,我们要分别打开浏览器搜索日程、打开买票应用、手动记下日程。
现在,你可以直接和Siri AI对话,它会用世界知识来回答。
比如,旧金山那场Suki Waterhouse的演出是什么时候?怎么买票?
你可以命令它:抢票开始时提醒我报名。甚至,只要你下指令,它还能播放这位歌手的新单曲。
整个过程中,Siri AI的对话极度自然,毫不割裂。
场景二:屏幕感知与信息检索
接下来,是Siri对屏幕内容的感知。
比如,你想问一位朋友的新地址。你可以给Siri相册中的海岸照片,问它这是哪里?
Siri展现出强大的能力,识别出了照片的地标!「这里是美丽的圣克鲁斯海岸,具体位置是 Natural Bridges State Beach。」
你告诉它,我朋友最近搬到这附近了,Jeff的新家在哪儿?
要知道,Jeff只发了一条信息,但Siri在后台通过语义抖音,快速找到了这条信息,找到了地址。
接下来你可以命令Siri,「帮我导航到海岸边的这个拱门地标,中途在Jeff家停一下。」它调用了地图,一键生成了路线。
多个复杂的跨应用操作,Siri一气呵成。
场景三:零手操照片分类
假设你刚从度假地回来,相册里积累了上百张照片,想要找出特定的照片分享给家人,直接找Siri就可以了。
「帮我找出上周末在沙斯塔山拍的照片」,Siri会瞬时检索相册,展示出符合时间与地理位置的大量图片。
再下命令,「只把里面有 Bryce、Madison 和 Quinn 的照片挑选出来,加到我们共享的家庭相册里」。
这时,Siri会自动人脸识别,找到照片,直接后台推送到共享相册。这个过程中,完全不用打开相册。
Siri的听觉体验,华丽蜕变
而且,这次Siri AI的升级不仅在大脑上,也在声音和耳朵上。
因为端侧语言和语音模型的融合,新版Siri的发音情绪起伏极为丰富,非常像真人。
你还可以微调它的发音风格、语调、语速,独家定制自己喜欢的声音。
它的听写能力也大幅提升,无论是在嘈杂地铁上给朋友发短信,还是用日记长篇口述,它都能实现高精度的拼写、标点符号及大小写判定,几乎不用二次修改。
多轮对话,情境整合
iOS端的Siri AI,具备极强的多轮对话和情境整合能力。
比如可以问它:世界杯开幕的赛程是什么样的?它会给出赛程列表。
用户看到巴西对摩洛哥的比赛,决定举办一次观赛派对,让Siri介绍两国的特色菜肴。
Siri结合世界知识,给出了经典菜品,还附带了食物照片。
用户问:我女儿想贡献个倡议,她最近提到的甜点是什么?
Siri在后台搜索了手机短信和聊天记录,找到了答案——椰子饼干。
最终,Siri把这些元素整合到一起,自动整理好一切信息,拟好派对邀请,用户只要点击发送,就能通知到所有好友了。
MacOS里的Siri生产力大提升
在 Mac 平台上,通过将 Siri AI 内置在 Spotlight 搜索中,让我们的日常效率大大提升。
现在,我们想为学校或社区建立一个创客空间。
首先,可以在Spotlight 中直接输入:「如何在棚屋里建造创客空间」?
搜索框会自动识别,转为 Siri 交互,在侧边对话框给出方案。
我们有三份不同厂商的报价单,可以直接让Siri来对比。它立刻生成对比表格,清晰列出各方面优劣。
儿子提过学校原先的方案有电路故障,问Siri:「Luke 提到过一个电学问题,哪一个能解决?」(就算拼错单词,它都能自动容错)。
Siri AI 随即在后台搜索邮件和短信,找到儿子发过的故障描述,给出明确的选购建议。
最后,它给厂商写好了邮件,自动抓取了厂商联系人名字和具体选购理由。
而且,Siri在整个产品中都是通用的。
你可以把它在iPhone上打开,在iPad上继续中断的工作,在Mac上还继续可用。
更是神奇的是,在Vision Pro上,你不需要说嘿siri,只要看着Siri,就可以开始说话。
视觉智能,看你所看
多模态的终极奥义,是让AI实时理解外部物理世界,和屏幕上的画面。
Siri AI这一次带来的视觉智能,将这一愿景落地了!
首先,在iPhone上,视觉智能被整合进原生相机APP中,成为全新的「Siri Mode」。
在iPhone相机里,按下快门就能让它「看你所看」——
对着一盘菜能给营养分析,对着账单能帮你AA分账。
Mac、iPad上,Siri也都能用快捷键或截图唤起。
比如,在iPad上,想要查看日程安排,打开可视化界面,一次性将多个事件添加到日历。
在 Vision Pro 上,视觉智能更是跟「空间计算」和「注视点追踪」完美结合。
Vision OS直接让交互彻底变成科幻电影!看一眼,Siri 就懂了。
得益于强大的空间感知与多模态理解能力,Siri不仅能精准识别眼前事物,还能无缝融合你的个人上下文背景。
比如只需一个眼神,Siri 就能秒算物理空间告诉你,「那双靴子能放进那个牌子的背包,不过会挤爆」。
随时随地,Siri写作
不仅如此,在任何能打字的地方,你都能让Siri帮你起草、润色;
它甚至会模仿你跟特定同事/朋友的沟通风格——你平时给老板发简短要点,它就给你简短要点。
全系统还加了自动校对,连大多数第三方App都覆盖了。
顺便提一句,在国内完成监管期间,Siri AI暂不可用。
苹果AI,灌进每一个APP
如果说Siri是主角,那这次真正「润物细无声」的,是Apple Intelligence钻进了所有App里。
Loading...

没有找到文章