null | AI地域

type

status

date

slug

summary

Anthropic Claude 推出全新 Glassy 语音，语音模式再升级

近日，Anthropic 公司为其备受瞩目的 Claude AI 移动应用推出了重大更新，新增了名为"Glassy"的语音选项。这一创新举措标志着 Claude 语音模式开发的又一里程碑。"Glassy"语音以其独特而迷人的音色迅速在社交媒体上走红，被誉为 Claude 迄今为止最吸引人的语音选择之一。用户现在可以通过 Claude 官方镜像站点：https://claude.aigc.bar 抢先体验这一全新功能，感受 AI 语音交互的未来。

Claude AI 语音模式的核心功能

Claude 的最新更新为用户带来了多项令人兴奋的功能升级，以下是主要亮点：

全新"Glassy"语音：新增的"Glassy"语音以其清脆、富有人性化的音色，为用户提供更加自然、沉浸式的交互体验。它与现有的"Airy"、"Mellow"和"Buttery"（英式口音）语音选项共同构成了多样化的选择，满足不同用户的需求。

双向语音交互：用户可以通过语音输入（最长可达 10 分钟）与 Claude 进行实时对话，AI 将以语音或文本形式进行响应。这一功能类似于 ChatGPT 的 Advanced Voice Mode，为用户带来流畅、自然的对话体验。

文件上传与分析：语音模式界面集成了上传功能，支持用户上传相机拍摄的照片、图库中的图片或各类文件（如 PDF、图片等），并可直接与 Claude 讨论上传内容，例如分析图表或文档中的数据。

Google Workspace 集成：新增了对 Gmail、Google Calendar 和 Google Drive 的搜索功能（Beta 版），用户可以通过语音查询邮件、日程或云端文件，极大地提升了生产效率。

隐私与安全：Claude 高度重视用户隐私，语音输入采用端到端加密技术，音频记录在转录后立即删除，且不会用于模型训练。Pro 和 Team 计划的用户还可以自定义数据保留策略，确保信息安全。

这些功能使 Claude 在个人助手和企业生产力场景中展现出强大的竞争力，挑战了 OpenAI 的 ChatGPT 和 Google 的 Gemini Live。

技术架构：Claude 3.7 Sonnet 模型的强大支持

Claude 语音模式的开发基于 Anthropic 的 Claude 3.7 Sonnet 模型，该模型具备强大的多模态推理能力，能够整合语音、文本和图像等多种输入形式，支持复杂任务如文档分析和实时对话。以下是其核心技术亮点：

技术特性	描述
多模态推理	基于 Claude 3.7 Sonnet 模型（可能超 200B 参数），支持语音、文本和图像处理。
语音合成引擎	优化"Glassy"等语音的音色、语调与流畅度，确保自然对话体验。
语音转录系统	支持最长 10 分钟的语音输入，自动转录为文本，转录准确率达 98% 以上。
高效推理	利用 AWS 与 GCP 云端推理，推荐 16GB RAM 设备以支持流畅语音交互。

此技术架构确保了 Claude 在语音交互中的高效性和可靠性，为用户提供接近人类助手的交互体验。

应用场景：从个人助手到企业生产力

Claude 语音模式的更新为个人和企业用户带来了广泛的应用场景，以下是主要用途：

个人助手：通过"Glassy"语音快速查询信息（如"查找明天的航班"）或生成创意内容（如"用英式口音讲故事"），提升移动端交互效率。

企业工作流：结合 Google Workspace 集成，用户可以通过语音查询邮件或日程（如"查找上周的会议记录"），甚至自动化生成报告。例如，一位销售经理利用 Claude 的"Glassy"语音和 Google Drive 搜索功能，快速汇总客户资料并生成会议简报，将准备时间缩短了约 50%。

教育与研究：学生和研究人员可以上传学术论文或讲义，与 Claude 进行语音讨论，快速获取分析和总结，降低学习和研究的门槛。

内容创作：创作者可以利用 Claude 生成播客脚本或社交媒体内容，并通过文件上传功能优化创意流程，适用于 TikTok、Instagram 等平台的营销活动。

开发者生态：开发者可以通过官方 API 将 Claude 的语音模式集成到定制应用中，如智能客服系统或教育平台，拓展应用场景。

这些场景展示了 Claude 语音模式在提升效率和创造力方面的巨大潜力。

上手指南：快速体验 Glassy 语音

要体验 Claude 的"Glassy"语音及其强大的语音模式功能，用户可以访问 Claude 官方镜像站点：https://claude.aigc.bar，进入选车claude账号

确保设备支持语音权限。

点击提示区域的麦克风图标，选择"Glassy"语音。

录制最长 10 分钟的语音输入，与 Claude 进行对话。

上传文件（如 PDF 或图片）或查询 Google Workspace 数据（如"查找日历中的下周会议"）。

调整语音选项（Airy、Mellow、Buttery 或 Glassy），测试不同音色与交互场景。

建议提供清晰的语音输入，并测试文件上传功能以优化多模态交互。目前语音模式仅支持英语，确保流畅体验。

社区反响与改进方向

自"Glassy"语音发布以来，社区对其音色多样性和交互自然度给予了高度评价。用户表示，"Glassy"为 Claude 注入了更人性化的对话魅力，使其在教育和企业场景中的应用潜力堪比 ChatGPT 的语音模式。然而，部分用户反馈语音模式初期仅限英语，限制了全球用户体验，建议加速多语言支持。此外，社区还期待视频交互功能和更低的硬件要求。

Anthropic 回应称，多语言支持和视频模式已在开发中，预计 2025 年底前推出。未来，Claude 语音模式可能与微服务框架或图像生成技术整合，构建从语音到多模态生成的闭环生态。

未来展望：语音交互与 AGI 的桥梁

Claude 语音模式的持续开发标志着 Anthropic 在人机交互与通用人工智能（AGI）领域的深远布局。通过引入"Glassy"语音和 Google Workspace 集成，Claude 在生产力场景中展现出强大的竞争力，直接挑战了 OpenAI 的 ChatGPT 和 Google 的 Gemini Live。

社区已在探讨将其与 3D 环境生成或 WhatsApp 集成结合，构建从虚拟助手到沉浸式交互的生态。长远来看，Claude 语音模式有望推出"语音插件市场"，提供定制化音色和 API 服务，类似模型生态。预计 2025 年，Claude 将在多语言支持、视频交互和企业级部署方面取得显著进展。

结语

Anthropic Claude 的最新更新为 AI 语音交互树立了新的标杆。通过引入"Glassy"语音和一系列创新功能，Claude 不仅提升了用户体验，还为个人和企业用户带来了前所未有的便利。现在就访问 Claude 官方镜像站点：https://claude.aigc.bar，亲身体验这一革命性的 AI 技术吧！

https://pic1.imgdb.cn/item/67e41f420ba3d5a1d7e460c6.png