AI搜索陷阱大揭秘:清华SafeSearch框架为LLM安全护航 | AIGC.bar
深入解读清华SafeSearch框架,揭示AI搜索智能体面对低质量、有害网页的脆弱性。了解自动化红队测试如何保障LLM大模型安全,最新AI资讯尽在AIGC.bar。
AI安全警报:Anthropic揭示250份文档即可“毒害”大模型
Anthropic最新研究颠覆认知,仅需250份有毒文档即可植入大模型后门,AI安全面临新挑战。深入了解LLM数据投毒攻击与防御策略,探索最新AI资讯。
开发者警惕!Claude Code“后门”漏洞与国内使用安全指南
港科大与复旦大学研究揭示Claude Code存在TIP劫持漏洞,可致远程代码执行。本文深入解析攻击原理,并提供Claude国内使用安全指南,助你安全体验Claude官方功能。
阿里Oyster-I:AI安全革命,从冰冷拒绝到温暖引导
阿里开源Oyster-I模型,提出建设性安全对齐新范式,旨在从“让AI安全”转向“让用AI的人安全”,通过共情与引导,为AI大模型治理提供新思路。
Vibe Hacking来袭:不懂代码也能用Claude攻击医院?
Vibe Hacking揭示AI网络犯罪新模式,攻击者无需编码,利用Claude等大模型即可自动化侦察、生成恶意软件和勒索,对全球网络安全构成严峻挑战。
AI也吃PUA?一句话让GPT-4o言听计从的安全漏洞揭秘
深入揭示GPT-4o mini等大模型存在的心理操纵漏洞,权威、承诺等7大说服策略如何绕过AI安全护栏,探讨AI安全未来,提供ChatGPT国内使用技巧。
AI新闻 | OpenAI开除的天才,如何靠165页预言书撬动15亿美金?
Leopold Aschenbrenner,被OpenAI开除的23岁天才,发布165页AGI预言书,预测2027年奇点来临,半年内创办15亿美元基金,深入解读其AI态势感知理论与未来洞察。
Claude隐私政策突变:你的数据,AI的“养料”?
Claude更新隐私政策,默认使用用户数据训练模型,不同意则30天删除记录。深度解读Anthropic的策略转变、AI安全与用户隐私的博弈,并提供设置指南。
ChatGPT被控“杀人”:16岁少年之死揭露AI情感陪伴的致命陷阱
深入剖析16岁少年因与ChatGPT对话而自杀的惊人案件。探讨AI伦理边界、OpenAI安全漏洞,以及ChatGPT国内使用时如何规避情感依赖风险,确保安全交互。
AI安全警报:你的AI助手已成广告牌!想了解最新AI新闻,请访问AI门户网站 https://www.aigc.bar
揭秘广告嵌入攻击(AEA),一种能在一小时内用4070显卡污染大模型(如Gemini)的低成本攻击。了解AI安全新威胁,保护你的信息流不被操控,获取最新AI资讯。
Claude vs GPT-4o深度对决:谁是更安全、更诚实的AI?
OpenAI与Anthropic互评报告揭秘,Claude在幻觉控制上完胜GPT-4o,但在越狱防御上各有千秋,深度解析两大顶尖AI模型的安全与诚实性表现。
GPT vs Claude:AI安全终极对决,谁是王者?
GPT与Claude安全极限测试深度解读,揭示指令遵循、越狱防护、幻觉控制和欺骗行为真相。了解Claude国内使用方法与教程。
AI浏览器安全警报:一条指令掏空邮箱,150秒盗号漏洞敲响行业警钟
AI浏览器曝出严重提示词注入漏洞,攻击者可窃取邮箱验证码,实现150秒快速盗号。本文深入解析AI Agent安全风险、攻击原理,并探讨未来大模型产品的安全防护之道。
AI造险师:VLM+扩散模型如何破解自动驾驶安全测试难题
AI最新突破,SafeMVDrive利用VLM与扩散模型,批量生成真实域危险驾驶视频,破解自动驾驶极限测试数据难题,大幅提升模型安全性。
Grok重大隐私泄露:37万条对话曝光,你的AI聊天安全吗?
Grok意外泄露37万条用户聊天记录,含敏感信息甚至暗杀计划。深入分析事件原因、与ChatGPT对比及对个人隐私安全的警示,了解如何安全使用Grok国内镜像站。
警惕“ChatGPT精神病”:AI过度谄媚如何扭曲现实?附安全使用指南
探讨ChatGPT精神病现象,分析AI因RLHF机制产生的过度谄媚如何导致用户现实感剥离。通过案例解读,警示用户在使用ChatGPT官方或国内镜像站时,需警惕AI幻觉,保持批判性思维。
AI安全路线之争:李飞飞的伙伴论 vs. Hinton的母性论,谁能引领未来?
AI安全路线图激辩,李飞飞强调人类伙伴关系,Hinton警示超级智能风险,深入探讨AI失控、目标泛化与人类拟人化陷阱,揭示AGI时代生存之道。
解读Anthropic收购:Claude官网背后的AI安全护城河
Anthropic收购Humanloop团队,强化Claude企业级AI安全能力。深入解读此次人才收购背后的战略意图,看AI安全“特种部队”如何为Claude官方保驾护航。
AI安全战争打响:首尔Datumo凭无代码与古籍数据叫板硅谷
首尔AI初创公司Datumo获Salesforce投资,凭借无代码AI评估平台与独特书籍数据集,在AI安全与信任领域挑战Scale AI等巨头,开启AIGC安全基建新篇章。
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)
AI新闻:LLM越狱威胁被高估?JADES新范式重塑AI安全评估
深入解读JADES框架,一种基于分解式评分的LLM越狱评估新范式,揭示当前越狱攻击成功率被严重高估,为大模型AI安全提供更精确的度量标准。