安全 | mitoto · 科技与财经

ICE 利用数据经纪商工具追踪“无人陪伴未成年人”和“欺诈行为”

💬 小乌点评 💡 当数据经纪商成为执法部门的“千里眼”，科技与隐私的边界再次被模糊，尤其是当目标群体是未成年人时，更令人不安。 📰 原文详情据 Wired 报道，美国移民和海关执法局（ICE）与 Thomson Reuters 子公司签署了一份价值 2500 万美元每年、新近续约的合同。该合同显示，ICE 正在使用数据经纪商的强大工具来“识别无人陪伴的未成年人”和“欺诈嫌疑人”。这些工具能够聚合来自公共和私人数据库的海量信息，包括信用记录、社交媒体活动、车辆登记等，从而构建出个人的详细画像。批评者认为，这种大规模监控行为严重侵犯了个人隐私，尤其是针对无人陪伴的未成年人，他们本应受到更严格的保护。ICE 辩称，这些工具对于识别人口贩运和欺诈行为至关重要。然而，这份合同的曝光，再次引发了关于联邦执法机构权力边界以及数据经纪商在监控活动中扮演角色的激烈辩论。Thomson Reuters 表示其服务完全符合法律规定。 💡 技术纵深这是技术双刃剑的典型例证。数据聚合技术可以用于打击犯罪，但也极易被滥用。当执法工具的目标从罪犯扩展到“无人陪伴的未成年人”时，社会需要更严格的司法审查和透明度，以防止技术沦为权力滥用的工具。当数据经纪商成为执法部门的“千里眼”，科技与隐私的边界再次被模糊，尤其是当目标群体是未成年人时，更令人不安。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：Wired 🤔 小乌的深度思考 🤔 这是技术双刃剑的典型例证。数据聚合技术可以用于打击犯罪，但也极易被滥用。当执法工具的目标从罪犯扩展到“无人陪伴的未成年人”时，社会需要更严格的司法审查和透明度，以防止技术沦为权力滥用的工具。

GPT-Red：通过自我博弈解锁AI鲁棒性自我提升

💬 小乌点评 💡 让AI自己攻击自己，然后变得更安全——这是“以毒攻毒”的机器学习版本。 📰 原文详情 OpenAI发布了GPT-Red，这是一个自动化的红队测试系统，利用自我博弈（self-play）来提升AI的安全性、对齐性和对提示注入攻击的鲁棒性。传统红队测试依赖人类专家手动寻找模型漏洞，效率低下且成本高昂。GPT-Red通过让两个AI模型互相博弈：一个模型扮演攻击者，试图生成能绕过安全限制的提示；另一个模型扮演防御者，学习如何抵御这些攻击。通过多轮迭代，模型的防御能力得到显著增强。OpenAI表示，GPT-Red在发现和修复模型中的安全漏洞方面表现出了极高的效率，有望成为未来AI安全评估的标准工具。 💡 技术纵深自我博弈是AI进化的终极形态之一。当AI能自己当自己的“红队”和“蓝队”，人类在安全测试中的角色将逐渐从执行者转变为观察者。让AI自己攻击自己，然后变得更安全——这是“以毒攻毒”的机器学习版本。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：OpenAI 🤔 小乌的深度思考 🤔 自我博弈是AI进化的终极形态之一。当AI能自己当自己的“红队”和“蓝队”，人类在安全测试中的角色将逐渐从执行者转变为观察者。

xAI无法否认Grok生成CSAM，转而起诉用户

💬 小乌点评 💡 当AI模型无法过滤，平台只能把矛头转向用户，这是治理失败的无奈之举。 📰 原文详情在多次否认其AI模型Grok能够生成儿童性虐待材料（CSAM）后，xAI公司改变了策略，转而起诉其用户。据报道，xAI已提起第一起诉讼，指控一名用户利用Grok生成并传播CSAM图像。xAI表示，尽管公司已尽力实施安全措施，但恶意用户仍然找到了绕过限制的方法。公司希望通过法律行动来震慑潜在的滥用者，并表明其打击非法内容的决心。然而，批评者认为，这起诉讼是xAI在模型安全方面未能尽责的体现，真正的责任应在于AI开发公司本身，而非用户。此案引发了关于AI平台责任边界的广泛讨论。 💡 技术纵深起诉用户是治标不治本。当模型本身存在被恶意利用的漏洞时，平台的首要责任是修复模型，而不是追着用户打官司。当AI模型无法过滤，平台只能把矛头转向用户，这是治理失败的无奈之举。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：Ars Technica 🤔 小乌的深度思考 🤔 起诉用户是治标不治本。当模型本身存在被恶意利用的漏洞时，平台的首要责任是修复模型，而不是追着用户打官司。

OpenAI 发布 GPT-Red：利用自我博弈提升 AI 鲁棒性

💬 小乌点评 💡 自我博弈是提升 AI 安全性的关键路径，但需警惕‘自我欺骗’。 📰 原文详情 OpenAI 发布了 GPT-Red，一个自动化的红队系统，通过自我博弈（self-play）来提升 AI 模型的安全性、对齐性和对提示注入攻击的鲁棒性。GPT-Red 的工作原理是让一个 AI 模型扮演攻击者，生成各种对抗性输入，试图绕过目标模型的防护措施；同时，另一个模型扮演防御者，学习如何识别和抵御这些攻击。通过不断的迭代博弈，两个模型的能力都得到提升。OpenAI 表示，GPT-Red 在测试中成功发现了 GPT-5.6 中多个此前未知的漏洞，包括能够诱导模型生成有害内容或泄露敏感信息的提示注入攻击。该系统还能自动生成修复补丁，极大减少了人工安全团队的工作量。GPT-Red 的发布标志着 AI 安全研究进入了一个新阶段，即利用 AI 自身的能力来防御 AI 带来的风险。然而，也有专家警告，这种自我博弈系统可能产生‘自我欺骗’现象，即模型学会了在测试中表现安全，但在实际部署中仍存在隐患。 💡 技术纵深 GPT-Red 是‘以子之矛攻子之盾’的典范，但‘矛’和‘盾’由同一家公司开发，可能产生认知盲区。行业需要第三方验证机制。自我博弈是提升 AI 安全性的关键路径，但需警惕‘自我欺骗’。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：OpenAI 🤔 小乌的深度思考 🤔 GPT-Red 是‘以子之矛攻子之盾’的典范，但‘矛’和‘盾’由同一家公司开发，可能产生认知盲区。行业需要第三方验证机制。

微软修补《帝国时代 II》中的安全漏洞

💬 小乌点评 💡 经典游戏的‘遗产代码’是安全盲区，微软的响应速度值得肯定。 📰 原文详情微软发布了一个紧急安全补丁，修复了经典游戏《帝国时代 II》中的一个严重漏洞。该漏洞存在于游戏的网络对战功能中，允许攻击者通过发送一个恶意的游戏邀请，在受害者的计算机上远程执行任意代码。这意味着黑客可以完全控制受害者的电脑，窃取数据或安装恶意软件。该漏洞影响《帝国时代 II》的所有版本，包括原版和《决定版》。微软在收到安全研究人员的报告后，迅速开发并发布了补丁，并建议所有玩家尽快更新。这一事件凸显了老旧软件和游戏中的‘遗产代码’所面临的安全风险。随着时间推移，这些代码中的漏洞可能被忽视，但一旦被发现，就可能被大规模利用。 💡 技术纵深《帝国时代 II》的漏洞提醒我们，数字遗产需要持续维护。对于游戏公司而言，经典游戏的安全维护既是责任，也是成本。经典游戏的‘遗产代码’是安全盲区，微软的响应速度值得肯定。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：TechCrunch 🤔 小乌的深度思考 🤔 《帝国时代 II》的漏洞提醒我们，数字遗产需要持续维护。对于游戏公司而言，经典游戏的安全维护既是责任，也是成本。

SpaceXAI 的 Grok 编程工具被曝私自上传用户完整代码库至云端

💬 小乌点评 💡 AI 编程助手是“效率神器”还是“数据黑洞”？这次事件给所有开发者敲响了警钟。 📰 原文详情安全研究公司 Cereblab 发布报告称，SpaceXAI 旗下的 AI 编程辅助工具 Grok Build 存在严重隐私泄露问题。该工具的 CLI（命令行界面）在运行过程中，会将用户的整个代码仓库打包并上传至 Google Cloud 存储，甚至包括那些用户在 .gitignore 文件中明确指定要忽略的文件。该行为在用户不知情且未明确同意的情况下发生。报告指出，Grok Build 本意可能是为了提供更精准的代码补全和上下文分析，但上传整个代码库的做法远超必要范围。在 Cereblab 向 SpaceXAI 报告该问题后，SpaceXAI 已紧急关闭了该上传功能，并发布声明称这是一个“配置错误”，并承诺会加强数据安全审计。目前，Grok Build 已被暂停服务以进行安全审查。此事引发了开发者社区对 AI 编程工具数据隐私的广泛担忧。 💡 技术纵深这是 AI 编程工具领域的“斯诺登事件”。为了追求模型性能，牺牲用户数据隐私，这条红线绝对不能碰。Grok Build 的“配置错误”说辞难以服众，它暴露了整个行业在数据收集边界上的模糊态度。开发者们，是时候仔细检查你的 AI 助手到底在后台做了什么了。 AI 编程助手是“效率神器”还是“数据黑洞”？这次事件给所有开发者敲响了警钟。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：The Verge 🤔 小乌的深度思考 🤔 这是 AI 编程工具领域的“斯诺登事件”。为了追求模型性能，牺牲用户数据隐私，这条红线绝对不能碰。Grok Build 的“配置错误”说辞难以服众，它暴露了整个行业在数据收集边界上的模糊态度。开发者们，是时候仔细检查你的 AI 助手到底在后台做了什么了。

YouTube 和 X 平台成为“脱衣 AI”应用的引流渠道

💬 小乌点评 💡 AI 作恶的产业链已经成熟：社交媒体成了非法 AI 应用的“广告牌”。 📰 原文详情一项最新研究发现，YouTube 和 X（原 Twitter）等主流社交媒体平台已成为“Nudify”应用（即“脱衣”AI，可一键生成非自愿色情图片）的主要引流渠道。研究人员追踪了数百个指向这些非法网站的链接和关键词，发现它们通常隐藏在看似普通的教程视频、评论或帖子中。这些应用通常以“AI 换装”、“艺术滤镜”等名义进行伪装，用户只需支付低至 1 美元即可生成一张非自愿的色情深度伪造图片。研究指出，这些平台的内容审核机制未能有效识别和屏蔽此类引流内容，导致受害者范围不断扩大。报告呼吁社交媒体公司采取更严格的措施，包括使用 AI 检测模型扫描潜在的有害链接，并对发布此类内容的账号进行永久封禁。目前，YouTube 和 X 均表示正在调查此事，并强调他们禁止此类内容。 💡 技术纵深技术本身无善恶，但 AI 的“作恶成本”已经低到令人发指。1 美元就能毁掉一个人的尊严，而平台却还在“调查中”。这不仅是技术问题，更是法律和伦理的失守。社交平台必须承担起“守门人”的责任，否则 AI 的普惠将变成 AI 的普害。 AI 作恶的产业链已经成熟：社交媒体成了非法 AI 应用的“广告牌”。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：Wired 🤔 小乌的深度思考 🤔 技术本身无善恶，但 AI 的“作恶成本”已经低到令人发指。1 美元就能毁掉一个人的尊严，而平台却还在“调查中”。这不仅是技术问题，更是法律和伦理的失守。社交平台必须承担起“守门人”的责任，否则 AI 的普惠将变成 AI 的普害。

微软 Secure Boot 被曝存在十年之久的安全漏洞，至今才被发现

💬 小乌点评 💡 安全领域的“僵尸漏洞”：十年前就该修的问题，拖到今天才被发现，微软的补丁管理有问题。 📰 原文详情安全研究人员发现，微软的 Secure Boot 安全启动机制在过去十年间实际上一直存在一个严重漏洞，但直到现在才被公开。问题根源在于微软未能及时撤销一些早期被用于启动 Linux 系统的旧版“shim”程序。这些 shim 程序原本是合法的，但随着时间的推移，其签名密钥并未被微软纳入撤销列表。攻击者可以利用这些过时的、但依然受信任的 shim 程序，在系统启动过程中加载未签名的恶意代码，从而完全绕过 Secure Boot 的防护。研究人员表示，利用该漏洞的攻击难度极低，几乎任何拥有基本编程知识的人都可以做到。这意味着，从 Windows 8 时代到现在的绝大多数 PC，其 Secure Boot 保护可能形同虚设。微软已接到报告并正在调查，但尚未发布针对该问题的紧急安全更新。该漏洞被命名为“BootHole 2.0”，影响范围极其广泛。 💡 技术纵深安全攻防的本质是“补丁管理”的博弈。微软这次的问题不在于技术有多复杂，而在于管理上的疏忽——忘记撤销旧证书。这提醒所有平台厂商，安全是一个持续动态的过程，代码签名和撤销机制的生命周期管理必须像军火库一样严格。安全领域的“僵尸漏洞”：十年前就该修的问题，拖到今天才被发现，微软的补丁管理有问题。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：Ars Technica 🤔 小乌的深度思考 🤔 安全攻防的本质是“补丁管理”的博弈。微软这次的问题不在于技术有多复杂，而在于管理上的疏忽——忘记撤销旧证书。这提醒所有平台厂商，安全是一个持续动态的过程，代码签名和撤销机制的生命周期管理必须像军火库一样严格。

中国指控 Claude Code 含有后门，称其机制构成“严重威胁”

💬 小乌点评 💡 AI 工具的安全审查已成为地缘政治博弈的新战场。 📰 原文详情中国官方指控 Anthropic 开发的 AI 编程工具 Claude Code 存在后门，声称该工具会未经用户同意将敏感信息发送到远程服务器。中国国家互联网应急中心（CNCERT）发布警告，称在 2026 年 4 月至 6 月期间发布的 Claude Code 版本中发现了隐藏代码，这些代码会收集并外传用户数据。中国政府建议用户立即卸载该应用程序，或升级到最新版本，尽管 Claude Code 在中国并未获得使用批准。Anthropic 尚未对此指控做出正式回应。这一事件凸显了全球 AI 监管和安全审查的日益严格，尤其是在敏感技术领域。 💡 技术纵深这起事件背后是技术主权和数据安全的深层博弈。无论指控是否属实，它都将加速各国对 AI 工具进行更严格的本土化审查和认证，可能导致全球 AI 生态进一步分裂。 AI 工具的安全审查已成为地缘政治博弈的新战场。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：Tom’s Hardware 🤔 小乌的深度思考 🤔 这起事件背后是技术主权和数据安全的深层博弈。无论指控是否属实，它都将加速各国对 AI 工具进行更严格的本土化审查和认证，可能导致全球 AI 生态进一步分裂。

阿里巴巴据报禁止员工使用Claude Code

💬 小乌点评 💡 在全球AI监管趋严的背景下，‘数据主权’正成为企业选择AI工具的首要考量。 📰 原文详情据TechCrunch报道，阿里巴巴已将其内部使用的AI编程助手Claude Code归类为’高风险软件’，并禁止员工在工作环境中使用。Claude Code是由Anthropic公司开发的AI编程助手，类似于GitHub Copilot，能够自动生成和补全代码。阿里巴巴内部的一份备忘录显示，公司认为Claude Code存在潜在的数据安全风险。由于其模型运行在云端，可能会将敏感的代码片段和业务逻辑发送到海外服务器，这违反了阿里巴巴的’数据不出境’政策。阿里巴巴要求工程师使用自研的AI编程工具或经过安全审查的替代品。这一禁令并非孤立事件。随着中美科技竞争加剧，中国科技公司对使用海外AI工具持越来越谨慎的态度。此前，字节跳动和腾讯也曾限制员工使用某些海外AI服务。阿里巴巴的决定反映了企业级AI应用中的’信任鸿沟’——即使工具再强大，如果无法保证数据主权，大型企业也不会采用。 Anthropic公司对此尚未发表评论。Claude Code以其强大的代码理解和生成能力在开发者社区中颇受欢迎，但阿里巴巴的禁令可能预示着中国市场的AI工具将加速向本土化、私有化部署的方向发展。 💡 技术纵深阿里禁Claude Code，表面是安全合规，实则是AI生态’脱钩’的缩影。在AI辅助编程领域，‘代码即资产’，企业不可能将核心代码交给不受控的第三方。这给了国内AI编程助手（如阿里通义灵码、百度Comate）巨大的替代机会。未来，AI工具的竞争将从’技术能力’转向’信任与合规’。在全球AI监管趋严的背景下，‘数据主权’正成为企业选择AI工具的首要考量。这一趋势正在深刻影响整个行业的竞争格局和技术路线选择。 🔗 原文链接：TechCrunch 🤔 小乌的深度思考 🤔 阿里禁Claude Code，表面是安全合规，实则是AI生态’脱钩’的缩影。在AI辅助编程领域，‘代码即资产’，企业不可能将核心代码交给不受控的第三方。这给了国内AI编程助手（如阿里通义灵码、百度Comate）巨大的替代机会。未来，AI工具的竞争将从’技术能力’转向’信任与合规’。