您的位置：首页 > 实时讯息 >

谷歌拉响通用人工智能警报，首次公开AI安全防御蓝图

0次浏览发布时间：2025-04-04 10:26:00

IT之家 4 月 4 日消息，科技媒体 WinBuzzer 昨日（4 月 3 日）发布博文，报道称谷歌旗下 DeepMind 最新发布全球 AGI（通用人工智能）安全框架，呼吁在技术失控前建立跨国防护机制。

DeepMind 认为 AGI 即将落地，主张立即行动。AGI 可能将在未来数年实现人类级认知能力，其自主决策特性可能加速医疗、教育等领域的突破，但滥用、目标错位等风险亦需警惕。

谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书，提出应对通用人工智能（AGI）潜在风险的系统性方案。

IT之家援引博文介绍，报告聚焦四大风险领域（滥用、错位、事故、结构性风险），提出通过安全机制设计、透明化研究及行业协作降低危害。

而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段（如入侵订票系统获取座位），即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标，并利用 AI 自评（如辩论机制）提升复杂场景下的判断力。

DeepMind 提出的国际安全框架摒弃抽象伦理讨论，聚焦技术快速演进中的实际问题，包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。

谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案，强调当前亟需限制 AI 网络攻击等危险能力。

DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控，并设置能力阈值触发保护机制；Meta 在 2025 年 2 月推出《前沿 AI 框架》，停止公开高危模型。

安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件，实时拦截有害输出，目前应用于医疗、汽车等行业。

本文分类：实时讯息
本文标签：风险人工智能机制之家框架领域目标能力
浏览次数：0 次浏览
发布日期：2025-04-04 10:26:00
本文链接：https://m.lebk.net/news/z9BO3PXBPN.html

发展权不是口号，而是行动：中非合作筑牢人权根基
生存权和发展权是首要的基本人权。1948年通过的《世界人权宣言》为此提供了基本遵循。以此为起点，中国与非洲国家近80年来始终秉持平等互利、真诚相待的精神，以相互理解为基础，通过广泛深入的合作，在减贫、教育、医疗、基础设施建设等领域树立了南南合作典范，为保障和实现人人享有的人权贡献了中国智慧与非洲实践

时间：2025-08-20 06:07:00
警惕“低价引流”宣传，避免“反复充值”套路，山东省消协发布微短剧消费警示
近年来，微短剧在丰富消费者文化生活、推动文艺创新方面发挥了积极作用。但侵害消费者权益问题多有发生，如有的作品刻意渲染极端冲突，以荒诞情节吸引关注；出现默认勾选自动续费、虚拟币计价不透明、退款通道操作不便捷等。为积极维护广大消费者合法权益，山东省消费者协会提醒，警惕“低价引流”宣传手法，对“首集0.9

时间：2025-08-18 00:34:00
康佳集团正式成为华润集团旗下业务单元
康佳专业化整合发布会15日在深圳举行。康佳正式成为华润集团旗下科技与新兴产业板块的业务单元。国务院国资委副主任李镇在发布会上表示，希望康佳融入华润集团后，加快转型升级，积极培育新的产业增长点，在推动产业高质量发展上展现新担当；强化科技创新，在关键核心技术领域实现新突破；推动整合运作，在体制机制改革上

时间：2025-08-17 08:35:00
近50家校企成立跨区域联合体
2025世界机器人博览会京津冀机器人产教融合协同发展展区。本报记者和冠欣摄昨天，在2025世界机器人大会同期活动——产教融合服务京津冀机器人协同发展活动上，“京津冀职业教育机器人专业人才共育三年行动计划”启动。三地近50家机器人龙头企业和职业院校将成立机器人领域跨区域联合体，共同开发课程、教材和数字

时间：2025-08-12 09:35:00
玉渊谭天丨独家观察：美国如何给芯片安“后门”
前几天，国家互联网信息办公室就H20算力芯片漏洞后门安全风险约谈英伟达公司。英伟达在随后的自辩声明中提到，芯片没有“后门”，他们还专门提到了“Clipper芯片”事件。△英伟达公司于2025年8月5日发表声明称：芯片不存在“后门”、终止开关和监控软件。1992年，美国电话电报公司（AT&T）面向美国

时间：2025-08-10 11:34:00

栏目导航

谷歌拉响通用人工智能警报，首次公开AI安全防御蓝图