谷歌拉响通用人工智能警报,首次公开AI安全防御蓝图
IT之家 4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。
IT之家援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。
而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。
DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。
谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。
DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。
安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。
-
发展权不是口号,而是行动:中非合作筑牢人权根基
生存权和发展权是首要的基本人权。1948年通过的《世界人权宣言》为此提供了基本遵循。以此为起点,中国与非洲国家近80年来始终秉持平等互利、真诚相待的精神,以相互理解为基础,通过广泛深入的合作,在减贫、教育、医疗、基础设施建设等领域树立了南南合作典范,为保障和实现人人享有的人权贡献了中国智慧与非洲实践
时间:2025-08-20 06:07:00 -
警惕“低价引流”宣传,避免“反复充值”套路,山东省消协发布微短剧消费警示
近年来,微短剧在丰富消费者文化生活、推动文艺创新方面发挥了积极作用。但侵害消费者权益问题多有发生,如有的作品刻意渲染极端冲突,以荒诞情节吸引关注;出现默认勾选自动续费、虚拟币计价不透明、退款通道操作不便捷等。为积极维护广大消费者合法权益,山东省消费者协会提醒,警惕“低价引流”宣传手法,对“首集0.9
时间:2025-08-18 00:34:00 -
康佳集团正式成为华润集团旗下业务单元
康佳专业化整合发布会15日在深圳举行。康佳正式成为华润集团旗下科技与新兴产业板块的业务单元。国务院国资委副主任李镇在发布会上表示,希望康佳融入华润集团后,加快转型升级,积极培育新的产业增长点,在推动产业高质量发展上展现新担当;强化科技创新,在关键核心技术领域实现新突破;推动整合运作,在体制机制改革上
时间:2025-08-17 08:35:00 -
近50家校企成立跨区域联合体
2025世界机器人博览会京津冀机器人产教融合协同发展展区。本报记者和冠欣摄昨天,在2025世界机器人大会同期活动——产教融合服务京津冀机器人协同发展活动上,“京津冀职业教育机器人专业人才共育三年行动计划”启动。三地近50家机器人龙头企业和职业院校将成立机器人领域跨区域联合体,共同开发课程、教材和数字
时间:2025-08-12 09:35:00 -
玉渊谭天丨独家观察:美国如何给芯片安“后门”
前几天,国家互联网信息办公室就H20算力芯片漏洞后门安全风险约谈英伟达公司。英伟达在随后的自辩声明中提到,芯片没有“后门”,他们还专门提到了“Clipper芯片”事件。△英伟达公司于2025年8月5日发表声明称:芯片不存在“后门”、终止开关和监控软件。1992年,美国电话电报公司(AT&T)面向美国
时间:2025-08-10 11:34:00