首页 文章推荐 家电百科 实时讯息 常识
您的位置: 首页 > 实时讯息 >

谷歌拉响通用人工智能警报,首次公开AI安全防御蓝图

0次浏览     发布时间:2025-04-04 10:26:00    

IT之家 4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。

DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。

谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。

IT之家援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。

而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。

DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。

谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。

DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。

安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。

相关文章
  • 发展权不是口号,而是行动:中非合作筑牢人权根基

    生存权和发展权是首要的基本人权。1948年通过的《世界人权宣言》为此提供了基本遵循。以此为起点,中国与非洲国家近80年来始终秉持平等互利、真诚相待的精神,以相互理解为基础,通过广泛深入的合作,在减贫、教育、医疗、基础设施建设等领域树立了南南合作典范,为保障和实现人人享有的人权贡献了中国智慧与非洲实践

    时间:2025-08-20 06:07:00
  • 警惕“低价引流”宣传,避免“反复充值”套路,山东省消协发布微短剧消费警示

    近年来,微短剧在丰富消费者文化生活、推动文艺创新方面发挥了积极作用。但侵害消费者权益问题多有发生,如有的作品刻意渲染极端冲突,以荒诞情节吸引关注;出现默认勾选自动续费、虚拟币计价不透明、退款通道操作不便捷等。为积极维护广大消费者合法权益,山东省消费者协会提醒,警惕“低价引流”宣传手法,对“首集0.9

    时间:2025-08-18 00:34:00
  • 康佳集团正式成为华润集团旗下业务单元

    康佳专业化整合发布会15日在深圳举行。康佳正式成为华润集团旗下科技与新兴产业板块的业务单元。国务院国资委副主任李镇在发布会上表示,希望康佳融入华润集团后,加快转型升级,积极培育新的产业增长点,在推动产业高质量发展上展现新担当;强化科技创新,在关键核心技术领域实现新突破;推动整合运作,在体制机制改革上

    时间:2025-08-17 08:35:00
  • 近50家校企成立跨区域联合体

    2025世界机器人博览会京津冀机器人产教融合协同发展展区。本报记者和冠欣摄昨天,在2025世界机器人大会同期活动——产教融合服务京津冀机器人协同发展活动上,“京津冀职业教育机器人专业人才共育三年行动计划”启动。三地近50家机器人龙头企业和职业院校将成立机器人领域跨区域联合体,共同开发课程、教材和数字

    时间:2025-08-12 09:35:00
  • 玉渊谭天丨独家观察:美国如何给芯片安“后门”

    前几天,国家互联网信息办公室就H20算力芯片漏洞后门安全风险约谈英伟达公司。英伟达在随后的自辩声明中提到,芯片没有“后门”,他们还专门提到了“Clipper芯片”事件。△英伟达公司于2025年8月5日发表声明称:芯片不存在“后门”、终止开关和监控软件。1992年,美国电话电报公司(AT&T)面向美国

    时间:2025-08-10 11:34:00