谷歌拉响通用人工智能警报,首次公开AI安全防御蓝图
IT之家 4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。
IT之家援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。
而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。
DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。
谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。
DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。
安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。
-
AI营销洞察:AI全域赋能,开启阿里妈妈618质赢增长新纪元
AI的大势,正在重塑千行百业的底层逻辑。不进则退的商业世界,创新的停滞往往伴随着被淘汰的风险。这份危机感,在节奏更快的电商行业更加厚重。“AI能为电商带来什么?”成了行业性的集体迷思。猜想有很多,确定性的答案却很少。今年2月,阿里妈妈在开年发布会上,提出“AI赢新,高质增长”,将AI驱动放在了战略高
时间:2025-05-21 09:50:00 -
理论周刊 | 机器人也跑马拉松,具身智能何以“步步生风”
●值得注意的是,具身智能并不等同于人形机器人或智能机器人,机器人是具身智能的一种应用形态。具身智能的实体包含多种形态,可以通过非人形机器、平台、机械臂等多种形式表现出来。人形机器人只是具身智能各种形态和应用中最为理想、技术难度较大和最接近人形的一种形态“具身智能”被写入政府工作报告,将为新型工业化提
时间:2025-05-20 06:03:00 -
世卫组织报告:全球卫生领域进展放缓
【世卫组织报告:全球卫生领域进展放缓】财联社5月16日电,世界卫生组织15日发布《2025年世界卫生统计报告》指出,全球健康领域进展放缓。数据显示,2019年至2021年间,全球人均预期寿命下降1.8岁,健康预期寿命因焦虑与抑郁上升而减少6周。
时间:2025-05-16 04:35:00 -
这种饮料对血管很好,真的建议你常喝!
茶,深受广大网友的喜爱,不少人还有饭后喝茶解腻的习惯。每天喝茶,对身体有哪些影响?一起来看↓↓01喝茶对身体有哪些好处? ■ 降低2型糖尿病风险研究表明,糖尿病高风险人群喝茶,有利于控制血糖,改善胰岛素敏感性;糖尿病患者喝茶则有利于降低空腹血糖和糖化血红蛋白浓度。此外,喝茶对健康的这种好处并无种族差
时间:2025-05-12 16:45:00 -
300209,“摘星脱帽”!周二复牌!
近日,多家A股公司“摘星脱帽”。5月11日,*ST有树(300209.SZ)公告称,关于撤销对公司股票交易退市风险警示及其他风险警示的申请已获得深交所审核同意。根据相关规定,公司股票将于5月12日(星期一)开市起停牌1天,于5月13日(星期二)开市起复牌,股票简称将由“*ST有树”变更为“有棵树”,
时间:2025-05-12 02:01:00