谷歌拉响通用人工智能警报,首次公开AI安全防御蓝图
IT之家 4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。
IT之家援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。
而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。
DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。
谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。
DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。
安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。
-
实测谷歌Gemma 3n:偏科明显,但这才是端侧大模型的答案
有一说一,最近国内的AI大模型圈,属实有点安静了。先不谈大伙万众瞩目的DeepSeek-R2了,这玩意除了半真半假的爆料以外,没有一点动静,有种哪怕再过半年时间,也不一定能够落地的感觉。去年打得你来我往的AI四小龙,今年好像也和小猫一样蔫了,说是大家都在闷声鼓捣着自己的东西,但愣是什么都没有端出来,
时间:2025-07-06 09:06:00 -
高考后现“医美”热潮,学生扎堆整形!这些风险要注意→
近几年,每年高考后都会出现一阵“医美”热潮,“双眼皮手术爆单”“打瘦脸针要抢号”……不少高中毕业生趁暑假做医美,准备“改头换面”迎接大学生活。未成年人适合做医美手术吗?这类手术背后,潜藏着哪些容易被忽视的风险?医美成为“高考奖励”有医生一天做七八台手术进入暑假,不少医院皮肤科、整形美容门诊里多了很多
时间:2025-07-05 10:52:00 -
43岁白雨石履新恒丰银行行长
除白雨石,恒丰银行还有八名高级管理人员。其中,副行长四名:郑现中、韩靖文、房毅、毕国器;董事会秘书、人力资源总监侯本旗,首席风险官付巍,首席信息官徐彤,首席财务官杨立斌文|《财经》记者 陈洪杰编辑|张颖馨6月30日,国家金融监督管理总局批复,核准白雨石恒丰银行董事、行长的任职资格。“(恒丰银行)应督
时间:2025-07-02 11:13:00 -
让青年与文博双向奔赴 四川博物院“青年之家”正式启动
封面新闻记者 李雨心在风景如画的浣花溪畔的四川博物院,不仅可以学习如何通过镜头记录文物之美,还可以了解文创产品开发全流程,更有丰富的课程涵盖书法、国画等传统文化,听起来是否令人心动呢?如今,这样的景象不再存在于想象之中,而是成为了现实。四川博物院“青年之家”启动7月1日,四川博物院“青年之家”项目启
时间:2025-07-01 19:16:00 -
数据宝在福建数智医疗会分享实践成果引领行业升级
【来源:贵阳市大数据发展管理局_行业资讯】日前,数据宝参加在福州举办的2025福建数智医疗创新发展研讨活动——AI与医疗健康场景应用活动,并在会上聚焦数据资产AI化进行分享。本次活动聚焦人工智能与大数据技术驱动下的医疗健康产业变革,汇聚全国医疗信息化领域权威专家与实践者。数据宝董事、数据资产研究院院
时间:2025-06-27 17:08:00