谷歌拉响通用人工智能警报,首次公开AI安全防御蓝图
IT之家 4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。
IT之家援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。
而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。
DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。
谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。
DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。
安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。
-
网班上涨22.57%,报8.58美元/股,总市值1.53亿美元
4月5日,网班(NTCL)盘中上涨22.57%,截至03:21,报8.58美元/股,成交51.66万美元,总市值1.53亿美元。财务数据显示,截至2024年09月30日,网班收入总额1010.16万美元,同比减少8.91%;归母净利润-147.78万美元,同比减少1010.94%。资料显示,网班科技
时间:2025-04-05 03:29:00 -
市建立健全生态产品价值实现机制工作专班调度会召开 席峰主持
【来源:池州政协_政协要闻】4月3日上午,市政协主席席峰主持召开市建立健全生态产品价值实现机制工作专班调度会。专班组成员参加会议。 席峰强调,要进一步增强责任感和紧迫感,把思想和行动统一到市委的决策部署上来,一鼓作气、把握机遇,以更加坚定的决心,更加有力的举措,全力以赴推进生态产品价值实现机制各项工
时间:2025-04-04 14:19:00 -
全球媒体聚焦丨美国著名专栏作家撰文称 在中国看到了未来
最近,美国《纽约时报》专栏作家、《世界是平的》一书作者托马斯·弗里德曼撰文提到了自己不久前的中国之行,并引用一位在中国工作多年的美国商人的话说,过去人们去美国了解未来,现在他们来中国了解未来。弗里德曼不久前参观了一家中国企业位于上海的研发中心。该研发中心仅用3年多一点的时间建成,拥有104栋各具特色
时间:2025-04-04 13:00:00 -
烟台理工学院启动“烟台——小岛屿国零碳合作对接项目”
4月1日,烟台理工学院积极响应《国际零碳岛屿合作倡议》,正式启动“烟台——小岛屿国零碳合作对接项目”会议。烟台理工学院结合自身发展特点,计划从“一个研究中心、一本资讯、一次学术会议、一个智库、一个领导批示”入手,多管齐下,为烟台市绿色低碳高质量发展贡献力量。根据会议精神,学校将成立一个零碳研究中心,
时间:2025-04-04 11:13:00 -
阳光财险山东分公司:织密民生保障网,点亮消费新活力
食品安全责任险覆盖山东全省1081家食品企业,构建8.95亿元风险防控体系;安全生产责任险为5690家企业构筑防线,承载1194.56亿元安全保障使命;校园责任险实现全省16地市全覆盖,为逾千所学校编织2579.17亿元校园安全网格;针对小微企业成长痛点精准施策,730.89亿元风险保障靶向灌溉75
时间:2025-04-04 10:57:00