首页 家电百科 实时讯息 常识
您的位置: 首页 > 实时讯息 >

谷歌DeepMind最强手语翻译模型:SignGemma登场

0次浏览     发布时间:2025-05-31 11:24:00    

IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。

IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。

DeepMind 希望通过这一技术,打破手语使用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。

DeepMind 今年还推出 Gemma 3n 模型,支持从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。

此外,谷歌还与佐治亚理工学院及 Wild Dolphin Project 合作,推出 DolphinGemma 模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。

同时,MedGemma 模型作为 Gemma 3 家族新成员,聚焦医疗 AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。

相关文章
  • 世界环境日|AI升级,算力狂飙,地球能承受吗?

    生成一张图片,需要多少电力?本文的封面图由DeepSeek与豆包联合生成,仅使用一条文字指令和一次图像请求。手机电量几乎未变,但背后的实际能耗,足够让它从零充满一次。从上游的芯片制造到下游的日常使用,人工智能发展的每个环节都需要消耗大量生态资源。此外,一家半导体制造厂每小时的用电量足以让100个人用

    时间:2025-06-05 18:05:00
  • 谷歌DeepMind最强手语翻译模型:SignGemma登场

    IT之家 5 月 31 日消息,谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。IT之家注:SignGemma 模型支持多语言功能,但目前主要针对美国手语(A

    时间:2025-05-31 11:24:00
  • AI战场,腾讯向左,阿里向右

    文 | 硅基研究室,作者 | kiki作为中国两家公开表示「追求AGI」的科技大厂,腾讯和阿里成为了「互联网大厂派」中对AI投入最激进的两个典型案例。这几天,腾讯前脚在北京开了今年的AI产业应用峰会,把主题定位「全面拥抱AI」,阿里云后脚就开了中企出海大会,继续展露全球化的野心。特别是自DeepSe

    时间:2025-05-23 16:16:00
  • 寒武纪-U强化研发投入 探索新兴场景算力需求

    作为A股算力龙头,寒武纪-U (688256)已经实现连续两个季度盈利。公司高管在2024年度暨2025年第一季度业绩说明会上表示,2025年,公司将持续加强研发投入,推动芯片产品向大模型及行业垂直领域延伸,探索新兴场景的算力需求。2024年寒武纪归属净利润-4.52亿元,同比上年亏损收窄近五成。其

    时间:2025-05-12 15:53:00
  • 人机对齐:破解AI伦理困境的“钥匙”

    近年来,AI(人工智能)技术飞速发展,在带来效率革命的同时,也暴露出隐私泄露、歧视偏见、算法滥用等伦理问题。当AI在医疗健康领域的应用日益普及,人类能否对其托付生命健康?近日,健康报记者专访第十四届全国政协委员、研究员级高级工程师王江平,请他谈谈医疗AI存在的伦理风险以及应对策略。 医疗AI可能导致

    时间:2025-05-06 17:33:00