您正在准备在 Google Meet 上召开区域更新会议或国际团队会议,但并非每个人都说同一种语言。这种情况您遇到过吗?
Google Meet 于 2025 年 5 月在 Google I/O 2025 大会上推出测试版,正式引入了 AI 语音翻译功能,作为对其现有 AI 字幕功能的补充。这一新增功能既是向前迈出的重要一步,也是对日常视频通话中日益增长的实时翻译需求的直接回应。
但这项新功能仍处于初期阶段,目前仅支持两种语言(英语和西班牙语)。因此,如果您正在筹划一场至关重要的会议、一场多语种的全体员工大会或一次全球产品发布会,仅靠这个内置工具可能无法满足需求。这时,专业的口译服务和外部语言解决方案(例如Interprefy)就派上了用场——它们能够为您提供所需的灵活性、支持和质量,助您轻松实现跨语言沟通。
在我们深入探讨之前,让我们先来了解一下目前有哪些功能,以及如何进一步提升 Google Meet 中的实时翻译功能。
截至 2025 年,每月有超过 3 亿人进行视频会议,涵盖个人和工作场景。目前,多语言 Google Meet 会议的主持人可以使用两种核心的 AI 翻译技术:
人工智能驱动的字幕:Google Meet 可以自动生成会议内容的实时字幕。字幕可以与发言者的语言相同,也可以根据套餐和设置自动翻译成其他语言。例如,如果发言者使用英语,参会者可以选择阅读西班牙语、法语或日语的字幕。这有助于弥合语言障碍,让会议更易于所有人参与。
Interprefy等专业翻译服务进行远程同声传译。然而,就在一个月前,即 2025 年 5 月 20 日,Google Meet 推出了人工智能语音翻译功能,允许参会者将自己的语音近乎实时地翻译成另一种语言。该功能目前面向消费者提供测试版,计划于 2025 年晚些时候向企业用户推出。
这项新功能利用谷歌的Gemini人工智能技术,聆听说话者的声音,翻译其内容,并使用合成语音进行朗读,力求最大程度地模仿说话者的语调、节奏和语速。同时,还能听到原声的微弱回声,使对话听起来更加自然。由于翻译是实时进行的,因此会存在轻微的延迟——通常为几秒钟。
目前,Google Workspace AI Pro 和 AI Ultra 套餐用户可以使用 AI 语音翻译功能。会议中只需一位参会者激活该套餐即可——所有其他参会者,包括使用免费 Google Meet 帐户的用户,都可以使用翻译功能。
该功能上线初期支持英语和西班牙语之间的语音翻译。预计不久后将支持更多语言对,包括意大利语、德语和葡萄牙语。
通话期间,符合条件的用户可以从会议菜单中打开“语音翻译”工具。他们选择当前使用的语言和目标语言。激活后,参会者将听到翻译后的语音,而不是原始音频。为了保持上下文连贯性,原始语音会在背景中保持轻微的音量。
在主流视频会议平台(例如 Google Meet)中引入人工智能语音翻译功能,反映了行业内支持多语言沟通这一趋势,并将此作为活动策划和执行的核心环节。随着虚拟和混合型活动日益全球化,组织者面临着越来越大的压力,需要确保活动内容能够被不同语言的受众所理解和使用。
人工智能语音翻译是语言技术发展以满足这一需求的一种方式——尤其适用于内容简洁明了的传递,或在时间或资源有限的情况下。它被广泛应用于各种平台,凸显了实时语言支持正变得越来越容易被各类组织者和参与者所接受。
Google Meet 的字幕功能会在会议期间自动转录口语,并实时以屏幕文本的形式显示。根据用户的套餐,字幕可以显示原始口语,也可以即时翻译成所选的目标语言。
任何会议参与者都可以开启实时字幕功能。开启后,Meet 会自动转录发言内容并在屏幕上显示字幕。这对于身处嘈杂环境或听力障碍人士的参会者尤其有帮助。
参与者可以通过点击“更多”>“设置”>“字幕”并选择口语来启用此功能。字幕将显示在屏幕底部,并实时自动滚动。
对于符合条件的 Google Workspace 用户(例如 Business Plus、Enterprise Standard、Education Plus 和支持 Gemini 的版本),Meet 提供将字幕翻译成其他语言的功能。启用此功能后,系统会检测用户正在使用的语言,并自动以所选目标语言显示字幕。
例如,一位用英语发言的演讲者,可以通过阅读德语、日语或葡萄牙语字幕,被现场观众听懂。这一切都借助人工智能翻译技术实时完成。
截至 2025 年 6 月,隐藏式字幕支持 80 多种语言,但部分语言仍处于测试阶段,可能并非所有用户都能使用,或仍在不断改进中。字幕支持超过 4,600 种语言对(翻译组合),适用于拥有 Gemini for Google Workspace 或其他符合条件的套餐的用户。
为了提升可读性,Google Meet 还允许参会者自定义字幕的显示方式。用户可以调整字体大小、文本颜色和背景,以满足其辅助功能偏好。这些样式更新已于 2024 年年中开始在全球范围内推出。
虽然 Google Meet 在人工智能驱动的实时翻译方面取得了令人瞩目的进展,但仍有一些关键限制需要注意——尤其是在您计划举办多语言活动,且参与者背景各异或内容复杂的情况下。
与其他平台(例如 Zoom 或 Microsoft Teams)不同,Google Meet并不像专业会议平台那样原生支持远程同声传译 (RSI) 通道。它没有内置的方法将人工译员连接到会议,也没有提供多个音频通道供参会者选择。这对于需要多语种专业译员进行实时口译的组织者来说可能是一个挑战。
对于专业的同声传译——即译员实时聆听和发言——许多机构会将第三方平台(例如Interprefy )与 Google Meet 结合使用。这些平台可以连接到 Google Meet,为译员和参会者提供独立的音频流,但这并非 Google Meet 本身的内置功能。
相关文章:
Google Meet 于 2025 年 5 月推出的全新 AI 语音翻译功能,在实时语言辅助方面带来了显著进步,但目前也存在一些局限性。
首先,语言支持有限。目前实时语音翻译仅支持英语和西班牙语。谷歌已宣布计划在未来几周内将支持语言扩展到意大利语、德语和葡萄牙语。虽然翻译字幕等相关功能支持超过 69 种语言,但语音 AI 翻译功能在语言对方面仍然非常有限。
此功能仅限订阅 Google Workspace AI Pro 和 AI Ultra 套餐的用户使用。免费用户无法使用此功能,预计将于 2025 年晚些时候向企业版和标准版 Workspace 用户全面推广。这种付费机制可能会给无法订阅高级套餐的用户或组织带来不便,从而限制其适用范围。
由于该功能仍处于测试阶段,用户可能会遇到一些小问题,例如翻译质量上的细微错误或不一致。此外,原始语音和翻译输出之间可能存在轻微延迟,但谷歌表示这种延迟非常小,通常不会影响对话的流畅性。
人工智能语音翻译的关键在于它试图通过合成语音来复制说话者的语气、语速和声音表现。然而,这种语音重建可能并不总是能捕捉到更细微的情感或文化元素——尤其是在复杂的讨论中。
总而言之,尽管谷歌 Meet 的 AI 语音翻译功能前景广阔,但仍受限于其语言支持范围狭窄、需要订阅以及仍处于测试阶段等问题。随着技术的进步和更广泛的普及,未来的更新有望解决其中的一些限制。
目前,Google Meet 尚不支持包含 AI 翻译语音的录制。新推出的 AI 语音翻译功能允许参会者在会议期间听到实时语音翻译,但这些翻译后的音频流不会被保存到正式的会议录制文件中。因此,录制文件仅包含原始语音内容。
对于需要带有翻译音频的录音的组织者来说,目前必须使用第三方工具。这可能涉及使用语音转文本和文本转语音技术对原始音频进行后期处理,以生成翻译后的语音轨道,而 Google Meet 本身并不提供此功能。
在多语言支持方面,Google Meet 目前提供的帮助仅限于其自动化功能本身。目前没有专门的支持流程来确保 AI 字幕或语音翻译功能配置正确或运行正常。如果出现故障(例如字幕无法显示或语音翻译无法激活),组织者必须自行排查问题,而且通常无法获得实时技术支持。此外,也没有专门针对多语言功能的会前检查、新用户引导或实时活动监控。对于语言访问至关重要的活动而言,这种缺乏主动响应式支持的做法可能会影响与会者的体验,并最终影响会议的成功举办。
Google Meet 的 AI 字幕和语音翻译工具为使会议更具可访问性奠定了坚实的基础——但对于许多类型的活动来说,它们并不能涵盖所有内容。
当准确性、细微差别和可靠性至关重要时,机构通常会寻求专业口译服务来弥补不足。这尤其适用于(但不限于)以下领域:
面向全球观众的大型活动
多语种小组讨论,其中来回对话至关重要。
会议内容涉及大量技术、法律或合规方面的内容
需要多语种录音或活动后材料的活动
线上线下相结合的混合模式
专业的口译合作伙伴可以为您的活动的各个阶段提供支持——从寻找口译员和测试设备,到管理口译员之间实时交接的功能,以及确保参与者在正确的时间收到正确的音频或字幕。
虽然 Google Meet 没有提供内置的远程同声传译支持,但可以通过外部工具灵活地扩展其多语言功能,而不会中断会议体验。
许多专业语言服务提供商现在提供可与 Google Meet 并行运行的解决方案。这些方案允许组织者通过配套界面或基于浏览器的工具,将人工口译和AI 语音翻译到会议中。
它通常是这样运作的:
原始会议音频会安全地传输给专业口译员或人工智能语音翻译引擎。
人工口译员通过远程控制台收听会议并提供实时口译,或者人工智能使用合成语音技术生成翻译语音,并扩展语言对支持。
参与者可以通过浏览器标签页或移动应用程序访问翻译后的音频,同时继续在 Google Meet 中参加会议。
同时还可以提供实时多语言字幕,以支持那些喜欢或需要阅读而不是收听的用户。
这种设置无需切换平台或要求参会者安装任何软件,即可在 Google Meet 中实现高级语言支持。对于需要支持更多语言组合、小众语言、技术内容或需要与国际观众进行高互动性的组织者来说,这尤其有用。
无论是领导层电话会议、培训课程还是多语言混合活动,这些外部解决方案都能帮助弥合差距——在 Google Meet 已有的功能基础上增加可扩展的语音和字幕支持。
虽然 Google Meet 提供了实用的内置翻译功能,但组织者通常需要更高的灵活性、更强的控制力和更全面的语言覆盖范围——尤其是在举办高规格或多语言活动时。Interprefy 通过与 Google Meet 无缝集成,提供专业级的实时翻译服务,弥补了这些不足。
实时远程同声传译和AI 语音翻译服务,由专业译员或 AI 语音翻译引擎提供。参会者无需离开会议,即可通过配套的浏览器标签页、移动应用或嵌入式播放器收听翻译后的音频。
实时多语言字幕,并借助 Interprefy 的自定义词汇功能进行增强,以提高特定事件术语、名称和缩写的准确性。
Interprefy 让 Google Meet 的功能远超其原生功能——提供专业级的实时翻译,而无需用户改变连接方式。
Google Meet 作为全球通信平台不断发展,最近的更新,例如 AI 语音翻译,扩展了多语言会议的可能性。
对于日常对话,这些内置功能已经足够用了。但对于专业、重要或复杂的活动,通常需要其他辅助功能。
目前 Google Meet 还没有内置的远程同声传译功能,而 AI 语音翻译虽然前景广阔,但在语言覆盖范围、平台兼容性和录制功能方面仍然有限。
正因如此,许多组织依赖外部支持来提供真正无缝的实时翻译体验。通过将 Google Meet 的优势与专业口译服务、AI 语音翻译工具和实时多语言字幕相结合,无论涉及多少种语言,都能创建清晰、包容、合规且全球可访问的会议。