<img src="https://ws.zoominfo.com/pixel/ODemgiDEhQshzjvCQ1qL" width="1" height="1" style="display: none;">

隆重推出 Interprefy Agent。这是一款功能强大的多语言助手,您只需像邀请客人一样邀请它即可。开启无缝多语言访问体验。

Zoom 和 Teams 中的隐藏式字幕质量

Zoom 和 Teams 都具备一项非常实用的功能,允许会议参与者启用字幕。该工具能够自动生成实时转录文本,为用户提供宝贵的视觉辅助,帮助他们更好地理解会议内容。Teams

和 Zoom 都使用自动语音识别算法进行实时转录。整个过程完全自动化,会议主持人几乎无需任何准备工作。

Zoom字幕的准确度如何?

Zoom提供两种方式为您的 Zoom 会议和网络研讨会添加字幕。在会议中,主持人可以使用集成的第三方字幕服务提供商,为参会者手动分配字幕。Zoom 还具备自动字幕功能,无需会议主持人额外操作即可开启或关闭。

Zoom 的自动字幕功能预计准确率约为 80%

团队字幕的准确度如何?

用户可以在Microsoft Teams会议期间启用实时字幕,字幕会立即显示在视频画面下方。研究表明,这些字幕的准确率可以达到 85%-90%

标准语音转文本引擎失效的情况

这两个平台都能提供足够高质量的字幕,帮助用户理解讲话内容。然而,大多数自动语音识别系统在识别说话者使用不常见的词语或短语时会失效。例如,独特的品牌名称或拼写方式不同的不太常用的名称。

人工智能语音转文本引擎本质上具有预测性。如果某个词语不在标准词典中,并且在非正式对话中不常用甚至根本不用,那么引擎就不会在对话中预测到它。


推荐文章

你知道吗?80%的Netflix用户经常使用字幕。

揭秘 5 个关于字幕的惊人事实 →


发动机优化如何提高质量

更先进的 AI 字幕系统,例如Interprefy Captions ,可以进行定制,以包含普通引擎会忽略的重要和不常见的词语和短语。

这是通过自定义系统,使其包含对您的会话至关重要的关键词来实现的。

通过预先将这些术语输入系统,系统将知道它们的存在,能够检测到它们,并在会话期间出现时正确转录它们。

以下是一些语音转文本系统经常会遗漏的词语示例:

  • 人名、演讲者姓名、组织中的关键人物或领域相关人员姓名
  • 技术、产品或服务的名称
  • 品牌名称
  • 首字母缩略词和简称
  • 不常用的术语,例如技术术语、专业术语或行话

字幕质量比较

让我们立即测试这些引擎。我们使用 Teams、Zoom 和 Interprefy 中同一句话的自动字幕功能,对这三种方法进行并排比较。

想象一下,有一家名为“Bravocado”的公司。Bravocado计划召开一次全公司范围的员工大会,介绍他们的新任首席执行官Aleks Ritchie,并推出他们的最新产品FRT 420。

以下是 MS Teams、Zoom 和 Interprefy 中开幕致辞的文字记录。

原剧本

大家好,欢迎来到Bravocado市政厅会议。稍后,我们将介绍我们的新任首席执行官Aleks Richie,并向大家介绍我们即将推出的FRT 420产品。


以下是一些与本次事件相关的关键术语,但人工智能引擎通常无法识别这些术语:

  • 布拉沃卡多
  • 亚历克斯·里奇
  • FRT 420

现在让我们来看一下在会议期间,使用完全相同的口语句子时,各个平台上显示的字幕。

Microsoft Teams 字幕输出

我们将首先使用 Microsoft Teams。以上文字是在 Microsoft Teams 会议中清晰地朗读出来的,当时自动字幕功能已开启。

结果如下:

Microsoft Teams 字幕质量最低要求

从我们可以看出,微软的引擎提供了足够的质量来帮助我们理解,但却缺少了三个重要的关键词。

原词   团队输出
布拉沃卡多 布拉瓦多
亚历克斯·里奇 亚历克斯·里奇
FRT-420 FT-420

 

Zoom 字幕输出

现在我们来了解一下Zoom的字幕功能。我们按照相同的步骤操作:加入Zoom会议,打开Zoom字幕,然后清晰大声地说话。

结果如下:

Zoom字幕质量

Zoom 的结果与 Teams 的结果略有不同。标点符号和句子结构有些错误,Zoom 还错误识别了一些关键术语。

原词   缩放输出
布拉沃卡多 勇敢
亚历克斯·里奇 亚历克斯·里奇
FRT-420 前420

 

使用引擎优化解释字幕输出

Zoom 和 Teams 会根据其常用的训练数据自动输出原始文本,而 Interprefy 更进一步,通过优化语音转文本引擎来实现这一目标。它通过使用与您的会话高度相关且独一无二的关键词来改进系统。

结果如下:

字幕质量解读 

正如我们所看到的,在引擎优化之后,Interprefy 的字幕系统准确地捕捉到了所有三个关键术语。

总之

字幕质量比较

标准的AI引擎可以提供有助于理解对话内容的字幕。在我们的实验中,我们发现,如果系统没有针对特定术语进行特别关注,它们都会漏掉我们正在寻找的三个主要词汇。

如果“足够好”就足够了,Zoom 和 Teams 的字幕功能或许可以作为辅助工具,帮助用户基本理解内容。然而,考虑到活动的具体情况和重要性,采用几乎肯定会拼错关键短语的字幕系统可能是一个冒险的选择。

像 Interprefy Captions 这样的专业字幕系统可以帮助您将准确度提升到标准水平以上。最棒的是,它们可以添加到您的 Zoom 网络研讨会、Teams 会议或您使用的任何其他会议平台,让您随时随地都能获得更佳的字幕体验。

新的行动号召

 

 

马库斯·阿雷格尔

作者: 马库斯·阿雷格

Interprefy市场营销主管