该工具允许您识别超过15种语言的语音,无需依赖任何云服务或订阅。它使用一个独立的语言服务器进程在本地运行,游戏通过与该语言服务器的通信来实现语音识别。语言服务器应用是公开的(Vosk语言服务器 GitHub),您可以对其进行分叉、定制或与游戏一起分发,并且可以无界面运行。


主要特点

  • 支持15种语言的离线语音识别:无需依赖云服务,适合脱机使用。
  • 流式语音识别:通过录音和实时识别,实现简单的对话系统。玩家可以通过语音与NPC互动,如“机器人,做这个”,“机器人,做那个”等。
  • 极简的Unreal引擎客户端:与语言服务器进行简单通信,录制语音并将其传送给服务器,返回识别结果。
  • 灵活性:语言服务器可以作为独立应用运行,也可以将游戏本身作为语言服务器。

技术细节

  • 安装和使用:您可以下载最新的语言服务器版本并运行。支持Unreal 5.3版本的示例项目,提供详细的文档与示例代码。
  • 开源和自定义:语言服务器是公开的,允许开发者对其进行修改和自定义。
  • 无需互联网连接:完全离线工作,适用于不稳定网络环境或对隐私有要求的应用场景。

下载与资源

声明:本站所有文章,本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。