该工具允许您识别超过15种语言的语音,无需依赖任何云服务或订阅。它使用一个独立的语言服务器进程在本地运行,游戏通过与该语言服务器的通信来实现语音识别。语言服务器应用是公开的(Vosk语言服务器 GitHub),您可以对其进行分叉、定制或与游戏一起分发,并且可以无界面运行。
主要特点
- 支持15种语言的离线语音识别:无需依赖云服务,适合脱机使用。
- 流式语音识别:通过录音和实时识别,实现简单的对话系统。玩家可以通过语音与NPC互动,如“机器人,做这个”,“机器人,做那个”等。
- 极简的Unreal引擎客户端:与语言服务器进行简单通信,录制语音并将其传送给服务器,返回识别结果。
- 灵活性:语言服务器可以作为独立应用运行,也可以将游戏本身作为语言服务器。
技术细节
- 安装和使用:您可以下载最新的语言服务器版本并运行。支持Unreal 5.3版本的示例项目,提供详细的文档与示例代码。
- 开源和自定义:语言服务器是公开的,允许开发者对其进行修改和自定义。
- 无需互联网连接:完全离线工作,适用于不稳定网络环境或对隐私有要求的应用场景。
下载与资源
- 最新语言服务器下载:GitHub发布页面
- 视频演示:观看演示视频
- Unreal 5.3示例项目:下载示例项目
资源下载
下载价格免费
©版权声明:本站除原创作品外的资源均收集于网络,只做学习和交流使用,版权归原作者所有,若作商业用途,请购买正版。
评论0