允许您识别超过15 种语言的语音,而无需依赖任何云服务或订阅。相反,语言服务器是您机器上的一个独立进程,它与您的游戏进行对话。语言服务器应用程序是公开的 ( https://github.com/IlgarLunin/vosk-language-server ),您可以对其进行分叉和自定义,与您的游戏一起分发,在没有任何用户界面的情况下运行它。
虚幻引擎客户端与语言服务器的通信非常简单。它连接到它,记录并将您的声音提供给语言服务器,服务器将识别的声音作为文本发送回虚幻。
这是流式语音识别,你可以与你的 NPC 进行简单的对话,除了语音之外不需要任何用户输入。“好的机器人,做这个”,“好的机器人,做那个”等。
下载最新的语言服务器:https ://github.com/IlgarLunin/vosk-language-server/releases
视频演示:https://youtu.be/iJVCsuuC5A4
示例项目:此处(虚幻引擎 4.27)
技术细节
特征:
- 不依赖于其他付费云服务
- 一次性支付
- 服务器可以同时处理多个客户端
- 易于设置
- 无需互联网
代码模块:
- VoskPlugin(运行时)
蓝图数量:0
C++ 类数:1
网络复制:否
支持的开发平台:Windows、Mac、Linux
支持的目标构建平台:Windows、Mac、Linux
文档: https: //github.com/IlgarLunin/VoskPlugin-docs
评论(0)