互动方式说明

更新时间：2024-3-22

对于交互的思考

对于数字角色的交互方式，我们做过很多思考，未来的终极形态，一定是类似于电影 Her 中开放的，就像人与人谈话一样自然，可以随时打断，随时补充改变话题的状态，为此我们做了很多的技术尝试，不过实际受限于现有的 LLM 性能和成本以及多人语言识别的能力，还无法达到预想的体验。

我们目前采用了三种对话互动方式，可以在后台配置中进行设置默认项，也允许用户交互中进行切换。来去应对不同的场景和需求。

每次唤醒

每次交互前，先使用唤醒词“你好”(可自定义)来进行唤醒，进入收听状态，AI 在收听后开始响应，响应状态下无法打断。

人 -> AI: “你好”
人 <- AI: “我在”

人 -> AI: 你是谁？
人 <- AI: AI 回话  #AI 回话过程中只能用命令打断，不响应新的输入

也可以把唤醒词加入到问题中

人 -> AI: “你好，你是谁”
人 <- AI: AI 回话  #AI 回话过程中只能用命令打断，不响应新的输入

这样的交互过程不够流畅，不过非常适合于展厅、商场等人声嘈杂的场所。

连续对话

不需要每次唤醒，直接对话，就能得到 AI 的响应，不过在 AI 响应时，无法打断。不需要 AI 响应时，可以用命令“再见”

人 -> AI: “介绍下你自己”
人 <- AI: AI 回话  #AI 回话过程中只能用命令打断，不响应新的输入

人 -> AI: "你真的这么认为吗？"
人 <- AI: AI 回话  #AI 回话过程中只能用命令打断，不响应新的输入

人 -> AI: "再见"
人 <- AI: AI 不再响应，等待新的唤醒

开放麦对话

AI 在讲话过程中，可以随时被任何人声打断，重新思考问题后回答。目前实装效果并不够理想

目标

虽然目前做的效果并不够好，不过我们对开放麦的方向充满信心，也在不断的改进中。在目前阶段推荐使用连续对话的方式来进行交互，能获得最好的体验。

互动方式说明 ​

每次唤醒 ​

连续对话 ​

开放麦对话 ​

目标 ​

互动方式说明

每次唤醒

连续对话

开放麦对话

目标