互动方式说明
更新时间:2024-3-22
对于交互的思考
对于数字角色的交互方式,我们做过很多思考,未来的终极形态,一定是类似于 电影 Her 中开放的,就像人与人谈话一样自然,可以随时打断,随时补充改变话题的状态,为此我们做了很多的技术尝试,不过实际受限于 现有的 LLM 性能和成本 以及多人语言识别的能力,还无法达到预想的体验。
我们目前采用了三种对话互动方式,可以在后台配置中进行设置默认项,也允许用户交互中进行切换。来去应对不同的场景和需求。
每次唤醒
每次交互前,先使用唤醒词“你好”(可自定义)来进行唤醒,进入收听状态,AI 在收听后开始响应,响应状态下无法打断。
md
人 -> AI: “你好”
人 <- AI: “我在”
人 -> AI: 你是谁?
人 <- AI: AI 回话 #AI 回话过程中只能用命令打断,不响应新的输入
也可以把唤醒词加入到问题中
md
人 -> AI: “你好,你是谁”
人 <- AI: AI 回话 #AI 回话过程中只能用命令打断,不响应新的输入
这样的交互过程不够流畅,不过非常适合于展厅、商场等人声嘈杂的场所。
连续对话
不需要每次唤醒,直接对话,就能得到 AI 的响应,不过在 AI 响应时,无法打断。不需要 AI 响应时,可以用命令“再见”
md
人 -> AI: “介绍下你自己”
人 <- AI: AI 回话 #AI 回话过程中只能用命令打断,不响应新的输入
人 -> AI: "你真的这么认为吗?"
人 <- AI: AI 回话 #AI 回话过程中只能用命令打断,不响应新的输入
人 -> AI: "再见"
人 <- AI: AI 不再响应,等待新的唤醒
开放麦对话
AI 在讲话过程中,可以随时被任何人声打断,重新思考问题后回答。目前实装效果并不够理想
目标
虽然目前做的效果并不够好,不过我们对开放麦的方向充满信心,也在不断的改进中。在目前阶段推荐使用连续对话的方式来进行交互,能获得最好的体验。