机器的声音越来越像人了,咱们得清楚地想想怎么既让技术帮我们过日子又别让人情味没了

智能语音交互技术把人们的关注度给引来了,大家都在讨论它要做到什么样才算“拟人化”。最近,一款在手机APP里的智能语音订餐功能,在社交平台上火了。用户只要给系统说想要点啥,系统就给商家打电话,用听上去很像真人的口气把订单定下来,还把对话内容变成文字和音频存下来。试玩视频里显示,这个系统不光能学着人说话的停顿和语调变化,还会根据聊的事儿说“不着急”、“生意兴隆”这种有感情的话,让好多人觉得太神奇了。这说明现在智能语音技术在特定的地方已经挺会模仿人了。 这个功能背后靠的是多模态交互系统一直在进步。它的核心引擎能在很短时间内认出情绪和意图,能抓住聊天时的话头变化和情绪走向,再配上相应的话术。以前这种技术多用在客服或者虚拟助手上,现在正慢慢用到生活服务里。业内人士觉得,随着深度学习模型和语音合成技术结合得越来越好,机器对话像不像人已经成了企业拼技术的重要一环。 从好的方面看,这种技术能省下人工成本、让服务更统一,在点餐、问问题这种重复活儿里特别管用。不过它太像人了也带来了一些麻烦:一方面用户可能分不清是在跟人说话还是跟机器聊;另一方面如果被拿来推销或者搜集信息,可能会搞混责任,甚至出现骗人的事儿。之前还有人用这个功能去跟其他公司的智能系统对话,弄得机器跟机器互聊了起来,这就更说明用得好有风险、不好控制。 面对技术跑得太快带来的新问题,搞开发的公司得在追求好用的同时多守点规矩。比如在聊天开始的时候就明确告诉用户对面是个机器人,建立个授权机制,还要限制用的地方。监管部门也得操心这事对社会的影响,赶紧出台针对这种仿生技术的分类规定来平衡创新和风险。 往前看智能语音技术并不是要把人都给替代了,而是当个助手帮忙干活。以后它可能在看病咨询、教小孩、照顾老人这些地方大展拳脚。它的关键逻辑得是人和机器一起干——机器处理那些固定的流程,人负责管感情和做决定。只有把边界划清楚、伦理框架立住了,创新的成果才能真真正正给老百姓带来好处。技术往前走的时候总会问社会伦理的问题:机器的声音越来越像人了,咱们得清楚地想想怎么既让技术帮我们过日子又别让人情味没了。这需要公司、学校还有大家一块儿造个理性又包容的治理观,在创新的大潮里护住那盏人文的灯。