人工智能语音行业如火如荼发展,语音助手、智能音箱已不是新鲜事,各大厂商都在纷纷布局。如果说通用型语音助手已经没多少坑可占,那么垂直领域的细分应用场景是否还有机会可挖呢?
近期,36氪接触到一款产品「发条」,为科大讯飞旗下创新产品,主打听音乐这个细分领域。9月底上线后,在没有推广的情况下,用户量已经达到4万多。目前,产品可以在四种场景下使用: 音乐、导航、微信、电话。打开APP之后,默认是音乐场景,按下说话:邰肇玫 墨绿的夜,即可打开网易云音乐自动播放:
科大讯飞在人机语音交互方向的尝试由来已久。2012年,讯飞联合中国移动做的灵犀语音助手,累计获得过亿用户量,积累了丰富的语义底层数据。谈到做发条的初衷,产品总监达达说,01年到现在,很多语音助手厂商转型做智能音箱等硬件,因为语音助手基于APP端的场景很局限。现在大部分助手是为了查询信息,但是很少用手机做事儿。实际生活中,人们在说话时候,不一定是按照逻辑的,所以要让机器理解也有难度。语音交互不够开放的时候,语音助手做到拟人化很难。要实现突破,首先需要缩小到一个话术体系里。讯飞团队分析发现,用户在语音助手上搜索音乐方面的数据占比最高,因此决定聚焦在音乐这个场景。
AI终局是无限接近于人,但是离人的距离还很远,需要基于场景,定点突破。在功能层面,发条通过语义处理引擎垂直在音乐场景,做到准确识别。比如用户说晴天,产品会找相关歌曲,而不是报天气。技术方面,使用讯飞的语音引擎技术,全双工语音交互,整合语音唤醒(成功率达到95%)、语音识别、自然语言理解和语音合成。
在搜索方面,发条通过与4家音乐平台合作,采用AI搜索引擎,实现全网搜歌,自动播放,并自动判断版权归属。因各家音乐平台分别持有不同音乐人和唱片公司的版权,发条在每一次用户请求时,会向所有对接的音乐平台发起请求,若用户偏好APP内没有对应曲目的版权,可自动跳转至有版权的音乐APP进行播放,保证每一首歌、每一位歌手的内容都能让用户听到。
关于后续的产品规划,发条第一阶段的目标是,做到更符合用户直觉的说话响应,听懂书面化、口语化的表达;再往后,将继续做好音乐内容的优先识别模型和混合语种识别模型,最终实现个性化的识别和响应。
目前,发条团队共有20多人,主要是产品和技术人员。谈到未来发展,达达表示将会继续做好面向用户的APP,优化在音乐垂直领域的模型,同时把能力连接到耳机、音箱等硬件上,通过与厂商合作,逐步探索商业化。
36氪认为,语音助手与垂直场景的结合是智能语音未来的发展方向。但是,如何选择好场景,如果做到智能化、生活化的理解,是摆在各个厂商面前的难题。音乐是最佳领域吗?欢迎关注智能语音助手行业的创业者、投资人与我们分享、交流观点,36氪将持续关注这一领域。
0