小雅nano升级(小雅Nano爆款背后的技术揭秘)
小雅nano升级(小雅Nano爆款背后的技术揭秘)(小雅AI音箱)和2017年发布的小雅AI音箱一样,猎豹移动投资的人工智能公司猎户星空的全套语音OS解决方案仍然在小雅Nano上得到应用,包括麦克风阵列、声音信号处理算法、语音唤醒、语音识别、自然语言理解、语音合成、生活常见语音skill等一系列语音技术和能力,用AI对喜马拉雅沉淀的用户数据进行分析,进行个性化推荐的同时,完成智能化升级。有报告显示,智能音箱用户80%的使用时间会停留在“听内容”这个关键动作上,想象中复杂、众多的场景,其实并不符合用户日常的需求。而喜马拉雅小雅AI音箱的单机月人均使用次数是其他家的12倍,活跃用户的每天使用时长高达105分钟,这就凸显了喜马拉雅对于智能音箱的使用粘性。内容对音箱的作用如此重要,那么,问题来了,如何把这些内容呈现给用户呢?这需要音箱具备优秀的语音交互能力,能够第一时间正确地响应用户的需求。作为小雅Nano的技术提供方,猎户语音OS成功地胜任了这
小雅Nano智能音箱火了。近日,喜马拉雅全新推出的智能音箱小雅Nano正式开售,10000台现货开售1分钟即被抢购一空。到了第二天下午,小雅Nano首批10万台产品就已经售罄,呈现“一货难求”的局面。短短几十个小时里,小雅Nano为什么能够成为一个现象级的产品?要知道,距离喜马拉雅发布自己的第一款智能音箱,仅仅过去了一年的时间。
数万个语音技能,用户却喜欢“听内容”
目前,国内智能音箱市场处在“百箱大战”的阶段。消费科技市场研究机构 Strategy Analytics 发布了《2018 年第三季度全球智能音箱市场报告》,报告显示 Q3 全球智能音箱出货量同比增长197 %,达到 2270万台,创下了历史新高。
智能音箱的出货量一片大好,但是智能音箱的实际表现似乎不是那么令人满意。曾有用户吐槽,买回来的音箱渐渐沦为摆设,“在家里吃灰”。为了最大化地覆盖用户的使用场景,巨头曾在智能语音技能上不断加码。以Amazon的Alexa为例,目前Alexa已经拥有上万项技能,并在17年6月底达到了1.5万个。但是,用户真的需要这么多的技能吗?
有报告显示,智能音箱用户80%的使用时间会停留在“听内容”这个关键动作上,想象中复杂、众多的场景,其实并不符合用户日常的需求。而喜马拉雅小雅AI音箱的单机月人均使用次数是其他家的12倍,活跃用户的每天使用时长高达105分钟,这就凸显了喜马拉雅对于智能音箱的使用粘性。
内容对音箱的作用如此重要,那么,问题来了,如何把这些内容呈现给用户呢?这需要音箱具备优秀的语音交互能力,能够第一时间正确地响应用户的需求。作为小雅Nano的技术提供方,猎户语音OS成功地胜任了这个角色。
猎户语音全链路技术助力小雅Nano成爆款
和2017年发布的小雅AI音箱一样,猎豹移动投资的人工智能公司猎户星空的全套语音OS解决方案仍然在小雅Nano上得到应用,包括麦克风阵列、声音信号处理算法、语音唤醒、语音识别、自然语言理解、语音合成、生活常见语音skill等一系列语音技术和能力,用AI对喜马拉雅沉淀的用户数据进行分析,进行个性化推荐的同时,完成智能化升级。
(小雅AI音箱)
围绕技术深度定制,打造最强内容体验
喜马拉雅拥有海量的音频内容,且用户喜欢的内容品类不一,导致大量的长尾内容需要被智能音箱认识和学习。为了提高用户语音点播内容的准确率,猎户星空围绕语音识别、自然语言处理、内容搜索等环节进行了语音语义一体化识别定制,将热门内容数据进行反复的学习和训练,再进行逐个的仿真测试和修复后,热门内容的点播准确率逐步提升,综合准确率超过90%,远超竞品,基本上用户喜欢的内容都能被点中。
语音识别过程中,音箱还要兼顾到不同人群、不同家庭的表达习惯。例如,“我想听backstreet boys的larger than life”这样一句普通的点播需求,很多智能音箱就难以招架,这是因为中英文混合点播能力一直是语音技术中的难点,多语种混合Query对语言模型带来了更大的复杂度。针对这样的行业难题,猎户星空团队投入了大量的精力进行底层技术的提升,学习了大量用户中英文点播说法以后,热门英文歌曲也可以小雅音箱想听就听。
除了准确点到想要的内容,用户有时候还会面临唤醒之后“空气突然安静”的尴尬,因为他们可能也不知道接下来该干嘛。为了打造音箱与用户之间的粘性,猎户星空团队推出了基于用户行为分析的“星云推荐系统”。即使用户没说话,唤醒后的智能音箱也会根据用户的历史行为,个性化推荐你想听的内容,部分场景的续听率已经超过70%。
10月份,猎户语音OS还推出了基于内容的免唤醒点播功能,解决用户一直吐槽的反复唤醒的问题,该功能在发出指令后一段时间内持续有效,避免用户多次唤醒。同时小雅Nano还具备跨设备的断点续播功能,登录账号后,不管你是在喜马拉雅app上听过,还是在其他小雅音箱上听过,只要对着小雅Nano喊一声,“小雅小雅、继续播放”,就可以继续听上次没听完的内容。
结合童声的“小小雅”人设,放心让孩子听
小雅音箱1代发布时,只要唤醒小雅,就会有一句温暖的“诶”“我在”,打动了无数人,后续推出的智能音箱也纷纷效仿,这是猎户语音OS领先行业首创的唤醒人声回应,再加上从上百人中挑选出来的”这个星球上最温暖的女声”,经过上百小时训练的大数据拼接语音合成,火遍大江南北,猎户星空tts被广泛应用在各种智能产品中。
针对小雅Nano智能音箱,猎户星空为其配置了最新的儿童TTS。儿童TTS采用了大数据情感拼接语音合成技术,经过真实儿童群体的投票海选,选出儿童真正喜欢的声音。儿童TTS的发音人是真正的儿童,并非市面上的成人声优模仿。经过长达4个月的录音,打造了上万句语料库,并加入大量情感语料,使得合成的声音自然、流利,深受儿童和成人用户的喜欢。
在小雅Nano上结合童声的“小小雅”人设,是小雅Nano推出的第一款儿童人设,小朋友可以放心的收听被安全过滤的精品儿童内容,每次唤醒的时候可以听到“我来了”“我在呢”这种非常可爱的应答。未来,喜马拉雅还会利用猎户星空新推出的声音克隆技术,为小雅Nano打造声音皮肤、明星主播人设等个性化体验。
从人性的角度出发,围绕技术细节进行深度定制,猎户星空赋予了小雅Nano更多的本领,使其成为一款“真有用”的智能音箱。
卖好一款爆品,远不止内容和技术
简单来说,小雅Nano能够成为“爆款”,除了自身优质的内容资源储备和猎户星空的技术高地,还有很重要的一点就是商业模式的创新。
小雅Nano深度绑定了1年喜马拉雅VIP会员。在预售阶段,用户只需支付1元诚意金锁定名额,正式发售阶段再支付一个相当于喜马拉雅年度会员费的尾款198元,即可获得小雅Nano,免费畅听所有喜马拉雅的会员内容。从实际销量来看,用户对于这种模式的接受度非常高。
喜马拉雅希望通过小雅Nano嫁接用户与内容生态,打造闭环式的会员增值服务,最终实现硬件的价值。这套以会员和价值内容为导向带动智能音箱销量的模式,将成为小雅Nano甚至整个行业的一个创新案例。
小雅Nano的成功并不是偶然的运气和用户短暂新鲜感的结果。可以预见的是,有了猎户语音OS的AI能力和喜马拉雅的海量内容加持,小雅Nano将从红海的智能音箱竞争中脱颖而出,取得亮眼的销售成绩和用户的广泛喜爱。(一鸣)