远鉴科技创始人(远鉴科技再获表扬信)
远鉴科技创始人(远鉴科技再获表扬信)远鉴科技的声纹识别技术,在同信道随机数字串应用下,在百万规模的说话人测试中,取得了0.1%的等错误率,在跨麦克信道和电话信道的千万级规模的随意说实际语音测试中,取得了1%左右的等错误率。在随意说应用场景下,远鉴科技的声纹识别技术能够对10秒左右的语音进行精确建模,对5秒左右的语音进行精确比对。在深耕声纹识别技术后,远鉴科技在各行各业都取得了大量的应用,并掌握了足够的技术领先优势。比如能够在很短的时间内,完成对亿级规模声纹库的比对查询;能够用电话信道的语音,在麦克信道的模型上进行正确的声纹比对,反之亦然。幸运的是,远鉴科技恰好拥有这些。在人工智能行业一片生机澎湃之时,几乎所有公司都把目光放在图像识别、语音识别的风口上,一时之间人脸解锁手机、智能音箱等产品层出不穷。然而在AI第一次商业鏖战如火如荼之时,远鉴科技却“反其道行之”,锁定了最难攻克的声纹技术,并深深扎根其中。2014年,远鉴科技敏锐
2018年5月28日,远鉴科技收获深圳市公安局龙岗分局送达的表扬信,信中对远鉴科技在“飓风14号”行动侦查工作中的大力支持给予肯定。这已经是远鉴科技自开春以来收到的第四封感谢信,这一次深圳公安着力表扬的是其领跑业内的声纹技术。
声纹技术的“蜀道难”
声纹识别技术的研究最早起源于上世纪70年代,当时的研究重点主要集中在对声纹特征的参数的提取和处理以及新的模式匹配算法的探讨上,研究者相继提出了LPCC、MFCC、PLP等有代表性的声纹特征,同时还对动态时间规整(DTW)、矢量量化、隐马尔科夫模型、高斯混合模型(GMM)、人工神经网络、支持向量机(SVM)等模式匹配算法进行了探索性研究,在一些简单的应用场景下得到了一定的实际应用。但由于当时的声纹技术对于信道的鲁棒性较差,因此未能在实际应用中得到广泛推广。进入21世纪,研究人员对跨信道问题进行了深入的探索,相继提出了联合因子分析(JFA)、i-vector模型以及基于深度神经网络的i-vector模型等方法,在一定程度上提高了模型的区分性能力和信道鲁棒性,为声纹识别技术的实际应用打下了良好的基础。
虽然声纹识别技术近年来取得了迅速的发展,在许多领域也得到了一定的应用,但仍面临着许多的应用挑战,如信道差异、多人对话语音、录音假冒等问题,使得声纹识别的应用仍然难以迈出。这些挑战并非一朝一夕就能够克服,需要的是大量的实战经验、数据积累以及迎难而上的坚韧。
幸运的是,远鉴科技恰好拥有这些。
一次“逆时代”的决策在人工智能行业一片生机澎湃之时,几乎所有公司都把目光放在图像识别、语音识别的风口上,一时之间人脸解锁手机、智能音箱等产品层出不穷。然而在AI第一次商业鏖战如火如荼之时,远鉴科技却“反其道行之”,锁定了最难攻克的声纹技术,并深深扎根其中。
2014年,远鉴科技敏锐的发现了声纹识别的行业应用机会,大刀阔斧的对公司原有业务做了调整,加大了对声纹识别等人工智能技术的研发和行业开拓。在2017年,远鉴科技更是主导起草了声纹技术行业标准,并参与了人脸、认证等五个国家和行业标准的撰写。
在深耕声纹识别技术后,远鉴科技在各行各业都取得了大量的应用,并掌握了足够的技术领先优势。比如能够在很短的时间内,完成对亿级规模声纹库的比对查询;能够用电话信道的语音,在麦克信道的模型上进行正确的声纹比对,反之亦然。
远鉴科技的声纹识别技术,在同信道随机数字串应用下,在百万规模的说话人测试中,取得了0.1%的等错误率,在跨麦克信道和电话信道的千万级规模的随意说实际语音测试中,取得了1%左右的等错误率。在随意说应用场景下,远鉴科技的声纹识别技术能够对10秒左右的语音进行精确建模,对5秒左右的语音进行精确比对。
这些领先于其他公司的优势,正是这次“逆时代”决策的厚积薄发。这支成长于本土、发展于本土、服务于本土的团队,汇聚了来自于中科院、清华、北大等知名高校顶尖人才,以及来自百度、IBM、联通、腾讯、华为等行业巨头的资深专家。众多生物识别领域优秀的博士或研究员的努力,使得其他公司开始关注这条赛道时,远鉴科技已经顺利地突破赛道第一道关卡,并在赛道第二段遥遥领先了。
而赛道的第二段正是远鉴科技,利用自己的声纹技术优势所做的创新。
重新定义创新:从突破到“聚合”从最早的“互联网 ”概念到现在屡屡被提及的“人工智能 大数据”,时代的轨迹证明单一领域的发展必然需要多学科的“聚合”。远鉴科技在声纹领域就完成了两次非常有里程碑意义的“聚合”:跨信道识别&多维生物特征识别
1跨信道识别:
依托声纹识别应用业务和平台,远鉴科技积累了超过千万说话人规模的跨信道语音数据,尤其是打通了互联网语音跟电话语音的数据通道,为声纹识别技术的跨信道应用研究打下了坚实的基础,取得了语音数据的先发优势。
针对跨信道的研究难题,远鉴科技利用深度神经网络、i-vector、PLDA、语音识别以及模型区分性训练等技术,利用互联网和电话语音数据,自主研发打造了一套能够同时用于互联网和电话领域的声纹识别系统,实现了两大业务领域的交叉应用。
2多维生物特征识别:
自iPhoneX的面部识别被破解开始,单一生物特征认证的不稳定性和局限性被暴露了出来。在这种情况下远鉴科技将声纹识别与人脸识别结合,打造了一套基于人脸和声纹的复合认证技术,只需要用户在摄像头前正常采集声纹就可以完成对用户的身份识别,有效的解决了使用录音、照片、视频和冒名顶替等进行假冒闯入的难题。
这一项突破,使得远鉴科技拥有了雄厚的技术资本,成了多维身份识别与可信认证技术国家工程实验室的共建方。作为共建方,远鉴科技依托于国家合法、权威的庞大数据资源,结合自主研发的声纹识别、活体检测等技术,有效实现了成果转化。
在了解到多维身份识别的安全性后,招商银行、微众银行率先使用了远鉴科技推出的多维身份识别服务,此后多家金融支付公司纷纷开始尝试多维认证。可以预见,未来多维身份识别与认证必将成为主流的安全保护手段。
远鉴科技准备好了放眼全球,随着人工智能技术的不断发展,再到大数据推动机器学习算法的不断完善,科技正在推动社会的前进。
远鉴科技作为一家科技驱动型公司,深厚的自主研发能力、领跑业内的技术实力,都已经让它从试水者变成了如今的引领者。未来两年内,远鉴科技有信心依托现有声纹识别的行业应用优势、应用数据优势和核心技术优势,打造独有的声纹技术服务平台,为各行各业提供声纹识别服务。声纹技术的发展潜力巨大,当前已迎来了其爆发期:比如,现在国内手机行业领导者也正在向远鉴科技预约声纹解锁功能,这预示着声纹技术即将走进寻常百姓家。
哥伦布曾经说过:“天才 就是别人认为毫无价值的不毛之地 你却能挖掘出黄金和甘泉来。”——远鉴科技是首个踏上了声纹这块“新大陆”的先驱,准备好了要在这片新世界里大展拳脚,让每个人都可以在可信的网络世界里快乐生活。