FreeNeb亮剑语音界,主攻“声纹+语音”新战场

恩察资讯2019-11-08 10:11:05

[寻云网北京]9月23日报道(文/奇点)

近年来,全球智能语音市场呈现出逐年增长的趋势。据估计,到2020年,全球市场规模将达到191.7亿美元——与2015年的61.9亿美元相比,其增长率在四年内增长了两倍多。

然而,实际着陆情况并不乐观。

目前,语音识别在行业中遇到的最大问题是行业数据和需求之间的不平衡,即语音识别缺乏专业性。即使是语音识别龙头企业,也很难覆盖市场的所有细分市场,从而在提高行业整体识别率方面造成困难。

从技术角度来看,当前自然语言处理的发展仍然面临着“四大挑战”:形态和语义等不同层面存在不确定性;新的术语和词汇导致未知语言现象的不可预测性。数据资源不足难以涵盖复杂的语言现象;相关的语义知识很难用简单的数学模型来描述,因此迫切需要使用参数巨大的深度模型。

因此,nlp并没有真正实现技术突破,这也导致产品在整个语音领域的落地与客户期望之间存在一定差距,尤其是在客户服务、问答等领域。

近日,云搜索网络接触到了语音领域的新势力——北京自由网(Beijing freeneb),这是一家专注于语音处理技术研究的初创公司,为企业提供“独特的”语音识别和语音识别解决方案及专业服务。

依托清华大学人工智能核心技术的研究力量,freeneb在语音和声纹识别等语音相关领域取得了一系列成果。

其核心产品包括语音和声纹识别服务私有化平台、嵌入式语音和声纹识别服务以及智能语音翻译和智能语音门锁等多种解决方案。它已经延伸到教育、金融、政府和客户服务等许多领域。

飞思卡尔首席运营官刘荣在接受《狩猎云》采访时表示:“基于目前产品在整个语音领域的登陆情况,飞思卡尔将打造一款为企业量身定制的语音优化工具,旨在将语音识别技术的体验变成一款简单易用的工具。”

刘荣还表示:“我们的主要工作是使语音识别技术能够到达更多的行业,并使每个行业能够独立使用其内部数据和语音技术来实现快速的现金流。”

近年来,freeneb致力于成为产品定位中标准化、可应用和高效的语音优化工具,并将成为未来可扩展的标准化工具。

Freeneb最近推出的产品“创新企业开放语音平台(ceaos)”是智能语音创新企业开放联盟(ceafos)支持的企业级私有引擎开放系统。本质上,ceaos系统是一个为中小企业服务的“私人语音识别引擎和优化工具”。

中小企业和中小创业企业可以利用开放平台免费获得企业级语音服务引擎,从而可以自由构建属于自己企业的“专业语音服务”。

目前,freeneb的产品工具已经达到标准化,同时推出了私人语音识别引擎和自适应培训平台。如果研究它的技术原理,它涉及两个模型:声学和语言。

声学模型的自适应学习可以增强系统对特定工业领域的鲁棒性(简单地理解为适应性和性能稳定性),包括对用户的鲁棒性(年龄、性别、生理、口音等)。)和环境(地点、背景声音、近远场等)。),最终达到提高系统整体识别性能的目的。

整个过程类似于转移学习,即模型获得的一般“知识”通过适应特定场景中数据的内部变化和差异,形成特定场景下的专业“知识”,使系统更好地适应数据描述的特定领域。

语言模型是机器在“造单词和句子”时必须参考的知识库。为了适应特定行业领域的语言模型,有必要学习该领域的文本数据(领域知识载体),以便语音识别引擎能够了解更多的行业知识,在面对行业场景时变得更加智能。

Ceaos的主要目的是让更多的初创企业获得免费语音技术,从而降低语音行业登陆过程中的摩擦成本。

此外,对于行业用户,freeneb推出了私有化培训平台解决方案,为用户提供私有化学习功能。一键训练可以快速推广,并可应用于电话侧语音识别、网络侧语音识别等场景。目前,行业用户已经在金融端申请呼叫中心应用解决方案。

目前,声纹识别应用广泛,其技术渗透到各个领域。自2016年以来,中国建设银行一直使用手机声波纹支付。不仅如此,声纹技术还应用于呼叫中心的反欺诈和vip认证,智能手机华为和三星的声纹唤醒技术,以及社会保障的远程认证。

目前,freeneb的声纹技术主要应用于银行金融、安全和智能硬件领域。与此同时,freeneb与特定企业的业务组合也在不断完善,并得到了各企业的一致认可。

值得一提的是,从目前的智能语音市场来看,有很多制造商做语音控制和声波纹,但致力于将声波纹与语音技术相结合的freeneb是第一家。

刘荣对此进行了阐述:“在声纹和语音技术方面,融合是我们的特色。拆分后,我们都有相应的着陆产品。该团队一直在不断研究和开发嵌入式语音技术。边缘端的语音技术和声纹技术已经投放市场,声纹+产品模块也已批量生产。”。

一方面,freeneb依靠清华语音人工智能核心的力量,声纹技术早在现在就已经在清华实验室积累了十多年的丰富经验。另一方面,freeneb的创始人王东致力于语音技术的研究已有20多年,经验丰富。

此外,目前国内声纹市场刚刚兴起,声纹技术人才相对短缺。来自清华语音研究团队的freeneb拥有天然的技术优势和人才储备。

目前,freeneb正与相关公司合作推出声波纹门锁模块,该模块将动态声波纹特征集成到原始静态指纹特征中,安全性极高。

此外,freeneb在着陆产品设计上也是独一无二的。它注重在边缘端施力。用户的数据信息不需要上传到云服务器,而是在边缘端直接处理。用户可以随时在边缘端请求删除数据,有效保护了用户的隐私。

刘荣说:“接下来,我们希望最终实现设备之间的可靠控制。在边缘端处理的数据不会上传到云。所有语音数据将在边缘端计算。这也是智能设备未来处理数据的正确趋势。”在未来的研究中,freeneb端的技术不仅将用于人类的声纹控制,还将扩展到设备的声纹控制(即物体的声纹识别)。

未来,我们周围的智能设备和专属可穿戴设备将不再需要通过复杂的机械步骤进行手动控制,而是将使用自然便捷的声纹+语音来实现可靠可信的交互控制。

弗里内布的核心团队来自清华大学,清华大学有着深厚的科研背景。主办方王东是清华大学副教授,言语和语言技术中心副主任。他曾担任甲骨文软件工程师、ibm高级软件工程师、爱丁堡大学玛丽·居里研究员、法国欧洲电子商务博士后研究员、美国nuance公司高级研究科学家。

中国科学院首席执行官唐致远和清华大学联合培养医生,重点研究语音识别、说话人识别、语言和语言等领域,在主要国际期刊或会议上发表论文20多篇。

清华大学博士李兰天(Cto Li Lantian)专注于说话人识别领域,在主要国际期刊或会议上发表论文50余篇,在北京拥有优秀毕业生,发表专利10余项。

首席运营官刘荣(Coo Liu Rong)是中国石油大学学士学位,清华大学语音语言技术中心高级工程师。他是阿里巴巴的高级算法工程师,优酷土豆信息流推荐的算法工程师。此外,freeneb团队还包括许多知名互联网公司的优秀人才。

技术力量的储备和行业经验的积累使freeneb团队拥有了从技术到业务的人才梯队。

刘荣在接受狩猎云网采访时说:“现阶段,人工智能在登陆方面遇到了瓶颈。大部分原因是人工智能人才成本高。在一个行业中,商业、市场和销售不了解技术,这往往是最麻烦的事情。

从这一点出发,刘荣改变了他的想法。

2016年团队组建之初,freeneb带算术博士到现场与客户进行深入沟通。在这一转变过程中,它的技术思维和解决问题的思维被慢慢融合和打磨。尽管这个过程极其痛苦,freeneb也完成了人工智能登陆的意识形态改革。

刘荣说:“这是一个心态转变的过程,不仅需要了解技术,还需要涉足商业。当然,最重要的是降低技术水平,并与传统制造商适度讨论。这一变化对freeneb有很大影响。”

目前,freeneb涵盖技术研发部、工程开发部、产品质量检验部、市场项目部等。合作伙伴包括国家电网、日本清华同方和中国-科威特外汇协会。

他们也在开启新一轮融资,寻找投资者和资源,共同致力于语音技术产业的登陆。

项目:ceaos(创新型企业开放语音平台)

公司:北京傅锐陈星智能科技有限公司

网站:http://www.freeneb.com/

江苏十一选五开奖结果 安徽快3 贵州快三投注 山东11选5开奖结果

<