智能家居的突围:什么样的NLP数据让语音交互更智慧

[摘要]人工智能+家居场景”的智能化阶段将呈现持续且长期的发展后劲。AI数据助力下,智能家居行业必定迎来强劲的增长,迸发出绚丽的火花。
 
近几年,得益于物联网、人工智能、5G等新型技术的飞速发展,智能家居在短短数年间就已经相继渡过了“自动化”、单品智能化”、“物联网+家居场景”三个阶段,进入了当前的“人工智能+家居场景”的“智能”阶段,开启了智能家居对人的思维和意识的学习与探索。
 
 
一方面,AI技术与家居生活应用的进一步结合,更催化了众多行业标杆企业的飞速发展,诸如小米、百度等公司;另一方面,从严格意义上智能家居产品分类涵盖了家电、娱乐、能源供暖、厨房用品、安全健康等,中国作为全球智能家居市场的发展重心,人们对于生活品质与家居产品体验的追求也将不断增加。由于智能家居多以房屋、住宅、社区为载体,应用场景相对更具集中性和确定性。例如小爱音箱一类的智能音箱产品,用户可以与之进行多轮对话,同时可以对其发出语音指令控制,从而实现点歌、查天气等操作。
 
某智能家居企业营销策略总监表示,语音是最自然的人机接口,它可执行触控及手势做不到的免持操作,因此成为控制智能家居装置的理想方式。除此之外,与繁忙的办公室或嘈杂的街道相比,家庭是一个相当私人、安静而封闭的场所,因而也较适合语音控制的使用环境,因此在家庭中采用语音控制可以说是顺理成章。
 
这不得不提智能音箱背后的支撑——NLP(自然语言处理)技术。作为人工智能的一个分支,狭义的NLP(自然语言处理)是至使用计算机来完成以自然语言为载体的非结构化信息为对象的各类信息处理任务,比如文本的理解、分类、摘要、信息抽取、知识问答、生成等的技术。简单来说NLP实际上就是人类语言和机器语言之间顺畅沟通的桥梁。
 
 
场景化AI数据成NLP技术落地核心需求
 
应用于智能家居场景的NLP技术的两大关键分别是算法和数据,算法往往是公开的,差异化更多地来自于场景化的高质量训练数据,AI大牛沈向洋在演讲中也强调:“在任何时候,构建AI都离不开数据,如何设计和构建负责任的AI,数据的来源至关重要”,可见AI训练数据对技术落地的重要性。
 
事实上,越来越多的智能家居企业已经意识到了高质量NLP数据的重要性,并对AI技术和NLP数据提出了更高的要求。云测数据总经理贾宇航在接受采访时曾表示“图像采标有很强的规则性,按照规范化的指导文档工作即可,但NLP数据对应的是语言的丰富性,需要结合上下文等背景去理解和处理。”在高位提升这件事上,NLP数据更难。
 
尤其是智能家居头部企业,为了保持自身的竞争优势,就必须追求更高质量的、符合业务需求的NLP数据。因此,在AI产业蓬勃发展、市场竞争愈发激烈的倒逼下,符合企业需求的高标准NLP数据服务已成为行业头部企业的刚需。
 
以智能家居领域头部AI数据服务商云测数据的“场景化”服务模式为例,其专精于场景化、高质量数据服务模式,正契合当下智能家居“大规模、小场景”的落地趋势。
 
“大规模” 是指随着B端和C端功能应用、渠道开拓、项目落地与场景应用逐步成熟,智能家居正步入大范围爆发期;“小场景”是指体验场景愈加聚焦。
 
具体到NLP,云测数据的数据采集核心能力包括唤醒词采集、控制词采集、指定语料采集、人脸采集、情绪类型采集、中英文、国内各地方言、东南亚及欧洲、非洲小语种等采集类型,支持智能音箱、智能电视、智能扫地机器人等场景数据采集;数据标注核心能力包括人物语音转写、行为意图、声纹识别、领域识别、语句泛化、语义分割等标注类型,支持智能音箱、智能电视、智能扫地机器人等场景数据标注。
 
目前,云测数据的人工智能数据服务团队已经形成了一套包含任务分配、需求分析、需求确认、数据清洗、试标确认、进度控制、质量保障等流程的完整作业体系。比如云测数据在语音、文本、图片、视频等类别标注上都设置了底层规则,并设有多次审核机制,再加上专业标注逻辑、思维和思考能力以及相关领域知识,从而高效输出成一套高质、精准的智能家居数据解决方案。
 
以智能音箱为例。在云测数据,以单个场景的意图标注就分为10-20个大类,上百个子类,根据业务需求可能还会有进一步的标注细分。
 
除了对NLP数据进行对话意图、领域、槽位等进行判断和标注,多角度的泛化也必不可少。也就是说,无论用户说的是地方话还是普通话,有没有出现口误,还是以不同的句子表达同一个意思,AI都能够读懂句子并给出正确的回答,这就要求NLP数据标注员对句子进行泛化,以不同的描述方式重组或扩充句式、标签等,以提升AI对话的准确度。
 
除了业务能力的专业能力,云测数据在软硬件设施的持续投入、数据安全隐私方面也有自己的原则和技术保障。
 
 
强者恒强,头部更多的选择与头部AI数据服务商合作
 
在云测数据服务的众多智能家居相关企业中,头部企业占比达90%。这表明,在庞大的市场规模和市场需求下,与场景化、更高质量、更高准确度的AI数据服务商合作,已成为头部智能家居企业推动应用落地的必然趋势;
 
另一方面也表明,AI商业化对NLP数据的要求还在继续提高,无论是在数据采集的样本多样性、场景多样性方面,还是在数据标注的数据精度、领域知识方面,数据服务商都面临不断升级的业务难度。所以形成了企业和高质量的数据服务业务粘性来往很高。以云测数据为例,一个项目在建立合作之后,往往会带来长达2-3年的持续合作,这就产生了马太效应,强者恒强。
 
 
如今,智能家居产业在政策红利和蓝海市场的双重利好中迎来快速发展。咨询公司A T Kearney的一项预测显示,到2022年,亚洲的智能家居市场将增长到260亿美元,到2030年将增长到1150亿美元,占全球市场的30%以上。中国将成为亚洲增长的关键。而就智能家居现阶段而言,“人工智能+家居场景”的智能化阶段将呈现持续且长期的发展后劲。AI数据助力下,智能家居行业必定迎来强劲的增长,迸发出绚丽的火花。
 



版权声明:

凡本网注明”来源:中国软件网(http://www.soft6.com)”的所有作品,版权均属于中国软件网或昆仑海比(北京)信息技术有限公司,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

任何行业、传播媒体转载、摘编中国软件网(http://www.soft6.com)刊登、发布的产品信息及新闻文章,必须按有关规定向本网站载明的相应著作权人支付报酬并在其网站上注明真实作者和真实出处,且转载、摘编不得超过本网站刊登、转载该信息的范围;未经本网站的明确书面许可,任何人不得复制或在非本网站所属的服务器上做镜像。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,昆仑海比(北京)信息技术有限公司将追究其相关法律责任。