首页 资讯频道 互联频道 智能频道 网络 数据频道 安全频道 服务器频道 存储频道

智能产品走入千家万户 车载场景成为新蓝海

2020-09-11 08:33:38 来源 : 人民邮电报

近年来,随着人工智能技术不断成熟,具备智能问答、语音控制、人脸识别功能的智能产品和应用逐渐走入千家万户,不断提升用户生活和工作的便利性。

手机成为智能化核心

得益于高速无线通信、较强的计算能力和便携性等优势,伴随智能语音、自然语言理解、计算机视觉等技术逐步融合到手机操作系统或者各类智能化App之中,智能手机逐渐成为个人用户的智能化核心。从智能技术角度来看,手机的智能化应用主要包括智能语音语义类应用和计算机视觉类应用两种。

智能语音语义类应用,主要使用语音识别、语音合成、声纹识别、机器翻译等技术,实现各类语音语义类信息的交互和处理。常见的智能语音语义类应用主要包括智能助手、语音听转写、语音搜索、智能翻译等应用。其中,最典型的应用就是手机的智能语音助手,包括苹果的“Siri”、小米手机的“小爱同学”、华为的“小艺”和OPPO的“Breeno”等,已经成为智能手机语音交互的核心入口。用户可以简单地通过语音与手机助手交互而不必进行复杂的点击操作,实现拨打电话、知识问答、添加行程、系统设置等功能,大大简化了手机操作的复杂度。

计算机视觉类应用,主要使用图像分类、目标检测、目标跟踪和图像分割等技术,实现各类图像和视频信息的处理。该类应用主要包括场景识别、拍照美颜美化、相册分类、身份认证、文字识别等应用。近年来,最热门的应用无疑是人脸解锁和拍照功能优化。其中,人脸解锁自苹果的iPhone X首先推出以来,推动了智能手机从指纹认证向人脸认证的升级,同时带来了大量使用人脸进行认证和验证的场景。拍照功能优化通过手机内置的各类图像优化、分类算法,实现智能拍照、相片美化、人像美颜、相册自动分类等。

智能家居产品成为“主战场”

智能家居市场是智能化产品提供商的另一个“主战场”。目前,智能家居产品主要朝着提升家居产品交互和控制的便利性、家居空间的安全性两个方向发展。

智能音箱逐渐成为家庭的语音交互核心。各大厂商纷纷发力智能音箱市场,不仅因为智能音箱本身可以作为各类内容服务(如音乐、有声小说、有声书等)的载体,而且在于其处于各类智能家居产品的核心控制位置,在前端各类家居产品连接协议没有统一、互联互通性能较差的情况下,智能音箱成为各个不同生态系统竞争的入口。

智能音箱市场正处于蓬勃发展之中。家居环境具有封闭和私密的特点,背景噪音较小,易于实现语音交互。智能音箱在传统音箱的基础上增加了智能语音交互功能,可以提供音乐、有声读物等内容服务,同时实现对智能家居产品的控制。IDC报告显示,2019年第二季度全球智能音箱的销量实现飙升,达到3030万台,同比增长95.8%,几乎是2018年同期的两倍。亚马逊以21.9%的市场份额位居第一,我国出货量大的企业分别是百度(15.3%)、阿里巴巴(14.1%)和小米(11.1%),三家中国厂商出货总量超过1200万台。

家用智能摄像头开始在家庭视频监控和安全报警上崭露头角。自2017年支持“人形检测”的智能摄像头上市后,“人形检测”功能成为主流,大量家用摄像头产品开始支持“人形检测”功能。智能摄像头通过集成各类图像识别和动态检测等算法,能够实现陌生人识别报警、移动追踪、全景巡航、智能侦测人形、追踪拍摄等功能。例如,自动报警功能通过智能摄像头实时对画面中的人形轮廓进行分析识别,如果画面中的人是陌生人,智能摄像头就会启动录像取证,并通过手机等设备向户主发送入侵报警信息。

车载场景成为新蓝海

车机是对汽车里车载信息娱乐设备的简称,车机在功能上能够实现人与车、车与外界(车与车)的信息通信和交互控制等功能。

随着用户对汽车功能的要求越来越多,车机的功能越来越多、交互界面越来越复杂,会给驾驶带来一定的危险。基于这种特殊场景,车载语音交互成为降低驾驶员对车机操作依赖的重要方案。各类智能语音厂商已经开始重点发力车载场景,与汽车生产商合作进行前装(在汽车生产厂内完成的车内零部件安装)或通过提供各类智能车机、智能倒车镜等方式进行后装(在汽车出厂后安装或更换零配件),引入智能语音交互和控制能力,方便驾驶员在驾驶时直接通过语音对车机相关功能进行操作和控制。

当前,智能语音在车载场景中主要实现导航、播放音视频、通信、车辆基本控制、车辆状态查询、生活信息查询等功能。但是,车载场景因无法避免的背景噪音(胎噪、风噪以及其他车辆背景噪音),使当前车载智能语音的交互准确率无法达到较为满意的水平,这也是众多智能语音企业重点突破的技术方向之一。

融合与安全成为新趋势

当前,消费级智能产品如雨后春笋般涌现,为智能设备市场注入了前所未有的活力。未来,消费级智能产品仍将持续演进,为人们带来更好的使用体验。

其一,单一智能技术无法满足用户的复杂需求,融合成为消费级智能终端的一个重要发展方向。当前,人机交互已经开始朝着语音控制的方式发展。但是,图片和视频信息占据了人类交互信息量的绝大部分,导致很多场景下语音控制无法精确响应用户的需求,仍然需要融合手势、步态、表情等视觉信息。因此,如何将语音信息与视觉信息有效融合,在提高单一技术能力的同时,以融合方式赋能更多应用场景成为未来的重点研究方向。例如,2019年多家企业发布的合成主播,就是以语音合成为根基,辅以视频合成完成的多模态融合应用典型。

其二,各类智能设备安全和伦理问题频发,安全可信成为业界关注的焦点。据外媒报道,某手机厂商语音助手会收集用户语音信息,并将相关录音、位置、联系方式和App等数据发送给技术人员,导致产业界越发关注智能设备非授权采集语音、图像、视频信息等行为。

当前,用户对智能设备在安全可信方面的需求主要体现在三个方面:数据安全、算法安全和伦理安全。数据安全包括是否会非法收集在设备运行过程中产生的各类数据以及是否有相关数据保护手段;算法安全包括算法是否具备抗攻击能力;伦理安全指的是智能产品及其相关能力是否会挑战人类已有的道德伦理准则。2019年8月,中国人工智能产业发展联盟在国家相关部委的指导下,推出了《人工智能行业自律公约》,希望人工智能企业从以人为本、增进人类福祉、确保公平公正和避免伤害四个方面,共同努力形成“安全可信、合理可责”的人工智能可持续发展模式。

其三,由于当前深度学习算法受场景所限,收集数据扩大产品适用范围成为企业的首选。目前,基于深度学习模型产生的各类智能化产品通用型较差,产品一旦脱离特定场景,性能就会大幅下降,甚至会出现不可用的情况。各厂商在技术暂时无法突破的前提下,通过收集和使用大量的特定场景数据,以降低场景变换对产品性能造成的影响。例如,智能语音助手普遍对用户的普通话水平要求较高,一旦用户使用方言或带有口音,智能语音助手的识别性能就会直线下降。对此,当前企业主要采用采集大量的方言语音数据的方式来优化语音识别模型,力图提升语音识别在特定场景下的识别能力。

关键词:智能产品
相关文章

最近更新