首页 > 文章中心 > 语音识别技术

语音识别技术范文精选

语音识别技术

语音识别技术范文第1篇

1嵌入式假肢智能控制系统中语音识别技术的研究

1.1技术结构分析

在嵌入式假肢智能控制系统中,语音识别技术在硬件结构上分为语音识别芯片、扩展电路以及功能模块三个组成部分。由语音识别芯片对残疾人所发出的语音信号进行识别,并通过内部语音识别程序来对语音信号进行处理,然后将处理结果发送给功能模块进行执行。

1.2语音识别芯片

在嵌入式假肢智能控制系统中,语音识别芯片的型号为SPCE061A,该芯片高度集成了MCU、RAM、A/D、D/A与ROM,该芯片具有内积运算功能以及16*16位的乘法运算功能。SPCE061A能够对各种复杂的数字信号进行处理,其处理性能强大,价格低廉,而且能够进行中断处理。语音识别芯片可对至少10个中断源及中断向量进行有效支持,这使其在实时语音识别及处理方面有着非常明显的应用优势,同时其还具有自动增益控制功能,这能够使残疾人通过麦克风来进行语音控制,从而大大提高了残疾人对嵌入式假肢的控制便利性。

1.3扩展电路

在扩展电路中,分布有语音采集电路、电源模块、程序下载模块、音频输出模块、扩展存储模块以及通信模块,扩展电路会通过语音采集电路来采集语音信号,然后通过模数转换存储至控制芯片中。而音频输出信号会将需要输出的控制指令进行相应转换,然后进行语音输出。电源模块则能够为系统的各个功能模块提供工作电压。扩展存储模块能够对语音信号进行外部Flash存储。而程序下载模块则是在控制芯片中写入事先编好的程序,通信模块用于实现PC端和控制芯片之间的通信。

1.4功能模块

在嵌入式假肢智能控制系统中,其功能模块是通过电机来进行驱动的,在其功能模块中,主要包括电机主体、编码器、位置传感器、驱动器以及压力传感器。其中,驱动器负责对语音识别芯片所发出的信号进行接收,同时还能接收编码器的反馈信号,并可对电机的转速、转向及启停进行控制。而压力传感器则可对假肢所受到的外界压力情况进行检测,并利用转换电路将信号向语音识别芯片,由芯片来处理反馈信息,并下达控制指令来对电机进行相应的控制。

2嵌入式假肢智能控制系统中语音识别技术的实现

2.1语音识别程序

在嵌入式假肢智能控制系统中,语音识别技术的功能实现是通过语音识别程序来完成的。语音识别程序共包括四个组成部分,分别是API函数、语音源文件、初始化程序以及主控程序。在语音识别时,会先进行初始化程序,然后在主控程序中调入API函数与语音源文件,然后由主控程序发出控制处理信号。在语音录制过程中,首先要进行语音采样,该系统在定时中断控制下通过8kHz来对采样的语音信号进行A/D转换,然后将转换后的语音信号按照某种算法来进行压缩编码,最后将编码后的语音信号存储到存储介质当中。该系统在语音识别程序设计中,应用了台湾凌阳公司所录制的SCAM-DVR函数库,并对相应的API函数进行了调用。

2.2语音识别流程

嵌入式假肢智能控制系统中语音识别功能的实现,使其能够听懂残疾人的语音命令,并根据语音命令的不同做出对应的响应。该系统可根据不同对象在说话时的依赖程度,将其划分成两种,一种是能够对特定的残疾人的语音命令进行识别,其只能对特定的对象语音进行辨认,这需要残疾人进行相应的训练后方可使用。还有一种是能够对所有对象的语音命令进行识别,不需要进行特定的训练。此外,根据不同残疾人的说话方式差异,语音识别技术既可进行孤立词识别,也可进行连续语音识别,在孤立词词别中,只能对单个词汇进行单次识别,而在连续语音识别中,则可对正常说话中的语句进行语别。此外,为了使嵌入式假肢智能控制系统的语音识别准确率更高,还应用了特定人识别方式。该系统的语音识别功能实现流程如下:在训练过程中,嵌入式假肢智能控制系统启动后会对RAM进行初始化,并由使用者进行训练,系统会自动获取训练结果,并提示训练成功,系统会自动建立使用者的语音特征模型。在识别过程中,嵌入式假肢智能控制系统会在启动后对识别器进行初始化,并获得识别结果,然后识别出语音命令,同时确认语音命令是否能够被执行,当不能执行时,会重新获取识别结果,如果能够执行,则会自动执行相应操作,从而完成整个识别过程。

3结语

总而言之,本文针对残疾人人群在日常生活中的种种不便,同时考虑到现有假肢在动作控制上存在的不足,提出一种以语音识别技术为核心的嵌入式假肢智能控制系统,该系统能够对残疾人所发出的语音命令进行自动识别,然后根据语音识别结果来做出相应的动作,从而实现了残疾人通过语音来控制假肢的目的,大大提高了残疾人的生活质量,并为残疾人对假肢的控制带来了很大便利,使残疾人能够具有更强的自信心重返社会。

参考文献

[1]楚岩,唐康,陈亮,巨永锋.基于语音信号的嵌入式假肢控制系统研究[J].电子设计工程,2013,21(24):174-177.

[2]樊炳辉,卢凤,王鑫,刘圭圭.智能上假肢特定人语音识别系统实现[J].计算机工程与设计,2017,38(06):1630-1634.

语音识别技术范文第2篇

关键词:人工智能;语音识别;图像识别;神经网络

0引言

伴随着经济的飞速发展与科技水平的不断提升,计算机技术的开发与应用的研究成为学者们关注的重点[1]-[2]。特别是在人工智能识别方面的研究越来越深入,其应用也越来越广泛。人工智能识别技术的应用,不仅提升了生产的效率,同时为人们的生产生活提供了方便[3]。针对此,本文在对人工智能识别技术进行介绍的基础上,对其关键性技术进行了分析,这对于提高人工智能识别技术应用水平具有重要的工程意义

1人工智能识别技术

1.1人工智能识别技术的定义

智能识别技术是以计算机系统、扫描设备、照相设备为基础设施,对目标的数据信息进行智能识别。当前的人工智能识别技术是从语音识别技术中逐步发展起来的。现在已经形成了人脸识别、图像检测、图像检索、目标跟踪、风格迁移等多项智能识别手段。这些智能识别技术的出现,提升了人们的生活质量,减小了人们的工作量、提高了生产生活小效率,对于推动我国社会主义现代技术的发展具有重要的意义。

1.2人工智能识别技术的研究现状

从目前的发展来看,我国已经在多个领域应用了人工智能识别技术。但在人工智能识别的核心技术上,仍然处于发展阶段。与国外其他发达国家相比,还未形成完成成熟的技术体系[4]。同时伴随着近几年各个国家之间加强了对人工智能识别技术的相互交流与渗透,使得我的人工智能的发展得到了新的发展机遇。在近几年的时间里,我国在人工智能的技术水平上不断提升,为人们的生活提供了便利,改善了人们的生活条件[5]-[6]。并且,我国相关科技管理部门加强了对人工智能识别技术的重视与相应资金上的投入。从目前来看,现阶段计算机人工智能识别技术的发展方向是解决应用过程中存在的各类问题以及对核心技术进行研发。

1.3人工智能识别技术的特点

人工智能识别技术在应用特点上具有高反应效率,高运算速度等特点,并且人工智能识别技术能够通过自我学习,达到能解决问题,能改造或创造,能做理论推演或理论研究的目的,在工程中,人工智能识别技术能够严格监控整个生产运行状态,如果一旦运行状态出现异常情况,就可以及时掌握故障信息反馈给维修人员,智能化的数据支持,也能给维修人员提供帮助,从而大大提高设备运行的状态稳定和安全。在实际生活中,图像识别与语音识别等人工智能识别技术的应用,能有有效的实现人与人之间信息调配和沟通,降低生活中资源浪费。因此,人工智能识别的成功应用,可以有效的解决人们在实际生产生活中遇到的问题。

2人工智能识别技术关键技术的运用

2.1语音识别

语音识别技术的研发,其核心是所采用的机械设备能够准确识别人类的语言,在此基础上开发人机语言交互技术也是其中的重要的一环。当前,基于语音识别技术的产品在不断的被研发普及。在各个领域得到了广泛应用。为人们的生活提供了便捷。语音识别技术在技术上是通过MFCC提取过程、预加重、分帧加窗、离散傅里叶变换、Mel滤波器组、Mel滤波器组、高斯函数gmm等在声控交换、语音通信识别、语音交流中的运用。在这个过程中,其预加重环节需要用到公式(1)进行处理:在整个语音识别过程中,要做到两点,其一是实现高效的语音沟通交流,第二方面是要保证通话的堡真性,从而保证人们在实际过程中有着良好的通话体验。

2.2图像识别技术

图像识别技术作为计算机人工智能技术的重要领域与分支。其核心是对图像进行相应的对象识别,以便区分出不同模式下的目标与对象。图像识别技术从发展上来讲,总共经历了三个阶段。分别为文字识别、图像处理与识别、物体识别。其通过对图像信息进行相应的处理分析,得到我们所需要的研究目标。发展到了今天,图像识别不仅仅是通过肉眼进行识别,同时借助计算机进行识别也是重要的识别手段。在识别原理上,计算机图像识别技术与人客户肉眼识别上是相同的。人类进行图像识别是根据图像本身具有的特征,将图像识别出来。当我们看到一张图片的时候,大脑会迅速反应出该相识的图片,并进行分类识别与存储记忆。人工智能图像识别技术是以图像特征为基础,关注每个图片的主要特征,并排除掉多余的输入信息,找到所需要的关键信息,分阶段的完成对图像信息的整理形成一个完整的直觉映像。在人工智能图像识别过程中,模式识别是关键,模式识别是对事物不同形式的信心进行分析处理,从而实现对一个事物或者现象的描述、辨别以及分类。

2.3机器人技术

我国在进入信息化时代之后,机器人技术逐渐发展起来,并得到了广泛的应用。同时,为了满足时代的发展的需求,机器人技术已经逐渐成为一门学科。伴随着智能化技术的发展,人工智能识别技术与机器人技术的相互融合,使得机器人技术得到了飞速的发,推动了机器人行业的迅速发展。人工智能识别机器人在组成上包含内部信息以及外部信息传感器。其传感器包含了对视觉、听觉、触觉以及嗅觉等。除了感受器之外,他们号又要电动机、筋肉等主要部件组成的效应器,使得他们能够与外界充分的接触起来。从目前的技术发展来看,智能机器人在组成上至少需要感觉、反应以及思考三要素。

2.4人工智能神经网络技术

近几年,人工智能网络技术十分常见。其主要是通过将处理单元之间进行有效的连接,从而构建出成熟的网络系统,能够进行相应的逻辑思维思考等功能,就像人的大脑一样进行思考,与人的脑力具有相似的模拟系统。在实际工业工程中,电子元件、处理元件以及人工神经元等的有效结合,可有效的解决实际工程中的问题以及保证工业的稳定运行。一个完整的人工智能神经网络包含输入层、隐层以及输出层三部分组成。

2.5远程规划与自主控制技术

远程规划与自主控制技术是计算机人工智能识别技术的关键组成部分。通过在航空航天领域应用该项技术,可以有效的实现对外太空器件控制的目的,其中NASA技术的研究应用成功,是人工智能识别技术在航空航天领域应用成功的重要里程碑。其将系统控制与远程监控系统技术充分融合在一起。实现了动态的监控。同时工作人员也可以采用计算机智能识别技术,了解外太空设备的运行状态以及明确设备可能出现的问题。并可针对存在的问题,制定出相应的调整方案,保证设备的可靠运行。

3小结

伴随着经济水平与科学技术的不断提升,人工智能识别技术的应用也越来越广泛,因此对人工智能识别技术进行研究对于提高人们生产生活质量水平具有重要的意义。本文在对人工智能识别技术的定义、研究现状以及其优点优势介绍的基础上,对人工智能识别中的语音识别、图像识别、机器人技术、人工智能神经网络技术以及远程规划与自主控制技术的特点与原理进行的全面的分析。这对于促进人工智能水平的发展具有重要的意义。同时,在未来的人工智能识别技术的发展中,需要对相应的工程实践经验进行总结,并结合环境发展的趋势要求,做好相应的技术研发工作。

参考文献

[1]张文娟.计算机人工智能识别关键技术分析[J].电子测试,2019,000(001):139-140.

[2]朱维平,金钱菽,王海华,等.基于人工智能的船舶识别关键技术研究与应用[J].中国水运(上半月),2020.000(004):65-67.

[3]黄琳.视频监控系统中的关键技术研究[D].西南交通大学,2006.

[4]赵楠,缐珊珊.人工智能应用现状及关键技术研究[J].中国电子科学研究院学报,2017,012(006):590-592.

[5]胡智魁.生物医学图像计算机智能识别关键技术研究[D].广东工业大学.

语音识别技术范文第3篇

关键词:汽车电子元器件;数据加密;信息交互;信息数据

0前言

作者简介:黄玉萍(1982—),女,硕士,研究方向为计算机技术应用。随着互联网的飞速发展,大数据并行计算采用了更为复杂的指令系统,人们通过各种加密方法来保护互联网信息和数据的安全。

1数据加密的重要性

1.1互联网技术的潜在危机

数据作为新的生产要素,其蕴含的价值日益凸显,而其存在的安全问题也愈发突出。目前,在互联网信息安全领域,用于保障通信信息安全的技术仍以数据密钥为主[1]。计算机数据加密技术是将原始信息转换为一种按特定方式排列的代码,通过这些特定的、具有规律性的代码解密,才可以对原始信息进行读取,从而起到保护计算机数据的目的。

1.2区块链技术

汽车行业是人工智能和自动驾驶系统等新技术的探索者和践行者。汽车行业可以利用区块链的方式有很多,其中数据加密等一些区块链技术已经被整车制造商所采用。据悉,在国际上已有一些公司开始了区块链技术测试。例如:宝马汽车公司与摩洛哥矿业公司(ManagemGroup)签订了1份1亿欧元的钴供应合同,大力发展区块链技术;梅赛德斯-奔驰汽车公司应用区块链技术推出了“安全驾驶”计划;保时捷汽车公司则通过区块链技术构建了相应的应用程序(APP)。应用区块链技术,可以提高自动驾驶汽车的安全性,快速处理、分析和传输大量数据。目前,区块链技术在汽车行业的运用已经涉及到共享汽车、数据位置追踪、电子合同支付、个人信息存储、车辆召回和汽车自动驾驶等诸多需要进行数据加密的技术领域,并且其应用领域还将不断拓展,这推动了汽车电子元器件技术的进一步发展[2]。

2数据加密技术

数据加密技术是数据安全最为经济可靠的手段。对数据进行加密,并结合有效的加密保护手段,可在开放环境中实现对数据的访问控制,从而让数据共享更为安全、更有价值。随着《密码法》等相关法规的施行,各行业对数据加密、产品安全和服务效率的重视程度在不断提升。数据加密可以在病毒入侵之前预先判断潜在的入侵,提前向文档所有者发出警告,可以通过电子邮件和电话向用户普及热点事件,并在加密数据中心安装防护墙、自动文件锁和文件备份,以保护文件的安全。在日常生活中,文件可以以多种方式进行传输,在互联网条件下,文档可以在几秒钟内备份或发送给其他人。因此,仅通过设置密码来保护文档是不够的,应设置文件用户密码和手势认证的双重保护,确保密码不被窃取,自动保护文档并防止信息系统被入侵。公司的数据源应具备收集入侵数据并进行分析的功能。为了应对新型的、更强的数据入侵行为,数据加密时将根据入侵方式和文档自身弱点对文档进行分析,增强其可能受到破坏的薄弱环节,从而进一步提高文档的安全性。大数据加密算法模型如图1所示。大数据加密算法可分为对称加密和非对称加密2种。利用对称加密技术,采用相同密钥对数据进行解码,具有解码速度快、效率高、资源利用率高、使用成本低、算法开放、技术成熟等特点,被广泛应用于信息系统的加密。对称加密技术在2个远程终端用户之间很容易建立密钥通道,无需见面或使用在线认证服务。但是,由于在数据传送前,双方已商定和保存好密钥,一旦一方的密钥泄露,信息传递就不再安全。如果每次信息传递都需要换1次密钥,则会增加信息加密的工作量。非对称加密技术则同时拥有公开密钥和私有密钥,私有密钥可以自己存储数据,数据可以通过公开密钥进行解码。然而,虽然非对称加密技术密钥的保存量少,但存在算法相对复杂、资源占用率高、解码速度慢及效率低等问题。

3数据加密技术的应用

3.1基于数据加密的智能芯片

智能语音识别芯片采用了多种智能语音识别技术,包括信号处理与模式识别、发生机理与听觉机理、概率论与信息论,以及人工智能等技术。芯片与集成电路制造属于精密仪器制造,对制造环境和运行环境具有较高要求,对应的开发与制造成本相对较高。智能语音识别芯片在性能较低的硬件平台下运行并不理想,对多语种混合识别还有所欠缺,对噪声的干扰也比较敏感,还应进一步优化和完善。按照识别对象与内容,智能语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片[3]。其中,特定人语音识别芯片用于对指定的人进行语音识别,必须将用户的语音参考样本存储在数据库中作为比较,即必须在使用前对特定人的语音识别并进行训练,无法识别特定人之外的语音。非特定人语音识别芯片则针对普通人群进行语音识别,可普遍识别各种人的语音。

3.2基于数据加密的电子元器件

3.2.1音响。通过音频面板上的按钮将某些数据(即设置密码)输入到汽车音频中,可实现车辆的防盗保护。如果驾驶员设置了安全代码并进入防盗模式,车机系统必须在输入驾驶员设置的密码后才能正常工作。在防盗模式下,如果密码输入错误,车机系统将拒绝工作。目前,几乎所有高端车载音响系统都使用这种防盗方法。3.2.2汽车电子钥匙。在数据加密技术的应用中,汽车的电子钥匙是最早应用数据加密技术的电子元器件之一。不同于机械滚码,数据加密技术可以在相同信息量情况下提高加密等级,节省对码时间。美国福特汽车公司在1994年提出了一种名为“埃斯科特样机”的电子安全保护装置。这是全球第1把带密码的电子钥匙。随着移动互联网和车载网络技术的普及,被称为“蓝牙钥匙”或“虚拟钥匙”的数字钥匙,已经成为下一代车辆的标准配置。数字钥匙主要使用输入通信技术,允许用户通过智能手机或便携式智能设备(如智能手表)进行车辆的解锁、锁定和启动。目前,汽车制造商通常使用自己独有的统一通信技术进行数据加密,该加密方式与用户没有特定联系,一旦加密数据被破解,很容易造成大量汽车被盗。例如,特斯拉汽车公司曾因数字钥匙的安全性,深陷“安全漏洞”风波。为此,特斯拉改进了车辆的加密技术,并增加了“PINtoDiver”功能选项,提高了车辆的防盗能力。

3.3基于数据加密的信息软件服务

3.3.1数据库系统。数据库系统通常采用数据操作规范、用户身份认证和系统操作安全等方式进行数据库管理,并且数据库会对重要信息进行加密处理。但为了不大幅增加数据库的空间储存量,方便获取用户数据,数据库加密和解密的速度必须足够快,尤其是通过互联网存储的内置内存加密功能,解密的速度应更快。3.3.2信息传递。每个主机的用户都能使用唯一的用户身份识别号(ID)和密码访问位于网络中的文件或者应用程序。多数存储在系统服务器或应用终端上的敏感数据都以文件的形式存在。加密可以作为敏感数据和信息的防线,是网络安全技术的基石。数据加密的目的是保护用户信息不被非法读取,并帮助公司处理机密数据。在信息系统中,大量数据通过互联网进行传输,各级信息系统进行相互联通,任一节点出现问题都将对整个信息系统的安全可靠运行造成致命打击。3.3.3软件匹配。互联网信息数据安全性和完整性,是计算机服务软件的重要组成部分,如果没有各种服务软件,计算机将无法发挥其基本功能和作用。因此,为计算机中的各种服务软件提供数据加密服务也是保证计算机网络中信息和数据安全的有效手段。目前,各种服务软件的加密方式一般为软件加密锁。软件加密锁主要包括相关加密数据信息和加密算法。用户在使用过程中可以通过与计算机网络系统的连接来查询信息数据,在保证查询速度的同时,提高查询过程的安全性。3.3.4公钥基础设施(PKI)。PKI是1个包含硬件、软件、人员、策略和规程的集合,采用通用技术规范和标准,实现基于公钥密码体制的密钥设置和安全证书的产生、管理、存储、分发、撤销等功能,如密钥的创建、分发、管理、销毁和验证,证书服务和加密等。典型的PKI系统包括PKI策略、软硬件系统、证书签发机构(CA)、证书注册机构(RA)、证书系统和PKI应用等,为数据的安全性和完整性提供完整的解决方案[4]。

4结语

区块链以其“分散、强化信任、分布式核算、非操纵”的特点,被提升到国家科技战略的高度。其分散性、透明性、开放性、自治性、信息操纵性和匿名性等特点可以更好地解决共享经济过程中信息不对称、交易成本高、陌生人之间缺乏信任等问题。互联网巨大的用户基数和惊人的数据传递与存储量,使得计算机信息安全维护逐渐成为人们关注的焦点。在技术层面,数据加密技术并不能完全解决计算机网络安全的所有问题,只是一种主动防御攻击的技术手段,还存在一定的局限性。数据加密技术的应用是为互联网信息安全提供保障,为新能源汽车各项数据提供安全保护。加快完善数据安全立法及法规体系的建设,全面实施数据安全标准规范,完善数据安全监管联动机制,是现阶段数据加密技术应用领域的重要课题。

参考文献

[1]傅晓彤,刘晓晓.一个无证书型非交互式密钥协商协议[J].密码学报,2014,1(4):334-340.

[2]钟先锋,汤煜,金标,等.星地量子密钥分发中的数据协调方法[J].计算机工程,2017,43(4):122-125.

[3]王晓跃,习海旭,柳益君,等.基于SPOC混合式学习模式的学习支持服务构建研究[J].电化教育研究,2019,40(3):48-53.

语音识别技术范文第4篇

关键词:生物特征;指纹;虹膜;面部特征

1背景介绍

简单来说,在身份认证领域里生物特征指的是一个人与生俱来的生理特征,例如:指纹、虹膜、面部特征等。利用这些特征进行身份认证有很多优点,当然,没有一种能够满足所有需求的完美的生物特征识别技术,每一种技术都有其自身的优缺点。但是,要使生物识别系统可用,需要具备一些共同的特征。首先,生物特征识别必须基于可区别的特征。有大量的科学数据支持“没有两个指纹是相同的”的想法。诸如手部几何学之类的技术已经使用了很多年,诸如面部或虹膜识别之类的技术已得到广泛使用。一些更新的生物识别方法可能同样准确,但是可能需要更多的研究来确定其独特性。另一个关键方面是系统的“用户便利性”。用户身份验证的过程应该快速简便,例如用摄像机拍摄照片,对着麦克风讲话或触摸指纹扫描仪。第三,低成本也很关键。生物特征识别所涉及的不仅是传感器或配套软件的初始成本,可能还需要考虑到对于老旧系统的兼容问题,这又是一项难以预料的投入。生物特征识别技术早已在犯罪鉴定及监狱安全等领域广泛应用,并且具有很强的潜力,可广泛应用于民用应用,例如电子银行,电子商务和访问控制。由于电子交易的数量和用途的迅速增加,电子银行和电子商务正成为生物识别技术最重要的新兴应用之一。这些应用程序包括信用卡和智能卡安全性,ATM安全性,支票兑现和资金转账,在线交易和Web访问等。随着技术的进步,会有越来越多的领域使用生物特征识别技术进行身份验证[1]。生物特征认证要求将已注册的生物特征样本(生物模板或标识符)与新捕获的生物特征样本(例如,登录期间捕获的指纹)进行比较。在注册过程中,将采集生物特征的样本,由计算机进行处理并存储,供以后比较。可以在“识别”模式下使用生物特征识别,其中生物特征识别系统通过仅基于生物特征识别在数据库中搜索匹配项来从整个登记人群中识别一个人。系统也可以在“验证”模式下使用,在该模式下,生物特征识别系统会根据之前的注册模式来验证一个人所声称的身份。这也称为“一对一”匹配[2]。

2常用生物特征

2.1人脸识别

人脸识别的实现方式有很多种。例如,使用廉价的相机捕获可见光谱中的面部图像,或者使用面部热量散发的红外模式。可见光中的面部识别通常从面部图像的中心部分对关键特征进行建模。可见光系统使用各种各样的相机,从捕获的图像中提取不会随时间变化的特征,同时避免了诸如面部表情或头发之类的表面特征。在可见光谱中对面部图像建模的几种方法有主成分分析,局部特征分析,神经网络,弹性图论和多分辨率分析等。面部光谱识别中遇到的一些挑战包括减少可变照明的影响以及检测遮罩或照片。尽管许多系统使用实时过程来检测人的头部并自动定位面部,但是某些面部识别系统可能需要固定的或摆姿势的用户才能捕获图像。面部识别的主要好处是它是非侵入性的,免提的,连续的,并为大多数用户所接受[3]。

2.2语音识别

语音识别的历史可以追溯到大约40年前,当时对几个模拟滤波器的输出进行了平均,以进行匹配。语音识别利用已发现的个体间语音的声学特征。这些声音模式既反映了解剖结构(例如,喉咙和嘴巴的大小和形状)又反映了学习的行为模式(例如,声音音调,说话风格)。这种将学习到的模式结合到语音模板(后者称为“语音记录”)中的方法已经赢得了演讲者的认可,被归类为“行为生物特征”。语音识别系统采用三种语音输入方式:与文本有关,与文本提示有关以及与文本无关。大多数语音验证应用程序使用依赖于文本的输入,这涉及一个或多个语音密码的选择和注册。只要有冒名顶替者,都会使用文本提示输入。用于处理和存储声纹的各种技术包括隐马尔可夫模型,模式匹配算法,神经网络,矩阵表示和决策树等。语音行为属性的更改以及使用一部电话注册并在另一部电话进行验证可能会导致性能下降。识别系统还需要解决由于年龄老化导致的语音变化。许多公司销售语音识别引擎,通常将其作为大型语音处理,控制和交换系统的一部分。生物特征的捕获被认为是非侵入性的。通过使用现有的麦克风和语音传输技术,该技术几乎不需要额外的硬件,从而可以通过普通电话(有线或无线)进行长距离识别[4]。

2.3虹膜识别

这种识别方法是利用眼睛的虹膜,它是围绕瞳孔的有色区域。虹膜图案被认为是唯一的。虹膜图案是通过基于视频的图像采集系统获得的。虹膜扫描设备已经在个人身份认证应用中使用了几年。基于虹膜识别的系统的价格已大幅下降,并且这种趋势有望继续。该技术在验证和识别模式下都非常有效。甚至在存在眼镜和隐形眼镜的情况下也可以使用当前的系统。该技术不是侵入性的,它不需要用户与扫描仪进行物理接触[4]。

2.4手和手指的几何形状识别

手识别已经有二十多年的历史了。为了实现个人身份认证,系统可以测量手指或手的物理特征。这些包括手的长度,宽度,厚度和表面积。手的几何形状已在一系列应用中得到认可。在商业和住宅门禁,时间和考勤系统以及一般个人身份验证应用中的物理访问控制中经常可以找到它[3]。

2.5签名验证

该技术使用签名的动态分析来对人进行身份验证。该技术基于产生签名时对人用力的速度,压力和角度的测量。这项技术的重点是电子商务应用程序和其他应用程序,其中签名是公认的个人身份验证方法[4]。

2.6指纹

一个人的指尖上的摩擦脊和谷的模式对该人而言是唯一的。几十年来,执法人员一直在通过匹配脊末端和分支的关键点来对身份进行分类和确定。指纹对于一个人的每个手指都是唯一的,包括同卵双胞胎。作为最商业化的生物特征识别技术之一,用于台式机和笔记本电脑访问的指纹识别设备现已广泛使用,用户不再需要输入密码,只需触摸即可提供即时访问。指纹是指尖上的脊和沟纹,已被广泛用于个人识别。指纹形成的生物学特性是众所周知的,并且指纹已经被用于多个世纪的鉴定目的。自20世纪初以来,指纹已被世界各地的各个法证部门广泛用于识别罪犯。由于其犯罪含义,有些人在为民用应用提供指纹以进行识别时感到不舒服。但是,由于基于指纹的生物特征识别系统可以高度肯定地提供可靠的识别,并且紧凑的固态指纹传感器可以嵌入各种系统中,因此基于指纹的身份验证在手机中越来越受欢迎。廉价,紧凑的固态扫描仪以及强大的指纹匹配器的可用性是基于指纹的识别系统普及的两个重要因素。与其他生物特征识别技术相比,指纹也有许多缺点[5]。

3优缺点对照

在上一节中介绍了常见的生物特征识别技术,这些技术并不是十全十美的,在使用它们时还必须考虑环境、成本、用户便利性等因素。接下来,我们通过表1对比各项技术的优缺点。

3.1优点综述

(1)高可靠性

通过验证用户所拥有(例如:UKey)或所固有(例如:指纹)的东西,生物特征识别技术为我们提供了一种真实感,为攻击者获取授权增加了一道障碍,使得攻击者即便在获得密码之后,仍然由于不具备生物特征而无法获得授权。此外,生物特征识别只能由呼吸中的活人提供,因此,机器人将很难通过虹膜扫描。

(2)用户便利性

虽然生物特征认证的内部过程是技术性的,但从用户的角度来看,它的过程非常简单快捷。将手指放在扫描仪上并在数秒内解锁账户,比输入包含多个特殊字符的长密码快得多。另外,忘记密码是大多数用户的常见错误。但是,您会忘记指纹吗?恐怕不容易。

(3)唯一性

生物特征认证要求在授权时提供其输入。您无法以数字方式转移或共享生物特征,换句话说,能提供生物特征通过验证的用户就是本人。

(4)防伪性

像脸部图案,指纹,虹膜扫描等生物识别技术几乎不可能用当前技术进行复制。您的指纹与他人的指纹完全匹配的可能性为640亿分之一[1]。换句话说,与拥有试图通过生物识别技术保护您的账户的黑客拥有相同的指纹相比,您有更大的机会赢得。

3.2缺点综述

(1)成本高

先进的安全系统需要大量的投资和实施成本也就不足为奇了。Spiceworks在2018年进行的一项调查中,有67%的IT专业人员将成本视为“不采用生物特征认证的最大原因”。过渡到生物识别认证将不是公司唯一需要付费的事情,有47%的受访者表示需要升级当前系统以支持其设备向生物识别认证的转变[2]。

(2)数据泄露危害更大

收集和存储用户个人数据的企业和政府一直受到黑客的威胁。由于生物特征识别数据是不可替代的,因此组织需要更加谨慎的对待敏感的生物特征识别数据。如果密码被盗用,还能对其进行更改。对于一个人的生物特征而言,这就没那么容易修改了。

(3)隐私泄露

随着世界上对诸如面部识别技术和其他生物特征安全措施之类的生物特征认证系统的使用的增加,需要考虑用户的隐私。当将生物特征识别技术转换为数据并进行存储时,攻击者甚至可以利用这些数据跟踪用户,用户只是经过了摄像头,就会在系统内留下一条数字记录,而且是在用户完全不知道的情况下。

(4)误报和不准确

大多数常见的生物特征认证方法都是依靠部分信息来认证用户的身份。例如,移动生物识别设备将在注册阶段扫描整个指纹,并将其转换为数据。但是,将来对指纹进行生物特征认证时,只会使用部分打印内容来验证身份,因此它将会越来越快。纽约大学的一个研究团队于2018年创建了一个人工智能平台,该平台能够通过将部分打印的相似性与完整生物特征数据进行匹配来以20%的成功率欺诈性地破解指纹认证[3]。

4结论

语音识别技术范文第5篇

关键词:广告监测系统;系统架构;安全播出

0引言

广播电视广告监测系统,完成广告内容识别、违规预警,为各级监管部门提供服务,对识别出的广告信息进行判断、取证,并通过开放系统权限实现相关监管机构对违规广告的研判、审核功能。系统以总局61号令、6号令《专网及定向传播视听节目服务管理规定》及行业相关管理文件相关内容为依据,可精准的实现对各类广告进行自动化监测,对广告播出情况进行分类统计(如商业广告类型:食品、药品及保健品、医疗、医疗器械、化妆品、酒类、家用电器、房地产、金融、教育培训、其他;公益广告类型:讲文明树新风、反腐倡廉、健康生活、生态/环境保护、其他),并支持对长广告、变种广告、购物短片类等进行监测。对监测结果,可进行多维度统计分析。

1总体架构设计

如图1所示,广告监测系统的逻辑层次架构设计由数据层、计算层、系统应用层构成。数据层主要包括主要用于广告数据的采集和广告数据的存储,为广告监测系统提供基础数据支持,为上层的服务。计算层包含人脸识别引擎、语音识别引擎、文字识别引擎、语义识别引擎和场景识别引擎,主要完成广告画面的人工智能审核,为系统应用层提供研判结果。系统应用层主要是完成系统应用的功能,包括广告自动识别、新广告自动发现、广告结果快速审核、广告样本管理、广告统计、报告输出等功能,对监测范围内所播出的广播电视节目商业广告、公益广告以及违规广告进行自动识别,并且能够对识别结果进行划分种类、统计条目、分析内容,结合广告法、总局61号令、66号令、总局79号文,提供一套完整的节目广告播出情况统计分析报告。

2系统功能

2.1广告自动识别

系统具有自动分析广告内容和识别广告中关键特点的功能,根据不同地区的特定要求定制相应的结果报表,采用通过系统后台高效率的广告识别算法,能够做到多线程多个任务并行处理。广告识别根据国内现有的技术,只具备对短广告和已知做了模板的长广告进行识别,现在各地广告播出部门经常对同一个广告中间进行添加宣传片或对广告前后顺序颠倒或添加删减部分广告词,逃避监管部门的发现。还有的广告商把长广告做成连续剧样,今天播出的内容是第一集卖的是一个产品,明天播出的节目名称和今天的一样,但是卖的产品又是另外一个产品,使监管部门很难发现广告和对广告内容进行自动识别,在这一方面对国内的广告监管来说还是一个短板,虽然多个厂家想过很多种办法去尝试解决这个问题,但是没有哪个厂家有实质性的突破。

2.2新广告自动发现

系统具有新广告的智能识别能力,根据广告具有的重复性特征和某些特定的规则,自动发现疑似的新广告,结合快速非线性编审工具,可确定疑似新广告的起止时间,并经过属性标记后添加到系统中,系统自动进行拆分、下载和学习成广告样本,如图2所示。能够对电视上播出的新广告进行准确自动识别和能够定位广告的开始时间和结束时间。迅速发现所监测的频道节目内潜藏的新广告,通过较为醒目的方式提醒用户注意到该广告,并且有助于协助用户进行广告样本库的制作,从而做到广告识别的样本完整性和全面性。

2.3广告结果快速审核

对执行结果点击查看,侧滑展示结果数据,可对结果数据进行再次研判,展示信息包括:广告视频、广告名称、广告类别、是否违规(是、否)违规属性、违规类型、法律法规、备注。支持对违规广告进行处理、加入违规库和下载,如图3所示。自动提取节目中视频场景切换的帧,显示在审核界面中,便于广告审核员进行快速的查找定位,极大的方便广告审核。

2.4广告样本管理

通过前期的新广告的自动发现功能结合人工监看方式,制作新出现广告的样本,能够做到添加广告样本时对广告进行命名、分类、选择是否违规、违规内容以及违反的具体条例,选择识别的频道以及样本时长,进行存储,如图4所示。具有对已有的样本进行查询并播放广告、修改样本的名称、广告过期时间、分类、子类、入点时间、出点时间、是否合规、所属频道、状态、备注等属性、支持批量删除样本文件、媒资信息等基本编辑功能,同时具有过期样本自动删除、频道分配、内容监看、智能查询等管理功能。

2.5广告统计

根据国家新闻出版广电总局61号令和国家新闻出版广电总局66号令规定,将商业广告的违规情况分为两个方面,一方面违规主要体现在广告内容、广告形式上,根据法律法规中描述的禁止播出含有违规内容的广告和禁止播出的广告进行判断是否违规,并对系统发现的违规情况进行统计;另一类为时间违规,包括播出时长超出规定时间以及在公共用餐时间播出不适宜的广告,由系统以及人工根据识别出的违规广告播出情况进行统计。从广告角度统计广告播出情况,支持查询、导出,详情查看等功能。支持根据广告名称、开始时间、结束时间进行查询。展示信息包括广告名称、播出总次数、总时长、覆盖频道数,查看(详情)查询对应的广告列表。展示顺序为总播出次数最多的靠前。广告统计支持公益广告统计、商业广告统计、违规广告统计,支持按广告名称、播出频道、播出时间段进行统计,统计信息含播出时间、播出时长/次数、播出频道、广告名称、违规原因等,如图5所示。

2.6报告输出

对监测发现的违规广告等各类广告播出情况,结合统计图表、数据单,按月度、季度、年度,输出监管报告。目前根据国家新闻出版广电总局法律法规规定以及江西省自身要求对报表分类进行了定制,包括广告统计表、公益广告播出情况统计表、商业广告播出情况统计表、长广告播出情况统计表、黄金时段广告播出统计表、用餐时间广告播出情况统计表等,如图6所示。

2.7内容分析引擎

2.7.1人脸识别引擎。对广告播出画面中的人脸区域进行自动识别、标注并且进行存储。能够快速、准确的发现广告节目当中出现的敏感人物、禁止出镜人物等,对敏感人物、重点任务在节目中出现时间,持续时长进行标注,提示监管工作人员进行相应的处置操作。支通过区域标注、信息提取、积累优化等手段,完成对广告场景中人脸的在线检测;支持通过特征比对、结果反馈、多模板比对、识别结果重塑、匹配率计算等方式,完成对人脸的在线识别。2.7.2场景识别引擎。对广告节目画面中出现的各类景物对象、特定场景进行自动识别、标注、存储,实现涉暴、涉黄分析和对象识别。后续可利用关键词搜索技术进行筛选,快速检索到目标数据。支通过对象分类、特征提取、分类检测等手段,完成对广告场景中物体的在线检测;支持通过特征比对、多级类别标记等方式,完成物体识别;并根据物体识别结果,对物体群组进行标记,并通过物体比对分类完成对图像场景的分类。2.7.3语音识别引擎。对系统中的广告节目语音部分自动翻译为文本形式,后续即可利用关键词识别技术进行筛选,快速检索到目标数据。系统支持自动对采集到的广告类别的音频、视频节目进行自动生成文本。监测人员可以通过文本的方式对音视频节目进行关键字查询。支持对广告节目中普通话、粤语和混合场景语音部分自动翻译为文本。目前的语音识别系统的硬件设备需求量较大,对单个频道进行24小时的语音识别所耗费的运算占用大量服务器,在资金不充足的情况下建议对监测频道分时段进行语音识别任务。2.7.4文字识别引擎。对广告画面中出现的文字区域进行自动识别、标注并且进行存储,后续可以通过关键词搜索技术对已存储的数据进行调取数据并进行查看,快速检索到目标数据。2.7.5语义分析引擎。对广告节目中的文本信息进行语义分析,实现对舆情正负面的分析。分类识别:可实现词性分析以及词性标注;完成对文本类别的识别分类;自动实现语义实体识别。对文本的所属进行类别识别。能够对文本信息中所体现出的情感倾向进行正面、负面或者中性的分析。

2.8先进技术分析

2.8.1云计算架构。系统的设计符合云计算架构要求,可全面兼容国内主流的私有云、公有云、政务云环境。云计算架构的应用,为广告监测系统提供高稳定性的存储资源支持,为人工智能识别、大数据分析等智慧化监管工具提供高性能、高弹性的计算资源支持,为计算、存储、网络等所有底层资源提供了高可用的备份保障以及一站式的管理工具,为构建广告智慧监管体系提供了有力的资源保障。目前江西省广播电视监测中心已经将广告监测系统、移动互联网监测系统、IPTV监测系统、传统广播电视监测系统以及内容评议系统全部融入云平台进行统一管理。2.8.2人工智能深度识别。本次系统建设中,引入人工智能技术,实现对广告文字、图片、视频内容的深度分析,能够以机器代替人工完成非结构化数据的标签化分类清洗,协助值班人员更加精准、便捷的完成广告监测。2.8.3大数据分析技术系统采用大数据分析技术,对原本相对孤立、微观的广告监测系统进行统筹分析、深度挖掘,形成一系列宏观的分析报告,为真正实现广告智慧监管提供服务支撑。

3结论