首页 > 文章中心 > 人工智能技术意义

人工智能技术意义

人工智能技术意义

人工智能技术意义范文第1篇

关键词:智能化;建筑系统;应用

通过对智能化建筑系统集成电子技术进行分析,能够充分认识当下发展的现状,认识到发展中出现的问题和困难,讨论出电子技术在智能化建筑系统设计中的集成控制的策略,促进建筑行业朝着积极的方向不断发展。

1、智能化建筑系统集成电子技术的简述

1.1基本含义

智能化建筑系统集成在应用的过程中,可以和信息技术工程建设进行结合,应用到实际的生产工作中。在进行结合的过程中要注意设置好监控设备,这样才能提高整体的科学性。通过科学合理的设置,才能促进生产的智能化和科学化,才可以提高生产的质量和效率。[1]还应该通过优化资源配置这一方式来促进工程的不断进步和发展。

1.2应用现状

智能化建筑集成系統具有很多功能,比如火灾自动报警、问题防范等等。这种该系统的运用可以对信息和网络进行强化,可以最大程度地发挥出BMS集成控制,进而建立起更加完善的智能建筑管理集成系统。这样就可以不仅提供信息共享和监控的服务,还能够通过自动监测找出在建筑物中运行的功能,这就可以发挥出良好资源配置的功能和作用。

2、智能化建筑系统管理的意义

智能化建筑系统管理具有四点意义。[2]第一点意义是,可以建设更加安全和舒适的建筑环境来满足客户的需求。科技的进步也为建筑行业的发展带来了新的机遇和挑战,建筑企业如果能够抓住机会,就可以直接通过网络技术来了解客户的需求。这样就节省了实地考察的时间和财力,降低了成本,又提高了一定的效率。这样不仅可以减少工作人员的工作量,又可以让工作人员以高质量的效率进行工作,还可以为客户提供更优质的服务和建筑环境。第二点,可以完善通讯网络系统来满足客户发展的需要。目前互联网已经渗透在了人们生活、工作和学习的各个方面,所以要保证网络的通畅和速度。这可以促进业主和物业管理之间友好的关系,减少矛盾和问题,促进业主和物业管理和谐的存在。第三个意义,对外通讯设施系统。在现阶段,由于城市的土地比较珍稀,所以建筑物一般都比较密集,而且大多都是封闭的状态。一旦发生一些突发情况,就没有时间进行反应。智能化建筑可以很好地解决这一问题,因为智能化建筑集成电子建立的过程中,配备了足够的通讯设备,这样就为居民安全提供了一定的保证。第四个意义是建立水、气、电的抄送系统,可以方便物业的管理。因为传统的查抄需要工作人员挨家挨户上门统计。智能化的建筑系统可以科学合理的对水、气、电进行规划,这样也可以给业主带来方便。以往的上门查抄工作人员去的时间可能是业主不方便的时间,容易引起业主的不满,这样还可以方便工作人员进行工作和统计,也方便了物业的管理。

3、智能化建筑系统集成电子技术的应用与控制策略

通过对于智能化建筑系统集成电子技术的意义进行分析,能够促进智能化建筑设计和集中电子技术应用的发展。[3]首先,要明确智能化建筑系统的集成电子技术组成。在现代建设行业的发展中,需要注意各个系统的组成和应用。因为智能化建筑系统集成技术包含的内容很多,所以很多独立的系统又包含着其他子系统,这就需要对设计和开发建设中进行合理的规划和控制,这样才能促进智能化建筑系统及其集成技术发挥出应有的作用和效果。在智能化建筑系统集成电子技术应用的发展中,必须对一些技术进行创新,比如现代通信技术、电子信息技术、计算机网络技术等。其中,计算机网络技术的创新和发展非常重要。因为计算机网络系统是建筑和管理系统的基础,系统的整体运行都需要计算机网络系统来控制和操作。因此要加强对计算机网络技术的重视程度和革新,使得智能化建筑系统集成电子技术应用更加满足智能化、自动化发展的需要。

4、智能化建筑系统集成电子技术的具体应用

4.1公共广播传呼系统

现代建筑物中需要含有的系统就是公共广播传呼系统,这个系统可以进行紧急的广播、放送音乐等等。[4]在这个系统设计的过程中设计人员要先考虑选择的扬声器的特性和功能,还要明确紧急广播功能的切换和进行广播的路线,还要明确广播划分的区域。紧急广播主要应用在突发的火灾、一些意外情况的发生等等,所以需要设计人员特别注意。要注意扬声器的音量可以让每一个住户听到,对广播的区域进行合理划分。在日常没有突发事情的时候,公共广播可以放一些音乐、播报一些通知等等,在遇到紧急事件时,要确保紧急广播时刻处在优先地位。

4.2OPC技术

我国的科技发展在近几年来突飞猛进,在高速发展的同时,网络控制系统也变得越来越复杂,人们对于网络控制系统的应用和要求也越来越高,所以OPC技术就迎来了大好的市场。OPC技术是近年来新开发和应用的一种技术,具有开放、高效的特点。由于OPC技术对多个集成系统进行连接并且控制的,所以在应用的过程中要注意各个系统之间的兼容性。通过应用OPC技术,可以对集成系统进行良好的控制和联系,能够促进消费者和服务器之间完美融合,从而使工程建设可以顺利开展。OPC技术的应用可以节省一定的人力和财力,OPC技术能够使服务器都集中在一起,不用再考虑不同部件端口的问题,方便了应用和自动化功能的实现。

人工智能技术意义范文第2篇

关键词 :     智能手机技术;社会性;生成机制;实现路径;

Abstract: Smartphone technologies are related to the development,the production,the sales,and the use of smartphones,with features such as subjectivity,intentionality,mobility,multi-functionality,and incompleteness nature of ownership transition,etc.The social attribute of smartphone technology is defined as the attribute of human interaction reflected in above activities.The subjectivity and mobility of smartphone technologies extend the sense organs,the nervous system,and the brain of human,enhancing people’s cognitive and thinking ability;the mobility and multi-functionality extend temporal and spatial boundaries of human interaction,improving the efficiency of work and enriching our lives;the incompleteness nature of ownership transition determines the special diversity of subjects,demonstrating the complexity of social interaction.The social attributes of smartphone are generated by the permeation through the whole procedure of its running process,which present as the nationality,the economy and the value orientation ability and so on.

Keyword: Smartphone technology; Social attribute; Generation mechanism; Implementation path;

在智能化、网络化、信息化浪潮的推动下,智能手机成为日常生活和工作中不可或缺的部分。智能手机不仅普及率高,而且被使用时间长。据2021年《第十八次全国国民阅读调查成果》的结果显示,“2020年我国成年国民人均每天手机接触时长为100.75分钟,比2019年的100.41分钟增加了0.34分钟”。[1]反过来说,智能手机作为一种多功能的网络移动平台,进一步加速了智能化、网络化、信息化发展,延伸了人的感觉器官、神经系统和大脑,增加了人与人交往的时空边界,增加了人与人关系的复杂性。智能手机独特的技术特征将有利于深化人们对其社会性的认识,促进其规范使用和有序发展。

一、技术与智能手机技术

1. 技术的内涵与特征

芬伯格(Andrew Feenberg)同时依据两个标准(是否受人控制和是否价值中立)把技术理论分为四类:工具论、决定论、实体论和批判理论。其中,工具论和决定论是价值中立的,实体论和批判理论是价值负载的;决定论和实体论都强调技术的自主性,工具论和批判理论都认为技术是受人控制的。[2]前三类理论都是从技术产品,即人造物的角度分析技术。而最后一类(即技术批判理论),将关注的焦点集中到技术设计的源头。他认为,技术从设计阶段便融入了利益主体的意图、目的及价值观,主张批判现存技术去寻找可替代的技术。

伊德(Don Ihde)认为,“技术是我们在环境中以各种方式形成使用的那些物质文化的人工物。”[3]这种人工物不仅仅是一种工具和手段,而且其结构和功能还隐含着制造者的目的和意图。“通过人造物的结构,可以把人造物与人的因素,与人的意向和人所生活的具体情景(环境)联系起来。”[4]技术是生活世界的技术,人造物处在生活世界的大背景或某个具体情景之下,必然会依赖或聚集生活世界中自然、社会、历史等各方面的内容,对人与社会乃至整个世界的关系产生多维度的影响。

基于以上分析,本文对技术的概念界定如下:技术是以人造物为主要研究对象,联结人的意向和实践并对生活世界各要素聚集和反映的过程。其特征主要有:(1)主体性。技术不能脱离人单独存在,而且在技术过程中常有多个主体参与,他们都有可能影响技术发展的方向;(2)意向性。人造物中包含了技术主体的经济、社会、政治、文化和生态等方面的意向,这也是人造物产生的动力和原因;(3)物质性。技术最终会外化为一个人造物,或搭载在相应的工具或设备上。

2. 智能手机技术的内涵与特征

关于智能手机的内涵,大体有三种观点,一是认为智能手机是一种服务于媒体传播的移动媒介;[5]二是认为智能手机是一种携带方便的用于语音通讯和信息交流的工具;[6]三是认为智能手机是一种中心文化,反映了经济状况、社交活动及背后的权力关系等文化内容。[7]

以上三种观点谈论的是智能手机,所以关注的是智能手机的使用和由此导致的各种问题,而智能手机技术除了智能手机的使用外,还包括智能手机的研发、生产和销售等环节,其中手机的研发或设计至关重要:作为手机技术的源头,它潜藏着手机技术的目的、意向和本质。智能手机技术是技术的一种,其特征除了前文提到的技术的三个特征外还包括:(1)移动性。智能手机的最大特点是体积小且轻便,易于携带,成为了人们生活、工作的有力助手,几乎与人们形影不离。据统计,截至2020年12月,我国手机网民规模达9.86亿,网民通过手机接入互联网的比例高达99.7%,[8]且呈逐年上升的态势。(2)多功能性。智能手机除了可以接打电话、收发信息外,还可以上网、照相、导航等,理论上讲可以有无穷多的功能,这全看手机自身携带或安装的应用软件而定。(3)所有权让渡的不完全性。所有权是指所有者对实体占有、控制和使用的权利。一个完全的所有权让渡是指一旦实体的所有者发生了变更,则接受者完全拥有占有、控制和使用该实体的权利;同时,未经允许,其他主体则不具有上述相应权利。但是对手机这种智能产品,消费者在购买后并没有获得该手机的完全使用权限,因为其生产企业,甚至企业背后的政府或其他主体,可通过硬件或软件后门对手机实行远程控制。也就是说手机卖给你了,但企业仍然是手机的主人,甚至是手机的真正主人。这也是手机这种高智能产品与普通产品(如锤子)的重大区别。据此,可以把智能手机定义为:一种携带方便、具有多种功能的智能型人造物;而智能手机技术则可以定义为:关于智能手机的研发、生产、销售和使用的活动。

二、智能手机技术社会性的表现形式和生成机制

1. 智能手机技术社会性的内涵和表现形式

关于社会的概念,从描述意义上可分为广义与狭义两种。广义的社会指的是一种人与人或人与社会的互动关系。社会学家齐美尔在《社会学的问题》中指出:“在大量个人进入互动的地方,社会才存在”。[9]它包括了人类社会的各个方面,如经济、政治和文化等。狭义的社会仅指人们生存与发展的社会公共生活领域。本文采用的是广义的社会概念。

技术的社会性(即社会属性)是相对于其自然属性而言的。技术的自然属性是指技术活动所反映出来的人与自然关系的属性,如技术的合规律性、可行性和生态性等;技术的社会性是指技术活动所反映出来的人与人关系的属性。其表现主要有两方面:一方面,技术的产生、发展和应用要受到社会历史条件的制约;[10]另一方面,技术的产生也是为了满足社会发展的需要。技术的社会性具有经济性、阶级性、民族性等特质。[11]

因此,可以把智能手机技术的社会性定义为:人们在智能手机技术的研发、生产、销售和使用过程中所反映出来的人与人、人与社会关系的属性。具体表现在如下几个方面:(1)智能手机技术延伸了人的感觉器官、神经系统和大脑的功能,增强了人的感知和思维能力。智能手机不仅是人们的千里眼、顺风耳,还通过物联网自动“感知”各类设备信息。同时,通过融合人工智能算法,智能手机成为了人的“第二大脑”,在居家、出行、娱乐、社交、工作等领域实时自动发出相关指令,辅助人们拟定相关安排。(2)智能手机技术拓展了人与人交往的时空边界,提高了工作效率,增添了生活情趣。人们通过网络化的手机平台可以随时参与各种丰富多彩的活动,如通信、支付、购物、网页浏览等,扩展了人与人、人与物之间的时空边界,极大提高了人与人、人与物之间交流的自动化程度和效率。(3)智能手机技术的多元主体性展现了人与人关系的复杂性。智能手机技术所有权让渡的不完全性决定了智能手机具有同时被多个不同类型主体占有、控制和使用的可能性。这里可能的主体有:手机智能技术的开发者、所有者(如企业或与企业利益相关者)、销售后的所有者、使用者、相关应用程序的开发者、所有者和使用者等。这些多元化的主体都有可能通过硬件或软件后门监控手机的运行,而这些主体的目标和意向可能不同,甚至相互矛盾或冲突,这就反映了人与人关系的错综复杂性。

智能手机技术的社会性可分为内部社会性和外部社会性。内部社会性是指智能手机技术在研发、生产和销售过程中实现的社会性,如国家性、经济性等。其外部社会性是指智能手机作为一种携带方便的移动终端,在使用过程中实现的社会性,如观念引导性等。其中,内部社会性融入到智能手机的研发、生产和销售之中,在使用阶段难以更改;而外部社会性是后来附加上去的,基本上是由对智能手机的不同使用决定的:不同的主体可以利用智能手机宣传不同的社会文化。

2. 智能手机技术社会性的生成机制

智能手机技术社会性的生成过程就是其社会性在智能手机技术的研发、生产、销售和使用等各个环节的渗透过程。首先,在设计阶段,技术主体的目标和意向指引手机的设计,在设计中嵌入技术主体的价值目标,使之更好地为技术主体服务。其次,在生产阶段,制造者依据设计蓝图对手机的各要素(如智能要素、实体要素和过程要素等)进行适当、有效地整合,形成一定的技术结构(即手机产品)。显然,这一生产过程必须贯彻设计阶段的目标和意向。再次,在销售阶段,产品的销售过程一方面是对手机品牌背后承载的文化符号和价值理念的传播,另一方面也是实现其经济效益的重要方式。最后,在使用阶段,由于智能手机技术的多元主体性,决定了其使用目标和意向的多元性。一般消费者用于通信、娱乐、学习和工作,企业用于广告的精准推送,政府(或政党)用于主流价值观的宣传等。

三、智能手机技术社会性的实现路径

技术主体通过智能手机技术的意向性、移动性和所有权让渡的不完全性对智能手机的软硬件进行调控,以实现其相关的国家性、政治性和经济性等社会属性(属内部社会性);同时,智能手机作为一种携带方便的具备多功能性的移动终端,也是一部高效宣传社会文化的媒介,体现为观念导向性(属外部社会性)。

1. 国家性的实现路径

智能手机技术的国家性是指智能手机在设计、生产、销售和使用等方面为国家或政府服务的属性。主要表现在两个方面:一方面,政府通过与企业合作可以凭借手机软件或应用程序的使用获取大量相关信息,再通过大数据挖掘和智能算法等方式得到相关风险提示,有助于维护国家安全,保障人民群众的根本利益。在当前我国新冠肺炎疫情“外防输入、内防反弹”的严峻形势下,基于我国地域广阔、人口数量大、部分地区人口密度高等特点,为了快速应对疫情,在政府引导、企业参与下,搭建了“健康码”“大数据行程卡”等疫情防控小程序。这些程序搭载在智能手机上,每一个手机用户进出各类场所必须扫码登记,便于各个省、市、县、村或社区对人们的出行管理。这些措施大大提高了我国面对突发事件的应急效率,保障了我国人民的生命健康安全。另一方面,智能手机技术一旦被一些别有用心的企业控制,那么该企业(或与其利益相关方)就可能运用该技术所有权让渡的不完全性,非法监控、盗取人们的邮件、聊天记录、视频照片、文件等私人信息,从而可能严重侵犯个人隐私,并威胁到国家的信息安全。“斯诺登事件”的发生就说明这种侵犯和威胁是现实存在的。

2. 经济性的实现路径

智能手机技术的经济性在于提升企业的经济效益,促进社会经济发展。首先,企业在设计阶段可以对手机硬件作出调整,以影响消费者的选择范围和购买决策,提升其利润空间。以手机内存设计为例,从最早的16GB、32GB和64GB到现在将近1TB的版本,新款手机容量呈现持续向上增长的趋势。理论上企业可以提供给用户更多的选择,但实际上企业在设计过程中往往通过取消32GB的版本,仅支持16GB、64GB和128GB(甚至更大容量的内存)来引导消费者选择更贵的机型,从而使手机销量和企业利润大幅提升。其次,企业在设计时往往会将手机的耐久度按照一定的周期减损,从而控制手机的使用寿命,促进新品的销售。如一台手机的核心部件的预期寿命往往被设计为3-5年,相应的材料和工艺也会被严格控制。再次,手机企业可以通过设置手机应用商店限制人们对应用程序的使用,并对部分应用程序实行有偿使用政策。这样,既增加了一部分应用程序企业的经济收入,也使手机企业因此获取额外的中间费用。最后,企业(或其利益相关方)可以利用手机软件和应用程序,获取用户相关信息,采取相应行动,以维护经济安全,提升经济效益。如国家或政府能够通过企业监控手机的操作,打击金融诈骗、等经济犯罪行为,从而维护经济安全,防范经济风险;对于手机应用程序企业而言,可以通过所有权让渡不完全性收集用户偏好、以及生活习惯等信息,实施商品广告的精准推送,从而提高商品销量,创造更大的经济效益。

3. 观念引导性的实现路径

基于智能手机技术的多功能性和移动性,智能手机成为思想观念传播的重要工具。一方面,智能手机的软件设计有较大的弹性和张力,人们能通过各类软件平台接收不同的思想观念,从而使智能手机技术具备了承载多元价值观的能力。同时,许多应用程序借助智能算法还实现了精准化、智能化、定制化的信息推送,极大地增强了其观念引导的效能。另一方面,手机硬件提供了多种渠道(如声音、图像和视频等),以更生动地实现价值观传播的功能。现在,各国政府或政党都认识到了智能手机技术在观念引导中的重要作用。一方面利用各种新闻应用程序及时推送政府或政党的相关政策,或有利于政府或政党观念的新闻;另一方面通过各类学习应用程序加强对主流价值观的学习引导。这类推送和引导,充分利用了手机的移动性、便携性和智能性,扩展了观念引导的时间和空间,极大提高了观念引导的有效性。

参考文献

[1]国家新闻出版署第十八次全国国民阅读调查成果[DB/OLT.

[2]芬伯格技术批判理论[M].韩连庆、曹观法译,北京:北京大学出版社,2005,3-21.

[3]伊德技术与生活世界一-从伊 甸园到尘世[M] .韩连庆译,北京:北京大学出版社, 2012,1.

[4]舒红跃技术与生活世界[M].北京中国社会科学出版社, 2006,3.

[5]秦艳华、路英勇.全媒体时代的手机媒介研究[M]北京:北京大学出版社, 2013,18.

[6]匡文波手机媒体概论[M].北京:中国人民大学出版社,2012,17.

[7]Goggin,G. Cell Phone Culture.Mobile Technology in Everyday Life[M].New York:Routledge Publisher,2006,2.

[8]中国互联网络信息中心等.第47次中国互联网络发展状况统计报告[DB/OL]

[9]Simmel,G. On Individuality and Social Forms[M]. Chicago:The University of Chicago Press, 1971,23.

人工智能技术意义范文第3篇

1前言

1.1研究背景

人工智能概念诞生于1956年,在半个多世纪的发展历程中,由于受到智能算法、计算速度、存储水平等多方面因素的影响,人工智能技术和应用发展经历了多次高潮和低谷。2006年以来,以深度学习为代表的机器学习算法在机器视觉和语音识别等领域取得了极大的成功,识别准确性大幅提升,使人工智能再次受到学术界和产业界的广泛关注。云计算、大数据等技术在提升运算速度,降低计算成本的同时,也为人工智能发展提供了丰富的数据资源,协助训练出更加智能化的算法模型。人工智能的发展模式也从过去追求“用计算机模拟人工智能”,逐步转向以机器与人结合而成的增强型混合智能系统,用机器、人、网络结合成新的群智系统,以及用机器、人、网络和物结合成的更加复杂的智能系统。

作为新一轮产业变革的核心驱动力,人工智能在催生新技术、新产品的同时,对传统行业也具备较强的赋能作用,能够引发经济结构的重大变革,实现社会生产力的整体跃升。人工智能将人从枯燥的劳动中解放出来,越来越多的简单性、重复性、危险性任务由人工智能系统完成,在减少人力投入,提高工作效率的同时,还能够比人类做得更快、更准确;人工智能还可以在教育、医疗、养老、环境保护、城市运行、司法服务等领域得到广泛应用,能够极大提高公共服务精准化水平,全面提升人民生活品质;同时,人工智能可帮助人类准确感知、预测、预警基础设施和社会安全运行的重大态势,及时把握群体认知及心理变化,主动作出决策反应,显著提高社会治理能力和水平,同时保障公共安全。

人工智能作为一项引领未来的战略技术,世界发达国家纷纷在新一轮国际竞争中争取掌握主导权,围绕人工智能出台规划和政策,对人工智能核心技术、顶尖人才、标准规范等进行部署,加快促进人工智能技术和产业发展。主要科技企业不断加大资金和人力投入,抢占人工智能发展制高点。2017年,我国出台了《新一代人工智能发展规划》(国发〔2017〕35号)、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》(工信部科〔2017〕315号)等政策文件,推动人工智能技术研发和产业化发展。目前,国内人工智能发展已具备一定的技术和产业基础,在芯片、数据、平台、应用等领域集聚了一批人工智能企业,在部分方向取得阶段性成果并向市场化发展。例如,人工智能在金融、安防、客服等行业领域已实现应用,在特定任务中语义识别、语音识别、人脸识别、图像识别技术的精度和效率已远超人工。

标准化工作对人工智能及其产业发展具有基础性、支撑性、引领性的作用,既是推动产业创新发展的关键抓手,也是产业竞争的制高点。当前,在我国人工智能相关产品和服务不断丰富的同时,也出现了标准化程度不足的问题。人工智能涉及众多领域,虽然某些领域已具备一定的标准化基础,但是这些分散的标准化工作并不足以完全支撑整个人工智能领域。另一方面,人工智能属于新兴领域,发展方兴未艾,从世界范围来看,标准化工作仍在起步过程中,尚未形成完善的标准体系,我国基本与国外处于同一起跑线,存在快速突破的机会窗口。只要瞄准机会,快速布局,完全有可能抢占标准创新的制高点,反之,则有可能丧失良机。因此,迫切需要把握机遇,加快对人工智能技术及产业发展的研究,系统梳理、加快研制人工智能各领域的标准体系,明确标准之间的依存性与制约关系,建立统一完善的标准体系,以标准的手段促进我国人工智能技术、产业蓬勃发展。

1.2研究目标及意义

本白皮书前期在国标委工业二部和工信部科技司的指导下,通过梳理人工智能技术、应用和产业演进情况,分析人工智能的技术热点、行业动态和未来趋势,从支撑人工智能产业整体发展的角度出发,研究制定了能够适应和引导人工智能产业发展的标准体系,进而提出近期急需研制的基础和关键标准项目。

本白皮书并不预期成为人工智能领域的全面技术和产业综述,不求面面俱到,仅针对目前人工智能领域涵盖的技术热点和产业情况进行分析,研究提出人工智能标准体系。人工智能标准化工作尚处于起步阶段,本白皮书只作为人工智能领域技术、产业和标准化之间初始的连接纽带,并将在今后不断根据技术、产业和标准化的发展需求进行修订。本白皮书不过多地给出人工智能领域观点性的陈述,力求以较为浅显易懂的语言和方式进行阐述。

本白皮书的意义在于与业界分享人工智能领域的研究成果和实践经验,呼吁社会各界共同加强人工智能领域的技术研究、产业投入、标准建设与服务应用,共同推动人工智能及其产业发展。

2人工智能概述

2.1人工智能的历史及概念

2.1.1人工智能的起源与历史

人工智能始于20世纪50年代,至今大致分为三个发展阶段:第一阶段(20世纪50年代——80年代)。这一阶段人工智能刚诞生,基于抽象数学推理的可编程数字计算机已经出现,符号主义(Symbolism)快速发展,但由于很多事物不能形式化表达,建立的模型存在一定的局限性。此外,随着计算任务的复杂性不断加大,人工智能发展一度遇到瓶颈;第二阶段(20世纪80年代——90年代末)。在这一阶段,专家系统得到快速发展,数学模型有重大突破,但由于专家系统在知识获取、推理能力等方面的不足,以及开发成本高等原因,人工智能的发展又一次进入低谷期;第三阶段(21世纪初——至今)。随着大数据的积聚、理论算法的革新、计算能力的提升,人工智能在很多应用领域取得了突破性进展,迎来了又一个繁荣时期。人工智能具体的发展历程如图1所示。

长期以来,制造具有智能的机器一直是人类的重大梦想。早在1950年,Alan Turing在《计算机器与智能》中就阐述了对人工智能的思考。他提出的图灵测试是机器智能的重要测量手段,后来还衍生出了视觉图灵测试等测量方法。1956年,“人工智能”这个词首次出现在达特茅斯会议上,标志着其作为一个研究领域的正式诞生。六十年来,人工智能发展潮起潮落的同时,基本思想可大致划分为四个流派:符号主义(Symbolism)、连接主义(Connectionism)、行为主义(Behaviourism)和统计主义(Statisticsism)(注:由于篇幅原因,本白皮书不对四个流派进行详细阐述)。这四个流派从不同侧面抓住了智能的部分特征,在“制造”人工智能方面都取得了里程碑式的成就。

1959年,Arthur Samuel提出了机器学习,机器学习将传统的制造智能演化为通过学习能力来获取智能,推动人工智能进入了第一次繁荣期。20世纪70年代末期专家系统的出现,实现了人工智能从理论研究走向实际应用,从一般思维规律探索走向专门知识应用的重大突破,将人工智能的研究推向了新高潮。然而,机器学习的模型仍然是“人工”的,也有很大的局限性。随着专家系统应用的不断深入,专家系统自身存在的知识获取难、知识领域窄、推理能力弱、实用性差等问题逐步暴露。从1976年开始,人工智能的研究进入长达6年的萧瑟期。

在80年代中期,随着美国、日本立项支持人工智能研究,以及以知识工程为主导的机器学习方法的发展,出现了具有更强可视化效果的决策树模型和突破早期感知机局限的多层人工神经网络,由此带来了人工智能的又一次繁荣期。然而,当时的计算机难以模拟复杂度高及规模大的神经网络,仍有一定的局限性。1987年由于LISP机市场崩塌,美国取消了人工智能预算,日本第五代计算机项目失败并退出市场,专家系统进展缓慢,人工智能又进入了萧瑟期。

1997年,IBM深蓝(Deep Blue)战胜国际象棋世界冠军Garry Kasparov。这是一次具有里程碑意义的成功,它代表了基于规则的人工智能的胜利。2006年,在Hinton和他的学生的推动下,深度学习开始备受关注,为后来人工智能的发展带来了重大影响。从2010年开始,人工智能进入爆发式的发展阶段,其最主要的驱动力是大数据时代的到来,运算能力及机器学习算法得到提高。人工智能快速发展,产业界也开始不断涌现出新的研发成果:2011年,IBM Waston在综艺节目《危险边缘》中战胜了最高奖金得主和连胜纪录保持者;2012年,谷歌大脑通过模仿人类大脑在没有人类指导的情况下,利用非监督深度学习方法从大量视频中成功学习到识别出一只猫的能力;2014年,微软公司推出了一款实时口译系统,可以模仿说话者的声音并保留其口音;2014年,微软公司全球第一款个人智能助理微软小娜;2014年,亚马逊至今为止最成功的智能音箱产品Echo和个人助手Alexa;2016年,谷歌AlphaGo机器人在围棋比赛中击败了世界冠军李世石;2017年,苹果公司在原来个人助理Siri的基础上推出了智能私人助理Siri和智能音响HomePod。

目前,世界各国都开始重视人工智能的发展。2017年6月29日,首届世界智能大会在天津召开。中国工程院院士潘云鹤在大会主论坛作了题为“中国新一代人工智能”的主题演讲,报告中概括了世界各国在人工智能研究方面的战略:2016年5月,美国白宫发表了《为人工智能的未来做好准备》;英国2016年12月《人工智能:未来决策制定的机遇和影响》;法国在2017年4月制定了《国家人工智能战略》;德国在2017年5月颁布全国第一部自动驾驶的法律;在中国,据不完全统计,2017年运营的人工智能公司接近400家,行业巨头百度、腾讯、阿里巴巴等都不断在人工智能领域发力。从数量、投资等角度来看,自然语言处理、机器人、计算机视觉成为了人工智能最为热门的三个产业方向。

2.1.2人工智能的概念

人工智能作为一门前沿交叉学科,其定义一直存有不同的观点:《人工智能——一种现代方法》中将已有的一些人工智能定义分为四类:像人一样思考的系统、像人一样行动的系统、理性地思考的系统、理性地行动的系统。维基百科上定义“人工智能就是机器展现出的智能”,即只要是某种机器,具有某种或某些“智能”的特征或表现,都应该算作“人工智能”。大英百科全书则限定人工智能是数字计算机或者数字计算机控制的机器人在执行智能生物体才有的一些任务上的能力。百度百科定义人工智能是“研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学”,将其视为计算机科学的一个分支,指出其研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

本白皮书认为,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能的定义对人工智能学科的基本思想和内容作出了解释,即围绕智能活动而构造的人工系统。人工智能是知识的工程,是机器模仿人类利用知识完成一定行为的过程。根据人工智能是否能真正实现推理、思考和解决问题,可以将人工智能分为弱人工智能和强人工智能。

弱人工智能是指不能真正实现推理和解决问题的智能机器,这些机器表面看像是智能的,但是并不真正拥有智能,也不会有自主意识。迄今为止的人工智能系统都还是实现特定功能的专用智能,而不是像人类智能那样能够不断适应复杂的新环境并不断涌现出新的功能,因此都还是弱人工智能。目前的主流研究仍然集中于弱人工智能,并取得了显著进步,如语音识别、图像处理和物体分割、机器翻译等方面取得了重大突破,甚至可以接近或超越人类水平。

强人工智能是指真正能思维的智能机器,并且认为这样的机器是有知觉的和自我意识的,这类机器可分为类人(机器的思考和推理类似人的思维)与非类人(机器产生了和人完全不一样的知觉和意识,使用和人完全不一样的推理方式)两大类。从一般意义来说,达到人类水平的、能够自适应地应对外界环境挑战的、具有自我意识的人工智能称为“通用人工智能”、“强人工智能”或“类人智能”。强人工智能不仅在哲学上存在巨大争论(涉及到思维与意识等根本问题的讨论),在技术上的研究也具有极大的挑战性。强人工智能当前鲜有进展,美国私营部门的专家及国家科技委员会比较支持的观点是,至少在未来几十年内难以实现。

靠符号主义、连接主义、行为主义和统计主义这四个流派的经典路线就能设计制造出强人工智能吗?其中一个主流看法是:即使有更高性能的计算平台和更大规模的大数据助力,也还只是量变,不是质变,人类对自身智能的认识还处在初级阶段,在人类真正理解智能机理之前,不可能制造出强人工智能。理解大脑产生智能的机理是脑科学的终极性问题,绝大多数脑科学专家都认为这是一个数百年乃至数千年甚至永远都解决不了的问题。

通向强人工智能还有一条“新”路线,这里称为“仿真主义”。这条新路线通过制造先进的大脑探测工具从结构上解析大脑,再利用工程技术手段构造出模仿大脑神经网络基元及结构的仿脑装置,最后通过环境刺激和交互训练仿真大脑实现类人智能,简言之,“先结构,后功能”。虽然这项工程也十分困难,但都是有可能在数十年内解决的工程技术问题,而不像“理解大脑”这个科学问题那样遥不可及。

仿真主义可以说是符号主义、连接主义、行为主义和统计主义之后的第五个流派,和前四个流派有着千丝万缕的联系,也是前四个流派通向强人工智能的关键一环。经典计算机是数理逻辑的开关电路实现,采用冯诺依曼体系结构,可以作为逻辑推理等专用智能的实现载体。但要靠经典计算机不可能实现强人工智能。要按仿真主义的路线“仿脑”,就必须设计制造全新的软硬件系统,这就是“类脑计算机”,或者更准确地称为“仿脑机”。“仿脑机”是“仿真工程”的标志性成果,也是“仿脑工程”通向强人工智能之路的重要里程碑。

2.2人工智能的特征

(1)由人类设计,为人类服务,本质为计算,基础为数据。从根本上说,人工智能系统必须以人为本,这些系统是人类设计出的机器,按照人类设定的程序逻辑或软件算法通过人类发明的芯片等硬件载体来运行或工作,其本质体现为计算,通过对数据的采集、加工、处理、分析和挖掘,形成有价值的信息流和知识模型,来为人类提供延伸人类能力的服务,来实现对人类期望的一些“智能行为”的模拟,在理想情况下必须体现服务人类的特点,而不应该伤害人类,特别是不应该有目的性地做出伤害人类的行为。

(2)能感知环境,能产生反应,能与人交互,能与人互补。人工智能系统应能借助传感器等器件产生对外界环境(包括人类)进行感知的能力,可以像人一样通过听觉、视觉、嗅觉、触觉等接收来自环境的各种信息,对外界输入产生文字、语音、表情、动作(控制执行机构)等必要的反应,甚至影响到环境或人类。借助于按钮、键盘、鼠标、屏幕、手势、体态、表情、力反馈、虚拟现实/增强现实等方式,人与机器间可以产生交互与互动,使机器设备越来越“理解”人类乃至与人类共同协作、优势互补。这样,人工智能系统能够帮助人类做人类不擅长、不喜欢但机器能够完成的工作,而人类则适合于去做更需要创造性、洞察力、想象力、灵活性、多变性乃至用心领悟或需要感情的一些工作。

(3)有适应特性,有学习能力,有演化迭代,有连接扩展。人工智能系统在理想情况下应具有一定的自适应特性和学习能力,即具有一定的随环境、数据或任务变化而自适应调节参数或更新优化模型的能力;并且,能够在此基础上通过与云、端、人、物越来越广泛深入数字化连接扩展,实现机器客体乃至人类主体的演化迭代,以使系统具有适应性、鲁棒性、灵活性、扩展性,来应对不断变化的现实环境,从而使人工智能系统在各行各业产生丰富的应用。

2.3人工智能参考框架

目前,人工智能领域尚未形成完善的参考框架。因此,本章基于人工智能的发展状况和应用特征,从人工智能信息流动的角度出发,提出一种人工智能参考框架(如图2所示),力图搭建较为完整的人工智能主体框架,描述人工智能系统总体工作流程,不受具体应用所限,适用于通用的人工智能领域需求。

人工智能参考框架提供了基于“角色—活动—功能”的层级分类体系,从“智能信息链”(水平轴)和“IT价值链”(垂直轴)两个维度阐述了人工智能系统框架。“智能信息链”反映从智能信息感知、智能信息表示与形成、智能推理、智能决策、智能执行与输出的一般过程。在这个过程中,智能信息是流动的载体,经历了“数据—信息—知识—智慧”的凝练过程。“IT价值链”从人工智能的底层基础设施、信息(提供和处理技术实现)到系统的产业生态过程,反映人工智能为信息技术产业带来的价值。此外,人工智能系统还有其它非常重要的框架构件:安全、隐私、伦理和管理。人工智能系统主要由基础设施提供者、信息提供者、信息处理者和系统协调者4个角色组成。

(1)基础设施提供者

基础设施提供者为人工智能系统提供计算能力支持,实现与外部世界的沟通,并通过基础平台实现支撑。计算能力由智能芯片(CPU、GPU、ASIC、FPGA等硬件加速芯片以及其它智能芯片)等硬件系统开发商提供;与外部世界的沟通通过新型传感器制造商提供;基础平台包括分布式计算框架提供商及网络提供商提供平台保障和支持,即包括云存储和计算、互联互通网络等。

(2)信息提供者

信息提供者在人工智能领域是智能信息的来源。通过知识信息感知过程由数据提供商提供智能感知信息,包括原始数据资源和数据集。原始数据资源的感知涉及到图形、图像、语音、文本的识别,还涉及到传统设备的物联网数据,包括已有系统的业务数据以及力、位移、液位、温度、湿度等感知数据。

(3)信息处理者

信息处理者是指人工智能领域中技术和服务提供商。信息处理者的主要活动包括智能信息表示与形成、智能推理、智能决策及智能执行与输出。智能信息处理者通常是算法工程师及技术服务提供商,通过计算框架、模型及通用技术,例如一些深度学习框架和机器学习算法模型等功能进行支撑。

智能信息表示与形成是指为描述世界所作的一组约定,分阶段对智能信息进行符号化和形式化的智能信息建模、抽取、预处理、训练数据等。

智能信息推理是指在计算机或智能系统中,模拟人类的智能推理方式,依据推理控制策略,利用形式化的信息进行机器思维和求解问题的过程,典型的功能是搜索与匹配。

智能信息决策是指智能信息经过推理后进行决策的过程,通常提供分类、排序、预测等功能。

智能执行与输出作为智能信息输出的环节,是对输入作出的响应,输出整个智能信息流动过程的结果,包括运动、显示、发声、交互、合成等功能。

(4)系统协调者

系统协调者提供人工智能系统必须满足的整体要求,包括政策、法律、资源和业务需求,以及为确保系统符合这些需求而进行的监控和审计活动。由于人工智能是多学科交叉领域,需要系统协调者定义和整合所需的应用活动,使其在人工智能领域的垂直系统中运行。系统协调者的功能之一是配置和管理人工智能参考框架中的其他角色来执行一个或多个功能,并维持人工智能系统的运行。

(5)安全、隐私、伦理安全、隐私、伦理覆盖了人工智能领域的其他4个主要角色,对每个角色都有重要的影响作用。同时,安全、隐私、伦理处于管理角色的覆盖范围之内,与全部角色和活动都建立了相关联系。在安全、隐私、伦理模块,需要通过不同的技术手段和安全措施,构筑全方位、立体的安全防护体系,保护人工智能领域参与者的安全和隐私。

(6)管理管理角色承担系统管理活动,包括软件调配、资源管理等内容,管理的功能是监视各种资源的运行状况,应对出现的性能或故障事件,使得各系统组件透明且可观。

(7)智能产品及行业应用智能产品及行业应用指人工智能系统的产品和应用,是对人工智能整体解决方案的封装,将智能信息决策产品化、实现落地应用,其应用领域主要包括:智能制造、智能交通、智能家居、智能医疗、智能安防等。

3人工智能发展现状及趋势

依据参考框架中所涉及到的人工智能相关技术,本节重点介绍近二十年来人工智能领域关键技术的发展状况,包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。

3.1人工智能关键技术

3.1.1机器学习

机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。基于数据的机器学习是现代智能技术中的重要方法之一,研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测。根据学习模式、学习方法以及算法的不同,机器学习存在不同的分类方法。

(1)根据学习模式将机器学习分类为监督学习、无监督学习和强化学习等。

监督学习

监督学习是利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射,最典型的监督学习算法包括回归和分类。监督学习要求训练样本的分类标签已知,分类标签精确度越高,样本越具有代表性,学习模型的准确度越高。监督学习在自然语言处理、信息检索、文本挖掘、手写体辨识、垃圾邮件侦测等领域获得了广泛应用。

无监督学习

无监督学习是利用无标记的有限数据描述隐藏在未标记数据中的结构/规律,最典型的非监督学习算法包括单类密度估计、单类数据降维、聚类等。无监督学习不需要训练样本和人工标注数据,便于压缩数据存储、减少计算量、提升算法速度,还可以避免正、负样本偏移引起的分类错误问题。主要用于经济预测、异常检测、数据挖掘、图像处理、模式识别等领域,例如组织大型计算机集群、社交网络分析、市场分割、天文数据分析等。

强化学习

强化学习是智能系统从环境到行为映射的学习,以使强化信号函数值最大。由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。强化学习的目标是学习从环境状态到行为的映射,使得智能体选择的行为能够获得环境最大的奖赏,使得外部环境对学习系统在某种意义下的评价为最佳。其在机器人控制、无人驾驶、下棋、工业控制等领域获得成功应用。

(2)根据学习方法可以将机器学习分为传统机器学习和深度学习。

传统机器学习

传统机器学习从一些观测(训练)样本出发,试图发现不能通过原理分析获得的规律,实现对未来数据行为或趋势的准确预测。相关算法包括逻辑回归、隐马尔科夫方法、支持向量机方法、K近邻方法、三层人工神经网络方法、Adaboost算法、贝叶斯方法以及决策树方法等。传统机器学习平衡了学习结果的有效性与学习模型的可解释性,为解决有限样本的学习问题提供了一种框架,主要用于有限样本情况下的模式分类、回归分析、概率密度估计等。传统机器学习方法共同的重要理论基础之一是统计学,在自然语言处理、语音识别、图像识别、信息检索和生物信息等许多计算机领域获得了广泛应用。

深度学习

深度学习是建立深层结构模型的学习方法,典型的深度学习算法包括深度置信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深度神经网络(指层数超过3层的神经网络)。深度学习作为机器学习研究中的一个新兴领域,由Hinton等人于2006年提出。深度学习源于多层神经网络,其实质是给出了一种将特征表示和学习合二为一的方式。深度学习的特点是放弃了可解释性,单纯追求学习的有效性。经过多年的摸索尝试和研究,已经产生了诸多深度神经网络的模型,其中卷积神经网络、循环神经网络是两类典型的模型。卷积神经网络常被应用于空间性分布数据;循环神经网络在神经网络中引入了记忆和反馈,常被应用于时间性分布数据。深度学习框架是进行深度学习的基础底层框架,一般包含主流的神经网络算法模型,提供稳定的深度学习API,支持训练模型在服务器和GPU、TPU间的分布式学习,部分框架还具备在包括移动设备、云平台在内的多种平台上运行的移植能力,从而为深度学习算法带来前所未有的运行速度和实用性。目前主流的开源算法框架有TensorFlow、Caffe/Caffe2、CNTK、MXNet、Paddle-paddle、Torch/PyTorch、Theano等。

(3)此外,机器学习的常见算法还包括迁移学习、主动学习和演化学习等。

迁移学习

迁移学习是指当在某些领域无法取得足够多的数据进行模型训练时,利用另一领域数据获得的关系进行的学习。迁移学习可以把已训练好的模型参数迁移到新的模型指导新模型训练,可以更有效的学习底层规则、减少数据量。目前的迁移学习技术主要在变量有限的小规模应用中使用,如基于传感器网络的定位,文字分类和图像分类等。未来迁移学习将被广泛应用于解决更有挑战性的问题,如视频分类、社交网络分析、逻辑推理等。

主动学习

主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到的样本训练分类模型来提高模型的精度。主动学习能够选择性地获取知识,通过较少的训练样本获得高性能的模型,最常用的策略是通过不确定性准则和差异性准则选取有效的样本。

演化学习

演化学习对优化问题性质要求极少,只需能够评估解的好坏即可,适用于求解复杂的优化问题,也能直接用于多目标优化。演化算法包括粒子群优化算法、多目标演化算法等。目前针对演化学习的研究主要集中在演化数据聚类、对演化数据更有效的分类,以及提供某种自适应机制以确定演化机制的影响等。

3.1.2知识图谱

知识图谱本质上是结构化的语义知识库,是一种由节点和边组成的图数据结构,以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关“属性—值”对。不同实体之间通过关系相互联结,构成网状的知识结构。在知识图谱中,每个节点表示现实世界的“实体”,每条边为实体与实体之间的“关系”。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,提供了从“关系”的角度去分析问题的能力。

知识图谱可用于反欺诈、不一致性验证、组团欺诈等公共安全保障领域,需要用到异常分析、静态分析、动态分析等数据挖掘方法。特别地,知识图谱在搜索引擎、可视化展示和精准营销方面有很大的优势,已成为业界的热门工具。但是,知识图谱的发展还有很大的挑战,如数据的噪声问题,即数据本身有错误或者数据存在冗余。随着知识图谱应用的不断深入,还有一系列关键技术需要突破。

3.1.3自然语言处理

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,涉及的领域较多,主要包括机器翻译、机器阅读理解和问答系统等。

(1)机器翻译

机器翻译技术是指利用计算机技术实现从一种自然语言到另外一种自然语言的翻译过程。基于统计的机器翻译方法突破了之前基于规则和实例翻译方法的局限性,翻译性能取得巨大提升。基于深度神经网络的机器翻译在日常口语等一些场景的成功应用已经显现出了巨大的潜力。随着上下文的语境表征和知识逻辑推理能力的发展,自然语言知识图谱不断扩充,机器翻译将会在多轮对话翻译及篇章翻译等领域取得更大进展。

目前非限定领域机器翻译中性能较佳的一种是统计机器翻译,包括训练及解码两个阶段。训练阶段的目标是获得模型参数,解码阶段的目标是利用所估计的参数和给定的优化目标,获取待翻译语句的最佳翻译结果。统计机器翻译主要包括语料预处理、词对齐、短语抽取、短语概率计算、最大熵调序等步骤。基于神经网络的端到端翻译方法不需要针对双语句子专门设计特征模型,而是直接把源语言句子的词串送入神经网络模型,经过神经网络的运算,得到目标语言句子的翻译结果。在基于端到端的机器翻译系统中,通常采用递归神经网络或卷积神经网络对句子进行表征建模,从海量训练数据中抽取语义信息,与基于短语的统计翻译相比,其翻译结果更加流畅自然,在实际应用中取得了较好的效果。

(2)语义理解

语义理解技术是指利用计算机技术实现对文本篇章的理解,并且回答与篇章相关问题的过程。语义理解更注重于对上下文的理解以及对答案精准程度的把控。随着MCTest数据集的,语义理解受到更多关注,取得了快速发展,相关数据集和对应的神经网络模型层出不穷。语义理解技术将在智能客服、产品自动问答等相关领域发挥重要作用,进一步提高问答与对话系统的精度。

在数据采集方面,语义理解通过自动构造数据方法和自动构造填空型问题的方法来有效扩充数据资源。为了解决填充型问题,一些基于深度学习的方法相继提出,如基于注意力的神经网络方法。当前主流的模型是利用神经网络技术对篇章、问题建模,对答案的开始和终止位置进行预测,抽取出篇章片段。对于进一步泛化的答案,处理难度进一步提升,目前的语义理解技术仍有较大的提升空间。

(3)问答系统

问答系统分为开放领域的对话系统和特定领域的问答系统。问答系统技术是指让计算机像人类一样用自然语言与人交流的技术。人们可以向问答系统提交用自然语言表达的问题,系统会返回关联性较高的答案。尽管问答系统目前已经有了不少应用产品出现,但大多是在实际信息服务系统和智能手机助手等领域中的应用,在问答系统鲁棒性方面仍然存在着问题和挑战。

自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等不同层面存在不确定性;二是新的词汇、术语、语义和语法导致未知语言现象的不可预测性;三是数据资源的不充分使其难以覆盖复杂的语言现象;四是语义知识的模糊性和错综复杂的关联性难以用简单的数学模型描述,语义计算需要参数庞大的非线性计算。

3.1.4人机交互

人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算机到人的两部分信息交换,是人工智能领域的重要的技术。人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑机交互等技术,以下对后四种与人工智能关联密切的典型交互手段进行介绍。

(1)语音交互

语音交互是一种高效的交互方式,是人以自然语音或机器合成语音同计算机进行交互的综合性技术,结合了语言学、心理学、工程和计算机技术等领域的知识。语音交互不仅要对语音识别和语音合成进行研究,还要对人在语音通道下的交互机理、行为方式等进行研究。语音交互过程包括四部分:语音采集、语音识别、语义理解和语音合成。语音采集完成音频的录入、采样及编码;语音识别完成语音信息到机器可识别的文本信息的转化;语义理解根据语音识别转换后的文本字符或命令完成相应的操作;语音合成完成文本信息到声音信息的转换。作为人类沟通和获取信息最自然便捷的手段,语音交互比其他交互方式具备更多优势,能为人机交互带来根本性变革,是大数据和认知计算时代未来发展的制高点,具有广阔的发展前景和应用前景。

(2)情感交互

情感是一种高层次的信息传递,而情感交互是一种交互状态,它在表达功能和信息时传递情感,勾起人们的记忆或内心的情愫。传统的人机交互无法理解和适应人的情绪或心境,缺乏情感理解和表达能力,计算机难以具有类似人一样的智能,也难以通过人机交互做到真正的和谐与自然。情感交互就是要赋予计算机类似于人一样的观察、理解和生成各种情感的能力,最终使计算机像人一样能进行自然、亲切和生动的交互。情感交互已经成为人工智能领域中的热点方向,旨在让人机交互变得更加自然。目前,在情感交互信息的处理方式、情感描述方式、情感数据获取和处理过程、情感表达方式等方面还有诸多技术挑战。

(3)体感交互

体感交互是个体不需要借助任何复杂的控制系统,以体感技术为基础,直接通过肢体动作与周边数字设备装置和环境进行自然的交互。依照体感方式与原理的不同,体感技术主要分为三类:惯性感测、光学感测以及光学联合感测。体感交互通常由运动追踪、手势识别、运动捕捉、面部表情识别等一系列技术支撑。与其他交互手段相比,体感交互技术无论是硬件还是软件方面都有了较大的提升,交互设备向小型化、便携化、使用方便化等方面发展,大大降低了对用户的约束,使得交互过程更加自然。目前,体感交互在游戏娱乐、医疗辅助与康复、全自动三维建模、辅助购物、眼动仪等领域有了较为广泛的应用。

(4)脑机交互

脑机交互又称为脑机接口,指不依赖于神经和肌肉等神经通道,直接实现大脑与外界信息传递的通路。脑机接口系统检测中枢神经系统活动,并将其转化为人工输出指令,能够替代、修复、增强、补充或者改善中枢神经系统的正常输出,从而改变中枢神经系统与内外环境之间的交互作用。脑机交互通过对神经信号解码,实现脑信号到机器指令的转化,一般包括信号采集、特征提取和命令输出三个模块。从脑电信号采集的角度,一般将脑机接口分为侵入式和非侵入式两大类。除此之外,脑机接口还有其他常见的分类方式:按照信号传输方向可以分为脑到机、机到脑和脑机双向接口;按照信号生成的类型,可分为自发式脑机接口和诱发式脑机接口;按照信号源的不同还可分为基于脑电的脑机接口、基于功能性核磁共振的脑机接口以及基于近红外光谱分析的脑机接口。

3.1.5计算机视觉

计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。自动驾驶、机器人、智能医疗等领域均需要通过计算机视觉技术从视觉信号中提取并处理信息。近来随着深度学习的发展,预处理、特征提取与算法处理渐渐融合,形成端到端的人工智能算法技术。根据解决的问题,计算机视觉可分为计算成像学、图像理解、三维视觉、动态视觉和视频编解码五大类。

(1)计算成像学

计算成像学是探索人眼结构、相机成像原理以及其延伸应用的科学。在相机成像原理方面,计算成像学不断促进现有可见光相机的完善,使得现代相机更加轻便,可以适用于不同场景。同时计算成像学也推动着新型相机的产生,使相机超出可见光的限制。在相机应用科学方面,计算成像学可以提升相机的能力,从而通过后续的算法处理使得在受限条件下拍摄的图像更加完善,例如图像去噪、去模糊、暗光增强、去雾霾等,以及实现新的功能,例如全景图、软件虚化、超分辨率等。

(2)图像理解

图像理解是通过用计算机系统解释图像,实现类似人类视觉系统理解外部世界的一门科学。通常根据理解信息的抽象程度可分为三个层次:浅层理解,包括图像边缘、图像特征点、纹理元素等;中层理解,包括物体边界、区域与平面等;高层理解,根据需要抽取的高层语义信息,可大致分为识别、检测、分割、姿态估计、图像文字说明等。目前高层图像理解算法已逐渐广泛应用于人工智能系统,如刷脸支付、智慧安防、图像搜索等。

(3)三维视觉

三维视觉即研究如何通过视觉获取三维信息(三维重建)以及如何理解所获取的三维信息的科学。三维重建可以根据重建的信息来源,分为单目图像重建、多目图像重建和深度图像重建等。三维信息理解,即使用三维信息辅助图像理解或者直接理解三维信息。三维信息理解可分为,浅层:角点、边缘、法向量等;中层:平面、立方体等;高层:物体检测、识别、分割等。三维视觉技术可以广泛应用于机器人、无人驾驶、智慧工厂、虚拟/增强现实等方向。

(4)动态视觉

动态视觉即分析视频或图像序列,模拟人处理时序图像的科学。通常动态视觉问题可以定义为寻找图像元素,如像素、区域、物体在时序上的对应,以及提取其语义信息的问题。动态视觉研究被广泛应用在视频分析以及人机交互等方面。

(5)视频编解码

视频编解码是指通过特定的压缩技术,将视频流进行压缩。视频流传输中最为重要的编解码标准有国际电联的H.261、H.263、H.264、H.265、M-JPEG和MPEG系列标准。视频压缩编码主要分为两大类:无损压缩和有损压缩。无损压缩指使用压缩后的数据进行重构时,重构后的数据与原来的数据完全相同,例如磁盘文件的压缩。有损压缩也称为不可逆编码,指使用压缩后的数据进行重构时,重构后的数据与原来的数据有差异,但不会影响人们对原始资料所表达的信息产生误解。有损压缩的应用范围广泛,例如视频会议、可视电话、视频广播、视频监控等。

目前,计算机视觉技术发展迅速,已具备初步的产业规模。未来计算机视觉技术的发展主要面临以下挑战:一是如何在不同的应用领域和其他技术更好的结合,计算机视觉在解决某些问题时可以广泛利用大数据,已经逐渐成熟并且可以超过人类,而在某些问题上却无法达到很高的精度;二是如何降低计算机视觉算法的开发时间和人力成本,目前计算机视觉算法需要大量的数据与人工标注,需要较长的研发周期以达到应用领域所要求的精度与耗时;三是如何加快新型算法的设计开发,随着新的成像硬件与人工智能芯片的出现,针对不同芯片与数据采集设备的计算机视觉算法的设计与开发也是挑战之一。

3.1.6生物特征识别

生物特征识别技术是指通过个体生理特征或行为特征对个体身份进行识别认证的技术。从应用流程看,生物特征识别通常分为注册和识别两个阶段。注册阶段通过传感器对人体的生物表征信息进行采集,如利用图像传感器对指纹和人脸等光学信息、麦克风对说话声等声学信息进行采集,利用数据预处理以及特征提取技术对采集的数据进行处理,得到相应的特征进行存储。识别过程采用与注册过程一致的信息采集方式对待识别人进行信息采集、数据预处理和特征提取,然后将提取的特征与存储的特征进行比对分析,完成识别。从应用任务看,生物特征识别一般分为辨认与确认两种任务,辨认是指从存储库中确定待识别人身份的过程,是一对多的问题;确认是指将待识别人信息与存储库中特定单人信息进行比对,确定身份的过程,是一对一的问题。

生物特征识别技术涉及的内容十分广泛,包括指纹、掌纹、人脸、虹膜、指静脉、声纹、步态等多种生物特征,其识别过程涉及到图像处理、计算机视觉、语音识别、机器学习等多项技术。目前生物特征识别作为重要的智能化身份认证技术,在金融、公共安全、教育、交通等领域得到广泛的应用。下面将对指纹识别、人脸识别、虹膜识别、指静脉识别、声纹识别以及步态识别等技术进行介绍。

(1)指纹识别指纹识别过程通常包括数据采集、数据处理、分析判别三个过程。数据采集通过光、电、力、热等物理传感器获取指纹图像;数据处理包括预处理、畸变校正、特征提取三个过程;分析判别是对提取的特征进行分析判别的过程。

(2)人脸识别人脸识别是典型的计算机视觉应用,从应用过程来看,可将人脸识别技术划分为检测定位、面部特征提取以及人脸确认三个过程。人脸识别技术的应用主要受到光照、拍摄角度、图像遮挡、年龄等多个因素的影响,在约束条件下人脸识别技术相对成熟,在自由条件下人脸识别技术还在不断改进。

(3)虹膜识别虹膜识别的理论框架主要包括虹膜图像分割、虹膜区域归一化、特征提取和识别四个部分,研究工作大多是基于此理论框架发展而来。虹膜识别技术应用的主要难题包含传感器和光照影响两个方面:一方面,由于虹膜尺寸小且受黑色素遮挡,需在近红外光源下采用高分辨图像传感器才可清晰成像,对传感器质量和稳定性要求比较高;另一方面,光照的强弱变化会引起瞳孔缩放,导致虹膜纹理产生复杂形变,增加了匹配的难度。

(4)指静脉识别指静脉识别是利用了人体静脉血管中的脱氧血红蛋白对特定波长范围内的近红外线有很好的吸收作用这一特性,采用近红外光对指静脉进行成像与识别的技术。由于指静脉血管分布随机性很强,其网络特征具有很好的唯一性,且属于人体内部特征,不受到外界影响,因此模态特性十分稳定。指静脉识别技术应用面临的主要难题来自于成像单元。

(5)声纹识别声纹识别是指根据待识别语音的声纹特征识别说话人的技术。声纹识别技术通常可以分为前端处理和建模分析两个阶段。声纹识别的过程是将某段来自某个人的语音经过特征提取后与多复合声纹模型库中的声纹模型进行匹配,常用的识别方法可以分为模板匹配法、概率模型法等。

(6)步态识别步态是远距离复杂场景下唯一可清晰成像的生物特征,步态识别是指通过身体体型和行走姿态来识别人的身份。相比上述几种生物特征识别,步态识别的技术难度更大,体现在其需要从视频中提取运动特征,以及需要更高要求的预处理算法,但步态识别具有远距离、跨角度、光照不敏感等优势。

3.1.7虚拟现实/增强现实

虚拟现实(VR)/增强现实(AR)是以计算机为核心的新型视听技术。结合相关科学技术,在一定范围内生成与真实环境在视觉、听觉、触感等方面高度近似的数字化环境。用户借助必要的装备与数字化环境中的对象进行交互,相互影响,获得近似真实环境的感受和体验,通过显示设备、跟踪定位设备、触力觉交互设备、数据获取设备、专用芯片等实现。

虚拟现实/增强现实从技术特征角度,按照不同处理阶段,可以分为获取与建模技术、分析与利用技术、交换与分发技术、展示与交互技术以及技术标准与评价体系五个方面。获取与建模技术研究如何把物理世界或者人类的创意进行数字化和模型化,难点是三维物理世界的数字化和模型化技术;分析与利用技术重点研究对数字内容进行分析、理解、搜索和知识化方法,其难点是在于内容的语义表示和分析;交换与分发技术主要强调各种网络环境下大规模的数字化内容流通、转换、集成和面向不同终端用户的个性化服务等,其核心是开放的内容交换和版权管理技术;展示与交换技术重点研究符合人类习惯数字内容的各种显示技术及交互方法,以期提高人对复杂信息的认知能力,其难点在于建立自然和谐的人机交互环境;标准与评价体系重点研究虚拟现实/增强现实基础资源、内容编目、信源编码等的规范标准以及相应的评估技术。

目前虚拟现实/增强现实面临的挑战主要体现在智能获取、普适设备、自由交互和感知融合四个方面。在硬件平台与装置、核心芯片与器件、软件平台与工具、相关标准与规范等方面存在一系列科学技术问题。总体来说虚拟现实/增强现实呈现虚拟现实系统智能化、虚实环境对象无缝融合、自然交互全方位与舒适化的发展趋势。

3.1.8人工智能技术发展趋势

综上所述,人工智能技术在以下方面的发展有显著的特点,是进一步研究人工智能趋势的重点。

(1)技术平台开源化开源的学习框架在人工智能领域的研发成绩斐然,对深度学习领域影响巨大。开源的深度学习框架使得开发者可以直接使用已经研发成功的深度学习工具,减少二次开发,提高效率,促进业界紧密合作和交流。国内外产业巨头也纷纷意识到通过开源技术建立产业生态,是抢占产业制高点的重要手段。通过技术平台的开源化,可以扩大技术规模,整合技术和应用,有效布局人工智能全产业链。谷歌、百度等国内外龙头企业纷纷布局开源人工智能生态,未来将有更多的软硬件企业参与开源生态。

(2)专用智能向通用智能发展目前的人工智能发展主要集中在专用智能方面,具有领域局限性。随着科技的发展,各领域之间相互融合、相互影响,需要一种范围广、集成度高、适应能力强的通用智能,提供从辅助性决策工具到专业性解决方案的升级。通用人工智能具备执行一般智慧行为的能力,可以将人工智能与感知、知识、意识和直觉等人类的特征互相连接,减少对领域知识的依赖性、提高处理任务的普适性,这将是人工智能未来的发展方向。未来的人工智能将广泛的涵盖各个领域,消除各领域之间的应用壁垒。

(3)智能感知向智能认知方向迈进人工智能的主要发展阶段包括:运算智能、感知智能、认知智能,这一观点得到业界的广泛认可。早期阶段的人工智能是运算智能,机器具有快速计算和记忆存储能力。当前大数据时代的人工智能是感知智能,机器具有视觉、听觉、触觉等感知能力。随着类脑科技的发展,人工智能必然向认知智能时代迈进,即让机器能理解会思考。

3.2人工智能产业现状及趋势

人工智能作为新一轮产业变革的核心驱动力,将催生新的技术、产品、产业、业态、模式,从而引发经济结构的重大变革,实现社会生产力的整体提升。麦肯锡预计,到2025年全球人工智能应用市场规模总值将达到1270亿美元,人工智能将是众多智能产业发展的突破点。

通过对人工智能产业分布进行梳理,提出了人工智能产业生态图,主要分为核心业态、关联业态、衍生业态三个层次,如图3所示。

下面将重点对核心业态包含的智能基础设施建设、智能信息及数据、智能技术服务、智能产品四个方面展开介绍,并总结人工智能行业应用及产业发展趋势。

3.2.1智能基础设施

智能基础设施为人工智能产业提供计算能力支撑,其范围包括智能传感器、智能芯片、分布式计算框架等,是人工智能产业发展的重要保障。

(1)智能芯片

智能芯片从应用角度可以分为训练和推理两种类型。从部署场景来看,可以分为云端和设备端两步大类。训练过程由于涉及海量的训练数据和复杂的深度神经网络结构,需要庞大的计算规模,主要使用智能芯片集群来完成。与训练的计算量相比,推理的计算量较少,但仍然涉及大量的矩阵运算。目前,训练和推理通常都在云端实现,只有对实时性要求很高的设备会交由设备端进行处理。

按技术架构来看,智能芯片可以分为通用类芯片(CPU、GPU、FPGA)、基于FPGA的半定制化芯片、全定制化ASIC芯片、类脑计算芯片(IBM TrueNorth)。另外,主要的人工智能处理器还有DPU、BPU、NPU、EPU等适用于不同场景和功能的人工智能芯片。

随着互联网用户量和数据规模的急剧膨胀,人工智能发展对计算性能的要求迫切增长,对CPU计算性能提升的需求超过了摩尔定律的增长速度。同时,受限于技术原因,传统处理器性能也无法按照摩尔定律继续增长,发展下一代智能芯片势在必行。未来的智能芯片主要是在两个方向发展:一是模仿人类大脑结构的芯片,二是量子芯片。智能芯片是人工智能时代的战略制高点,预计到2020年人工智能芯片全球市场规模将突破百亿美元。

(2)智能传感器

智能传感器是具有信息处理功能的传感器。智能传感器带有微处理机,具备采集、处理、交换信息等功能,是传感器集成化与微处理机相结合的产物。智能传感器属于人工智能的神经末梢,用于全面感知外界环境。各类传感器的大规模部署和应用为实现人工智能创造了不可或缺的条件。不同应用场景,如智能安防、智能家居、智能医疗等对传感器应用提出了不同的要求。未来,随着人工智能应用领域的不断拓展,市场对传感器的需求将不断增多,2020年市场规模有望突破4600亿美元。未来,高敏度、高精度、高可靠性、微型化、集成化将成为智能传感器发展的重要趋势。

(3)分布式计算框架

面对海量的数据处理、复杂的知识推理,常规的单机计算模式已经不能支撑。所以,计算模式必须将巨大的计算任务分成小的单机可以承受的计算任务,即云计算、边缘计算、大数据技术提供了基础的计算框架。目前流行的分布式计算框架如OpenStack、Hadoop、Storm、Spark、Samza、Bigflow等。各种开源深度学习框架也层出不穷,其中包括TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、Theano、DeepLearning4、Lasagne、Neon等等。

3.2.2智能信息及数据

信息数据是人工智能创造价值的关键要素之一。我国庞大的人口和产业基数带来了数据方面的天生优势。随着算法、算力技术水平的提升,围绕数据的采集、分析、处理产生了众多的企业。目前,在人工智能数据采集、分析、处理方面的企业主要有两种:一种是数据集提供商,以提供数据为自身主要业务,为需求方提供机器学习等技术所需要的不同领域的数据集;另一种是数据采集、分析、处理综合性厂商,自身拥有获取数据的途径,并对采集到的数据进行分析处理,最终将处理后的结果提供给需求方进行使用。对于一些大型企业,企业本身也是数据分析处理结果的需求方。

3.2.3智能技术服务

智能技术服务主要关注如何构建人工智能的技术平台,并对外提供人工智能相关的服务。此类厂商在人工智能产业链中处于关键位置,依托基础设施和大量的数据,为各类人工智能的应用提供关键性的技术平台、解决方案和服务。目前,从提供服务的类型来看,提供技术服务厂商包括以下几类:

(1)提供人工智能的技术平台和算法模型。此类厂商主要针对用户或者行业需求,提供人工智能技术平台以及算法模型。用户可以在人工智能平台之上,通过一系列的算法模型来进行人工智能的应用开发。此类厂商主要关注人工智能的通用计算框架、算法模型、通用技术等关键领域。

(2)提供人工智能的整体解决方案。此类厂商主要针对用户或者行业需求,设计和提供包括软、硬件一体的行业人工智能解决方案,整体方案中集成多种人工智能算法模型以及软、硬件环境,帮助用户或行业解决特定的问题。此类厂商重点关注人工智能在特定领域或者特定行业的应用。

(3)提供人工智能在线服务。此类厂商一般为传统的云服务提供厂商,主要依托其已有的云计算和大数据应用的用户资源,聚集用户的需求和行业属性,为客户提供多类型的人工智能服务;从各类模型算法和计算框架的API等特定应用平台到特定行业的整体解决方案等,进一步吸引大量的用户使用,从而进一步完善其提供的人工智能服务。此类厂商主要提供相对通用的人工智能服务,同时也会关注一些重点行业和领域。

需要指出的是,上述三类角色并不是严格区分开的,很多情况下会出现重叠,随着技术的发展成熟,在人工智能产业链中已有大量的厂商同时具备上述两类或者三类角色的特征。

3.2.4智能产品

随着制造强国、网络强国、数字中国建设进程的加快,在制造、家居、金融、教育、交通、安防、医疗、物流等领域对人工智能技术和产品的需求将进一步释放,相关智能产品的种类和形态也将越来越丰富。

3.2.5人工智能行业应用

人工智能与行业领域的深度融合将改变甚至重新塑造传统行业,本节重点介绍人工智能在制造、家居、金融、交通、安防、医疗、物流行业的应用,由于篇幅有限,其它很多重要的行业应用在这里不展开论述。

(1)智能制造

智能制造是基于新一代信息通信技术与先进制造技术深度融合,贯穿于设计、生产、管理、服务等制造活动的各个环节,具有自感知、自学习、自决策、自执行、自适应等功能的新型生产方式。智能制造对人工智能的需求主要表现在以下三个方面:一是智能装备,包括自动识别设备、人机交互系统、工业机器人以及数控机床等具体设备,涉及到跨媒体分析推理、自然语言处理、虚拟现实智能建模及自主无人系统等关键技术。二是智能工厂,包括智能设计、智能生产、智能管理以及集成优化等具体内容,涉及到跨媒体分析推理、大数据智能、机器学习等关键技术。三是智能服务,包括大规模个性化定制、远程运维以及预测性维护等具体服务模式,涉及到跨媒体分析推理、自然语言处理、大数据智能、高级机器学习等关键技术。例如,现有涉及智能装备故障问题的纸质化文件,可通过自然语言处理,形成数字化资料,再通过非结构化数据向结构化数据的转换,形成深度学习所需的训练数据,从而构建设备故障分析的神经网络,为下一步故障诊断、优化参数设置提供决策依据。

(2)智能家居

参照工业和信息化部印发的《智慧家庭综合标准化体系建设指南》,智能家居是智慧家庭八大应用场景之一。受产业环境、价格、消费者认可度等因素影响,我国智能家居行业经历了漫长的探索期。至2010年,随着物联网技术的发展以及智慧城市概念的出现,智能家居概念逐步有了清晰的定义并随之涌现出各类产品,软件系统也经历了若干轮升级。

智能家居以住宅为平台,基于物联网技术,由硬件(智能家电、智能硬件、安防控制设备、家具等)、软件系统、云计算平台构成的家居生态圈,实现人远程控制设备、设备间互联互通、设备自我学习等功能,并通过收集、分析用户行为数据为用户提供个性化生活服务,使家居生活安全、节能、便捷等。例如,借助智能语音技术,用户应用自然语言实现对家居系统各设备的操控,如开关窗帘(窗户)、操控家用电器和照明系统、打扫卫生等操作;借助机器学习技术,智能电视可以从用户看电视的历史数据中分析其兴趣和爱好,并将相关的节目推荐给用户。通过应用声纹识别、脸部识别、指纹识别等技术进行开锁等;通过大数据技术可以使智能家电实现对自身状态及环境的自我感知,具有故障诊断能力。通过收集产品运行数据,发现产品异常,主动提供服务,降低故障率。还可以通过大数据分析、远程监控和诊断,快速发现问题、解决问题及提高效率。

(3)智能金融

人工智能的飞速发展将对身处服务价值链高端的金融业带来深刻影响,人工智能逐步成为决定金融业沟通客户、发现客户金融需求的重要因素。人工智能技术在金融业中可以用于服务客户,支持授信、各类金融交易和金融分析中的决策,并用于风险防控和监督,将大幅改变金融现有格局,金融服务将会更加地个性化与智能化。智能金融对于金融机构的业务部门来说,可以帮助获客,精准服务客户,提高效率;对于金融机构的风控部门来说,可以提高风险控制,增加安全性;对于用户来说,可以实现资产优化配置,体验到金融机构更加完美地服务。人工智能在金融领域的应用主要包括:智能获客,依托大数据,对金融用户进行画像,通过需求响应模型,极大地提升获客效率;身份识别,以人工智能为内核,通过人脸识别、声纹识别、指静脉识别等生物识别手段,再加上各类票据、身份证、银行卡等证件票据的OCR识别等技术手段,对用户身份进行验证,大幅降低核验成本,有助于提高安全性;大数据风控,通过大数据、算力、算法的结合,搭建反欺诈、信用风险等模型,多维度控制金融机构的信用风险和操作风险,同时避免资产损失;智能投顾,基于大数据和算法能力,对用户与资产信息进行标签化,精准匹配用户与资产;智能客服,基于自然语言处理能力和语音识别能力,拓展客服领域的深度和广度,大幅降低服务成本,提升服务体验;金融云,依托云计算能力的金融科技,为金融机构提供更安全高效的全套金融解决方案。

(4)智能交通

智能交通系统(Intelligent Traffic System,ITS)是通信、信息和控制技术在交通系统中集成应用的产物。ITS借助现代科技手段和设备,将各核心交通元素联通,实现信息互通与共享以及各交通元素的彼此协调、优化配置和高效使用,形成人、车和交通的一个高效协同环境,建立安全、高效、便捷和低碳的交通。例如通过交通信息采集系统采集道路中的车辆流量、行车速度等信息,信息分析处理系统处理后形成实时路况,决策系统据此调整道路红绿灯时长,调整可变车道或潮汐车道的通行方向等,通过信息系统将路况推送到导航软件和广播中,让人们合理规划行驶路线。通过不停车收费系统(ETC),实现对通过ETC入口站的车辆身份及信息自动采集、处理、收费和放行,有效提高通行能力、简化收费管理、降低环境污染。

ITS应用最广泛的地区是日本,其次是美国、欧洲等地区。中国的智能交通系统近几年也发展迅速,在北京、上海、广州、杭州等大城市已经建设了先进的智能交通系统;其中,北京建立了道路交通控制、公共交通指挥与调度、高速公路管理和紧急事件管理等四大ITS系统;广州建立了交通信息共用主平台、物流信息平台和静态交通管理系统等三大ITS系统。

(5)智能安防

智能安防技术是一种利用人工智能对视频、图像进行存储和分析,从中识别安全隐患并对其进行处理的技术。智能安防与传统安防的最大区别在于智能化,传统安防对人的依赖性比较强,非常耗费人力,而智能安防能够通过机器实现智能判断,从而尽可能实现实时地安全防范和处理。

当前,高清视频、智能分析等技术的发展,使得安防从传统的被动防御向主动判断和预警发展,行业也从单一的安全领域向多行业应用发展,进而提升生产效率并提高生活智能化程度,为更多的行业和人群提供可视化及智能化方案。用户面对海量的视频数据,已无法简单利用人海战术进行检索和分析,需要采用人工智能技术作专家系统或辅助手段,实时分析视频内容,探测异常信息,进行风险预测。从技术方面来讲,目前国内智能安防分析技术主要集中在两大类:一类是采用画面分割前景提取等方法对视频画面中的目标进行提取检测,通过不同的规则来区分不同的事件,从而实现不同的判断并产生相应的报警联动等,例如:区域入侵分析、打架检测、人员聚集分析、交通事件检测等;另一类是利用模式识别技术,对画面中特定的物体进行建模,并通过大量样本进行训练,从而达到对视频画面中的特定物体进行识别,如车辆检测、人脸检测、人头检测(人流统计)等应用。

智能安防目前涵盖众多的领域,如街道社区、道路、楼宇建筑、机动车辆的监控,移动物体监测等。今后智能安防还要解决海量视频数据分析、存储控制及传输问题,将智能视频分析技术、云计算及云存储技术结合起来,构建智慧城市下的安防体系。

(6)智能医疗

人工智能的快速发展,为医疗健康领域向更高的智能化方向发展提供了非常有利的技术条件。近几年,智能医疗在辅助诊疗、疾病预测、医疗影像辅助诊断、药物开发等方面发挥重要作用。

在辅助诊疗方面,通过人工智能技术可以有效提高医护人员工作效率,提升一线全科医生的诊断治疗水平。如利用智能语音技术可以实现电子病历的智能语音录入;利用智能影像识别技术,可以实现医学图像自动读片;利用智能技术和大数据平台,构建辅助诊疗系统。

在疾病预测方面,人工智能借助大数据技术可以进行疫情监测,及时有效地预测并防止疫情的进一步扩散和发展。以流感为例,很多国家都有规定,当医生发现新型流感病例时需告知疾病控制与预防中心。但由于人们可能患病不及时就医,同时信息传达回疾控中心也需要时间,因此,通告新流感病例时往往会有一定的延迟,人工智能通过疫情监测能够有效缩短响应时间。

在医疗影像辅助诊断方面,影像判读系统的发展是人工智能技术的产物。早期的影像判读系统主要靠人手工编写判定规则,存在耗时长、临床应用难度大等问题,从而未能得到广泛推广。影像组学是通过医学影像对特征进行提取和分析,为患者预前和预后的诊断和治疗提供评估方法和精准诊疗决策。这在很大程度上简化了人工智能技术的应用流程,节约了人力成本。

(7)智能物流

传统物流企业在利用条形码、射频识别技术、传感器、全球定位系统等方面优化改善运输、仓储、配送装卸等物流业基本活动,同时也在尝试使用智能搜索、推理规划、计算机视觉以及智能机器人等技术,实现货物运输过程的自动化运作和高效率优化管理,提高物流效率。例如,在仓储环节,利用大数据智能通过分析大量历史库存数据,建立相关预测模型,实现物流库存商品的动态调整。大数据智能也可以支撑商品配送规划,进而实现物流供给与需求匹配、物流资源优化与配置等。在货物搬运环节,加载计算机视觉、动态路径规划等技术的智能搬运机器人(如搬运机器人、货架穿梭车、分拣机器人等)得到广泛应用,大大减少了订单出库时间,使物流仓库的存储密度、搬运的速度、拣选的精度均有大幅度提升。

3.2.6人工智能产业发展趋势

从人工智能产业进程来看,技术突破是推动产业升级的核心驱动力。数据资源、运算能力、核心算法共同发展,掀起人工智能第三次新浪潮。人工智能产业正处于从感知智能向认知智能的进阶阶段,前者涉及的智能语音、计算机视觉及自然语言处理等技术,已具有大规模应用基础,但后者要求的“机器要像人一样去思考及主动行动”仍尚待突破,诸如无人驾驶、全自动智能机器人等仍处于开发中,与大规模应用仍有一定距离。

(1)智能服务呈现线下和线上的无缝结合

分布式计算平台的广泛部署和应用,增大了线上服务的应用范围。同时人工智能技术的发展和产品不断涌现,如智能家居、智能机器人、自动驾驶汽车等,为智能服务带来新的渠道或新的传播模式,使得线上服务与线下服务的融合进程加快,促进多产业升级。

(2)智能化应用场景从单一向多元发展

目前人工智能的应用领域还多处于专用阶段,如人脸识别、视频监控、语音识别等都主要用于完成具体任务,覆盖范围有限,产业化程度有待提高。随着智能家居、智慧物流等产品的推出,人工智能的应用终将进入面向复杂场景,处理复杂问题,提高社会生产效率和生活质量的新阶段。

(3)人工智能和实体经济深度融合进程将进一步加快

党的报告提出“推动互联网、大数据、人工智能和实体经济深度融合”,一方面,随着制造强国建设的加快将促进人工智能等新一代信息技术产品发展和应用,助推传统产业转型升级,推动战略性新兴产业实现整体性突破。另一方面,随着人工智能底层技术的开源化,传统行业将有望加快掌握人工智能基础技术并依托其积累的行业数据资源实现人工智能与实体经济的深度融合创新。

3.3安全、伦理、隐私问题

历史经验表明新技术常常能够提高生产效率,促进社会进步。但与此同时,由于人工智能尚处于初期发展阶段,该领域的安全、伦理、隐私的政策、法律和标准问题值得关注。就人工智能技术而言,安全、伦理和隐私问题直接影响人们与人工智能工具交互经验中对人工智能技术的信任。社会公众必须信任人工智能技术能够给人类带来的安全利益远大于伤害,才有可能发展人工智能。要保障安全,人工智能技术本身及在各个领域的应用应遵循人类社会所认同的伦理原则,其中应特别关注的是隐私问题,因为人工智能的发展伴随着越来越多的个人数据被记录和分析,而在这个过程中保障个人隐私则是社会信任能够增加的重要条件。总之,建立一个令人工智能技术造福于社会、保护公众利益的政策、法律和标准化环境,是人工智能技术持续、健康发展的重要前提。为此,本章集中讨论与人工智能技术相关的安全、伦理、隐私的政策和法律问题。

3.3.1人工智能的安全问题

人工智能最大的特征是能够实现无人类干预的,基于知识并能够自我修正地自动化运行。在开启人工智能系统后,人工智能系统的决策不再需要操控者进一步的指令,这种决策可能会产生人类预料不到的结果。设计者和生产者在开发人工智能产品的过程中可能并不能准确预知某一产品会存在的可能风险。因此,对于人工智能的安全问题不容忽视。

与传统的公共安全(例如核技术)需要强大的基础设施作为支撑不同,人工智能以计算机和互联网为依托,无需昂贵的基础设施就能造成安全威胁。掌握相关技术的人员可以在任何时间、地点且没有昂贵基础设施的情况下做出人工智能产品。人工智能的程序运行并非公开可追踪,其扩散途径和速度也难以精确控制。在无法利用已有传统管制技术的条件下,对人工智能技术的管制必须另辟蹊径。换言之,管制者必须考虑更为深层的伦理问题,保证人工智能技术及其应用均应符合伦理要求,才能真正实现保障公共安全的目的。

由于人工智能技术的目标实现受其初始设定的影响,必须能够保障人工智能设计的目标与大多数人类的利益和伦理道德一致,即使在决策过程中面对不同的环境,人工智能也能做出相对安全的决定。从人工智能的技术应用方面看,要充分考虑到人工智能开发和部署过程中的责任和过错问题,通过为人工智能技术开发者、产品生产者或者服务提供者、最终使用者设定权利和义务的具体内容,来达到落实安全保障要求的目的。

此外,考虑到目前世界各国关于人工智能管理的规定尚不统一,相关标准也处于空白状态,同一人工智能技术的参与者可能来自不同国家,而这些国家尚未签署针对人工智能的共有合约。为此,我国应加强国际合作,推动制定一套世界通用的管制原则和标准来保障人工智能技术的安全性。

3.3.2人工智能的伦理问题

人工智能是人类智能的延伸,也是人类价值系统的延伸。在其发展的过程中,应当包含对人类伦理价值的正确考量。设定人工智能技术的伦理要求,要依托于社会和公众对人工智能伦理的深入思考和广泛共识,并遵循一些共识原则:

一是人类利益原则,即人工智能应以实现人类利益为终极目标。这一原则体现对人权的尊重、对人类和自然环境利益最大化以及降低技术风险和对社会的负面影响。在此原则下,政策和法律应致力于人工智能发展的外部社会环境的构建,推动对社会个体的人工智能伦理和安全意识教育,让社会警惕人工智能技术被滥用的风险。此外,还应该警惕人工智能系统作出与伦理道德偏差的决策。例如,大学利用机器学习算法来评估入学申请,假如用于训练算法的历史入学数据(有意或无意)反映出之前的录取程序的某些偏差(如性别歧视),那么机器学习可能会在重复累计的运算过程中恶化这些偏差,造成恶性循环。如果没有纠正,偏差会以这种方式在社会中永久存在。

二是责任原则,即在技术开发和应用两方面都建立明确的责任体系,以便在技术层面可以对人工智能技术开发人员或部门问责,在应用层面可以建立合理的责任和赔偿体系。在责任原则下,在技术开发方面应遵循透明度原则;在技术应用方面则应当遵循权责一致原则。

其中,透明度原则要求了解系统的工作原理从而预测未来发展,即人类应当知道人工智能如何以及为何做出特定决定,这对于责任分配至关重要。例如,在神经网络这个人工智能的重要议题中,人们需要知道为什么会产生特定的输出结果。另外,数据来源透明度也同样非常重要。即便是在处理没有问题的数据集时,也有可能面临数据中隐含的偏见问题。透明度原则还要求开发技术时注意多个人工智能系统协作产生的危害。

权责一致原则,指的是未来政策和法律应该做出明确规定:一方面必要的商业数据应被合理记录、相应算法应受到监督、商业应用应受到合理审查;另一方面商业主体仍可利用合理的知识产权或者商业秘密来保护本企业的核心参数。在人工智能的应用领域,权利和责任一致的原则尚未在商界、政府对伦理的实践中完全实现。主要是由于在人工智能产品和服务的开发和生产过程中,工程师和设计团队往往忽视伦理问题,此外人工智能的整个行业尚未习惯于综合考量各个利益相关者需求的工作流程,人工智能相关企业对商业秘密的保护也未与透明度相平衡。

3.3.3人工智能的隐私问题

人工智能的近期发展是建立在大量数据的信息技术应用之上,不可避免地涉及到个人信息的合理使用问题,因此对于隐私应该有明确且可操作的定义。人工智能技术的发展也让侵犯个人隐私(的行为)更为便利,因此相关法律和标准应该为个人隐私提供更强有力的保护。已有的对隐私信息的管制包括对使用者未明示同意的收集,以及使用者明示同意条件下的个人信息收集两种类型的处理。人工智能技术的发展对原有的管制框架带来了新的挑战,原因是使用者所同意的个人信息收集范围不再有确定的界限。利用人工智能技术很容易推导出公民不愿意泄露的隐私,例如从公共数据中推导出私人信息,从个人信息中推导出和个人有关的其他人员(如朋友、亲人、同事)信息(在线行为、人际关系等)。这类信息超出了最初个人同意披露的个人信息范围。

此外,人工智能技术的发展使得政府对于公民个人数据信息的收集和使用更加便利。大量个人数据信息能够帮助政府各个部门更好地了解所服务的人群状态,确保个性化服务的机会和质量。但随之而来的是,政府部门和政府工作人员个人不恰当使用个人数据信息的风险和潜在的危害应当得到足够的重视。

人工智能语境下的个人数据的获取和知情同意应该重新进行定义。首先,相关政策、法律和标准应直接对数据的收集和使用进行规制,而不能仅仅征得数据所有者的同意;其次,应当建立实用、可执行的、适应于不同使用场景的标准流程以供设计者和开发者保护数据来源的隐私;再次,对于利用人工智能可能推导出超过公民最初同意披露的信息的行为应该进行规制。最后,政策、法律和标准对于个人数据管理应该采取延伸式保护,鼓励发展相关技术,探索将算法工具作为个体在数字和现实世界中的人。这种方式使得控制和使用两者得以共存,因为算法人可以根据不同的情况,设定不同的使用权限,同时管理个人同意与拒绝分享的信息。

本章节所涉及的安全、伦理和隐私问题是人工智能发展面临的挑战。安全问题是让技术能够持续发展的前提。技术的发展给社会信任带来了风险,如何增加社会信任,让技术发展遵循伦理要求,特别是保障隐私不会被侵犯是亟需解决的问题。为此,需要(制订)合理的政策、法律、标准基础,并与国际社会协作。在制订政策、法律和标准时,应当摆脱肤浅的新闻炒作和广告式的热点宣传,必须促进对人工智能技术产品更深层地理解,聚焦这一新技术给社会产生重大利益的同时也带来的巨大挑战。作为国际社会的重要成员,中国对保障人工智能技术应用在正确的道路上、基于正确的理由得到健康发展担负重要的责任。

3.4人工智能标准化的重要作用

当今,经济全球化和市场国际化深入发展,标准作为经济和社会活动的主要技术依据,已成为衡量国家或地区技术发展水平的重要标志、产品进入市场的基本准则、企业市场竞争力的具体体现。标准化工作对人工智能及其产业发展具有基础性、支撑性、引领性的作用,既是推动产业创新发展的关键抓手,也是产业竞争的制高点。人工智能标准的先进与完善与否,关系到产业的健康发展、以及产品国际市场竞争力的强弱。

美国、欧盟、日本等发达国家高度重视人工智能标准化工作。美国的《国家人工智能研究与发展策略规划》,欧盟的“人脑计划”,日本实施的“人工智能/大数据/物联网/网络安全综合项目”,均提出围绕核心技术、顶尖人才、标准规范等强化部署,力图抢占新一轮科技主导权。我国高度重视人工智能标准化工作。在国务院《新一代人工智能发展规划》中将人工智能标准化作为重要支撑保障,提出要“加强人工智能标准框架体系研究。坚持安全性、可用性、互操作性、可追溯性原则,逐步建立并完善人工智能基础共性、互联互通、行业应用、网络安全、隐私保护等技术标准。加快推动无人驾驶、服务机器人等细分应用领域的行业协会和联盟制定相关标准”。工信部在《促进新一代人工智能产业发展三年行动计划(2018-2020年)》中指出,要建设人工智能产业标准规范体系,建立并完善基础共性、互联互通、安全隐私、行业应用等技术标准;同时构建人工智能产品评估评测体系。

我国虽然在人工智能领域虽然具备了良好基础,语音识别、视觉识别、中文信息处理等核心技术实现了突破,也具有巨大的应用市场环境,但整体发展水平仍落后于发达国家,在核心算法、关键设备、高端芯片、重大产品与系统等方面差距较大,适应人工智能发展的基础设施、政策法规、标准体系亟待完善。

综上分析,更应重视人工智能标准化工作对于促进技术创新、支撑产业发展具有的重要引领作用:

(一)标准化工作有利于加快人工智能技术创新和成果转化。现阶段人工智能技术发展迅速,市场上逐步出现了可规模化、可商业化的产品和应用,需要以标准化的手段固化技术成果,实现快速创新推广;

(二)标准化工作有助于提升人工智能产品和服务质量。如市场上出现的人脸识别系统、智能音箱、服务机器人等产品,质量残次不齐,需要标准的统一规范,并配合以开展符合性测试评估的方式,提升产品和服务质量;

(三)标准化工作有助于切实保障用户安全。例如自动驾驶领域的“电车难题”伦理难题、苹果手机指纹泄露用户隐私等问题,引起了人们的广泛关注。如何保护用户权益是难点也是重点,这需要通过建立以人为本的原则,制定相关安全标准规范,确保智能系统遵从并服务于人类伦理,并确保信息安全;

人工智能技术意义范文第4篇

在人工智能技术应用上,教育领域也深受影响,如何更好的迎合现实需求,对此,我认为

一、人工智能技术要在促进学生学习理解上体现价值。

技术是有成本的。如果技术应用只是提高了训练的效益,其价值便只在低层次认知能力,这些成本是否值当?人工智能技术之应用须在促进学生高层次认知能力的发展上发挥作用,帮助学生从解答习题为主走向解决问题为主。我们应该依托人工智能技术在情境创设与人机互动等方面的优势,促使学生基于理解的学习,促使学生面向应用的学习。

二、人工智能技术要在促进学生个别化学习中发挥作用。

人工智能技术的出现,打破了教育的知识传播平衡,加强了“以学生为中心”的学习关系,使对每一个学习个体的尊重有了可能。而这恰是当前教育实践的薄弱之处。因而,在学校层面应用大数据与人工智能技术的关键,未必在统计意义的归因,而是关于学习个体的过程信息的采集,这是促进学生个别化学习的技术凭借。

人工智能技术意义范文第5篇

关键词:语义网技术;机械设计;现状;应用意义

前言

机械设计主要是指对机械的工作原理、结构、各零件的材料、形状尺寸等各方面进行构思、分析进而得出具体结论的工作过程。而目前的经济发展较为迅速,对于机械设计的要求也就越来越高,新时期的机械设计要更趋向于信息化、创新化、智能化,将语义网技术运用到机械设计上可以使设计更加方便、完善。

1.语义网的概述

语义网的概念最早是由蒂姆・伯纳斯-李提出来的,目前对于语义网的概念还没有统一的界定。但是语义网是未来网络的一个大胆设想。它是万维网的拓展、延伸,更加能够高效的理解词语,并能快速理清各个逻辑关系。更加方便人们与电脑进行沟通,提供高效的智能服务。

虽然对语义网目前还没有准确的定义,但是语义网相对于万维网来说具有以下几点区别:(1)面对的对象不同,万维网主要面对的对象是人,供“人”阅读和使用,而语义网面对的对象是机器。能够直接和计算机进行交流和合作。(2)侧重点不同,万维网侧重的是信息的格式,而语义网则侧重的是语义内容。(3)工作方式不同,万维网主要是人们用来搜集、整理信息的,而语义网的检索更加智能化,不必从大量的检索信息去挖掘所需数据。(4)主要任务不同,万维网的任务主要是帮助人们获取信息,供人们使用和交流。而语义网则是通过与计算机的交流,让计算机帮助人们完成一些工作,从而让网络应用更加智能化、自动化[1]。

2.语义网技术在机械设计中应用的研究现状

语义网虽然在学术界还没有统一的界定,但是其本身特有的优势已经受到越来越多的人喜爱,同时被广泛应用到各个领域。在机械设计中,语义网的应用也是刚刚起步,但是却起到很大的作用和效率。尤其在机械设计零部件、产品概念的设计上等应用现状较为明显。

2.1在机械设计零部件中信息重用的应用

语义网的发展突飞猛进,被广泛应用到各个领域,在机械设计领域效果也较为显著。语义网与传统的网络技术不同的是可以将设计信息达到共享,对于机械零部件设计环节来说,信息共享尤为重要。所以,语义网可以实现机械产品零部件信息重用,这样,大大提高了设计人员的工作效率,不必将大量的时间耗费在研究新产品上,提高了成功率的同时,也减少了企业的部分开销[2]。

2.2语义网技术应用到机械产品信息语义交换中

语义网技术能够高效的理解词语及逻辑关系,在机械设计中的应用,可以实现机械产品信息语义交换,也就是说可以将机械产品信息资源应用到各个系统中,并且还可以对各种数据进行自动处理和语义交换,这样就更容易让工作人员对机械产品进行开发、研究。

2.3语义网广泛应用到概念设计中

在产品的设计概念中,最重要的就是要构建合理的产品系统构架,确保子系统的配置与各个系统之间的交互顺利。在交互的环节中,其接口部分尤为重要,它是完成各系统间交互的重要环节。将语义网运用到产品概念的设计中,可以有效发挥其优势,顺利完成各项工作环节。保障产品概念设计更加快速、准确[3]。

3.语义网技术在机械设计中的应用意义

3.1语义网技术的应用可以使机械设计更加信息化、智能化

语义网技术在机械设计中具有重要的应用意义,它能够使机械设计更加信息化、智能化。语义网本身具有的优势可以为计算机辅助设计系统提供相应的语义交换平台,可以有效的实现信息数据转换,快速理清各种逻辑关系之间的联系。因此,随着科学技术的发展和互联网技术的广泛应用,语义网技术在机械设计中被广泛的应用,同时,语义网带来的便利也使得机械设计更加的协同化、智能化,成果较为显著。

3.2语义网技术应用到机械设计领域中是必然趋势

机械设计方法论的发展常常与其他领域研制的成果相结合,比如绿色设计、智能设计等设计成果都是引入其他领域的研究成果,而取得的成功方案。但是,随着目前的科学技术的发展,很多设计成果已然遇到了发展瓶颈,尤其在互联网领域中,网络信息不断增长,很多网络信息数据及内容不能被很好的筛选和解读,检索率下降,就不能提供更加准确、快捷的信息资源。比如,基于知识设计应用系统的知识库共享问题,以及重用困难、数据检索率低等,面对日益突出的设计问题,将语义网技术结合到机械设计中去,是机械设计发展的必然趋势。

3.3研究基于语义网技术的机械设计是适应互联网技术发展的必然要求

语义网以其独特的优势和高速运转的能力必然会成为未来互联网技术的一颗璀璨“明珠”,必会代替万维网而成为主流技术。在信息共享、语义转换的特殊功能下为制造企业提供了可靠的共享平台,为产品设计提供了便捷的优势。传统的Web信息处理也必然会转向语义网的知识处理。因此,研究语义网技术的机械设计是适应互联网技术发展的必然要求,是未来科学技术应用的研究热点。

4.结束语

综上诉述,随着计算机技术、互联网以及人工智能技术的不断发展,机械设计必然会更加信息化、智能化、协同化。语义网的出现,更是引起了极大的反响,在各个领域都被广泛应用。其独特的优势及其高速运转的能力在机械设计中得到了很好的应用,且效果显著。它是未来互联网技术发展的必然趋势,因此,研究给予语义网技术的机械方法和技术研究具有重要意义。

参考文献:

[1]张强.基于网络机械设计实验仿真及远程数据采集实验系统研究[D].北京科技大学硕士论文,2011,(5).

[2]张岩松.基于语义网技术的机械设计方法和技术研究[J].学术论丛,2012,(3):22-23.

[3]杨利花,杨世强.现代设计方法及其发展趋势[J].甘肃科学学报,2013,(8):33-34.

作者简介: