首页 > 文章中心 > 人文主义的基本特征

人文主义的基本特征

人文主义的基本特征

人文主义的基本特征范文第1篇

〔关键词〕图像检索;共词分析;知识图谱;研究热点

DOI:10.3969/j.issn.1008-0821.2013.11.023

〔中图分类号〕G254 〔文献标识码〕A 〔文章编号〕1008-0821(2013)11-0100-08

图像检索是信息检索的重要组成部分,从20世纪70年代开始,很多学者都对图像检索技术进行研究,先后提出基于文本的图像检索、基于内容的图像检索以及基于语义的图像检索技术。传统的文字搜索主要是以关键词匹配为基础,着重优化搜索路径算法,加强建立学习和反馈模型,比如百度和谷歌都取得了巨大的成功。但图像检索与文字检索存在很大的区别,存在很多问题,如图像内容描述、语义理解鸿沟、特征提取复杂等。这些问题制约着图像检索研究领域的进一步发展,也是图像检索研究的热点问题。

本文以CNKI近十年来发表的图像检索文献为研究对象,以文献关键词为研究载体,以共词分析方法为研究基础,采用聚类分析、多维尺度分析、社会网络分析等方法,结合可视化软件Ucinet,绘制近十年来图像检索研究图谱。笔者研究目的在于通过这篇研究论文,图像检索研究领域的学者或者是对图像检索感兴趣的人可以很清晰的发现近十年来图像检索研究领域过去的关注点、现在的热点以及未来的发展趋势。

1 文献来源及研究方法

1.1 研究文献来源

为了确保检索的文献符合笔者的分析需求,笔者检索条件设置为:数据来源为CNKI(中国学术文献网络出版总库),检索时间为2003-2012年,关键词中包含“图像检索”,检索策略为“精确”进行检索,共检索出期刊2 477篇。

1.2 基于研究样本的文献计量情况

论文载文量的变化,在一定程度上反映该学科的理论水平和发展速度[1]。笔者对国内图像检索相关的2 477篇文献进行统计,并利用Excel软件绘制出图像检索文献年代分布折线图,如图1所示。图1的数据表明,图像检索论文数量从总体上来看,是成上升趋势,在2008年达到顶峰。论文增长曲线呈现“S”型。根据普莱斯逻辑增长曲线规律,笔者发现图像检索研究是逐步发展的,并逐渐走向成熟的过程。图1 2003-2012年图像检索研究期刊发文量

1 通过文献计量软件SATI 2.2软件,对检索的2 477篇文章的文章进行统计分析,得到作者的总人数为3 917人(包括第一作者、第二作者等)。经过计算,笔者发现西安电子科技大学多媒体研究所的周利华教授和河南理工大学的孙君顶教授发表的文章最多,同为33篇,根据普莱斯计算公式,核心作者发文数m≈4.31,因此将文章数量为5篇及以上的著者定为核心著者,统计得到核心著者有153人,占全部作者总数的3.9%。笔者筛选出发文数量排名前20的作者及其单位,如表1所示。从表1中,我们发现图像检索研究机构以高校为主,并且相对集中。西安电子科技大学、西北大学、西北工业大学、河南理工大学等。高校是图像检索的主要研究机构,这也表明,图像检索的研究目前以理论研究为主,实际应用并不广泛。

表1 2003-2012年图像检索期刊发文量前20位作者及其单位

1.3 期刊分析

期刊载文分析主要反映学科研究文献的期刊分布情况,期刊的分布也可验证布拉德福定律。由于核心期刊的载文量水平较高,更能反映学科研究水平,因此本文的期刊分析,都以核心期刊为主。表2是排名前20位发文量超过15篇的核心期刊。

表2 载文前20种核心期刊表

1.4 研究主题分析

研究主题变化通过关键词词频变化来揭示。本文对2 477篇图像检索的关键词进行统计,在统计过程中,对一些关键词进行合并处理,如“基于内容的图像检索”、“基于内容”和“CBIR”;“纹理”和“纹理特征”等。为了能够清晰的揭示出研究主题的变化,笔者对每一年的论文关键词分别进行统计,统计结果见表3。

表3 2003-2012年论文关键词词频变化表

随着时间的推移以及研究的深入,图像检索领域的研究热点也在不断的变化中。笔者参考安徽大学储节旺教授将热点关键词进行分类的研究方法,将图像检索领域的热点关键词分为3种类型:恒星关键词、流星关键词和新星关键词[2]。(1)恒星关键词指的是那些一直处于研究热点的关键词,如“图像检索”、“基于内容的图像检索”、“相关反馈”、“特征提取”、“颜色直方图”等,这类关键词也是图像检索的核心内容。(2)流星关键词指的是那些研究一段时间后缺乏持续研究的关键词,如“图像数据库”、“医学图像检索”、“数字图书馆”等。这类关键词研究的内容深度不够,没有涉及到图像检索的核心内容,研究的是图像检索应用研究。图像检索研究本身存在很多技术有待突破,目前主要停留在理论研究层面,这些基于图像检索技术的应用研究明显研究深度和热度。(3)新星关键词指的是那些总体增长比较平稳并且在未来会受到重点研究的关键词,如“图像分割”、“小波变换”、“支持向量机”、“灰度共生矩阵”等。这类关键词涉及到图像检索的核心技术,也是未来提高图像检索速度和效果的关键所在。

1.5 高频关键词的确定

通过文献计量软件,统计得出2 477篇文章中共有关键词3 463个。通过对关键词进行认真分析,将一些表述相近意思的关键词进行合并,如“基于内容的图像检索”、“CBIR”和“基于内容图像索”;“纹理”和“纹理特征”进行合并,取词频大于20的关键词作为高频关键词,共有48个,如表4所示。表4 高频关键词表(部分)

关键词频次关键词频次图像检索1 190直方图48基于内容的图像检索488基于内容44相关反馈261灰度共生矩阵43特征提取210MPEG-743颜色直方图130数字图书馆37纹理特征94相似度37支持向量机86医学图像检索36颜色特征72图像特征35小波变换71图 像32图像分割65检 索31形状特征58信息检索30相似性度量56图像语义30图像数据库54图像分类29颜 色52颜色空间28聚 类49不变距27

为了进一步的分析关键词内部之间的联系,对48个高频关键词进行两两检索,形成48×48的共词矩阵,如图2所示。图像检索基于内容的

图像检索相关反馈特征提取颜色直方图纹理特征纹 理图像检索1 18910129104814942基于内容的图像检索103876341161916相关反馈12963261238310特征提取1044123210599颜色直方图81168513001图2 高频关键词共现矩阵(部分)

1.6 构造相关矩

通过对共词矩阵进行卡方检验,发现共词矩阵不符合正态分布规律,为了能够用更多的统计方法对数据进行统计分析,需要利用Ochiia系数对共词矩阵进行转换,构造相关矩阵和相似矩阵。用Ochiia系数将共词矩阵转换成相似矩阵,如图2所示。但是相似矩阵中的0值过多,统计时容易造成误差,为了方便进一步处理,用1与全部相关矩阵上的数据相减,得到关键词相异矩阵,部分数据如图3所示[3]。

图像检索基于内容的

在相似矩阵中,数值的大小表明了两个关键词之间距离的远近,数值越大表明关键词之间的距离越近,相关程度越大;数值越小则表明关键词之间的距离越远,相关程度越小。图像检索基于内容的

在相异矩阵中,数值越小表明关键词之间的距离越近,相关程度越大;数值越大则表明关键词之间的距离越远,相关程度越小。

1.7 知识图谱分析

科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。它的悄然兴起,一方面是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物,另一方面又是显示科学知识地理分布的知识地图转向以图像展现知识结构关系与演进规律的结果。基于社会网络的Ucinet软件,通过构建行动者节点及其联系网络的互动关系,解释社会网络的层次性、等级性、结构性等,并以网络图谱的形式揭示该研究领域的主题热点[4]。图5 关键词共现图谱

分析显示,网络密度为10.95%,中间中心度为19.62%,一致性指数为0.962,上述3个指数表明,关键词共现网络集聚程度不高。其中,图中节点大小由关键词频次决定,线条的粗细,由两个关键词共现的次数决定。线条越粗,表明共现次数越多,反之,表明共现次数越少。节点围绕图像检索、基于内容的图像检索、相关反馈、特征提取形成相对密集的圈层。图5,点的中间中心度排名前15位的分别是图像检索(982.269,1)、基于内容的图像检索(529.658,2)、相关反馈(365.832,3)、特征提取(343.531,4)、颜色直方图(160.999,5)、纹理特征(108.175,6)、支持向量机(95.334,7)、颜色特征(78.884,8)、小波变换(73.287,9)、图像数据库(57.513,13)、形状特征(46.640,11)、相似性度量(45.965,12)、聚类(44.494,15)、医学图像检索(40.030,22)、图像分割(34.788,10),括号内为关键词的中间中心度及频次排序。网络连线的粗细能反映节点的关联度,是识别意义类团的重要特征,如“图像检索——基于内容的图像检索——图像分割——相关反馈——纹理特征”、“图像检索——颜色直方图——颜色特征——兴趣点——颜色量化——特征匹配”、“图像检索——聚类——语义鸿沟——高层语义——图像索引”、“图像检索——特征提取——纹理特征——相似度——图像数据库——医学图像检索——图像检索系统”等。

1.8 多维量表分析

多维量表分析(MDS)是将一组个体间的相异性数据经过MDS转换成空间的构形,且尽可能保留原始数据的相对关系。在SPSS 19中文版中,选择“分析——度量——多维尺度(ALSCAL)”,得到空间二维图,如图6所示。图6 多维尺度分析结果图

从图6可以看出,关键词大体可以分为六大类。第一类,语义图像检索、多媒体数据库、纹理检索、图像匹配、空间关系、高层语义、主色调、纹理谱、位平面、粗糙集、纹理图像检索、商标图像检索、环形颜色直方图;第二类,纹理分析、边缘检测、图像检索技术、图像检索系统、兴趣点、搜索引擎;第三类,视觉特征、半监督学习、相关反馈、流形学习、多示例学习支持向量机、图像检索;第四类,图像特征、不变距语义、语义鸿沟、相似性度量、相似度、图像分类;第五类,数字图书馆、聚类、形状特征、颜色特征、特征提取;第六类,医学图像、图像数据库、医学图像检索、灰度共生矩阵、颜色距、图像语义、MPEG7、图像分割、颜色空间、图像标注等。

2 研究热点分析

通过上文对图像检索研究领域的多维计量分析(知识图谱分析、多维尺度分析)以及关键词词频的变化分析,笔者发现目前国内对图像检索的研究领域比较集中,主要集中在图像检索的算法研究、图像特征研究(如颜色特征,纹理特征,形状特征等)、图像语义研究等。具体分为以下几个方面:

2.1 图像算法研究

图像算法研究是图像检索的研究热点之一,不同的学者从不同的角度提出不同的图像检索算法,来提高图像检索的效果。鲁珂等提出基于支持向量机的理论提出了一种用于图像检索的半监督学习算法[5]。许相莉等提出一种基于粒子群的图像检索相关反馈算法,使得用户对检索目标的理解逐渐清晰,能够有效全面的搜索图片库,同时避免多次反馈造成的算法效率和检索效果之间的矛盾[6]。王崇骏等在IPSM模型对图像的语义分类特征进行描述和提取的基础上,提出并实现了基于高层语义的图像检索算法以及基于高层语义的相关反馈算法[7]。李健提出一种以曲波变换为基础,综合香农熵与频域子带能量特征的图像检索算法。该方法用香农熵进行预分类,用子带图像的能量特征进行相似度度量,并加入检索者的反馈信息,实现图像的精确检索[8]。牛蕾等回顾了早期的启发式相关反馈算法和近期的最优相关反馈算法,对现有的相关反馈算法进行了分析、总结和对比,并提出了今后相关反馈算法的发展方向[9]。因限于篇幅,不一一列举图像检索算法。

2.2 图像特征研究(颜色特征、纹理特征、形状特征、空间关系特征等) 特征提取是计算机视觉和图像处理中的一个概念,是图像检索的核心内容。它指的是使用计算机将图像信息进行分解、匹对,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。目前,特征提取算法各种各样,算法计算复杂性和可重复性也非常不同。颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质,由于颜色特征不能反映颜色信息的空间分布等特点,因此基于颜色特征的图像检索存在一定的缺陷,影响图像检索效果。王向阳等提出一种鲁棒的多特征彩色图像检索新方法,实验结果表明,该方法不仅能够准确、快速的检索出用户所需图像,而且对光照、锐化、模糊等噪声攻击均具有较好的鲁棒性[10]。纹理特征也是全局特征,它和颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算,这样提高了模式匹配的成功率,但光照、反射情况对图像检索存在一定干扰。安志勇等在构造了具有旋转、平移和尺度不变的纹理特征的基础上,提出基于纹理特征的图像检索算法,该算法具有旋转、平移和尺度不变性,与其它方法相比,具有较高的检索率[11]。形状特征有两类表示方法:一类是轮廓特征;另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。形状特征可以比较有效地利用图像中感兴趣的目标来进行检索,但图像形状本身存在容易出现变形的情况,而且人的主观意识对图像形状的判别也存在影响。何姗等提出一种基于兴趣点的图像检索新方法ACSM,利用兴趣点的位置信息,提取兴趣点周围局部区域的颜色矩特征和区域形状不变矩特征,由于将颜色和形状特征有机结合,ACSM算法有效提高了图像检索的准确性[12]。空间关系,是指将一幅图像进行分割,分割出来的多个目标之间的相互的空间位置或相对方向关系(邻接、重叠等关系)。空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。张伟等构造了在平移缩放旋转下保持不变的基于度量矩阵特征值的图像空间关系描述子。研究表明这种描述与人的主观视觉心理相一致,在平移缩放旋转下以及小噪声下具有较强的鲁棒性,具有较好的类别可分离性[13]。

2.3 图像语义研究

图像语义研究是图像理解的重点和难点,在现实生活中,人的视觉特征因人而异,人对同一副图像的情感认知也不尽相同,导致不同的人对同一副图像特征提取出现天壤之别。如何对一幅图像的特征(颜色、纹理、形状等)描述与视觉特征相吻合,进行客观的语义描述,实现基于语义的图像检索是国内学者研究的热点之一。图像语义研究包括语义鸿沟、高层语义、底层特征语义等角度。语义鸿沟是图像检索系统广泛存在的问题之一,它是人对图像相似性的判别依据与计算机对相似性的判别依据之间的不同,造成了人所理解的“语义相似”与计算机理解的“视觉相似”之间的“语义鸿沟”的产生。张菁等针对相关反馈和感兴趣区检测在弥补语义鸿沟时存在主观性强、耗时的缺点,提出了视觉信息是一种客观反映图像高层语义的新特征,基于视觉信息进行图像检索可以有效减小语义鸿沟[14]。高层语义主要涉及图像的场景语义、行为语义和情感语义。一般而言,高层的图像语义往往建立在较低层次的语义获得的基础上,并且层次越高,语义越复杂,涉及的领域知识越多,也是图像语义描述的难点之一。吴楠等利用图像的高层语义信息来进行图像检索,在深入研究图像高层语义的低层特征描述的基础上,提出了图像语义的层次划分,并对每个高层语义层提出了语义抽取和检索算法。该检索算法可以有效地对图像高层语义信息进行提取,并可作为新型高效图像检索系统的一个模型[15]。袁薇等指出了应用图像的高层语义特征和底层颜色特征作为图像检索的综合指标,将图像文本和视觉信息融合起来,给出了一种综合语义和颜色特征的图像检索系统的体系架构,以填补多媒体底层特征和高层语义之间的差异[16]。

2.4 图像检索技术研究

图像检索技术的发展是一个不断进化的过程,最初是基于文本的图像检索。基于文本的图像检索是首先对图像的特征进行文本描述,然后利用关键词进行检索图片,费时费力,而且检索效率低下,容易出现错误。为了克服基于文本的图像检索的局限性,提出了基于内容的图像检索系统,通过特征提取和高维索引技术进行检索,通过比较视觉特征的相似度来获得检索结果。洪俊明总结了图像数据库检索技术的发展轨迹和特点,针对基于内容的图像检索技术中的局限性,从计算机底层硬件的角度提出了基于内容检索的流水索引法[17]。但在现实生活中,人们往往习惯于对图像的语义进行检索,而不是图像的特征,如何建立从图像的低层特征到高层语义的映射,获取图像的语义概念,并在此基础上进行语义检索,是图像检索技术的一个新的方向,即基于语义的图像检索技术。陈久军等提出图像语义检索整体框架,系统采用XML技术,将图像内容层式描述、图像语义对象自动获取、图像语义相似测度等功能模块加以融合,实现语义层面的图像检索[18]。

3 结 语

国内对图像检索的研究热点主要集中在图像检索的算法研究、图像特征研究(如颜色特征,纹理特征,形状特征等)、图像语义研究等。当然,国内针对图像检索研究的热点还有,比如基于流行学习的图像检索技术、遗传算法、粗糙集理论在图像检索中的应用以及医学图像检索相关技术的研究等等,因限于篇幅,笔者主要列出国内学者研究比较集中的热点问题。通过共词分析法来展现国内图像检索研究的学科热点问题,这类文献基本没有。笔者的目的在于通过这篇研究论文,图像检索研究领域的学者或者是对图像检索感兴趣的人可以很清晰的发现近十年来图像检索研究领域过去的关注点、现在的热点以及未来的发展趋势。本文在研究过程中,也存在不足。在介绍图像检索研究热点问题,因限于篇幅,很多相关热点没有一一展示;在文献选取时,以期刊为检索源,忽略了硕博士论文,对研究结果会有一定的影响;高频关键词的设定、多维量表分析、知识图谱分析等都具有一定的主观性,这些问题是笔者下一步需要完善的地方。

参考文献

[1]张玉双.我国高校图书馆知识管理研究的文献统计分析[J].晋图学刊,2008,(5):45-48.

[2]储节旺,王龙.近十年国内知识管理研究热点——基于CSSCI数据库的词频分析[J].情报科学,2011,(9):1425-1429.

[3]Manfred Wettler.Reinhard Rapp Computation of Word Associations Based on the Co-occurrences of Words in Large Corpora[EB/OL].2005-10-09.

[4](美)林顿·C·费里曼.社会网络分析发展史[M].张文宏,刘军,王卫东,译.北京:中国人民大学出版社,2008:2-3.

[5]鲁珂,赵继东,叶娅兰,等.一种用于图像检索的新型半监督学习算法[J].电子科技大学学报,2005,(5):669-671.

[6]许相莉,张利彪,刘向东,等.基于粒子群的图像检索相关反馈算法[J].电子学报,2010,(8):1935-1940.

[7]王崇骏,杨育彬,陈世福.基于高层语义的图像检索算法[J].软件学报,2004,(10):1461-1469.

[8]李健,牛振山.基于曲波的纹理图像检索系统的设计与实现[J].计算机工程与科学,2011,(3):62-66.

[9]牛蕾,倪林.基于内容的图像检索中的相关反馈算法[J].计算机工程与应用,2004,(32):65-70.

[10]王向阳,芦婷婷.一种鲁棒的多特征彩色图像检索新方法[J].中国图象图形学报,2007,(10):1757-1760.

[11]安志勇,曾智勇,赵珊,等.基于纹理特征的图像检索[J].光电子·激光,2008,(2):230-232.

[12]何姗,郭宝龙,洪俊标.基于兴趣点颜色形状特征的图像检索方法[J].微电子学与计算机,2006,(3):40-43.

[13]张伟,何金国,桑佩罗布.基于度量矩阵特征值的图像空间关系描述[J].计算机应用研究,2010,(11):4376-4378.

[14]张菁,沈兰荪,David Dagon Feng.基于视觉感知的图像检索的研究[J].电子学报,2008,(3):494-499.

[15]吴楠,宋方敏.一种基于图像高层语义信息的图像检索方法[J].中国图象图形学报,2006,(12):1774-1780.

[16]袁薇,高淼.综合语义与颜色特征的图像检索技术研究[J].微电子学与计算机,2006,(10):36-39.

人文主义的基本特征范文第2篇

[关键词]中国;中国特色;社会主义

党的十七大报告指出:“中国特色社会主义道路之所以完全正确、之所以能够引领中国发展进步,关键在于我们既坚持了科学社会主义的基本原则,又根据我国实际和时代特征赋予其鲜明的中国特色。”

中国特色社会主义是指中国特色社会主义道路和中国特色社会主义理论体系的辩证统一,深入探讨中国特色社会主义在实践和理论上的中国特色,有助于人们更深刻地理解和把握有中国特色的社会主义理论体系,有助于人们在实践中自觉地坚持社会主义道路。

一、从理论体系上看,坚持科学社会主义的基本原则,立足于中国实际,形成了中国特色社会主义理论体系

党的十七大报告对中国特色社会主义理论体系作了科学概括,“中国特色社会主义理论体系,就是包括邓小平理论、‘三个代表’重要思想以及科学发展观等重大战略思想在内的科学理论体系。”这一理论体系既坚持了科学社会主义的基本原则,又根据我国实际和时代特征赋予其鲜明的中国特色。概括起来,主要表现在以下几个方面。

第一,理论渊源的承续特色

从理论渊源上看,中国特色社会主义理论体系表现出承续性特征。这首先表现在中国特色社会主义理论体系与马克思列宁主义一脉相承。马克思列宁主义是科学的世界观、方法论和价值观,其基本立场、基本观点和基本方法是中国特色社会主义理论体系形成和发展的理论根基。中国特色社会主义理论体系的形成和发展,从根本上看,是坚持和运用上述基本立场、观点和方法的必然结果。

其次,表现为中国特色社会主义理论体系与毛泽东思想一脉相承。毛泽东思想作为马克思列宁主义与中国实际相结合第一次理论飞跃的成果,无疑是马克思列宁主义的基本立场、观点和方法在中国科学运用的理论结晶。以毛泽东为核心的第一代中央领导集体,在社会主义改造基本完成之后,探索适合中国国情的社会主义建设道路,并取得了一系列重要理论成果,为后来中国特色社会主义理论体系的创立提供了宝贵的经验借鉴和现实启迪,成为中国特色社会主义理论体系的直接理论来源。

最后,中国特色社会主义理论体系是邓小平理论、“三个代表”重要思想和科学发展观等重大战略思想的有机统一体。其三个组成部分即邓小平理论、“三个代表”重要思想和科学发展观是在新时期,我们党坚持马克思主义的思想路线,立于中国实际,围绕处于初级阶段的中国社会主义发展这一理论主题,对人类社会发展规律、社会主义建设规律与共产党执政规律的认识不断深化和系统化的结果,体现出鲜明的相承性特征。

第二,理论品格的创新特色

中国特色社会主义理论体系作为马克思主义中国化的最新成果,在与马克思列宁主义、毛泽东思想一脉相承的基础上,又充分体现出创新的特征。

邓小平以超人的胆识和巨大的理论勇气,针对“两个凡是”的束缚,在坚持毛泽东所倡导的“实事求是”的同时,特别强调“解放思想”的极端重要性,围绕“什么是社会主义,怎样建设社会主义”这个问题,明确提出“走自己的路,建设有中国特色的社会主义”的命题,并阐明了社会主义初级阶段论、社会主义市场经济论、社会主义本质论等相关重大理论和实践问题,形成比较完备的中国特色社会主义理论。

以江泽民为主要代表的中国共产党人在新的实践基础上形成的“三个代表”重要思想,进一步回答了“什么是社会主义、怎样建设社会主义”的问题,创造性地回答了“建设什么样的党、怎样建设党”的问题。阐明了十三届四中全会以来我们党在改革发展稳定、治党治国治军、内政外交国防等方面的基本理论、基本路线、基本方针、基本经验,形成了比较完备系统的理论形态,实现了马克思主义中国化的新发展。

以胡锦涛为总书记的党中央和中国共产党人,提出了科学发展观理论,并就如何落实科学发展观、构建社会主义和谐社会、建设社会主义新农村、建设创新型国家、树立社会主义荣辱观、推动和谐世界建设、加强党的先进性建设等问题形成了一系列创新性的重大战略思想。科学回答了“实现什么样的发展、怎样发展”这一关系到中国现实和前途命运的重大问题,从而把对“什么是社会主义、怎样建设社会主义”和“建设什么样的党、怎样建设党”的认识提高到了一个新的高度。

可见,中国特色社会主义理论体系既坚持马克思列宁主义、毛泽东思想的基本原则,又大力推进理论创新。

第三,理论风格的民族特色

“马克思主义必须和我国的具体特点相结合并通过一定的民族形式才能实现。”[ 1 ]中国特色社会主义理论体系是马克思主义基本原理与中国优秀历史文化有机融合的产物,是具有中国特色、中国作风、中国气派的当代中国马克思主义的最新成果。

这种民族性首先表现在中国特色社会主义理论体系在坚持马克思主义基本原理和方法的前提下,从中华民族优秀传统文化和民族精神中汲取理论资源。例如,“三个代表”重要思想以总体的形式融会了中华民族的优秀思想,渗透着民族传统文化的人文精神。诸如民为邦本,本固邦宁的民本思想,天下为公的大同思想,“忧劳兴国,逸豫亡身”,“生于忧患,死于安乐”等居安思危的忧患意识。

其次,表现在对中华民族的优秀传统文化和民族精神加以创新,提出了具有时代特色的理论概括。邓小平理论对传统文化中“藏富于民”的思想加以运用和发展而做出的“共同富裕”是社会主义本质的论断;“三个代表”重要思想对传统文化中“苟日新,日日新,又日新”的与时俱进思想加以运用和发展而做出的马克思主义具有“与时俱进”理论品质的论断;科学发展观对传统文化的民本思想加以运用和发展而得出的“以人为本”的科学发展观理论,都是既源于中华民族优秀传统文化,又高于上述优秀传统文化的理论创造,更好地做到了民族性与时代性的统一。

最后,就是中国特色社会主义理论体系具有中华民族的形式,具有“新鲜活泼的、为中国老百姓所喜闻乐见的中国作风和中国气派”。第四,理论体系的开放特色

马克思主义“是发展着的理论,而不是必须背得烂熟并机械地加以重复的教条。”[ 2 ] 。

党的十七大报告明确指出,“中国特色社会主义理论体系是不断发展的开放的理论体系。”这个提法实际上概括了中国特色社会主义理论体系的开放性特色。

这一特色主要表现在,从理论自身来看,中国特色社会主义理论体系本身是一个开放的系统。这不仅体现于它是在借鉴与吸收中国传统文化和西方近现代文明精华的基础上,把马克思主义的基本立场、基本原理、基本方法与我国的具体实际日益结合的结果,而且体现在这一思想体系在以后的发展过程中,不断融入着蕴涵有实践和时代精华的要素。

一方面,这个理论体系是在以往的实践过程中不断发展的,党的三代中央领导集体和以胡锦涛为总书记的党中央都做出了重要贡献。以毛泽东为代表的第一代中央领导集体所创立的毛泽东思想,从理论上提出并初步分析了我国社会主义条件下的一系列新矛盾、新问题,为中国特色社会主义理论体系的形成提供了宝贵的思想财富。以邓小平为代表的第二代中央领导集体,继续探索中国特色社会主义的发展道路问题,创立了邓小平理论。以江泽民为代表的第三代中央领导集体,在改革开放的新的实践条件下创立了“三个代表”重要思想,使得这一理论继续丰富和发展。党的十六大以来,以胡锦涛为总书记的党中央,肩负起既坚持这个理论、又顺应客观实际的变化创新发展这个理论的历史责任,提出了科学发展观,将这一理论继续推向前进,体现了这一理论日益发展和丰富的内在规定性。

另一方面,随着改革开放和现代化建设实践的新发展,中国特色社会主义理论体系还将得到进一步完善和发展。

二、从制度上看,中国特色社会主义的基本经济制度和民主政治制度大异于传统社会主义模式

中国特色社会主义是中国共产党人和中国人民基于中国国情自主探索的结果。相对于社会主义的传统模式而言中国特色社会主义是一种新型的社会主义,主要表现在以下几个方面。

第一,在经济体制上,与苏联模式的高度集权的行政性计划经济体制不同,中国特色社会主义实行社会主义市场经济体制,在资源配置上由市场机制发挥资源配置的基础性作用。

首先,中国特色社会主义实现了社会主义与市场经济的有机结合。建设有中国特色社会主义的一个伟大创举,就是把社会主义基本制度同市场经济结合在一起,把建立社会主义市场经济体制作为我国经济体制改革的目标模式,把运用市场机制优化资源配置、提高经济效率的功能同社会主义保证社会公平、促进共同富裕的目标有机地结合在一起,实现了社会主义与市场经济的内在统一。

其次,中国特色社会主义建立了独特的所有制结构。在不断巩固和发展公有制经济的前提下,毫不动摇地鼓励、支持和引导非公有制经济的发展。

再次,在社会主义分配制度方面,“有中国特色的社会主义”突破了社会主义分配制度只能是按劳分配的传统观念,确立了以按劳分配为主体、多种分配方式并存的新观念。 [论文网 LunWenDataCom]

第二,在政治体制上,与苏联模式高度集权和集中的政治体制不同,中国特色社会主义实行社会主义的民主和法治。

我国《宪法》规定:“中华人民共和国是工人阶级领导的、以工农联盟为基础的人民民主专政的社会主义国家。”实行人民民主专政,体现了民主与专政的辩证统一,突出了不断发展社会主义民主,切实保护人民的利益,坚决维护国家的主权、安全、统一和稳定的职能。与人民民主专政的国体相适应,我国实行民主集中制的人民代表大会制度的政体。人民代表大会制度是符合中国国情、体现中国社会主义国家性质、能够保证中国人民当家作主的根本政治制度和最高实现形式,也是党在国家政权中充分发扬民主、贯彻群众路线的最好实现形式,是中国社会主义政治文明的重要制度载体。共产党领导的多党合作和政治协商制度是符合我国国情、经得起实践检验的正确有效的政党制度,我国政治制度的一大特点和优点。

坚持党的领导、人民当家作主和依法治国的统一,坚持依法治国和以德治国相统一,不断完善人民代表大会制度、共产党领导的多党合作和政治协商制度、民族区域自治制度以及基层群众自治制度,在坚持四项基本原则的前提下积极稳妥地推进政治体制改革,这是中国特色社会主义政治建设的主要内容。

第三,在文化体制上,中国特色社会主义采取在坚持马克思主义主流意识形态前提下保证文化多样性发展的体制。

坚持指导思想一元化、文化发展多样化,是中国特色社会主义在思想文化方面的基本特征。马克思主义是我们立党治国的指导思想,是全国各族人民团结奋斗的共同理论基础。反对和抵制指导思想的多元化,是中国特色社会主义在思想文化发展中必须坚持的一个重要原则。在坚持指导思想一元化的同时,要发展多样化的文化。人民的文化需要具有广泛性、多样性的特点。不断满足人民日益增长的多样性文化需要,是中国特色社会主义文化建设的一个立足点、着眼点。弘扬中华民族的优秀文化传统,发展民族的科学的大众的多样性文化,坚持“二为”方向和“双百”方针,繁荣文化艺术,构建社会主义核心价值体系,增强社会主义意识形态的吸引力和凝聚力,是中国特色社会主义文化建设的重要内容。

三、从实践上看,找到了一条实现现代化、实现中华民族伟大复兴的道路

中国特色社会主义实践是党在中国特色社会主义理论指引下领导人民开拓中国特色社会主义道路的实践活动及其成果的总称。这一实践始于1978年党的十一届三中全会。所谓中国特色社会主义的实践特征,就是中国特色社会主义实践形态的总体概括和外在表征。

在实践中,中国特色社会主义形成了顺应人类社会发展潮流、符合时展要求的新的发展格局。20世纪80年代以来,特别是伴随冷战结束和经济全球化的加速,中国发展面临的国际环境发生深刻变化;另一方面,国内经济社会发展和现代化进程进入新的历史阶段,中国共产党人深刻认识到这种变化及其引发的新的阶段性特征,逐步改变了中国社会主义的整体发展格局。

一是适时启动和加快对外开放进程,改变了过去的封闭发展格局,经济社会发展乃至整个社会主义建设出现了对外开放、全面融入经济全球化进程的全新格局。二是改变了过去平均主义的分配格局,让一部分人和一部分地区先富起来和先发展起来,形成了差异化、差序化的发展格局,整个社会的发展建立在分工、协作、竞争、专业化和社会化的基础之上,社会主义的发展因此建立在竞争和效率的基础之上。三是改变了过去经济部门和社会部门、公共部门和私人部门不分的格局,适时推动社会部门与公共部门的建设,整个社会开始呈现出公共部门与私人部门分野、经济领域效率提高、社会领域迅速发展并开始承担社会整合和维护社会公平职能的局面。四是逐渐从外延式、粗放式发展向内涵式、集约式发展转变,经济发展开始更多地依赖于技术进步和劳动生产率的提高。

以中国特色社会主义理论为依托,结合考察中国特色社会主义的实践历程,我们就能清晰地发现中国特色社会主义的实践特征。

第一,科学性特征

中国特色社会主义的实践历程是一个理论与实际相统一的过程,它既坚持了科学社会主义的基本原则,又根据我国实际赋予其鲜明的中国特色,具有浓郁的科学性,这是中国特色社会主义最根本的实践特征。

首先,坚持科学社会主义的基本原则。马克思主义本身是科学的。坚持马克思主义基本原则的关键在于坚持马克思无产阶级和全人类解放的基本价值取向和坚持马克思主义的世界观、方法论及由此而来的立场、观点、方法和科学精神。在中国特色社会主义实践中,我党始终坚持代表中国最广大人民群众的根本利益,中国特色社会主义的发展就是要做到“发展为了人民、发展依靠人民、发展成果由人民共享。”发展中国特色社会主义,坚持了马克思主义基本价值取向,从根本上保证了中国特色社会主义的科学性。

其次,立足现实建设中国特色的社会主义,这是中国特色社会主义实践科学性特征的重要标志。邓小平认为,“真正的马克思列主义者必须根据现在的情况,认识、继承和发展马克思列宁主义。”[ 3 ]对于中国特色社会主义的客观现实条件,邓小平有过精辟的论述:“我们党的十三大要阐述中国社会主义是处在一个什么阶段,就是处在初级阶段,是初级阶段的社会主义。社会义本身是共产主义的初级阶段,而我们中国又处在社会主义的初级阶段,就是不发达的阶段。一切都要从这个实际出发,据这个实际来制订规划。”[ 4 ]建立在这一科学的认识基础上,邓小平提出了社会主义初级阶段论和经济建设中心论,从而把中国特色社会主义置于一个现实的基础上,明确了奋斗的方向和任务,使我们对社会主义的认识得到了升华。

再次,在发展步骤和发展规划方面,坚决纠正了战略目标超越历史阶段的急性病和战略措施不按经济规律办事的政治化的失误,坚持战略目标的现实可能性与战略措施的可行性的统一。邓小平根据我国社会主义初级阶段的国情,参照世界上其他国家和民族实现现代化的经验,精心设计了中国特色社会主义道路的战略目标以及实现战略目标的战略步骤。提出用100年左右的时间基本实现现代化、把我国建设成为中等发达国家的战略目标。为了保证战略目标的实现,邓小平提出了循序渐进的“三步走”的战略步骤。实践证明,这是完全正确的。

第二,开放性特征

正如胡锦涛同志所说,新时期最鲜明的特点是改革开放。中国特色社会主义实践的科学性决定了它也必然是开放性的,开放性是中国特色社会主义的重要实践特征。

首先,中国特色社会主义实践是融入世界发展中的,本身已成为世界的一部分,它既是世界社会主义运动的一部分,也是世界发展的一部分。

其次,从内容上看,中国特色社会主义实践十分注重对各国经验、模式、手段的借鉴与吸收。在分清社会主义本质与社会主义实现手段基础上,邓小平指出:“我们要向资本主义发达国学习先进的科学、技术、经营管理方法以及其他一切对我们有益的知识⋯⋯闭关自守、故步自封是愚蠢的。”[ 5 ]

第三,渐进性特征

中国特色社会主义的实践是在探索和不断深化认识的过程中得以前进的,它是一个与时俱进的过程,渐进性正是中国特色社会主义实践历史性表征的概括。

首先,中国特色社会主义实践是循序渐进的。中国特色社会主义实践,是一个逐渐加深对“三大规律”认识的过程,是一个在摸索中前进、巩固中提高的过程,具有内在的逻辑发展理路。邓小平说:“社会主义是一个历史发展过程,我们现在处在社会主义的初级阶段,消灭剥削,消除两极分化的问题,什么时候突出地提出和解决这个问题,在什么基础上提出和解决这个问题要研究。”[ 6 ]这实际上就是他对中国特色社会主义实践的循序渐进性的深刻理解。

再次,中国特色社会主义实践是循序渐进的。中国特色社会主义实践是一个不断发展、不断创新的过程,既有量的变化,也有质的飞跃,既有形式的改变,也有内容的更新。

第四,全面性特征

按照历史唯物主义观点,人的全面发展,一定意义上就是人的社会关系的全面发展。不断培育、完善和优化人的社会关系,客观要求我们坚持以人为本的理念,全面贯彻落实科学发展观,按照“四位一体”的总体布局建设中国特色社会主义。因此,实施“四位一体”的总体布局,既是实现人的全面发展的必要条件,又是人的全面发展的历史的具体的标志,也是中国特色社会主义实践全面性的发展特征。

对于中国特色社会主义建设的整体布局,邓小平提出“两个文明都搞好了,才是有中国特色的社会主义”,江泽民提出了“物质文明、政治文明和精神文明三位一体的社会主义建设理论”,而胡锦涛同志在上述基础上发展为经济建设、政治建设、文化建设和社会建设“四位一体”全面发展的中国特色社会主义实践结构。这一探索过程,正是中国特色社会主义实践追求全面性特征的充分体现。

综上所述,中国特色社会主义本质上是在马克思主义的指导下,走自己的路。这条道路的基本轨迹就是从照搬“苏联模式”到走出“中国特色”。可见,只有真正弄懂中国特色社会主义的创新性,才能真正高举这面当代中国进步发展的旗帜。

参考文献:

[ 1 ]《毛泽东选集》第二卷[M ]. 北京: 人民出版社,1991: 534.

[ 2 ]《马克思恩格斯选集》第四卷[M ]. 北京:人民出版社, 1995: 681.

[ 3 ]《邓小平文选》第三卷[M ]. 北京: 人民出版社,1993: 291.

[ 4 ]《邓小平文选》第三卷[M ]. 北京: 人民出版社,1993: 252.

人文主义的基本特征范文第3篇

关键词: 浅层语义分析 语义角色标注资源 语义角色标注

引言

语义角色的自动标注是对句子中谓词所支配的语义角色进行自动标注,是对句子进行浅层语义分析的一种方法。语义角色标注技术在大规模语义知识库的构建、问答系统、机器翻译和信息抽取等领域都有着广泛的应用,其深入的研究对自然语言处理技术的整体发展有着重要意义。下面主要从三个方面来介绍中文语义角色标注研究状况:首先,介绍相关的中文语义角色标注语料资源;其次,描述了中文语义角色标注的发展现状;最后,对中文语义角色标注未来的工作进行展望。

1.中文语义角色标注语料资源

语义角色标注离不开语料资源的支持。英语较为知名的语义角色标注资源有FrameNet、PropBank和NomBank等。中文语义角色标注语料资源主要是从英语语义角色标注语料资源的基础上发展起来或参照其建设的。

Chinese Proposition Bank(CPB)同英文PropBank基本类似。在CPB中,总共定义了20多个角色,只对每个句子中的核心动词进行了标注,所有动词的主要角色最多有6个,均以Arg0~Arg5和ArgM为标记,其中核心的语义角色为Arg0~5六种,其余为附加语义角色,用前缀ArgM表示,后面跟一些附加标记来表示这些参数的语义类别。它几乎对Penn Chinese Treebank中的每个动词及其语义角色进行了标注,国内大多数语义角色标注研究都是基于此资源。

中文Nombank是在英文命题库(Proposition Bank)和Nombank的标注框架上进行扩展,对中文名词性谓词的标注。中文Nombank加入了语义角色层的标注信息,与CPB一样,也标注了核心语义角色和附加语义角色这两类语义角色。中文NomBank中的角色位置有两类情况:一是角色在以名词性谓词为核心词的名词短语中;二是当以名词性谓词为核心词的名词短语作支持动词的宾语时,允许语义角色在名词短语外。

山西大学构建的Chinese FrameNet是基于框架语义理论,类似FrameNet风格的中文词典。它描述了框架元素的详细句法信息和词汇单元以及参与者框架元素之间的关系。Chinese FrameNet的架构和英文FrameNet相似,并且有许多只是稍作修改直接对英文FrameNet进行翻译,但也有一些创新,增加了相应语义角色的汉语名称。目前Chinese FrameNet已经有130多个汉语框架,还在不断补充。

台湾中研院陈凤仪建立了中文句结构树资料库(Sinica Treebank)。Sinica Treebank是一个包含语义标记和句法标记的混合语料库。它的基本框架是以讯息为本的格位语法,主要是对小句进行标注。目前己标注了61 087个句子,包含了361 834个词语。语义角色标记共有50多个,基本沿袭了格语法的标记体系,如受益格、感受格等。

北京大学袁毓林教授组织建设的中文网库,是在北大汉语句法分析树库的基础上进行语义标注的,有着更为细致的语义角色设置,尤其是核心论元,分别在主体论元和客体论元内部各划分出五个子类。具体如下:(一)必有论元:A主体论元:施事、感事、经事、致事、主事;B客体论元:受事、与事、对象、系事。(二)非必有论元:A凭借论元:工具、材料、方式、原因、目的;B环境论元:时间、处所、源点、终点、路径、范围、量幅。

董振东主持建立的知网(HowNet)是一个常识知识库,描述对象为汉语和英语的词语所代表的概念,揭示了概念与概念之间以及概念所具有的属性之间的关系。《知网》描述了多种类型的词汇语义关系,涉及了词汇语义的各个方面,着重描述了不同词性的词语所代表的概念之间的语义关系,其别重视名词所代表的概念与动词所代表的概念之间的语义关系,也即我们通常称作实体与事件之间的语义关系即语义角色关系,例如作为实体的“医生”和作为事件的“医治”,两者有着“事件”与“施事”的关系。在知网中,800个事件主要特征中的每一个都标识有一个角色框架。

2.中文语义角色标注的发展现状

2.1语义角色标注的研究最早关注的是英文,随着宾州大学命题库的建立,语义角色标注任务得到广泛的国际关注,并取得了许多很好的结果。出现了一些相关的国际评测,如CoNLL2004、CoNLL2005、EMNLP-CoNLL2007和CoNLL2008都包含了语义角色标注的任务,同时也促进了语义角色标注研究的蓬勃发展。

2.2中文语义角色标注的工作开展较晚,最早进行研究的是Sun等人,当时因为还没有中文方面的专门语料,所以他们只能先人工标记了包含某些动词的语料然后在此基础上进行研究。后来,伴随着Chinese Proposition Bank(CPB)的构建,就有了一些比较系统的中文语义角色标注的工作。国内最早关注语义角色标注是刘挺、于江德等人,不过他们研究的重点是提升英文的语义角色标注的性能。

2.3语料资源和中文自动句法分析的不理想等因素使得国内中文语义角色标注的研究还局限在语义角色分类方面,完整的语义角色标注研究还不多见。虽然与英文方面的工作相比,中文语义角色标注方面的研究仍处在开始阶段,但该项工作已引起了许多研究人员的重视。国内的研究工作主要集中在以下四大高校。

北京大学关于语义角色标注的工作主要集中在两个方面:一是基于语义组块分析和词汇语义特征的语义角色标注;二是利用北大网库的标注语料进行语义角色标注的研究。丁伟伟[1]提出了一种基于语义组块分析的语义角色标注的处理策略。该方法将中文语义角色标注从一个节点的分类问题转化为序列标注问题,是一种简化的“语义组块识别——语义组块分类”流程,而不是传统的“句法分析——语义角色识别——语义角色分类”的流程。由于避开了句法分析这个阶段,使得语义角色标注摆脱了对句法分析的依赖,从而突破了汉语语法分析器的性能限制。北大网库构建了一种全新的语义角色标注资源,改变了以往无论中英文研究都基于宾州大学命题库的标注体系的局面。文献[2]的主要目的是将之前的各种研究方法在北大网库的标注语料中进行验证,考察它们在北大网库标注体系中的作用,进而讨论特征的选择对标注体系的依赖性问题,这种在北大网库基础上建立的语义角色分类系统,在语义角色分类阶段取得与在PropBank上相当的实验结果。

哈尔滨工业大学主要贡献是在不断优化特征和特征组合的基础上,进行不同方法的实验。文献[3]把汉语的特点与英文语义角色标注特征相结合,构建出一些新的特征和组合特征,如谓词和短语类型的组合、谓语动词类别信息和路径的组合等,并在CPB语料数据上使用最大熵分类器进行了实验。文献[4]以CPB为实验数据,首次将核方法应用于汉语语义角色标注中,通过对已有特征进行组合或分解,提取了更适用于汉语的新特征,得到了接近英文语义角色标注的性能。文献[5]提出一种基于特征组合和支持向量机的语义角色标注方法。该方法的基本标注单元是句法成分,基本特征集合是从当前基于句法分析的语义角色标注系统中选出高效特征,然后选择基于统计的特征组合方法,利用支持向量机在CPB语料上进行分类实验。

苏州大学的研究重点在两个方面:一是名词性谓词语义角色标注,二是以依存关系为标注单元进行语义角色标注。文献[6]和[7]讨论了汉语名词性谓词的语义角色标注特征问题。通过对名词性谓词语义角色标注的研究,探索了新的词汇、句法特征,选取了适合名词性谓词相关的特征集,用于名词性谓词语义角色标注,同时进一步利用动词性谓词已有的成果,极大地提高了名词性谓词语义角色标注的性能。文献[8]提出标注单元为依存关系的语义角色标注系统,经过依存关系分析、谓词标识、特征抽取、角色识别和角色分类,最终在CoNLL2008 SRL Shared Task自动依存分析的WSJ测试集取得了较好的结果,结果证明其性能明显好于基于句法分析的SRL。

山西大学的工作主要是在汉语框架语义知识库(CFN)语料库上进行,文献[9]基于汉语框架语义知识库(CFN),采用条件随机场模型,将语义角色标注问题通过IOB策略转化为以词为基本标注单元的线性序列标注问题,研究了汉语框架语义角色的自动标注。模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征。从CFN的219个框架中,挑选那些例句个数相对较多的25个框架的6 692个例句的语料上进行。对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证。

其他还有南师大的陈丽江[10]利用清华大学的中文树库(TCT),通过梅家驹等人编纂的《同义词词林》对谓词、名词进行划分,建立了谓词词表、名词词表和介词词表等来区分语义角色。在标注过程中使用规则确定谓词论元,使用规则和词表判定成分的语义角色,基于决策树分类的算法,对汉语真实文本的语义角色标注进行了实验。

3.展望

可以说,对中文语义角色标注的研究还任重而道远,下一步需要进行的研究工作还很多,集中表现在如下三个大的方面:

3.1成熟的语义理论。语义角色标注属于语义分析的范畴,离不开语义理论的支持。语义角色标注需要语义角色相关理论、语义分类体系、词汇语义等知识。目前,汉语语义这些相关理论都还不是很成熟。因此,建立合理有效的语义分类体系,系统地总结语法与语义之间的对应关系,是取得突破的关键。

3.2资源库建设。语料库和知识库是自然语言处理的两大基础性工程,语料库是对真实语言现象的收集,知识库是对语言知识的系统性总结,它们对自然语言处理的质量起着关键性的作用。由于语言现象与语言知识的复杂性,语料库和知识库都十分庞大,一般都需要耗费十年乃至数十年的时间来构建。今后计算语言学工作开展的重点之一就是建立语义层次上的语料库和知识库。

3.3改进分析方法。自然语言分析处理的方法包括基于规则的方法和基于统计的方法。这两种方法同样也适用于语义角色标注。如何选择合适的方法,如何将这两种方法有机地结合起来,对语义角色标注任务是至关重要的。而且,无论是基于规则的方法,还是基于统计的方法,它们所采用的技术,以及得到的准确性和效率也同语义角色标注的准确性和实用性相关,这些也需要不断地研究与改进。

参考文献:

[1]丁伟伟,常宝宝.基于语义组块分析的汉语语义角色标注[J].中文信息学报,2009.9,VOL23(5).

[2]杨敏,常宝宝.基于北京大学中文网库的语义角色分类[J].中文信息学报,2011.3,VOL25(2).

[3]刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007.1,VOL21(1).

[4]车万翔.基于核方法的语义角色标注研究[D].哈尔滨:哈尔滨工业大学,2008.

[5]李世奇,赵铁军,李晗静,刘鹏远,刘水.基于特征组合的中文语义角色标注[J].软件学报,2011,22(2):222-232.

[6]李军辉,周国栋,朱巧明,钱培德.中文名词性谓词语义角色标注[J].软件学报,2011,22(8).

[7]徐靖,李军辉,朱巧明,李培峰.中文名词性谓词语义角色标注的特征研究[J].计算机应用,2011.6,VOL31(6).

[8]汪红林,王红玲,周国栋.基于依存关系的语义角色标注[J].计算机工程,2009.8,VOL35(15).

人文主义的基本特征范文第4篇

根据我们对文化价值观的理解,科学主义的一般特征应当在三个层面上展开:第一,价值特征,即对某一文化形式或要素的认定。在其极端形态上它包含两个相关的方面:肯定特征与否定特征。以科学主义而言,肯定特征是对科学这一文化形式的完全认定乃至崇拜;否定特征则是对其它非科学文化形式,主要是人文方面的文化形式的贬抑和排斥。第二,认识特征,即对围绕价值认定的对象所进行的描述和合理性说明。科学主义在这方面也包含两个相关的方面:自身说明与关系说明。前者是对科学这一文化形式自身价值的绝对性描述和论证;后者是对科学文化与其它文化形式的关系描述与说明。第三,功能特征,即尚未现实化了的功用特性。按照大文化结构的概念,它应当有精神文化功能、社会的调节功能和器用。下面,我们按照这一解释框架对科学主义的一般特征作出初步的描述。

1、科学主义是关于科学的一种崇拜

科学主义的价值特征从肯定方面来说是科学崇拜。如R·G欧文所说,科学主义“使科学被认为是全知全能的人类救世主而逐渐受到崇拜”。或者径直而言,科学崇拜就是声称所有的问题都能被科学所解决,直至能检验精神价值和自由问题。韦莫斯说:“唯科学主义一词,……其意义可以理解为一种信仰,这种信仰认为只有现代意义上的科学和由现代科学家描述的科学方法,才是获得那种能应用于任何现实的知识的唯一手段。”所以,科学主义是一种价值认定的极端形态,这种极端形态使得科学神圣化,从而由一种自然知识的体系上升为一种神学信仰似的东西。因为这一点,科学主义与中世纪的宗教神学精神有了某种相通之处。如果说中世纪宗教神学认为上帝是全知全能的,则科学主义就认为科学是全知全能的;如果说宗教神学对上帝的崇拜是对一种精神范畴的崇拜,则科学主义对科学的崇拜就是对一种特殊文化形式的崇拜。不管科学与上帝是多么的不同,科学主义与宗教神学的共同之处是把人类的某种文化产物奉之为神明,使之成为高于人类的救星。就这一点也可以说,科学主义是新的历史文化条件下带有宗教神学态度的一种文化思潮。

2、科学主义是人文主义的对立形式

从价值特征的否定方面看,科学主义是作为人文主义的对立形式而存在的。科学主义对科学的理解是排斥人文因素的。科学主义的典型形式,如逻辑实证主义认为科学是真命题的集合,是不包含错误的,因而它否认科学的人性特征。科学主义推崇科学的认识方法而贬斥人文的方法,如历史的、心理学的、社会学的方法,实际取消了人文方法的地位和它与科学方法的互补作用。科学主义竭力把人的情感、意志等精神因素以及人本身排除在外,从而造成了科学理性与人文精神的分裂,使得科学与人文精神处于对立的两极。

科学主义与人文主义的尖锐对立还集中表现在人与科学的价值关系上。按照人文主义的观点,科学主义对科学的崇拜实际是人的一种异化。因为科学是人认识与改造世界的产物,它是属人的、为了人的并且服务于人的。如果我们把它看得高于人本身,对人的这一创造物顶礼膜拜,反过来受其统治,我们就走向了反面,导致自身的异化。这种情形,是把人作为价值中心的人文主义所不能容忍的。

3、科学主义是一种绝对的科学观

科学主义是把科学绝对化的产物,把科学这种人类的特定认识形式凝固化了。由于作了凝固化处理,本来是历史性的东西,现在则丧失了历史性;本来是人的创造物,与人的实践密不可分,现在则远离人本身,成为一种绝对本体。

科学主义对科学的绝对化主要表现在:

——科学定律是绝对正确的。构成科学具体内容的是真命题。科学就是真命题的集合,它不包括任何假的或错误的命题。因此,科学是掺不得一点假的。如果说科学有发展的话,也只是真命题、真子集的量的增加,而不是真与假、正确与错误的某种辩证运动。科学就是真理的化身,是它的表现形式。这是科学内容的绝对化。

——科学方法是绝对有效的,存在着通向真理的绝对可靠的途径。在某种意义上,科学内容的绝对真理性是由科学方法的绝对有效性予以保证的。如果不存在一条通向真理的绝对可靠的途径,科学的绝对内容就不能获取。不论是归纳主义,还是演绎主义,抑或是批判理性主义,都企图找到一种绝对可靠的认识途径。为了保证认识方法的绝对有效性,他们也都认为科学的认识方法是统一的、规范的,如同他们所认识的科学内容是统一、规范的一样。近现代科学主义的主流是规范主义的。

——存在着绝对的科学本体。绝对科学本体存在的基本条件是科学与非科学之间存在着截然分明的绝对界限。这条界限恰似一条鸿沟保证了科学的绝对纯洁性,使它免于被非科学所污染。这一点对于科学主义是至关重要的。如果科学与非科学之间存在哪怕是微乎其微的一点模糊之处,科学本体就丧失了它的绝对存在,科学的至高无上性与神圣地位就无法得到根本的保证。长期以来,科学主义的理论家们所以竭尽才智围绕科学划界问题连篇累牍地大做文章,根源在此。

——科学的社会作用是应当绝对肯定的。近现代以来人们对科学的社会功能与实际效用是肯定的。科学主义者比通常人们走得更远,他们认为科学对于社会、对于人类只有正面效应而不存在负面效应。他们对科学社会作用的理解是一重性的而不是两重性的。他们不认为科学这种文化形式除了它的巨大社会进步作用外,还可能有历史局限的一面,还可能有在一定条件下对社会产生负面效应的一面。他们截然拒绝接受这一可能性。

所以,对科学内容、科学方法、科学划界以及科学社会作用的绝对化理解,构成了科学主义的绝对科学观。

4、科学主义是一种片面的文化观

什么是文化?按照科学主义的理解,文化的基本目标是求真而不是求善求美;文化的基本内容是科学而不是其它学科;文化的基本结构是逻辑加经验而不应该包含其它基本要素;文化的基本方法是科学方法而非人文等学科的方法。总之,把文化归结为科学,把科学归结为逻辑加经验,把善和美的范畴归结为真的范畴,这是科学文化观的片面性所在。按照科学主义的理解,唯有科学才能称得上是真正的文化,才有资格进入神圣的文化殿堂。而其它文化形式无此地位,不堪佩以文化的绶带。这实质是一种科学文化的单一论与其它文化形式的取消论。

科学主义片面文化观还有其人本学方面的认识根源。文化,是人特有的生存和发展方式,对人的理解直接影响到对文化的理解。科学主义基于其特定时期的自然科学背景(牛顿力学),它把人理解为一种机器,因而不可避免地把人的存在方式——文化理解为一种机器的原理,即某种特定历史条件下的自然科学。

5、科学主义在精神文化方面的功能表现为科学基础主义

在科学主义看来,科学是其它一切文化形式的基础;在其极端形态上,科学主义甚至企图同化或消解其它文化形式,使其科学化或使其在文化领域丧失其独立性。所以,从文化功能的角度看,科学主义是一种科学基础主义。

科学基础主义有不同的表现形式或实现途径。一种是把科学本身的有限原则直接运用于一切文化领域,使它成为文化领域的公理,从而使科学成为一切文化形式的基础。例如,牛顿力学体系问世后,首先出现了将牛顿力学的原则推广到其它科学领域的倾向,继而它又被推广到社会学领域,此后几乎成为其它一切文化学科的基础或模式。另一种是从科学中先概括出一般方法,然后以此为标准对其它文化形式进行重新建构,使它们获得某种科学的形态。逻辑经验主义以及某些结构主义者所做的工作就是这样一种类型。这两类都属于科学化的工作,只是后者比前者更具有典型特征而已。

6、科学主义在社会功能方面表现为科学一元主义

科学主义认为,科学是调节和改善社会关系的唯一正确有效的指导思想。科学主义者甚至以物理学为模式提出了社会动力学与社会静力学,用以重新架构整个社会关系。在历史观方面,科学主义认为科学是唯一对历史发展起根本作用的因素。以此为基础,他们把历史观归结为科学,归结为一种物性的机械法则,而将历史观中属人的一面、与人的特性有关的一面排除出去。甚至在对马克思主义历史观的理解方面,科学主义也按己所需力图把马克思思想中所有人道的因素排除出去,而仅仅保留所谓科学的因素。在这种科学一元主义影响下,活生生的人的世界似乎变成了冷冰冰的物的世界,人的社会似乎变成了物的机械性的社会。

科学主义社会功能的另一表现是社会器用层面的单一价值取向。这种取向对于科学技术的进展与生产力的发展当然有一定的推动作用,但它也毫无疑问地具坌某种负面的功能。它不仅使人变得如同马尔库塞所说是一种单向度追求的人,而且尤其使社会环境变得极为不平衡,甚至是一种分裂、对立的状态。科学技术迅速地外化为造福于人的工具器用,使得社会的科技环境迅速地膨胀。与此同时,社会的人文环境却引人注目地相对萎缩。至于社会的生态环境则严重地受到损害而急剧地恶化,成为当代和下一世纪人类面临的突出问题。

二、关于科学主义一般特征的初步评析

首先看科学主义的价值特征。一方面,科学主义在价值特征上具有某种合理性,另一方面从根本点来说它又是不合理的。从合理的方面说,科学主义对科学的态度有可取之处。19世纪和20世纪毕竟是科学的世纪,科学主义对科学的倾向性具有某种历史的根据。同时,人类文化的活动就总体而言是在主体—客体的结构中进行的,它总是可能有不同的方向。它可能沿着经验的方向向外超越,体现为客体性的文化内容,形成对科学的倾向态度;也可能沿着超验的方向向内超越,体现为主体自身的文化内容,形成对人文学科的倾向态度。当然也可能是两者彼此结合,这或许是人类文化发展的希望所在。但不管怎么说,科学倾向在特定的条件下和一定的范围内确实在文化本体的结构里有自己存在的某种理由。历史地看,科学主义对科学的倾向性不管其程度如何,在其早期阶段对科学这类文化现象的滋长蔓延确实起了推动作用。任何一种“文化热”,都与某种倾向或偏好有关。“科学热”在一定的历史时期无疑具有积极的意义。它的另外一个积极作用在于,通过它的价值驱动,科学日益外在化,分化为某种独立物。这是科学发展必经的一个历史阶段,也是需要给予某种肯定的。但是,我们毕竟看到科学主义在根本点上站不住脚。科学成为一种被崇拜物,从服务于人的工具成为似乎高于人的统治者,从而产生了某种异化现象,使科学的价值走向反面,这是科学主义由对科学价值肯定的极端化而导致的对科学价值的否定。它提醒人们,对任何一种文化形式的价值评价都应以人类主体为根据,人类不应当对自己的任何一种文化形式取崇拜的态度。正是基于这种反思,现实生活中出现了下述的逆转:在人与科学的关系方面,重心开始摆向人本身;科学开始寻找自己的目的——以人为归宿;科学也开始意识到人文主义对自身的制约,意识到科学作为工具理性应当置于人的需求这一目标之下。科学的内容愈来愈带有人的色彩,成为属人世界的一部分。科学的人性特征日益显示出来。科学不再仅仅是客体性的积淀,主体性也被视为它的内在特性的有机构成之一。科学的外在性正在被扬弃,显示了它向人文精神的某种复归。这种情形本身就是对科学主义价值特性不合理性的批判,同时也表现出在人类文化创造的实践中主体与客体走向统一的某种趋势。

另一方面,科学主义把人类文化总价值全部赋予科学,这种以偏代全的文化态度是对人文学科乃至人文精神的贬斥,是以否定人类总体文化的存在为出发点和目标的。这使它自身走向反面,成为具有某种反文化特性的思潮。它在客观上遏制人文学科的发展,使人类文化成为一种跛足的文化。由此也限制了科学自身的发展,堵塞了它走向未来的道路。现实生活中由于重理轻文而导致了人文萎缩、灵魂空虚已经强烈地使人感到文化创造失却了它的原动力。这决不仅仅是人文学科的危机,而是包括科学文化在内的整个文化的危机。

其次,我们对科学主义的认识特征作一些分析。科学主义关于科学的价值论证是多方面的,而集中起来看主要是关于科学自身合理性和科学与其它文化形式关系的合理性说明。在这种说明中,科学主义的思想家们关于科学的结构、方法、语言等方面的研究,都不无合理的建树。某些研究之精致独到,令人刮目相看。这些,对科学的研究和发展起到了有益的作用。我们今天从事科学观的研究,对这些成果也不能绕道而行。尽管如此,科学主义由于在认识特征上的绝对化而使自己陷入困境。这可以从两方面看。一方面,绝对化使科学作为一种文化形式所特有的属性丧失,科学的知性特征被淹没了。另一方面,绝对化又使人们关于科学文化地位的认识极度扭曲,似乎科学不再是人类文化园林中的一员,从而失却自己的归属。

在实证科学兴起的早期,一些科学思想家关于科学的认识还没有被绝对化。随着科学主义的形成和成熟,这种情形发生了变化。科学认识理论的研究虽然更加精致化,形成了专门学科并包含了许多具体的合理内容,但科学的性质、内容和方法被绝对化了。科学好象达到了绝对本体,不再是一种知性的文化形式。这种文化本性的丧失,是科学主义认识特征的致命之处。正因为此,它受到了人们愈来愈多的批评,而最大的挑战则是来自科学本身的发展。二十世纪科学的进展愈来愈显示出科学相对性的一面。科学主义的价值论证因而失却了自己的依恃,陷入了某种无可奈何花落去的境地。科学不顾科学主义的反对似乎又回到了知性的地盘上,表现了某种回归。与此相应的是,科学的文化地位也重新为人们所审视。人们注意到,科学可能并不象科学主义所预期的那样,是唯一具有终极意义的文化形式,科学只是整个世界过程集合体的一部分,并非至高无上的。科学,不应当以否定其它文化形式的价值为前提来确定自己的价值和地位;相反,它应当在人类总体文化的范围内,在与其它文化的整合关系中确定自己的位置。人类的文化园林可能不象科学主义描绘的那样是科学一枝独秀,而应当是百花齐放。

最后,简要提一下科学主义的精神文化功能与社会功能。科学主义的精神文化功能与社会功能是科学主义价值特征和认识特征的逻辑延伸。文化关系中的科学基础主义与社会环境中的科学一元主义无非是科学崇拜与绝对科学观的文化表达和社会表达。从理论方面说,前面对科学主义价值特征与认识特征的评析已经包容了这两种特征的本质说明。至于这两种功能的具体评析,譬如科学基础主义的实现机制和科学一元主义的社会评价,则需专文作述,非本文所能纳涵。但它们根本的价值立足点与认识支点,应当说已经清楚。

总起来看,科学主义在走向世纪末的时候,似乎已江河日下,远非世纪初时的那般雄心勃勃。当代对科学主义文化思潮的激烈批评以及同时而起的新人文主义思潮,预示着人类文化方向的某种调整。长远地看,这种调整预示着新的更高类型文化的到来。人类将通过对原有文化思潮的批评,通过对科学文化的反思,特别是通过不断的文化创造实践为自己寻得一条文化新路。实际上我们已经看到,旧有的文化格局正在发生变化,新的文化类型正在旧文化类型的化解和调整中孕育而出。正是有了这样一种展望,我们说对科学主义一般特征的评析就不仅可能有助于我们深化对科学主义的批判性认识,而且可能有助于我们对新文化的选择与构建。

部分参考文献

①郭颖颖《中国现代思想中的唯科学主义》,雷颐译,江苏人民出版社1989年版

②约翰·洛西《科学哲学历史导论》,华中工学院出版社1982年版

③M·怀特《分析的时代》,商务印书馆1982年版

④艾耶尔《二十世纪哲学》,李步楼等译,上海译文出版社1982年版

⑤A.J.Ayer,"Language,TruthAndLogic",PublishedbyPelicanBooks,1987

⑥洪谦主编《逻辑经验主义》(上卷),商务印书馆1982年版

⑦江天骥《当代西方科学哲学》,中国社会科学出版社1984年版

⑧赖欣巴赫《科学哲学的兴起》,商务印书馆1983年版

⑨江天骥《科学理论的评价问题》,涂纪亮主编《分析哲学》,上海人民出版社1988年版

人文主义的基本特征范文第5篇

关键词:基于内容检索;媒体语义;特征分析;平台

media semantic feature analysis platform supporting content-based retrieval

xie yu-xiang1,luan xi-dao 1,2,wu ling-da1,chen dan-wen1,deng li-qiong1

(1.college of information system & management, national university of defense technology, changsha 410073, china;2.dept. of information & computing science, changsha university, changsha 410003, china)

abstract:on the demand of content-based retrieval, this paper introduced a media semantic feature analysis platform supporting content-based retrieval.it investigated some key techniques, such as digital media semantic object extraction and retrieval,classification and annotation,and semantic association analysis,etc.it also illustrated the implementation scheme about the platform in detail, and then realized the platform.

key words:content-based retrieval; media semantic; feature analysis; platform

0 引言

随着信息技术的发展和应用,图像、音频、视频等数字媒体信息呈现出海量增长的趋势。wwW.133229.coM如何根据用户的应用需求,从海量信息中快速找到用户感兴趣的信息,是目前信息领域迫切需要解决的重要问题之一。解决这类问题的基本方法是:根据用户的应用需求从海量数字媒体信息中提取出相应的媒体特征,并对这些特征进行合理有效的组织和管理,进而根据特征实现对用户感兴趣信息的基于内容检索,其中媒体特征的有效提取和组织是实现基于内容检索的关键问题之一。目前媒体特征的提取和组织,研究较多且相对成熟的是对媒体底层特征(如图像的颜色、形状等)的提取和利用。媒体特征提取和组织的新的研究前沿是,关注媒体的高层特征(如事件、人物、时间、地点等语义信息),通过分析提取媒体语义特征,同时通过建立不同类型媒体之间的语义关联,实现相对快速、高效的基于内容的检索。

目前,国外经典的多媒体信息处理系统包括:美国加州大学圣迭戈分校研究开发的信息透镜infoscope项目、ibm艾玛登(almaden)研究中心开发的qbic系统、美国哥伦比亚大学电子工程系和电信研究中心研究的visualseek与webseek、virage公司的vir图像工程系统、excalibur公司的excalibur视觉检索产品、普林斯顿大学研究的caeti iml系统、mit媒体实验室研究的photobook系统、意大利巴勒莫大学研究的jacob系统等。这些系统都具备依据媒体底层物理特征进行基于内容检索的能力[1]。近年来,国内外研究机构对于多媒体信息处理技术的研究已经由底层特征向高层语义转变,研究重心开始集中于多媒体语义对象提取与检索、多媒体数据自动分类与标注、关联分析、组织与表现等方面。

卡内基梅隆大学在数字图书馆项目第二阶段informedia-ⅱ[2,3]研究中,将单个视频文件的摘要技术扩展到多个视频文件的摘要及视频数据库信息可视化研究。主要研究能够自动探测和识别特定语义实体和视觉特性的技术,例如:视频中出现的特定人物、特定事件的具体场景镜头等,通过语义实体与视觉特性的分析,能够有效提取并分类信息,更加易于分析和发现有内在联系的个体动作、群组活动与事件。此外,爱尔兰都柏林城市大学开发的fishclar系统[4]也具有重要的影响力,该系统通过对新闻视频进行镜头探测、故事单元分割等处理,结合闭路字幕信息,实现了对新闻视频的管理和检索等应用。

国内清华大学、微软亚洲研究院、北京大学、国防科技大学、

其研究的主要内容是:a)数字媒体的分析处理技术,主要研究数字媒体特征选择、数字媒体特征描述和提取、数字媒体语义提取和标注、数字媒体数据的分类等;b)基于内容的媒体信息关联分析技术,主要研究语义事件和语义对象的关联分析、事件探测与跟踪技术、事件之间的关联分析等;c)基于内容的数字媒体检索技术,主要研究高维数据索引技术、交互式检索技术、基于语义的检索技术等;d)数字媒体数据的组织和表现技术,主要研究数字媒体数据的统一表示模型、数字媒体数据的表现技术。

本研究的目标是:以媒体信息服务的应用需求为牵引,着眼于对数字媒体语义特征分析的前沿问题进行探索研究,重点突破数字媒体语义对象提取与检索、分类与标注和语义关联分析等关键技术,提出以数字媒体语义分析为基础的高效的基于内容的检索方法;实现一个以基于内容检索应用为目标的媒体语义特征分析平台,并为军事等领域中的情报综合分析应用提供多媒体信息智能检索和个性化表现等服务的示范应用。

1 实施方案

本研究主要围绕建立支持基于内容检索的数字媒体语义特征分析平台展开研究,带动相关关键技术的研究。支持基于内容检索的数字媒体语义特征分析平台由数字媒体语义特征分析平台、数字媒体信息服务系统以及媒体信息数据库三个部分组成。平台的体系结构如图1所示。其中,数字媒体语义特征分析平台包括媒体语义模型、媒体特征提取、媒体语义提取、媒体分类与标注等模块;数字媒体信息服务系统包括数据组织与表现服务以及智能检索服务两大模块;媒体信息数据库由媒体库、特征库、语义信息库、索引库、模型库等组成。解决的关键技术已经集成在该平台的各个子模块中。

1.1 数字媒体信息处理子系统

数字媒体信息处理子系统是整个系统的基础,为最终的检索服务和组织与表现服务提供必需的信息。它在数字媒体信息收集工作的基础上完成媒体特征的选择、媒体特征的描述和提取、媒体数据的分类、媒体语义的提取和标注、关联分析等。

1)数字媒体底层特征提取与表示 根据语义提取和分类的需要,结合相应的领域知识,从各种数字媒体数据中提取多种有效的底层特征,同时通过分析特征之间信息的冗余性来找出更加简洁有效的底层特征,并采用统一的表示方式来进行描述。

2)数字媒体语义提取与标注 数字媒体语义的提取主要侧重于研究视频中对象语义的提取与标注技术,主要从三个方面来进行研究:

a)新闻视频中重要人物的提取与标注。由于在新闻视频中人们往往最关注的是一些重要人物,这里的重要人物主要指那些出现了特写镜头并且有一段讲话的人物,他们的出现往往与一些重要的新闻事件相关联,通过对重要人物的提取与标注能够极大地方便用户最终查询相应的人物和事件[9]。主要通过综合视频的多模态特征来提取出新闻视频中的这些重要人物,并用他们的名字来进行标注。具体来说分为三个步骤,首先通过综合音/视频特征来进行提取重要人物的提取;然后通过语音识别和字幕识别获得候选人名集合;最后通过多种方式来建立人物与人名之间的关联,完成对重要人物的标注。

b)场景对象语义提取与标注。场景对象语义往往描述了视频镜头的一些基本的全局信息,是分析和提取其他高层语义的基础。本研究提出了一种基于分块潜在语义的场景分类方法[10]。该方法首先对图像进行均匀分块并使用分块内视觉词汇的出现频率来描述每一个分块;然后利用概率潜在语义分析(plsa)方法从图像的分块集合中发现潜在语义模型;最后利用该模型提取出潜在语义在图像分块中的出现情况来进行场景分类。在13类场景图像上的实验表明,与其他方法相比,该方法并不需要进行大量的手工标注,而且具有更高的分类准确率。

c)运动对象的提取与标注。对于视频中运动对象的提取与标注,侧重于监控视频中运动目标的探测、跟踪和识别方法的研究。首先对监控视频采用背景剪除和运动补偿相结合的方法来探测运动对象,通过基于光流的金字塔跟踪算法来实现对运动对象的跟踪,在运动对象探测和跟踪的基础上,通过提取运动对象的特征来分析运动对象的模式、轨迹或者运动特点;最终通过与已有视频数据中相应目标的运动特征来进行匹配,从而识别出运动对象。

3)媒体数据分类 对于数字媒体数据分类的研究,以视频分类作为最主要的研究内容。首先对各类视频的视频特征(包括镜头编辑特性、运动特性、声音特性、画面的亮度色度特性等)作出概括,分析出各类视频的特征差异,然后根据各类视频的这些特征差异,分别通过视频内容分析静态特征提取、运动特征提取、音频特征提取等方法提取出合适的特征向量,完成对视频内容的描述。在搜集大量视频素材的基础上,研究采用合适的机器学习方法(如svm、hmm等方法)进行训练,从而利用该分类器模型实现对视频数据的分类。对视频中单模态分类结果进行融合,提高视频分类的准确性。

4)媒体数据关联分析 因为语义对象、语义事件能够为用户提供可以理解的语义信息,所以重点面向如下两方面:

a)基于语义对象要素与语义事件的关联分析。研究语义事件与时间、地点、人物等语义对象之间的关联,尤其是语义事件与人物之间的关联,同时在已有基础上对事件与时间、空间的关联进行完善。

b)基于语义事件的关联分析。它可以增强对语义事件的深入分析和理解。首先从新闻报道的角度展开事件探测与追踪技术的研究。事件探测旨在发现新的事件并将与某一事件相关的所有新闻报道归入相应的事件簇,所以事件探测本质上是一种特殊的文本聚类技术。事件追踪就是通过监控新闻媒体流以发现与某一已知事件相关的后续新闻报道,这与信息检索领域中基于示例的检索有许多共同之处,只是在事件追踪中往往已知的训练正例非常少,并且与某个事件相关的报道集中出现在特定的时间区间。对于语义事件之间也存在着的相互联系和影响,则通过它们之间关联规则的挖掘和关联关系的分析,对事件进行跟踪和对趋势进行预测,对特定事件可以实现预警。这种关联分析还可以辅助对主题的分析和管理。语义事件的关联分析以故事的文本信息为主要载体展开。通过文本信息中关键词对事件信息支持度的提取,结合时间信息进行事件关联分析。

1.2 数字媒体信息服务子系统

数字媒体信息服务子系统是与上层应用结合最紧密的系统,也是需求与关键技术进行有机结合的关键,包括如下系统。

1)情报表现服务子系统 其目的是将信息处理后的结果以可视化的方式表现给用户,为用户提供辅助决策和信息支持等服务。

(1)数字媒体数据的组织 针对数字媒体数据的特性,提炼出面向数字媒体信息分析服务的基本四维结构模型,在此基础上构造出基于事件、主题、结构化语义的数字媒体数据的关联组织。针对用户提出的个性化定制需求,研究基于媒体描述框架mpeg-7的多媒体情报的集成和同步模型,把超媒体模型和多媒体集成与同步模型(如ocpn)等结合起来,实现数字媒体数据关联节点的跳跃和基于时间线、时间墙、地理信息的动态组织。

(2)数字媒体数据的可视化表现 研究信息可视化的模型(如主题视图、时空关联图、信息资源与主题的关联程度分布等),针对不同类型的数据选择适合的可视化模型。

(3)数字媒体数据的综合集成服务 通过研究数字媒体数据间的趋势和可视化表现方法,提供趋势关联可视化辅助服务。采用文本、图像、视频、音频的分析方法对用户关心的事件和主题进行连续跟踪,基于时间序列的分析方法对事件和主题进行关联挖掘,采用时间序列可视化的方法(如河流模型)将分析得到的结果和趋势按照时间的顺序表现出来。

通过研究智能信息叙事性表现模型,为决策者提供可定制的高层信息表现服务。该模型包括文本理解与模板生成模块、媒体融合模块、信息表现模块。文本理解与模板生成模块以自动分词为前提,以信息词典库为基础,以句法和语义分析为核心,以规则和背景知识为约束,对输入的文本进行分词和词性标注;运用句法知识将输入的句子中单词之间的次序,转换成合适的叙事模板。媒体融合模块负责从大量的媒体中智能地找到符合叙事模板条件的合适媒体。信息表现模块负责把媒体融合模块中组织好的媒体以某种关联的方式(或按照语义的关联,或按照时间的关联)以适合的形式表现出来。

2)基于内容的智能检索服务子系统 其目的是为满足不同用户的不同信息需求,提供交互式的、基于语义的、高效率的检索服务。该子系统需要解决以下问题:

a)建立高维数据索引。对于大型数字媒体数据库,为对数据进行高效率的检索,必须对媒体特征和语义等信息建立高效的索引机制。首先分析数据集的整体分布特性,确定数据集中单个个体的本征维数,然后基于该统一的本征维数,用数据个体各自的本征维属性来表达该个体对象,从而达到降维的目的。

b)设计合理的检索模式。为更好地辅助用户完成检索操作,必须设计适合于语义检索的人机交互界面和检索模式,使其能便于用户以多种方式表达自己的意图。

c)基于内容的检索服务。媒体的内容既包括底层特征,又包括高层语义。传统的基于内容检索大多针对基于底层特征,但底层特征往往很难准确地表达用户的检索意图,因此本研究提供一种底层特征与高层语义相结合的检索方法,通过研究用户检索语义的表示与扩展方法,研究多元语义匹配机制,建立高层语义与底层特征之间的关联关系,从而使系统采用的基于语义的检索算法能更接近人的自然语言描述的意图。

d)建立相关反馈机制。基于内容的检索是一种模糊检索,系统往往难以准确描述用户的检索要求,需要与用户多次交互反馈、逐步过滤检索结果,逼近检索目标。相关反馈正是解决以上问题的一种有效途径。通过相关反馈,可以让用户评判检索结果的好坏,并返回给系统,系统对反馈结果进行分析处理,相应地调整参数,以提高下次检索的精度。通过一定次数的反馈,检索精度会达到一个令人满意的程度。

2 平台实现

支持基于内容检索的媒体语义特征分析平台通过visual studio进行了具体实现,其中涉及的核心技术通过vc进行了封装。平台主要提供对图像、视频、文本、音频等媒体数据的语义分析和处理功能。重点完成图像的自动分类,运动对象、人脸、台标等语义对象的标注,以及事件的关联分析等功能。图2显示了利用平台进行图像场景自动分类的过程。图3显示了利用平台进行人物的语义检索。平台所提供的其他功能在这里不再赘述。

3 结束语

本文介绍了研制开发的支持基于内容检索的媒体语义特征分析平台,研究围绕数字媒体的高层语义特征分析开展,以支持基于内容检索的应用,重点突破各种数字媒体信息的语义对象提取与检索、自动分类与标注和关联分析等关键技术,这些技术都是目前信息技术领域中的研究前沿问题

和难点问题,因此本项目的研究成果对我国数字媒体处理与服务技术的发展具有良好的推动作用。它将在很大程度上提高数字媒体收集整理工作的效率,大大简化数字媒体的管理工作;最重要的是能够帮助用户从大量的数字媒体数据中快速获取有价值的信息,节省大量时间、人力和物力,可带来巨大的经济效益和社会效益。

参考文献:

[1]

smeulders wm.content-based image retrieval at the end of the early years[j].ieee trans on pattern analysis and machine intelligence,2000,22(12):1349-1379.

[2]christel m g,hauptmann a g.the use and utility of high-level semantic features in video retrieval[c]//proc of international conference on image and video retrieval.berlin:springer,2005:134-144.

[3]hauptmann a g.lessons for the future from a decade of informedia video analysis research[c]//proc of international conference on image and video retrieval[s.l.]:springer,2005:1-10.