首页 > 文章中心 > 含有数字的成语

含有数字的成语

含有数字的成语

含有数字的成语范文第1篇

2、十拿九稳:十成的机率,占了九成。比喻很有把握,十分可靠。

3、九霄云外:在九重天的外面。比喻非常遥远的地方或远得无影无踪。

4、三教九流:旧指宗教或学术上的各种流派。也泛指社会上各行各业的人。

5、一言九鼎:形容说的话分量大,起决定作用。

含有数字的成语范文第2篇

关键词: 文字图像识别; 语义词典; 组合规则; 文字图像过滤

中图分类号: TN915.08?34 文献标识码: A 文章编号: 1004?373X(2013)21?0070?04

0 引 言

互联网技术发展到今天,已经成为广大网民获取信息和交流的重要途径之一。互联网上蕴含大量的共享信息,但是这些信息并不都是健康的和文明的,其中还包括了大量反动、色情、暴力以及垃圾邮件等不良信息,这些信息都会给网络用户带来负面的影响。

为了解决上述问题,网络信息安全研究者也在不断的努力研究各种信息过滤方法来过滤这些不良信息,但是网络垃圾信息制造者也常常采用不同的方式,例如,使用“*”、“|”等间隔符将敏感词分割开,使不良信息逃脱关键字、黑白名单等过滤方法的阻挠[1],继续在网络上传播;还有就是常见的广告垃圾邮件,这种邮件大多数情况下都是在未经允许的时候发送给电子邮件用户,由于广告中的文字是嵌入到图像中的,所以传统的基于文本的垃圾邮件过滤系统对这类邮件都无法过滤。

针对上述问题,网络信息过滤研究者们也在不断的探索新的方法来实现更加完善的信息过滤,例如,对于广告垃圾图像,根据图像的颜色特征[2]来判定该图像是否是广告垃圾图像,这类方法对于信息的过滤有一定的帮助,但是这种过滤方法也会造成很高的误判率。为了解决上述问题,本文提出了一种基于高层语义的文字图像过滤模型,并以含有敏感词的文字图像为例阐述了整个模型的构建过程以及模型中所用到的一些相关技术,实验证明该模型是可行的。

1 文字图像语义构建

1.1 图像语义层次模型

语义,反映图像包含的信息,这些信息可以是图像中所包含的具体事物、背景以及事物之间的空间关系等[3]。为了明确图像所处的语义层次,文献[4]中Eakins等提出了语义层次模型。该模型将语义层次划分为3个层次,分别为图像的底层特征层、对象层以及语义概念层,这3个层次又分别对应着6个不同的图像语义级别,如图1所示。图中的箭头表示语义的高低级别,下一个语义层次通常包含了比上一层次更高级更抽象的语义,而较高层的语义往往由较低层的语义通过某种规则推理而得。

对于上述一般图像的语义层次模型,可以将其应用到文字图像上。文字图像不同于其他图像,这类图像所包含的主要内容就是文字,且背景往往比较简单,例如自然风景图像里面所包含的元素就比较多,像‘天空’、‘草原’、‘河流’、‘山脉’等等都可以是自然风景图像的组成部分,而文字图像中所包含的对象类别就比较单一。本文把文字图像中的每个文字看成一个对象,采用一定的技术手段将文字图像中的单个文字切分出来,并提取出该对象的底层特征,并识别出该对象,如果一个对象是敏感词汇的组成部分,就将该对象称为敏感对象,然后再根据一定的规则将这些对象组合起来,然后和语义词典中的词汇相比较,语义词典中含有的就是敏感词,若图像中包含敏感词,那么该图像就会被过滤掉。

1.2 文字图像语义的组成

本文所提出的模型主要是针对文字图像,文字图像不像其他图像含有丰富的组成元素,该类图像所包含的对象类别较单一,也没有丰富的背景。将图像中的每一个文字看成是一个对象,对于包含敏感词的图像来说,这些对象的组合就是一个敏感词。下面将文字图像高层语义提取中所用到的技术手段及流程做进一步阐述。

1.2.1 对象的分割

把图像中的一个文字看成一个对象,所以在文字图像的高层语义处理过程中的对象分割就是将图像中的单个文字切分出了,即文字切分。文字切分流程如图2所示,具体流程描述:

(1)图像预处理,就是对图像进行去噪,二值化等操作;

(2)文字区域定位,在一幅文字图像中可能有一部分区域不包含文字,那么就要把不包含文字的区域去除掉,只保留含有文字的区域,这就是文字区域定位的作用;

(3)行分割,就是对图像进行进一步切分,使得分割后的每一部分只包含一行文字;

(4)文字切分,完成行分割以后,就可以进行文字切分了,即切分出来的部分只包含一个文字,这就是一个对象。

1.2.2 对象的识别

在将图像中的一个个文字切分出来以后,这些区域仍是以图像形式表示的,这时就需要进行单个文字图像的底层特征的提取,进而利用这些特征识别出单个文字图像具体含义,即要把对象与底层特征关联起来。本文选用的单个文字图像的底层特征分别是网格特征、交叉特征以及重心特征,下面对这些特征进行详细说明。

网格特征[5]:网格特征将文字图像划分为若干区域,称之为网格,在每一个网格内提取各种特征,将其除以整个文字图像中文字像素的个数,这样即使个别点的统计有误差也不会造成大的影响,增强了特征的抗干扰性。

交叉特征[6]:交叉数特征是指首先把单个文字图像的行和列等分成若干份,然后分别在行、列的各等分处做水平和垂直线穿过字符,计算水平线和垂直线与字符边缘相交次数的总和。

重心特征:重心特征顾名思义就是计算该特征所得数值能够表征图像中文字的重心偏向,即计算文字的上半部分所包含的文字像素与整个文字像素的比值和文字的左半部分所包含的文字像素与整个文字像素的比值。

1.2.3 提取高层语义

在对象分割、识别完成以后,接下来就要利用所识别出来的对象的不同组合来推理得出图像的高层语义。本文所要建立的是一个文字图像的安全模型,对于图像中出现的各种敏感词汇都要进行过滤,可以将这些敏感词汇集合起来作为文字图像的高层语义词典,由识别出的对象得到的不同组合的词汇与该词典里的词汇进行匹配,如果匹配成功,那就说明该图像是含有敏感词的,该图像就应该被过滤掉。由对象到词汇的过程是一个根据组合规则进行对象组合的过程,该组合规则描述如下:

确定各敏感词汇的组成部分,即敏感词汇具体是由哪些文字组成的。通过对象识别可以得到这些文字,把这些对象称作敏感对象。判断敏感对象在图像中是否能够构成一个词汇。对象识别所识别出的敏感对象,只能说明它们是敏感词汇的组成部分,这些对象在图像中是否是一个词汇还有待确定。

(1)一幅图像是否是文字图像的判定。要实现对敏感文字图像的过滤,首要任务就是该图像是文字图像,本文通过Gabor小波变换[7]和SVM来实现文字图像的识别;

(1)如果敏感对象位于同一行,则使用欧式距离来判断敏感对象是否是相邻的,欧式距离大小的设定以每一行中所有对象的平均间隔宽度为标准,小于等于这个标准的两个敏感对象是相邻的,大于这个标准的两个敏感对象是不相邻的,如果敏感对象是相邻的,那么这些敏感对象就是一个可能的词汇组合,然后再将该组合与语义词典中的词汇进行匹配,如果匹配成功就说明该图像中含有敏感词汇,该图像将被过滤掉,否则不过滤该图像;

(3)如果敏感对象彼此之间都不在同一行,那么这些敏感对象在原图像中肯定不是一个词汇,原始图像就不包含敏感词汇,该图像不被过滤;

(4)如果敏感对象有一部分在同一行,其余部分在下一行。且一部分在一行的末尾,另一部分在下一行的开头,在同一行中的敏感对象利用规则(2)判断它们是否相邻,如果相邻,那么这些敏感对象就是一个可能的词汇组合,然后再将该组合与语义词典中的词汇进行匹配,如果匹配成功就说明该图像中含有敏感词汇,该图像将被过滤掉,否则不过滤该图像。

2 模型设计

根据上面关于文字图像过滤的叙述,开始构建基于高层语义的文字图像过滤模型,如图3所示。从图中可以看出,该模型主要包括文字图像识别、对象分割、敏感对象识别以及敏感词匹配四个部分。

文字图像识别:该部分使用Gabor小波变换提取图像的纹理特征,并使用台湾大学林智仁教授的LIBSVM作为分类器;

对象分割:该部分使用了积分投影法[5]、基于连通域的汉字切分技术[8]完成文字区域定位、行分割以及文字切分;

敏感对象识别:提取单个文字图像的网格特征、交叉特征以及重心特征并通过归一化得到一个含有多维的综合特征向量,并使用台湾大学林智仁教授的LIBSVM作为分类器,进而识别出敏感对象。

敏感词匹配:正如前面所说首先将所有要过滤的敏感词汇集合起来构成一个语义词典,然后将敏感对象的组合结果与语义词典匹配,若匹配成功,则原图像包含敏感词汇,该图像被过滤。

3 训练数据集的构成

本文需要建立两个样本图像库,一个用于文字图像的识别,一个用于文字的识别。

(1)用于文字图像识别的样本图像库的构成。该图像库一共由96幅图像构成,其中48幅图像是由CoreI图像库中不同类别图像中挑选出来的,另外48幅图像是文字图像,是在网上收集的,包括了不同背景不同字体不同大小的文字图像。

(2)用于单个文字识别的样本图像库的构成。该图像库一共包含了208幅图像,这些图像都是由单个文字组成的,其中的100幅图像是非敏感词图像,这些图像是由汉字中最常见的100个汉字组成,另外的108幅文字图像是由组成敏感词的文字图像组成,这些图像具有不同大小不同字体的特性。

4 实验结果及分析

本文使用Matlab进行仿真实验来验证上述模型的可行性。在实验中使用积分投影法、基于连通域的汉字切分技术以及台湾大学林智仁教授的LIBSVM来实现文字图像中文字区域的定位、文字行切分、文字切分以及文字识别;此外,使用Gabor小波变换提取图像的纹理特征,结合LIBSVM实现对文字图像的识别。

4.1 实验结果

使用积分投影法对文字图像进行文字区域定位及行分割,实验结果如图4所示。

使用基于连通域的汉字切分技术对文字图像进行文字切分,原图像及切分后的图像分别如图5、图6所示,图6中用边框包围起来的部分就表示是一个文字。

使用Gabor小波变换提取图像的纹理特征,并使用SVM作为分类器对图像进行识别,首先提取样本图像库(1)中各图像的纹理特征,并对图像进行分类标注,文字图像标注为‘1’,非文字图像标注为‘-1’,然后利用该训练样本集对SVM进行训练,这样可以得到一个预测模型,接着,再从CoreI图像库中选出48幅图像以及从网上搜索48幅文字图像,这样就得到96幅图像(这96幅图像不能和样本图像库中的图像相同),以这96幅图像为测试集,可以得到如下结果,见表1。

表中RA代表识别正确率;TMN代表文字图像误分类个数;TMR代表文字图像误分率,是指文字图像的误分类个数与文字图像总数的百分比;NTMN代表非文字图像误分类个数;NTMR代表非文字图像误分率,是指非文字图像误分类个数与非文字图像总数的百分比。

分别提取样本图像库(2)中各文字图像的网格特征、交叉数特征和重心特征并进行相应的类别标注,属于敏感词中文字的类别标注为‘1’,不属于敏感词中文字的类别标注为‘-1’,这样就得到用于建立SVM预测模型的训练集。在得到预测模型以后,就是使用该模型进行预测。预测的结果见表2。

表2中敏感词文字图像是指该图像只能包含一个文字且该文字是敏感词中的一个;一般文字图像是指该图像只能包含一个文字且该文字不是组成敏感词的文字;其中,RA代表识别正确率;STMN代表敏感词文字图像误分类个数;STMR代表敏感词文字误分率,是指敏感词文字图像误分类个数与敏感词文字图像总数的百分比;GTMN代表一般图像误分类个数;GTMR代表一般文字图像误分率,是指一般文字图像误分类个数与一般文字图像总数的百分比。

4.2 分 析

从图4中可以看出,对于背景比较单一的文字图像,使用积分投影法进行文字区域定位和行分割的实验效果还是比较好的,但是对于背景稍微复杂的文字图像,该方法定位效果及切分效果就不太理想了。

从图5和图6中可以看出,基于连通域的汉字切割技术的切分准确率还是很高的,但是对于左右结构、上下结构以及全包围结构的汉字(如‘回’就是全包围结构的)的切分效果不是太理想,该方法会把左右结构的汉字切分为左右两部分,上下结构的汉字切分成上下两部分,全包围结构的汉字切分结果有可能是把汉字切分成内外两部分。

从表1中可以看到使用图像的纹理特征来判别一幅图像到底是不是文字图像也有不足之处,虽然说文字图像的纹理与非文字图像的纹理有显著的差别,但对于一些背景比较复杂的文字图像来说,它的纹理就和非文字图像差不多了,这样就会导致图像的误分类。

从表2中可以看出,对于敏感词文字图像分类的正确率还是比较高的,108个敏感词文字图像中只有9个被误分。而对于一般文字图像来说误分率较高,因为汉字之间具有相似的结构和笔画,组成敏感词的文字只有那么几个,而其他文字则有很多,这些原因就导致了一般文字图像的高误分率。

5 结 论

本文将需要过滤的敏感词汇集合起来构成语义词典,将文字图像中的每一个文字看成一个对象,并将分割出来的对象与底层特征相关联,实现了对象的分割和识别,指定了敏感对象相对应的组合规则,并将组合结果与语义词典中的词汇相匹配,实现了由对象语义到更高层语义的推理,实验证明本文提出的文字图像过滤模型是可行的。对于本文中有关如何提高文字图像的识别率、如何提高文字区域定位和行分割的精确度以及如何正确切分左右结构、上下结构以及全包围结构的文字都是需要未来作进一步研究的问题。

参考文献

[1] 吴慧玲,耿西伟.一种不良信息过滤的文本预处理方法研究[J].微计算机信息,2006,22(36):58?60.

[2] 丁丹,袁华,张凌.基于内容的广告垃圾图像过滤方法的研究[C]//第三届全国信息检索与内容安全学术会议论文集.北京:中国中文信息学会信息检索与内容安全专业委员会,2007:38?41.

[3] 张捷.图像语义标注[J].电脑开发与应用,2012,25(1):10?11.

[4] EAKINS J P.Automatic image content retrieval: are we getting anywhere [C]// Proc of 3rd International Conference on Electronic Library and Visual Information Research. Milton Keynes: ASLIB, 1996: 123?135.

[5] 陈义,李言俊,孙小炜.利用OCR识别技术实现视频中文字的提取[J].计算机工程与应用,2010,46(10):180?183.

[6] TSENG Yi?Hong, KUO Chi?Chang, LEE His?Jian. Speeding?up chinese character recognition in an automatic document reading system [J]. Pattern Recognition, 1998, 31(11): 1601?1612.

含有数字的成语范文第3篇

关键词:数字 模糊语义 翻译

美国教授查德(L.A.Zadch)提出的“模糊语言”的理论,在语言学界引起了广泛的关注,他指出在人类语言中,许多词语所表达的概念都是没有精确边界的,即:都是所谓的“模糊概念”。人们在日常交际活动中,经常自觉不自觉的地使用许多模糊概念和表达模糊概念的模糊词语。因此,“在一定意义上我们可以说,没有模糊词语便没有人类的自然语言。”由于模糊语言大量存在,更由于其特有的模糊属性,如何准确地把握和再现语言的内在蕴含就成为正确翻译的关键。

数字用于表示数目是所有语言中的共同现象,任何民族都离不开数的概念和计数的需要。但是,数字不仅仅隶属于数学王国,它被广泛应用于习语和修辞中,使语言生动形象、言简意赅,从而达到夸张或委婉的效果。在数学领域中,数字表达的是分毫不差的数量,是“实数 ”;而在语言运用的实践当中,数字往往被赋予不同的文化内涵,它的功能是表义,即:以精确的形式传递模糊意义,用于抒情达意、增强语势,是“虚数 ”。这种“虚数”的用法就是数字的语义模糊现象。所以,翻译过程中只考虑数字的认知意义是远远不够的,译者还应充分认识其模糊语义并准确译出其言外之意。

一、数字模糊语义的实现手段

作为语言的一个有机组成部分,数字在人类的科研、社会、经济等领域的作用愈来愈突出。在语言交际中具有模糊语义的数字主要用于数字习语和修辞当中,它们不仅使语言形象生动、用词凝练,还具有朗朗上口、形式工整、前后对称的美感效果。从一定意义上说,数字的模糊语义对丰富语言的表现力起着至关重要的作用。

1.数字习语。数字习语是语言中的核心与精华,是人类智慧的结晶。不论是数字谚语、数字典故还是数字俚语,都是数字模糊语义的具体运用。数字习语具有强烈的文化特征,既简练生动又妙趣横生。数字习语饱含民族色彩、历史色彩和地方色彩,在一定广度和深度上反映了不同民族的文化特色。如:英语俚语“the seventh son of a seventh son”(显要的后代)中的“seventh”已经失去了其原来指示的数量的概念,它的模糊语义源自圣经。据圣经所说,世界是在七天创造的,人有七种美德,人的一生被分为七个生长时期,主祷文也分为七个部分,七的倍数也被认为是神圣的。因而“第七个儿子的第七个儿子”被认为是极其显要的后代。类似的还有英语习语“four-letter man” (低智商的人) 中的“four”;汉语习语中有“半斤八两”中的“半”和“八”,“万水千山” 中的“万”和“千”等等。

2.修辞。数字的修辞用法集中体现在夸张和委婉表达,尤其指夸张,经常会用精确的数目表示模糊的含义,或者是夸大或者是缩小的数量。甚至有时不再指示数量,而是本质上的或者是质量上的改变。这种用法在英汉两种语言中均可见到。例如:英语“Thanks a million.”中的“a million” 便不再表明“一百万”的意义,而是“非常,很”的含义了。汉语中很多脍炙人口的诗句,如:“飞流直下三千尺,疑是银河落九天”、“窗含西岭千秋雪,门泊东吴万里船”等,都是运用数字模糊语义达到明显的“比喻”或者“夸张”的修辞效果。虽然,英汉语中数字的修辞用法存在着形式上和起源上的差异,但都抒发了强烈的感情,给读者留下深刻的印象。

二、数字模糊语义的翻译原则

罗马西赛罗说过:“翻译不是字当句对,而是保留语言的总风格和力量。”“按分量而不是数量译词”。数字的模糊语义使得语义外延扩大延伸,给人更大的思索和想象空间,同时,也给译者更大的发挥和再创作余地。正是数字语义的模糊性引发联想,让人回味,在语篇起着当中渲染气氛、烘托环境、增强语势的作用。为了使译文在内容上忠实、在语句上流畅、在风格上贴切,在数字的翻译过程中,译者应该遵循以下三大原则:

1.民族性原则。不同的民族有不同的文化背景和语言表达习惯,数字的模糊语义是有着鲜明的民族特色的,它是历史上民族文化长期积淀的结果。在翻译过程中,能否遵循译语的民族风俗和语言习惯,对数字进行必要的改译、换译是成功翻译的关键。如:汉语中的“九牛二虎之力”《汉英词典》(外研社,1996)的译文“use every ounce of one’s strength”成功地将华夏文化中数字模糊语义译成西方文化语言中的形象意义,符合“民族性原则”,有利于译文读者的理解。

2.等值性原则。英汉两种语言中有一些语言,无论在内容上,色彩上和形式上都十分相近。虽然英汉两种文化传统迥异,对其语言中的数词所赋予的社会文化含义也不尽相同,但是,这些不同的数词在不同文化背景、不同的语境中却拥有极其相似的对应表达,在这种情况下不妨直截了当地借用译入语的对应语言,可以使原语读者和译入语读者获得最大相似感受,从而使译入语在文化功能上获得与原语相同或相似的效果,即:“等值性原则 。”如:“once bitten, twice shy”一朝被蛇咬 十年怕井绳;“a nine day’s wonder”昙花一现;“one hundred and one thank”千恩万谢等等。

3.形象性原则。数字用于模糊含义时,往往都失去了其数量意义而具有形象意义。这种形象内涵丰富,具有较强的民族特征。数字的模糊语义有助于语言的形象更为生动、更为鲜明,如:汉语中的“三头六臂 ”、“十五个吊桶打水,七上八下”等等。因此,在翻译时,必须越过其实指意义而悉心捕捉其与其他词结合后所产生的形象意义,根据民族文化传统和语言表达习惯,或保留形象,或转译成译入语中人们熟悉的形象,选择恰当词语译出其模糊语义。

三、数字模糊语义的翻译策略

1.直译法。由于汉英两种语言中都存在着数字的语义模糊现象,因此,在不影响译入语读者理解的前提下,翻译时完全可以保留原语中的数字直译。如:“A cat has nine lives.”猫有九条命。这样翻译过来,既生动又形象,人们很容易接受。又如:“一寸光阴一寸金。”直译为“An inch of time is an inch of gold.”

2.习语法。汉英语中对数字有不同的使用习惯,数字的模糊语义在理解和表达中也存在着一定的差异,因此,在翻译中不局限于数字本身的含义,应用译入语中等值的习语才更符合译语的表述习惯。如:“The two sisters are different in a thousand and one way.”译成“姐妹俩之间千差万别”就比直译成“一千零一”更加准确形象。再如:“Six of one and half a dozen of the other.”译成“半斤八两”。

3.增减法。所谓增减法,指的是将数字改大或变小。数字的模糊语义在很大程度上是为了达到夸张或比喻的效果。为了再现原文的神韵,可以将数字进行扩大或缩小的处理,如:“百里挑一”译为“one in a thousand.”“百”在翻译时扩大了,译成了“thousand”。但有些数字在翻译时需要缩小,以便使译文更符合译入语的习惯。如:Bynner 在翻译柳宗元的《江雪》时将“千”译成“hundred”, 因而“千山鸟飞绝”译成了“A hundred mountains and no bird.”

4.转译法。模糊数字的使用具有一定的民族文化背景和特定的语言表达习惯,为求语句通顺、语义清楚,翻译是不按数字所指称的数的概念翻译,而是依据它们在特定语境中的模糊语义,译出其语用含义既可。如:“What is it? What hurts you?”“My eyes. They’re hurting like sixty.”(J. London, The Valley of the Moon) “怎么啦?你什么地方疼?”“我的眼睛,疼的厉害。”又如:“九死一生”译为“survival after many hazards”。译文舍弃了数字转译其语用含义。

参考文献:

[1]王秉钦:《语言与翻译新论》,南开大学出版社,1998。

[2]《汉英词典》,外语教学与研究出版社,1996.4。

[3]郭建民:《数词的模糊语义与翻译》,《中国当代翻译百论》,重庆大学出版社,1994。

[4]聂崇信:《汉英双解成语词典》,商务印书馆,1982。

[5]文旭:《语义模糊与翻译》,《中国翻译》,1996.2。

[6]文旭:《浅论英汉数词的模糊性》,《外语学刊》,1994.2。

含有数字的成语范文第4篇

【关键词】汉语第二语言教学;双音节复合词;语义激活扩散模型;含相同语素

一、语义激活扩散理论

1.语义激活扩散理论的提出。激活扩散模型(Spreadung Actiation Modllins)是Collins和的Loftus(1975)提出的,它也是一个概念网络模型,但与层次网络模型不同。它放弃了概念的层次结构,而以语义的网状联系表示它们的联系。

下图的图中方框为网络的节点,代表一个概念。概念之间的连线表示它们的联系,连线的长短表示联系的紧密程度。连线愈短,表明联系愈紧密,概念之间有愈多的共同特征;两个节点之间通过其共同特征有愈多的连线,则两个概念的联系愈紧密。从图中可以看出,各种机动车通过其共同特征而紧密联系起来。围绕各种颜色的关联也是这样。

图1:激活扩散模型片断

2.语义激活扩散模型的加工过程。激活扩散模型的加工过程是很有特色的。它假定,当一个概念被加工或受到刺激,在该概念节点就产生激活,然后激活沿该节点的各个连线,同时向四周扩散,先扩散到与之直接相连的节点,再扩散到其它节点。此外还假定,激活是特定源的激活,虽有扩散,但可追踪出产生激活的原点。此外还假定,概念间连线的另一个重要特征:强弱。前面提到概念间连线按语义联系紧密程度而有长短之分,现在连线则又有强弱之别。连线的不同强度依赖于其使用频率高低,使用频率高的连线有较高强度。同样,当连线的强度高时,激活扩散的越快。

二、含相同语素的复合词群落的语义激活扩散模型的构建

1.激活汉字显义功能,理解含同一语素的复合词语义网络

由于汉字与汉语单音词的关系是十分密切的,这样在单音词指向复音词的组词过程中,汉字在复合词中具有显义作用。一般说来,一个汉字是一个语素,语素是有意义的,它是音义结合在一起形成的最小的单位。汉字字形对语素义的表现也能起到显义的作用。人们一看到字形,就会联想到仅仅从语音形式上想不到,或不能那么迅速联想到的东西。

例如,看到“海潮”两个字就似乎看到了汹涌澎湃,惊涛骇浪的飞动,而听到“hai chao”则难以达到这种效果。汉字字形字势溶入单音词之中,它将单音词的意义特征形象而又概括地反映在字形上,使人们一看到是字形,就将意念活动直接指向客观对象,进而指向一组符号。如上面所说的“海潮”的那种效果。

在汉语第二语言词汇教学中,如何运用汉字的这一优势,帮助学习者构建汉语复合词的认知模式?要掌握大量的词语,不能主要靠汉字的视觉效果,还要依靠理解一个语素义,进而理解复合词群落。前面已经提到:看到“海潮”两个字就似乎看到汹涌澎湃,惊涛骇浪的飞动。同时我们还应该搞清楚,“海”指大洋靠近陆地的部分,有的大湖也叫海。“潮”指海水因为受了日月的引力而定时涨落的现象。那么,来看一下以“海”为“节点”的双音节复合词群落的语义网络。

图2:“海”的双音节复合词群落的语义网络的片断

如上图所示,“海”与“岸”二者的语义关系是修饰与被修饰的关系,意思为“邻接海洋边缘的陆地”;“海岛”的语义关系是同样的修饰与被修饰,意思为“海洋中的岛屿”;“海路”指“海上运输的航线”;“海轮”指专在海岸上航行的轮船。“人海”与“火海”中的“海”是比喻义,即“比喻数量多的人或事物”。以上是以“海”为“节点”的双音节复合词群落中复合词的图示。这些含有“海”这个语素的复合词,如果有一个被激活,学生应该想到有关的另一个,这样才能保证他们不写别字。所以,含有一个汉字的词语群落中各个单词都可以通过这个字被激活,汉字具有显义功能,具有显示词语群落的功能。

2.激活汉字对含同音语素复合词的区别作用。符号是什么?在认识活动中,人们常常用甲事物代表乙事物,这代表乙事物的甲事物就是乙事物的符号,即符号是事物的代表,是指代他种事物的标记。

符号是由形式和内容两个部分构成的结合体,形式是人的感觉器官可以感知的,内容则是形式所表达的意义。像红绿灯、旗语、手势、文字等是视觉可以感知的,是视觉符号,汽笛、军号是听觉符号。语言是听觉符号系统。这些可以感知的形式都是和意义结合在一起的。汉语中“人”的语音形式“r閚”,是听觉可以感知的声音,它的意义是指所有的人,概括起来可以说是“用两条腿走路、会说话、会干活的动物”,“ren”这个形式和人的意义结合成汉语中的人的符号,代表着客观世界中的人这种事物。

在所有的符号中,语言符号是最重要、最复杂的一种。语言中最小的符号是语素,汉语中的“黑”、“板”、“人”、“民”、“朋”、“友”等都是符号。语素是语言中音义结合的最小单位。人们自然地感觉到语言中的单位是词,而不是语素。有些词由一个语素构成,如“人”、“水”、“火”、“土”,有些词包含不止一个语素,如“黑板”、“人民”、“朋友”。

汉字这一符号,对含同音语素的复合词具有区别作用。具体表现为:汉语中的同音字,是语音上的相同,声音上的这种相同常常会造成字形上的混淆。因为学生感知到了声音,但并不明确所指是什么,这时,应将这些同音字书写出来,通过字形形式来辨别。

例如:(说明:画#号的词有同音词;不加#号的,括号内的字大多是别字;画*号的有异形词,括弧外的词形是规范词形。)

#得到(道) #势力(视)#主意(义) #过虑(滤) #公用(功)

究竟(竞)避免(勉) 汇报(会)年纪(记) 导致(制)

访问(仿)习惯(贯) 经常(长)篮球(蓝) 立刻(克)

*订婚(定) *精彩(采)*身分(份) *计划(画)*图像(象)

少数民族中学生汉语教学中,如果引导学习者利用汉字对含同音语素的区别作用构建复合词认知模式,这样可以预防或避免别字现象。

那么,如何引导少数民族中学生构建含相同语素并含同音语素的复合词的认知模式呢?在前面谈到了语义记忆的激活扩散模型。这里我们就运用该理论,激活汉字对含同音语素的复合词的区别作用,有利于引导学生构建同一个语素组成的复合词群落语义记忆的激活扩散模型。

3.激活汉字对同音复合词的区别作用。汉语的音节数量少,复音节的词增加了组合的类型,减少了相同的机遇,但两个音节的复合词同音的机会仍高于西方语言的多音单音词和多音词。同音词多,这无疑对汉语第二语言学习者带来了极大的困难。对此应该试图利用“汉字对同音复合词的区别作用”来构建汉语复合词词汇的语义网络解除这一困难。

汉语复合词语音相同率高的现象仍有赖于汉字的参与,凭借着汉字形体的显示,才可以将同音复合词清楚地分辨出来。

少数民族学生因同音而书写别字的现象普遍存在。这是因为音近的语素语义系统相混淆而造成的。解决这一问题的有效途径是帮助他们构建语素的语义系统。上面这些就是他们经常混淆的词。这里就不能通过声音记忆汉字,而要通过语义并强调字形来记忆汉字,这样才能避免别字现象的出现。含相同语素复合词群落的记忆与激活,是以汉字作为节点的,应该注意对含同一汉字的复合词群落的讲析。

运用上述认知心理学研究成果,帮助少数民族学生逐步构建起语素和相应复合词的语义层次网络模型,引导汉语第二语言学习者在学习的过程中逐步完善复合词心理认知模式,使他们在较短时间内,能够正确理解、记忆、书写汉语复合词,牢固地掌握现代汉语书面语词汇,是解决少数民族学生写错别字的科学途径之一,并对国内汉语第二语言具有重要的理论价值和现实意义。

参考文献:

[1]王甦,汪安圣.认知心理学[M].北京:北京大学出版社,2001:175-182.

含有数字的成语范文第5篇

【中图分类号】G 【文献标识码】A 【文章编号】0450-9889(2012)06A-0085-02

数学语言是数学化了的自然语言,是表达科学思想的通用语言和数学思维的最佳载体。它包含符号语言、文字语言和图表语言,具有简练、抽象、清楚以及形式多样的特点。无论是符号语言还是图表语言,最终让学生理解其含义都要通过文字语言的表述,所以,这里重点阐述数学的文字语言。

一、数学文字语言的特点

1.准确性。

自然语言具有多义性,含糊不清,而数学语言必须准确、严密、清楚,不存在歧义,它是表达数学概念、判断、推理、定理的逻辑思维语言,与富有弹性的文学语言相比,数学语言有一副“铁板的面孔”。它的每个字、词都有确切的含义,不容混淆。“一元一次方程”与“一元二次方程”、“直线和射线”、“钝角和锐角”等,一字之差,表示完全不同的两个概念;词序颠倒,也会表达两种不同的意思,如“全不为零”与“不全为零”、“方程解”与“解方程”等。数学语言中,句子的附加成分常常作为条件,如定义“底面是正多边形的直棱柱”中的定语,定理“平行四边形中,对角线互相平分”中的状语,都是不可增删的条件,这就是数学特有的性质——数学语言的准确性。

2.严谨性。

数学还有一副钢制的骨架——严谨的逻辑。特殊不能代替一般,部分不能代替整体,不能臆断、不能循环论证等。这些特点决定数学概念要表述准确,判断和推理要严密,叙述要合乎逻辑。所以,教学中教师要做到:讲概念,抓住实质,准确无误;做推理,步步有据,完整周详;得规律,字斟句酌,无懈可击。不仅如此,还要对概念的定义进行解剖,对定理、法则中的关键词语下一番咬文嚼字的功夫,并适当辅以反例,以明确概念的内涵。如,一位教师在教学分数的初步认识时,指着一张纸的四分之一处说:这是四分之一。这句话准确吗?是不是缺少一些修饰语呢?数字只是一种“表示”符号。注意我这里强调的是一种“表示”,决不能说它“是”什么。如不能指着你的手说这是“5”,而应说这是5个手指头,再如有3棵树,不能指着树说:这是3,而应说这是3棵树。所以,刚才提到的分数初步认识的四分之一正确的说法是:可以用四分之一来表示,或者占这张纸的四分之一,是这张纸的四分之一等。这样的数学语言才准确、严谨、规范。再如,分数的基本性质,分数的分子和分母同乘或除以一个相同的数(零除外),分数的大小不变。这句话里的“同时”、“相同”、“零除外”这些词概括得非常准确、严谨,缺一不可,如果没有这些词分数的基本性质就不成立了。

3.简洁性。

数学的逻辑严谨、高度抽象必然带来数学语言的精练。用数学语言表达数学事实,要特别注意详略得当,简洁明了,凡重复的或多余的叙述应力求避免,而必须交代的事项则一定要阐述清楚,不可省略。例如加法交换律:两个数相加,交换加数的位置和不变。简短的一句话包含了三层意思:研究范围是两个加数,交换加数的位置,和不变。应该说不能再少一个字了。再如三角形的定义,由三条线段围成的图形。只有10个字,“三条”、“线段”、“围成”、“图形”再加上连接词“由”和“的”,概括得严密准确,惜字如金,没有任何多余成份。

二、如何教学数学的文字语言

1.找准每节课的核心数学语言或关键词。

数学内容是由数学语言构成的,数学教学就是数学语言的教学。教师根据教学内容,在教学时要尽量把每一节课的数学知识提炼成一两句数学语言或一两个关键词,紧扣数学语言或关键词展开教学。这样,学生不仅能理解数学知识,更能够发展思维,增长智慧。

如,教学长、正方形的周长,关于周长的描述,“围成物体一周的总长,叫做这个物体的周长”,“围成图形一周的总长,就是这个图形的周长”,这里要凸显“一周”、“总长”。

又如,教学“面积”时,“物体表面的大小或封闭图形的大小叫做面积”。这里要突出“表面”和“封闭图形”,教师在教学时表述要准确、清楚,如黑板面的大小、课桌面的大小、数学书封面的大小、墙壁面的大小等。

再如,在“分数的初步认识”一课中,把一个物体平均分成(

)份,其中的一份是这个物体的(

),这句话要让学生结合具体物体才能够完整地表述出来,就是说,不要求学生用语言概括出分数的意义,但要能够结合具体物体把某一具体分数的含义表述完整,这样才能说明学生真正理解了某一分数表示的含义,否则就是一本糊涂账。通过这种数学语言的教学,学生才能真正理解数学知识的含义,发展思维,增长智慧。

2.数学语言的抽象过程要清晰。

数学语言的抽象就是从众多的生活事实中舍弃非数学的,提取出共性的、共同的、数学特有的东西。提取的时候要分成两步,首先,相关的生活事实要丰富,其次,进行去粗取精,去伪存真,提炼出数学本质的东西。如教学长方形、正方形的周长,教师可以先用镜框的边线进行引入:“围成这个镜框一周木线条的总长,就叫做这个镜框的周长。”教师一边说一边用手比划,接着问:“什么是黑板的周长?”同样让学生一边用手比划,一边用语言描述。再接着让学生描述什么是讲桌的周长、教室里墙壁上画框的周长、窗户玻璃的周长等。最后让学生撇开这些具体的实物,用一句话来概括到底什么叫物体的周长?引导学生总结出:围成物体一周的总长度,叫做物体的周长。即先结合具体实物用数学语言进行描述,接着再引导学生撇开具体实物概括出纯数学语言。

3.概括时要突凸显数学语言的核心词。

语文教学中要抓住关键词、关键句进行教学,同样数学教学中也要抓住关键词、句进行教学。如上述的物体的周长描述中的“围成”、“一周”、“总长”,就是周长定义的关键词,学生进行总结的时候,教师要引导学生把这些关键性的词语凸显处理。那么,如何才能凸显这些关键词呢?

首先,举反例引出关键词,如孩子在概括周长的时候,如果没有加上“围成”这个词,教师可以在黑板上随手画上一片树叶,并用红笔描出大半个周长,质疑学生这是这片树叶的周长吗?引出“围成”这个词,说明“围成”是要首尾相连和封闭的。

其次,教师表述时语调要加重,以便引起学生注意。如上述周长的描述,教师在读围成物体一周的总长,叫做这个物体的周长的时候,特意把“围成”、“一周”、“总长”词语加重,便于引起学生注意。这样,物体的周长含义在学生头脑中才会印象深刻,而且清晰、明了。这既培养了学生的语言概括能力,又发展了学生的数学思维。

相关期刊更多

江汉石油科技

部级期刊 审核时间1个月内

中国石化集团江汉石油管理局;中国石油化工股份公司江汉油田分公司

江汉石油职工大学学报

省级期刊 审核时间1个月内

中国石化集团江汉石油管理局;中国石化集团公司经济技术研究院

数学理论与应用

省级期刊 审核时间1个月内

中南大学