首页 > 文章中心 > 计算机科学的研究方向

计算机科学的研究方向

计算机科学的研究方向

计算机科学的研究方向范文第1篇

关键词:非计算机专业;计算机教学;课程体系

非计算机专业研究生计算机教育是一个复杂和具有挑战性的问题。各学科研究生的计算机教学要求是什么?基本知识、素质和能力是什么?培养计划是什么?这些问题是必须明确回答的,只有这样才能够制定出实用的研究生计算机教学规划。

1现状及存在问题

1.1开课情况分析

目前,我校面向全校研究生(列入公共课课程目录)开课,与计算机或信息技术有关的课程共15门,包括微机控制系统及其应用、计算机网络与通信技术、嵌入式系统及其设计、软件工程专题、神经网络导论、神经网络理论及应用、微机控制系统及应用、计算机通信与网络、Internet原理与技术、数据库系统原理与应用、面向对象技术、软件开发、计算方法(A)、计算方法(B)、有限元方法及其程序设计。

软件开发课程开设于1994年,由冯博琴教授发起,面向全校的研究生,采用了西安交通大学出版社出版的、冯博琴教授等编写的《软件开发》这本书。自1996年起,李波老师担任该课程的主讲教师。该课每学年上一次,1996-2007年,该课的学生人数在70~90人之间,2007-2010年,该课的学生人数稳定在40~50人之间。选此课的主要为电气、电信、能动、机械、材料等学院的学生。该课的学生以硕士生为主,每学期有5名左右的博士生选修。自1996年起,教师采用自己编写讲课幻灯并布置阅读清单的方式开展教学。

1.2国内研究综述

国内学者普遍认为,非计算机专业研究生不应从计算机应用基础起步。富春岩等[1]针对非计算机专业文史类、理工类、师范类和医学类硕士研究生的计算机教学方法,提出改革方案――“四个层次”的课程设置模式。即第一层次为计算机基础知识和基本操作,第二层次为高级语言程序设计,第三层次为计算机软硬件新知识学习,第四层次为结合专业需要开设应用课程。根据信息技术发展的要求和信息检索课的现状,研究生计算机信息检索课程的教学内容设计、教学方法设计以及教学模式设计要进行改革,要适应信息化、网络化要求。

在工科院校的研究生中开设计算机应用课程,是时展的需要。国内高校根据专业特色,为非计算机专业的学生开设了计算机课程,如中国科技大学的神经生物学专业就开设了计算机在生物学中的应用这门课,热能工程专业开设了利用Matlab建筑传热建模这门课。上海交通大学机械制造及其自动化专业开设了计算机图形学等课程。这些课程为学生在本专业的研究提供了方便的工具,打下了坚实的基础。国内大学对于非计算机专业计算机教育的改革是不遗余力的,不过目前还处于初级阶段,课程体系还不够成熟,普及率也不高。大部分学校的课程还局限在选修计算机网络、软件工程等传统课程,存在课程与本专业联系不够紧密的问题,学生反映上课与实用脱节。

国外理工科大学的研究生计算机教育为学生提供与研究方向密切相关的课程,学生每学期至多选3门课。课程要求严格,作业量大。比如,MIT的航空航天系开设了设计及最优化计算课程,人口与环境科学系开设了计算机及工程问题解决导论课程。这类课程的共同点是计算机是专业研究的辅助工具。学生在完成课程作业过程中,需要用到编程等计算机知识时,一般采用自学或旁听的方式。系统建模与仿真、软件工程、算法基础是其他工科专业开设最多的课程。国外大学为学生提供配置齐全的计算机实验室、模拟实验室或仿真实验室等,实验室有计算机专业的老师进行辅导,对全校师生开放,方便大家实现自己的想法或者作业。以我国目前的教学模式和师资情况来看,不适合实行这样的开放式教学。而把非计算机专业的计算机教育改革着眼于为学生提供与本专业相关的计算机知识、基础实验,更符合当前的实际情况。

1.3研究生计算机应用能力现状

1999年,中国开始进入高等教育的大发展阶段,中国高等教育一举从精英型变成了大众型。目前,本科生、硕士生教育规模居世界第一位,博士生教育规模在2008年已超过美国,居世界第一位。西安交通大学现有全日制在校生30 126人,其士、硕士研究生13 044人。本科专业并没有多大变化,本科人数的增加主要是合校的结果,在此期间主要进行的是研究生的扩招。在计算机能力和素质方面,普遍存在学生编程能力不强,信息技术和方法应用能力不足的情况,在导师课题中不能发挥应有作用,远不能适应专业应用的需要。目前,我们在本科阶段实施“质量工程”,各研究型大学应高瞻远瞩,及早在研究生教学阶段重视计算机教学工作。

1.4计算思维及非计算机专业研究生教学面临的挑战

2006年,美国卡内基•梅隆大学计算机科学前系主任周以真(Jeannette M.Wing)教授在美国计算机权威杂志ACM会刊上提出,计算思维是运用计算机科学的基础概念进行问题求解、系统设计以及人类行为理解等涵盖计算机科学之广度的一系列思维活动。她将计算思维与工程问题的联系给出了更清晰的描述:通过约简、嵌入、转化和仿真等方法,把一个看来困难的问题重新阐释成一个我们知道问题怎样解决的思维方法;是一种递归思维,是一种并行处理,是一种把代码译成数据又能把数据译成代码,是一种多维分析推广的类型检查方法;是一种采用抽象和分解来控制庞杂的任务或进行巨大复杂系统设计的方法,是基于关注分离的方法(SoC方法);是一种选择合适的方式去陈述一个问题,或对一个问题的相关方面建模,使其易于处理的思维方法;是按照预防、保护及通过冗余、容错、纠错的方式,并从最坏情况进行系统恢复的一种思维方法;是利用启发式推理寻求解答,也即在不确定情况下的规划、学习和调度的思维方法;是利用海量数据来加快计算,在时间和空间之间,在处理能力和存储容量之间进行折中的思维方法[3-4]。计算思维既向我们计算教育提出了挑战又指明了方向,如何在教学过程中贯彻计算思维的基本原则,是目前和未来亟待解决的一个问题。

在计算机学科(计算学科)教育方面,最有代表性和影响力的工作依然是IEEE-CS/ACM组织的Computing Curricula研究工作。CC2005报告认为,计算概念在过去的十年中发生了巨大变化,这种变化对教学计划的设计和教育方法会产生深刻影响。21世纪的计算包含许多富有生命力的学科,它们有着自己的完整性和教育学特色。研究者将报告分为5个独立的卷出版,它们分别是计算机科学卷(Computer Science―CS)、计算机工程卷(Computer Engineering―CE)、软件工程卷(Software Engineering―SE)和信息系统卷(Information System―IS)、信息技术卷(Information Technology―IT)。计算所包含的内容在深度和广度上有了巨大的增加,如何在规定的学分及学时内完成对巨量的与计算有关的基本知识传授,如何选择和抽取基本的核心的内容,是对教学工作提出的严峻挑战。

信息技术的发展对各个学科的研究与发展起到了推动作用。主要体现在如下方面:

应用数学和应用物理学的发展,使复杂自然和工程现象可用数理方程描述,用并行算法求解;传感器技术的发展,使人们所观察到的自然和工程现象的信息实现数字化;通信技术和先进网络的发展,使人们可以在任何时间、任何地点、以任何方式获取和交互信息;高性能芯片、并行计算机和软件技术的发展,使自然和工程现象实现数字化模拟和可视化,工程现象可以进行实时数字化控制,从而优化了产品质量,缩短了研发周期,提高了生产效率[2]。

如何针对科学技术的进步,尤其是信息技术的发展,培养新一代适应信息化社会的高端人才,是中国研究生教育的一个重大战略问题。

1.5结论

从以上文献和各校的实际情况可以得知,目前,非计算机专业研究生计算机教学处于各自为政的非规范化状态。虽然研究生的计算机教学和本科生不一样,不必提出统一的要求和内容,各校可独立发展出自己特色的教学体系,但目前还未见一个大学在此方面有系统的、能说得出特点的方法。

综上所述,我们认为当前的研究生计算机教育存在以下问题:

1) 在全校层面重视不够,没有开展此方面的统筹和规划工作。

2) 研究型大学的研究生计算机教学研究工作尤其薄弱,没有回答出研究生计算机教学的目的、要求、基本内容、教学方法等核心问题。

3) 目前实行的计算机课程难以说清体系,教学目标也欠清晰。

4) 由于对“计算”的概念理解不到位,造成对计算机教育的认识有偏差。

因此,我们有必要号召骨干教师和教学管理人员对以上问题引起重视,共同解决。

2教学改革思路

为响应国家提出的“知识创新工程”的号召,适应时展的需要,创建研究型大学成为我国重点高等院校发展的主要方向。研究型大学主要具有如下特征:1)能够培养出具有世界一流水平的人才。2)能够取得高水平的科研成果。3)教师队伍强大,拥有一批世界公认的学术权威和知名学者。4)学科门类齐全,基础学科具有明显的优势,同时具有强大的工科,作为学校发展的支柱。5)办学具有国际性,招收众多的外国留学生和访问学者。6)拥有一流的实验室。

为了创办研究型大学,我们提出以下几点想法和建议。

2.1计算机教育的目标定位

我们认为,在我国目前的研究型大学研究生教育中,计算机教育应该继续作为所有专业学生的培养内容并予以高度重视,应该进一步结合各专业教学改革与发展,不断强化计算机教学。为此,各大学要有明确的机构负责并实施全校研究生的计算机基础教学,提出实验室建设及加强师资队伍建设的要求。

作为计算机教学的依据和目标,研究型大学的研究生计算机知识与能力应该达到什么水平?研究型大学的核心是知识创新,对各个学科而言,应用数学和计算是从事各学科学习和科研工作的方法和工具。如何建立自然现象的数学模型,如何处理自然界的随机现象和复杂现象,如何考虑模型中典型参数的渐近行为,以及如何针对具体问题设计数值格式并进行数值分析,已经成为当代应用数学与计算领域的基本问题与基本模式。我们还知道,应用数学的方法只有通过计算机进行工具化,才能变成科学研究的锐利武器,否则会导致方法没有支持、工具缺乏内容的现象发生。若在此方面对研究生进行高水平的训练,必然会推动其科学研究手段的进步。我们认为,研究生计算机基础教学应紧密围绕提高学生采纳数学方法、使用计算机工具的能力培养上来。

有关研究生计算机基础教学的目标定位,在前提假定学生掌握了教育部高等学校计算机科学与技术教学指导委员会基础课程分委员会在2009年8月提出的计算机基础课程教学基本要求后,我们认为新的课程要求可以归纳为以下几个方面:

1) 计算机软硬件基础知识,主要掌握软件技术、体系结构及网络。具备专业领域中应用系统的集成与软硬件开发能力。

2) 掌握数学模型方法。

3) 新计算模型及新算法。

4) 掌握数值计算及数值分析方法及工具。

2.2变“传授型教学”为“研究型教学”

研究型教学的特点是:1)教师不能只满足于依照一成不变的教材一般化地“完成”教学任务,而要通过继续学习、终身学习,不断更新自己的知识结构,使自己处于学科前沿。2)教师要担负一定的具有创新性的研究课题,力争成为本学科的学术骨干乃至学术带头人。3)教师要把研究与教学有机地结合起来,在向学生传授基本知识和新知识的同时,提高学生的综合素质,帮助学生完成一些较小的研究课题,使学生具备一定的研究和创新能力。

美国麻洲大学(The University of Massachusetts)的Jim Kurose教授长期从事计算机网络的教学和研究工作,曾担任IEEE Transactions on Communications和IEEE/ACM Transactions on Networking期刊的主编。他写的计算机网络教科书被全世界300多个大学采用,此书最显著的特点是将自己的研究结果编辑成书,别人的成果自己也经过实验进行了论证。他无疑是“研究型教学”的楷模。

以往,高校本科的计算机教学分为计算机专业的计算机教学和非计算机专业的计算机教学,由于两者的教学对象不同,所以教学目标和教学内容也不同。各校大多形成了一支专门从事计算机基础教学的师资队伍,许多高校计算机专业与非计算机专业的计算机教学基本处于分离状态。这种状态是不适合研究生的培养,肯定是没有生命力的。

目前,研究型大学都有较好的计算机学科和应用数学学科。特别是经过“211”和行动计划建设,各校的学科水平得到进一步加强。各校应依托和发挥计算机学科和应用数学学科优势,统筹学校的研究生计算机教学,只有这样才能真正地变“传授型教学”为“研究型教学”。

2.3将计算机与应用数学紧密结合

计算机应用是一个范畴很大的应用领域。广义地说,凡是与计算机使用相关联的领域,都可纳入计算机应用的范畴。但对于计算机应用技术学科而言,应将计算机应用于各个行业的计算机具体应用与研究计算机应用与具体领域的共性理论、方法和技术的学问区分开来。前者叫计算机具体应用,它们应该划入具体应用领域的学科,后者称为计算机应用或计算机基本应用技术,这是计算机应用技术学科的范畴。

计算机应用技术是一门发展中的前沿学科,计算机应用技术已渗透到国民经济的各个领域,并占有相当重要的地位。该学科是其他技术或学科研究的基础,对其他技术或学科的发展具有一定的支撑作用。同时,作为一门独立的学科体系,它具有其他学科所不具备的辐射渗透作用,和其他学科相互融合,带动和促进了其他学科的发展。

计算机应用技术着重研究计算机用于各个领域所涉及的共性原理、方法与技术。学科研究范围包括人工智能、计算机图形学与CAD、图像处理与模式识别、计算机视觉、多媒体应用技术、人机交互技术、计算机模拟技术、基于网络的计算机应用技术、智能控制与机器人学、管理信息系统等。

应用数学是五个数学二级学科(基础数学、计算数学、概率论与数理统计、应用数学、运筹学与控制论)中尤为重要的一个二级学科,是联系数学与自然科学、工程技术以及信息、管理、经济、金融、社会和人文科学的重要桥梁。由于它涉及的学科与专业面广,而且地位突出,在数学学科中的地位显得越来越重要。特别的,通过建立数学模型,借助于高性能计算机,使得应用数学在科学与工程技术领域中取得了令人瞩目的成就,越来越多的应用数学方法被越来越多的科学技术研究工作者所重视。

另一方面,应用数学也是数学新问题的重要来源。应用数学的研究范围非常广泛,包括建立实际对象的数学模型、利用数学方法解决实际问题、研究具有实际背景和应用前景的数学理论等。同时应用数学的发展丰富了数学学科的内涵,扩大了其外延,使数学学科不断和其他学科相互交叉和融合,产生了许多极具生命力的交叉学科和新兴学科。

作为研究型大学,应该充分发挥多学科优势,深入挖掘数学学科对工程技术、生命科学、社会科学等学科的支撑作用,以先进的数学理论和方法提升其他学科科学研究的水平。

从以上分析可以看出,研究型大学要出高水平的成果和培养高层次的人才,应建设高水平的计算机应用技术和应用数学学科,并将两学科的学术优势变为向全校师生提供高质量的教育服务及资源,从而成为研究型大学研究生计算机基础教育的根本保障。

3课程参考

研究型大学在应用数学和计算机学科中开设了大量的课程,应用数学的主要课程有微分方程稳定性理论及应用、线性控制理论、最优化方法及应用、数理统计学导论、可靠性数学理论、多元统计分析、数值代数、特殊矩阵与新型算法、矩阵谱论、模糊数学基础、计量经济学、数理经济学、模糊逻辑与神经网络。计算机应用的主要课程有人工智能导论、模式识别、数字图像处理、多媒体技术基础及应用、计算机图形学基础、计算机实时图形和动画技术、虚拟现实、现代控制技术、信息检索、电子商务平台及核心技术、数据挖掘。

从以上内容可以看出,课程纷繁复杂,让学生摸不着头绪,也没有一个教研室能开设全部的课程。为此,有必要分层次设计研究生计算机教学,便于学生学习和组织教学。以上课程主要面向本学科的学生设计,对于非本专业的学生,只能在学习了一个基本内容后,结合自己的研究方向选修以上课程。因此,必须要分析各个学科对应用数学和计算机学科的要求现状,找出基本的和共性的要求和内容,作为公共基础类课程,制订一定明确的培养要求,向全校研究生开设。

根据计算思维的观点,并结合英国SouthBank大学的Centre for Applied Methods经验,我们建议计算机公共基础类的课程分成3个层次:计算思维类、硬软件技术类、计算方法类。计算思维类的核心课程有计算思维、计算原理等。硬软件技术类的核心课程有软件技术、体系结构、计算机网络与数字系统。计算方法类的核心课程有数学模型方法、科学计算、数值分析、新算法。

计算思维、计算原理主要讲授计算的核心概念及应用方式。软件技术包括面向对象程序设计、软件开发方法学、分布式计算,力图使学生熟练地掌握面向对象的开发方式,为今后从事研究工作的数字实验及开发本领域的系统打下基础。除此之外,学生可选修一些学科的专题课程,例如嵌入式软件的开发、可视计算等。体系结构、计算机网络与数字系统包括计算机、网络、数字系统的工作原理、系统构建方式等。数学模型方法包括形式化方法(逻辑、代数、可计算函数),可视化方法及方法对应的工具软件。科学计算包括矩阵计算、符号计算、数值常微分方程、数值偏微分方程、有限元法、矩阵演算。数值分析包括数值分析方法及工具,是计算机处理科学研究和工程技术研究的重要内容,而对于理、工、经济、管理、医学等学科,精确的数值分析技术是提高科研水平的重

要基础。新算法包括遗传及进化计算、神经网络、统计学习算法等新型计算和优化方法。

课程应遵循以数学方法为体,计算工具为用这一指导原则。通过以上课程的学习,学生可以建立系统工程的思想,掌握基本的数学方法,熟练使用数学软件工具,独立地研究自己专用的算法或数学软件工具。

4结语

总之,非计算机专业学生的计算机教学应结合特定专业具体案例,这样学习效果更好,学生更容易接受。理工科专业研究生对数值计算、数值分析方法及工具等课程很感兴趣,而经济、管理以及少量法学专业的学生选择经济统计与分析软件应用课程,这就对课程案例设计提出了很高的要求。对于同一课程,不同学科有不同的能力要求,因此在制定知识体系、课程指引、能力要求报告时,都必须参考各科具体情况,体现学科特性。在此基础上寻找学科共性,培养学生的计算思维,通过教学案例使学生学会常用工具,并学会用计算思维解决工程问题。

参考文献:

[1] 富春岩. 非计算机专业研究生计算机教学的研究[J]. 计算机教育,2006(6):38-40.

[2] 李未. 对新形势下我国计算机教育发展的思考[R]. 福州:第四届全国计算机教育论坛,2008.

[3] 董荣胜,古天龙. 计算思维与计算机方法论[J]. 计算机科学,2009(1):1-4.

[4] 周以真. 计算思维[C]//中国科学技术协会学会学术部. 新观点新学说学术沙龙文集⑦教育创新与创新人才培养. 北京:中国科学技术出版社,2007:83-85.

Study of Computer Learning Problems

――Aiming at Non-computer Major Graduates in Research Universities

LI Bo, FENG Boqin, HAN Lina

(School of Electronic & Information Engineering, Xi’an Jiaotong University, Xi’an 711049, China)

计算机科学的研究方向范文第2篇

>> 计算机科学技术在计算机教育中的应用研究 计算机科学技术在计算机教育中的应用研究 计算机科学技术在现代教育中的应用研究 浅析计算机科学技术在现代教育中的应用研究 计算机科学与技术在经济管理中的应用研究 智能化建筑中的计算机科学与技术应用研究 计算机科学与技术应用研究 浅谈计算机科学技术在计算机教育中的应用 计算机科学技术在计算机教育中的应用 计算机科学技术在高校计算机教育中的应用 网络技术在计算机辅助教育中的应用研究 计算机云技术在现代教育中的应用研究 “计算机科学与技术导论”课程在计算机教育中的作用 地方师范院校计算机科学与技术专业教学体系研究与实践 关于分层技术在计算机软件中的应用研究与分析 计算机技术在机械制造与管理中的应用研究 VR技术在计算机组装与维护中的应用研究 非计算机专业的信息技术教育研究 基于计算机网络技术在电子信息工程中的科学应用研究 计算机信息技术在职业技术教育中的应用与展望 常见问题解答 当前所在位置:l.

[4]陈向阳.美国技术教育课程百年变革的历史考察[J].职教论坛,2011,(12):81-84.

[5]万明秀,章洁.国内外中小学信息技术教育比较研究[J].教学与管理,2010,(2):159-160.

[6]张瑞梅.第72届国际技术教育年会在美国北卡罗来纳州夏洛特市举行[J].教育研究与评论:技术教育,2010,(3):88.

[7]郝志国.宣化一中的创新教育展望与乐高“做中学”[J].教育教学论坛,2011,(14):40.

计算机科学的研究方向范文第3篇

关键词:研究型教学;教学模式;网格计算;本科教学

0.引言

研究型教学理念最初是为了创办以学术研究和培养研究生为主的研究型大学而提出的。大学,特别是研究型大学,承担着创造知识和传播知识的双重任务,研究型教学就是把大学的科研和教学联系起来。由于本科教学的基础性和重要性,研究型教学就作为一种人才培养模式和教学模式在本科教学中得以应用。1998年著名的博伊报告——《重视本科教育:美国研究型大学发展蓝图》中提出改变本科教育的10大途径的第一条就是“使得基于研究的学习成为标准”,即倡导在有条件的研究型大学的本科生教育中推行研究型学习和教学。

研究型教学理念既有宏观层面的体现——创办研究型大学,乃至形成崇尚研究、鼓励创新的学术风气;也有微观层面的体现——在具体的教学实践中采用研究型的教学模式,在传授学生专业知识的同时,培养学生的创新能力,并形成教师个人科研和教学的良性互动。研究型教学引入我国以来,许多学者开展了卓有成效的工作,既有宏观层面的研究和论述,也有微观层面的运用和实践。下面介绍笔者在网格计算课程教学实践中实施研究型教学模式的一些体会和经验。

1.研究型教学模式的特征和实施条件

研究型教学模式是指融合学习与研究于一体,由传统的教师为主导的单向知识灌输转变为教师引导学生发现问题、分析问题、解决问题、评估问题,最终获取知识、培养创新能力,乃至作出实际创新的教育模式。

笔者认为在一门课程的本科教学实践中采用研究型教学模式应该包含两个方面:一是课程已有知识体系的传授要遵循知识发现的过程和规律,引导学生以研究思维模式掌握已有知识体系;二是介绍课程的未来发展方向和热门研究方向,引导学生接触前沿研究问题,甚至作出实际创新。

1.1研究型教学模式的特征

研究型教学模式要求在课程教学实践的各个环节如教学方式、课堂内容的准备和组织、实践环节、考核方式以及教学方法、教学管理等方面进行全新规划和组织。

1.1.1教学环节方面的特征

从教学方式、课堂内容的准备和组织、实践环节和考核环节等4个方面阐述研究型教学模式在教学环节方面的特征。

笔者提出如下几种基于研究型教学模式的教学方式:

(1)基于问题的学习(Problem-basedLearning):在教学实践中引导学生提出问题、分析问题、解决问题、评估问题(以期进一步改进),把学生的主动思考和学习融入到知识的讲解过程中。

(2)指导性设计(Guided Design):确立能够覆盖课程知识面的设计课题,引导学生给出设计方案,并完成课题的实现和测试,最后再完成对设计方案的评估,锻炼学生运用课程的相关知识解决实际问题的能力。

(3)案例研究(Case Study in Science):设计实际的情景或者问题,引导学生给出解决方案,建立课程知识与实际的联系。

(4)基于项目的学习(Project-basedLeaming):介绍与课程紧密相关的科研项目的情况,最好是让优秀的学生参与实际的科研项目中,为项目作出贡献的同时学习知识、锻炼能力。

(5)论文研究(Research):引导学生收集、阅读、整理论文资料,从中发现问题,并采用合适的方法解决问题,然后整理成论文的形式发表,直接为课程相关学科和研究方向的发展作出贡献。

(6)讨论班(Seminar):讨论班的方式是随意的,可以是一名或者若干名同学主讲,也可以是有主题的针对性讨论或无主题的心得体会的交流;讨论内容也是灵活设立,可以是某一个问题、设计方案、案例解决方案、科研项目相关的内容或者论文的分析、论文新成果的讨论等。

在研究型教学实践中,可以根据课程不同内容的需要灵活采用上述教学方式,如已有知识体系的传授采用基于问题的学习方式,课程实践环节采用指导性设计方式,未来研究方向的介绍采用论文研究和讨论班的方式等。

课堂内容的组织和准备,需要根据内容性质的不同(如概念、原理、技术、规范等)选择合适的教学方式,然后按照所选择教学方式的要求对课堂内容进行组织和准备。

实践环节是锻炼学生应用课程相关知识解决实际问题的关键环节,任课教师需要精心设计实践课题,制定要求和范围,引导学生发挥主动性自主设计课题,完成方案设计、实现和评估的完整的实践环节,实践环节可以采用指导性设计或案例研究等教学方式。

传统单向灌输式教学模式的考核方式一般采用闭卷考试,重点考核学生对于课程知识体系的掌握程度(当然有部分题目考核学生对于知识的运用)。研究型教学模式教学过程的考核环节需要具有与研究型教学模式相适应的考核方式。在研究型教学模式中学生掌握课程已有知识体系不是唯一的目标,运用课程知识体系解决实际问题的能力、拓展课程知识体系的创新能力是具有研究型教学模式鲜明特色的另外两个重要目标,课程考核中应突出对这两种能力的考核。

1.1.2教学方法方面的特征

研究型教学不仅在教学过程的各个环节上区别于传统的单向灌输式教学模式,而且在各个教学环节的实践中采用的教学方法也有显著区别。研究型教学模式以教师为主导、学生为主体,在教学中尤其注重引导学生主观能动性的发挥。

研究型教学实践中各个环节可以采用不同的教学方法,如表1所示。需要说明的是,这些教学方法对于研究型教学模式来说并不是完备的,任课教师可以采用其他的教学方法或者自创新的教学方法。

1.2研究型教学模式的实施条件

实施研究型教学模式需要在教学所涉及的各个方面具备一定的条件:如课程、任课教师、学生和学风、学校管理等方面,这些条件不是绝对的,但是具备这些条件将更有利于研究型教学模式的实施:

(1)课程:课程所涉及的学科和研究方向已形成体系,并处于活跃的发展时期。

(2)任课教师:要求任课教师熟悉课程的已有知识体系以及科学研究的规律;在课程相关的学科具有实际的科研经验,形成任课教师科研和教学的良性互动。

(3)学生和学风:要求学生从被动的知识接受者转变为主动的知识获取者,学校要有提倡勤于钻研的学风。

(4)学校管理:学校在研究型教学实施的初期能够提出以提倡和鼓励为主的管理措施,在研究型教学的普遍实施阶段具有规范管理的措施。

2.网格计算课程的研究型教学模式实践

笔者在为计算机科学与技术专业本科生开设的选修课网格计算课程中,尝试实施研究型教学模式,取得了初步的效果。

2.1网格计算及网格计算课程

网格是一种新型的计算基础设施和计算技术,其基本思想是计算力能够像电力一样易于使用。19世纪90年代出现网格的具体实现形式——网格中间件Globus Toolkit(简写为GT)。网格计算是多种计算机技术融合的一门交叉学科,如计算机网络、分布式计算、软件体系结构、软件组件技术、面向对象程序设计、信息与网络安全等;并采用了多种实现技术,如Java语言、XML、Web服务等。网格计算经过几十年的发展,已经具备自己的知识体系,目前处于快速发展中。

网格计算课程旨在为计算机科学与技术专业高年级本科生介绍网格计算这一前沿技术,具有内容前沿、技术新颖、综合性强、研究性强等特点,着力培养学生的批判性思维、锻炼学生的创新能力和解决实际问题的能力、培养学生基本的科研素质等。此外,还在本科学生的培养中发挥以下作用:

(1)构建专业知识体系:一方面网格计算课程通过运用多门先导性课程知识,起到了夯实知识体系基础的作用;另一方面,通过掌握课程本身的知识,拓展了本科学生的知识体系,开拓了学生的眼界和视野。

(2)锻炼专业基本能力:在理论知识的讲解中注意锻炼学生的逻辑思维能力,而实践等环节可以锻炼学生软件系统的分析、设计和开发能力,以及解决实际问题的能力。

2.2网格计算课程的教学实践

2.2.1课堂教学内容的选择与组织

网格计算目前没有适合本科教学的成熟教材,这就需要按照本科教学的要求和网格计算课程的目标对网格计算的知识体系进行筛选,在课时要求内选出网格计算技术的最为主要的内容。

在筛选出主要内容以后,运用基于问题的学习这一教学方式,对课堂内容进行组织,把教学内容组织为一个个粒度各异的问题,按照背景介绍提炼问题分析问题解决方案方案评价的方式介绍课程内容。如在第一课概述部分,首先从企业计算的发展需求、科学计算的发展需求、计算技术本身的进步等多个方面介绍背景,得出共同的需求——计算要在更为宽广的范围内进行,从而得出网格计算的定义,即网格计算要解决的问题——“在广泛分布、动态、自治的网络环境中构建虚拟组织”。而后续各个章节的内容就是这个最大粒度的问题的解决方案,在后续章节的讲述中要注意呼应这个问题。最后一章——网格计算的研究方向则隐含了对这一问题解决方案的发展和评价,如在介绍Web服务资源框架,通过介绍以业界为主提出的Web服务存在的问题——无状态支持,得出“如何为Web服务提供状态支持”这一问题。然后介绍两种解决方案——开放网格服务基础架构和Web服务资源框架两种解决方案。最后对两种解决方案进行评估,指出Web服务资源框架方案的优势所在。

在WSRF服务的编程技术相关章节的教学中,主要采用了示例法:搭建网格的运行环境和编程环境,通过编写一个个具有代表性的WSRF实际程序,结合实例程序的代码讲解,并不断与Java程序设计、设计模式等课程中的知识点相联系,使学生掌握不同类型的WSRF服务的编写方法和流程。

在最后一章——网格计算的研究方向介绍时,主要采用了基于问题的教学方式,把各个研究方向要解决的问题交代清楚,给出网格计算领域的主要学术期刊和国际会议名称,供学有余力和有进一步研究兴趣的学生参考。

网格计算课程的课堂授课内容,以及所采用的教学方式方法如表2所示。

2.2.2实践环节设计

为锻炼学生的动手能力和解决实际问题的能力,安排了一个8学时的实践环节:

(1)实验内容:搭建网格的运行环境和编程环境;设计并实现一个WSRF服务。

(2)实验要求:①WSRF服务解决一个实际的问题;②完成问题确立、分析、设计、实现的全部过程,并在实验报告中体现;③具有较好的程序演示效果。

(3)教学方式:指导性设计。

2.2.3考核环节设计

采取了与研究型教学相适应的考核环节,课程的总成绩由两个部分考核成绩综合给出:一是实践环节的成绩,鼓励实验解决实际问题;二是布置学生阅读网格计算相关研究方向至少3篇研究论文,撰写评述性读后感,文章要求符合研究论文的格式,鼓励提出自己的见解。

2.2.4与网格计算相关的后续环节培养

凭借一门课程的力量培养学生解决实际问题的能力和创新能力是有限的,能力的培养是一个持续努力的过程。一门课程的有限能量在教学活动中可以通过两个途径得到弥补:一个途径是通过课程相关的课程群建设,尤其是后续课程的建设,继续加强相关技术的理解和运用;另一个途径就是通过课外环节和实践环节,吸引有兴趣的学生利用课外时间或毕业设计,开展对该技术的深入学习和研究。

在网格计算课程结课后,我们在如下3个后续环节加强了培养:毕业设计、创新学分和星火基金等。目前,我们已经在毕业设计环节设置网格计算技术相关的设计课题和研究性课题,进一步鼓励学生在网格计算领域作出创新,吸引有兴趣的学生参与网格计算方面的实际科研项目。

2.3网格计算方向科研与教学的互动

研究型教学模式对任课教师提出了更高的要求,要求任课教师不仅要熟练掌握课程已有知识体系,而且要掌握研究的方法,最好具备相关领域的研究经验。

笔者从2000年至今一直从事Web服务与网格计算领域的科研工作,先后参与了863计划、国家自然科学基金重大研究计划、教育部中国教学科研网格ChinaGrid等项目的科研工作,并主持了北京市教委网格计算方向的一些研究性项目。在Web服务运行环境,基于服务的网格中间件、服务组合、网格工作流等方向取得了一定的研究成果,发表相关学术论文40余篇。这些经历为网格计算课程研究型教学的实施打下了很好的基础。

3.结语

笔者在网格计算课程中实施研究型教学,收到了较好的效果。网格计算课程研究型教学模式在培养学生的批判思维、创新意识方面确实比传统单向灌输式教学模式具有优越性,但是研究型教学模式的实施,需要具备较多的客观和主观条件,其实际效果要或多或少地受到这些条件的影响。

(1)任课教师主导地位的发挥最终取决于教师个人科研水平和教学水平:授课内容的选择、基于问题的学习等教学方式的准备和教学内容的整理、课堂授课的实际效果等,决定了教师主导地位的高低。要实施好研究型教学模式,就要求任课教师加大科研和教学的投入,并形成科研和教学的良性互动。

(2)学生的投入热情和主观能动性的发挥直接决定研究型教学的实际效果。教师的主导地位是一方面,但是如果在教学环节中提炼的问题不能引导学生思考、实践环节和考核环节流于形式、学生对未来的研究方向不感兴趣,研究型教学模式就不会起到应有的效果。研究型教学模式的成功实施要求学生对技术和知识具有敏感性。

(3)研究型教学模式的成功实施还需要一个恰当的开设时机。网格计算课程开设需要先导性课程,如计算机网络、分布式计算、面向对象编程等,这些先导性课程有的在本科阶段没有开设,就会影响课程效果。

参考文献:

[1]The Boyer Commission on Educating Undergraduates in Research University,Reinventing Undergraduate Teaching:A Blueprint for America's Research Universities[EB/OL].[2013-01-07].SUNY Stoncybrook.http://notes.cc.sunysb.edu/pres/boyer.nsf.

[2]张红霞,从国际经验看研究型大学本科教学改革的基本原则,高等教育研究,2006,27(12):60-65.

[3]徐岚,卢乃桂,从教学与研究之关系看研究型大学本科教学的特点[J].高等教育研究,2009,30(6):66-73.

[4]卢德馨,关于研究型教学的进一步探讨[J].中国高等教育,2004(21):24-25.

[5]袁德宁,关于宏观层面的教学质量,推进“研究型”教学方式[J].中国高等教育,2002(6):17-19.

[6]郭银章,曾建潮,徐玉斌,教学研究型大学教学与科研的关系及融合机制研究[J].计算机教育,2008(8):82-84.

[7]马岱,实施研究型教学的实践与思考[J],计算机教育,2009(10):110-112.

[8]汪劲松,彭方雁,汪蕙,等,实施研究型教学,推进创新性教育[J],中国高等教育,2003(6):26-28.

计算机科学的研究方向范文第4篇

引言

随着计算机现代智能的高速发展,计算机已经完全融入我们的生活,甚至占据了重要领域,从国家核心科技到每个人生活的小细节,都离不开计算机的覆盖和使用。我们简单的在键盘上操作几个键,打出一系列符号命令,就能使计算机按照人类的要求,高速运行和进展,从而达到人力所不能达到的速度和正确率。

我们从小学习数学,数学是什么呢?数学是利用符号语言研究数量、结构、变化以及空间模型等概念的一门学科。数学,作为人类思维的表达形式,反映了人们积极进取的意志、缜密周详的逻辑推理及对完美境界的追求。数学更多的是一种抽象的概念,是一门重要的工具学科。人类利用抽象的概念及一些固定的定律形成理论,而脱离实际应用的概念并不是人类发展学习的初衷,而是利用它们来指导实际,化抽象为实体。而计算机就由此演化。1946年2月15日界上的第一台计算机诞生在宾西法尼亚大学,主要运用于高倍数的数学运算。时至今日,计算机直接能识别的语言仍然是1、0二进制代码。

1 计算机中所需要的数学理论

计算机学科最初是来源于数学学科本文由收集整理和电子学学科,计算机硬件制造的基础是电子科学和技术,计算机系统设计、算法设计的基础是数学,所以数学和电子学知识是计算机学科重要的基础知识。计算机学科在基本的定义、公理、定理和证明技巧等很多方面都要依赖数学知识和数学方法。计算机数学基础是计算机应用技术专业必修并且首先要学习的一门课程。它大概可分类为:

1.1 高等数学 高等数学主要包含函数与极限、导数与微分、微分中值定理与导数的应用、不定积分、定积分及应用、空间解析几何与向量代数、多元函数微分法及其应用、重积分、曲线积分与曲面积分、无穷级数、微分方程等。各种微积分的运算正是计算机运算的基础。

1.2 线性代数 线性代数主要包含行列式、矩阵、线性方程组、向量空间与线性变换、特征值与特征向量、二次型等。在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分。

1.3 概率论与数理统计 概率统计与数理统计包含随机事件与概率、随机变量的分布和数学特征、随机向量、抽样分布、统计估计、假设检验、回归分析等。概率论与数理统计是研究随机现象客观规律并付诸应用的数学学科,通过学习概率论与数理统计,使我们掌握概率论与数理统计的基本概念和基本理论,初步学会处理随机现象的基本思想和方法,培养解决实际问题的能力。这些都是计算机编程过程中不可或缺的基础理论知识和技能。

2 计算机编程中数学理论的应用

计算机的主要专业知识包括计算机组成原理、操作系统、计算机网络、高级语言程序设计、数据结构、编译原理、数据库原理、软件工程等。计算机程序设计主要包括如:c语言、c++、java、编译语言、汇编语言等编程语言的基本概念、顺序结构程序设计、分支结构程序设计、循环结构设计、函数、指针、数组、结构、联合以及枚举类型、编译预处理、位运算、文件等内容,掌握利用各种编程语言进行程序设计的基本方法,以及编程技巧。算法是编程的核心,算法的运用离不开数学,数学运算正是编程的基础。

计算机科学是对计算机体系,软件和应用进行探索性、理论性研究的技术科学。由于计算机与数学有其特殊的关系,故计算机科学一直在不断地从数学的概念、方法和理论中吸取营养;反过来,计算机科学的发展也为数学研究提供新的问题、领域、方法和工具。近年来不少人讨论过数学与计算机科学的关系问题,都强调其间的密切联系。同时,人们也都承认,计算机科学仍有其自己的特性,它并非数学的一个分支,而有自身的独立性。正确说法应该是:由于计算机及程序的特殊性,计算机科学是与数学有特殊关系的一门新兴的技术科学。这种特殊关系使得计算机科学与数学之间有一公共的交界领域,它范围相当广,内容相当丰富,很富有生命力。这一领域既是理论计算机科学的一部分,也是应用数学的一部分。

2.1 计算理论是关于计算和计算机械的数学理论。主要内容包括:

①算法:解题过程的精确描述。②算法学:系统的研究算法的设计,分析与验证的学科。③计算复杂性理论:用数学方法研究各类问题的计算复杂性学科。④可计算性理论:研究计算的一般性质的数学理论。⑤自动机理论:以研究离散数字系统的功能和结构以及两者之关系为主要内容的数学理论。⑥形式语言理论:用数学方法研究自然语言和人工语言的语法理论。

2.2 计算几何学是研究几何外形信息的计算机表示,分析和综合的新兴边缘学科,它是计算机辅助几何设计的数学基础。主要内容如:贝塞尔曲线和曲面、b样条曲线和曲面、孔斯曲面。

2.3 并行计算问题是 “同时执行”多个计算问题。他的延伸学科有:并行编译程序、并行程序设计语言、并行处理系统、并行数据库、并行算法。

2.4 形式化方法是建立在严格数学基础上的软件开发方法。软件开发的全过程中,从需求分析,规约,设计,编程,系统集成,测试,文档生成,直至维护各个阶段,凡是采用严格的数学语言,具有精确的数学语义的方法,都称为形式化方法。

2.5 程序设计语言理论是研究书写计算机程序语言的学科。主要内容如:研究语法、语义、语用以及程序设计语言的优劣。

计算机科学的研究方向范文第5篇

虽然计算机设计的初衷是缘于数值计算,但是英国数学家图灵(a.m.turing)在《机器能思维吗?》(1950)一文中已经预见到计算机和自然语言将结下不解之缘,并且提出检验计算机智能的最好方法就是对语言信息的处理能力。1977年,费根鲍姆(feigenbaum)提出知识工程,计算机信息处理出现了从“数据世界”向“知识世界”的转移趋势。知识世界的载体是语言符号系统,语言信息处理的需求促使语言研究过程和语言研究成果的技术化趋势日益明显,当代语言学已凸显出“语言科学”与“语言技术”的二分互补格局,由此我在《南京师范大学语言科技系建设发展规划》(2001年2月)中提出“语言科技”的新思维。“语言科学”主要指基础性的描写语言学和理论语言学。“语言技术”主要指面向信息处理的应用语言学或计算语言学,其研究任务可划分为“文本处理技术”和“语言模拟技术”。简而言之,语言文本处理技术是通过编辑和编程,将印刷文本转化为可供计算机使用的电子文本的技术。语言系统模拟(simulation)或者语言能力仿真(emulation)技术是通过算法和编程,将自然语言的理解和生成能力输入计算机的技术。获得语言能力的计算机可以实现“人—机对话”而成为名实相符的“电脑”。为研制智能机服务的“语言系统模拟”,可比喻为“语言基因图谱分析工程”和“语言能力移植工程”。强调语言研究的技术化,并非忽视传统语言学研究存在技术性的一面,例如实验语音学和方言语音调查等。之所以以往未能突出语言研究的技术化,其原因在于——除语音研究可借助声学技术设备以外——语言研究的绝大多数领域还一直没有相应的实验性技术设备。

虽然当代语言学家不可能也不必要都转向计算语言学研究,但具有一定的语言信息处理意识却非常必要。早在1964年11月,美国科学院语言自动处理咨询委员会就在《语言与机器》的报告中明确指出:机器翻译遇到了难以克服的semanticbarrier(义障)。然而这一警告,除了致使机器翻译研究热的暂时消退以外,并没有引起语言学界的足够重视。1982年,日本制订了一个为期10年面向ai(人工智能)的“第五代计算机”即智能机的研制计划,其中包括自然语言处理装置。1992年结束时,只部分达到了预定目标。随后又公布了另一个为期10年的“真实世界计算机(rwc)计划”即“新信息处理技术计划”。(许万增1996,p.61-62)据说,90年代后期日本不得不宣布暂停研制,其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言处理装置的任务无法实现,计算机谈何“真实世界”或“人工智能”。时至今日,这一“义障”仍然没有跨越。在《新世纪将对人类产生重大影响的十大科技趋势》(新华社北京2000年12月30日电)的报道中,列出21世纪的“认知神经科学领域”和“信息技术领域”,并分别提出来“探索意识、思维活动的本质”和“计算机向智能化方向发展”的任务,然而没有语言科技领域的合作——关键是认知语义结构网络研究的根本性突破——则不可能实现。

无论从手段还是就目标,对准自然语言处理的当代语言学研究,其性质都应界定为“语言科技”。“语言科技”的内涵是以理论研究为指导,以描写研究为基础,以应用研究为枢纽,促使语言研究向计算机应用、数学、认知科学和现代教育技术领域延伸,沟通文理工相关学科以实现语言研究过程及其成果的技术化;“语言科技”的外延表现为语言工程科技、语言教育科技和语言研究科技。语言学和计算机科学等学科相结合的“语言工程科技”,研究领域是“人—机对话”,其目标主要是自然语言能力的模拟。语言学与现代教育技术相结合的“语言教育科技”,研究领域是“人—人对话”,其主要目标是实现语言教育的多媒体和网络化。“语言研究科技”是将语言研究活动与计算机工具相结合,其主要目标是实现语言学自身的计算机化,包括语料库、词库和句库的研制,语言研究的分析性、统计性、比较性和实验性软件的开发等。这一新思维既突出了当代科技发展所要求的“语言学的技术化”,又体现了以语言学为本而沟通文理工相关学科的研究旨趣。

二、计算语言学的界定要突出技术性

20世纪50年代以后,在理论方法交叉渗透而形成诸多边缘语言学的同时,语言学与计算机结合的趋势开始出现。1954年,在美国乔治敦大学所进行的世界上首次机器翻译试验,标志着计算机科学与语言学的结合已经起步。在这一研究领域,立足于不同的学科视角或知识结构,先后出现了一系列名称术语,如“语言工程”、“语言工程学”、“自然语言的计算机处理”(工科视角)、“语言信息处理”(信息学视角)、“数理语言学”(数学视角)等等。20世纪60年代以后,计算机和语言学的结合逐步深入到语言学的各个领域,形成了包括计算语音学、计算词汇学、计算语法学、计算语义学等分支学科在内的计算语言学(computationallinguistics)。其中“计算语音学”等名词,虽然计算语言学界没人提过,因为已经存在着“言语识别”、“言语合成”等计算机应用专业术语,但是从“语言工程学”到“计算语言学”的术语演变中,透露出“语言学立场”在这门交叉学科中的日益强化。虽然目前的计算机运算速度已经可以满足语言信息处理的技术要求,但是之所以“人—机对话”尚未实现,其“瓶颈”就在于现有的语言研究成果无法满足计算机处理的要求。归根结底,语言信息处理的最终目标就是“计算机模拟语言能力工程”或“语言能力移植计算机工程”。探索语言能力的性质和描写语言系统的结构,这些艰巨性工作还得由语言学家先来完成。语言信息处理或计算语言学务必以语言学为本而以计算机为用。语言学家必须具备“数字化”意识,了解计算机需要怎样的语言描写成果,然后才可能将研究目标对准语言工程。

迄今为止,正如许多发展中学科一样,“计算语言学”的定义尚无一致认定,归纳起来盖有四种观点(侯敏1999,p.2—p.6):

第一种,计算语言学是以计算机为工具研究语言学。侯敏认为,任何一个学科在使用工具方面都是自由的,使用不同工具研究一个学科会带来不同特点,但不因为使用了新工具就产生了新学科。虽然并不排除新工具的使用没有导致新学科的产生,但同样不能否认工具的变革有可能带来学科体系的革命,以致于产生新的分支或交叉学科。现代自然科学之所以能够建立,无疑得益于望远镜和显微镜的应用,前者打开了人类认知的宏观世界之门,后者打开了人类认知的微观世界之门。望远镜和显微镜带来的不仅仅是“这一个工具”,而是人类认知方式的巨大变革,从而引起了天文学、生物学等自然科学的一系列革命,产生了一系列新学科。因此,问题在于如何使用新的工具或新认知方式。如果仅仅利用计算机做语言研究的统计工具,也许不会产生新的分支学科,但是利用计算机作为语音分析和合成的工具,则形成了计算语音学。

第二种,计算语言学是把语言学成果应用于计算机。侯敏认为,计算机的应用领域几乎没有限度,什么学科的成果都可以在计算机上应用,因此在计算机上应用语言学的研究成果不足以建立新学科。问题不在于在什么学科的成果能在计算机上应用,而在于在计算机上所应用的成果的性质。与其他学科研究对象的性质迥然不同,语言学科的研究对象——语言——是人类最重要的认知符号系统和知识载体,因此面向信息处理的语言成果应用于计算机足以建立新的学科。以往的语言学研究是面向人际交流,而计算语言学研究是面向人机交流,两者具有截然不同的性质。版权所有

第三种,计算语言学是研究语言中的可计算问题。侯敏认为,虽然利用可计算理论研究语言符号是建立了一个新学科,但是这种说法偏于保守,没有把计算语言学推进语言学发展的作用充分体现出来。问题在于面向信息处理的计算语言学研究,其显著特点就是语言的可计算性。“推进语言学发展的作用”这不是计算语言学的定义,强调“研究语言中的可计算问题”未必保守,反而突出了计算语言学的显著特点。

第四种,计算语言学是建立基于计算机科学理论的语言学理论。侯敏认为,把计算机科学的基本思想和方法引进语言学领域,不但可以产生许多应用性课题,而且能够促使研究者从新的角度观察语言学,建立与传统语言学不同的理论。因此计算语言学是一种基于计算机科学理论所建立的语言学理论。问题在于:一方面计算语言学需要理论但本质上不是一门理论科学,同时并非所有的计算语言学家都乐意或适合从事理论研究,另一方面计算语言学的应用性质决定了研究成果的技术性特征,而绝大多数人可能更适合于——实际上也更需要——语言信息处理的技术性研究。

第一种和第二种是欧洲流行的广义定义,主张计算语言学是计算机和语言学的交叉,第三种和第四种是盛行于美国的狭义定义,主张计算语言学是计算机科学和语言学的交叉。也就是说,前者仅仅把计算机当成语言学研究中的一种新工具应用,而后者强调计算机学科的要求和理论对语言学的影响。陈小荷(2001)认为,计算语言学就是以计算机为手段来研究自然语言,较严格的定义是“通过建立形式化的计算模型来处理自然语言的一门科学”。要建立形式化的计算模型来处理自然语言,首先要完成适合于计算机使用的自然语言系统的描写。这一面向“人—机对话”的机用语言系统,与以往面向“人—人对话”的日常语法系统不同。因此机用语言系统的描写应当纳入计算语言学的研究范围,即完成了“机用语言系统”以后,才能“建立形式化的计算模型”使计算机获得自然语言能力。综上所论,计算语言学可以定义为——利用计算机作为工具研究语言、研究机用自然语言系统、研究语言系统或语言能力的计算性,同时建构基于计算机应用、数学模型、认知科学等相关学科基础之上的语言理论的新学科。姑且图示如下:

工具性:利用计算机研究语言

计算语言学描写性:研究机用自然语言系统

技术性:研究语言系统的计算性

理论性:建构新的语言学理论

虽然计算语言学的关键任务是研究人机之间的语言交际问题,即“如何教计算机学会说话”。但是从本质上来说,研究语言系统或语言能力的可计算性和利用计算机工具来研究语言是相通的,只是前者探索的是适合于人-机对话的语言能力,而后者讨论的是适合于人-人对话的语言规则。

依据目前的语言研究成果和信息处理技术路线,计算语言学包括应用基础研究、应用研究和理论研究三个方面。(陈小荷2001)应用基础研究指语言处理的基本技术研究。现阶段的主要进展是:1.自动分词技术:这是计算机理解自然语言的第一步。目前汉语书面语自动分词的正确率达到95%以上。2.词语特征标注技术:现阶段的词语特征包括词性和义项,这是句法结构理解的基础。两种标注可采用相似的计算模型但后者要复杂得多,目前尚无大规模的实验结果报道。3.语句分析技术:句法结构和语义结构是自然语言理解的关键技术,目前分析真实文本句子的正确率仅在40%左右。4.语料库建设技术:语料库是为特定目的而收集的言语作品集,包括语料处理和检索。研究语句分析需要存放句法分析树的“树库”,但目前的汉语语料库加工程度较低,所建立的树库很少且规模不大。5.语言知识库建设技术:语言知识包括词汇知识、语法知识和语义知识等,事实性和规则性知识分别放在机读词典和规则库中。语句分析技术之所以不能取得突破,主要原因就是目前尚无适合于中文信息处理的大规模语言知识库。

应用研究指自然语言处理的应用工具的研制。现阶段的热点主要有:1.机器翻译工具:半个多世纪过去了,机器翻译的质量仍然令人失望。现在通行的是有限范围翻译和机器辅助翻译。2.自动文摘工具:微软公司的词处理器word有用于英语的文摘功能,哈工大研制的hit-863i型中文自动文摘系统可按用户设定的比例压缩原文。3.自动校对工具:现在存在的主要问题是误报率过高,并且深层错误难以发现。4.信息检索工具:有主题词检索、全文检索两种。前者需要预先有一个主题词表;后者任意字符串都可成为检索对象。另外从语料库中自动获取各种知识的“信息抽取”在线工具的研究刚刚兴起。5.言语识别和言语合成工具:言语识别(或语音识别)可分为词语识别(计算机口语命令)、有限词汇识别(电话订票)和无限词汇识别(将成段说话转为文字)。言语合成(或语音合成)指用计算机将书面语转换为口语即“文语转换”,存在的问题主要是断词不当且语调刻板,仿真度亟待提高。

然而,如果以为应用性特征明显的计算语言学仅仅是技术,则未免失之于偏颇。计算语言学有着相应的理论研究,大致包括人工智能理论(含计算模型理论。目前的人工智能研究,主要还是集中在人工体能、人工技能。在语言能力移植电脑过程未取得实质性进展以前,还谈不上真正的人工智能)和语言学理论两个方面。例如计算机如何或是否可以模拟人脑和语言能力,如何寻找合适的语言计算模型等,就是计算语言学家特别关心的理论问题。除此之外,还有对自然语言本质属性的重新认定、面向信息处理的机用语法学理论、语言系统与数学模型的关系、语言结构和数理逻辑的关系、语言符号的数字化可能性及其局限性、语言的异质性和受限性或语域理论、元语言理论和研究方法等一系列问题。总体而言,一方面,由于牵涉的学科太多,计算语言学的理论研究还相当薄弱,另一方面,与科技发展息息相关的计算语言学不容过多地沉醉于理论探索。计算语言学的强大发展动力植根于鲜明的应用性,必须通过实践推动理论探索。

三、语言系统的计算机模式化要求

从语言学家的立场出发,语言系统的计算机模式化要求,就是要了解计算机需要怎样的语言描写成果,传统语言学(此处指非面向语言信息处理的语言学)的研究是经验描写解释型,而计算语言学的研究是实验操作技术型,自然语言系统要能进行操作技术化处理,首先必须实现语言的计算机模式化。冯志伟(1999,p.215)认为自然语言处理一般应经过三个过程:1.形式化,将所研究的自然语言问题以一定的数学形式表示出来;2.算法化,把自然语言的数学形式转换为算法形式;3.程序化,根据自然语言的算法形式编写计算机程序。侯敏(1999,p.30)认为语言系统的形式化或计算机模式化必须满足三个要求:1.高度抽象化,即从语言现象中抽象出一般规则;2.元语言的形式化,即采取形式逻辑、数学公式、程序语言等形式语言作为元语言;3.运用过程的严密化,即运用过程必须具有数学与逻辑的严密性。

袁毓林(1993)认为形式语言至少具有三个特点:基本单元的明确性、基本运算和基本关系的明确性、运算优先级别的明确性,但是自然语言在这三方面皆不明确。具体而言,1.语法范畴的边界不明,例如语素、词和词组之间、词类之间的界限不明;2.结构关系难以定义,通常所说的结构关系,如主谓、动宾等往往很难明确界定;3.层次关系不外显,人们通常根据语感和语境等来识别结构层次。侯敏(1999,p.36—40)不赞同这种分析,针锋相对地提出:1.可以根据实际需要或应用目的来确立词项或划分词类;2.结构关系分析需要深入到语义平面;3.形式语法已经给出了体现层次的结构树,在分析歧义结构中可加入语义限制,至于有些连人都解决不了的层次歧义结构也不必要求计算机解决。侯敏的观点是“理论追求的是完美,工程追求的是适用”,避开理论困难而采取工程方法,可以建立一个语言分析的近似模型。

所谓“语法范畴的边界不明”,主要是因为这些“范畴”的设置从某种程度上肢解了语言事实;所谓“结构关系难以定义”,主要是因为这些“结构”难以反映语言的本质结构;而所谓“层次关系不外显”,恰恰是语言结构的特点之一。这些探索和争论,实际上反映了三个根本性的问题:1.汉语结构语法学中长期存在的一些困扰,不仅是套用西方语法学框架框范汉语事实所产生的龃龉,而且也是语形语法学自身无法克服的固有问题。几千年来的西方语形语法学研究之所以能够存在,就是因为人脑在发育过程中逐步自建构了与认知能力协同发展的语义结构网络,为语形语法规则提供了语义选择清单与路径。虽然这些语形语法规则在人际交流中可以使用,但是在语言能力的计算机移植中却顿时陷入困境,因为计算机不存在语义网络结构的自建构功能,缺少语义激活路径。根据语形语法规则,计算机造出来的符合自然语句标准的概率极低,多为与对象世界不存在一致性的随机词语串。2.计算语言学所要求的自然语言的形式化,是基于计算机运算模式的语言研究成果。移植进计算机的“定域受限语言系统”和自然语言系统并不完全相等,严格说来,只是一种接近自然语言的计算机模式化符号系统。3.计算语言学的理论和方法,必须建立在语言的本质共性语义性和和计算机数字化运算模式的基础之上。如果对人类语言的认知语义性没有足够的认识,依然安居于语形语法窠臼而迟迟未能建构语义结构网络,语言信息处理的目标则不可能实现。

中国信息科学界有一种看法,计算机对于形态结构的印欧语言处理具有良好的支撑能力,而对中文信息处理则不然(陈力为2000)。之所以计算机对印欧语文信息处理具有良好的支撑能力,是因为印欧语文结构类型便于建立计算机处理模型。从历史上来看,谷登堡印刷术和打字机键盘都是基于字母的简约性而发明的。一方面,字母系统的符号简约性便于进行数据化处理,汉字符号的繁复性难以进行数据化处理;另一方面,印欧语的形态变化为形式化提供了识别标志,而汉语的孤立结构却没有明显的标志。依据现在的计算机处理模型,汉字的繁复性和汉语的非形态性必然导致中文信息处理中存在一些特殊问题:1.中文信息处理的第一个“瓶颈”。汉语的常用汉字数量繁多,汉字需要解决键盘输入、内部代码、汉字识别和显示、程序语言的数据类型、数据库的排序和检索等一系列问题。2.中文信息处理的第二个“瓶颈”。印欧书面语采取词分写形式,而汉语书面语采取单字连写形式。由于采用西方词法学框架,因此必须研制自动分词技术。假定考虑以“字”和“字义块”等作为汉语的结构单位,自动分词技术将相应改为“字义块”切分技术。3.印欧语的同音词较少,而汉语的同音字较多,同义词和量词也十分丰富,这些都给中文信息处理带来必须解决的难题。4.印欧语可以借助实词的形态变化即在词法层面上进行处理,汉语只有在句法和语义层面上进行处理,需要把语序和虚字的语法信息归纳出来再让计算机掌握。5.印欧语的句子结构是以动词性词语为核心的“主—谓”结构,而汉语的句子结构是以体词性词语为核心的“话题—说明”结构。印欧语的句子结构划一而句界分明,汉语的句子结构多样、成分缺省并且前后句义缠绵。

如果说语言系统是一座“冰山”,那么以上这些语言信息处理中遇到的难题还都是语言系统浮在海水上面的那一小部分,真正的障碍是隐没在海水下面的那一大部分。无论哪一种结构类型的自然语言系统的计算机模拟,包括形态语言,迟早会无可避免地碰撞上坚硬实在而又难以捉摸的“语义结构”。语言研究需要敢于在冰海下持续探索“语义结构”的潜水员。从自然语言系统来说,要让计算机理解语言通常认为必须使电脑能够解决三个问题:1.消除自然语言的一词多义;2.揭示自然语言的潜在意义;3.掌握自然语言的联想推理。这些问题都离不开语义分析,而语义分析技术尚处于探索阶段。(侯敏1999,p.247)对于第一个问题,一词多义可给出不同义项的清单。对于第二个问题,给出每一义项的显性和潜性语义特征清单。对于第三个问题,给出义项或义场之间的语义关联模式。由此可见,必须在以往的经验语感法和先验演绎法基础上,引进实验归纳法和结构优化法,消除语义“泥潭”情结,潜心于冰海中的语义“冰山”,才能逐步建构造语义结构网络。

就世界各种语言来说,语言的计算机理解的深层次难点可能还在于:1.至今尚未揭示出人类理解语言的机制,计算机只能局部模拟自然语言理解的某些简单过程;2.至今尚未完成人类理解语言所凭借的知识系统,建立人类进行语言表达的完整理论,计算机尚无从掌握人类语言的知识系统以及语言表达机制;3.至今尚未对人类语言所兼具的规则性和离散性、精确性和模糊性做出定量和定性的系统分析,计算机尚无从掌握语言系统的复杂性和语言使用的随机性。(傅永和1999,p.238—239)既然语言的理解和表达是一个以知识系统为基础的综合,因此语言系统的计算机模拟必须进行跨学科的研究,特别需要语言学、计算机科学、数学和认知科学以及百科知识学者的合作。与侧重于面对自然人语言学习的语形语法学不同,如果面向语言信息处理,那么就需要以计算机智能模式来重新确定语言学的理论基础、研究重点和研究方法。

面向自然语言处理的计算语言学理论基础,目前主要有基于语言规则性的理性主义理论(即先验主义)和基于语言随机性的经验主义理论。依据理性主义的语言学理论主要有:短语结构语法(psg)、扩充转移网络(atn)、配价语法(vg)、格语法(cg)、范畴语法(cg)、概念从属理论(cd)、多叉多标记树形图分析法(mmt)、词汇功能语法(lfg)和蒙塔古语法(mg)等。这些理论和方法,因为从“理性”出发,因此不可能反映以感受性为基础的自然语言的真实面貌,其缺失已经日益明显。为了克服理性主义理论的不足,采取经验主义理论处理大规模真实文本的语料库语言学应运而生。在收集语言资源或建立语料库的基础上,运用统计方法进行语言信息处理,语言交际过程的随机性由此得到关注。面对传统语形语法学对自然语言过程的不相适应和语义研究的复杂性,甚至有人尝试撇开语言学家的语言研究,以借助语料库逐步实现自然语言系统模拟。虽然借助语料库可以解决语言信息处理的一些问题,但是仅仅依赖语料库实现自然语言系统模拟注定此路不通。因为自然语言不是一个语料仓库,而是一个语义和语形复合性结构系统。无论是理性主义还是经验主义,都必须意识到:语言信息处理中所处理的是定域受限语言。这一研究的理论基础既不应是纯粹基于语言规则性的理性主义,也不应是完全依赖语言随机性的经验主义,而应是突出语言受限性的实验主义。世界语言学的发展经历了从经验科学到先验科学的漫长过程,计算机的发明必将促使当代语言学成为一门实验科学。强调计算语言学的实验主义,并非一概否定理性主义和经验主义,而是要在实验主义的基础上运用理性和经验的理论方法。

自然语言处理的语言理论,目前主要有基于语形的语言理解系统和基于语义的语言理解系统。前者是以语形语法研究的成果为出发点,从句法形式入手;后者是以语义研究的成果为出发点,从语义关系入手。两种理解系统在文本输入、预处理和自动分词等早期环节上基本相同,不同的是基于语形的理解系统先进行词法和句法分析,后进行语义和语用分析,基于语义的理解系统先进行语义分析和语义结构生成,后进行目标语的形式组合。生成语义学认为句子的句法特点取决于语义,语义部分才具有生成能力。认知语义学把意义看作一个植根于知识网络和信仰系统中的认知结构,理解一个语言形式的意义必须激发相关认知领域中的其他认知结构。既然语形结构只是语义结构的表层投影,既然基于语义的理解系统才符合语言的生成机制,既然语义处理才是语言信息处理的关键,那么只有基于语义的理解系统才能满足计算机对自然语言的理解和生成。

李葆嘉:论语言科学与语言技术(下)

四、人脑语言和电脑语言的性质异同

根据与“人脑语言学”的对应关系,计算语言学也可以称之为“电脑语言学”。从人脑角度出发,电脑语言学的研究是将人脑语言系统移植电脑工具的电子工程;从电脑角度出发,电脑语言学是电脑程序模拟人脑语言能力的仿生工程。

不管是系统移植还是能力仿生,首先必须认识到人脑和电脑的异同。1.构造机制的不同:人脑是生物神经系统,具有生物认知机制,而电脑是电子计算系统,具有电子运算程序。2.伴随情感的有无:人脑具有驱动感觉、思维和表达进行的情感性,而电脑只具有执行程序运算的机械性。3.经验基础的有无:人脑具有以感受性为特征的经验基础以及知识系统,而电脑即使配备了一定的知识背景,也不可能具有人脑一样的认知经验基础。4.认知理性的异同:人脑的感受和认知可以区别为非语言层次和语言符号层次,非语言层次包括直觉和感觉,语言符号层次包括知觉(游移性印象)、象觉(清晰性意象)和统觉(逻辑性抽象)。电脑的认知理性只能够定位于语言符号的象觉和统觉层次,难以具备丰富的认知层级系统。5.交流对象的异同:人脑的交流对象分别为对象世界和人际关系之间,具有交流的二重性;而电脑的交流对象只有执行程序的人或“人—机对话”的一重性,所谓“机—机对话”的实质仍然是“人—机对话”的连网,互联网交流仍然是执行者之间的交流。由于计算机永远不可能直接认知人所面对的对象世界,必须以人类的认知为中介,因此计算机永远不可能超越人类的智慧,计算机统治人类世界永远是一种不必要的担忧。

其次,必须认识人脑语言系统和电脑语言系统的差别。人脑语法或自然语言法则是在历史上逐步形成的,具有随机性、规约性、类推性和耗散性特点;而电脑语法或机用语言法则只是自然语法的再抽象化和再规范化,具有受限性、是否性、程序性和封闭性的特点。即使将来研究出适合于语言信息处理的机用语法,也不等同于自然语法。电脑所能获得的语言能力,只是自然语言的一部分或有限语言能力。因此,移植进电脑的语言系统必须进行界定:1.定域化语言:因为人脑语言是一个可以分为不同语域的复合性层级系统,所以必须首先确定电脑语言与人脑语言的对应层级,最佳选择就是规范性的日常语域。2.受限化语言:只能采取有限网络模式,才能将自然语言裁剪成适合计算机运算模式的机用语言。3.形式化语言:必须将定域受限语言的语义结构和语形规则分别形式化。4.算法化语言:借助一定的数学模型,将形式化语义和语形系统数字化。5.编程化语言:依据一定的程序语言,将数字化语义和语形系统编程化。

语言信息处理的目标,就是在受限性语言层面上逐步实现人—机对话。归根结底,自然语法≠电脑语法,电脑语言系统是通过建立形式化的计算模型进行处理的定域自然语言系统。电脑的运算速度可以远远超过人脑的思维速度,但是电脑不可能具备人的能动性认知行为。语形语法学面对是人—人对话,人们在语言习得过程中不知不觉地形成了建立在认知能力之上的语义结构网络,为语形语法规则提供了一份语义可选性清单。语言信息处理面对的是人—机对话,而语言“白板”的计算机并不具备这份语义可选性清单。语形语法规则,在教计算机如何说话的过程中顿时陷入困境。几千年来的西方语法学之所以能够延续下来,全赖人们具有基于认知能力的语义结构网络的自建构功能。反之,正是这一语义结构网络的存在,致使以往的语言学家误以为语形语法就是语法的全部或主要,而将语义结构法则长期放逐出语法学领域。

自然语言系统的计算机处理对西方具有两千多年传统的语形语法学提出了根本性的挑战,也为东西方语言学的合流带来了新的契机。回顾20世纪东西方语言学合流的历程,之所以出现西方语法学框架和汉语事实的错位,是因为合流基点的选择陷入误区。西语具有丰富的语形结构(这里指形态变化)而汉语基本没有(汉语主要依靠语序、虚词、韵律和语气,另外对语境或语用具有极大依赖性)。选择建立在形态变化基础上的西方语法学框架作为合流的基点,必然导致这一过程的曲折。反思的结果显示,东西方语言学合流的基点应当是建立在人类语言所共有的语义结构基础上的语义语法学理论。随着对语言能力研究的进一步深入和语言信息处理对传统语言学的挑战,传统语义研究在新的形势下得以复活。随着世界语言学从20世纪60年代以来出现了从语形研究向语义研究的转移,东西方语言学研究的合流将在新的基点上逐步实现。

五、面向语言系统模拟的语义语法学

尽管乔姆斯基理论认识到语言形式化的重要性,但生成语义学才是语言研究本体的转向。虽然配价语法和格语法的引进和对汉语语法意合性的认定,促使语义句法研究成为当代中国语法学界的热点,但迄今为止,中文信息处理应用系统自觉而全面地运用语义研究成果的鲜见。这一现状的表象似乎是语义研究成果不多,其根源却在于没有彻底认识到——必须从人类(不限于印欧族群)普通(不限于欧洲唯理主义)语法(不限于形态语言)的高度,来解决语言理论和研究方法的创新。无论是语言信息处理,还是语言机制揭示,汉语研究都需要既能反映汉语个性又植根于人类语言共性的原创理论。

人类的认知表现为对象世界的符号化(认知对象的符号化形成语义单元)、范畴化(语义单元的范畴化形成语义类别)和关联化(语义类别的关联化形成语义结构)。西方语言中的词法范畴原型是先民通过语音形式所表现出来的认知范畴或语义类别。语言的形态标记性、单位分布性和结构层次性都是语义类别关联化在表达层面的投影或者制约。一方面,随着人们认知的发展,反映原始认知足迹的形态范畴(如原始生物观的“性”、原始计算法的“数”)的价值日益消解;另一方面,随着语言系统的演化,表现原始认知足迹的语法手段又不可避免地合并、弱化和丧失。语序、功能词等手段的补偿,导致语言结构类型从综合型向分析型方向嬗变。这一过程证明,原始词法范畴在句法结构中并不具有充分必要性。一种语言可以没有词法形态变化,但不可能没有语义结构规则。不同的自然语言之间之所以可能互译,其基础就是存在可互通性语义,尽管结构类型迥然不同。(李葆嘉2001)

由此可见,人类语言的本质属性是语义性,其他属性都是语义性的派生。人类语言的共性可以概括为:在人类感知对象世界的过程中,神经机制依据象似性模式促使对象世界语符化,音义一体化的语符具有实体性和范畴性,由此组成的语义结构具有语境性和关联性,语义结构的语境性表现为语用、语义结构的关联性投影为语形,而语义结构模式具有生成性。图示如下:

神经机制语义实体语境-语用性

象似性认知过程语符语义结构生成性

对象世界语音范畴关联-语形性

在自然语言能力移植工程中,计算机需要的是具有语言本质共性的语义结构网络,由此有必要首先建构语义语法学。所谓“语义语法学”不是“语义+语法的学”,而是以语义为研究对象的语法学。把语义结构的表层投影——语形作为语法研究的纯正对象,有悖于语言结构的真实本体。乔姆斯基试图在语形结构进行数理化描写的基础上,建构反映语言能力的生成语法体系势必捉襟见肘。这一初始思路必然导致“抛开语义——深层语义——语义解释——逻辑表达——逻辑式”这样的“不断革命”。虽然乔姆斯基强调语言研究的目的在于揭示语言天赋,但依据其理论思路:普遍语法(研究对象)——语言能力(哲学基础)——自然主义(学科性质)——数学方法(方法借鉴)——符号描写(形式载体)——形式语法(研究成果),显然缺少人类天赋中最关键的认知性语义能力这一环节。完全排斥语义的经典理论阶段,其句法结构规则必然导致生成出一批语言事实中并不存在的语符串。即使在不得不引进语义解释的标准理论阶段,也没有放弃把形式结构作为句法生成的基础规则。然而,任何脱离语义的语法形式化注定流产,不可能达到揭示语言生成机制或普遍语法的目标。

如果说语义语法学的语言观强调人类语言的本质共性是语义性,那么语义语法学的语法观则突出语义结构是语法的主要研究对象。在欧洲传统语文学中,“语法”主要指基于形态变化的词法和句法规则。在历史比较语言学时代,“语法”包括语音法则,因此才有“青年语法学派”之称。20世纪的结构主义和描写主义促使“语法”研究的对象日益窄化。依据语言是音义符号系统这一论断,所谓“语法”即语言结构之法,当包括语音结构法和语义结构法。在语言系统的第一次划分中没有通常所说的“语法”即语形结构法的位置。语形结构是语义结构的表层投射或制约,语形结构法依附于语义结构法。语言系统的音义二分以及相关研究学科,图示如下:

语音分析(生理语音学、物理语音学)

自然语音解析

语言(语音学)语音结构(音位系统学、语流节律学)

符号语形结构(语形语法学)

系统语义投影聚合性义场(词类)

(语义学)语义结构(语义语法学)

组合性义场(句模)

以往的“语音、词汇、语法”三分法,迷糊了研究者的视线。虽然语形语法研究在语言交际和语言教学中具有一定或者相当用途,但是从研究角度而言,却避开了关键的语义结构法则。

人类认知的本质是对世界图式的语义符号化,人所认识的世界就是存在于语言符号系统中的世界。语义结构网络表现为“实体范畴化”(聚合性义场)和“关系模式化”(组合性义场)的相互交错。广义语义不仅包括实体范畴化的词汇语义和关系模式化的结构语义,而且包括语境范畴化的语用语义。语法的真实本体或语法研究的切实对象应当是语义范畴及其关联模式。结构语法和生成语言的不同之处,在于前者强调“语言系统”,而后者强调“语言能力”,但其共通之处却在于皆以语义结构的虚象——语形作为研究实相,始终游离于语法真实本体之外。依据语形语法学的有限范畴和简略框架(词类划分、语形成分、短语结构、句子成分等),既难以深入分析句法结构,更不可能有效驾驭语言结构的生成机制。从表达来说,语义编码是一切语言编码的基础,要揭示语言的奥秘必须从语义入手。语形型语言(并非只有语形,而是语形隐含或遮蔽了语义语法)和语义型语言(并非没有语法,而是没有形态变化语法)的研究基础,都应是语符的语义性。语义语法学的语法观突出语义结构,表面上突出汉语的个性特征,实质上受制于人类语言的本质共性。关于语形型语言和语义型语言的大致异同,图示如下:

语形型语言:形态手段

语义范畴——语义网络(知识世界)——元语言(日常认知)

语义型语言:非形态手段版权所有

人类的语言符号系统,本质上是一个意义隐喻系统。作为人类认知基本能力的隐喻,其更深层次是源于动物性感受的模仿(基于事物的相似性)与借代(基于事物的相关性)这两种认知能力。关于语言符号系统的形成大致流程,图示如下:

神经机制情绪模式

认知机制具体感受元语言(日常认知)——语义网络(知识世界)

对象世界经验框架

西方语法学源于古希腊的“语言·哲学·逻辑”混沌母体,西方哲人的逻辑研究基于思辩性语言活动。因为逻辑的基本单位是概念和命题,因此人们往往把注重语义的语法研究混同于逻辑的研究。汉语实词的义类划分不是根据逻辑意义,而是借助日常语义;汉语句读之间的语法关系不是根据逻辑关系,而是遵循事理关系。虽然逻辑规则是语法规则的部分再抽象化,但泛逻辑主义却致使人们误以为语法规则都可以逻辑化。自然语言首先具有本能传情性和日常认知性,语言结构法则主要依据广泛存在于日常生活中的事理关系。这一事理关系包括:时序先后性、空间位置性、主观因果性、主观目的性和评估好恶性等等。不是日常语法以思辩逻辑为基础,而是思辩逻辑以日常语法为基础。同样,虽然可以借用数理符号转写具有算法性的语言结构法则,但不可把语言法则混同于数理逻辑规则。

语义语法学的技术路线,是从建构现代汉语元语言系统到建构现代汉语语义网络。虽然自然语言信息处理依赖于语义结构的形式化,但是一些语言学家往往视语义研究成果为“非语法”,并且对其形式化的可能性持怀疑态度。一方面语义单元不具备语形变化的显著标记,而包含较多的意会性;另一方面语义单元并非没有范畴标准,也具有感受或认知的一致性。所谓语义的客观性和主观性就是语义的集体认同性和个人联想性,其本质是个体使用的“素单位”和集体认同的“位单位”之间的矛盾。语义语法学的研究对象首先是具有集体认同性的“义位”(标准体),然后才有可能是仅具个人使用性的“义素”(义位变体)。尽管语义单元或语元数量众多,语义结构关系复杂,但它们以潜在的元语言系统为基础。语义结构网络由语元实体和语义关系组成。同类语元之间具有聚合性语义关系,异类语元之间具有组合性语义关系。换而言之,每一语元都具有两种互相制约着的语义关系,一是同一义场内的各个“义位”之间的“义征”(语义特征)异同,一是不同义场的“义位”之间的“义联”(语义关联)异同。由此,可以依据义征和义联的异同而建立聚合性义位系统和组合性义联系统,在两者基础上在编织语义结构网络。句法结构的形式化应当是语义结构的形式化,而语义结构的形式化就是义场关联模式。

现代汉语语义语法的基础研究是建立“现代汉语元语言系统”,这一研究可比喻为“语言基因图谱分析工程”。其研究思路是:首先归纳出现代汉语词典中用于释义的最低限量词汇,以建构释义元语言系统;其次依据日常语言交际和语言教学中的用词,参照释义元语言以建立词汇元语言系统;再次抽象出义征范畴以建立析义元语言系统,完成语义标记集。在以上成果基础上,一方面可以结合认知心理学和神经语言学的成果进一步研究认知元语言系统,另一方面可以依据语言信息处理的要求,建立机用元语言系统。(李葆嘉等2002)

在现代汉语元语言系统这一基础性工作完成以后,才可以逐步建构现代汉语语义结构网络。研究程序和主要方法大致如下:1.义征对比法。依据有限网络模型,借助析义元语言系统对义元进行形式化描写即标注义征。给出义元在义场内的语义特征,其目标是建构聚合性义场。2.义联配比法。依据有限网络模式,对语义符号的配比关系进行形式化描写即标注义联,在分析和描写过程中归纳出关联性元语言系统和语义结构关联框架。语义句法的本质是相关义场之间的配比,因此义联标记体现着义场配比。给出义场之间的语义选择或语义制约规则,其目标是建立组合性义场。3.语形标记法。汉语具有词序、虚词和韵律等形式手段。韵律手段属于语音句法,可姑且不论。汉语的语形大致可以概括为两种:附着在词或词组上的词语级语形是完构成分;附着在句干上的句子级语形是完句成分。在进行汉语语形范畴化研究的同时,寻找语义关联和语形成分之间的对应性,然后对语形系统进行层级性形式化描写。4.合成建构法。在义征、义联和语形研究成果的基础上,通过相关标记的合成以建构语义结构句模系统。

“语言能力移植工程”的语言学部分主要是语义结构网络研究。通过建立形式化的计算模型,可以将语义结构网络进一步形式化、算法化和程序化。语义语法系统研究的每一结果,都可以也应当用计算机操作作为验证。以往的语法学研究,除了执著于语形研究以外,还有一个根本性的缺憾,就是不具备自然科学研究中的实验手段,因此难免经验性、臆断性和游移性等。采取计算机作为研究和验证手段,从而使语法研究具有鲜明的技术性和可证伪性。人们常说,只有学会一门外语,人们才真正了解自己的母语。与此同理,只有计算机掌握了自然语言,人类才深入揭示出自然语言的奥秘。换而言之,根据语言学习对象的不同,可能存在三种教学语法:一种是母语教学语法(着重于语形语法,因为人类对语义结构网络和语言知识库具有自建构能力),一种是对外语言教学语法(需要在语形语法的基础上增加与语言理解相关的社会文化知识,因为不同语言的语义结构网络具有不同的文化性),一种是计算机模拟语言能力的语法(需要语义语法和语言知识库,因为计算机不具备语义结构网络自建构能力以及与语言理解相关的知识系统的自学习能力)。也只有揭示出语义结构网络,语法学研究才能够在语形语法研究的基础上取得全面突破,语法形式、语形语法意义和语义语法意义,才能够全面贯通。

尽管语义研究及其形式化相当困难,但是在语义语法学理论的指导下,根据定域(语言定域)、定量(词语定量)、定性(义元定性)、定式(义联定式)的“四定”原则逐层实施,自然语言的理解与生成有可能在单句模式系统中首先实现。只要对语言本质的探索和人脑语言移植电脑的目标不变,就必须穿越语义研究的沼泽地。如果说20世纪是语形语法学的世纪,那么可以预言21世纪将是语义语法学的世纪。

六、语言科技复合型人才的培养

自然语言的计算机理解和生成已经成为国际语言学研究的聚焦,语言信息处理的技术水平已经成为当前衡量一个国家现代化水平的重要标志之一,尽快培养兼通语言学、计算机科学、数学和认知科学的复合型人才迫在眉睫。据《美国计算语言学杂志》1986年统计,全球设置计算语言学博士学位的大学已有105所,其中美国63所。在英国曼彻斯特大学已有计算语言学的学士和硕士专业。(侯敏1999,p.27)

中国的机器翻译在20世纪50年代启动,但由于反复不断的政治动乱停滞了近20年。1981年,成立了中文信息学会。1987年,隶属于中文信息学会的计算语言学专业委员会成立。通过计算机专家和语言学家的努力,已经取得语言信息处理的一系列成果。但迄今为止,中国大陆计算语言学方向的研究生的培养,或附属在汉语言文字学、语言学及应用语言学学位点,或附属在计算机应用等学位点,专门性的本科专业迄今尚无设置。根据目前中国高等教育学科体系,一方面,语言学和计算机科学分属不同专业,兼通语言学和计算机科学人才的培养如隔重山;另一方面,“中国语言文学”学科中,作为学术或准科学的“语言学”在前而作为艺术或教化工具的“文学”为重,两者始终捏而不合。