首页 > 文章中心 > 左传

左传

左传范文第1篇

祭仲①曰:“都城过百雉②,国③之害也。先王之制,大都不过参国之一④,中五之一,小九之一。今京不度⑤,非制也。君将不堪。”公曰:“姜氏欲之,焉辟⑥害!”对曰:“姜氏何厌之有!不如早为之所。无使滋蔓。蔓,难图也。蔓草犹不可除,况君之宠弟乎!⑦”公曰:“多行不义必自毙。子姑待之。”

――《左传・隐公元年・郑伯克段于鄢》

宫之奇谏曰:“虢,虞⑧之表⑨也。虢亡,虞必从之。晋不可启⑩,寇不可玩{11}。一之为甚,其{12}可再乎?谚所谓‘辅车相依,{13}唇亡齿寒’者,其虞、虢之谓也。”

――《左传・僖公五年・宫之奇谏假道》

曰:“吾知所过矣,将改之。”稽首而对曰:“人谁无过?过而能改,善莫大焉。{14}”

――《左传・宣公二年・晋灵公不君》

言之无文{15},行{16}而不远。

――《左传・襄公二十五年》

虢射曰:“皮之不存,毛将安傅?{17}”

――《左传・僖公十四年》

注释:

①〔祭(zhài)仲〕郑大夫,字足。

②〔雉(zhì)〕古代计算城墙长度的单位。长三丈,高一丈,为一雉。

③〔国〕指诸侯国家。

④〔参国之一〕国都的三分之一。此处的国是指国都。

⑤〔度〕法度、规定。

⑥〔辟〕通“避”。

⑦〔无使滋蔓。蔓,难图也。蔓草犹不可除,况君之宠弟乎〕不要让他的势力继续滋长蔓延。蔓延开来,就难以对付了。蔓延的野草尚且不能铲除,何况是您骄宠的弟弟呢!

⑧〔虢(uó),虞〕均为国名。

⑨〔表〕外表,这里指屏障、藩篱。

⑩〔启〕启发,这里指启发晋的贪心。

{11}〔玩〕这里是轻视、玩忽的意思。

{12}〔其〕反诘语气词,难道。

{13}〔辅车相依〕车载物,用辅支持,所以辅与车有相依关系。辅:车两旁的板子。

{14}〔人谁无过?过而能改,善莫大焉〕哪个人能不犯错误呢?犯了错误能够改正,没有比这更大的好事了。

{15}〔文〕文采。

{16}〔行〕流传,流行。

左传范文第2篇

《左传》中的名句:

辅车相依,唇亡齿寒。皮之不存,毛将焉附。欲加之罪,何患无辞。言之无文,行而不远。不去庆父,鲁难未已。外举不弃仇,内举不失亲。居安思危,思则有备,有备无患。人非圣贤,孰能无过?过而能改,善莫大焉。好学而不贰。惩恶而劝善。修己而不责人。祸福无门,唯人所召。

(来源:文章屋网 )

左传范文第3篇

关键词:左传 伏笔 说明历史

《左传》亦称《左氏春秋》、《春秋左氏传》,旧传为春秋时左丘明所作[1],是一部杰出的史传文著作,多用史实解释《春秋》,记事详明。其原本与《春秋》各自成帙,西晋杜预(字元凯)合《左氏春秋》与《春秋经》作《春秋左氏经传集解》[2]。《左传》起于鲁隐公元年(公元前722年)终于鲁悼公四年(前463年),涵盖约二百五十多年的历史,将众多纷杂的历史事件叙述得清楚、得当,不仅在史学上价值很高,在文学上也有突出的历史地位。清代刘熙载说:“烦而不整、俗而不典、书不实录、赏罚不中、文不胜质,史家谓之五难,评左氏者,借是说以反观之,亦可知其众美兼擅矣。”[3]在左氏高超的叙述手法中,伏笔的运用,是他成功的一个重要原因。

伏笔是“文章描写、叙述的一种手法,指作者对将要在作品中出现的人或事物,预作提示或暗示,以求前后呼应。”[4]《左传》中多处运用了伏笔,共计达二百多处,而且伏笔运用的方式也多种多样。前人对于《左传》中的伏笔,专门研究的很少。

清刘熙载《艺概》:“揭全文之指,或在篇首,或在篇中,或在篇末。在篇首则后必顾之,在篇末则前必注之,在篇中则前注之后顾之。顾、注,亦所谓文眼者也。”[5]王凯符在《古代文章学概论》中认为:此处的“顾”应解释为“照应”,而“注”则解释为“伏笔”。刘熙载仅是从写作角度谈伏笔,并未涉及具体文本。

评点家冯李骅《读〈左〉卮言》里说《左传》有二十八叙法[6],其中的预叙,我以为就是《左传》中伏笔的别称。

还要提到,宋代王应麟在《玉海》中说,《左传》“或先经以始后经之事,或后经以终前经之义,或依经以辩理,或错经以合异”[7]。这虽是主要论述《左传》与《春秋经》的关系,但倘若从广义之伏笔来看,“先经以始后经之事”也隐约含有伏笔的意味。

《左传》对伏笔的运用,虽都是在人或事之前预著一笔,但具体运用伏笔时却多种多样,不拘一格,充分显示了《左传》作者出神入化的文学技巧。

1.以诸侯之间的政治、军事事件为伏笔

① 隐公元年:“郑共叔之乱,公孙滑出奔卫。卫人为之伐郑,取廪延。”[8]故隐公二年:“郑人伐卫,讨公孙滑之乱也。”

② 隐公四年:“宋殇公之即位也,公子冯出奔郑;郑人欲纳之,及卫州吁立,将修先君之怨于郑……于是陈、蔡方睦于卫,故宋公、陈侯、蔡人、卫人伐郑;围其东门,五日而还。”郑人不甘,隐公五年,郑人有了一个复仇机会:“宋人取邾田。邾人告于郑曰:‘请君释憾于宋,敝邑为道。’郑人以王师会之,伐宋,入其郛,以报东门之役。”

③ 文公七年:“秋八月,齐侯、宋公、卫侯、陈侯、郑伯、许男、曹伯会晋赵盾,盟于扈。晋侯立故也。公后至,故不书所会。……”这个迟到招来了文公八年“晋人以扈之盟来讨”。

由上可见,诸侯之间发生的各种小战争,有很多是由相互报复、外交失误导致,其原因繁不胜繁,《左传》采用伏笔,并加以点明,使得“烦而变整”,有利于说明历史。

2.以倒叙为伏笔

① 庄公八年:“初,公孙无知谑于雍廪。”于是庄公九年:“九年春,齐大夫雍廪杀无知。”

② 僖公五年:“初,晋侯使士蒍为二公子筑蒲与屈,不慎,置薪焉。夷吾诉之。公使让之,士蒍稽首而对曰:‘臣闻之:“无丧而戚,忧必雠焉。”无戎而城,雠必保焉。寇雠之保,又何慎焉?守官废命,不敬;固雠之保,不忠。失忠与敬,何以事君?《诗》云:“怀德惟宁,宗子惟城。”君其修德而固宗子,何城如之?三年将寻师焉,焉用慎?’退而赋曰:‘狐裘龙茸,一国三公,吾谁适从?’”果然,僖公六年“六年春,晋侯使贾华伐屈。夷吾不能守,盟而行。”士蒍多年之前就已经预见到晋国将乱,《左传》用倒叙为伏笔点明晋国局势。

3.以预言为伏笔

① 桓公十七年:“初,郑伯将以高渠弥为卿。昭公恶之,固谏,不听。昭公立,惧其杀己也,辛卯,弑昭公而立公子亹。……公子达曰:‘高伯其为戮乎?复恶,已甚矣!’”果如其言,桓公十八年:“秋,齐侯师于首止。子繻会之,高渠弥相。七月戊戌,齐人杀子繻而轘高渠弥。”

② 僖公二十一年:“秋,诸侯会宋公于盂。子鱼曰:‘祸其在此乎!君欲已甚,其何以堪之?’于是楚执宋公以伐宋。冬,会于薄以释之。子鱼曰:‘祸犹未也,未足以惩君。’”僖公二十二年:“三月,郑伯如楚。夏,宋公伐郑。子鱼曰:‘所谓祸在此矣。’……楚人伐宋以救郑。……宋师败绩。公伤股,门官歼焉。”宋襄公由于欲望太重,招致泓之战的败绩,子鱼准确地预言了宋襄公这一祸事的到来。

4.以神鬼、占卜、异象为伏笔

① 僖公三十二年:“冬,晋文公卒。庚辰,将殡于曲沃,出绛,柩有声如牛。卜偃使大夫拜,曰:‘君命大事,将有西师过轶我。击之,必大捷焉。’”果然,鬼魂之命灵验了。僖公三十三年:“夏四月辛巳,败秦师于殽,获百里孟明视、西乞术、白乙丙以归。”

② 僖公十四年:“秋八月辛卯,沙鹿崩。晋卜偃曰:‘期年将有大咎,几亡国。’”僖公十五年:“秦伯伐晋。卜徒父筮之曰:‘吉!涉河,侯车败。’诘之,对曰:‘乃大吉也。三败必获晋君!其卦遇《盅》,曰:“千乘三去。三去之馀,获其雄狐。”夫狐《盅》,必其君也。《盅》之贞,风也;其悔,山也。岁云秋矣,我落其实而取其材,所以克也。实落材亡,不败何待?’”晋异象表明有大灾难、秦卜筮战果,都预示晋军将大败。僖公十五年:“三败,及韩。……壬戌,战于韩原。……秦获晋侯以归。”

5.以琐事、小事为伏笔

① 桓公元年:“宋华父督见孔父之妻于路,目逆而送之,曰:‘美而艳!’”华父督对孔父之妻已生歹念,于是,桓公二年:“二年春,宋督攻孔氏,杀孔父而取其妻。”

② 桓公三年:“芮伯万之母芮姜恶芮伯之多宠人也,故逐之,出居于魏。”预先交待芮伯居魏,桓公四年:“秋,秦师侵芮,败焉……冬,王师、秦师围魏,执芮伯以归。”

③ 僖公三年:“齐侯与蔡姬乘舟于囿,荡公。公惧,变色;禁之,不可。公怒,归之,未之绝也。蔡人嫁之。”齐侯与蔡姬夫妻间玩笑开大了一些,蔡人让蔡姬改嫁,得罪了齐侯。僖公四年:“四年春,齐侯以诸侯之师侵蔡,蔡溃。”两国战端,实始于僖公三年“乘舟”之事。

6.以双方言行为伏笔

刘熙载说:“左氏叙战之将胜者,必先有戒惧之意,如韩原秦穆之言,城濮晋文之言,邲楚庄之言皆是也。不胜者反此。观指睹归,故文贵于所以然处著笔。”[9]刘氏之论述,十分精辟,《左传》中大凡大战未始,将获胜的一方总是言语、行动十分小心,努力合于礼仪,体恤百姓。而要失败的一方却骄横跋扈,不听劝谏,四处作恶。这也是《左传》作为史书,警劝后人之处。

《左传》对于伏笔的运用,很有特点。首先,运用伏笔的形式是多种多样的。上面已总结了六种伏笔的运用方式,相信还有其它一些形式,由于本人学力所限,尚未发现。其次,《左传》运用伏笔大都不着痕迹。若不是细细查看,前后贯连,就不易看出伏笔。由于《左传》是一部史书,它所记载的事件,人们多会从历史角度,即事件本身存在这一角度来接受,大多将事件之间的关系视为平行的,忽略了事件之间的联系;又因为伏笔往往是与将发生的事毫无相关之处,隐蔽性强,是一条历史发展的内线;加之《左传》作者高超的文学技巧,使得伏笔的运用不着痕迹,鬼斧神功。我想,这大概就是很少有人专门研究《左传》中伏笔的原因吧。再次,《左传》中的伏笔大多是一种先知先觉式的,使人感觉整个历史的发展都有一种内在的秩序和方向。而且伏笔中有很多是鬼神占卜之说,我们不能据此就确定《左传》作者相信鬼神占卜,但不可否认,其中包含了一种宿命论的历史观。至于众多鬼神占卜的出现,我想,一个原因是,古代巫史不分,因而史书中多夹杂有神鬼之事的记载,左丘明在引用古史时难免会引到一些神鬼异事。还有一个原因,是由于后天造成的。左丘明是在占有史实之后,来写《左传》的。冯李骅说《左传》“议论之精,辞令之妙,都经妙手删润,然尚有底本。至叙事全由自己剪裁。”[10]也就是说是记载前人之事,在通晓史实的情况下,加以整理,加之时代的局限,产生一些唯心的观念也情有可原。

伏笔的运用,为《左传》增光添彩。首先,体现在文学性上:二百五十多年的历史,纷繁芜杂,千头万绪,极不易把握。伏笔不仅从结构上使得文章前后呼应、浑然一体,而且使文章更隽永,更耐人寻味,增强了文章的可读性。同时,由于伏笔多是较细小的事件,更细腻地刻画了一些人物形象,如卫州吁、秦穆公、晋文公等,增强了《左传》的文学性。而《左传》就其主要方面看,更大的意义在于历史学方面的价值。伏笔的运用,对《左传》史学上的意义也起了很大作用。《左传》不像《春秋经》那样,单是记录历史,它更要说明历史。运用伏笔,使读者清楚事件发生的原委,了解历史发展的原因。《御览》六百十引桓谭《新论》曰:“左氏经之与传,犹衣之表里相待而成。有经而无传,使圣人闭门思之十年,不能知也。”可见,《左传》在说明历史、传达历史上,成就远高于《春秋经》以及《公羊传》、《穀梁传》。这其中,伏笔的运用功不可没。总而言之,《左传》同时在文学和历史学上具有极高的成就,都和运用伏笔有关。伏笔的运用,将《左传》的文学性与史学性紧密结合在一起。

《左传》运用伏笔来写史,对后世的影响是显而易见的。由于秦代之前的历史典籍,大都失传,《左传》是幸存下来的几种古本之一,对后来写史产生了重要的影响。《史记》作者司马迁读过《左传》[11],并受其影响,在《史记》中也继承了运用伏笔写史的方法。其后的《汉书》、《资治通鉴》等也是如此。《左传》中的伏笔不但在史学上有其深远影响,在文学上也是后世的典范。在写作技巧上,《左传》与小说是相通的,其后许多小说家在技巧上很自然地受它影响。伏笔作为一种写作技巧,自然也会对后世小说产生作用,特别是文言小说。

还要谈到的是,时下流行“戏说”,将很多历史题材弄得少了历史的“味道”,流于媚俗,更有甚者,胡编滥造,歪曲历史,对如何把握娱乐性与历史真实性处理得不好。我想,我们应该多向《左传》学习,它在这方面取得的极大的成功,值得我们研究。对《左传》中伏笔的价值及其在《左传》文学性与史学性两方面的贡献,我们还没有充分的认识。本文还只是一个初步的探索,希望能抛砖引玉,引发大家更深一层研究的兴趣。

注释

[1] 唐·孔颖达《十三经注疏》:“沈氏云:《严氏春秋》引《观周篇》云:孔子将修春秋,与左丘明乘如周。观书于周史,归而修春秋之经。丘明为传。”宋人王应麟《玉海》中亦如是。

[2] 清·周中孚《郑堂语书记》卷十:“按《汉志》载,春秋古经十二篇,左氏三十卷,是经与传各自为帙,自元凯分经之年与传之年相附比,其义类比,各随而解之,名曰经传集解。”

[3] 清·刘熙载《艺概·文概》。

[4]引自《辞海》1989年版第245页。

[5]同[3]。

[6]二十八叙法为:正叙、原叙、顺叙、倒叙、实叙、虚叙、明叙、暗叙、预叙、补叙、类叙、串叙、摊叙、簇叙、对叙、错叙、插叙、带叙、拾叙、陪叙、零叙、复叙、间议夹叙、连经驾叙、述言代叙、趁文滚叙、凌空提叙、断案结叙。

[7] 宋·王应麟《玉海》卷四十“《艺文志》云:‘左丘明,鲁史也。’是言丘明为传,以其姓左,故号为左氏传也,或先经以始后经之事,或后经以终前经之义,或依经以辩理,或错经以合异。”

[8]引自《十三经注疏》。《左传》原文均引自此书。

[9]同[3]。

[10]冯李骅《读〈左〉卮言》。

[11]《史记·吴太伯世家》:“余读春秋古文……”。

左传范文第4篇

一、分合皆宜,观水有术

观水有术,况乎文章。《左传》与《春秋》相表里,经纬相错,笔法精严,叙事论断无不精绝。菀其鸿裁者,必定不会遗漏其细节和精髓。左氏的处理,使得《左传》细节充满质感,故事发展的连贯性与纵向的时间感随之增强。

究竟左氏是怎么对春秋时期的史事进行处理的呢?叙事角度、叙事者及其态度等手法不必多说。

行文中,叙事事件活用宾主并行不悖,且用宾为后面事件作张本。叙事时间剪裁由己,清人冯李骅《读卮言》一连列举了二十九种叙事手法“其中有正叙,有原叙,有顺序,有倒叙,……”。其说不免有些繁琐,但其分析十分透彻。在他看来原叙和倒叙就有区别,《左传》文中用了“初”字叙述事件来由的归结为原叙,如:传桓公二年,成师兆乱。而倒叙则如:僖公八年败狄采桑之役,将过去之事提前。埋伏提应变化不穷,有明伏暗伏,伏中有应,应中有伏。有众伏一应,如:传成公二年齐晋之战,写晋克侥幸获得胜利,则处处写齐师不弱。这些伏笔呼应使得故事前后相勾连,承上启下又虚实相合,像人体的各个穴位一样让整个脉络畅通并隐显自如。

体例严整有法,辞令之隽、议论之精、褒贬之妙,皆独运匠心。《左传》中的凡例从公即位、会盟朝聘、伐取入灭战败、卒葬吊赠,到弑君、灾异、狩、郊雩尝等都有严格的体例和用法。下字断语都经考核,自然,《左传》为文记事精切了当,笔法严整。

篇章分合自如,分国可以成篇,纪事本末亦可成篇。有独自成篇者,如:郑穆公兰之死(传宣公三年),邾文公卜迁于绎(传文公十三年)等;有逐时随事连缀成篇者,如:下段即将论述的穆伯之事;有类聚成篇者,如:传文公八年,宋襄公夫人杀昭公之党,司马公子司城荡意诸,一死一奔,是对叙,“皆贵之”,则是以类聚为篇。而且此书会在某些时候对前情进行回顾,如:晋侯使吕相绝秦(传成公十三年)、楚才晋用(传襄公二十六年)等,虚虚实实,因事隐伏,深于篇法,精妙绝伦。

可见《左传》是一张线索气脉灵活的网,体例与史事兼备,诸国与众人并存,事件与事件相勾连,经纬分明。从哪儿都能提起一个完整的脉络,并拆合自如,实得叙事之精髓,这是《左传》异于其他叙事作品的最大特点,也使得《左传》适合于各种读法。

二、以管窥豹,见微知著

《左传》中不乏名篇,也都叙事精妙、气势恢宏、波澜起伏、跌宕多姿。最有说服力的往往不是典型的篇章,而是极为平常的记事,是充满质感的细节。任何不精密的细节都会拥堵其灵活脉络。对细小故事的把握和处理才能真正见出左氏的功力。

就以围绕鲁国公孙敖的故事为例来看:

这则故事发生于鲁文公在位期间,由“传元年。春,王使内史叔服来会(僖公之)葬”提起,以穆伯己氏二子之死终之,似有几分戏谑的味道。从内史叔服善相人顺而转到公孙敖使叔服相其二子。叔服评人字数不多,全无奉承之语,精简扼要,却极关乎事件的发展。“也食子,难也收子。也丰下”,评人下字断语之确,又暗含故事后半部分的发展线索:穆伯奔莒,“鲁人立文伯”(传十四年),是为“也食子”;文伯死后,惠叔立,至“惠叔犹毁以为请。立于朝以待命。许之,取而殡之”,是为难也葬穆伯之身也;“他年,其二子来,孟献子爱之”,孟献子即文伯之子仲孙蔑,是为也“有后于鲁国”。这一节既为公孙敖二子、难之事作了一个铺垫,又为将要发生的事情设置了一大悬念,即传八年公孙敖奔莒从己氏,穆伯又为文章通身之线索,足见左氏为文之密。

“传七年,穆伯娶于莒”一节,“穆伯娶于莒”为事件发生之初,前面亦已涉及二子,此处倒叙仅为事件前后勾连之用,不是事件发生的原因,所以不用“初”字。倒叙至“聘焉”为断,文势由缓趋急,情节渐渐趋于紧凑。再到“自为娶之”为一关戾,刹住上段,由初时相好突然转到“仲请攻之,公将许之”,文势大变,似有不可遏止之势。惠伯谏文公,又将此势勒住,谏言之中三“寇”字三“乱”字,前一“乱”一“寇”作出区分;中一“寇” 一“乱”,写出乱不及人而害己;后一“乱”一“寇”,说尽内乱实是启寇之祸端。由顺转逆,顺逆而下,公止之,使惠伯成之,文势也由急转缓。顺逆相转之处全用“之”字作关键,共用了十一个“之”字,牵上搭下,功用不同,条理清晰,率尔成章,无斧凿痕迹。杜注说:“为明年公孙敖奔莒传。”可见,本段在埋伏笔的同时又写尽穆伯的勉强。

“传八年。穆伯如周吊(襄王)丧,不至,以币奔莒,从己氏焉。”此节虽短,却牵前启后,为全文之关戾。左氏用一虚笔,穆伯奔莒,不实写声己之怨,为下文“声己不视,帷堂而哭”埋下一条隐线。

“传十四年。穆伯之从己氏也”一节,承前“从己氏”,全用顺叙之法,叙述穆伯生还之事,暗伏明年死归丧还之事。“生二子于莒”启后二子来鲁之事,“鲁人立文伯”明应“也食子”,“之子弱”为后面孟献子的出现作明伏,“卒于齐”及“请葬”又分别为齐人为孟氏谋归丧和葬事暗伏。二求复一卒三请,对应一使无朝一许复一弗许,若以正反为喻的话,文势可比作:正(穆伯生二子于莒而求复,文伯以为请,襄仲使无朝。)反(三年而尽室以复适莒。)正(穆伯请重赂以求复,惠叔以为请,许之。)反(卒于齐,告丧,请葬,弗许。),自成片段,跌宕起伏,前后勾连,方法不一,变化无穷。

“传十五年,齐人或为孟氏谋”一节述穆伯因齐之谋、赖亲之力得以死归之事。“齐人或为孟氏谋”暗应传元年文公初立之时,穆伯如齐始聘。“惠叔犹毁以为请。立于朝以待命”明应“难也收子”。“取而殡之”、“葬视共仲”本应相连,中间却插入了解经之语“齐人送之。书曰:‘齐人归公孙敖之丧。’为孟氏,且国故也。”左氏篇末解经者甚多,而在叙事中间加入解经者亦不少,如:

僖公二十六年:“公以楚师伐齐,取谷。凡师能左右之曰以。置桓公子雍于谷……”

此种结构主要是为前面的字或事作解说,连经驾叙,以断为连,娴熟之处旁人不可及。“声己不视,帷堂而哭”照应传八年从己氏,实写声己之怨,又为后面“襄仲欲勿哭”暗提同怨相比为目。惠伯亲亲之道始终如一,常用数语劝善且极富文采:

“丧,亲之终也。虽不能始,善终可也。史佚有言曰:‘兄弟致美。’救乏、贺善、吊灾、祭敬、丧哀,情虽不同,毋绝其爱,亲之道也。子无失道,何怨于人?”

左传范文第5篇

关键词:《左传》 地名识别 自然语言处理

1、引言

先秦文献信息处理属于中文信息处理技术与古典文献交叉研究的领域,而地名研究属于先秦文献信息处理的子领域。其研究的必要性在于,汉语的词与词之间没有自然的界限,使得中文信息处理大多是先对要处理的文本进行词语切分,而在分词阶段,未登录词的识别成为许多分词系统发展缓慢甚而走向应用瓶颈的主要原因之一,地名在未登录词中占有一定的比例,随着先秦文献信息处理的深人发展,如果不做地名识别,会很大程度上影响分词的精度。

学界已经对先秦地名的命名原则,选词用字。起名来源等方面进行了探讨,诸如:台湾中研院的《先秦金文简牍词汇资料库》,香港中文大学中国文化研究整理编撰的《先秦两汉古籍逐字索引丛刊》等,都提出了很好的研究方法和研究理论,为我们前期分析先秦文献地名结构规则的研究提供了很好依据。目前,命名实体识别技术在不断地发展,各种识别模型的应用为我们的模型选用和识别实验提供了很好的例证。

2、语料考察分析

本文对先秦25本主要文献进行筛选,最终选择《左传》作为实验语料。原因在于:作为方法探求始初,选取的文献要具有可读性,易提取性,另外,文献需要包含较多的地名。《左传》在先秦文献中,字数最多,词汇总量最大,是记录春秋时期社会状况的重要典籍。事件、人物的描写必然和相关的地点密切联系,以上多种因素正满足了我们实验的要求。

2.1 《左传》地名统计与分析

我们选用“汉达文库”提供的《左传》(17万字次)作为实验语料。首先对其五分之三语料人工标注了分词和词性标记信息。参照北大分词规范,并依据古代汉语的特点制定了先秦文献语料分词标注集,给出了17个标记,分别是:名词n、动词v、形容词a、数词m、量词q、代词r、介词p、连词c、助词u、副词d、语气词v、人名nr、地名ns、兼词i、方位词f、时间词t、标点w等,我们总体上倾向于和,而不是分。其中,地名的标注我们遵守指称性、专门性、词汇性等命名实体特征,对文献中出现的地名做了词频统计(见表3-1)。

2.2《左传》地名特点分析及用字考察

基于以上统计分析,我们对《左传》地名进行了分类。

按内容分,主要包括:

自然地理实体:山(如:泰山)、水(如:汉水)、河(如:河)等

人文地理实体:国名(如:秦国)、县名(如:温)等等

按结构分,主要有以下几种形式:

1、单字专名,如:毫、郧、京

2、专名+通名,如:泰山、清丘

3、双字专名,如:汾隰、甘鹿

另外,我们对《左传》进行了字频统计,共有3300多个汉字,其中,地名用字共有827个字,频率在10以上的地名用字为27个,我们对这些频率较高的字进行了考察,并从结构、文化等方面对《左传》地名进行细致的分析,从而总结出以下几个特点:

1、方位词居多。

字频统计分析显示,《左传》地名中,主要的方位词及其频率是:阳33、上22、东、16、中12、南12、北、10等等。可见,大部分方位词出现的频率是很高的,因为当时人的群居及其恶劣的生活环境,人们在生产劳动时,必须要辨认方向,确定不同的地理位置。

2、存在通名现象,常常省略通名

我国早期地名“近取诸身,远取诸物”,所以古地名通名来历常常与其自然环境有关。从我们的统计数据看出,高频字中的通名包括:丘4J4、城28、国24、陵20、泽16、山15、泉14、州12等等,而且,地名常有通名省略的情况,例如:

汉,汉水:名词。水名。汉水。长江最大支流。

(1)楚子伐随。军于汉、淮之间。(桓公八年)

(2)楚国方城以为城,汉水以为池,虽众,无所用之(僖公四年)

3、同名异指和异名同指

《左传》地名的异名同指现象主要指在文本中同一个地名的表达形式不同,或范围不一。例如:

汉,汉川

(1)沿汉溯江,将人郢。(文公十年)

汉:水名。汉水。长江最大支流,源出陕西宁强县,人湖北省至武汉市人长江。

(2)周之子孙在汉川者,楚实尽之。(定公四年)

汉川:汉水。此指汉水地区。

同名异指现象普遍存在于文本中,大多是表行政区域的地名,主要原因可能是因为“地随移民”,即和古代迁都,扩都、移民等现象有关。例如:

(1)请京,使居之,谓之京城大叔。(隐公一年)

郑国地名,在今河南荥阳县东南。

(2)群王子追之,单子杀还、姑、发、弱、隧、延、定、稠,子朝奔京。(昭公二十二年)

周国地名,在今河南洛阳市西南。

2.3 《左传》地名与现代地名比较

以上关于《左传》地名特点的分析,为我们今后的地名识别工作奠定了语言学基础,现在,我们主要从地名识别角度将《左传》地名与现代地名进行比较:

1、现代地名数量大,新地名不断涌现,地名标注规范较为完善,古代地名数量有限,从研究角度讲,不涉及新地名的问题。学界关于古代地名标注规范问题讨论的还不够。

2、现代地名长度无限制,真实文本中,还存在简称的问题。而古代文献地名,长度较短,主要是两个字和三个字的地名。

3、现代地名结构较为复杂,内部相互成词,甚至存在诸如“北京市海淀区”这样的多层复合的复杂地名。而从统计的左传地名中可以看出,地名长度短,结构较简单,可总结的规则较少,不适合采用现代地名识别研究中规则的方法。

4、现代地名结尾有明显的通名。例如:“江苏省”、“郑州市”等地名中的“省”、“市”,《左传》地名也存在这样的通名。

3、实验结果及分析

本实验使用条件随机场(Condition Random Fields,CRFs)模型,具体采用的是TakuKudo编写的工具包“CRF++0.51”进行训练和测试(下载连接:http://crfpp。soureeforgeaaet)进行训练和测试。

命名实体识别任务实际上是序列标注任务。根据词性标注语料考察,在实际操作中我们采取了4词位标注集T,即T={B,I,E,s},其中,B是多字词的开始词,I是多字词的中间词,E是多字词的结尾词,S是单字词。

我们分别做了四个实验:

实验一、只用字符本身作为特征,地名标注为ns_x(x为词位标记),地名以外的其他词用字一律标注为0_x。

实验二、在实验一的基础上。加入部首特征。

实验三、在实验一的基础上,分词和词性标注(包括地名标注)一体化的处理,模板同实验一。

实验四、在实验三的基础上,加入部首特征,模板同实验二。

实验中,我们选用部首特征,因为汉字中形声字居多,形旁在词义理解过程中起了重要的作用。其次,在语料观察的基础上,我们发现地名中的确存在这种现象,例如:“右邑左阜”之说。在《左传》地名用字统计中,“耳”旁在右表“邑”的用字有27个,“耳”旁在左表“阜”的用字有个17个。例如:邯郸、郢、郡。我们尝试部首特征是否可以提高识别率。

实验一、实验二将词性标记分为地名和非地名。并把分类问题转化为序列标注问题,对于地名

外其他词语的词性标为0,而地名标为NS。(例如:于O_S蔑ns_S),实验三、实验四训练语料样例分别如表4-1、表4-2所示。(表中的**表示该字的部首不详,标记符号是词性标记+词位标记,例如:真v S表示:“寞”是个单字动词,该标记参考现代汉语分词规范,地名的词性标记为ns。)

根据不同的要求分别制定了模板一和模板二(如表4-3、表4-4所示),表中以以上语料为例,对各个模板做出说明。

基于以上两个模板,我们对《左传》五分之二语料进行开放测试,给出三个评测指标:准确率、召回率以及调和平均值,见公式(1)、(2)、(3)

准确率R=(正确识别的地名,识别出的地名)100% (1)

召回率P=(正确识别的地名/实际存在的地名)*100% (2)

调和平均值F=((2+1)PR,((2R+P)通常(=l,则F=2PR/(R+P) (3)

实验结果分析:

实验一和实验二的结果表明,添加部首特征并没有提高识别率,于是,我们又进行了实验三和实验四,加入了每个词的词性,分词、词性一体化处理,结果精确率与前两个实验大致相同。召回率有了明显的提高,但是,加部首特征实验相比之下,识别率仍然比较低。原因可能有二:一是部首特征标注不充分,在识别过程中,这样特征不健全的情况,反而没有未提供部首特征的实验效果好。二是许多地名用字没有明显的部首特征,例如许多独体字部首不确定,这样训练和测试语料中出现大量的“**”,此时部首特征反而成了统计中的噪声。此外,在实验三和实验四中,我们做的是分词和词性一体化,但实际操作时,我们只是计算地名的识别效果,因此不能全面的反映所选用的特征的作用,这也可能是影响识别精度的因素之一,我们会在下一步的工作中进行论证。

另外,前两个实验的识别率较后面两个实验低,尤其是召回率。原因在于我们没有提供足够的上下文信息,《左传》地名有较为工整的上下文。不同的词性对地名有不同的影响,而在实验一和实验二中,地名前后的标记都是O,于是标记同化,信息不足,所以取得了较差的成绩。但是,标记同化就相当于单纯的分词,在原始文本中识别地名,人工代价低,下一步,我们会充分利用分词与词性标注信息,挖掘文本中的其他特征,进一步提高识别效果。

4、未来工作展望

我们下一步的工作主要有:

(1)进一步提高识别效果,并用此方法对先秦其他主要文献地名进行识别。

(2)重点放在先秦地名知识库建设方面。

(3)构建先秦历史知识检索系统。

在我们下一步的工作中识别将不是主要问题,虽然电子文献还不完善,但一些出版的古代文献中一般对专名加了标记,如:下划线等。所以,我们将进一步提高识别效果,并利用此方法对先秦其他主要文献地名进行识别,从而挖掘地名知识背景,解决地名层级关系,沿革问题,同名异指和异名同指等问题。以为古汉语信息处理中其他领域的研究奠定基础。

参考文献:

[1]邓慧蓉,从中国地名透视汉族人的思维方式和社会心理,学术交流。2003

[2]王际桐,论我国地名的命名原则,地球信息科学,2001

[3]华林甫,论先秦时期我国地名学的特点,湖北大学学报(哲学社会科学版),1996

[4]周易・系辞

[5]陈克炯,左传详解词典,中州古籍出版社,2004

[6]陈桥驿,论地名重合续,中国地名,1999

[7]闰海,浅析古地名中的“天人合一”现象,辽宁师专学报(社会科学版),2002

[8]陈立中,阴阳五行与中国古代地名学,文化天地年,2005

[9]李丽

SVM与规则相结合的中文地名自动识别,中文信息处理学报,2006

[10]陈春荣,基于SVM的中文地名识别,大连理工大学。2005

相关期刊更多

焦作师范高等专科学校学报

省级期刊 审核时间1个月内

河南省教育厅

中国训诂学报

部级期刊 审核时间1个月内

中国训诂学会

临床普外科电子

部级期刊 审核时间1个月内

国家卫生健康委员会