首页 > 文章中心 > 翻译器

翻译器

翻译器

翻译器范文第1篇

关键词:翻译;人工翻译;机器翻译

1 翻译的本质与定义

翻译是一种语言到另一种语言的转换。翻译的本质是科学性和艺术性的有机统一。黄振定认为,艺术性和科学性性同时包含在翻译活动中,而这是一个有机的统一体。”刘宓庆也认为“忽视翻译的科学性固然是错误的;忽视翻译的艺术性同样是错误的,因为翻译本身就是融科学与艺术于一体的活动。”只有人才能使翻译活动既具有科学性又具有艺术性。机器翻译只能从现存的语料库出发对译文进行翻译,虽具有一定的科学性,但其艺术性受限或者无艺术性,这一点尤其表现在文学翻译领域。下面是笔者在文学翻译实践遇到的句子“Vogt, a professor of biology at the University of Geneva, once affirmed that “man as well as the animal is only a machine.”笔者用Transmate翻译工具得到的译文为“沃格特,日内瓦大学的生物学教授曾确认,“人以及动物只是一台机器”。人工翻译译文为“日内瓦大学的生物学教授沃格特曾认为“人作为一种动物也不只过是N机器。”对比这两个译文可以看出机器对词语的翻译比较准确,但语序和行文的润饰还有所欠缺,无法将译文既具有科学性又有艺术性。而人工翻译可发挥人的主观能动性,可根据具体的语境,选择词语、修辞手法和排列语序等等,使译文符合目的语的行文习惯且优美流畅,将译文达到艺术性和科学性的统一。

王宁认为翻译是同一语言古文和现代语、两种语言之间、由符码到文字、关于图像阐释、形象与语言之间的转换、影视戏剧脚本的改编和再创作以及以语言为主要媒介的跨媒介阐释。随着高科技的发展和联络通讯技术的发展使得人们的阅读习惯发生了极大的变化,在当下这个读图时代,翻译不光是语言之间的转化还是图像、字符、表现形式之间的转换。母亲向孩子用语言去解读画中人物传达的神态和想法时也是翻译;课堂上老师用白话文解释文言文也是翻译。而这类翻译,机器翻译目前是无法完成的。目前机器翻译只能做到部分语种之间的翻译,若实现古文与现代文的互译和所有现代文字之间的互译还有很长的一段路要走,更何况实现图像、字符、表现形式等人的主观性要求较高的翻译材料的翻译。

2 机器翻译

作为翻译形式的一种,机器翻译是利用电子计算机按照一定程序自动进行对自然语言进行翻译。机器翻译是语言学、数学和计算机科学这三门学科共同的产物。语言学家做机器翻译的语料库,数学家把语料形式化和代码化,计算机科学家给机器翻译提供软件手段和硬件设备并进行程序设计。这个过程也决定了机器翻译的滞后性和人工翻译存在的必要性。若语料库不能及时更新,机器翻译是无法满足人类不断发展的翻译需求,而语料库的更新则离不开人工翻译。

自诞生之日起,机器翻译以其翻译速度之快和部分专业词汇翻译精准度之高受到了广泛肯定。但其翻译质量,特别是在诱导型和呼唤型文本的翻译中,受其自身机械性的限制,译文总有不尽人意之处,需人工翻译进行校对与润色。

3 机器翻译与人工翻译

除了依赖语料库的解码和编码的精确与否,机器翻译的优劣还在于其是否具有超强“学习能力”,即可根据某些词汇的使用频率和采用频率,改进翻译准确性与速度。在某些信息型文本中,机器翻译可以替代人工翻译的词汇翻译工作。例如,“BEIJING -- Chinese President Xi Jinping on Monday stressed the importance of “a sound environment for public opinion.”这句新闻有道机器翻将其译为“北京――中国国家主席周一强调的重要性“一个良好的舆论环境。”虽然整句话的语序不对,但从“Chinese President”和“a sound environment for public opinion”这两个短语可以看出机器翻译的学习能力让其在专业术语的翻译上可和人工翻译媲美。所以,人可通过机器翻译的帮助,免去查词等简单而又繁琐的准备和检查工作,把更多精力花在对译文的分析、评估等要求人的主观性较高的翻译活动中。

另外,索绪尔认为,语言是具有社会性,即语言是语言团体整体心智的产物。随着社会的发展与进步,人类使用的有些语言也在不断的更新与衰退。语料库相当于机器翻译的“心脏”需要不断地输入新鲜的“血液”。若语料库的更新速度落后于新词汇产生的速度,那么机器翻译满足不了含有某些新词翻译活动,即机器翻译也无法满足当下人类的翻译需求。现在若使用机器翻译去翻译网络流行语“香菇”,则直接译成“mushroom”,这无法让目的语读者真正理解原文想要表达的“想哭”意思。而人作为人工翻译的核心可自身保持与时俱进的语言知识,能正确译出其隐喻含义。所以,人工翻译这种动态翻译活动有机器这种较为静态翻译活动不可代替的作用。

4 结语

近年来,机器翻译技术已实现巨大的发展。谷歌神经机器翻译系统、百度翻译等软件的相继问世极大地提高的翻译效率。但因翻译归根到底都是语言的问题,所以不管机器翻译如何发展都不会取代人工翻译。加之,综合翻译的定义与本质、翻译对象和机器与人工翻译的两种译文质量的对比考虑,人工翻译都发挥着机器翻译无法匹敌的作用。人与机器强强联合是才翻译的未来。人们应更加关注如何让机器翻译更好的协助人的翻译活动即人工翻译,而不是去担忧机器翻译会取代人工翻译那一天的到来。

参考文献

[1] 辞海[C]北京:商务印书馆,1997

[2] 费尔迪南・德・索绪尔.普通语言学教程[M].商务印书馆,2014

[3] 胡开宝 李翼.机器翻译特征及其与人工翻译关系的研究[J].中国翻译.2016

[4] 黄振定.翻译学[M],长沙:湖南教育出版社,1998

[5] 刘宓庆.翻译美学导论[M],北京:中国对外翻译公司出版公司,2005

[6] 罗璇.浅析翻译的本质[J].世纪之星创新教育论坛,2016

[7] 刘涌泉.机器翻译归根到底是个语言学问题[J].语言文字应用,1997

[8] 王宁.全球化时代的翻译及翻译研究: 定义、功能及未来走向[J].外语教学,2016

[9] 现代汉语词典[C]北京:商务印书馆,1980

作者简介

郑江(1993-),女,白族,山东济宁人,在读硕士研究生。主要研究方向:英汉笔译。

翻译器范文第2篇

关键词:机器翻译;自然语言;发展趋势

一、引言

《圣经.创世纪》中第十一章巴别塔:“耶和华说:看哪,他们成为一样的人民,都是一样的言语,如今既作起这事来,以后他们所要作的事就没有不成就的了。我们下去,在那里变乱他们的口音,使他们的言语彼此不通。于是耶和华使他们从那里分散在全地上;他们就停工,不造那城了。因为耶和华在那里变乱天下人的言语,使众人分散在全地上,所以那城名叫巴别(就是变乱的意思)。”这只是圣经故事,但告诉我们语言的不同确实是人们交流的极大障碍,因此人们一直在寻找打破语言障碍的途径和办法。翻译则能克服语言障碍,使得不同语言人们之间能相互交流。谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说:孔子周游列国,在各地言语发音不尽相同,彼此交流甚少的当时,也不得不通过象寄之才(即翻译人员)以“达其意,通其欲”。随着互联网的日益发展,网络信息的激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。

二、机器翻译的定义

计算机翻译通常叫机器翻译(MachineTranslation或MT),即全自动高质量机器翻译(FullyAutomaticHighQualityMachineTranslation,简称FAHQMT或MT),就是人类利用计算机进行自然语言间的相互翻译,利用软件实现从一种自然语言文本到另一种自然语言文本的翻译。

三、机器翻译的历史与现状

在古希腊时代就有人提出利用机械装置来进行语言翻译的想法,其中之一是如何用机械手段来分析自然语言。17世纪,人们首次提出使用机械字典克服语言障碍的设想。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)首次使用了“机器翻译”(MachineTranslation)这个术语。1952年在美国麻省理工学院(MIT)召开了第一届国际机器翻译会议,标志着机器翻译正式迈出了第一步。1978年在中科院计算机所的一台64K容量的计算机上成功地进行了20个标题的机器翻译测试。1987年在日本箱根举行了第一届机器翻译峰会(MTSummit),并决定以后每两年轮流在亚、欧、美定期举行。20世纪90年代后,随着微机的普及,相继出现了多种翻译软件,例如金山公司的词霸系列,实达铭泰的东方快车系列,Trados翻译软件等。到目前为止,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译已经取得了相当大的进步,不过,机器翻译的水平距理想的“全自动高质量(FAHQ)”的目标还有很远的距离。

四、机器翻译面临的问题

4.1影响机器翻译质量的核心是歧义的处理。在词汇的层面上,词汇的歧义主要是一词多义,如英语单词“note”可以指“笔记”、“短信”、“注释”、“纸币”等。以下是词汇歧义的例子:

原文:Thank-younotesareheart-warming.机器译文:感谢笔记温暖人心。人工译文:感谢信温暖人心。在结构层面上,常见的结构歧义有and(和)结构,如nicegirlsandboys,它既可表示“好女孩和男孩”,也可表示“好女孩和好男孩”,这种歧义只有人工翻译才能消除,计算机无法识别此歧义,可见歧义的处理是影响机器翻译质量的关键。

4.2人类翻译目标集中于目标语言,如果有必要的话,译者会采用灵活的方式以使翻译传情达意,有的时候会使用意译的方法,这是机器翻译所无法达到的。以文学翻译为例,文学翻译是“传达作者的全部意图,即作者对在读者思想感情上产生艺术作用的全部意图……”。即使对于专业翻译工作者来说,文学翻译也不是件容易的事,更何况是对于没有任何认知能力的机器。笔者曾让机器翻译了下面句:以下是美国19世纪著名作家爱默森长篇散文Beauty中的原句。原文:"ButthisbeautyofNaturewhichisseenandfeltasbeauty,istheleastpart."—BeautyRalphWaldoEmerson机器译文:但是这哪个看见并且作为美丽感到的自然的美丽,是最小部分。夏济安译文:可是凡是耳目所能辨认出来的美,只是自然之美的最低部分。以下是美国著名作家马克.吐温早期创作的一则优秀短篇小说《竞选州长》中的原句。原文:"Ihauleddownmycolorsandsurrendered."—RunningForGovernorMarkTwain机器译文:我沿着我的颜色拖并且投降。张有松译文:我偃旗息鼓,甘拜下风。以上机器译文荒唐可笑。由于机器没有思维、推理、判断能力,缺乏人工译者的综合知识和长期积淀下来的文化知识等,无法对原文产生全面的了解,做的只是机械转码,无法突破思维障碍。要获得地道完整的译文,必须对机器译文进行人工修改、加工。

五、机器翻译的发展趋势

机器翻译的质量虽然不能和人工翻译相提并论,但有许多优势是人工翻译所不具备的。我国著名计算语言学与机器翻译专家董振东说:“美国要开发一种口语翻译机,专门用来审讯与美国人语言不通的俘虏。如果用人来做翻译,由于语言不通,即使翻译被收买,对美国人信口胡说,美国人也不会知道,而机器就不可能出现这种情况。这机器现在有没有发明出来,能到什么翻译水平还不得而知,但这至少是一个相当好的发展领域。”因此,发挥机器翻译的自身优势是决定机器翻译发展趋势的重要因素之一。机器翻译的发展趋势是解决人工智能的技术问题。“假设要从人工智能上有所突破,那只能在神经网络和模糊计算上寻找出路。”为了探索人工智能,使电脑模仿人脑,进行更多的智力劳动,模糊计算便应运而生。神经网络和模糊计算都是通过对人脑的结构和推理方式的模拟来实现计算机的智能化。“只有人脑才能和人脑相比”——这看似废话,对于机器翻译来说,却是技术上真正意义上的突破口。:

六、结语

目前,机器翻译的水平较50年前有了很大的提升,但要彻底克服语言障碍,使MT投入实际应用,还需数学家、计算机专家、人工智能专家、语言学家、心理学家、认知学家、逻辑学家等通力合作,共同努力,从理论研究和应用开发上有所突破,相信机器翻译会到达光明的彼岸。

参考文献

翻译器范文第3篇

关键词:机器翻译 日语 日译汉 特朗普就职演讲 百度翻译

一、引言

机器翻译是最早的信息处理研究①。20世纪30年代初,法国科学家阿尔楚尼有了“机器翻译”的构想。我国于1956年开始研究机器翻译,随着互联网的迅猛发展和跨文化交流的扩大深化,机器翻译正逐渐成为人们克服获取信息时所面临的语言障碍的重要手段,翻译需求的不断增大使得翻译软件进入一个新的发展时期。②

机器翻译中,汉日翻译备受瞩目。随着中日经济、文化交流的不断扩大深化,中国迅速准确地获取日文信息的需求日益迫切。虽然中国的日语学习者不断增多,目前中国已超过韩国成为日语学习者最多的国家,但仍远不能满足这一需求。日译汉机器翻译软件的出现,为突破汉日语信息壁垒提供了一种高效的手段。

目前国内关于机器翻译的研究多集中于英汉翻译,对于日汉机器翻译软件在日语专业大学生中的使用情况、不足之处的分析及对策的研究比较罕见。本文通过问卷调查,考察了目前日汉翻译软件在曲阜师范大学日语专业大学生中的使用现状;并以目前中国知名度最高的机器翻译软件“百度翻译”为代表,以美国新任总统特朗普的就职演讲日文版③为语料,考察其不足之处,并提出改进建议。

二、日汉机器翻译软件在日语专业大学生中的使用现状调查

笔者以曲阜师范大学日语专业大学生为样本,对其日汉翻译软件的使用现状进行了问卷调查,以此估计日语专业大学生整体的使用状况。共发放问卷200份,回收184份,有效问卷178份。

问卷结果显示,对于日汉翻译软件,仅有31.5%的学生“经常使用”,从没用过的学生比例高达12.9%。

对于使用日汉翻译软件的场合,8.4%的学生选择“浏览日文网页”,“阅读日文版书籍”的比例为12.9%,“辅助课后作业”的比例高达22.5%。

使用过日汉翻译软件的同学中,对于其翻译质量,选择“非常好”的仅占5.6%,选择“非常差”的高达51.7%。可见,总体上,日语专业大学生对日汉翻译软件是不满意的,这反映出日汉翻译软件质量仍然不够高。

三、日译汉翻译软件的翻译质量实证考察

为了对日语专业大学生对日汉翻译软件满意度较低的具体原因M行探究,本文进行了实证考察。以美国新任总统特朗普的就职演讲日文版为语料,以目前中国机器翻译领域最著名的软件“百度翻译”为工具进行分析,逐句考察其译文的适当性,将其出现的错误归类,并列出代表性的错误例句。

(一)专名错误

1.专名误译为普通名词

(1)原文:トランプ大yI就任演h

误译:打牌总统就任演说

确译:特朗普总统就职演说

「トランプ在日语中是平假名表示的外来语,英语原词是“trump”,表示“扑克牌”,恰好与新总统的名字“Trump”拼写相同。

2.专有名词未译

(2)原文:ネブラスカ

误译:ネブラスカ

确译:内布拉斯加州

造成这种错误的原因大概是百度翻译的词库中未收录这个地名。

(二)漏译

1.连续出现的词的漏译

(3)原文:ロバ`ツ最高裁判所L官、カ`タ`元大yI、クリントン元大yI、ブッシュ元大yI、オバマ大yI、そしてアメリカ国民の皆さん、世界の皆さん、ありがとう。

误译:罗伯茨最高法院长官,卡特前总统,克林顿总统,布什总统,奥巴马总统,以及美国国民的诸位,世界的诸位,谢谢。

确译:首法官罗伯茨,卡特前总统,克林顿前总统,布什前总统,奥巴马总统,全体美国国民,所有世界人民,谢谢。

原文中出现了四个「大yI(汉译:总统),其中前三个「大yI前有「元(汉译:前),百度翻译仅译出了第一个「元,后两个「元都漏译了。

(4)原文:私たちは雇用を取りします。私たちは国境を取りします。私たちは富を取りします。そして、私たちの簸蛉・します。

误译:我们将通过雇佣。我们把国境取回。我们把财富取回了。然后,我们的梦想。

确译:我们将把就业岗位取回。我们将把国境取回。我们将把财富取回。并且,我们将把我们的梦想取回。

原文共用了四个「取りし,然而第四个「取りし漏译了。

2.出现一次的词的漏译

(5)原文:私たちはともに、アメリカと世界が今後数年gMむ道をQめます。

误译:我们共同决定,美国和世界今后数年的前进。

确译:我们共同决定美国和世界今后数年的前进道路。

原文中的「道(汉译:道路)漏译了。

(6)原文:きょうの私の宣誓は、すべてのアメリカ国民にする忠\の宣誓です。

误译:今天的我的誓言,对所有的美国国民的忠诚的宣誓。

确译:今天我的宣誓,是对所有美国国民的宣誓。

日语指定助动词「です(相当于汉语判断动词“是”)漏译了。

(7)原文:Q易、税、移民、外交}にvするすべてのQ断は、アメリカのP者とアメリカの家族を利するために下されます。

误译:关于贸易、税收、移民、外交问题的一切的决断,是为了让美国的劳动者和美国的家人进行的。

确译:关于贸易、税收、移民、外交问题的所有决定,都是为了有利于美国的劳动者和美国的家庭而做出的。

句子的核心――动词「利する没有被译出,造成译文成分残缺。

(8)原文:私たちは、すだけで常に不氦蚴訾佟⑿婴蚱黏长丹骸}に辘筏瑜Δ趣筏胜ふ治家を受け入れる余地はありません。

误译:我们说,总是会说话总是不满意,不引起行动,没有接受问题的政治家。

确译:我们不会接受那些总是只是通过话语表达不满,而不采取行动,不应对问题的政治家。

复合动词「受け入れる没有译出。

(9)原文:中g婴胃护稀⒈摔椁渭彝イらZわれ、世界中で再分配されてきました。

误译:中间层的财富,被他们的家庭被剥夺,在全世界被分配了。

确译:中产阶级的财富,被从他们的家庭剥夺,在全世界再分配了。

格助词「から没有翻译出来。

(三)增译

原文中没有的内容,在译文中却错误地出现了。

(10)原文:あまりにもLいg……

误译:在太长时间的时候……

确译:在太长的时间里……

译文中出现了原文中没有的“时候”。

(11)原文:あなたたちは二度とoされることはありません。

误译:你再也不会被无视的事了。

确译:你再也不会被无视了。

(12)原文:あなたの声、希望、簸膝メリカの\命をQ定づけます。

误译:你的声音,希望,梦想是美国宾客的命运。

确译:你的声音、希望、梦想将决定美国的命运。

例(12)中增译了“宾客”。

(13)原文:ありがとうございます。

误译:谢谢你。

确译:谢谢(你们)。

(四)重复翻译

指同一个成分翻译了两遍。

(14)原文:子どもたちのためにすばらしい学校を……

误译:为了让孩子们为了孩子们的美好的学校……

确译:为了孩子们优良的学校……

「子どもたちのために的译文重复出现。

(五)词义错误

1.义项选取不当

是指某个词有多个义项,译文没能选择适合语境的那个义项,而是选择了不恰当的义项。

(15)原文:皆さんのものだからです。

误译:因为是大家的东西。

确译:因为是大家的事情。

名词「もの在这个语境下明显是指无形的“事情”,而不是指有形的“东西”。

(16)原文:1つまた1つと、工訾祥]iし……

误译:一个又一个和,工厂封闭……

确译:一个又一个地,工厂倒闭……

将表示状语的虚词「と,误认为是表示并列的「と。

(17)原文:そして、何兆ドルも海外で使う一方で、アメリカのbIは荒し衰退してきました。

误译:并且,在海外使用几兆美元的一方面,美国的产业也荒废了。

确译:而且,一方面在海外使用数兆美元,另一方面却使美国的产业荒废了。

连词“一方面”应与“另一方面”搭配使用,译文中却漏掉了后者,而且前者在分句末尾这一点不符合汉语表达习惯。

(18)原文:アメリカ人の手によって、アメリカのP者によって、われわれの国を再建します。

误译:根据美国人的手,根据美国的劳动者,重建我们的国家。

确译:用美国人的手,靠美国人的劳动者,重建我们的国家。

「によって(相当于汉语的介词)有许多义项:“原因,理由,手段,方法,根据,依据”。很明显,这里「によって表示“手段”,而不是“根据”。

2.译文超出了原词的义项范围

有时,某个词的译文的意思,并不属于原词的任何一个义项,这种错误更加严重。

(19)原文:教育は金がかかり……

误译:教育是金钱……

确译:教育花费金钱……

将行为动词“花费”误译为了判断动词“是”。

(20)原文:われわれの国の富とさ、そして自信は地平のかなたに消えていきました。

误译:我们的国家的财富和强度,并且自信地在地平线的那一边消失了。

确译:我们国家的富强及自信,消失在了地平线的那一边。

将结构助词「は误当成「に来翻译了。

(21)原文:ほかの国々が、われわれのu品を作り、われわれの企IをZい取り、われわれの雇用を破菠工搿…

`译:其他的国家,我们的产品的制作,我们的企业,唆使我们的雇佣破坏的掠夺……

确译:其他国家,制作我们的产品,夺取我们的企业,损害我们的就业……

复合动词「Zい取り被翻译成了“唆使”,二者没有任何关联。笔者在百度翻译中输入其动词原形「Zい取る,正确翻译为“夺取”,可能是百度翻译的程序对动词连用形的翻译有漏洞。许多例句出现了这种情况。

3.词性选择错误

(22)原文:政治家は繁绚筏皮ましたが……

误译:政治家的繁荣起来了……

确译:政治家繁荣起来了……

将动词「繁绚工搿沟弊髁嗣词来翻译。

(23)原文:最後に、私たちは大きく考え、大きな簸蛞るべきです。

误译:最后,我们要大的考虑,应该看一个大的梦。

确译:(直译)最后,我们应该大地考虑,应该看到一个大的梦。

「大きい是形容词,其副词形态为「大きく(日语语法中称为“连用形”),作状语,应翻译为“大地”,而不是“大的”。

(六)语序不当

(24)原文:私たちは4年ごとに、秩序だち、平和的な政匾菩肖韦郡幛思Yします。

误译:我们每4年,就要和秩序,和平的政权为转移而集结。

确译:我们每4年,就会有秩序地,为了和平的政权转移而集结。

「のために表示“为了/为”,其介词宾语应为「政匾菩小梗而不是「政亍埂

(25)原文:それは私たちが\い肌であろうと、褐色の肌であろうと、白い肌であろうと……

误译:那是我们黑色的皮肤,无论是褐色的皮肤,还是白色的皮肤……

确译:那就是,无论我们是黑色的皮肤,还是褐色的皮肤,还是白色的皮肤……

连词“无论”应前移,以覆盖住黑皮肤、褐皮肤、白皮肤这三种情况。

(26)原文:しかし、常に饨Yすることを追い求めなければなりません。

误译:但是,通常团结的精神追求必须。

确译:但是,平时必须追求团结。

情态动词「なければなりません表示“必须”,日语中是放在动词后面,而汉语中要放在动词前面。

(七)肯定否定颠倒

(27)原文:私たちはgに、1つの政丐ら次の政丐恕あるいは、1つの政hからeの政党に移行するだけでなく、叵蓼蚴锥讥铳伐螗去螭握治からアメリカ国民に返すからです。

误译:因为今天,我们仅仅是一个政权,或从一个政党的政党转移到另一个政党,从首都华盛顿的政治到美国国民。

确译:因为今天,我们不仅仅是一个政权转移到下一个政权,或从一个政党转移到下一个政党,而是把权力从首都华盛顿的政治归还到美国国民手中。

「だけでなく(汉译:不仅)没有被翻译出来,造成否定句变成了肯定句。

(28)原文:彼らの倮は皆さんの倮ではありませんでした。

误译:他们的胜利是大家的胜利。

确译:他们的胜利不是大家的胜利。

(29)原文:できないことをすのはもうやめましょう。

误译:说不出的话就别再停止吧。

确译:做不到的事情就别再说了吧。

(八)主动、被动颠倒

(30)原文:私たちは守られ、そして守られAけます。

误译:我们保护,并继续守护着。

确译:我们被保护,并将一直被保护。

把被动态当成了主动态。

(九)时态错误

(31)原文:私たちはn}や困yに直面するでしょう。しかし、私たちはやり遂げます。

误译:我们面临过课题和困难。但是,我们做到了。

确译:我们或许会面临课题和困难。但是,我们将完成(任务)。

原文表示的是对将来的承诺,但译文中却使用了动态助词“了”,表示过去完成。将「ます翻译成“了”是错误的,一般而言,「ました或「た才翻译为“了”。

原文表示对未来的预测,译文中却用了动态助词“过”,是过去时。

(十)搭配不当

(32)原文:彼らは本当にすばらしかったです。

误译:他们真的很美妙。

确译:他们真的很棒。

“美妙”一般形容事物、感觉等,而不形容人,应将「すばらしかった翻译为“棒”。

(33)原文:私たちは2つのgなル`ルを守ります。

误译:我们保护2个简单的规则。

确译:我们遵守两个简单的规则。

与“规则”搭配的动词应为“遵守”,原文将「守り翻译为“保护”不恰当。并且数词“2”一般不和“个”搭配使用,应将“2”改为“两”。

(34)原文:私たちはアメリカを再びゴ螭摔筏蓼埂

误译:我们把美国再次伟大

确译:我们将使美国再次变得强大。

(十一)层次划分不当

(35)原文:数百万もの瞬gに出会うでしょう。

误译:数百万的瞬间会相遇吧。

确译:数百万人瞬间相会吧。

正确的划分方式为“数百万/もの/瞬gに/出会う/でしょう”,而百度翻译明显是根据错误的划分方法来翻译的:“数百万/も/の/瞬g/に/出会う/でしょう”。

(十二)惯用搭配翻译不当

1.惯用词组翻译不当

(36)原文:いま、私たちは未来だけに目を向けています。

误译:现在,我们只针对未来的目光。

确译:如今,我们只关注未来。

「……に目を向ける是日语中的惯用搭配,表示“注目于,关注”。百度翻译软件将其拆开翻译,造成误译。

2.惯用句翻译不当

(37)原文:神の祝福が皆にありますように。

误译:神的祝福各位都在。

确译:愿神的祝福与各位同在。

这是基督教祝福时的惯用句。

(十三)标点符号错误

(38)原文:きょうという日は、皆さんの日です。

误译:今天是大家的日子。是给大家的祝贺。

确译:今天是大家的日子,是给大家的礼物。

将日语逗号翻译为了句号。

四、关于日汉翻译软件质量改进的建议

(一)大幅提升词库的容量

对于专有名词,如人名、地名、书名等,尤其是当今社会中重要人物的名字,要更多地收入词库,这样才能避免将“トランプ大yI”翻译成“打扑克总统”之类的错误,而更有利于跨文化交流交际,有利于了解异文化的实事动态。

日语不同于汉语这种孤立语,而是一种词形变化较为丰富的语言。如同一个动词,会有“连体形”“连用形”“假定形”“终止形”“意志形”“未然形”等形态,因此要将一个动词所有可能的形态都收入词库。这样能避免例句中一些动词形态没有被辨认出来的错误。

对一些专业领域的词汇,非专业领域的人士往往不认识。对此可以编纂容量巨大的各种专业电子词典,将专业词汇囊括其中,从而做到在各个专业翻译领域中都游刃有余。

(二)改M相关编程,纠正语序错误

汉语与日语的语序差异很大。汉语的主要语序是“主谓宾”,日语的主要语序是“主宾谓”。另外,汉语的否定成分与情态动词一般都在动词的前面,而日语是在后面。程序编写者要充分认识到两种语言的语序差异,深入研究相关语言对比的知识,并用程序语言精确地表达出来。

(三)尽量消除漏译与增译

漏译与增译的错误较为突出,这两种情况都会改变原有成分数量,使语义发生较大改变。应改进程序算法,杜绝这种低级错误。

(四)提升智能性,提高运用语境知识的能力

翻译软件翻译时经常只关注局部而忽略了与之相关的其他部分,“只见树木,不见森林”。翻译软件应提高“记忆力”,建立记忆库,使之能够存储语句的上下文以及语法知识,甚至各种文化知识、百科知识、时事知识。当有需要时,便能调动知识库进行一些简单的推理,排除不合理的翻译可能项,确定最适合语境的翻译。这样,很多搭配不当、义项选择不当的错误就都能避免。

(五)日汉翻译软件与人工翻译有机结合

当今日汉翻译软件的翻译质量与之前相比已有了长足的进步,但不可否认,日汉翻译软件与专业翻译人员的翻译质量仍然差距巨大。尤其是在文学翻译领域,由于缺乏人类的感情,没有人类细腻的推敲功夫,缺乏人类的“百科知识”与语言文化知识,机器翻译还难以涉足。此外,在法律文书、合同这些要求语言十分精确、语言错误会引起严重后果的领域,机器翻译的使用也要慎之又慎。机器翻译的优势在于“量”,在于其人类难以企及的速度,人类译员的优势在于“质”,要想又快又好地翻译,就要将两者有机结合起来,将两者的突出优势相结合,如安排人类译员对机器迅速翻译出来的初加工文本进行仔细审校再加工,从而实现优势互补。

五、结语

本文就日语专业大学生对日汉翻译软件的使用状况进行了问卷调查研究,并以“百度翻译”为工具,对特朗普就职演讲的日文版进行了汉译,逐句考察其错误并对错误类型进行归纳总结,在此基础上提出了一些改进日汉机器翻译质量的建议,希望能够为促进中文信息处理及中日文化交流略尽绵薄之力。

注释:

①陆俭明,沈阳.汉语和汉语研究十五讲[M].北京:北京大学出版

社,2004:452.

②杜金华,张萌,宗成庆,孙乐.中国机器翻译研究的机遇与挑

战――第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,(4).

③http:///20170121/n479273966.shtml

参考文献:

[1]陆俭明,沈阳.汉语和汉语研究十五讲[M].北京:北京大学出版

社,2004.

[2]杜金华,张萌,宗成庆,孙乐.中国机器翻译研究的机遇与挑

战――第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,(4).

[3]http:///20170121/n479273966.shtml

[4]沈阳.语言学常识十五讲[M].北京:北京大学出版社,2005.

[5]Daniel Jurafsky&James H.Martin.自然语言处理综论[M].冯志

伟,孙乐译.北京:电子工业出版社,2005.

翻译器范文第4篇

关键词:机器翻译;自然语言;发展趋势

1.引言

《圣经.创世纪》中第十一章巴别塔:“耶和华说:看哪,他们成为一样的人民,都是一样的言语,如今既作起这事来,以后他们所要作的事就没有不成就的了。我们下去,在那里变乱他们的口音,使他们的言语彼此不通。于是耶和华使他们从那里分散在全地上;他们就停工,不造那城了。因为耶和华在那里变乱天下人的言语,使众人分散在全地上,所以那城名叫巴别(就是变乱的意思)[1]。”这只是圣经故事,但告诉我们语言的不同确实是人们交流的极大障碍,因此人们一直在寻找打破语言障碍的途径和办法。翻译则能克服语言障碍,使得不同语言人们之间能相互交流。谭载喜在他的《西方翻译简史》一书中提到我国的翻译史时说:孔子周游列国,在各地言语发音不尽相同,彼此交流甚少的当时,也不得不通过象寄之才(即翻译人员)以“达其意,通其欲”。随着互联网的日益发展,网络信息的激增,国际社会交流愈加频繁,机器翻译已成为克服交流时所产生的语言障碍的重要手段之一。

2.机器翻译的定义

计算机翻译通常叫机器翻译(Machine Translation或MT),即全自动高质量机器翻译(Fully Automatic High Quality Machine Translation,简称FAHQMT或MT),就是人类利用计算机进行自然语言间的相互翻译,利用软件实现从一种自然语言文本到另一种自然语言文本的翻译[2]。

3.机器翻译的历史与现状

在古希腊时代就有人提出利用机械装置来进行语言翻译的想法,其中之一是如何用机械手段来分析自然语言。17世纪,人们首次提出使用机械字典克服语言障碍的设想。1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)首次使用了“机器翻译”(Machine Translation)这个术语。1952年在美国麻省理工学院(MIT)召开了第一届国际机器翻译会议,标志着机器翻译正式迈出了第一步。1978年在中科院计算机所的一台64K容量的计算机上成功地进行了20个标题的机器翻译测试。1987年在日本箱根举行了第一届机器翻译峰会(MT Summit),并决定以后每两年轮流在亚、欧、美定期举行。20世纪90年代后,随着微机的普及,相继出现了多种翻译软件,例如金山公司的词霸系列,实达铭泰的东方快车系列,Trados 翻译软件等。到目前为止,由于计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅度提高以及人工智能在自然语言处理上的应用,机器翻译已经取得了相当大的进步,不过,机器翻译的水平距理想的“全自动高质量(FAHQ)”的目标还有很远的距离[3]。

4.机器翻译面临的问题

4.1影响机器翻译质量的核心是歧义的处理。在词汇的层面上,词汇的歧义主要是一词多义,如英语单词“note”可以指“笔记”、“短信”、“注释”、“纸币”等。以下是词汇歧义的例子:

原文:Thank-you notes are heart-warming.

机器译文:感谢笔记温暖人心。人工译文:感谢信温暖人心。

在结构层面上,常见的结构歧义有 and(和)结构,如 nice girls and boys, 它既可表示“好女孩和男孩”,也可表示“好女孩和好男孩”,这种歧义只有人工翻译才能消除,计算机无法识别此歧义,可见歧义的处理是影响机器翻译质量的关键。

4.2人类翻译目标集中于目标语言,如果有必要的话,译者会采用灵活的方式以使翻译传情达意,有的时候会使用意译的方法,这是机器翻译所无法达到的。

以文学翻译为例,文学翻译是“传达作者的全部意图,即作者对在读者思想感情上产生艺术作用的全部意图……”。即使对于专业翻译工作者来说,文学翻译也不是件容易的事,更何况是对于没有任何认知能力的机器。笔者曾让机器翻译了下面几句:以下是美国19世纪著名作家爱默森长篇散文Beauty中的原句。

原文:"But this beauty of Nature which is seen and felt as beauty, is the least part."

—Beauty Ralph Waldo Emerson

机器译文:但是这哪个看见并且作为美丽感到的自然的美丽,是最小部分。

夏济安译文:可是凡是耳目所能辨认出来的美,只是自然之美的最低部分。

以下是美国著名作家马克.吐温早期创作的一则优秀短篇小说《竞选州长》中的原句。 原文:"I hauled down my colors and surrendered."

—Running For Governor Mark Twain 机器译文:我沿着我的颜色拖并且投降。

张有松译文:我偃旗息鼓,甘拜下风。

以上机器译文荒唐可笑。由于机器没有思维、推理、判断能力,缺乏人工译者的综合知识和长期积淀下来的文化知识等,无法对原文产生全面的了解,做的只是机械转码,无法突破思维障碍。要获得地道完整的译文,必须对机器译文进行人工修改、加工。

5.机器翻译的发展趋势

机器翻译的质量虽然不能和人工翻译相提并论,但有许多优势是人工翻译所不具备的。我国著名计算语言学与机器翻译专家董振东说:“美国要开发一种口语翻译机,专门用来审讯与美国人语言不通的塔利班俘虏。如果用人来做翻译,由于语言不通,即使翻译被塔利班收买,对美国人信口胡说,美国人也不会知道,而机器就不可能出现这种情况。这机器现在有没有发明出来,能到什么翻译水平还不得而知,但这至少是一个相当好的发展领域。” 因此,发挥机器翻译的自身优势是决定机器翻译发展趋势的重要因素之一。机器翻译的发展趋势是解决人工智能的技术问题。“假设要从人工智能上有所突破,那只能在神经网络和模糊计算上寻找出路。”为了探索人工智能,使电脑模仿人脑,进行更多的智力劳动,模糊计算便应运而生。神经网络和模糊计算都是通过对人脑的结构和推理方式的模拟来实现计算机的智能化。“只有人脑才能和人脑相比”——这看似废话,对于机器翻译来说,却是技术上真正意义上的突破口。

6.结语

目前,机器翻译的水平较50年前有了很大的提升,但要彻底克服语言障碍,使MT投入实际应用,还需数学家、计算机专家、人工智能专家、语言学家、心理学家、认知学家、逻辑学家等通力合作,共同努力,从理论研究和应用开发上有所突破,相信机器翻译会到达光明的彼岸。

参考文献

翻译器范文第5篇

关键词:机器翻译;独词句;词义;句义

中图分类号:TP305 文献标识码:A文章编号:1009-3044(2007)03-10788-02

1 引言

机器翻译研究的意义是不言而喻的,它有着重大的社会、经济价值。在当今世界,随着信息的急剧增加,国际交流的日趋频繁,尤其是国际互联网络的逐渐普及,机器翻译的潜在需求越来越大。

机器翻译研究同时又是一项艰巨的研究课题。自1954年美国乔治顿大学进行第一次试验以来,机器翻译已经发展了五十余年,经历了几起几落的曲折历程,人们对它的评价毁誉参半。自20世纪40年代电子计算机诞生之日起,人类就开始了把计算机应用于语言翻译的探索。之后的许多年,机器翻译系统主要是基于双语字典进行直接翻译,几乎没有什么细致的句法结构分析。直到20世纪80年代,计算语言学的发展产生了更加复杂的方法,一些机器翻译系统采用了间接方法进行翻译。在这种方法中,源语言文本被分析转换成某种意义上的抽象表达形式,随后利用一些程序,通过识别词结构(词法分析)和句子结构(句法分析)解决语义上的歧义问题。句法分析模块通常包含识别多义词的模块和识别正确语义关系的模块。人们希望这种抽象表达形式是无歧义的,并为生成一个或多个目标语言提供根据。其中有一种方法将抽象表达设计为一种与具体语种无关的"中间语言(metalanguage)",它可以作为许多自然语言的中介。这样,翻译就分成两个阶段:从源语言到中间语言,从中间语言到目标语言。

然而令人遗憾的是,无论是中英互译还是中日互译的机器翻译软件生成的翻译句子时常会令人啼笑皆非。本文就是希望通过语言学的理论分析,来探讨日语“ちょっと”这个独词句在机器翻译中所遇到的麻烦以及我们需要思考的问题。

2 ちょっと该怎么翻译

rgがあれば行きたいですが。ちょっと。

我们将这段话输入到中、外两个在线机器翻译软件里,得出的翻译结果如下例1所示。

例1:

显然,两个机器翻译软件翻译出来的结果都有很大的问题。“ちょっと。”在这里是一个语言学上所谓的“独词句”,表达一种委婉的否定。独词句是指非主谓句中由一个词直接构成的句子。 这种独词句大量存在于我们的日常语言之中,但是上述两种在线机器翻译软件在翻译这句话的时候都忽略了语言中的这种现象。 “One-word sentences,in which a single word comprises a complete sentence. (R.H.Robins)”(独词句是一个词表达一个完整的句子。) “The fact that the contribution of some words is partly that of reference does not make reference the same as the whole of meaning;and it is not to be assumed that the meaning of a word when it constitutes a one-word sentence is the same as its meaning when it forms part of a larger sentence. (R.H.Robins)” [1] (事实上一些词并不能当成它相同的词义来看,我们不能认为一个词当它作为独词句的时候还能表达与它在长句子中相同的意思。)语言学家Robins教授在1989年的著作中就指出了:独词句表达的不是一个词的意思,应当是一个完整句子的句义。也就是说,研究或者翻译独词句应当从句子的层次来探讨,而不是从词的层次来分析。所以机器翻译在把独词句当成“词”来翻译的时候就犯了致命的错误,因此也就难免产生歧义。

3 “ちょっと”与浅层句法分析

计算机在处理语言翻译的时候通常采取浅层句法分析。

“浅层句法分析(shallow parsing),也叫部分句法分析(partial parsing)或语块分析(chunk parsing),是近年来自然语言处理领域出现的一种新的语言处理策略。它是与完全句法分析相对的,完全句法分析要求通过一系列分析过程,最终得到句子的完整的句法树。而浅层句法分析则不要求得到完全的句法分析树,它只要求识别其中的某些结构相对简单的成分,如非递归的名词短语、动词短语等。这些识别出来的结构通常被称作语块(chunk)。”[2]

比如:

rgがあれば行きたいです。

分成语块就是:

rgが/あれば/行きたい/です/

(依附关系)(依附关系)

浅层句法分析的结果并不是一棵完整的句法树,但各个语块是完整句法树的一个子图(subgraph),只要加上语块之间的依附关系(attachment),就可以构成完整的句法树。所以浅层句法分析将句法分析分解为两个子任务:(1)语块的识别和分析;(2)语块之间的依附关系分析。浅层句法分析的主要任务是语块的识别和分析。这样就使句法分析的任务在某种程度上得到简化,同时也利于句法分析技术在大规模真实文本处理系统中迅速得到利用。句法分析的方法基本上可以分成两类:基于统计的方法和基于规则的方法。当然也可以采用规则和统计相结合的混合方法。

统计方法认为翻译问题也是一个噪音信道问题,如图1。

图1

“可以认为,一种语言S(信道意义上的输入,翻译意义上的目标语言)由于经过了一个噪音信道而发生了扭曲畸变,从而在信道的另一端呈现为另外一种语言T(信道意义上的输出,翻译意义上的源语言),翻译问题实际上就是如何根据观察到的T,恢复最为可能的S的问题。用Pr(S|T)表示T译成S的概率,那么翻译问题就成为:在观察到T的前提下,寻找一个S,使得Pr(S|T)取最大值的问题。 Pr(t1|s1)被称为翻译概率(translation probability),表示单词译成单词的概率。” [3]

也就是说,在计算机软件遇到上例所谈到的“ちょっと”的时候,首先是运用浅层句法分析确定“ちょっと”前后没有依附关系的语块(是一个词单独构成的“独词句”),然后通过统计的方法计算出这个词被翻译成“稍微、少许、一点”的概率很大,于是由“S”到“T”得出了上述例子中的翻译。

笔者认为独词句用浅层句法分析的方法很难得到正确的翻译。比如例2。

例2:

其实每一个实词都可以成为一个独词句,而机器翻译通常情况下没有考虑一个词作为一句话的译法。

因此笔者认为也有必要在机器翻译系统中加入对每个实词作为独词句的含义统计,比如“ご。”作为独词句的时候翻译成“吃饭啦”的概率显然要大于“饭”的概率。借此也可以有效提高对独词句翻译的正确率。

4 独词句与语义分类

此外,通过增强软件的语义分类也可以使对独词句的翻译更加准确。

语义处理至少有下面两个显著作用:(1)语义处理有助于得到句子正确的句法结构。(2)语义处理有助于多义词问题的解决。[4]

独词句正是使用一个词汇的语义来表达通常必须要用一句话才能表达清楚的事情的例子。在例1中,“ちょっと”作为一个词,有“一点点、些微”之意,于是说话人就把它拿来表达“有一点点不方便(ちょっと不便だ。)”、“与您的期待有点点不相同(ちょっとご期待には添えませんが。)”等等要用一句话才能表述清楚的意思;同样,例2中,“ご”作为词其含义是“饭、白米饭”,于是说话人在这个场合就用这个词来表达“到吃饭时间了”、“饭准备好了”等等意义,它们表达的不再是这个词的词义所能概括的了的。特别是在日语中,独词句的存在显得尤为突出。主要的原因是因为日语本身经常省略主语和句子的其他成分,对语言环境的依赖性很强。

“ちょっと。” 是日语中比较特殊也是比较典型的一个独词句。这是特别暧昧、委婉的日本人表达转折与否定的一种特殊方式。这样的独词句在中文和英语中很难找到同样的、用一个词来表达的方式。通过这个例子我们还认为:只要是词都应当首先考虑它作为“独词句”时的“句”义而不仅仅是“词”义。这些可能需要建立例句的数据库来进行语义类比的等价替换。

“基于实例的机器翻译(Example-Based Machine Translation,简写为EBMT)方法的基本思想是由日本长尾真提出的。长尾真探讨了外语初学者的基本模式,发现初学外语的人总是记住最基本的英语句子和对应的日语句子,而后做替换练习。因此,参照这个学习过程,提出了基于实例的机器翻译思想:(1)人类不通过做深层语言学分析翻译句子。(2)人类的翻译过程:首先正确分解输入句子,分解成短语碎片(也许是格框架单元),接着,把这些短语碎片译成其它语言短语,最后把这些短语构成一个长句。每个短语碎片采用类比的原则进行翻译。”[5]

因此,我们可以尝试如图1所表示的方法来进行独词句的翻译。

如图2所示,系统的主要知识源是双语对照的实例库和词库。每当输入一个源语言句子S时,系统首先判断它是否是独词。如果不是,进行句意分析,从词库中调出词的解释,根据语法规则重新组合成目标语言T输入。

如果输入的句子是独词,那么转化为独词句,依靠对前后文的分析,再将该独词句转化为句子。

图2 考虑独词句的句法分析流程

如例1中:

“ rgがあれば行きたいですが。ちょっと。”

在对前文的分析后,系统可以判断“ちょっと”这个独词句,是对短语“rgがあれば”的否定,因此可以从独词句用例库中找到相应的句子:“ちょっと都合がありましてEE。”。然后调用词库进行替换,再进行句意的分析和解释,得出目标语言T。

根据上述系统的流程,独词句就不会再被当成词汇翻译而出现歧义了。笔者认为,独词句是一个“句子”,在做机器翻译的时候要充分考虑它的“句义”,需要将它还原成一般的句子进行处理。

5 结束语

其实,独词句从某种意义上说就是一种表达的省略,这种省略比较复杂。不参考上下文的关系和语境,很难确定省略的是什么成分。在人工智能化还无法达到一定水平的时候,指望机器翻译完全取代人工翻译是不现实的事情。但是不谈翻译的文学性,就达意的程度而言,机器翻译要提高正确率还是能有所做为的。当然如何提高翻译正确的概率仅仅凭借一种方法是远远不够的。笔者的看法是至少要结合上下文的语义分析、语义合理分类以及实例统计三个方面共同作用才能起到好的效果。

实际上,目前许多翻译系统已经在自己原有的单功能分析的立场上有所改变。有的已经开始采用了一些其它方法改善自己的系统。如Nirenburg提出了多引擎(Multi- engine)的概念并在PANGLOSS系统中予以具体实施。PANGLOSS Mark III和其它任何翻译系统的不同之处是该系统有三个翻译引擎:一个基于知识的机器翻译(KBMT)引擎,该系统的一个主要引擎;一个基于实例的机器翻译(EBMT)引擎;一个词汇转换(lexical transfer)引擎 。因此我们有理由期待机器翻译将越来越进步。

参考文献:

[1]R.H.Robins.General Linguistics[M].Longman Group UK Limited.1989.

[2]孙宏林,俞士汶.浅层句法分析方法概述[J].当代语言学.2000(2):23-24.

[3]常宝宝,张伟.机器翻译研究的现状和发展趋势[J].术语标准化与信息技术.1998(2):45-46.

[4]常宝宝,詹卫东.一个汉英机器翻译系统中的语义处理框架及其作用[N].计算机世界报.1998(13).