当前位置:首页 > 开发 > 编程语言 > 编程 > 正文

机器翻译的误区(二)

发表于: 2010-08-26   作者:bardo   来源:转载   浏览次数:
摘要:         也许你对这个语义架构表不以为然。我们先讲一下它的应用。         针对前面的例子。我们清楚,名词首先要按这个表中的行,进行语义分类。而词组,则需要进行语义分析,按语义级结构选择语义。由此:street, bedroom均是somewhe

        也许你对这个语义架构表不以为然。我们先讲一下它的应用。

        针对前面的例子。我们清楚,名词首先要按这个表中的行,进行语义分类。而词组,则需要进行语义分析,按语义级结构选择语义。由此:street, bedroom均是somewhere. 而 come scross somwhere,其语义是:穿过了somewhere, 来到了somewhere的对面。那么,我们可以看出,经过这样一处理,不仅是这一句翻译正确了。同时,机器具备了机器学习与知识积累的技能。

        这便是语义架构基本模型的作用。当然,对于纯粹的惯用法,象“so do I”这样的,是无法使用语义架构分析的。但这在任一语言中均是少数。我们可以看出,英语的语义架构基本模型加上时态语气,介词等封闭词类,可以构成任一种抽象的句式。我们言语中的任一句话,抽象的结果均离不开不些词。所以,它提供的语义理解的途径。这如同软件编程中的依赖倒置原则一样。我们拥有了一个抽象的模型。那么,建立具体的语义库,以及语义分析算法就相当方便了。

        也许,你会说,语义对接并不是对等的。这话并不完全正确。因为,虽说各民族各语言中有些特定的文化,专有的词汇,但绝大多数是能进行语义对接的。有人用“大”字举证过这一事实。但那种说法也是不正确的。原因在于,我们没有对语义结构分析透彻。因为,大本义就是大。至于,广大,强大,伟大,均不是其本义,当用成此义时,我们应当视这些词为缩写词,这样,英语与汉语的语议就对接上了。当然,有些并不需要将其当成缩写词,当整个词汇在目标语言中有对等词汇时。比如,大海,就不需要当成缩写词,而大风,大人则必须当成缩写词。

        有了很好的语义库,机器翻译实际上就是相当简单的事了。因为,所谓的语义分析算法,就是分析与检索语义,然后按目标语言词序调整。假如这样的软件,或者网站问世,它会慢慢成长,因为,它具备自我学习功能。因而,我们可以相信,它会慢慢成为翻译高手。加上这么多年来,汉语分词技术进了长足的进步,所以,不仅英译汉,汉译英也比以往简单多了。

        机器翻译,这项技术的进步,不仅是翻译技术,同时还会影响到机器思维,机器学习等。语义架构基本模型,是属于知识模型,用此,机器可以自我积累知识。进而可以发展成机器思维。但这么多年来,机器翻译一直是处于几乎停止不前的状态。trados.com虽说被微软收购,但是,他们也只能处理软件的本地化,并不是真正的机器翻译高手。并且,由于英汉互译的特殊性,trados.com目前连中文网页都没有。而国内,以中科院的译星,天津的译典等均是以往令人啼笑皆非的翻译软件。后来的雅信译霸提出的CAT理念虽好,但仍然没有语义结构分析。所以,不具备学习技能。金山公司的金山词霸,当年媒体报道中引用他的话,“一招先,吃遍天”,可惜,现在也进入了死胡同。我们不知金山翻译是不是与词霸一样,与他人合作放到了网上,如果是这样,如果我们在新浪,在GOOGLE中用的就是这个,那真是太笑人了。一晃八年过去了。八年前讲一朝鲜,却认定所谓语言与翻译专家的是正确的。这是一个极为可悲的错误。

        因为,机器翻译,最有发言权的,是对人工智能研究的人员,绝不是什么语言学家。因为,就是懂计算机的语言学家,也不懂得计算机能做什么。只有人工智能研究人员最有发言权,也只有他们的成果才是最可信的。

        当然,本文中所给的只是最基本的语义架构,要建成庞大可用的语义库,工程是相当大的。所以笔者想,如果有可能,如果你愿意,不妨和我们一起开始一个英汉语义库计划。放眼国外,巴比伦翻译软件在一天天壮大。尽管它目前英汉仍相当差。而人类,特别是中国人,迫切需要一个真正可用的机器翻译软件。八年来的进展可以证明,靠专家是行不通的。所以,我们欢迎有识之士能够加入我们的这项计划。

 

        注:本文中所给的语义基本架构表只是本人在人工智能研究领域对机器翻译研究的成果中的极少的一部分。版权归笔者所有。同时欢迎海内外同行与我交流。本人才疏学浇,所以,错误难免。也希望大家不吝指正。

机器翻译的误区(二)

  • 0

    开心

    开心

  • 0

    板砖

    板砖

  • 0

    感动

    感动

  • 0

    有用

    有用

  • 0

    疑问

    疑问

  • 0

    难过

    难过

  • 0

    无聊

    无聊

  • 0

    震惊

    震惊

编辑推荐
上接 DotNet并行计算的使用误区(一) ● 误区三 . 并行计算是运行时的事 的确,DotNet会在运行时决定
原作者: 来源Language Log » Happy cat → I’m cute 译者chunfengqiushui 机器翻译与中式英语 梅
之前在网上看到了一篇使用MapReduce实现二次排序的博客,自己尝试实现了,并测试成功,代码有所改动
巴比伦塔的失败说明了语言不通导致的沟通不畅会严重影响生产力, 然而我们又无法统一语言,所以机器
微软首席研究官 Rick Rashid 博士在天津举办的“ 21 世纪的计算 – 自然而然”会议上展示了他们实时
这段时间在学习python(2.5), 准备学习一下python访问mysql的代码,在网上查了下,于是下了个.tar的
动态规划具有如下特点:1.有递推性质,可以将大的问题转化成小的问题,可以由小的问题推出大的问题
每到年底,业内不少工程师又需面对晋升答辩的流程,如何让自己在最短的时间完成职级提升是大家关注
认识的误区:Hadoop=云计算 作者:chszs,转载需注明。 作者博客主页:http://blog.csdn.net/chszs
context.setTransform(1,0,0,1,0,0);//重置转换为初始化状态 var angleInRadians = 45 * Math.PI /
版权所有 IT知识库 CopyRight © 2009-2015 IT知识库 IT610.com , All Rights Reserved. 京ICP备09083238号