2010年8月19日星期四

利用Olifant实现Trados和Wordfast翻译记忆库相互转换

For the audience who do not understand Chinese, this post is related to how to convert TMs between mainstream CAT tools, especially SDL Trados and Wordfast. In this post, I will guide you to convert Trados-based TM to Wordfast-based TM with a Windows application called Olifant step by step. If you are interested in this post, please translate it with Google Translate or any other machine translation application to your language. I hope these illustrations help you understand what I am talking about. Please specify the author and source if you reproduce this post on any other site. Thank you for your cooperation!

Trados和Wordfast是目前翻译行业两大主流的翻译辅助工具 (CAT),两者都有鲜明的优点和缺点,许多翻译公司和译者都根据自身的实际情况选择翻译辅助工具。据我了解业界的巨头TransPerfect公司已经由使用Trados全面转向使用Wordfast,而本身作为Trados的开发公司同时也是翻译公司的SDL公司则坚守Trados阵地。现在的问题是,如果客户指定译者使用某款翻译辅助工具,而要求翻译的文件译者曾有接触过,但使用了与客户指定的CAT不同的工具,而且两者的翻译记忆库 (TM) 无法直接实现互转,该怎么办?比如说,Trados Translation’s Workbench 导出的txt格式TM无法直接导入Wordfast,而后者导出的tmx格式TM也无法直接导入前者,两者TM的差异迥然,如下图所示:

Difference_of_TMs

实际上,实现两者之间的转换也并不难,Olifant这款小应用程序可以做到这一点。Olifant是由Okapi Framework开发的,Okapi Framework提供多种组件,主要用于提供跨平台的本地化和翻译的互操作性工具。Olifant一个创建、编辑和管理翻译记忆文件的Windows应用程序。它使用TMX为主要格式,而且还支持其他一些格式。Olifant支持多语言翻译记忆库、过滤、全局查找和替换等,单击这里即可下载这个应用程序。

下载Olifant安装程序并安装到本机之后,就可以使用它来实现不同格式TM之间的相互转换了。在这里我以Trados Translation’s Workbench的翻译记忆库为例演示如何从Trados TM转化为Wordfast TM。

首先,将Trados Translation’s Workbench的翻译记忆库导出,以TMX格式保存。

TM_export

在导出TMX格式TM时,可以在“保存类型”的下拉菜单中选择后三种格式中的任意一种,然后单击保存,将TMX保存在本机的任意位置。

Open_olifant

打开Olifant,然后单击“File”>“Open”,在弹出的对话框中有三种类型的TM可供选择。

Open_file

在这里,打开刚刚保存的TMX格式TM。

Open_tmx

打开TM后,界面如上图所示,箭头所指的地方可供编辑,以修改TM当中的一些错误。修改完后,就可以将TM导出了。

export

单击“File”>“Export”,会弹出一个对话框,在“保存类型”的下拉菜单中选择Wordfast file (*.txt) 选项,如下箭头所示,将TM导成Wordfast格式的TM。

export_wordfast_tm

输入文件名并单击保存按钮,由Trados TM转化为Wordfast的TM就大功告成了,看一下导出的Wordfast TM的模样如何。

 Wordfast_TM

可以看得出来,转化的结果还是令人非常满意。其实,转化的过程可以简述为:Trados Translation’s Workbench TM –> 导出TMX格式TM –>用Olifant打开TMX文件 –> 导出Wordfast TM。在这里,我就不详细演示如何从Wordfast TM转化为Trados TM,其实它是一个逆向过程而已,十分简单。当然除了这种方法,只要是双语对照存在的资料,就不难找到方法实现相互转化。比如说,我之前就经常使用Lionbridge开发的基于SaaS的Translation Workspace将Wordfast TM转化为Trados TM。

(本文转载请注明作者及出处)

2010年8月6日星期五

干爆鸭子

37PI左侧的图片近期网上被热传,我看过之后也不禁捧腹大笑。这张图是中英对照的菜单截图,其中“干爆鸭子”这道菜被翻译成“F*ck the duck until exploded”,翻译成中文“干鸭子直到爆炸”,顿时让人觉得雷声轰隆隆地从远处传来,雷得你外焦里嫩。再仔细一看,菜的价格单位是欧元,这种翻译把脸丢到国际上去了。

“F*ck”是个“低俗”的字眼,但是就有许多国人就喜欢犯这种令人啼笑皆非的毛病,以前也有一张热传的图片是某超市里边把“干货”翻译成了“F*ck goods”。有人说这是机器翻译惹的祸,但我可以负责任地告诉各位机器没有那么笨,不信自己将“干爆鸭子”这个词输入到Google Translate里边试试,这完全是译者水平过低,不求甚解造成的。

但是这种误译却从来不出现在港台,我认为这不是两地的整体文化水平比较高的原因。从另一方面讲,多年前在中国大陆进行汉字简化运动也造成了一定的混淆。在传统汉字里边,“乾”和“幹”两字的读音不同,用法也不同,但都被简化成“干”。在繁体字里,这倒菜名就应该写成“乾爆鴨子”,港台的译者绝对不会联想到“F*ck”,而是首先想到“Dry”,不会像左图偏离中文原意如此之远。由这可以看出老祖宗造字的智慧,也一定程度体现了简化字的危害。

这种现象值得反思,如果不这样的话,有个特别知名的食品商标叫“老干妈”,指不定会被翻译成什么呢!

2010年2月22日星期一

利用 DocFetcher 简化翻译


利用 DocFetcher 简化翻译

作者:郭宝锋

2010年2月

作为一位翻译工作者,我有各种各样的烦恼和期待。从业几年下来,接触的文件非常多,分门别类整理难度巨大,平常碰到一些似曾相识的文件,但会往往忘记了之前做过的文件放在硬盘上的哪个位置,于是不得不搜遍整个硬盘。但是Windows等操作系统自带的搜索功能仅能搜索文件名而已,而文件名的长度本身也有限制,不可能包含所有的信息。这样,往往使得即使翻遍整个硬盘也找不到想要的文件,十分费时费力。因此,就希望能有一款软件能够解决这样的问题,哪怕你只记得其中的一个关键词,也能即搜即得。也许很多译员并不知道,网络上有许多桌面搜索程序可以解决这样的问题。本文的目的正是向各位译员朋友推荐一款强大桌面搜索软件DocFetcher,并且介绍如何利用这款软件简化翻译流程,保证翻译质量。

DocFetcher是一个类似于Google Desktop的开源桌面搜索工具,支持Windows、Linux等多个平台。DocFetcher像Google Desktop一样,搜索本地计算机中的文件如同使用搜索引擎搜索网络一样容易。支持多种文件格式(包括HTML、Microsoft Word、OpenDocument、Txt、PDF、RTF),并且支持中文关键字搜索。该软件目前最新的版本1.0.2,下载该软件安裝版 | 免安裝版(Portable)

下载并安装DocFetcher之后,打开该软件,其主界面如下所示:

鼠标右键点击左侧下方方框的空白处(上图红色方框内),在弹出的对话框中点击Create Index来创建索引,选择想要索引的文件夹。可建多个索引,但不能交叉、重叠索引。在本演示中,作者对存放翻译过的文件的文件夹进行索引。

DocFetcher不仅支持File Types列表中的文件格式,还支持自定义索引该文件夹下其他几乎所有文件格式。选定要索引的文件夹后,在弹出的对话框中点击Text extensions对应的"..."按钮,除了默认的选择文件扩展名txt,可以勾选Trados记忆库文件扩展名tmw、TagEditor文件扩展名 ttx、Wordfast文件扩展名txml等。

索引生成中

索引生成后,你就可以在界面右上方的文本输入框输入您想要查找的关键字。

当你接到一项翻译任务,首先你要想想是不是之前有类似相关的项目,如果有,想想其关键字是什么。比如说,当得到如上截图所示的待翻译的PDF文件之后,因为这个文件本身是扫描版本,现成的TM用不上,再加上已经完全忘记之前的项目放在哪里,要怎么做呢?我首先想到之前做过类似的项目,并且在本地电脑上有备份,因此输入一个关键词“TIMI”,返回的结果如下:

如图所示,界面左下角显示出相关的结果有144个,右上方的方框中则显示出文件名或内文中有“TIMI”这个关键字的所有文件及其分值(score%),分值比较高的排在前面。点击文件名,界面右下方的文本框会显示出其内文。在其中,我们不难得到许多重要的信息,比如说一些固定名称、词组和短语的翻译。在此例子中,我们可以非常迅速地得到项目名称、公司名称等的翻译。

“阜外心血管病医院临床医学伦理委员会” “Medical Ethics Committee of Cardiovascular Institute and Fuwai Hospital”

“第一三共株式会社” “Daiichi Sankyo Co., Ltd.”

……

现在,你可以直接从右下方的文本框中复制相关的翻译,或鼠标右键点击文件名,然后在弹出的对话框中点击“Open”打开文件来复制。这样,翻译就事半功倍了,而且不容易出错,有助于翻译的连续性,保证术语、特定用语、语言风格的一致性。

另外,DocFetcher还支持多种语言搜索,包括中文。比如说,输入“第一三共株式会社”会得到许多结果,在得到的结果中点击其中一个,文本框显示出Trados处理过的中英对照Word文件,其效果不亚于Trados Workbench的相关搜索(Concordance)功能。

与最为广泛应用的桌面搜索工具Google Desktop相比,DocFetcher的弱势是不适于将整个硬盘进行索引,否则有程序崩溃的风险,程序的作者也有提到这一点;其弱势恰恰是其优势,Google Desktop是对整个电脑进行搜索,往往会引入不相关的内容,所以DocFetcher的索引更具针对性,避免干扰;另外,关键词部分在内容显示中以黄色高亮显示,方便定位所查找的关键词。由此来看,DocFetcher这款软件更适于作为相关领域的搜索,特别是把它应用于你的工作中,让你的工作事半功倍。

显而易见,在利用DocFetcher简化翻译的过程中,具有以下几个主要优点:

1. 支持多平台;

2. 支持内文搜索;

3. 文件定位方便;

4. 支持多种文件格式;

5. 支持多种语言搜索,包括中文;

6. 文本显示内文,易于复制;

7. 有助于保证翻译的连续性。

使用心得:DocFetcher功能强大,对系列项目翻译的帮助极大,节省翻译时间,提高生产力。我个人的期望是,公司的项目管理软件也能整合DocFetcher的功能,可以让我们在整个服务器里边进行搜索。关于更多DocFetcher的使用方法,参考以下两个链接。

参考链接

[Portable] DocFetcher 搜尋本地文件內容就像 Google 一樣方便

http://blog.joaoko.net/archives/2587

DocFetcher 快找文件檔案內文的輕巧桌面搜尋器,支援中文索引(由于政府的网络审查,该网站被屏蔽,此文在中国境内无法访问,请翻墙浏览)

http://playpcesor.blogspot.com/2010/02/docfetcher.html