帅哥 发表于 2008-12-27 21:18:35

Trados翻译简要流程

Trados翻译简要流程
1. 分析稿件
1-1 稿件类型分析
说起稿件的类型千百种,但是目前遇到的不外乎以下几种原始格式:
1. Word/RTF档
2. PDF档
3. 白纸档 (咳,也就是只给原文Hardcopy的意思)
4. HTML/XML档
5. 传说中的PageMaker与FrameMaker档 (等有资本买Trados整个solution后看有没有公司要给case吧)
这整个Stage是我自己定义的,任何Trados或是其它翻译软件的文件里都没有提到。为什么要提这个?由经验上我知道进入很多个领域时,首要之务就是先做功课。先做功课可以在几个小时内就让你掌握状况,具备基本know-how跟sense,是很有用的投资。做功课的方法也很重要,不过基本上就要看你求学时搜寻数据的方式了。印象中大学时有门课「作业研究」,提供一些信息领域研究与分析的理论跟简介,不过很多东西都是自己出社会后逐渐由经验得来的。此时推荐的工具有google跟各原厂或产品的相关中英文网页。真的不行的时候直接找产品的HELP或bbs也可以。
这个阶段有几个重要目的:
?有多少既有东西能重复使用?
?有多少参考数据能使用?
?有多少东西是能力所及/不及的?
?成本因素上是否要接单?
1-2 字数计算与工时估算
说到算字数,应该是爬格子的同行们最兴奋也最怕受伤害的时刻了。Word里面 [字数统计] 的功能可以好好利用,只是别错把字符数当成字数,那就真的糗大。
此外,专业一点的方式就是由Translator's Workbench里,利用 分析功能得到。
不过吊诡的事情来了。明明都是字数统计的功能,怎么算出来有略为不同?目前为止我也没抓到原因,要不就是有些Word里自己用的标识符被Trados也算进去了。在Translationzone (Trados Freelancer的网站) 上建议以下的报价方式:
100% Match: charge 30% of base rate per word
99%-85% Fuzzy matches: charge 60% of base rate per word
84%-No Match: charge 100% of base rate per word
这个只是建议的报价方式。台湾这边的业主要求使用Trados的量还不是很多 (以整体翻译市场来看),而且也没有明确的规范。举例来说,我遇过业主希望结案的时候TM跟MultiTerm都一并交出,但由于它是属于 [白纸档] 型的case,因此我会要求这些智慧财要charge;其它业主直接给予TM的case是最棒的了,结案后我们自己也能得到一份业主那边的TM,有助于我们建立更丰富的TM数据库。
在时间的估算方面,建议用你每天所能翻译字数加上一定程度的容许值。例如我一天的水准约在4,000字,在稿件很难的状况下,我会使用下列公式:
所需工期= (总字数 / (4,000*0.9) * 1) *1.2
0.9是困难度的参数,后面1解为一个人翻译,最后的1.2表示容许值。前半公式算出来若是10天,那么乘上1.2就是12天。凡人并非金刚不坏之身,总也有累、烦、病、痛、婚丧喜庆、公司加班等不可抗拒之因素,这个值算是蛮可靠的。
上面字数的部分都以84% fuzzy match以下估计。跟业主就先这样回报好了,因为后续还有很多一致性、格式的相关动作,快也快不了多少。
1-3 准备字汇库
1-3-1 搜寻相关字库
在我几个月使用下来,MultiTerm事实上对Freelancer来说不是甚有用的工具。基本上具规模的业主都有自己格式的glossary供译者参考,如Microsoft的GIAA、CISCO网络相关的glossary等。我也曾经花过苦工,将GIAA中60几万句筛选到约2万句汇入MultiTerm,可惜还是不好用。MultiTerm的部分再找篇幅谈使用心得。在这个阶段,基本上就是先找好届时可以查技术单字、技术定义的地方,好用的工具还是google,译点通也勉强可以。印象中网络上也有很多定义技术字汇的地方,资策会等机构跟一些大专院校的教授网页有时也会有不错的发现。
1-3-2 使用ExtraTerm制作数据库
ExtraTerm是完整Trados解决方案中的一个工具,在我浏览Trados官方网页时找到了试用版。虽然比对分析的结果无法储存,但是还是能得到高出现率的字汇列表 (最多先抄下来再开MultiTerm手动加上去)。
其实ExtraTerm还有许多强大的功能,不过限于手上版本只有旧版的试用版,还是先找能用的部分好了。
这些结果就是汇入文稿中最常出现的字汇,当然,先将一一加入MultiTerm数据库以绝后患。
在我翻阅多本使用手册后,对MultiTerm的用法还是有点不踏实。根据我看到的信息,整个智能翻译的流程应该是这样的:
Original Texts --> TM 85% fuzzy match 先取代 --> 这些取代的句子中,有出入的部分援用MultiTerm内的对应意义
所以MultiTerm真的要上场的时间 (除却将它纯当为字典使用的功能),得要句子达到85%的fuzzy match,而且还要是有出入的那15%才有可能直接填上MultiTerm中的译词。
综合以上,所以我放弃了几天晚上努力筛选的GIAA精简版,重新建立一个单字数在1~5个之间的MultiTerm数据库,里面放的大多是惯用语或俚语,专有名词加减放。毕竟各原厂几乎每季每月都会更新自己的字汇库,频率跟数量都不是下游的译者所能相比的。Trados的业务代表怎么没有去拜访Microsoft呢?
1-3-3 MultiTerm字汇汇入与整理
MultiTerm最新的版本是MultiTerm iX (隔几天4/17就会出新版),附在Trados 5.5 Freelance上的是MultiTerm 5.5。基本上两者各有利弊:MultiTerm 5.5支持直接汇入.txt文件的功能,能将格式化的双语对照txt档直接汇入,成为新的数据库;MultiTerm iX能够在线直接编辑,亦即在Word环境中能直接在线加入新的term,非常方便。我个人先将大量文字转换成.txt,汇入MultiTerm 5.5后再转汇出成MultiTerm iX所支持的XML格式,以便在翻译过程中使用MultiTerm iX。
解开谜题!汇入成MultiTerm 5.5的.txt档格式就是这样。
这是MultiTerm iX的画面,调整过后我在里面仅放入常用的俚语跟技术名词备用。
事实上MultiTerm iX还有个极佳的用法,那就是用来当为我骨灰游戏的数据库。MultiTerm iX的单本记录支持图片、甚至是声音,格式也能自订,又支持XML,保留将来可以直接取用的弹性。日后再来将我那几百套骨灰游戏制成MultiTerm的数据库吧,目前的Access格式还是难用了点。
1-4 准备参考TM
1-4-1 搜寻相关资料
以下以举例的方式来说明,事实上这些内容来自于我先前的一个case,也算是real thing。(不过最后案子因为合约之故没有结案,业主失约让我的小小工作室损失快200K,所以最后没签约放掉)
案子:翻译「Introducing Microsoft Windows Server 2003」
分析:这本书是Microsoft Press的书,里面相关Microsoft的技术。对我的sense来说,在产品整个行销流程上,书籍的出版都尽量压在跟产品同步面世 (产品未出书有用吗?)。但是在行销动作上网页文章与杂志DM却是几个月前就发动了,于是乎我连到台湾跟美国的Microsoft网站,几分钟后发现了下列有用的东西:
「Introducing the Windows Server 2003 Family.htm」的中文版网页就是 「介绍Windows Server 2003系列.htm」,其它也都是一对一对照的情况。如何,免费就能拿到Microsoft官方的翻译资料,不错吧。比尔说过了:Information at your finger tips,我们当然也能从他家借点东西出来用用。
1-4-2 使用WinAlign制作TM
WinAlign是随附在Trados 5.5 Freelance中的工具,专门处理旧有数据去芜存菁的工作。我们可以利用它来将前面找到的资料对应一番:
将对照出来的结果储存汇出,就能得到干净的TM (对应时要注意选用Plain Text,可以得到更干净的对照文字)。
1-4-3 整理档案并汇入TM
最后,将纯文字文件汇入Translator's Workbench即可。我们可以由 功能上查看汇入的成果:
大功告成!至此我们在实际进行翻译前,已经有了一些term的名单,更重要的是也有了初步的TM了。只要分析的动作与步骤实在,可能就会得到下面这种漂亮的数据。
在还没动手前,我们就有约30%的部分高于85%的命中率,翻译的时间跟品质都能更上层楼!
2. 前置处理稿件
2-1 了解格式
接下来是处理原始稿件。客户端取得的稿件型式很多,对软件中文化 (Software Localization,亦即直接对软件上显示的文字进行中文化) 的案子来说常是 .rc (资源档)、.rtf/.doc (软件的在线说明,会build成 .chm) 或 .htm (.xml) 等。
2-1-1 使用格式转换工具 (如Acrobat)
2-1-2 转换时图形处理方式
2-2 在Word中自动格式化文件
2-3 检查与编修文件
页: [1]
查看完整版本: Trados翻译简要流程