Trados翻译简要流程

帅哥发表于 2008-12-27 21:18:35

Trados翻译简要流程
1. 分析稿件
1-1 稿件类型分析
说起稿件的类型千百种，但是目前遇到的不外乎以下几种原始格式：
1. Word/RTF档
2. PDF档
3. 白纸档 (咳，也就是只给原文Hardcopy的意思)
4. HTML/XML档
5. 传说中的PageMaker与FrameMaker档 (等有资本买Trados整个solution后看有没有公司要给case吧)
这整个Stage是我自己定义的，任何Trados或是其它翻译软件的文件里都没有提到。为什么要提这个？由经验上我知道进入很多个领域时，首要之务就是先做功课。先做功课可以在几个小时内就让你掌握状况，具备基本know-how跟sense，是很有用的投资。做功课的方法也很重要，不过基本上就要看你求学时搜寻数据的方式了。印象中大学时有门课「作业研究」，提供一些信息领域研究与分析的理论跟简介，不过很多东西都是自己出社会后逐渐由经验得来的。此时推荐的工具有google跟各原厂或产品的相关中英文网页。真的不行的时候直接找产品的HELP或bbs也可以。
这个阶段有几个重要目的：
?有多少既有东西能重复使用？
?有多少参考数据能使用？
?有多少东西是能力所及/不及的？
?成本因素上是否要接单？
1-2 字数计算与工时估算
说到算字数，应该是爬格子的同行们最兴奋也最怕受伤害的时刻了。Word里面 [字数统计] 的功能可以好好利用，只是别错把字符数当成字数，那就真的糗大。
此外，专业一点的方式就是由Translator's Workbench里，利用分析功能得到。
不过吊诡的事情来了。明明都是字数统计的功能，怎么算出来有略为不同？目前为止我也没抓到原因，要不就是有些Word里自己用的标识符被Trados也算进去了。在Translationzone (Trados Freelancer的网站) 上建议以下的报价方式：
100% Match: charge 30% of base rate per word
99%-85% Fuzzy matches: charge 60% of base rate per word
84%-No Match: charge 100% of base rate per word
这个只是建议的报价方式。台湾这边的业主要求使用Trados的量还不是很多 (以整体翻译市场来看)，而且也没有明确的规范。举例来说，我遇过业主希望结案的时候TM跟MultiTerm都一并交出，但由于它是属于 [白纸档] 型的case，因此我会要求这些智慧财要charge；其它业主直接给予TM的case是最棒的了，结案后我们自己也能得到一份业主那边的TM，有助于我们建立更丰富的TM数据库。
在时间的估算方面，建议用你每天所能翻译字数加上一定程度的容许值。例如我一天的水准约在4,000字，在稿件很难的状况下，我会使用下列公式：
所需工期= (总字数 / (4,000*0.9) * 1) *1.2
0.9是困难度的参数，后面1解为一个人翻译，最后的1.2表示容许值。前半公式算出来若是10天，那么乘上1.2就是12天。凡人并非金刚不坏之身，总也有累、烦、病、痛、婚丧喜庆、公司加班等不可抗拒之因素，这个值算是蛮可靠的。
上面字数的部分都以84% fuzzy match以下估计。跟业主就先这样回报好了，因为后续还有很多一致性、格式的相关动作，快也快不了多少。
1-3 准备字汇库
1-3-1 搜寻相关字库
在我几个月使用下来，MultiTerm事实上对Freelancer来说不是甚有用的工具。基本上具规模的业主都有自己格式的glossary供译者参考，如Microsoft的GIAA、CISCO网络相关的glossary等。我也曾经花过苦工，将GIAA中60几万句筛选到约2万句汇入MultiTerm，可惜还是不好用。MultiTerm的部分再找篇幅谈使用心得。在这个阶段，基本上就是先找好届时可以查技术单字、技术定义的地方，好用的工具还是google，译点通也勉强可以。印象中网络上也有很多定义技术字汇的地方，资策会等机构跟一些大专院校的教授网页有时也会有不错的发现。
1-3-2 使用ExtraTerm制作数据库
ExtraTerm是完整Trados解决方案中的一个工具，在我浏览Trados官方网页时找到了试用版。虽然比对分析的结果无法储存，但是还是能得到高出现率的字汇列表 (最多先抄下来再开MultiTerm手动加上去)。
其实ExtraTerm还有许多强大的功能，不过限于手上版本只有旧版的试用版，还是先找能用的部分好了。
这些结果就是汇入文稿中最常出现的字汇，当然，先将一一加入MultiTerm数据库以绝后患。
在我翻阅多本使用手册后，对MultiTerm的用法还是有点不踏实。根据我看到的信息，整个智能翻译的流程应该是这样的：
Original Texts --> TM 85% fuzzy match 先取代 --> 这些取代的句子中，有出入的部分援用MultiTerm内的对应意义
所以MultiTerm真的要上场的时间 (除却将它纯当为字典使用的功能)，得要句子达到85%的fuzzy match，而且还要是有出入的那15%才有可能直接填上MultiTerm中的译词。
综合以上，所以我放弃了几天晚上努力筛选的GIAA精简版，重新建立一个单字数在1~5个之间的MultiTerm数据库，里面放的大多是惯用语或俚语，专有名词加减放。毕竟各原厂几乎每季每月都会更新自己的字汇库，频率跟数量都不是下游的译者所能相比的。Trados的业务代表怎么没有去拜访Microsoft呢？
1-3-3 MultiTerm字汇汇入与整理
MultiTerm最新的版本是MultiTerm iX (隔几天4/17就会出新版)，附在Trados 5.5 Freelance上的是MultiTerm 5.5。基本上两者各有利弊：MultiTerm 5.5支持直接汇入.txt文件的功能，能将格式化的双语对照txt档直接汇入，成为新的数据库；MultiTerm iX能够在线直接编辑，亦即在Word环境中能直接在线加入新的term，非常方便。我个人先将大量文字转换成.txt，汇入MultiTerm 5.5后再转汇出成MultiTerm iX所支持的XML格式，以便在翻译过程中使用MultiTerm iX。
解开谜题！汇入成MultiTerm 5.5的.txt档格式就是这样。
这是MultiTerm iX的画面，调整过后我在里面仅放入常用的俚语跟技术名词备用。
事实上MultiTerm iX还有个极佳的用法，那就是用来当为我骨灰游戏的数据库。MultiTerm iX的单本记录支持图片、甚至是声音，格式也能自订，又支持XML，保留将来可以直接取用的弹性。日后再来将我那几百套骨灰游戏制成MultiTerm的数据库吧，目前的Access格式还是难用了点。
1-4 准备参考TM
1-4-1 搜寻相关资料
以下以举例的方式来说明，事实上这些内容来自于我先前的一个case，也算是real thing。(不过最后案子因为合约之故没有结案，业主失约让我的小小工作室损失快200K，所以最后没签约放掉)
案子：翻译「Introducing Microsoft Windows Server 2003」
分析：这本书是Microsoft Press的书，里面相关Microsoft的技术。对我的sense来说，在产品整个行销流程上，书籍的出版都尽量压在跟产品同步面世 (产品未出书有用吗?)。但是在行销动作上网页文章与杂志DM却是几个月前就发动了，于是乎我连到台湾跟美国的Microsoft网站，几分钟后发现了下列有用的东西：
「Introducing the Windows Server 2003 Family.htm」的中文版网页就是「介绍Windows Server 2003系列.htm」，其它也都是一对一对照的情况。如何，免费就能拿到Microsoft官方的翻译资料，不错吧。比尔说过了：Information at your finger tips，我们当然也能从他家借点东西出来用用。
1-4-2 使用WinAlign制作TM
WinAlign是随附在Trados 5.5 Freelance中的工具，专门处理旧有数据去芜存菁的工作。我们可以利用它来将前面找到的资料对应一番：
将对照出来的结果储存汇出，就能得到干净的TM (对应时要注意选用Plain Text，可以得到更干净的对照文字)。
1-4-3 整理档案并汇入TM
最后，将纯文字文件汇入Translator's Workbench即可。我们可以由功能上查看汇入的成果：
大功告成！至此我们在实际进行翻译前，已经有了一些term的名单，更重要的是也有了初步的TM了。只要分析的动作与步骤实在，可能就会得到下面这种漂亮的数据。
在还没动手前，我们就有约30%的部分高于85%的命中率，翻译的时间跟品质都能更上层楼！
2. 前置处理稿件
2-1 了解格式
接下来是处理原始稿件。客户端取得的稿件型式很多，对软件中文化 (Software Localization，亦即直接对软件上显示的文字进行中文化) 的案子来说常是 .rc (资源档)、.rtf/.doc (软件的在线说明，会build成 .chm) 或 .htm (.xml) 等。
2-1-1 使用格式转换工具 (如Acrobat)
2-1-2 转换时图形处理方式
2-2 在Word中自动格式化文件
2-3 检查与编修文件

页: [1]

航空论坛_航空翻译_民航英语翻译_飞行翻译's Archiver

Trados翻译简要流程