帅哥 发表于 2009-7-16 23:53:43

Trados 基本知识、使用技巧与经验(此帖甚强,建议大家通读)

本贴的内容将着重于 Trados 的 Workbench 和 Tageditor 两个组件,其他组件也会在后续内容中有所涉及。

所帖内容暂分为三类:

【基础知识】:就各组件的某一功能和特性进行解释说明

【界面操作】:逐一介绍相关组件界面的内容设置及其含义

【技巧经验】:介绍使用技巧、使用经验和使用中某些具体问题的解决办法

所有内容均针对 Trados 6.5 来展开。

本人能力有限,斗胆发出此贴,旨在增进交流,共同提高,企盼网友的支持和参与,提供你们的宝贵建议和意见,把每个人的知识和经验变成大家的知识和经验。帖中错误不当之处在所难免,望大家不吝赐教。

===========================================================================================================================

Workbench 组件目录索引:

Workbench 简介及相关术语约定

【操作界面】

Options -> Translation Memory Options -> General 选项卡

Options -> Translation Memory Options -> General 选项卡(续)

Options -> Translation Memory Options -> Penalties 选项卡

Options -> Translation Memory Options -> Substitution Localisation 选项卡

Options -> Translation Memory Options -> Concordance 选项卡

Options -> Translation Memory Options -> Tools 选项卡

Options -> Terminology Recognition Options 对话框

Options -> Translated Text Colours 对话框

Settings -> Project and Filter Settings 对话框

Settings -> Select Target Language 对话框

Settings -> User ID 对话框

Settings -> Non-translatable Paragraphs 对话框

Workbench 的 View 菜单项( 详见:新手入门 4 )

Tools -> Analyse 对话框

Tools -> Translate 对话框

Tools -> Clean up 对话框

【新手入门】

新手入门 1

新手入门 2

新手入门 3

新手入门 4

【专题知识】

关于 Attribute Field 和 Text Field

关于 Project Settings 和 Filter Settings

关于 Multiple Translation

【专题讨论】

字数分析(Analyse)的影响因素

关于Tool -> Analyse 对话框中 Use TM from previous analysis 选项的应用

关于 Project and Filter Settings 选项卡以及 Attribute 和 Text 字段的应用(原 Trados 使用教程中文版一帖的内容)

关于 Project and Filter Settings 选项卡以及 Attribute 和 Text 字段的应用(本主题)

翻译过程中使用 TM 库的一个方案设想 —— 有关 General 选项卡 Do not create new translation units if only text fields differ 选项的一个应用

有关 DTD Setting (ini) 文件使用方面的一些问题

关于 Analyse 选项卡的一点使用体会

帅哥 发表于 2009-7-16 23:54:09

【Workbench 简介及相关术语约定】


20 世纪 40 年代末期,英国工程师 A.D.Booth 和美国工程师 W.Weaver 提出了计算机代替人工翻译的可能性,它不禁使人畅想,未来的时代可能是一个全能的机器翻译时代,那时,人工翻译将仅限于文学领域。
时至今日,机器翻译领域仍无长足进展,无论是人工智能模式还是统计模式,都未能获得令人满意的翻译效果。而在这一过程中,一种退而求其次,依靠人工参与的计算机辅助翻译系统 (Computer Aided Translation, CAT) 开始大行其道,成功得以应用,并在今日的本地化领域及其他翻译领域成为主流的翻译工具。CAT 的基本概念就是“翻译记忆”(Translation Memory,TM),它和其他许多人类的发明一样,是人们避免重复劳动的“偷懒创造”。
TM 的原理很简单,就是将已翻译过的内容以“成对”原文和译文的方式存储在特定数据库中,当进行新的翻译工作时,使用要翻译的内容在数据库中检索相匹配的原文,如果找到完全匹配的原文,则可以直接使用其译文,如果找到的是达到一定匹配率但不是完全匹配的原文,则可以将其译文作为参考,经过适当的修改后使用。通过这个过程几乎可以完全避免翻译的重复工作,充分利用原有的翻译内容,达到降低翻译成本、提高翻译效率的目的。同时,TM 还为译文和术语的一致性提供了有力的保障,也为用户之间交换翻译库带来了便利。
一般所用的 CAT 软件就是所谓的 TM 数据库系统,它可以创建、管理、维护 TM 数据库,是翻译人员与 TM 数据库之间的中介桥梁,有些 CAT 软件还融入了本地化翻译项目管理的概念,提供了项目字数分析、预翻译处理等功能,Workbench 就是这样一款产品。
它主要包括四大功能模块:
TM 的创建和维护 - TM 创建(File -> New...)、导入(File -> Import...)、导出(File -> Export...)、TM 数据库整理(File -> Reorganise...)、TM 数据库维护(File -> Maintenance...)
TM 的设置 - TM 的常规信息、TU 信息字段、字体、Non-translatable 设置、分隔规则、TM 访问权限(File -> Setup...)
Workbench 设置 - 基本设置(Settings 菜单)、窗口显示设置(View 菜单)、翻译设置(Options 菜单)
Workbench 工具 - 3 大批处理工具(Tools 菜单下的 Analyse、Translate 和 Cleanup 实用工具)、索引词查询工具(Tools 菜单下的 Concordance 实用工具)
基于这些功能,Workbench 在三个层次上实现了对重用翻译内容的支持:
1、Segment 支持
  
在翻译过程中,可以利用 Workbench 的主窗口,获得整句原文的搜索匹配结果
2、Subsegment 支持
  
可以利用 Workbench 的 Concordance 工具,以整句中的部分内容作为关键词进行搜索
3、Terminology 支持
  
可以借助  Trados 的组件工具 Multiterm 实现词汇(术语)的检索重用
【本贴术语约定】
下面是一些后续文档中要使用的术语,为了统一起见,特此列出。术语列表可能会随文档内容的更新而不断增补。
TM - 翻译记忆数据库系统(Translation Memory )
TU  - 翻译单元(Translation Unit),TM 的存储单位,每个 TU 由原文部分(Source Segment)、译文部分(Target Segment)、系统信息字段(System Field)和自定义信息字段(Attribute Field 及 Text Field)四部分组成
Source Segment - TU 中的原文部分
Target Segment - TU 中的译文部分
System Field - TU 中的系统信息字段,包括:Created on、Created by、Changed on、Changed by、last Used、usage
Attritute Field - 用户自定义的 TU 信息字段,每个属性信息字段需要定义字段名和相应的字段值,设置时在 Project Settings(Settings -> Project and Filter Settings)中进行选择
Text Field - 用户自定义的 TU 信息字段,每个文本信息字段只需定义字段名称,字段值在 Project Settings 中以文本形式输入
No Match - TM 中 TU 的匹配情况。表示 TM 中当前不存在匹配率大于等于 Minimum match value % 值(Options -> Translation Memory Options -> General 选项卡)的 TU
Fuzzy Match - TM 中 TU 的匹配情况。表示 TM 中当前存在匹配率大于等于 Minimum match value % 值但小于 100% 的 TU
Full Match - (100% match)TM 中 TU 的匹配情况。表示 TM 中存在匹配率等于 100% 的 TU
Placeable - 在 TU 的 Target 中需要保留原文而不翻译的 Source 部分的内容,主要是 Tag。由于可以对其进行移动,因此得名 Placeable
Penalty - 匹配率扣减。翻译文档过程中,在对 TM 中的 TU 进行匹配时,首先是将文档中要翻译的内容与 TM 中 TU 的 Source 部分进行“文本”上的匹配,之后,会考虑其他一些在要翻译的内容与 TM 中 TU 的 Source 部分之间存在的差异和相关因素来调整(扣减)文本匹配率,其中包括:文本格式(字体、字号、其他特殊效果)的差异、属性信息字段及文本信息字段的差异、所包含的 Tag 的差异,是否存在 Multiple Translation 等等。从“文本”匹配率中扣减掉适用的 Penalty 值后,得出的才是最终的匹配率
Multiple Translation - 指 TM 中对于某个特定的 Source(原文)内容存在有多个 Target(译文)内容的现象,即 TM 有多个其 Source 部分相同但 Target 部分不同的 TU
Batch Tool - 指 Workbench 的三个批量处理工具:Analyse(字数分析工具)、Translate(预翻译工具)、Cleanup(清除原文工具)

【TU 结构示意图】
http://bbs.giltworld.com/UploadFile/2006-11/200611210113711677.jpg
红色:Source Segment(原文部分)
黄色:Target Segment(译文部分)
蓝色:System Field(系统字段),分别为,创建时间、创建者、修改时间、修改者、最后修改时间、使用次数
绿色:自定义信息字段


【以下内容】先逐一介绍 Workbench 各个菜单对话框的设置和操作,中间会插入一些使用方面的技巧、方法,最后会就某几个专题集中进行讨论。

帅哥 发表于 2009-7-16 23:54:30

Workbench 的 Options -> Translation Memory Options -> General 选项卡




Minimum match value %
   【解释说明】
指定 fuzzy match 的阈值。Workbench 将 TM 中翻译单元的匹配情况分为三种:full match(或 100% match)、fuzzy match、no match。而 Minimum match value % 就是 fuzzy match 和 no match 的分水岭,即匹配率小于此值的为 no match,大于等于此值但不完全匹配的为 fuzzy match。在翻译过程中,Workbench 窗口会显示 full match 和 fuzzy match 的翻译单元,但如果是 no match,则不显示任何翻译单元。
【使用提示】
该设置的系统默认值为 70%,如果希望匹配到更多的 TU,可以降低设置。但一般来说,较低的设置并不能保证提供具有重用价值的翻译单元。
另外,该阈值还会影响到字数分析 (Analyse)。具体来说,Workbench 的 Tools -> Analyse 面板下部会列有以下统计项:95~99、85~94、75~84、50~74、No match,如果某个句子在 TM 中的实际匹配率为 60%,当 Minimum Match Value 值低于 60 % 时,会将这个句子统计到 50~74 这一项中;当 Minimum Match Value 值高于 60% 时,会将这个句子统计到 No match 一项。因此,Minimum Match Value 值不同,某些情况下统计结果会有很大的差别。需要提请注意的是,Minimum Match Value 的值是保存在本机的 Workbench 中的(而不是保存在 TM 数据库中),也就是使用本机的 Workbench 打开任何一个 TM,Minimum Match Value 值都不变。因此,对于经常使用 Wrokbench 做字数分析的 PM 人员,如客户没有特殊的要求,建议使用默认的 Minimum Match Value 值,以免造成分析结果不一致的情况。
Maximum number of hits
【解释说明】
指定在 Workbench 窗口中可显示的 full match 或 fuzzy match 的翻译单元的数量。比如对于文档中的某句话,TM 中有 10 个翻译单元的匹配率大于 Minimum match value % 值但都不是完全匹配,如果 Maximum number of hits 值设置为 5,则在 Workbench 窗口中只可能显示前 5 个翻译单元。具体显示时,会在窗口中显示匹配率最高的那个翻译单元,此时,窗口左下角的翻译单元切换按钮会处于可用状态,可以使用这些按钮访问其他 4 个匹配率相对最高的 fuzzy match 翻译单元。如果 TM 中有且只有一个 full match 的翻译单元,则会只显示该翻译单元,切换按钮处于不可用状态。但如果有多个 full match,则会按 fuzzy match 的显示规则进行显示。

【使用提示】
建议使用系统的默认值 5

【Switches】(开关设置)
Display time
【解释说明】
在 Workbench 窗口左侧的 Created on 和 Changed on 位置显示当前窗口中显示的翻译单元的时间信息。如果不选中此复选框,则只显示日期信息。

【使用提示】
翻译人员在选择使用 TU 时,如果日期无法作为判断条件,可以参考时间信息。在多人共享同一 TM 时,也可根据时间信息判断是否选用已被修改的 TU 译文部分。另外,可以根据时间信息判断当前 TU 是集中 Cleanup 到 TM 中的 TU,还是翻译过程中提交到 TM 中的 TU,如果有多个 TU 的日期时间完全一样(精确到分钟),则可以大致判断这些 TU 是通过 Cleanup 操作进入翻译单元的。
Show project settings
【解释说明】
打开 TM 时显示 Project and Filter Settings 对话框,以便用户在开始工作之前设置自定义信息字段。

【使用提示】
如果项目中使用的 TM 包含自定义信息字段,并且在翻译过程中需要将这些信息字段附件到 TU 来提交到 TM 数据库,则适宜选中此复选框,这样可以在开始工作前设置或确保设置相应的自定义信息。如果项目无此要求,则建议清除此复选框,这样在打开 TM 时就不会显示 Projcet and Filter Settings 对话框。
   

Copy source on no match
【解释说明】
在翻译过程中,如果 TM 中没有任何翻译单元的匹配率大于等于 Minimum match value % 值,即出现了 no match 的情况,则选中该复选框的情况下,会将 Source 部分复制到译文位置。

【使用提示】
建议选中此复选框。如果要翻译的句子中的某些词需要保留为英文(而且有时这类内容需要保留原有格式),则在 no match 的情况下,会自动将 Source 部分复制过来,翻译完后删除不需要的英文即可,这样可免去输入那些保留为英文的部分。
Insert blank after tag
【解释说明】
当使用 Tageditor 组件工具栏的 Placeable 插入按钮(包括 Get previous placeable、Get current placeable、Get next placeable),或者在 Word 中使用 Trados 工具栏中的 Placeable 插入按钮(取上一非译元素、取当前非译元素、取下一非译元素),在翻译文档的 Target 部分插入 Placeable 内容(即通常所谓的 tag 标记)时,会自动在 tag 后面添加一个空格。

【使用提示】
具体的测试中发现,在 Tageditor 中操作时,无论是否选中该选项,均无任何效果;而在 Word 中操作时,无论是否选中该选项,如果在英文前插入 tag,都会自动添加一个空格,如果在中文前插入 tag,也没有任何效果。
Strip tags from fuzzy matches...
   【解释说明】
如果翻译过程中,文档中当前要翻译的句子不带有 tag,但 TM 中与之具有最高匹配率的翻译单元却带有 tag,则选中该选项后,使用相应命令来复制 TM 中该翻译单元的译文时,会自动去掉 tag。
【使用提示】
该选项在 Word 和 Tageditor 中均有效。建议选中该选项。
Ask before opening...
  这个和 TM Server 有关,希望其他网友提供相关信息。
(待续...)

帅哥 发表于 2009-7-16 23:54:47

Workbench 的 Options -> Translation Memory Options -> General 选项卡(续)
   



阅读本文档之前,如有必要,请参阅本贴中的以下内容:
[*]关于 Attribute Field 和 Text Field[*]关于 Multiple Translation(Project Settings 导致 Multipel Translation 的说明) [*]关于 Project Settings 和 Filter SettingsUpdating attribute and text fields
【解释说明】
   在翻译文档时,如果文档中当前正在翻译的原文在 TM 中对应有完全匹配的 TU(翻译单元),但该 TU 的自定义信息字段值与当前 Project Settings 中设置的不一样,这种情况下,您可能会完全重用匹配的译文,也可能会对译文进行修改,问题在于,在提交该翻译单元时,如果对译文进行了修改,那么提交后是覆盖原来那个匹配的 TU 还是创建一个新的 TU;在重用原来的译文以及修改原来的译文这两种情况下,提交时如果不创建新的翻译单元,如何处理 TM 中该翻译单元原有的自定义信息字段值与 Project Settings 中的设置不同这一矛盾?是保留原来的信息字段值,还是替换为 Project Settings 中的设置,或者是将这两者合并?以下对这些问题进行简要的分析说明。
当遇到 100% 匹配的 TU 时,通常会出现三种处理情况:
① 使用了匹配的 TU 的译文部分而没有进行修改,提交后保留 TM 中那个匹配的 TU,出现这种情况要满足以下条件:
[*]遇到 100% 匹配的 TU[*]使用了该 TU 的译文部分而没有进行修改② 修改了匹配的 TU 的译文部分,提交后保留 TM 中那个匹配的 TU 但替换其译文部分,出现这种情况要满足以下条件:
[*]遇到 100% 匹配的 TU[*]修改了译文部分[*]当前 Project Setings 中设置的 Attirubte 和 Text 字段值与当前匹配的 TU 附带的字段值一致或为后者的一个子集(或者说后者包含前者)。注1[*]使用通常的 Trados 提交按钮 http://bbs.giltworld.com/UploadFile/2007-1/2007131937171985.jpg 或命令来提交翻译单元,而不是使用 Workbench 菜单中的 Add as new translation 菜单项(在 Tageditor 中)或者使用 Trados 菜单中的“添加新译文”菜单项(在 Word 中)提交翻译单元。注2③ 修改了匹配的 TU 的译文部分,提交后在 TM 中生成新的 TU,出现这种情况要满足以下条件:
[*]遇到 100% 匹配的 TU[*]修改了译文部分[*]当前 Project Setings 中设置的 Attirubte 和 Text 字段信息值与当前匹配的 TU 附带的字段信息值不一致且前者不是后者的一个子集。在提交翻译单元时,Trados 会按以上条件判断是保留 TM 中匹配的 TU、覆盖匹配的 TU、还是保留匹配的 TU 但新增一个 TU。
如果匹配的 TU 的自定义信息字段值与当前 Project Settings 中的设置不一致,在以上所述的前两种情况下(即不增加新的 TU 的情况下),会按本选项卡 Updating attribute and text fields 区域的设置进行处理。
该区域有两组设置: Used translation units 和 Changed translation units,分别确定上述的第 1、2 种情况下如何处理 Project Settings 中的设置与匹配的 TU 的字段值不一致的情况。如果 Project Settings 中未设置任何内容,则不适用这些选项。
可选择的处理方式如下:
[*]Leave unchanged —— 保留原有的自定义信息字段值[*]Merge —— 将原有的自定义信息字段值与 Project Settings 中的设置合并[*]Overwrite —— 使用 Project Settings 中的设置替换原有的字段信息值举例来说,比如 TM 中当前匹配的 TU 的自定义信息字段值为 Client:HP,而 Projcet Settings 中的设置为 Client:IBM,则上述三个选项设置对应的结果如下:Client:HP(保留)、Client:HP,IBM(合并)、Client:IBM(替换)。
需要说明的是,对于上述的 TU 100% 匹配的第二种情况,在 Changed translation units 部分选择 Leave unchanged 和 Merge 的实际效果是一样的,拿注释1 中的例子来讲,提交后的标记都是 client = IBM, HP。


【使用提示】一般选择将这两种情况均设置为 merge,这样既不会破坏已有的自定义信息字段值,也可将 Project Settings 中的设置包含进去。当然,如果 Project Settings 中未设置任何内容,则不适用这些选项。
Do not create new translation units if only text fields differ

【解释说明】
选中该选项后,如果在 Project Settings 中设置了 text 字段,且 Project Settings 中的设置与 TM 中原有翻译单元的自定义信息字段值相比较,只有 text 字段不同,则“提交时修改了 TM 中原有的 TU 的译文部分”的情况下,不会添加新的翻译单元,而是覆盖原有的翻译单元。
【使用提示】
可以利用这个设置满足一些特殊的需要,将在以后的帖子中进行介绍。


注释1:举例来说,如果 Project Settings 中设置了一个 client 字段,并且为其选择的值为 HP,则提交翻译单元时,应附带 client = HP 这个信息字段值,但如果 TM 中完全匹配的 TU 所附带的信息字段值为 client = IBM, HP,则前者就为后者的一个子集,即后者包括前者。
注释2:如果使用后两种提交方式,则会添加一个新的翻译单元,详情请参见本贴“关于 Multiple Translation”中有关“TM 中出现 Multiple Translation 的三种可能途径”的途径 a 部分的说明。

帅哥 发表于 2009-7-16 23:55:04

Workbench 的 Options -> Translation Memory Options -> Penalties 选项卡
  

Workbench 的机制之一就是将已翻译过的内容以翻译单元(TU)的形式存储在后台数据库(TM)中,以便在翻译新的文档时重用这些翻译内容。在实现这一机制时需要将当前的翻译内容与 TM 中已有的 TU 进行比较,获得匹配率以供用户来选择处理。翻译单元的匹配首先是文本上的匹配,除此之外,Workbench 还会考虑 TU 的 Source 部分的格式差异、是否包含要保留为英文的 Placeable 内容、该 TU 是否由 WinAlign 生成、TU 的自定义信息字段是否与 Filter Settings 的设置匹配、是否存在 Multiple Translation 等因素。因此,在对文本进行匹配的基础上,会根据是否出现这些情况,进行相应的匹配率扣减,以便提醒用户注意这些因素。而 Peanlties 选项卡就是用来设置在获得 TU 匹配率时需要考虑哪些因素以及相应地要扣减多少匹配率分值。以下逐一介绍这些 Penalty 设置项。

Formatting differences penalty %

【解释说明】
如果当前在文档中处理的翻译单元与相应的 TM 中匹配的 TU 在格式上(字体、字号、颜色等样式)存在差异,则会应用此扣减项。(注1)
【默认设置】
1%(可设置范围:0~20%)
【窗口提示】

http://bbs.giltworld.com/UploadFile/2006-11/2006112520131414252.jpg
【使用提示】
如果当前翻译的文档无需考虑任何格式,可以将其改为 0。如果文档中的文本存在特殊的格式设置,且翻译后要求保留原来的格式(多见于 doc 文档),最好为此扣减项指定大于 0 的值。

Attribute and text field differences penalty %

【解释说明】
如果当前在 Filter Settings 中进行了设置,且所设置的内容与在 TM 中匹配的 TU 的自定义信息字段值不同(并且后者也不包括前者),则会应用此扣减项。
【默认设置】
2%(可设置范围:0~20%)
【窗口提示】

http://bbs.giltworld.com/UploadFile/2006-11/2006112520182146607.jpg
【使用提示】
实际上,Filter Settings 的筛选机制就是按照这个值来扣减那些与 Filter Settings 设置不符的 TU 的匹配率,相对提高那些符合 Filter Settings 设置的 TU 的匹配率,从而将这些 TU 筛选出来。因此,要使筛选机制有效,Filter Settins 和此扣减项二者缺一不可。如果将其清为 0,则 Filter Settings 即使设置了也无效;但反过来说,没有设置 Filter Settings,此扣减项也形同虚设。

Placeable differences penalty %

【解释说明】
假设文档中当前翻译的原文包含 Placeable(或 Tag),如果 TM 中有一个 TU 的文本内容与其完全匹配,但 Tag 部分的内容不同,则会应用此扣减项。但如果它们的 Tag 在数量上存在差异,则不适用此扣减项。
【默认设置】
2%(可设置范围:0~20%)
【窗口提示】

http://bbs.giltworld.com/UploadFile/2006-11/2006112520211393498.jpg
【使用提示】
实际上,只有在选中 Apply placeable penalty also when source tags differ 复选框后,才会应用此扣减项。

Allignment penalty %

【解释说明】
如果 TM 中匹配的 TU 是由 WinAlign 工具生成的(注2),则会应用此扣减项。
【默认设置】
3%(可设置范围:0~20%)
【窗口提示】

http://bbs.giltworld.com/UploadFile/2006-11/200611252025041849.jpg
【使用提示】
Align 过程并不能保证所生成的 TU 完全正确,因此可以设置此 Penalty 值来提醒译员注意并确认匹配的翻译单元。一旦通过提交翻译单元对 Align 后的 TU 进行了确认,该 TU 的 Changed by 字段就会附加上当前译员的“用户 ID”,下次遇到该 TU 时此 Penalty 选项将不再适用。


Machine translation penalty %

【解释说明】
此选项尚不了解其含义,估计和欧洲语言的机器翻译有关,可能对亚洲语言不适用,恳请高手给出解释。
【默认设置】
15%(可设置范围:0~20%)

Multiple translations penalty %

【解释说明】
如果当前文档中的某句原文在 TM 中有多个完全匹配的 TU,则会应用此扣减项。
【默认设置】
1%(可设置范围:0~20%)
【窗口提示】

http://bbs.giltworld.com/UploadFile/2006-11/2006112520272860512.jpg
【使用提示】
建议使用此选项,以便在遇到此种情况时,能够提醒译员来选择合适的 TU。

Apply placeable penalty also when source tags differ

【解释说明】
该复选框与 Placeable differences penalty % 结合使用,缺少任何一个,都不会应用 Placeable 匹配率扣减。
【使用提示】
如果所翻译的文档中某句原文在 TM 中对应有文本内容完全匹配但 Placeable(Tag)不同的 TU,则在从这个匹配的 TU 复制其译文到文档中时,会自动将 Tag 部分替换为文档中原文所使用的 Tag。如果设置了 Placeable differences penalty % 且选中了该复选框,则仍会应用这一自动替换处理,但在 Workbench 窗口底部会显示扣减后的匹配率。
需要提请注意的是,设置这些匹配率扣减项的目的之一就是提醒译员在翻译时注意相关的问题。因此,如果觉得没有必要,可以将相应的设置清为 0,这样可以使翻译过程更加流畅。而对于需要使用 Workbench 进行字数分析的 PM 来讲,最好使用默认设置。理由是,这些设置会影响 TU 的匹配率,这种影响会最终体现在字数统计结果中。在保存字数分析结果的 log 文件中,95% - 99% 统计项内有很多统计的都是这类文本完全匹配但被 Penalty 的 TU,因此,为了保证统计结果的一致性,建议 PM 最好使用默认的设置或与客户的设置一致。另外,这些设置是保存在本地的 Trados 安装文件夹下的,使用同一台计算机打开任何一个 TM,该设置都不会改变,这点需要注意。如果是使用别人的计算机进行分析,请不要忘记先确认 Penalty 设置。

注1:这里需要说明,提交到 TM 中的 TU 在某些情况其 Source 部分中会加入文字格式标记。具体来说,如果提交的 Source 部分使用统一的格式,不论具体格式包含哪些特殊的格式设置(字体、字号、颜色、特效),只要是统一,提交到 TM 中时就不会添加任何格式标记;但如果同一原文 Source 内部存在多种格式(比如一句原文中存在两种字体),则提交到 TM 中时就会添加格式信息,以区分同一句原文中不同部分所使用的不同格式。请看以下示例:
We must do best we can to provide the product of high quality in short time.

这句原文开始的部分使用了加粗的效果,结尾部分使用了红色字体。将这句原文翻译后提交到翻译单元,然后通过 Tools 菜单下的 Concordance 实用工具或 File -> Maintenance... 选项卡显示该翻译单元,右键单击 TU 左侧的国旗图标,在显示的快捷菜单中选择显示 Advanced Edit... 对话框,这时会看到,对话框中上面的那个文本框所显示的 Source 部分,除了文本之外,还包括一些格式标记,如下所示:

http://bbs.giltworld.com/UploadFile/2006-11/2006112520292310503.jpg
而如果将这句原文的格式调整为统一(红色并粗体):We must do best we can to provide the product of high quality in short time.,虽然仍带有格式,但提交后,打开它的 Advanced Edit...选项卡,会发现 Source 部分不会带有任何格式标记。实际上,对于上面那个内部格式不统一的原文,它在 TU 中 Source 部分的实际存储形式就是“{\b We must do best we can} to provide the product of high quality{\cf6  in short time}.”,比较其匹配率时,也是按照这个带有标记的 Source 来比较的。因此,从这个意义上,它与那个格式统一的 Source 尽管文本上完全匹配,但它们属于不同的 Source,会作为不同的 TU 来保存。
因此,任何文本内容相同的原文,即使它们相互将的格式存在差异,但只要格式对于它们各自来讲是内部统一的,那么提交到 TM 后就不会带有格式标记。因此以下不同格式的 Source 是完全匹配的,因为它们实际的 Source 内容就是“We must do best we can to provide the product of high quality in short time.”,它们之间不会涉及到由于格式而导致的匹配率扣减问题:
We must do best we can to provide the product of high quality in short time.
We must do best we can to provide the product of high quality in short time.
We must do best we can to provide the product of high quality in short time.
We must do best we can to provide the product of high quality in short time.
......
......
...... 但 We must do best we can to provide the product of high quality in short time. 与它们是不同的 Source,因为它的 Source 内容实际为:“{\b We must do best we can} to provide the product of high quality{\cf6  in short time}.”。
注2:WinAlign 工具简单来说就是按照一定规则从两个不同语言的文档生成 TU 的工具。具体来说,假设某两个文档分别包含“This is a book.”、“这是一本书。”这两句话,则可以使用 WinAlgn 工具将其合成为一个翻译单元。通过这种方式合成的 TU,其“Created by”字段值为“ALIGN!”,以此来标明该 TU 是由 WinAlign 工具生成的。Workbench 也是根据这个字段来判断是否应用 Allignment penalty % 扣减项。

帅哥 发表于 2009-7-16 23:55:20

Workbench 的 Options -> Translation Memory Options -> Substitution Localisation 选项卡
软件本地化的一个重要方面就是使本地化后的软件符合用户所在区域的文化和使用习惯,这需要对与区域相关的日期、时间、数字、度量衡等的形式或格式进行调整,以适合本地用户来使用。Workbench 在这方面进行了一些尝试,本节要介绍的 Substitution Localisation 选项卡就是用于处理这类问题的。该选项卡与 File -> Setup...-> Substitutions 选项卡结合使用,后者用于设定在翻译文档时,哪些内容是无需翻译而自动在译文中进行替换的,这类内容(比如日期)可看作为特殊的 Placeable;而 Substitution Localisation 则更进一步,可以指定在对此类内容进行自动替换时,将其替换为哪种本地用户格式。举例来说,如果在 File -> Setup...-> Substitutions 选项卡的 Automatic substitutions 部分选中了 Dates,则可以在Substitution Localisation 选项卡中设置 Dates 的本地化格式,若是在 Long date 中选中“yyyy'年'M'月'd'日'”这个选项,在翻译时会自动将原文中的“长日期”替换为所选中的形式。
这里先简单介绍一下 File -> Setup...-> Substitutions 选项卡的作用。所谓的自动替换听起来十分诱人,但它并不是凭空来完成替换,需要有一些条件。举例来说,所谓的自动替换是指,如果 TM 中存在一个 TU,它与当前要翻译的某句原文除了其中包含的数字之外,其他内容完全一样,则在 Substitutions 选项卡中选中 Numbers 选项的情况下,由于数字无需翻译,会认为此 TU 与当前原文完全匹配,使用快捷键或按钮从匹配的 TU 中将其译文复制到原文的译文部分时,会自动使用原文中的数字替换译文中的数字,从而可加快翻译速度。以下是一个包含所有类型的替换内容的典型示例:
假设1、在 Substitutions 选项卡的 Automatic substitutions 部分选中了所有选项,分别为 Numbers(数字)、Acronyms(首字母缩写词)、Dates(日期)、Times(时间)、Measurements(度量衡)、Variables(变量),并且单击右侧的 Edit 按钮,在显示的记事本文档中输入两个变量值:Presario、ThinkPad,然后保存。
假设2、将 Substitution Localisation 选项卡中的选项全部禁用
假设3、TM 中存在一个翻译单元,如下所示:
http://bbs.giltworld.com/UploadFile/2006-12/200612101725751839.jpg
假设4、当前文档中存在一句原文:
According to the annual report annouced by IBM at 16:24:45 on December 26, 2006, its 15 inch screen notebook, ThinkPad, has been produced more than 6,500,000.

可以看出该句子与上图所示的 TU 存在六点差异,现分别用红色标出。在 Word 中对该句子使用 Trados 工具条中的“打开/获取”命令,Workbench 窗口的显示内容以及文档中形成的翻译单元如下所示:

http://bbs.giltworld.com/UploadFile/2006-12/2006121017252683805.jpg
http://bbs.giltworld.com/UploadFile/2006-12/2006121017313339136.jpg

可以看到,Workbench 窗口上部的原文部分有六项内容的下面标注了蓝色下划线,表示属于 Placeable 内容,无需翻译且自动替换,它们分别对应 Substitutions 选项卡中的 Acronyms(首字母缩写词)、Times(时间)、Dates(日期)、Measurements(度量衡)、Variables(变量)和 Numbers(数字)。由于已在 Substitutions 选项卡中选中了所有选项,所以这些内容都会自动替换。请注意,在上图所示的翻译单元中,相应部分已使用了当前翻译的原文内容进行了替换。

现在我们启用 Substitution Localisation 选项卡中的全部选项,并进行如下设置:


http://bbs.giltworld.com/UploadFile/2006-11/2006112710211185206.jpg
然后在文档中重新打开这个翻译单元,可以看到译文部分发生了一些变化,其中的日期时间格式不但进行了自动替换,而且采用了在 Substitution Localisation 选项卡中设置的本地化格式,同时单位 inch 也转换为 cm,而且具体数值也进行了换算:


http://bbs.giltworld.com/UploadFile/2006-12/2006121017315781785.jpg

需要说明的是,要想实现这种自动替换,除了在 Workbench 中进行相应的设置之外,对于 TM 中匹配的 TU 的译文部分也是有一定要求的。可以将替换过程分为三步:
① 确认文档中的原文和匹配的 TU 中,对应有哪些可自动替换的内容;
② 对于每一个可自动替换的内容,在 TU 的译文中寻找对应的替换位置;
③ 根据两个选项卡中的设置进行替换。
步骤 2 非常关键,只有在 TU 的译文中找到对应的替换位置,才能实现替换。那么,如何找到替换位置呢?以下进行具体说明:
数字 - 在 TU 的译文中,找到 TU 的原文中的数字所出现的位置,该数字在 TU 的原文和译文中必须相同,但不必与要翻译的原文中的数字一致。否则,无法替换;
首字母缩写词 - 在 TU 的译文中,找到出现首字母缩写词的位置,该缩写词在 TU 的原文和译文中必须相同,但不必与要翻译的原文中的缩写词一致。否则,无法替换;
日期 - 在 TU 的译文中,找到 TU 的原文中的日期出现的位置,该日期在 TU 的原文和译文中必须是同一日期,但可以为不同的表示形式(必须能够为 Trados 所识别),且不必与要翻译的原文中的日期一致。否则,无法替换;
时间 - 在 TU 的译文中,找到 TU 的原文中的时间出现的位置,该时间在 TU 的原文和译文中必须是同一时间,但可以为不同的表示形式(必须能够为 Trados 所识别),且不必与要翻译的原文中的时间一致。否则,无法替换;
度量衡 - 在 TU 的译文中,找到 TU 的原文中的度量衡出现的位置,该度量衡在 TU 的原文和译文中必须是同一类型的度量衡,如果使用不同的度量衡,换算后的数值必须相等,但要翻译的原文中的度量衡可以为其他类型。否则,无法替换;
变量 - 在 TU 的译文中,找到出现变量的位置,该变量必须为 Substitutions 对话框的 Variable list 中列出的变量,需要在 TU 的原文和译文之间保持一致,但无需与要翻译的原文中的变量一致。否则,无法替换;
Substitution Localisation 选项卡中的设置大同小异,现简要地予以说明:

【解释说明】
① Dates 和 Times 部分中的各个下拉列表的可选内容,来自于当前 TM 的目标语言在操作系统中的相关区域设置。对于 Windows 系统,可通过“控制面板”中的“日期、时间、语言和区域设置”对话框来查看和修改这些内容。所谓的 Long date,对于英文来讲,是指类似于 December 26, 2006 这种英文日期表示形式。 ② Digit grouping symbol 只有两个选项,“逗号”和“句号”,如果将该选项设置为“逗号”,则对于使用“句号”作为数字分隔符的情况,替换时会将“句号”替换为“逗号”,反之亦然。
③对于 measurement system,如果 TM 选择的源语言和目标语言分别为“英语(美国)”和“简体中文”,则该列表框将包含两个选项:metric、U.S.。设置为 metric,则对于出现英制(U.S.)度量衡的情况,替换时会将英制单位替换为对应的公制单位,并且按照国际公制-英制转换公式,转换相应的数值,反之亦然。

【使用提示】
该选项卡需要与 Substitutions 选项卡结合使用,只有在 Substitutions 选项卡选中了特定的选项后,才能在该选项卡进行相应的设置。该选项卡中的这些选项使用的前提是,TM 中必须存在包含 Placeable 的 TU,且符合上述要求。在具体的应用中,除了数字之外,其他的日期、时间、度量衡的本地化形式的替换很少使用。这可能是因为,实现对 Placeable 的本地化替换需要满足诸多条件;同时也可能是对于此设置了解不足所造成的。当然,Workbench 所提供的解决方案并不是一劳永逸,自动替换后,可能会出现格式上的问题,需要进行手工处理。
另外,Substitutions 选项卡和 Substitution Localisation 选项卡中的自动替换规则也适用于 fuzzy match 的情况。

帅哥 发表于 2009-7-16 23:55:36

Workbench 的 Options -> Translation Memory Options -> Concordance 选项卡

Concordance 选项卡用于设置与 Concordance 对话框(Tools -> Concordance...)有关的行为,该选项卡也可通过 Concordance 对话框中的“Options...”按钮来访问。Concordance(索引词查询)是 Workbench 重用 TM 数据库的三大机制之一,可以使用文档中某句原文的一部分内容作为索引词来搜索 TM 数据库。

Minimum match value %
  【解释说明】
设置搜索的最低匹配率。
【使用提示】
Trados 推荐的最佳匹配率范围为 65% - 75%,默认值为 70%。建议使用默认设置,在实际搜索过程中,可以通过控制搜索词的长度来调整搜索效果。
Maximum number of hits (1-99)
  【解释说明】
在 Concordance 对话框窗口中显示的搜索结果数。
【使用提示】
可设定范围为 0 - 99,默认为 30。设置的数值越大,搜索所花费的时间越长。
Reference (read-only) translation memory:
  【解释说明】
在执行 Concordance 搜索时,使用第二个 TM 作为(只读)搜索对象,即对两个 TM 都进行搜索。
【使用提示】
这个设置在有一个以上的 TM 可供使用时,非常有用;有时需要使用两个 TM 进行工作,可衡量其各自的重要程度,使用相对较重要的 TM 来作为主 TM,而在此对话框中将另一个 TM 设置为(只读)参考 TM。另外,这个设置会保存在本机的 Trados 安装目录下,因此,在下一次使用新的 TM 进行工作时,如果不需要这个参考 TM,可将本文本框清除,以免误用其中的术语,对翻译造成误导。


Switches 区域


Start concordance search if no segment match is found
  【解释说明】
选中此选项后,在打开文档中的某句原文时,如果 Workbench 窗口显示 no match,则会自动打开 Concordance 对话框,并以整句原文作为索引词来进行 Concordance 搜索。
【使用提示】
从理论上来讲,如果将 General 选项卡中的 Minimum match value % 与 Concordance 选项卡中的 Minimum match value % 设置为相同的值,由于选中此选项后引发的 Concordance 搜索是使用整句作为索引词进行搜索,因此,若是 Workbench 窗口中显示为 no match,则 Concordance 的搜索结果也应是 no match。但实际的操作表明,这两种搜索方式似乎采用了不同的搜索方法。即使将 Minimum match value % 设置为相同的值,当 Workbench 窗口出现 no match 时,Concordance 也可能会返回搜索结果。是否选中此选项取决于具体使用的TM 和个人的操作习惯。
Move cursor into Concordance dialog box after search
  【解释说明】
Workbench 自动打开或使用命令打开 Concordance 对话框时,将焦点移到该对话框。
【使用提示】
建议选中此复选框。这样便于操作,在查看 Concordance 对话框中显示的搜索结果之后,可以按 Esc 键直接关闭该对话框并将焦点切换回当前工作的文档。
Search first in reference translation memory
  【解释说明】
指定是否首先在(只读)参考 TM 中进行搜索。
【使用提示】
可根据两个 TM 的不同重要性和参考价值来确定是否选中此选项。
Apply current filter settings
  【解释说明】
指定在搜索时是否应用 Filter Settings 中设置的筛选条件。
【使用提示】
可将其作为一种确定术语使用优先级的方式来使用。这样在搜索时,同等文本匹配率的情况下,会先显示符合 Filter Settings 设置的 TU。
Display translation unit information
  【解释说明】
指定 Concordance 窗口显示搜索结果时,是否显示 TU 的信息字段(Created on、Created by、Changed on、Changed by、last Used、usage 以及自定义信息字段)。
【使用提示】
建议选中此选项。可以使用这些信息字段来判断是否使用相关的搜索结果。
Show most recent translation units first
  【解释说明】
该选项确定在搜索到多个结果的情况下,是否将 TU 的 Changed on(修改时间)和 Created on(创建时间)作为排序条件之一来显示这些结果。
【使用提示】
如果不选中此选项,则只会按搜索的匹配率对 TU 进行排序;如果选中此复选框,则会首先按匹配率进行排序,然后使用 Changed on(修改时间)和 Created on(创建时间)作为第 2、第 3 排序关键字。


以下两点需要说明:
① 有时,我们会对 Concordance 的搜索结果表示怀疑,比如,我们要搜索“Add New Item”这个 UI 词汇的翻译,假设 TM 中即存在原文部分只有“Add New Item”这三个词的 TU,也存在大量的包含“Add New Item”这三个词的整句的 TU。我们希望搜索结果中会首先显示只包含“Add New Item”这三个词的 TU,但结果常常不尽人意。实际上,我们只是在搜索“Add New Item”这三个词,而“Add New Item”和“Please click Add New Item to add new entry.”在搜索意义上来讲都是 100% 匹配的,因此,并不能保证只包含“Add New tem”的 TU 会在搜索结果中最先显示。
② Workbench 窗口中使用的搜索方法可能与 Concordance 的有所区别,因此在 Workbench 窗口中无法搜索到的句子,在 Concordance 对话框中常常会得到结果。

帅哥 发表于 2009-7-16 23:55:52

Workbench 的 Options -> Translation Memory Options -> Tools 选项卡


Tools 选项卡用于设置批量处理工具 Analyse、Translate 和 Cleanup 的行为,具体如下:

General options 区域


Strip unused fonts
  【解释说明】
“对于使用 Word 创建的 RTF 文件,文件的 RTF 头包含许多文件中不使用的字体信息。这类信息可能会在 Word 或 Workbench 中引发‘Out of memory(内存不足)’或‘Not enough system resource to display the requested font(资源不足,无法显示所要求的字体)’。”这是 Trados 帮助中的解释。选中此选项后,可通过对原 RTF 文件执行 Cleanup 来清除这些不使用的字体信息。
【使用提示】
移除这些信息可以提高 RTF 文件的处理速度。

Strip unused styles
  【解释说明】
“如果 Word 文档包含大量的段落和字符样式,则会降低 Workbench 和 Word 之间的交互处理速度,即使其中的某些样式在文档中并不使用,也会对交互处理性能造成影响。在对文档中的注脚部分进行分析和转换时尤为如此。”这是 Trados 帮助中的解释。选中此选项后,可通过对原 RTF 文件执行 Cleanup 来清除这些不使用的样式。
【使用提示】
对此没有实际的处理经验,将在以后补充相关内容,也请了解这一设置的网友就此问题发表高见。
Strip TW4Win Styles
【解释说明】
选中此选项,在 Workbench 中对文件执行 Cleanup 时,会清除所有 TW4Win 样式(如 tw4winExternal、tw4winInternal 和 tw4winTerm)。
【使用提示】
对此没有实际的处理经验,将在以后补充相关内容,也请了解这一设置的网友就此问题发表高见。

Use same log file for all TMs
【解释说明】
选中此选项后,将对所有 TM 使用同一 log 文件来记录批量处理结果。如果清除此选项,则会对每个 TM 单独使用一个 log 文件,该文件的路径和名称为:“<当前 TM 所在的路径>\<当前 TM 的名称>.log”。在清除此选项的情况下,也可以临时在批量处理工具的对话框中指定其他 log 文件,但下次打开批量处理工具的对话框时,会恢复使用以上指定的默认 log。
【使用提示】
建议选中此复选框,这样便于区分和管理不同 TM 生成的 log 报告。也可以清除此复选框,建立一个单独的文件夹来保存所有的 log 文件,不过,这样在每次更换 TM 进行批量处理时,就需要选择相应的 log 文件。

Save Workbench RTF as TRADOS tag
【解释说明】
在对 RTF 文件执行 Translate 时,生成可在 Tageditor 中处理的 TTX 文件(Trados Tag XML 文件)。
【使用提示】
建议选中此复选框。一般来说,Tageditor 在处理包含 Tag 的文档时具有明显的优势,它不但可以防止对 Tag 进行修改,而且还有相应的保护和检查措施,可避免出现丢失 Tag 的情况以及出现其他 Tag 问题。RTF 文档也同样可以用 Tageditor 来处理。

CSV log file cell separator:
【解释说明】
选择随 log 生成的 CSV 文件中使用的分隔符。
【使用提示】
使用默认值即可。
Backup 区域

Keep backup
【解释说明】
选中此复选框表示在对文档执行 Translate(预翻译)和 Cleanup(清除原文)操作前,对文档进行备份。默认情况下,备份文件使用与原文件相同的名称,但以 .BAK 作为扩展名。直接将 .BAK 改为原来文件的扩展名即可恢复文件。而且,备份文件默认保存在与原文件相同的目录下。但可以选中下面的“Move backup files”复选框,然后在右侧的文本框中指定其他路径。
【使用提示】
建议选中此复选框。对于 TTX 文档,清除原文后,原来的 TTX 文档还会存在;但对于 RTF 文档,则是直接在原文件中进行清除操作,而且一旦清除,就很难通过清除后的文件来恢复原来的双语文件,因此建议进行备份。

Move backup files
【解释说明】
在选中上面的“Keep backup”后,此复选框才可用。使用此复选框可以指定其他路径来保存备份文件。
DTD settings files 区域
【解释说明】
在对 XML、HTML 和 SGML 等标记语言文件进行“字数分析”(Analyse)和“预翻译”(Translate)时,需要使用相应的 DTD settings 文件(注1)。单击右侧的 DTD Settings.. 按钮将打开 DTD Settings Manager,该对话框用于管理和指定 Workbench 和 Tageditor 所使用的 DTD settings 文件(即 ini 文件)。
【使用提示】
有关 DTD settings 文件及使用方面的详细内容,将在后续内容中专门予以介绍。此处仅对与标记文件的批量处理操作有关的方面进行说明。在对标记语言文件进行批量处理时,需要使用合适的 ini 文件(DTD settings 文件),Trados 提供了三个简单的 ini 文件:HTML4.ini、XSL.ini 和 RESX.ini 文件(所在目录:C:\Program files\TRADOS\<所安装的 Trados 版本>\TT),分别用于处理 HTML 文件、XML 文件和 .NET RESX 文件。在具体的项目中,客户也可能会提供自己的 ini 文件。在对标记语言文件进行批量处理时,Workbench 会检查 DTD Settings Manager 中列出的 ini 文件,从中选择合适的 ini 文件(注2)。列表中可能会包含多种类型的 ini 文件,也可能包含多个同一类型的 ini 文件,具体的选择规则如下: ①从 DTD Settings Manager 列表中选择适用的 ini 文件,如果同时有多个 ini 文件适用,则使用第一个 ini 文件;
②如果没有适用的 ini 文件,则使用已设置的默认 ini 文件;
③如果即没有适用的 ini 文件,也没有默认的 ini 文件,或者列表中没有任何 ini 文件,则跳过处理文件,同时在 Log 中写入错误消息。

因此,在对标记语言文件进行批量处理时,应检查 Workbench 中的 DTD Settings Manager 列表,确保存在要使用的 ini 文件,如果有多个适用的 ini 文件,应确保要使用的 ini 文件在列表中位于其他适用的 ini 文件之前。对话框中没有提供调整 ini 文件顺序的按钮,如需要,可通过 Add 和 Remove 按钮间接调整或将不需要的其他 ini 暂时移除(不会将实际的 ini 文件删除)。

需要强调的是,同一类型的 ini 文件可能会有多个,而每个 ini 文件对于该类型的标记语言文件的处理方式可能会有所差异,比如某些内容在一个 ini 文件中处理为 Tag,在另一个 ini 文件中可能会处理为可翻译的内容,因此来说,ini 文件的正确与否会影响到字数分析的结果。在具体的项目中应确保使用客户指定的 ini 文件,如果没有指定,应使用 Trados 默认提供的 ini 文件。有关字数分析的影响因素,将专门予以介绍。

Multiple translations 区域

Always add new translation unit when target segments differ
【解释说明】
选中该复选框的情况下,如果在执行“预翻译”以及“清除原文”时选中了“Update TM”选项,则在使用文档中的翻译内容更新 TM 时,若是 TM 中已经存在某个 TU,但文档中的译文与该 TU 的译文(target 部分)不同,则会添加一个新的 TU。清除此复选框的情况下,则会覆盖已存在的 TU。
【使用提示】
该复选框需要在创建 TM 时选中 Allow multiple translation for identical source segments 选项后才能使用。如果创建 TM 时未选中“允许 multiple translation”,则该复选框将不可用(呈灰显)。选中该复选框后,在进行批量处理时,如果所处理的文档存在 Multiple Translation 的情况,则会导致 TM 中也出现 Multiple Translation。有些客户使用此选项来检查所翻译的文档中是否存在 Multiple Translation。有关 Multiple Translation,请参见本贴第 39 楼的相关内容。
注1:众所周知,标记语言文件主要由所谓的 Tag 元素和要显示的内容组成,Tag 元素用于指定要显示的内容的显示方式。在对标记语言文件进行“字数分析”和“预翻译”时,需要将 tag 与要翻译的实际显示文本相区分,DTD settings 文件的作用就在于此。每种类型的标记语言文件(比如 HTML 文件、XML 文件)都对应有各自的 DTD settings 文件,DTD settings 文件中包含特定类型标记语言文件所使用的元素(tag)和实体(特殊字符)及此类文件的处理方式等信息。具体来说,在对标记语言文件进行字数分析或在预翻译过程中将其转换为 TTX 文件时,使用 DTD settings 文件来确定将哪些内容处理为外部 Tag、哪些处理为内部 Tag,哪些处理为可翻译内容。
注2:Workbench 使用所谓的“根元素”(root element)来确定适用于特定标记语言文件的 ini 文件。使用文本编辑器打开标记语言文件,可以看到位于文档顶部的“根元素”(比如 XML 文件中的 xml),有时也会在 DOCTYPE 中声明根元素(比如 HTML 文件中的“<!DOCTYPE html...”)。而每个特定类型的 ini 文件中也会存在包含根元素的字符串“DOCTYPE=<根元素>”(比如 DOCTYPE=HTML),来表明该 ini 文件的适用类型。Workbench 就是根据根元素来确定适用于特定标记语言文件的 ini 文件的。

帅哥 发表于 2009-7-16 23:56:12

Options -> Terminology Recognition Options 对话框

在 Workbench 中,重用原有翻译内容的手段之一就是术语识别和重用,在使用 Workbench 时结合 Trados 的 MultiTerm 组件就可以实现这一功能,而本对话框就是用于设置此类功能的。由于此部分内容涉及到了 MultiTerm 组件,所以整个内容拟分为三部分:
一、Terminology Recognition Options 对话框设置 二、在翻译过程中使用 MultiTerm 术语库的简要说明
三、将 Excel 格式的术语表导入 MultiTerm 术语库
一、Terminology Recognition Options 对话框设置
Terminology Recognition Options 对话框包含有两个选项卡:Termbase 和 Settings,Termbase 选项卡用于指定所要使用的 MultiTerm 术语库以及索引语言,而 Options 具体设置查询术语时的一些操作行为。由于设置都比较简单明了,以下仅做简要介绍:
Termbase 选项卡
Terminology provider 区域
   指定所要使用的 MultiTerm 术语库的类型(或版本)。
默认情况下,在 Workbench 6.5 中,MultiTerm version: 后面的下拉列表中会自动包括 MultiTerm 5 (TRADOS 5) 选项。而如果安装了 MultiTerm 6.x 或 MultiTerm 7,下拉列表中也会包含 MultiTerm 6.x 或 MultiTerm 7 选项。

Termbase location 区域
   指定 MultiTerm 术语库的具体位置。如果在 Terminology provider 区域选中了 MultiTerm 5 (TRADOS 5) 选项,则单击 Browse... 将打开文件选择对话框,可以在其中指定要使用的 .mtw(MultiTerm 5 的术语库文件格式)文件;如果选中的是 MultiTerm 6.x 或 MultiTerm 7,则单击 Browse... 后会显示一个 MultiTerm 6.x 或 MultiTerm 7 风格的术语库选择对话框,可在其中指定术语库。如果选中的是 MultiTerm 7,单击 Browse... 后会显示如下所示的 Open Termbases 对话框:
http://bbs.giltworld.com/UploadFile/2006-12/2006121417491854484.jpg(TRO-1)单击加号按钮将打开 Select TermBase 对话框,选中 Local TermBase,下面的列表就会显示当前本地存在的所有 MultiTerm 7 术语库,可从中进行选择。如果使用的是远程术语库,可选择下面的 Remoter termbases 选项,然后进行相应的设置。有关 Open Termbases 对话框中其他按钮的使用,请参考对话框中按钮的提示信息或查询帮助。

Language selection 区域
   选定术语库后,会在该区域显示术语库中的索引语言。对于“英-中”对照的双语术语库,索引语言就是指“英语”和“中文”。Source language: 和 Target language: 下拉列表会显示索引语言,可以对这两个对话框进行调整,但切记,在 Source language 下拉列表中选择的语言应与当前 TM 的源语言一致。

Setings 选项卡
Tuning 区域
   用于设置查询的具体行为。
①、Minimum match value% - 指定查询术语时的最低匹配率,默认为 70%
②、search depth (10-999) - 指定最多可以显示多少条符合 Minimum match value% 的术语,默认为 20。
③、Default Settings - 单击该按钮可以将 Minimum match value% 和 search depth (10-999) 重置为默认值。

Run terminology recognition in the background 选项
   在使用术语库的情况下,打开翻译单元时,Workbench 会同时执行两个操作:①、搜索 TM 数据库;②、搜索术语库。只有这两个操作都完成之后,才会正式打开相应的翻译单元。一般来说,搜索术语库的操作耗费的时间比搜索 TM 数据库要长,当句子中包含较多的术语或通过网络使用术语库时更是如此。如果选中此选项,则会将这两个操作分开独立进行,Workbench 在执行完搜索 TM 数据库的操作后即会打开翻译单元,即使搜索术语库的操作尚未完成也是如此,这样就可以加快打开翻译单元的速度。默认情况下,该选项处于选中状态。

二、在翻译过程中使用 MultiTerm 术语库的简要说明
在文档中针对某个句子打开翻译单元时,如果该句中包含当前术语库中的术语词汇,Workbench 窗口上部的“文档 Source”窗格显示的 Source 中会使用红色的括线标注这些术语,其中第一个术语使用较粗的括线标注,右侧的“术语”窗格中会显示该术语条目,如下图所示:
http://bbs.giltworld.com/UploadFile/2006-12/2006121417493420784.jpg(TRO-2)将鼠标指针放到任一括线的上方,指针会变成手型,单击该括线会在“术语”窗口中显示括线下方的术语条目,单击后的括线将变粗,表示“术语”窗格当前正在显示其下方的术语条目。“术语”窗格中只会显示索引语言内容,比如对于“英-中”双语术语库,只会显示英文术语和对应的中文翻译。某些术语库的结构比较复杂,除了包含必要的索引语言内容之外,每个条目还会包含其他的一些定义性或说明性的信息。如果要查看完整的术语条目信息,可单击“术语”窗格中术语条目左侧的“字典”图标,此操作将打开 TRADOS MultiTerm 窗口,其中会显示每个条目的完整信息。
在具体操作中,当打开包含术语的翻译单元后,可以使用 Workbench 的术语按钮(如下图所示)或使用相应的快捷键将术语的翻译内容复制到文档翻译单元的译文部分中光标所在的位置,使用“取下一个术语”(Get Next Term)或“取上一个术语”(Get Previous Term)可以在不同的术语间切换,这样可以免去使用鼠标在 Workbench 的“文档 Source”窗格中点选相应的术语。
http://bbs.giltworld.com/UploadFile/2006-12/2006121417494465674.jpg(TRO-3)三、将 Excel 格式的术语表导入 MultiTerm 术语库(适用于 MultiTerm 6.2 之后的版本)
从 MultiTerm 6 开始,MultiTerm 只接受 XML 格式的文件作为数据源,因此,使用外部数据源生成 MultiTerm 术语库的过程可以简单分为三个过程:

①、将外部数据源转换为相应的 XML 文件,这可通过 MultiTerm 自带的 MultiTerm Convert 工具来完成; ②、在 MultiTerm 中创建 MultiTerm 术语库(也可使用已有的术语库);
③、将步骤 1 生成的 XML 文件导入步骤 2 中生成的术语库。

下面就以从 Excel 术语表生成 MultiTerm 术语库为例来具体说明这些过程。有关如何从 MultiTerm 5 术语库升级到 MultiTerm 6 或 MultiTerm 7 术语库的步骤,可以查看 MultiTerm 附带的 Tutorail 教程,而从 .csv 文件和 txt 文件生成 MultiTerm 术语库的过程与 Excel 文件差别不大,且不具有典型性,此处就不做说明了。
过程 1 - 生成 XML 文件
下图是要导入的 Excel 术语表,该表分为三列,分别为“英文术语”、“中文翻译”和“定义”内容,在第一行设置了 3 个列标题 - English、Chinese 和 Definition:
http://bbs.giltworld.com/UploadFile/2006-12/200612141750626689.jpg(TRO-4)(以下步骤中的蓝色部分为说明文字,可略去不看。)
a、打开 MultiTerm Convert 工具,单击 Next。
b、选择 New conversion session。如果希望下次重用此次的设置,可以选中 Save conversion session 并指定相应文件路径来保存设置,下次操作时,选择 Load existing conversion session 并进行相应指定即可。单击 Next。
c、在 Available conversion options 中选中 Microsoft Excel format,单击 Next。
d、单击 Input file 文本框右侧的 Browse... 按钮指定要转换的 Excel 文件。指定 Excel 文件后会默认将生成的 XML 文件、xdt 文件和 log 文件保存在该 Excel 文件所在的同一目录,当然可以单击下面的 Browse... 按钮修改相应的保存路径。需要说明的是,在将外部数据源(包括 MultiTerm 5 术语库、.csv、.txt 和 .xls)转换为 XML 文件时,会生成一个 XML 文件和一个 xdt 文件,XML 文件保存外部数据源的内容,而 xdt 文件保存所生成的 XML 文件的结构,在创建 MultiTerm 术语库时会使用到 xdt 文件。选择数据源后单击 Next。
e、这一步设置“索引字段”和“描述字段”。MultiTerm 的每个术语条目至少要包含两个“索引字段”,分别对应术语的两种语言表述,比如这里的“English”和“Chinese”,此外,条目中还可以包含其他说明性信息,比如这里的“Definition”。左侧的 Available column header 列表中列出了前面所选择的 Excel 表的列表题(English、Chinese 和 Definition),需要在此指定它们的字段类型。从 Available column header 列表选中 English,将其指定为 Index field,然后在下面的语言列表中选择 English (United States);选中 Chinese,将其指定为 Index field,然后在下面的语言列表中选择 Chinese (PRC);选中 Definition,将其指定为 Descriptive field,然后在下面的列表中将其文本类型设置为 Text(如下图所示)。单击下一步。
http://bbs.giltworld.com/UploadFile/2006-12/2006121417501850200.jpg(TRO-5)f、左侧的 Entry stucture 列表简要显示了要生成的 XML 的基本结构,但未包含 Definition 字段。单击 Entry stucture 列表中的 Entry level,然后从右侧列表中选中 Definition,点击 <<Add,将其插入到结构表中与 English 和 Chinese 同级的结构位置(如下图所示)。单击 Next。
http://bbs.giltworld.com/UploadFile/2006-12/2006121418195835555.jpg(TRO-6)g、确认设置,然后单击 Next。
h、进行转换,结束后会显示转换结果。单击 Next,然后单击 Finish 完成转换过程。可查看生成的 log 报告来确认转换结果。

至此,完成了从 Excel 表到 XML 文件的转换。需要说明的是,MultiTerm 6 的某些版本不支持中文路径,因此 Excel 表要存放在英文路径下,但 MultiTerm 7 则无此限制。另外,应确保术语表位于 Excel 的第一个工作表。
过程 2 - 创建 MultiTerm 术语库
从 Excel 表成功生成 MultiTerm 术语库的关键是保证,转换后的 XML 文件的结构与所创建的 MultiTerm 术语库的结构一致。为了确保一致,在创建术语库时,可以使用在上一过程中生成的结构定义文件 .xdt 来设置术语库的结构,使得所创建的 MultiTerm 术语库在结构上与 XML 文件一致,这是最方便的办法。如果要完全自定义术语库的结构,则需要注意一些细节。以下先介绍如何使用 .xdt 文件设置术语库的结构,然后再具体说明在自定义术语库结构时如何保证结构的一致性。
a、打开 MultiTerm,从 Termbase 菜单选择 Create Termbase...,在随后的对话框中指定术语库的保存路径,然后单击“确定”。
b、在随后打开的 Termbase Wizard 欢迎界面中,会列出创建 MultiTerm 术语库的主要步骤。单击 Next。
c、指定如何创建术语库的结构。若要自定义术语库结构,请选择 Create a new termbase definition from scratch;若要利用 MultiTerm 提供的模板来创建,请选择 Use a predefined termbase template;若要使用 xdt 文件来创建,请选择 Load an existing termbase definition file,然后选择生成 XML 文件时附带生成的 xdt 文件。这里使用 xdt 文件来创建,选中 Load an existing termbase definition file 选项,指定 xdt 文件,然后单击 Next。
d、指定术语库的名称、描述信息和版权信息。该名称将显示在 Workbench 的术语库选择列表中。单击 Next。
e、可以看到,在所显示的 Available index fields 列表中,已列出了 XML 文件中的索引字段。如果是自定义设置术语库,则需要指定这些索引字段。接受 xdt 文件所指定的索引字段而不做修改,单击 Next。
f、Available descriptive fields 列表中已列出了 XML 文件中的描述字段,如果要设置其他描述字段,可以在左侧文本框中指定,然后单击 Add>>。单击 Next。
g、可以看到,Entry structure 列表中显示的术语库结构与过程 1 的步骤第 f 处列出的结构一致,只是,这里用 Index level 表示那里的 English 和 Chinese(如下图所示)。单击 Next。
http://bbs.giltworld.com/UploadFile/2006-12/2006121417553718100.jpg(TRO-7)h、单击 Finish,完成术语库的创建。

过程 3 - 将 XML 文件导入术语库
a、在 MultiTerm 窗口左下方的窗格中选中刚刚创建的术语库。从 Termbase 菜单选择 Import Entries...,打开 Import 选项卡。可以看到术语库的很多操作都集中于此。
b、在 Import 选项卡中,单击右侧的 Process... 按钮。在打开的下一个窗口中选择要导入的 XML 文件并指定 log 文件的保存位置,然后单击 Next。
c、指定 Exclusion 文件。该文件用于保存 XML 文件中由于不符合术语库结构而无法导入的那些条目。下面有一个 Ignore sublanguage 选项,将在后面进行说明。单击 Next。
d、单击 Next。开始导入术语条目。完成后会显示导入结果。如果出现错误信息,可查看在步骤 b 中指定的 log 文件。
e、单击 Next,单击 Finish。关闭 Import 选项卡。

至此导入完毕。这时可看到,MultiTerm 的右侧窗格中已列出了导入的第一个条目的内容。然后,即可关闭 MultiTerm,转到 Workbench 来设置使用已创建的 MultiTerm 术语库。
回顾以上所有过程,有关 Excel 表中的标题、术语库的条目结构以及 Workbench 的 Terminology Recognition Options 选项卡的索引语言可用以下图示关系来说明:
http://bbs.giltworld.com/UploadFile/2006-12/200612141756974350.jpg(TRO-8)如果是自定义术语库的结构,则需要确保 Excel 表的索引标题与术语库的定义一致,如下图所示:
http://bbs.giltworld.com/UploadFile/2006-12/2006121417563630427.jpg(TRO-9)
图 TRO-9 中,左上角显示的是创建术语库结构时设置索引字段的界面,右侧是要转换的 Excel 表,左下方是转换后的 XML 文件的一部分内容。由图 TRO-9 中的 Available index fields 列表可以看到,在自定义术语库结构时,我们选中了 Languages 下拉列表框下面的 Show sublanguages 选项,此时,Languages 列表框中就出现了子语言选项(所谓子语言,即指某种语言下面的语言分支,比如中文 Chinese 有 Chinese <HongKong S.A.R.>、Chinese <PRC>、Chinese <Singapore> 和 Chinese <Taiwan> 等子语言),在此选择了 English (United States) 和 Chinese (PRC) 作为索引字段,如图 所示(当然也可以不使用子语言,此处只是为了说明起见)。
从上图可以看到,每个索引字段包含两部分,比如英语索引字段由 EN-US 和 English (United States) 两部分组出,这里暂分别将其称为“语言标记”和“语言类型”。Excel 表的语言标题部分即对应这里的“语言类型”。因此,为了保证 XML 结构与术语库的一致性,要求 Excel 表中的语言标题内容必须与自定义术语库时选择的“语言类型”完全一致(文本内容、空格、全角半角格式和大小写格式都必须一致),否则,导入 XML 文件时会由于结构不一致而失败,这也是通过自定义方式来创建术语库的关键所在。
而如果是使用 xdt 文件来定义术语库的结构,因为这相当于将 XML 文件的结构完全复制到术语库结构,则不存在这类问题,你可以在 Excel 表的标题“胡乱”输入任何内容,甚至在转换时可以随意选择任何语言,都不会影响你使用术语库,但需要注意的是,你的 Workbench 的 Terminology Recognition Options 选项卡的索引语言所显示的内容将与 Excel 表的语言标题一致。
总之,如果选择自定义术语库或者使用已存在的术语库,则必须保证 Excel 表的语言标题、在转换 Excel 表的步骤 e 中指定的索引语言与术语库的设置完全一致。另外需要说明的是,MultiTerm Convert 工具所提供的索引语言列表中,某些语言(比如中文和英文)仅提供了子语言选项。而在自定义术语库时,即可以使用语言选项,也可以选择使用子语言选项。如果在自定义术语库时,也是指定子语言选项,则当然没有任何问题。但如果指定的是语言大类而不是具体的子语言,或者现有的术语库已指定了语言大类而非子语言,则也不必担心,在导入过程的步骤 c 可以选中 Ignore sublanguage 选项,这样只要属于同一语言类别就都可以导入。

帅哥 发表于 2009-7-16 23:56:28

Options -> Translated Text Colours 对话框

为了能够帮助区分文档中翻译单元 (TU) 的原文和译文部分,可以指定 Workbench 使用不同的颜色对文档中 TU 的原文和译文部分进行标记,Translated Text Colours 对话框就是用于指定这类颜色设置的。下文分为三部分:①TU 原文和译文部分的颜色设置
②使用颜色设置的一些负面问题
③有关翻译单元颜色设置的建议
一、TU 原文和译文部分的颜色设置
1、为何要对翻译单元的原文和译文部分设置颜色
为翻译单元的原文和译文部分设置不同的颜色,其主要目的就是在文档中能够对这两者加以区分。另为,在设置译文部分时,可对 full match 和 fuzzy match 的情况分别指定不同的颜色,这样也有利于区分这两种情况。在具体的翻译工作中可以通过这种方式来加快翻译速度,如果客户要求只处理非 full match 的情况,则可以根据颜色来进行区分。不过,这种颜色设置也会带来一些问题。实际上,可以使用 Tageditor 中的 Set Close Next no 100% Open Get 命令或 Word 的 Workbench 菜单的“保存/关闭并打开获取下一非完全匹配句段”来快速定位到 no match 的部分。
2、Translated Text Colours 对话框设置
http://bbs.giltworld.com/UploadFile/2006-12/200612202104615713.jpg(TTC-1)该选项卡简单明了,现说明如下:
Source colour
设置翻译单元原文部分的颜色 Target (100% match)
设置 100% 匹配的翻译单元译文部分的颜色
Target (fuzzy match)
设置 fuzzy match 情况下的翻译单元译文部分的颜色
Suggest 按钮
将以上三项颜色设置为 Workbench 的推荐颜色,分别为 Blue(“蓝色”)、Dark Green(暗绿)、Dark Yellow(暗黄)。
Reset 按钮
将以上三项颜色设置为 Unchanged,即不使用任何颜色标记原文和译文,而保留文档原有的颜色设置。
设置完成后,下面的列表框中会显示颜色设置示例。
3、适用情况
该颜色设置适用于在文档中打开翻译单元的操作以及 Workbench 的“预翻译”(Tools —> Translate)批处理操作。另外,这个颜色设置主要是针对 Word 的。而对于 Tageditor,“预翻译”过程可能会有效,但对于打开翻译单元的操作则没有效果。
4、颜色设置对于 Cleanup 后的文档的影响
一般来说,如果文档的原文部分原来就带有颜色,在对原文和译文部分应用颜色标记的情况下, Cleanup 后会恢复原有的颜色设置,但在某些情况下也会出现问题(将在第二部分讨论)。
二、使用颜色设置的一些负面问题

1、不宜在 Translated Text Colours 对话框中设置原文档中出现的文本颜色,否则可能会造成问题:例如,以下是文档中的原文,分别对一个词和整句使用了蓝色、红色和暗黄色:
http://bbs.giltworld.com/UploadFile/2006-12/200612202105846959.jpg(TTC-2)如果在 Translated Text Colours 对话框使用 Suggest 按钮设置了颜色,则 Source Colour 和 Target Colour (fuzzy match) 会分别设置为“蓝色”和“暗黄色”,与文档中的颜色重复。进行“预翻译”后的结果如下所示(假设这两个句子在 TM 均为 full match):http://bbs.giltworld.com/UploadFile/2006-12/20061220211858252.jpg(TTC-3)可以看到,上图中的原文中红色保留了下来,第二句原文部分整个变成了蓝色。
Cleanup 后的结果如下所示:
http://bbs.giltworld.com/UploadFile/2006-12/200612202111584804.jpg(TTC-4)可以看到,Cleanup 后,第二句话原有的暗黄色变成了黑色。造成这种情况的原因是,如果在 Translated Text Colours 对话框设置中指定了颜色,在形成翻译单元时,Workbench 会将文档中与所设置的三种颜色相同的任何文本的相应颜色部分作为黑色来处理,即将这部分设置为 Translated Text Colours 对话框中指定的颜色;而在 Cleanup 时,Workbench 会将所有这三种颜色的文本修改为黑色,因此在 Cleaup 后就可能出现丢失原有颜色的情况。如果在 Translated Text Colours 对话框中将颜色设置为 Unchanged,则会保留原文档的颜色而不做修改。
2、如果使用颜色标注了文档中的翻译单元,则在对译文部分进行修改时,可能会造成同一译文句子中颜色不一致的情况,这也可能会导致出现 Multiple Translation。在 Tageditor 中进行此类修改时就会出现这种情况。
在 Tageditor 中对如下图所示的翻译单元进行修改:
http://bbs.giltworld.com/UploadFile/2006-12/200612202112518398.jpg(TTC-5)假设开始觉得句首的“在从”两字不妥而将其删除,而后又恢复原来的翻译,手动输入“在从”两个字,由于 Tageditor 会默认将光标前面的颜色格式应用到当前光标位置输入的内容,因此所输入的“在从”两个字使用它前面原文部分的颜色 — 蓝色,从而造成了一句译文中存在多种颜色,如下图所示:


http://bbs.giltworld.com/UploadFile/2006-12/200612202121983713.jpg(TTC-6)将这个翻译单元提交到 TM,其译文部分存储的实际内容是:
http://bbs.giltworld.com/UploadFile/2006-12/200612202123212039.jpg(TTC-7)
可以看到,其中的译文部分加入了文本颜色标记 cf2(蓝色)和 cf11(绿色),与下图所示的情况比较,其文本部分完全相同,但由于前者加入了颜色标记,因此它们属于不同的译文。
http://bbs.giltworld.com/UploadFile/2006-12/200612202124218323.jpg(TTC-8)当然,你可以想方设法使整句格式一致。实际上,如果句子的内部格式不一致(不只限于颜色),提交到 TM 中时就会加入格式标记。详情请参见本贴“Penalties 选项卡”内容部分的注释 1。
3、Translated Text Colours 对话框中的设置是保存在本地的,也就是,在你的机器上使用 Workbench 打开任何 TM 时,这个设置都不变(除非你进行修改)。因此,如果是向客户提交文件,或者和其他人合作完成项目,当你的 Translated Text Colours 对话框设置与客户或其他人的不一样时,就会出现问题。比如,某个文档中的文本完全为黑色,但在你的 Translated Text Colours 对话框中采用了推荐的设置方式,但你的客户则设置为 unchanged,这种情况下,如果你只提交双语文件而由客户自己来 Cleanup,就会出现问题。在你提交的文档中,full match 部分和 fuzzy match 部分分别使用了“暗绿色”和“暗黄色”;客户在 Cleanup 你的文档时,由于他的 Translated Text Colours 对话框设置为 Unchaged,会将“暗绿色”和“暗黄色”译文部分视为原文原有的颜色,因此会保留这些颜色。这样,原本没有颜色的原文变成了有颜色的译文,如果对文档的颜色有严格的要求,就会造成问题。
三、有关翻译单元颜色设置的建议

1、鉴于以上可能存在的问题,如没有特殊考虑,建议尽可能使用 Unchanged 设置 2、在与客户交接项目时,建议确认 Translated Text Colours 对话框的设置。
3、如果必须设置颜色,应避免设置文档中出现的颜色。
4、对于最终要生成纯文本的文档,设置颜色虽然对于文档的使用没有任何影响,但在具体处理时应避免出现上文提到的句子内部出现多种格式的情况。
页: [1] 2 3
查看完整版本: Trados 基本知识、使用技巧与经验(此帖甚强,建议大家通读)