2022年02月22日
完全一致がメモリに入っていない
少し前に、完全一致 (Perfect Match、略して PM) が含まれるプロジェクトで少し面倒なことがあったので、そのときのことを紹介したいと思います。Trados には、PM、100%、コンテキスト マッチ (CM) などいろいろな一致がありますが、PM はかなり特殊なので少し注意が必要です。
完全一致が含まれていた今回のプロジェクトは、よくある改訂版の翻訳でした。ソフトウエアのマニュアルで、バージョン 1 の既訳をバージョン 2 にアップデートするものです。今回翻訳するバージョン 2 のファイルは、下図のサンプルのように、バージョン 1 との完全一致で既に一部訳文が入っている状態で受け取りました。
一致の種類の概要については、公式ブログの「「100% 一致」と「完全一致」の違い」を参考にしてください。この公式ブログでも説明されていますが、完全一致 (PM) の「一致」は、メモリとの一致ではなく、バイリンガル ファイルとの一致を意味しています。完全一致はメモリを介さないので、タグや認識済みトークンの変換が発生せず、複数訳文での訳し分けの影響も受けません。とにかく、実際にバイリンガル ファイルで使われている訳文がそのままコピーされてきます。
最初に挙げた図のような PM、CM、100% が交ざったバイリンガル ファイルは、翻訳会社さんが「完全一致の適用」と「一括翻訳」という 2 つの一括タスクを使って既訳を埋め込んで作っています。
まず、「完全一致の適用」タスクで、バージョン 1 のバイリンガル ファイルから既訳をコピーします。このときにコピーされた分節が「PM」となります。その後、「一括翻訳」 タスクで今度はメモリから既訳をコピーします。これが一般的なマッチで「CM」または「100%」となります。
■ 完全一致はバイリンガル ファイルからコピー
■ CM と 100% はメモリからコピー
ちなみに、私の使っているフリーランス版では「完全一致の適用」タスクは実行できません (上図のようにグレーアウトされています)。このタスクはプロフェッショナル版でのみ使用可能です。個人でも使いたいことはあるので、この制限はぜひぜひ解除して欲しいのですが、無理ですかね、だめですか、Trados さん?
今回のような改訂版の翻訳では、用語や表現を前版に合わせる必要がありますが、このとき最優先にすべきは、PM の訳文です。CM や 100% より、PM です。
CM や 100% はメモリとの一致なので、それが本当にバージョン 1 に使われていた訳文なのかはわかりません。メモリがバージョン 1 のファイルからのみ作られているのであれば、CM や 100% と PM はほぼ同じ結果になりますが、そんな単純かつきれいにメモリが作られていることはまれです。たいていのメモリは、参考のためにと別マニュアルの訳文が入っていたり、訳し分けなどの理由で複数の訳文が入っていたりします。また、プロジェクトによってはメモリが複数指定されていることもあり、その場合は、CM や 100% と表示されていてもどのメモリとの一致なのかはわかりません。
一方、PM は、メモリではなく、バージョン 1 のファイルから直接コピーされた訳文なので、間違いなくバージョン 1 で使われていた訳文ということになります。このため、バージョン 2 を翻訳するときに最も参考にしなければならないのは PM です。
というわけで、PM の訳文を参考にしたかったのですが、今回はこれがメモリに入っていませんでした。普通、バージョン 2 を訳すときはバージョン 1 の訳文をメモリに入れるものですが、「完全一致の適用」タスクではメモリを使わないので「バイリンガル ファイルには適用したけれども、メモリには入れなかった」ということが起こり得ます (起こり得るだけで、意図的にこんな状態を作るとは考えにくいので、おそらくミスです)。
PM としてバイリンガル ファイルにコピーされているだけでは、メモリの一致としてヒットしてきませんし、訳語検索でも使えません。このような状態では、PM の訳文を最優先したくてもできません。
「PM」と表示されている分節の訳文がメモリに入っていないことに気付いた場合は、自分で PM の訳文をメモリに取り込んでメモリとして参照できるようにします。手順は簡単です。
1.新しいメモリを作成する。
・PM であることを区別できるように、フィールドを追加する。
2.作成したメモリに、バージョン 2 のバイリンガル ファイルをインポートする。
・インポートするステータスとして「リリース」を指定する。
・フィールドに、「PM」など、わかりやすい値を入力する。
1.新しいメモリを作成
まず、提供されたメモリとは別に新しいメモリを作成します。ここに、PM の訳文だけをインポートします。新しいメモリには、後から PM とわかるようにするためフィールドを追加します。フィールドは新規作成のウィザードに従って操作すれば簡単に追加できますが、作成した後でも [設定] 画面から追加できます。(フィールドについては、以前の記事「提供された訳文と自分の訳文を区別する ー A どのメモリの訳文かを表示する」も参考にしてください。)
2.バイリンガル ファイルをインポート
作成したメモリにバイリンガル ファイルをインポートします。このとき、ステータスが「リリース」の分節のみをインポートするように設定します。PM の分節は、通常、ステータスが「リリース」になっています (もし、なっていない場合は、下記の「ステータスの「リリース」を使用できない場合」を参考にしてください)。
ウィザードに従って進むとフィールドを設定する画面が表示されるので、[編集] ボタンをクリックしてフィールドを設定します。下図では、「Flg」という名前のフィールドに「PM」という値を設定しています。
正常にインポートできたら、そのメモリをプロジェクトに追加して、翻訳作業で参照するようにします。フィールドを設定しておくと、複数の訳文がマッチしてきても、以下のように右端にフィールドが表示されるので、どのメモリからのマッチなのかがわかりやすくなります。下図では、上段の訳文が PM の訳文、下段の訳文は他のメモリからの訳文です。
上記の手順では、インポートするときにステータスが「リリース」であることを条件にしました。これは、インポートするときのオプションとしてはこれしかないので使用しただけです。通常、PM の分節はステータスが「リリース」となってロックされていますが、この状態は絶対ではありません。PM でもステータスが「リリース」でないことはあり得ます。また、PM 以外の分節のステータスが「リリース」になっている場合もあります。
条件として「リリース」を使用できない場合は、高度な表示フィルタを使用します。PM の分節のみを抽出して、バイリンガル ファイルを生成します。
[属性のフィルタ] タブで [元データ] の [完全一致] を選択してフィルタをかけ、その後 [生成] ボタンをクリックします。これで、フィルタで抽出された分節だけをバイリンガル ファイルとしてエクスポートできます。この方法でエクスポートしたファイルをメモリにインポートします。
メモリをインポートするときにフィールドを設定し忘れても大丈夫です。フィールドの値は後から一括で入力できます。翻訳メモリ ビューのリボンから [一括編集] ボタンをクリックすると、メモリ内の訳文やフィールドを一括で編集できます。
[追加] ボタンをクリックすると、[フィールドの値の変更] というオプションが表示されます。それを選択して、入力したいフィールドと値を設定します。
今回は以上です。PM は改訂翻訳などではとても便利な機能です。ただ、作業するときはその意味を理解した上で有効に使う必要があると思います。Trados は、少し複雑になることもありますが、自分で自由に操作できることが最大のメリットです。パッケージを受け取って作業する場合でも、できる範囲で工夫をしてみることが大切かもしれません。
完全一致が含まれていた今回のプロジェクトは、よくある改訂版の翻訳でした。ソフトウエアのマニュアルで、バージョン 1 の既訳をバージョン 2 にアップデートするものです。今回翻訳するバージョン 2 のファイルは、下図のサンプルのように、バージョン 1 との完全一致で既に一部訳文が入っている状態で受け取りました。
完全一致とは?
一致の種類の概要については、公式ブログの「「100% 一致」と「完全一致」の違い」を参考にしてください。この公式ブログでも説明されていますが、完全一致 (PM) の「一致」は、メモリとの一致ではなく、バイリンガル ファイルとの一致を意味しています。完全一致はメモリを介さないので、タグや認識済みトークンの変換が発生せず、複数訳文での訳し分けの影響も受けません。とにかく、実際にバイリンガル ファイルで使われている訳文がそのままコピーされてきます。
既訳を埋め込む一括タスク: 「完全一致の適用」と「一括翻訳」
最初に挙げた図のような PM、CM、100% が交ざったバイリンガル ファイルは、翻訳会社さんが「完全一致の適用」と「一括翻訳」という 2 つの一括タスクを使って既訳を埋め込んで作っています。
まず、「完全一致の適用」タスクで、バージョン 1 のバイリンガル ファイルから既訳をコピーします。このときにコピーされた分節が「PM」となります。その後、「一括翻訳」 タスクで今度はメモリから既訳をコピーします。これが一般的なマッチで「CM」または「100%」となります。
■ 完全一致はバイリンガル ファイルからコピー
■ CM と 100% はメモリからコピー
ちなみに、私の使っているフリーランス版では「完全一致の適用」タスクは実行できません (上図のようにグレーアウトされています)。このタスクはプロフェッショナル版でのみ使用可能です。個人でも使いたいことはあるので、この制限はぜひぜひ解除して欲しいのですが、無理ですかね、だめですか、Trados さん?
最優先で参考にすべきは完全一致
今回のような改訂版の翻訳では、用語や表現を前版に合わせる必要がありますが、このとき最優先にすべきは、PM の訳文です。CM や 100% より、PM です。
CM や 100% はメモリとの一致なので、それが本当にバージョン 1 に使われていた訳文なのかはわかりません。メモリがバージョン 1 のファイルからのみ作られているのであれば、CM や 100% と PM はほぼ同じ結果になりますが、そんな単純かつきれいにメモリが作られていることはまれです。たいていのメモリは、参考のためにと別マニュアルの訳文が入っていたり、訳し分けなどの理由で複数の訳文が入っていたりします。また、プロジェクトによってはメモリが複数指定されていることもあり、その場合は、CM や 100% と表示されていてもどのメモリとの一致なのかはわかりません。
一方、PM は、メモリではなく、バージョン 1 のファイルから直接コピーされた訳文なので、間違いなくバージョン 1 で使われていた訳文ということになります。このため、バージョン 2 を翻訳するときに最も参考にしなければならないのは PM です。
完全一致はメモリに入っていないこともある
というわけで、PM の訳文を参考にしたかったのですが、今回はこれがメモリに入っていませんでした。普通、バージョン 2 を訳すときはバージョン 1 の訳文をメモリに入れるものですが、「完全一致の適用」タスクではメモリを使わないので「バイリンガル ファイルには適用したけれども、メモリには入れなかった」ということが起こり得ます (起こり得るだけで、意図的にこんな状態を作るとは考えにくいので、おそらくミスです)。
PM としてバイリンガル ファイルにコピーされているだけでは、メモリの一致としてヒットしてきませんし、訳語検索でも使えません。このような状態では、PM の訳文を最優先したくてもできません。
完全一致のメモリを自分で作る
「PM」と表示されている分節の訳文がメモリに入っていないことに気付いた場合は、自分で PM の訳文をメモリに取り込んでメモリとして参照できるようにします。手順は簡単です。
1.新しいメモリを作成する。
・PM であることを区別できるように、フィールドを追加する。
2.作成したメモリに、バージョン 2 のバイリンガル ファイルをインポートする。
・インポートするステータスとして「リリース」を指定する。
・フィールドに、「PM」など、わかりやすい値を入力する。
1.新しいメモリを作成
まず、提供されたメモリとは別に新しいメモリを作成します。ここに、PM の訳文だけをインポートします。新しいメモリには、後から PM とわかるようにするためフィールドを追加します。フィールドは新規作成のウィザードに従って操作すれば簡単に追加できますが、作成した後でも [設定] 画面から追加できます。(フィールドについては、以前の記事「提供された訳文と自分の訳文を区別する ー A どのメモリの訳文かを表示する」も参考にしてください。)
2.バイリンガル ファイルをインポート
作成したメモリにバイリンガル ファイルをインポートします。このとき、ステータスが「リリース」の分節のみをインポートするように設定します。PM の分節は、通常、ステータスが「リリース」になっています (もし、なっていない場合は、下記の「ステータスの「リリース」を使用できない場合」を参考にしてください)。
ウィザードに従って進むとフィールドを設定する画面が表示されるので、[編集] ボタンをクリックしてフィールドを設定します。下図では、「Flg」という名前のフィールドに「PM」という値を設定しています。
正常にインポートできたら、そのメモリをプロジェクトに追加して、翻訳作業で参照するようにします。フィールドを設定しておくと、複数の訳文がマッチしてきても、以下のように右端にフィールドが表示されるので、どのメモリからのマッチなのかがわかりやすくなります。下図では、上段の訳文が PM の訳文、下段の訳文は他のメモリからの訳文です。
ステータスの「リリース」を使用できない場合
上記の手順では、インポートするときにステータスが「リリース」であることを条件にしました。これは、インポートするときのオプションとしてはこれしかないので使用しただけです。通常、PM の分節はステータスが「リリース」となってロックされていますが、この状態は絶対ではありません。PM でもステータスが「リリース」でないことはあり得ます。また、PM 以外の分節のステータスが「リリース」になっている場合もあります。
条件として「リリース」を使用できない場合は、高度な表示フィルタを使用します。PM の分節のみを抽出して、バイリンガル ファイルを生成します。
[属性のフィルタ] タブで [元データ] の [完全一致] を選択してフィルタをかけ、その後 [生成] ボタンをクリックします。これで、フィルタで抽出された分節だけをバイリンガル ファイルとしてエクスポートできます。この方法でエクスポートしたファイルをメモリにインポートします。
メモリのフィールドを設定しなかった場合
メモリをインポートするときにフィールドを設定し忘れても大丈夫です。フィールドの値は後から一括で入力できます。翻訳メモリ ビューのリボンから [一括編集] ボタンをクリックすると、メモリ内の訳文やフィールドを一括で編集できます。
[追加] ボタンをクリックすると、[フィールドの値の変更] というオプションが表示されます。それを選択して、入力したいフィールドと値を設定します。
今回は以上です。PM は改訂翻訳などではとても便利な機能です。ただ、作業するときはその意味を理解した上で有効に使う必要があると思います。Trados は、少し複雑になることもありますが、自分で自由に操作できることが最大のメリットです。パッケージを受け取って作業する場合でも、できる範囲で工夫をしてみることが大切かもしれません。
タグ:Perfect Match CM 一括編集 リリース PM フィールド 一括翻訳 完全一致の適用 100%マッチ 100%一致 コンテキスト マッチ 完全一致 高度な表示フィルタ 属性のフィルタ フィールドの値の変更 一括編集スクリプト トラブルシューティング メモリがヒットしてこない
Tweet
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/11271822
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック