アフィリエイト広告を利用しています
最新記事
にほんブログ村 英語ブログ 英語 通訳・翻訳へ
にほんブログ村
 
翻訳ランキング
  翻訳ブログランキング参加中
翻訳ブログ人気ランキング


タグ
検索
ご意見・ご感想

ご意見、ご感想、ご質問をお待ちしております。
こちらから、どうぞお気軽に!

記事一覧
◆パッケージについて
 作業前に内容を確認する
 作業前に設定を変更する
 メモリをアップグレードする (2017 SR1)
 格納されているファイルにアクセスする

◆Trados の機能
 表示フィルタ・高度な表示フィルタ
   2021 の表示フィルタ
   タグの中の検索
   プラグイン
   プラグイン for 2019
   変更履歴
   すべてのコンテンツ
 検証機能
   全般の設定
   QA Checker
 QuickInsert
 印刷プレビュー
 メモリのフィールド
 ファイルの解析 @
 ファイルの解析 A
 AutoSggest
   ATOK との競合
   プラグイン
 ショートカット キー
   設定方法
   便利なキー
   高度な表示フィルタ
 変更履歴
 繰り返しの自動反映
 upLIFT テクノロジー
   フラグメント一致
   あいまい一致の自動修正
   単語数のカウント
 自動置換 > 単位
 ジャンプ
 用語認識
 MultiTerm
 変数リスト

◆Trados のバージョン・エディション
 2021 SR2 CU9
 2021 の新機能
 プラグインとアプリの 2021 対応 (2020/08)
 2017 SR1 の最近のバグ (2020/05)
 プラグインとアプリの 2019 対応 (2019/02)
 2019 の新機能
 Starter エディション
 2017 SR1 の新機能
 メモリのアップグレード (2017 SR1)

◆プラグインとアプリ
 2024 対応 (2024/08)
 フィルタで繰り返しを除外
 原文の英数字を訳文にコピー
 パッケージの中身を一覧表示
 コメントを Excel にエクスポート
 選択箇所の検索結果を別画面で一覧表示
 メモリをアップグレード
 用語集を変換
 コメントや変更履歴のユーザー名を変更
 sdlxliff ファイルを Excel にエクスポート
 Community Advanced Display Filter for 2019
 Community Advanced Display Filter
 Regex Match AutoSuggest Provider
 PackageReader
 Comment View Plugin
 SegmentSearcher
 TM Lifting
 Glossary Converter
 SDL Batch Anonymizer
 Export to Excel

◆トラブルシューティング
 QuickInsert の設定が表示されない
 QuickInsert が動かない
 訳文生成できない
   分節の結合
   コメント
   表示フィルタのハイライト
   ハイパーリンク タグ
 メモリがヒットしてこない
   完全一致が登録されていない
   検索オプション
   言語ペア
   サーバー TM
   Trados のバージョン
   空メモリから作業を始めた場合
   単語単位のトークン化
 「TM はアップグレードが必要」が消えない
 検証の除外設定が効かない
 エディタの動きが遅い
 エディタが落ちる
 ファイルの解析が終わらない
 エディタ上のフォントが変わらない
 用語が認識されない
 同じ用語が何回も表示される
 パッケージを正常に開けない

◆翻訳作業に役立つ Tips
 タグの中の文字を検索する
 複数の分節に分かれている場合の処理
 メモリに登録されるユーザー名を変える
 自分の訳文用のメモリを作る
 Trados の設定を変える
 パッケージを別プロジェクトとして開き直す
 訳文を表示する方法
   印刷プレビュー
   訳文のみで保存
   訳文の表示
 単語数・文字数のカウント
   解析レポート @
   解析レポート A
   単語単位のトークン化
 ショートカット キーを設定する
   設定方法
   便利なキー
 変更履歴を記録する
 繰り返しを自動入力する
 エディタ上のフォントを変える
 1 つの原文に複数の訳文を登録する
 単位記号の前にスペースを入れる
 英日と日英で同じメモリを使う

◆Trados 以外のツール
 CAT ツール
   Memsource
   memoQ
 その他のツール
   ATOK
   Xbench
    変更履歴
    使い方【前編】
    使い方【後編】
   QA Distiller
   AutoHotKey
   WinMerge
   Visual Studio Code
   Vale
最新コメント
プロフィール
さくらさんの画像

昔は「Trados さん、頑張って!」とお祈りしながら訳文生成していませんでしたか? 今も、たまにそんな気分になるときがあります。Trados って本当にわからないことばかりです。特に、日本語の情報は少ないですよね。いくら翻訳者とはいえ、日本語の情報が欲しいのです。Trados ユーザーの方々といろいろ情報交換できたらと思っています。




広告

posted by fanblog

2020年08月05日

重複している用語の削除

先日の Trados 質問会ウェビナーからあっという間に 1 か月以上がたってしまいました。まだ在宅勤務が続いている私ですが、なぜか通勤していた頃より忙しく、時間はどんどん流れていきます。

この質問会の中で、用語ベースに関して「重複している用語を削除できないか」という質問がありました。私はいつも Glossary Converter を使って削除しているので、Trados 自体で削除できるならその方法をぜひ知りたいと思ったのですが、残念ながら、Trados には一括で削除する方法はないとのことでした。

最適化やフィルタの機能もチラッと紹介されていましたが、私が試したところでは、どちらを使っても重複している用語を削除することはできなそうでした。今回の記事では、この最適化とフィルタについてと、Glossary Converter を使って重複を削除する方法を紹介したいと思います。


なぜ、重複している用語を削除したいのか


質問会では個々の質問が 1 文程度で紹介されるだけなので、質問者の詳しい状況や背景は想像するしかありませんが、私が削除したいと思う理由は、用語認識ウィンドウが以下のようになってしまうからです。

    56_7.gif


この画像は以前の記事 用語ベースが巨大すぎる! で紹介したものです。こんな感じに認識されてもまったく役立ちません。表示の設定に「同じ用語は 1 回だけ表示する」というようなオプションでもあればいいのですが、そのようなものはなさそうなので、じゃあ、用語ベースのデータを物理的に削除しちゃおう、ということになります。

翻訳会社さんから提供される用語ベースには、本当の意味での用語が登録されている以外に、UI の文言が登録されていることがあります。ウィンドウ名やボタン名、エラー メッセージなどが「用語」として登録されてきます。重複が多くなるのは、こうした UI の用語ベースです。バージョンが違うとか、コンテキストが違うとか、いろいろ理由はあるでしょうが、重複が多すぎて用語認識できないのでは用語ベースを使う意味がありません。用語認識機能に 100% 頼ることはしませんが、自動で認識してくれる機能はやはり便利なので、使えるものならうまく使いたいと思っています。


最適化


SDL MultiTerm には「最適化」という機能があります。用語が認識されてこないなど何かおかしいときに最適化をすると問題が解決されることがあります。パッケージに設定されてきた用語ベースでも、「最適化してください」とメッセージが表示されることがあります。どのような処理が行われるのかはわかりませんが、最適化するように促されたら私は素直に最適化しています。私の経験からすると、この処理が失敗することはまずありません。対象の用語ベースを開いて、左下の [用語ベース管理] をクリックします。リボンに [最適化] ボタンが表示されるので、それをクリックするとウィザードが始まります。


67_1.gif


ただ、私が試した限り、最適化をしても重複している用語は削除されませんでした。たぶん、エントリ数は変わらないと思います。巨大な用語ベースだと何か違うかもしれませんが、通常は、この機能で重複を削除することはできなそうです。


フィルタ: Source contains synonyms


SDL MultiTerm には「Source contains synonyms」というフィルタが最初から用意されています。一見役立ちそうな名前のフィルタですが、これを使っても重複している用語を抽出することはできません。


67_2.gif


Source contains synonyms を使うと、ソース言語に複数の用語が存在するエントリを抽出できます。上図では、英語から日本語を検索しているのでソース言語は英語です。このため、英語が複数あるエントリが表示されます。検索を反転させて日本語から英語にすると、ソース言語は日本語に変わります。こうなると、上図のエントリの日本語は 1 つなので、今度は表示されないことになります。

このフィルタは一括削除をするときなどにも使用できますが、私が削除したい「重複している用語」とは違います。上図のように、1 対多のエントリとしてまとまっているのであれば、削除する必要はありません。逆に、synonym が削除されては困ります。実は、上図のエントリは、Glossary Converter を使ってマージを行った結果のデータです。このように 1 対多のエントリにまとめながら、重複を削除する方法を次に説明します。


Glossary Converter でマージする


Glossary Converter のマージ機能は、複数の用語を 1 つのエントリにまとめる機能ですが、これを使えば重複している用語をきれいに削除できます。この機能については、以前の記事 【後編】マイクロソフトの用語集を使いたい でも紹介しました。


67_3.gif



Glossary Converter のマージ処理では、基準にする言語を選択できます。どちらの言語を選択しても、両方の言語で用語が重複しているエントリは削除されます。上図では、「保存 - Save」と「保存 - save」のエントリがそれぞれ 2 回登場していますが、マージ後はそれらが 1 回にまとめられています。大文字小文字の違いが無視されないこともポイントです。

Glossary Converter の詳しい操作方法については、以前の記事 【後編】マイクロソフトの用語集を使いたい や、SDL のブログ Glossary Converter - Excelから用語ベースおよびTMXへの変換 を参照してください。

以前の記事のほぼ繰り返しですが、簡単に説明するとこんな感じです。


1. 用語ベース ファイル (.sdltb) が出力されるように設定する
[settings] > [General] タブで、「MultiTerm Termbase」を選択します。

  43_4.PNG


2. マージの設定をする
[settings] > [Merging] タブで、[Merge Files] チェックボックスをオンにします。さらに、基準とするフィールドを入力します。(ここで入力しなかった場合は、実行時にプロンプトで尋ねられます。)


  43_5.PNG


3. [settings] が下図のようになっていることを確認してから、用語ベース ファイル (.sdltb) をドロップする

  43_6.PNG


Glossary Converter のマージはとても使いやすいですが、細かい制御はできません。いろいろな制御が必要な場合は、いったん Excel ファイルに変換して、Excel 上でデータを編集する方が便利です。


今回は、以上です。UI の文言を用語ベースに登録するという手法は、実際によく使われていますし、それなりに機能もします。でも、用語ベースは、そもそも UI のために作られているものではないですよね。UI 用に何かもっと良い手段があればいいのにといつも思いますが、ではどんなものが良いかと聞かれると、具体的にはよくわかりません。何か “革新的” な方法ってないものでしょうか。




  




この記事へのコメント
コメントを書く

お名前:

メールアドレス:


ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバックURL
https://fanblogs.jp/tb/10092660
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
×

この広告は30日以上新しい記事の更新がないブログに表示されております。