アフィリエイト広告を利用しています
最新記事
にほんブログ村 英語ブログ 英語 通訳・翻訳へ
にほんブログ村
 
翻訳ランキング
  翻訳ブログランキング参加中
翻訳ブログ人気ランキング


タグ
検索
ご意見・ご感想

ご意見、ご感想、ご質問をお待ちしております。
こちらから、どうぞお気軽に!

記事一覧
◆パッケージについて
 作業前に内容を確認する
 作業前に設定を変更する
 メモリをアップグレードする (2017 SR1)
 格納されているファイルにアクセスする

◆Trados の機能
 表示フィルタ・高度な表示フィルタ
   2021 の表示フィルタ
   タグの中の検索
   プラグイン
   プラグイン for 2019
   変更履歴
   すべてのコンテンツ
 検証機能
   全般の設定
   QA Checker
 QuickInsert
 印刷プレビュー
 メモリのフィールド
 ファイルの解析 @
 ファイルの解析 A
 AutoSggest
   ATOK との競合
   プラグイン
 ショートカット キー
   設定方法
   便利なキー
   高度な表示フィルタ
 変更履歴
 繰り返しの自動反映
 upLIFT テクノロジー
   フラグメント一致
   あいまい一致の自動修正
   単語数のカウント
 自動置換 > 単位
 ジャンプ
 用語認識
 MultiTerm
 変数リスト

◆Trados のバージョン・エディション
 2021 SR2 CU9
 2021 の新機能
 プラグインとアプリの 2021 対応 (2020/08)
 2017 SR1 の最近のバグ (2020/05)
 プラグインとアプリの 2019 対応 (2019/02)
 2019 の新機能
 Starter エディション
 2017 SR1 の新機能
 メモリのアップグレード (2017 SR1)

◆プラグインとアプリ
 2021 対応 (2020/08)
 2019 対応 (2019/02)
 フィルタで繰り返しを除外
 原文の英数字を訳文にコピー
 パッケージの中身を一覧表示
 コメントを Excel にエクスポート
 選択箇所の検索結果を別画面で一覧表示
 メモリをアップグレード
 用語集を変換
 コメントや変更履歴のユーザー名を変更
 sdlxliff ファイルを Excel にエクスポート
 Community Advanced Display Filter for 2019
 Community Advanced Display Filter
 Regex Match AutoSuggest Provider
 PackageReader
 Comment View Plugin
 SegmentSearcher
 TM Lifting
 Glossary Converter
 SDL Batch Anonymizer
 Export to Excel

◆トラブルシューティング
 QuickInsert の設定が表示されない
 QuickInsert が動かない
 訳文生成できない
   分節の結合
   コメント
   表示フィルタのハイライト
   ハイパーリンク タグ
 メモリがヒットしてこない
   完全一致が登録されていない
   検索オプション
   言語ペア
   サーバー TM
   Trados のバージョン
   空メモリから作業を始めた場合
   単語単位のトークン化
 「TM はアップグレードが必要」が消えない
 検証の除外設定が効かない
 エディタの動きが遅い
 エディタが落ちる
 ファイルの解析が終わらない
 エディタ上のフォントが変わらない
 用語が認識されない
 同じ用語が何回も表示される
 パッケージを正常に開けない

◆翻訳作業に役立つ Tips
 タグの中の文字を検索する
 複数の分節に分かれている場合の処理
 メモリに登録されるユーザー名を変える
 自分の訳文用のメモリを作る
 Trados の設定を変える
 パッケージを別プロジェクトとして開き直す
 訳文を表示する方法
   印刷プレビュー
   訳文のみで保存
   訳文の表示
 単語数・文字数のカウント
   解析レポート @
   解析レポート A
   単語単位のトークン化
 ショートカット キーを設定する
   設定方法
   便利なキー
 変更履歴を記録する
 繰り返しを自動入力する
 エディタ上のフォントを変える
 1 つの原文に複数の訳文を登録する
 単位記号の前にスペースを入れる
 英日と日英で同じメモリを使う

◆Trados 以外のツール
 CAT ツール
   Memsource
   memoQ
 その他のツール
   ATOK
   Xbench
    変更履歴
    使い方【前編】
    使い方【後編】
   QA Distiller
   AutoHotKey
   WinMerge
   Visual Studio Code
   Vale
最新コメント
プロフィール
さくらさんの画像

昔は「Trados さん、頑張って!」とお祈りしながら訳文生成していませんでしたか? 今も、たまにそんな気分になるときがあります。Trados って本当にわからないことばかりです。特に、日本語の情報は少ないですよね。いくら翻訳者とはいえ、日本語の情報が欲しいのです。Trados ユーザーの方々といろいろ情報交換できたらと思っています。




2019年04月30日

【後編】マイクロソフトの用語集を使いたい

前編に引き続き、マイクロソフトの用語集を Trados で使えるように変換する方法を説明します。今回こそ具体的な手順を説明しますが、Glossary Converter の使い方に詳しい方は前編の概要だけでだいたいわかって頂けるかと思うので読み飛ばしてください。

説明する手順は、前編で説明したとおり、こんな感じです。

1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。

2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。

3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。

4. 出力された用語ベース (sdltb) を、英語でマージする。

5. マージした用語ベース (sdltb) を、さらに日本語でマージする。

  42_7.GIF


まず、Glossary Converter のお約束

まず、Glossary Converter のステップ全体に共通する点を説明します。


◆ [settings] で設定してから、ドラッグ アンド ドロップする

Glossary Converter の基本的な使い方は、以下のとおりです。

  1. [settings] で設定する

  2. 変換元のファイルをドラッグ アンド ドロップする

  3. 変換元のファイルと同じフォルダーに変換後のファイルが生成される

どんなファイルを変換するときも、この手順は変わりません。そして、Glossary Converter は、一度行った設定を覚えています。同じ変換を何回もするときは設定を覚えていてくれる機能も便利ですが、今回はいろいろな変換をするので、各ステップで、設定を変えてからファイルをドラッグ アンド ドロップします。

なお、ドラッグ アンド ドロップできないときは、Alt+O でファイル選択のダイアログボックスが表示されるので、ファイルを指定して変換を開始します。


◆ 時間がかかる

マイクロソフトの用語集はとても大きいので、変換にものすごく時間がかかります。止まっているんじゃないかと心配になりますが、ステータスバーを見ながら、気長に、気長に、お待ちください。



1. マイクロソフトの用語集ファイルを用語ベースに変換、さらに Excel ファイルに変換

tbx 形式の用語集ファイルはそのままでは編集しにくいので、なんとか Excel で編集できる形にします。tbx ファイルを直接 Excel で開くこともできますが、XML の知識がないと編集しやすい形にするのは難しいため、今回は @ tbx ファイルを Trados の用語ベースに変換A 用語ベースを Excel ファイルに変換という 2 段階の方法を取ります。2 段階はちょっと手間ですが、この方法なら複雑なことを自分で考えなくても Glossary Converter が適当に変換してくれます。

@ tbx ファイルを用語ベースに変換

・設定
最初は、設定不要です。

・変換
tbx ファイルをドラッグ アンド ドロップします。これだけで、Trados の用語ベース (sdltb) が生成されます。


A 用語ベースを Excel ファイルに変換

・設定
今度は、[settings] で少し設定を変えます。[General] タブで、「Excel 2007 Workbook」が選択されていることを確認します (デフォルトで選択されているはず)。

43_2.PNG


[Spreadsheet] タブで、「Multi-line format (one row per synonym)」を選択します。さらに、[Repeat source term] チェックボックスもオンにします。これで、複数の訳語がある場合にそれぞれが別レコードとして複数の行が生成され、各行に原語が入力されます。[Column/Language name] は、今回は空白で大丈夫です。空白にしておくと、最初の列が原語として使われます。

43_3.PNG


・変換
設定ができたら、用語ベース (sdltb) をドラッグ アンド ドロップします。これで、Excel ファイルが生成されます。



2. Excel で、定義などの不要な列を削除

生成された Excel ファイルを開いて、定義などの不要な列を削除し、英語と日本語の 2 列だけにします。

43_1.PNG



3. Excel ファイルを用語ベースに再度変換する

英語と日本語の 2 列だけにした Excel ファイルを、用語ベース (sdltb) の形に戻します。

・設定
このステップでは不要です。

・変換
Excel ファイルをドラッグ アンド ドロップします。これで、用語ベース (sdltb) が生成されます。



4. 出力された用語ベースを、英語でマージ

この時点の用語ベース (sdltb) は、まだ複数の訳語が別レコードとして残っている状態なので、まず英語でマージして重複する訳語を削除します。英日または日英のどちらか一方向だけで使うときは、その方向で 1 回だけマージすれば大丈夫です。

・設定
[General] タブで、「MultiTerm Termbase」を選択します。これで、用語ベース (sdltb) を用語ベース (sdltb) に変換する、という設定になります。

43_4.PNG


[Merging] タブで、[Merge Files] チェックボックスをオンにします。[Merge on this Field] は空白のままにします。空白にしておくと、変換処理が始まってからプロンプトが表示されるのでそこで設定します。

43_5.PNG


・変換
下図のように「merge」と表示されていることを確認して、 用語ベース (sdltb) をドラッグ アンド ドロップします。マージの基準にするフィールドを尋ねるプロンプトが表示されるので、英語 (English) を選択します。変換が終わると、元のファイル名に「.output」を追加した名前で新しい用語ベースが生成されます。

43_6.PNG



5. 用語ベースを、さらに日本語でマージ

英語でマージした用語ベースをさらに日本語でマージします。(もしかしたら、このステップは不要なんじゃないかとも思うのですが、念のためしておきます。)

・設定
[General] タブで、「MultiTerm Termbase」が選択されていることを確認します。前のステップで選択したので、その設定がそのまま残っていると思います。

[Merging] タブで、[Merge Files] チェックボックスが選択されていることを確認します。これも、前のステップで選択しているのでそのままオンになっているはずです。[Merge on this Field] は、前のステップの 「English」 が残っていたら、空白に戻します。

・変換
前のステップと同じように「merge」と表示されていることを確認して、 用語ベース (sdltb) をドラッグ アンド ドロップします。マージの基準にするフィールドを尋ねるプロンプトがまた表示されるので、今度は日本語 (Japanese) を選択します。変換が終わると、元のファイル名にさらに「.output」を追加した名前で新しい用語ベースが生成されます。これで、完成です。


これでマイクロソフトの用語集の準備は完了です。ステップが多くなっていますが、今回の方法は試行錯誤の末、なるべく安全な方法として考えました。今さらですが、マージ機能は用語ベースから用語ベースへの変換でなくても、Excel から用語ベースへの変換でも使えます。なので、ステップ 3 の Excel から用語ベースへの変換は省略することも可能だと思います。が、実際にやってみると、微妙にうまくいきませんでした。重複している訳語の中で抜けてしまうものがあったりして、なんとなく信用ならない感じでした。何が抜けるのか、なぜ抜けるのかなどを考えるのがちょっと面倒になり、少々ステップは増えますが、今回の方法にしました。

また、Excel を間に含めたのには、もう 1 つ理由があります。Excel でいろいろ細かい編集がしたかったのです。マイクロソフトの用語集はマイクロソフトのスタイルガイドに従っているので、カタカナの連語の間にはスペースが入っていますし、全角文字と半角文字の間にもスペースが入っています。これが、別会社の翻訳に使うときにはちょっと面倒なんです。Excel ファイルにしてしまえば、この辺りをスタイルガイドに合わせて編集することができます。数式や正規表現を使って (皆さん、お得意ですよね??) いろいろ加工ができます。

次回は、この用語ベースを Trados のエディタで使うときに気を付ける設定などを紹介したいと思います。




2019年04月27日

【前編】マイクロソフトの用語集を使いたい

記事の更新が久しぶりになってしまいました。ちょこちょこと書きたいことはあったのですが、仕事が忙しかったり、なかなか考えがまとまらなかったりで、1 か月以上も過ぎていました。

さて今回は、マイクロソフトから提供されている用語集を Trados で使う方法を紹介したいと思います。この用語集はとても便利ですが、とにかくデータ量が多いので Trados で効果的に使うには少し工夫が必要です。私はずいぶん昔から試行錯誤していたんですが、最近ようやく、Glossary Converter を使ったら便利かもしれないということに思いあたりました。今回は、Glossary Converter のマージ機能を使った方法を紹介します。何かもっとこうした方が良いというアドバイスなどありましたら、ぜひぜひお聞かせください。

この記事は「前編」として概要だけ説明します。細かい Glossary Converter の使い方などは後編で書きたいと思います。

マイクロソフトの用語集

42_1.png



この用語集には、IT 分野で使える用語が大量に入っています。マイクロソフト提供のものですが、製品の UI などは別で提供されていて (おそらく、一般人は無料では手に入らない)、この用語集には一般的な用語のみが格納されています。

各国語のデータが用意されているので、日本語を選択してダウンロードします。ダウンロードされるデータは tbx 形式のファイルです。tbx とは「Term Base eXchange」のことで、用語データに一般的に使われる XML のデータ形式です。この形式は、Multiterm に付属のコンバーターでもサポートされています。


変換に使用するツール: Glossary Converter


42_2.png


tbx 形式の用語集は Multiterm 付属のコンバーターで扱うこともできますが、今回は、SDL App Store から無料でダウンロードできるアプリ「Glossary Converter」を使います。これは、Trados Studio に組み込まれるプラグインではなく、Trados Studio の外側で動くアプリです。 (現在は、上記のバージョンより新しいものになっています。)

このツールについては、SDL の公式ブログ「Glossary Converter – Excelから用語ベースおよびTMXへの変換」でも紹介されています。参考にしてください。

使い方はとても簡単で、アプリを起動したら、そこにファイルをドラッグ アンド ドロップするだけです。変換したいファイルをドロップすると、後は自動で適当に変換してくれます。実際には、以下の 2 つの処理のいずれかになります。

・用語ベース (sdltb) をドロップ    -->  Excel ファイルなどに変換される。
・用語ベース (sdltb) 以外をドロップ  -->  用語ベース (sdltb) に変換される。

ドロップした元ファイルと同じフォルダーに、同じ名前で拡張子だけが違うファイルが生成されます。同名のファイルが既に存在している場合は、上書きするかどうかを尋ねられるので、必要に応じてファイル名を指定できます。

変換先の形式や細かい変換方法を設定したい場合は、ドロップする前に、[settings] から設定を行います。たいていは何も設定しなくてもうまく変換されます。今回の変換で使う設定については、後編の記事で説明します。

今回の変換で気を付けたこと


今回の変換で私が気を付けたのは、以下の 3 つです。(なんか、どっかのマニュアルみたいですが)


  • 同じ訳語は 1 回だけ表示されるようにする

  • ただし、大文字小文字は区別する

  • 英日と日英のどちらでも使える用語集にする


マイクロソフト提供の用語集は、同じ訳語であっても定義の違うものは別レコードとして登録しているので、単純に変換すると、Trados の用語認識ウィンドウに同じ訳語が何回も表示されてきてしまいます。用語の定義を知りたいときはそうした表示も役立ちますが、実際には、Trados の用語認識ウィンドウに訳語の定義を表示しても読みにくく、あまり効率的ではありません。今回の用語ベースは、あくまで入力補助として使うことを前提に、定義の違いは無視して同じ訳語は 1 回だけ表示されるようにしました。


42_6.PNG



重複を削除するにあたって問題となったのが 2 つ目の大文字小文字の区別です。以前に、「Excel で重複を削除する方法」を紹介しましたが、実は、この Excel の「重複の削除」機能は大文字小文字を区別しません。今回のマイクロソフトの用語集では区別できなくても問題ないですが、実際の仕事では、Trados の用語ベースに UI が格納されていることがよくあります。日英翻訳の UI では、一般用語と違って大文字小文字を区別することが必要な場合があるので、今回はそうした用語ベースにも使える方法として Glossary Converter のマージ機能を使ってみることにしました。

Excel で大文字小文字を区別しながら重複を削除する方法も試してみたのですが、私の思い付く限りでは、少し数式を書く必要がありました。その方法は、また次回紹介したいと思います。

最後に、3 つ目の英日と日英のどちらでも使えるようにですが、これはいくつも用語集があると面倒なので、1 つにしたいなあと思っただけです。ただ、これも重複の削除のときに少し注意が必要で、英語の用語が 1 つで日本語の用語が複数の場合と、この逆の場合とが混在していることを意識しておく必要があります。とは言っても、結局、今回の方法にしたら、ほぼ何もしなくてもうまく変換されました。

変換の手順

変換の手順は、こんな感じです。

1. マイクロソフトの用語集ファイル (tbx) を用語ベース (sdltb) に変換し、さらにそれを Excel ファイル (xlsx) に変換する。

2. Excel で、定義などの不要な列を削除して英語と日本語の 2 列だけにする。

3. 2 列だけにした Excel ファイル (xlsx) を用語ベース (sdltb) に再度変換する。

4. 出力された用語ベース (sdltb) を、英語でマージする。

5. マージした用語ベース (sdltb) を、さらに日本語でマージする。


42_7.GIF


さて、今回は以上です。概要だけで、何も詳しい手順がなくてすみません。書いていたら予想以上に長くなってしまったので、詳しい手順は後編で説明したいと思います。