アフィリエイト広告を利用しています
最新記事
にほんブログ村 英語ブログ 英語 通訳・翻訳へ
にほんブログ村
 
翻訳ランキング
  翻訳ブログランキング参加中
翻訳ブログ人気ランキング


タグ
検索
ご意見・ご感想

ご意見、ご感想、ご質問をお待ちしております。
こちらから、どうぞお気軽に!

記事一覧
◆パッケージについて
 作業前に内容を確認する
 作業前に設定を変更する
 メモリをアップグレードする (2017 SR1)
 格納されているファイルにアクセスする

◆Trados の機能
 表示フィルタ・高度な表示フィルタ
   2021 の表示フィルタ
   タグの中の検索
   プラグイン
   プラグイン for 2019
   変更履歴
   すべてのコンテンツ
 検証機能
   全般の設定
   QA Checker
 QuickInsert
 印刷プレビュー
 メモリのフィールド
 ファイルの解析 @
 ファイルの解析 A
 AutoSggest
   ATOK との競合
   プラグイン
 ショートカット キー
   設定方法
   便利なキー
   高度な表示フィルタ
 変更履歴
 繰り返しの自動反映
 upLIFT テクノロジー
   フラグメント一致
   あいまい一致の自動修正
   単語数のカウント
 自動置換 > 単位
 ジャンプ
 用語認識
 MultiTerm
 変数リスト

◆Trados のバージョン・エディション
 2021 SR2 CU9
 2021 の新機能
 プラグインとアプリの 2021 対応 (2020/08)
 2017 SR1 の最近のバグ (2020/05)
 プラグインとアプリの 2019 対応 (2019/02)
 2019 の新機能
 Starter エディション
 2017 SR1 の新機能
 メモリのアップグレード (2017 SR1)

◆プラグインとアプリ
 2024 対応 (2024/08)
 フィルタで繰り返しを除外
 原文の英数字を訳文にコピー
 パッケージの中身を一覧表示
 コメントを Excel にエクスポート
 選択箇所の検索結果を別画面で一覧表示
 メモリをアップグレード
 用語集を変換
 コメントや変更履歴のユーザー名を変更
 sdlxliff ファイルを Excel にエクスポート
 Community Advanced Display Filter for 2019
 Community Advanced Display Filter
 Regex Match AutoSuggest Provider
 PackageReader
 Comment View Plugin
 SegmentSearcher
 TM Lifting
 Glossary Converter
 SDL Batch Anonymizer
 Export to Excel

◆トラブルシューティング
 QuickInsert の設定が表示されない
 QuickInsert が動かない
 訳文生成できない
   分節の結合
   コメント
   表示フィルタのハイライト
   ハイパーリンク タグ
 メモリがヒットしてこない
   完全一致が登録されていない
   検索オプション
   言語ペア
   サーバー TM
   Trados のバージョン
   空メモリから作業を始めた場合
   単語単位のトークン化
 「TM はアップグレードが必要」が消えない
 検証の除外設定が効かない
 エディタの動きが遅い
 エディタが落ちる
 ファイルの解析が終わらない
 エディタ上のフォントが変わらない
 用語が認識されない
 同じ用語が何回も表示される
 パッケージを正常に開けない

◆翻訳作業に役立つ Tips
 タグの中の文字を検索する
 複数の分節に分かれている場合の処理
 メモリに登録されるユーザー名を変える
 自分の訳文用のメモリを作る
 Trados の設定を変える
 パッケージを別プロジェクトとして開き直す
 訳文を表示する方法
   印刷プレビュー
   訳文のみで保存
   訳文の表示
 単語数・文字数のカウント
   解析レポート @
   解析レポート A
   単語単位のトークン化
 ショートカット キーを設定する
   設定方法
   便利なキー
 変更履歴を記録する
 繰り返しを自動入力する
 エディタ上のフォントを変える
 1 つの原文に複数の訳文を登録する
 単位記号の前にスペースを入れる
 英日と日英で同じメモリを使う

◆Trados 以外のツール
 CAT ツール
   Memsource
   memoQ
 その他のツール
   ATOK
   Xbench
    変更履歴
    使い方【前編】
    使い方【後編】
   QA Distiller
   AutoHotKey
   WinMerge
   Visual Studio Code
   Vale
最新コメント
プロフィール
さくらさんの画像

昔は「Trados さん、頑張って!」とお祈りしながら訳文生成していませんでしたか? 今も、たまにそんな気分になるときがあります。Trados って本当にわからないことばかりです。特に、日本語の情報は少ないですよね。いくら翻訳者とはいえ、日本語の情報が欲しいのです。Trados ユーザーの方々といろいろ情報交換できたらと思っています。




2020年11月02日

改行を表示しよう

最近は記事の更新頻度が下がってしまい、1 か月に 1 回がやっとになってきてしまいました。更新しないと広告が表示されてしまうので、今回は、ちょっと簡単なものをあげておきます。

Trados のエディタでは、空白や改行文字などを表示することができます。これを表示していないと、ただの空白なのか、改行なのか、はたまたタブなのかわからず、訳文生成してみたらレイアウトが崩れてしまったということになり兼ねません。

たとえば、こんな原文が

 70_11.png


実は、こうだったということもあり得ます。

 70_2.png


私の場合、空白は表示されなくてもいいんですが、改行とタブは表示して欲しいと思っています。特に改行はいくつか種類があるので、どの種類の改行かを意識する必要があります。で、「改行を表示しよう」と思って設定を探し回り、ぜんぜん見つからず、確か表示できたはずなのにと悩む、ということを私は過去に何回か繰り返していました。


設定は「空白文字の表示」


「改行を表示しよう」と思って設定を探しているから見つからないのです。Trados の UI は、広い心をもって、しかし細心の注意を払って見なければいけません。


70_3.png



設定は、[ファイル] > [オプション] > [エディタ] の [空白文字の表示] です。「空白文字」とありますが、このチェックボックスで改行もタブも表示されるようになります。Word で言えば「編集記号」ですね。チェックボックスが 1 つなので、Word のようにどの編集記号を表示するかを個別に設定することはできません。改行を表示したければ、空白も表示するしかありません。


ショートカット キーを設定できる


空白の表示はうるさく感じることもあるので、私はショートカット キーを設定して、切り替えながら作業しています。ショートカット キーの設定は、[ファイル] > [オプション] > [ショートカット キー] > [エディタ] の [空白文字の表示] で行います。私は以下のように設定していますが、任意のキーを設定できます。


70_4.png



リボンからも切り替えられる


私自身はリボンを使うことはあまりありませんが、リボンのボタンからも表示を切り替えられます。[ホーム] > [書式] の ¶ (段落記号) のアイコンです。ここでの表現は、空白文字ではありません。さすがに、空白文字はアイコンにしにくかったのでしょう。


70_5.png


改行の種類は原文と同じにする


リボンのアイコンは ¶ ですが、実は、Trados のエディタで ¶ を入力することはできません。分節内で改行を入力したいときは Shift+Enter を押しますが、これで入力できるのは、普通の ↵ (リターン) です。

私が試した限り、↓ (ライン フィード?) や ¶ (段落記号) をキーボードから入力することはできませんでした。これらの改行を使いたいときは、原文からコピーします。改行の種類は、原文と同じにするのが大原則だと私は考えているので、原文からコピーして入力できれば、キーボードから入力できなくても特に問題はありません。

正直に言うと、それぞれの改行が Trados でどのように訳文生成されるのかはよくわかりません。また、Trados 以外の変換やコピー&ペーストでどうなるのかもよくわかりません。たとえば、自分は Trados 上で Word ファイルを訳していると思っていても、本当の元原稿は PowerPoint だったとか、最終的には HTML ファイルに変換されるものだったとか、訳文生成された後に実は Excel ファイルに訳文がコピー&ペーストされたとか、そんなことがないとは言い切れません。いろいろな可能性を考えるときりがないので、改行の種類は原文のとおりにしておくのが最も安全です。


今回は以上です。「空白文字の表示」で改行が表示されるということを理解するまでに、私は数年かかりました。まあ、改行もタブも、見た目は空白ですよね。そうなんですが、その考え方になかなか至りませんでした。

 



  




2020年09月30日

コメントに表示される名前の変更

前回の記事で「8 月ももう終わりです」と書きましたが、今回は 9 月がもう終わりです。最近 Trados を使っていないとか、ネタがなくなってきたとか、なんかもう疲れたとか、決してそういうことではないんです。頑張って Trados さんを応援していきます。


  コメントに表示される名前を変更したい
  https://community.sdl.com/product-groups/translationproductivity/f/studio/30951/thread

コミュニティにこんな投稿がありました。Trados では、Word と同じように、エディタ上でコメントを付けられますが、このコメントの作成者として記録されるユーザー名を設定で変えることができません。問答無用で Windows のユーザー名が使用されます。コメントは、翻訳会社はもちろん、その先のクライアントにも渡る可能性があるので、名前が変えられないとかなり困ります。この動作への対策として、上記の投稿でいくつかアプリ (プラグイン) が紹介されていました。


69-2.png


2020 年 9 月 30 日現在、上図のようなプラグインがあります (一部、バージョン 2019 以上でしか使えないものがあります)。右上の大きな顔の 2 つのプラグインは「Free」となっていますが、複数ファイルの一括処理には有料ライセンスが必要になります。今回は、左下の SDL Batch Anonymizer を試してみました。

このプラグインをインストールすると、[一括タスク] に [SDL Batch Anonymizer] というタスクが追加されます。複数のファイルを選択してこのタスクを実行すれば、一気に処理を行えます。タスクを開始すると、以下のような画面が表示されるので、変更後のユーザー名などを設定します。


SDL Batch Anonymizer の設定画面
69-1.png


細かい検証はしていないのですが、ざっと試したところ、大部分がうまく変更されました。

Created byLast modified by
これは、メモリ (.sdltm) に記録されるユーザー名ではなく、バイリンガル ファイル (.sdlxliff) に記録されるユーザー名を意味しているようです。エディタの [翻訳結果] ウィンドウに表示されるユーザー名はメモリに記録されているユーザー名なので、このプラグインで変更を行ってもエディタに表示されるユーザー名は変わりません。メモリに記録されるユーザー名については、こちらの記事「Trados で使われるユーザー名」も参考にしてください。

また、Created byLast modified by の 2 つを変更しても、バイリンガル ファイルから変更前のユーザー名が完全に消えるわけではありません。バイリンガル ファイルにはいろいろな情報が記録されているようで、変更前のユーザー名がいくつか残っていました。


Comment author
これが、上記のコミュニティの投稿で質問されていた「コメントに表示される名前」です。これは、私が試した限り、問題なくすべて変更されていました。


Tracked changes
変更履歴に記録されるユーザー名です。コメントと同様、Trados では自由に設定することができず、Windows のユーザー名になってしまいます。このプラグインを使ったところ、ほとんどの履歴のユーザー名が変更されました。ただ、一部変更されずに残るものがありました (この辺りの詳細は、また後日に調べたいと思います)。


Resource origins
こちらは試していません。おそらく、機械翻訳を使った痕跡を消そうという趣旨の機能です。まあ、機械翻訳を使ってみたくなることはありますが、禁止されている場合は使わない方が安全です。実は、このプラグイン以外にも、機械翻訳の痕跡を消す機能を提供するプラグインやアプリはいくつかあります。でも、Trados 自体の動きもよくわからないのに、プラグインの動きなんてとても把握できません。何がどこでばれるかわからないので、ルールには従っておきましょう。


Delete settings
このプラグインの設定自体を削除するようです。バイリンガル ファイル (.sdlxliff) ではなく、プロジェクト設定ファイル (.sdlproj) に残っている設定を削除するようですが、実際にどんなデータが削除されるのか、また削除されないのかは確認していません。


今回は以上です。大まかな検証だけで、未確認のことが多くすみません。今回取り上げた SDL Batch Anonymizer 以外のプラグインも含め、もう少し調べたら記事を追加したいと思います。







  




2020年08月29日

2021 にアップグレードする??

厳しい暑さは続いていますが、8 月ももう終わりです。コロナウィルスだ、熱中症だ、と心配しながら、お盆には 80 代の父を相手にオンライン帰省にも挑戦し、なかなか大変な夏でした。こんな「特別な夏」のなか、気付けば SDL Trados Studio 2021 がリリースされています。私は、2021 にアップグレードできるライセンスを持っていますが、まだ実際のアップグレードはしていません。いつアップグレードしようかと考え中です。

2021 についての情報は、以下の SDL のページをご参照ください。ページの上部にあるリンクをクリックすると、いろいろな情報が表示されます。

SDL Trados Studio 2021の新機能
68_1.png



といっても、よくある質問のページにはなかなかたどり着けないので、こちらからどうぞ。

よくある質問のページ
68_2.png


2021 にアップグレードすると 2017 は使えなくなる


私は、現在、Freelance ライセンスで 2017 と 2019 を併用しています。2017 からのアップグレードとして 2019 を購入したので、2017 をまだ使うことができています。今回、2021 へのアップグレードをしたら、もしかして、2017、2019、2021 と 3 バージョンを使えるのかしらと虫のいい期待をしていましたが、それはできないそうです。コミュニティで確認したところ、2021 のライセンスで併用できるのは 2019 のみで、2017 は使えなくなるとのことでした。これは心配の種になりそうです。

とはいえ、私自身は、2019 へのアップグレード以降、2017 に戻らなければならなくなったことはありません。翻訳会社さんの中には 2017 を指定してくる会社もありますが、sdlxliff ファイルで作業して、そのファイルを納品するだけなら、バージョンの違いはあまり問題になりません。

でも、Trados さんを甘くみてはだめですよね。きっと。まだまだ不安定そうな 2021 と、まだまだ信用しきれない 2019 だけになってしまうのはちょっと不安です。


補足情報
2019 と 2021 を併用するには、2021 へのアップグレードをする前に、2019 を CU7 (Cumulative Update 7 for SDL Trados Studio 2019 SR2 (Build 15.2.7.2849, released on 7 July 2020)) に更新しておく必要があります。2019 を CU7 に更新してからいったんディアクティベーションし、その後で 2021 をアクティベーションすると 2019 も使えるようになる、ということらしいです。(すみません、実際には試してません。)


SDL Trados Live Essential の無料期間はアップグレード時に開始する


2021 の目玉は、おそらくクラウド サービスの SDL Trados Live Essential ですよね。私は、自宅でしか作業しないし、Windows パソコンだし、スマホ世代でもないし、という感じで特に必要ではないのですが、無料で使えるなら使ってみたいと思っています。

2021 のライセンスには 12 か月の無料サブスクリプションが付属しています。このため、12 か月は無料で使えるはずですが、ここで疑問に思ったのが、無料期間の開始はいつなのかです。ウェブサイトには「ライセンス購入日から 12 か月間」と記述されていますが、私が 2021 へのアップグレード権付きライセンスを購入したのは、2021 がリリースされる以前の 5 月です。さすがにそれで「購入日」ということはないだろうと思い、SDL さんに確認したところ、無料期間が開始するのは、ライセンスを「アップグレードした日」だそうです。

実際に SDL Trados Live Essential にアクセスしたかどうかにかかわらず、ウェブサイト上でライセンスをアップグレードした時点から無料期間は消費されていくとのことでしたので、アップグレードしたらすぐに使い始めるのがよさそうです。


補足情報
無料期間の終了後は、年間 75 ユーロになります。ちょっと高いでしょうか。Trados 本体のサブスクリプションは年間 40,000 円で、これには Trados Live Essential の料金も含まれるそうです。ただ、私はアップグレード ライセンスを購入してしまっているので、しばらくはサブスクリプションという選択肢はありません。12 か月、考えてみますかねぇ。


アプリやプラグインの対応が早い


今回はアプリとプラグインの対応がとても早いです。前回の 2019 のときは、なかなか対応がされず、そのために私はアップグレードを遅らせていたのですが、今回は、私が使っているアプリやプラグインはもうほとんどが対応済みです。

2020 年 8 月 28 日現在、こんな感じです。

・対応済み

 Comment View Plugin (コメントのエクスポート)

 SegmentSearcher (検索結果を別画面で一覧表示)

 Regex Match AutoSuggest Provider (AutoSuggest の拡張機能)

 Glossary Converter (用語ベースのさまざまな変換)
  ただ、現在は、「temporarily removed from the appstore」となっています。

 Export to Excel (sdlxliff を Excel 形式でエクスポート)

 File type definition for TMX (ファイルの種類: TMX メモリ用)

 MXLIFF File Type (ファイルの種類: Memsource 用)

 Community Advanced Display Filter (さらに高度な表示フィルタ)
  このプラグインは、2021 では Trados 本体に組み込まれているはずです。


・未対応

 SDLTMExport (sdltm メモリを tmx 形式でエクスポート)
  このアプリは未対応ですが、同様の機能を提供してくれるアプリは他にもありそうな気がします。

 PackageReader (パッケージの中身を一覧表示)
  正式なサポートは 2015 までですが、今も使えているので、おそらく大丈夫だと思っています。


補足情報
私はまだアップグレードをしていないので、それぞれの動作は実際には確認していません。上記は、あくまで AppStore に表示されている情報です。あしからず。


トライアル版はまだダウンロードできない


2021 のトライアル版はまだダウンロードできません。以下のページで登録をしておくと、ダウンロードできるようになったときに通知がくるようです。

トライアル版のダウンロード
68_3.png


私は、ライセンスは持っているのでトライアル版は必要ないのですが、それでもトライアル版があるなら使いたいと思っています。なぜなら、それは私のライセンスが Freelance だからです。今回のトライアル版がどうなるかはわかりませんが、これまでのトライアル版では、Professional の機能を使うことができました。たとえ 30 日間でも、Professional を使いたいのです。

Professional を使って何をしたいのかというと、一括タスクのカスタマイズです。一括タスクとは、ファイルを追加してから、翻訳ファイルに変換して、訳文言語にコピーして...といったタスクです。Professional ではこうしたタスクの組み合わせをカスタマイズして保存しておけます。Freelance では機能制限のためにこのカスタマズができませんが、トライアル版の Professional を使ってタスクをカスタマイズしておけば、30 日後に Freelance に戻っても、カスタマイズしたタスクはそのまま残っています。なので、トライアル期間のうちにタスクをカスタマイズしたいと思っています。


補足情報
私は、自分のアカウントで SDL のサイトにログインすれば 2021 のプログラムをダウンロードすることはできます。インストールだけしてアクティベーションをしなければ、トライアル版として機能するのでは? と予想しているのですが、どうでしょう。もう少し先になりそうですが、試してみたいと思います。


今回は以上です。翻訳会社さんはすぐには 2021 にアップグレードしないだろうから、しばらく待つ方が賢明な気はしますが、Live は使ってみたいとも思います。でも、やっぱりもう少し待とうかなぁ。






2020年08月05日

重複している用語の削除

先日の Trados 質問会ウェビナーからあっという間に 1 か月以上がたってしまいました。まだ在宅勤務が続いている私ですが、なぜか通勤していた頃より忙しく、時間はどんどん流れていきます。

この質問会の中で、用語ベースに関して「重複している用語を削除できないか」という質問がありました。私はいつも Glossary Converter を使って削除しているので、Trados 自体で削除できるならその方法をぜひ知りたいと思ったのですが、残念ながら、Trados には一括で削除する方法はないとのことでした。

最適化やフィルタの機能もチラッと紹介されていましたが、私が試したところでは、どちらを使っても重複している用語を削除することはできなそうでした。今回の記事では、この最適化とフィルタについてと、Glossary Converter を使って重複を削除する方法を紹介したいと思います。


なぜ、重複している用語を削除したいのか


質問会では個々の質問が 1 文程度で紹介されるだけなので、質問者の詳しい状況や背景は想像するしかありませんが、私が削除したいと思う理由は、用語認識ウィンドウが以下のようになってしまうからです。

    56_7.gif


この画像は以前の記事 用語ベースが巨大すぎる! で紹介したものです。こんな感じに認識されてもまったく役立ちません。表示の設定に「同じ用語は 1 回だけ表示する」というようなオプションでもあればいいのですが、そのようなものはなさそうなので、じゃあ、用語ベースのデータを物理的に削除しちゃおう、ということになります。

翻訳会社さんから提供される用語ベースには、本当の意味での用語が登録されている以外に、UI の文言が登録されていることがあります。ウィンドウ名やボタン名、エラー メッセージなどが「用語」として登録されてきます。重複が多くなるのは、こうした UI の用語ベースです。バージョンが違うとか、コンテキストが違うとか、いろいろ理由はあるでしょうが、重複が多すぎて用語認識できないのでは用語ベースを使う意味がありません。用語認識機能に 100% 頼ることはしませんが、自動で認識してくれる機能はやはり便利なので、使えるものならうまく使いたいと思っています。


最適化


SDL MultiTerm には「最適化」という機能があります。用語が認識されてこないなど何かおかしいときに最適化をすると問題が解決されることがあります。パッケージに設定されてきた用語ベースでも、「最適化してください」とメッセージが表示されることがあります。どのような処理が行われるのかはわかりませんが、最適化するように促されたら私は素直に最適化しています。私の経験からすると、この処理が失敗することはまずありません。対象の用語ベースを開いて、左下の [用語ベース管理] をクリックします。リボンに [最適化] ボタンが表示されるので、それをクリックするとウィザードが始まります。


67_1.gif


ただ、私が試した限り、最適化をしても重複している用語は削除されませんでした。たぶん、エントリ数は変わらないと思います。巨大な用語ベースだと何か違うかもしれませんが、通常は、この機能で重複を削除することはできなそうです。


フィルタ: Source contains synonyms


SDL MultiTerm には「Source contains synonyms」というフィルタが最初から用意されています。一見役立ちそうな名前のフィルタですが、これを使っても重複している用語を抽出することはできません。


67_2.gif


Source contains synonyms を使うと、ソース言語に複数の用語が存在するエントリを抽出できます。上図では、英語から日本語を検索しているのでソース言語は英語です。このため、英語が複数あるエントリが表示されます。検索を反転させて日本語から英語にすると、ソース言語は日本語に変わります。こうなると、上図のエントリの日本語は 1 つなので、今度は表示されないことになります。

このフィルタは一括削除をするときなどにも使用できますが、私が削除したい「重複している用語」とは違います。上図のように、1 対多のエントリとしてまとまっているのであれば、削除する必要はありません。逆に、synonym が削除されては困ります。実は、上図のエントリは、Glossary Converter を使ってマージを行った結果のデータです。このように 1 対多のエントリにまとめながら、重複を削除する方法を次に説明します。


Glossary Converter でマージする


Glossary Converter のマージ機能は、複数の用語を 1 つのエントリにまとめる機能ですが、これを使えば重複している用語をきれいに削除できます。この機能については、以前の記事 【後編】マイクロソフトの用語集を使いたい でも紹介しました。


67_3.gif



Glossary Converter のマージ処理では、基準にする言語を選択できます。どちらの言語を選択しても、両方の言語で用語が重複しているエントリは削除されます。上図では、「保存 - Save」と「保存 - save」のエントリがそれぞれ 2 回登場していますが、マージ後はそれらが 1 回にまとめられています。大文字小文字の違いが無視されないこともポイントです。

Glossary Converter の詳しい操作方法については、以前の記事 【後編】マイクロソフトの用語集を使いたい や、SDL のブログ Glossary Converter - Excelから用語ベースおよびTMXへの変換 を参照してください。

以前の記事のほぼ繰り返しですが、簡単に説明するとこんな感じです。


1. 用語ベース ファイル (.sdltb) が出力されるように設定する
[settings] > [General] タブで、「MultiTerm Termbase」を選択します。

  43_4.PNG


2. マージの設定をする
[settings] > [Merging] タブで、[Merge Files] チェックボックスをオンにします。さらに、基準とするフィールドを入力します。(ここで入力しなかった場合は、実行時にプロンプトで尋ねられます。)


  43_5.PNG


3. [settings] が下図のようになっていることを確認してから、用語ベース ファイル (.sdltb) をドロップする

  43_6.PNG


Glossary Converter のマージはとても使いやすいですが、細かい制御はできません。いろいろな制御が必要な場合は、いったん Excel ファイルに変換して、Excel 上でデータを編集する方が便利です。


今回は、以上です。UI の文言を用語ベースに登録するという手法は、実際によく使われていますし、それなりに機能もします。でも、用語ベースは、そもそも UI のために作られているものではないですよね。UI 用に何かもっと良い手段があればいいのにといつも思いますが、ではどんなものが良いかと聞かれると、具体的にはよくわかりません。何か “革新的” な方法ってないものでしょうか。




  




2020年06月26日

ワンクリックで全選択 ...できてない

昨日、Trados 質問会ウェビナーを視聴しました。今回はいつもより短時間で、さらっと終わってしまった印象でしたが、いくつか有用な情報はありました。なかでも、2019 にアップグレードしたばかりの私にとって重要だったのは、


  ワンクリックですべての分節を選択できる


機能でした。このブログでは紹介するのをすっかり忘れていましたが、2019 バージョンのエディタに導入された最大の新機能はこれでした。


65_1.png


しかし、この機能には落とし穴があります。大きなファイルを開いたときは、最初の方の一部の分節しか選択されません。

エディタで大きなファイルを開いた場合、画面自体はすぐに表示されても、下の方にスクロールしたり、Ctrl+End を押して末尾に移動したりすると、分節が空白になる、画面が動かない、といったことがあると思います。おそらく、ファイルの最初の方の分節だけを読み込んでとりあえず表示し、後ろの方の分節は後から読み込んでいるんだと思います。

この「後ろの方の分節がまだ読み込まれていない状態」で上記の部分をクリックしても、読み込まれている分節が選択されるだけで、後ろの方の分節は選択されません。すべての分節を確実に選択するには、カーソルをファイルの末尾まで移動して、いったんすべてを表示する必要があります。

でも、ワンクリックで全選択したいと思うのは、たいてい、大きなファイルのときです。大きいファイルこそ、末尾まで移動するのが面倒だから。すぐに全選択をすることが無理なら、せめて、クリックした後にしばらく待たせるとか、なんとかならないですかねぇ。何事もなかったように操作できてしまうと、全選択したはずなのになぜ?ってことになります。


今回は、これだけです。この質問会ウェビナーでは、私がもう 1 つ気になった情報として、用語集から重複している用語を削除できる、というものがありました。これについてはちょっと検証してからまた紹介したいと思います。


2020年05月28日

さらに高度な表示フィルタが便利!

先日、SDL Trados Studio を 2017 から 2019 にアップグレードしました。前回の記事は「2019 へのアップグレード」というタイトルだったにもかかわらず、すみません、2019 についてほとんど何も書いていませんでした。2017 のバグがあまりに多く、そればかり気になっていました。今回こそは 2019 について書きたいと思いますが、Trados 本体の新機能としては個人翻訳者に役立つ大きなものが見当たらないので、2019 で使える便利なプラグイン Community Advanced Display Filter を紹介しようと思います。

Community Advanced Display Filter は、SDL のブログでも「さらに高度な表示フィルタ」として紹介されています (プラグインのインストール方法から詳しく解説されているので、参考にしてください)。このプラグインは 2017 でも使えますが、最新の機能は 2019 でしか使えません。また、次期バージョンの 2021 では、このプラグインが標準機能として本体に組み込まれるそうです。現在のようにプラグインとしての提供では別途インストールが必要ですが、本体に装備されればそうした手間もなくなるのでさらに便利になりそうです。


表示フィルタは 3 つある


さて、上記の SDL のブログのタイトルには「さらに高度な表示フィルタ」と少し妙な表現が使われています。これは、「さらに」「高度」ではない表示フィルタが存在するからです。

 @ [レビュー] タブ > 表示フィルタ
 A [表示] タブ > 高度な表示フィルタ
 B [表示] タブ > Community Advanced Display Filter <--- これが「さらに高度な表示フィルタ」

まず、高度ではない普通のフィルタが [レビュー] タブにある「表示フィルタ」です。最も手軽に使えるフィルタで、ステータスなどの条件を 1 つだけ選択するか、検索したい文字列を入力して使用します。これに対して、複数の条件を指定できるなど、少し機能が強化されているフィルタが [表示] タブから表示する「高度な表示フィルタ」です。ここまでの 2 つが現在のところ Trados 本体に組み込まれている機能で、それらとは別にプラグインとして追加する Community Advanced Display Filter が「さらに高度な表示フィルタ」となります。


正直にいって、3 つに分かれている状態はわかりにくいですし、各画面での操作も面倒です。でも、2019 バージョンの Community Advanced Display Filter は少しだけ使い勝手が良くなっています。


右クリックで使える


2019 バージョンの Community Advanced Display Filter の使いやすいところは、右クリックで使える点です。エディタで右クリックをすると、次のようなメニューが表示されます。

64_1.png

4 つのコマンドが用意されていますが、私がよく使用するのは下の 3 つです。Source Filter と Target Filter は、カーソルのある分節の原文全体または訳文全体でフィルタをかけます。つまり、原文または訳文がまったく同じ繰り返しの分節を表示できます。

一番下の Selection Filter は、分節内の選択した文字列でフィルタをかけます。原文と訳文のどちらで選択しても大丈夫です。さらに、原文と訳文の両方で文字列を選択しておくと、両方を条件としてフィルタがかかります。

最近、Memsource を使うことが多かった私は、Memsource のフィルタの便利さにすっかり慣れてしまい、Trados のフィルタにかなりストレスを感じていました。でも、この右クリックのメニューのおかげで Memsource と同じようにワンアクションでフィルタをかけられるようになりました。便利です!


フィルタ表示された分節を蛍光ペンでマークする


2019 バージョンの Community Advanced Display Filter で私が気になっていた機能の 1 つが「Highlight」です。

64_2.png


何か条件を指定してフィルタをかけた後、[Highlight] から色を選択して、表示中の分節に蛍光ペンでマークを付けることができます。[Clear] を選択すると、追加した蛍光ペンをすべて削除できます。


64_3.png


便利そうな機能ですが、実際に使うときはいくつか注意する点があります。


■ ステータスが変わる
蛍光ペンを追加する操作をすると、上図のようにステータスが「翻訳中」になってしまいます。「未翻訳」でも「翻訳済み」でもすべて「翻訳中」に変わります。Trados にとっては、人間が行う普通の編集と同じ認識になるようです。また、[Clear] で削除したときも、「翻訳中」に変わります。


■ エディタの設定で「書式を表示する」
上図のようにエディタ上で蛍光ペンの色を表示するには、エディタの [書式の表示スタイル] で書式を表示するように設定しておく必要があります。

[ファイル] > [オプション] > [エディタ] > [並列型エディタ] から設定します。
64_4.png

3 つのオプションがありますが、一番下の [書式を表示せずにタグを表示する] を選択していると、書式設定のタグが表示されるだけで、上図のような緑色の蛍光ペンの表示にはなりません。蛍光ペンを表示するには、上の 2 つのオプションのどちらかを選択する必要があります (この書式表示の設定については、以前の記事 エディタ上のフォントを変える でも少し説明しています)。私のお勧めは [すべての書式とタグを表示する] です。


■ 生成される訳文にタグが挿入される
書式の表示に [すべての書式とタグを表示する] をお勧めするのには理由があります。それは、この蛍光ペンがタグとして訳文に挿入されるからです。この蛍光ペンは、Trados のエディタ上のみのマーキングではなく、通常の書式と同じようにタグとして訳文に挿入され、生成される訳文にも蛍光ペンの書式が反映されます。

64_5.png

タグの内容を表示してみるとわかりますが、<cfhighlight> という書式タグが挿入されています。これは、Word で使われる蛍光ペンのタグです。このため、このまま訳文生成をすれば蛍光ペン付きの状態で訳文が生成されます。蛍光ペン付きの訳文を生成できるのは便利な場合もありますが、実は少し注意が必要です。


■ Word ファイル以外は要注意

Office 文書の場合、Word には蛍光ペンの機能がありますが、Excel や PowerPoint にはその機能がありません (PowerPoint の一部のバージョンにはあるようですが)。そのため、Word 以外のファイルに <cfhighlight> を挿入しても無視されてしまいます。また、無視されるだけならいいのですが、場合によっては、エラーになり訳文生成ができなくなることもあります。

HTML や XML など、ほかの形式の場合も同様で、<cfhighlight> タグを挿入しても、生成される訳文に蛍光ペンが表示されるわけではありません。エディタ上で蛍光ペンを残しておくと訳文に余計なタグが入ることになるので、訳文生成をする前に蛍光ペンはすべて削除した方がよさそうです。


表示フィルタだけでなく、検索やジャンプも強化して欲しい


Community Advanced Display Filter はとても便利です。便利ですが、そもそも表示フィルタって使いにくいですよね?? フィルタをかけて分節を非表示にすると、翻訳対象の前後の分節が見えなくなり作業しにくいことがよくあります。ツールを使っていると文脈を見失いがちとか、パッチワーク翻訳はだめとか、さんざん言われているのに、なぜ表示フィルタだけの強化なんだろうと疑問です。

タグの中身を検索する機能は、昔のように検索機能の中にあって欲しいし、ロックされている分節を飛ばしてジャンプしてくれる機能も欲しいところです。非表示にしないで、表示したままでジャンプして欲しいんです。非表示にしちゃおうっというのは、どちらかといえばコーディネーターさんの発想のような気がします。一括でロックをかけたいとか、特定の条件でワード数をカウントしたいとか、そんな用途じゃないかと思います。分節をひとつひとつ作業していく翻訳者としては、検索機能とジャンプ機能の充実も期待しています。


今回は以上です。先日、SDL のオンライン ロードショーに参加しましたが、今回の内容は主に企業向けの感じがしました。前回は翻訳者向けだった気がするのでバランスを取っているのかもしれないですが、今後も、翻訳者の存在が忘れられないよう、ほそぼそとでも声をあげていきたいなあと思っています。




  



2020年05月10日

2019 へのアップグレード

最近、ようやく自粛解除の話が聞かれるようになりました。でも、いざ解除と言われるとそれはそれで心配になり、かといってこのまま自粛を続けるわけにもいかず、気持ちが揺れっぱなしの毎日です。

そんな中、今頃になって 2019 にアップグレードしました。もう少し 2017 を使い続けようと思っていたのですが、2021 登場のニュースを聞いて、ついに買ってしまいました。実は、いろいろとバグが多くて困っていたところでした。



まず、去年に

  パッケージが開けない
    (コミュニティ: Studio2017をアップデート後、返却パッケージが開けない)

という問題がありました。これは致命的でした。この問題を解決するために、2017 は CU18 に更新する必要がありました。



で、その更新が原因かはわからないのですが、

  メモリに登録した訳文がすぐにはヒットしてこない
    (コミュニティ: TMに登録した訳文が表示されないことがあります)

という問題が発生していました。メモリに登録した訳文がヒットしてこないことがたまにあり、おかしいなぁと思っていました。でも、しばらく (おそらく 2、3分) するとヒットしてくるようになるので、自分の勘違いかとも考えていました。(ただ、この問題は、上記のコミュニティの投稿によると、2019 でも発生するようなので、2019 にアップグレードしたからといって解消されるわけではなさそうです。)



で、次の問題は

  複数ファイルを開いてコメントを挿入すると、上書き保存できなくなる
    (コミュニティ: Cannot save multiple files in Editor (Studio 2017 CU18))

でした。これも私にとっては致命的でした。小さいファイルが数十個含まれているプロジェクトを作業していて、複数ファイルをまとめて開くことは当たり前になっていました。そのようなプロジェクトで翻訳会社への申し送り事項を記録するときに便利なのがコメント機能と Comment View Plugin です。作業中は Trados 上でコメントを付けておき、最後に Comment View Plugin を使ってコメントを Excel ファイルに出力して、翻訳会社への申し送りとします。

ところが、複数ファイルを開いて作業し、コメントを追加して、いざ上書き保存をしようとすると、おなじみのエラー「オブジェクト参照がオブジェクト インスタンスに設定されていません」になってしまいます。

  63_1.png

結局、コメントをいったん削除しないとファイルを上書き保存できませんでした。Comment View Plugin が悪いのかと思ってプラグインを無効化してみたり、SDL Freshstart を使って設定をリセットしてみたりと、いろいろ試してみましたがだめでした。上記のコミュニティの投稿によると、この問題は CU18 のバグのようです。



で、設定をリセットした後で見つけたのが

  AutoText が使えない
    (ナレッジベース: "Failed to create setting page" error in SDL Studio 2017 CU18 when selecting AutoText)

という問題です。SDL Freshstart を使って設定をリセットすると、この AutoText やショートカットキーの設定が消えてしまうことがあります。なので、リセットをした後で、AutoText の設定を確かめようと思って開いたら、こんな画面になっていました。

63_2.png

SDL Freshstart を使った後でしたし、バックアップのために設定ファイルの名前を手動で変更するなどの操作もしていました。ああ、これはもう設定ファイルの何かを壊してしまったんだなぁと思い、完全な再インストールまでしてしまいました。が、結局、問題は解決されませんでした。これも、上記のナレッジベースにあるように、CU18 のバグのようです。



で、どうしようかと悩んでいたところに、今 2019 にアップグレードすれば 2021 のリリース時に無償でアップグレードできるというメールが届き、もうアップグレードするしかないのかなぁと思い、今回の決断に至ったわけです。

なんか負けた気がしないでもないですが、新しいバージョンに期待するしかなさそうです。Trados さん、ホントに頑張って!!




  


2020年04月29日

正規表現なしで、検証機能を使う

先日、ステイホーム週間なるものが始まりましたが、皆さま無事に過ごしていらっしゃいますでしょうか。私は、以前から在宅での仕事が多く、平日の 5 日間まったく外出しないこともそれほど珍しくない生活ではあったのですが、それでも、外出してはいけないと言われる続けるこの厳しい状況は、なんとか早く終わって欲しいと願っています。

今のところは、ただただ、淡々と、黙々と、自分にできることを続ける以外になさそうなので、またまた Trados さんの重箱のスミをつついていこうと思います。今回は、検証機能です。

検証機能では、正規表現を知っているとできることがとても多くなります。でも、私はこの正規表現がどうも苦手です。そこで今回は、正規表現なしでもここまでできる!というところを紹介してみたいと思います。


設定を変える前に


Trados の検証機能には、QA Checker、タグ検証機能、用語検証機能の 3 つがあります。これらの概要については、以前の記事 検証機能の設定を調整する も参照してください。


設定の変更は [プロジェクトの設定] > [検証] から

プロジェクトを作成した後、またはパッケージを開いた後で設定を変えたい場合は、[プロジェクトの設定] > [検証] に移動します。[ファイル] > [オプション] > [検証] ではないので注意してください。この 2 つの設定の違いについては、以前の記事 Trados の設定を変えるには − [ファイル] と [プロジェクトの設定] を参照してください。


既存の設定をエクスポートして保存しておく

検証の設定は、翻訳会社さんがパッケージに設定してきていることがあります。納品時に検証結果のログも一緒に納品するように求められることがあるので、既存の設定に自分で手を加える前に、設定をエクスポートしてファイルとして保存しておきます。エクスポートしておけば、自分でいろいろ設定を変えても、エクスポートしておいたファイルをインポートすることで元の状態に戻せます。エクスポートとインポートは、[QA Checker のプロファイル] から行います。

エクスポートして設定ファイルを保存したら、あとは自由にいろいろ試してみましょう。


分節の検証 ― 禁止文字がないかチェックする


私は、この禁止文字のチェックが、最も簡単で、最も役立つのではないかと思っています。UI はなんだかよくわからない表示になっていますが、チェックボックスをオンにして、右側のテキストボックスに禁止したい文字をずらずらと入力すれば OK です。


62_1.png


禁止する文字は、スタイルガイドに従って、全角の英数字、各種の括弧、コロン、引用符などなどです。入力が面倒だったら、以下をコピペしてください。こんなにたくさん入力してもまったく問題なく機能します。括弧やコロンなど、スタイルガイドによって変わる文字は、先頭の方に入力しておき、そのたびに書き換えて使うと便利です。


():“”ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz1234567890あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをんアイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンーがぎぐげござじずぜぞたぢづでどばびぶべぼザジズゼソタヂヅデドバビブベボぱぴぷぺぽパピプペポぁぃぅぇぉっァィゥェォッ


正規表現を使っても同じチェックをできますが、禁止文字として設定した方がエラーがわかりやすく安全です。正規表現でのチェックは、いろいろな設定ができるだけにエラーが多くなり、誤検知も多くなりがちです。そうなると、エラーとして検出されても見落とす危険が出てきます。絶対に禁止とわかっている文字には、この禁止文字のチェックの方がお勧めです。


句読点 − 余分なピリオドとスペース


英訳のときは、連続するスペースのチェックが欠かせませんが、こうした一般的なチェックはある程度用意されています。


62_2.png


[句読点] には、上図のようにいろいろ便利そうな設定があります。が、便利そうなだけで、[余分なピリオドとスペース] 以外の設定は、日本語と英語の組み合わせのときはあまり役立ちません (あくまで、個人的感想です)。特に、[括弧のチェック] は、説明を見るといかにも便利そうですが、この説明のとおりには機能してくれません。このチェックは、原文と訳文に同じ種類の括弧があるかを確認しているようで、たとえば、原文は全角の括弧、訳文は半角の括弧としただけでもエラーになるので、閉じ括弧がないといったケースを見つけるのにはあまり役立ちません。
  

単語リスト


名前のとおり、チェックしたい単語をリストアップしてチェックします。正しくない単語と、正しい単語を入力するだけなので、とてもわかりやすくて簡単です。スタイルガイドで、「例えば」と漢字ではなく「たとえば」とひらがな書きにするという指示がある場合などに使うと便利です。


62_3.png


長音のチェックには限界がある

単語リストの問題点としてよく挙げられるのが長音のチェックです。単語リストは、シンプルに単語を検出するだけなので、「サーバ」が正しくなくて、「サーバー」が正しいというケースには対応できません。正しくない単語の「サーバ」が、正しい単語の「サーバー」の中に含まれているので、「サーバー」と正しくなっていてもエラーとして検出されます。

下部に [単語単位で検索する] というチェックボックスもありますが、これは日本語の場合にはあまり適切に機能しません。「サーバ」を検出したい場合は、正規表現を使うしかなさそうです。(具体的な正規表現については、こちらの記事 オンライン質問会から (2019年12月) を参照してください。)


すみません、エスケープ文字だけは使います

この単語リストですが、実は、入力には正規表現を使う必要があります。どこにもそんなことは書いてないですし、「正規表現」というチェックは別に独立してあるのですが、なぜか単語リストでも正規表現を使う必要があります。といっても、それほど心配する必要はありません。「サーバー」や「たとえば」など、普通の文字から成る単語を入力するときは何も意識しなくて大丈夫です。注意が必要になるのは、半角の丸括弧、ピリオド、疑問符など、正規表現に使われる記号を含む場合だけです。

たとえば、以下のように設定したとします。

  正しくない語形: (ファイル)
  正しい語形: ファイル

(ファイル) と丸括弧付きの表記は正しくなく、ファイル と括弧なしが正しいとします。しかし、上記のように入力すると、(ファイル) の丸括弧は正規表現の記号として解釈されるので、実際に丸括弧付きの (ファイル) をエラーとして検出することはできません。この丸括弧を、正規表現ではなく、文字そのものとして認識させたいときに使うのが、エスケープ文字と呼ばれる円マーク \ です。


  記号っぽいものの前には、円マーク \ を付ける


ルールはこれだけです。丸括弧、疑問符、アスタリスクなど、正規表現に使われそうな記号の前には円マーク \ を付けておきます。これを付けると、その記号は、正規表現の式ではなく、文字そのものとして解釈されます。

  \(ファイル\) --> (ファイル) という丸括弧付きの単語が検出される
  \\n --> 改行マークではなく、\n という文字そのものが検出される

私は、正規表現なんて見たくもない!と思っている人間ですが、このエスケープ文字だけは使わざるを得ません。今回の記事は、正規表現を使わずになんとか頑張るという趣旨ではありますが、すみません、エスケープ文字だけは使ってください。


正規表現


では、いよいよ「正規表現」です。正規表現と名付けられていますが、実は、正規表現を使わないチェックも可能です。前述の単語リストのように、普通の文字から成る単語を検出するだけなら、正規表現は不要です (すみません、ここでも、エスケープ文字は必要です)。「正規表現」は、「単語リスト」よりいろいろな設定ができるので、より複雑なチェックが可能です。

62_4.png



上図のように、[条件] ドロップダウンにいろいろな条件が最初から用意されています。[原文正規表現] と [訳文正規表現] のそれぞれに原文と訳文で検出したい語句を普通に入力して、あとは適切な条件を選べば、設定は完了です。


原文と訳文の正規表現パターンが一致した場合に報告する

この条件は、単語の見間違いの検出に使えます。たとえば、virtually と vertically は似てますよね。私は、うっかり見間違えてしまったことがあるので、以下のように設定しています。

  原文正規表現: vertically
  訳文正規表現: 仮想
  条件: 原文と訳文の正規表現パターンが一致した場合に報告する

これで、原文に vertically があるのに、訳文には 仮想 が含まれている分節がエラーになります。これでも心配な場合は、条件を [原文が一致する場合に報告する (原文チェックのみ)] に変更します。こうすれば、原文に vertically が含まれる分節を、訳文がなんであろうと関係なく、すべて検出できます。検出されたら、あとは 1 つ 1 つ確認していきます。vertically なんてめったに出てこない、という文書だったら、モレなく検出できるこの条件の方が安全です。


原文と訳文の両方に一致するが、一致回数が異なる場合に報告する

原文と訳文で、語句の登場回数をチェックしてくれます。たとえば、注釈のアスタリスクの個数がだんだん増えていく、というような表記が使われているときに便利です。(アスタリスクを検出したい場合は、下記のようにエスケープ文字の円マークを付けます。)

  原文正規表現: \*
  訳文正規表現: \*
  条件: 原文と訳文の両方に一致するが、一致回数が異なる場合に報告する


62_5.png


上図のように設定すると、以下のような結果になります。


62_6.png


1 行目は、アスタリスクが原文に 1 個、訳文にも 1 個なので、エラーではありません。2 行目は、原文には 2 個ですが、訳文には 1 個なので、エラーになります。3 行目のようにたくさんあって数えるのが面倒なときは特に便利です。

さて、ここで条件の文言をもう一度よく読んでみます。もう既に気付いている方もいらっしゃると思いますが、「原文と訳文の両方に一致するが」となっているので、両方に一致しないケースはこの条件では検出できません。つまり、訳文にアスタリスクが 1 個もない分節はエラーになりません。


62_7.png


上図の 2 行目ように、アスタリスクを入力し忘れてしまってもエラーにはなりません。これを検出するには、[原文と訳文の両方に一致するが〜] の条件とは別に [原文は一致するが訳文は一致しない場合に報告する] という条件を使う必要があります。


今回は以上です。正規表現を知らなくても、結構いろいろできます。翻訳会社さんからもらうパッケージには検証の設定が含まれていることがあるので、そうした設定を参考にいろいろ試してみるのもいいかと思います。





  


2020年03月31日

「単語単位のトークン化」は単語数を数えるだけ

新型コロナウイルスの感染拡大が続いていますが、皆さま影響はありますでしょうか。幸いにも私は仕事を続けています。オンサイトの仕事でしたが、周囲の方のご尽力により在宅勤務にしてもらい、仕事量も今のところは変わっていません。これからどうなるかは不安ですが、ひとまずは目の前の仕事に努めたいと思っています。


前回の記事で私がかなり混乱していた「単語単位のトークン化」ですが、コミュニティで質問させてもらったり、SDL のブログを読み直したりして、なんとなく理解できました。参考にした SDL の記事は、「翻訳メモリの互換性 SDL Trados Studio 2019 / 2017 / 2015」と「Trados Studio 2019 – 進歩した日本語原文の解析」です。


32-10.png


結論としては、すみません、upLIFT がどうとか、マッチ率がどうかいうのは、ほぼ私の勘違いでした。簡単にまとめると、こんな感じです。


・単語単位のトークン化は単語数を数えるための機能

・普段この機能を使うことはないので、デフォルトのまま無効にしておけばよい



「単語単位のトークン化」は、日本語の原文について、文字数ではなく、単語数を知りたいときにのみ使う機能だそうです。「単語数」が何を意味するのかは後述しますが、原文が日本語のときに単語数が必要になることはほぼないので、実はこの機能を使用する機会もほぼありません。私はいろいろと疑って考えてしまって、この機能が upLIFT の動作に影響するのではないか、マッチ率の計算が翻訳者にとって不利になるのではないか、などと心配していましたがそうしたことはなさそうです。


日本語の単語数


単語単位のトークン化と単語数については、上記に挙げたブログの「Trados Studio 2019 – 進歩した日本語原文の解析」に説明されています。最初からこの記事を素直な気持ちで読んでいれば、こんなに混乱することはなかったと思います。が、すみません、ついつい長年の習慣で、Trados さんの情報には何か別の意味がありそうとか、文字どおりの意味のはずがないとか、そんな気持ちで私はこの記事を読んでしまいました。

例として、「WAFの役割」という日本語の単語数を考えてみます。この日本語のカウントは、以下のようになります。

  @ 単語単位のトークン化を使用しない場合 --> 4 単語
  A 単語単位のトークン化を使用する場合 --> 3 単語

@ の場合、「WAF」という英文字のかたまりは 1 単語と数え、それ以外は文字をそのまま数えます。Word の「単語数」と同じカウント方法です。これに対し、単語単位のトークン化を使用する A の場合は、「WAF」、「」、「役割」で 3 単語となります。

日本語が原文の場合、料金はたいてい単語ベースではなく文字ベースです。なので、単語単位のトークン化を使用する、しないの以前に、「単語数」自体にあまり意味がありません。

私がそれでも「単語数」をちょっと気にしていたのは、過去に、@ の単語数に対して通常の文字単価を適用されたケースがあったからです。これには、さすがに強く抗議しました。文字単価は単語単価より低いことが多いので、たとえ英単語でも「WAF」という 1 単語を 1 文字のお値段で訳すことはできません。英単語をそのまま使うとしても、訳文には「WAF」と 3 文字を入力しますし、そもそもその前に「WAF」とはどういう意味なのか、英語として使っていいのか、とちゃんと翻訳作業をしています。


翻訳メモリの互換性 ― 2015 と 2017 SR1 での解析結果の差異


私が「単語単位のトークン化」の設定にここまでこだわってしまったのは、上記の「単語数」が気になっていたこととは別に、2015 から 2017 SR1 になってあいまい一致のマッチ率がずいぶん上がっているような気がしていたからです。「マッチ率が上がる」ということは、つまり「翻訳料金が下がる」ということであり、特に、あいまい一致に費やす作業量はそれなりに大きくなることが多いので、翻訳者としてはちょっと困ったなぁと思っていました。こんな偏った翻訳者目線で考えていたことが、今回の混乱の原因です。すみません。

2015 と 2017 SR1 での解析結果の差異については、最初に挙げたブログの「翻訳メモリの互換性 SDL Trados Studio 2019 / 2017 / 2015」に詳しく説明されています。解析結果の差異は解消されているようですし、この差異の解消に「単語単位のトークン化」の設定が関係することもないようです。

「単語単位のトークン化」を使用すると解析結果は確かに変わりますが、これは、最初に説明したとおり、単語単位で解析するようになるので結果が変わるということです。繰り返しですが、原文が日本語の場合は文字ベースの料金です。なので、「単語単位のトークン化」は使用せず、そのまま文字ベースで解析するのが適切です。「どっちで解析すればマッチ率が下がるのか?」といった翻訳者目線の損得で考えてはいけませんでした。(すみません、反省します。)


というわけで今回は以上です。「単語単位のトークン化」はデフォルトで使用しない設定です。単語数を数える以外には特に意味のない設定なので、素直にそのまま放っておいてよかったのです。マッチ率を上げたり下げたりできる都合のいい設定なんて、あるわけないですよね。いろいろと混乱させてしまい、失礼しました。




  




2020年03月18日

単語単位のトークン化を使用する

少々、混乱しております。間違った認識をしていたかもしれません。

32-10.png


単語単位のトークン化を使用するかどうかの設定について、ちょっと試したところ、こんな感じでした。


・「使用しない」方がマッチ率は上がる

・解析時だけでなく、作業時の動作にも影響する


えっと、私の認識はまったく逆でした。「単語単位のトークン化」というのは、upLIFT に関係する新しい機能で、これを使用するとマッチ率が上がると思っていました。

さらに、この設定は解析結果を以前のバージョンと同じ文字ベースの数字にするためだけに存在しているもので、実際のエディタでの作業には影響しないと思っていました。が、実際にこの設定を変えてみると、エディタでヒットしてくるメモリが変わりました。しかも、「使用しない」方がたくさんのメモリがヒットしてきます。(作業時には影響しない、というのは SDL さんにも確認したつもりだったのですが、何か認識のずれがあったのかもしれません。)

すみません、今回はとりあえず、混乱しているというご報告だけにさせてください。改めて、きちんと確認して記事を書きたいと思います。