Trados さん、頑張って！

2022年12月12日

Visual Studio Code を使ってみよう

Advent Calendar 「翻訳に役立ってくれそうなツール」の記事です。今回は、プログラミングのためのエディター「Visual Studio Code」の紹介です。

Visual Studio Code (VS Code) はマイクロソフトが無償で提供しているテキストエディターで、主にプログラムのソースコードを編集することを目的としたものです。一般的にはプログラミングに使用するものなので複雑な機能が搭載されてはいますが、私は「無料で使えるテキストエディター」と考えてごくごく簡単な用途に使っています。

概要、ダウンロード、インストールなどについては、以下のようなサイトが参考になります。

　・Visual Studio Code – コードエディター | Microsoft Azure
　　公式サイトです。ここからダウンロードできます。

　・【VSCode】インストール／日本語化／基本的な使い方 (senseshare.jp)

　・開発の定番「VSCode」とは？インストールから使い方までを解説 (1/3)|CodeZine（コードジン）
　　まだ、連載の第1回しかありませんが、今後追加されるようです。

　・VSCode | Visual Studio Codeのダウンロードとインストール (javadrive.jp)

インストールと日本語化

VS Code は、上記にも挙げた公式サイトからダウンロードできます。インストーラーが用意されているので、それをダウンロードして、画面の指示に従ってなんとなく進めていけば OK です。特に難しい手順はありません。上記の 2 番目に挙げているサイトの説明がわかりやすいと思います (が、特に参照しなくても普通にインストールできます)。

ただ、単にインストールしただけでは UI が英語です。日本語表示にしたい場合は日本語用の拡張機能を別途インストールする必要があります。これの手順も上記のサイトに説明されていますが、おそらく読まなくても大丈夫です。英語のまま使っていると VS Code からしつこいくらい「日本語にしますか」というプロンプトが表示されてきます。プロンプトが表示されたら、それに従って操作すれば日本語表示にできます。

拡張機能

VS Code で何かしたいときは、たいてい「拡張機能」をインストールします。Trados の「アプリ」のようなものですが、Trados とは比較にならないくらい種類がたくさんあります。ただ、検索もインストールも簡単なので心配は無用です。

左側のメニューから、四角いパズルのようなアイコンをクリックすると拡張機能のパネルが表示されます。このパネルから、検索、インストールとアンインストール、設定など、いろいろな操作が行えます。

では、ここからは私が VS Code をどのように使っているのかを紹介していきます。最初に紹介する AutoHotkey のスクリプト以外は、特にプログラミングとは関係のない用途です。

AutoHotkey のスクリプトを書く

AutoHotkey のスクリプトは普通のテキストエディターで書けますが、VS Code を使った方がコードの色分けやオートコンプリート機能などが使えるので便利です。

私は上記の拡張機能をインストールしていますが、拡張機能はこれ以外にもいくつかあります。拡張子が「.ahk」のファイルを VS Code で開くと「AutoHotkey 用の拡張機能を入れますか」というようなプロンプトが表示されてきます。それに従って適当な拡張機能をインストールします。

Windows の仮想デスクトップを使う

AutoHotkey のスクリプトを書き換えたくなることはよくありますが、スクリプトを書くのはどうしても面倒なのでついつい後回しにしがちです。その対策として、私はよく使うスクリプトファイルを常に VS Code で開きっぱなしにしています。いちいち開く手間がなくなり手軽に更新できるので、後回しにせず小まめに更新するようになります。

とはいえ、翻訳作業をしているときはウィンドウをたくさん開いていてデスクトップは常に一杯の状態です。そこに VS Code まで開くと切り替えの操作などが面倒になります。そこで使うのが Windows の仮想デスクトップ機能です。これは、仮想的にデスクトップ画面を追加して、複数のデスクトップを使えるようにする機能です (詳細については、こちらのサイトが参考になります)。私は、通常の翻訳作業に使っているデスクトップの他に、仮想デスクトップを 1 つ追加し、そこに VS Code を開いています。

デスクトップの追加は、ショートカットキー Windows+Ctrl+D で行います。追加した後の切り替えは、Windows+Ctrl+右矢印/左矢印です。これで、スクリプトの変更が必要になったら、さっと画面を切り替えて編集できます。(といっても、スクリプトを書くのはやっぱりちょっと面倒です。)

Markdown ファイルをプレビューする

最近、Markdown の翻訳を依頼されることがたまにあります。Markdown ファイルは VS Code で開けば簡単にプレビューできます。拡張機能もいくつかありますが、何も入れなくても既定でプレビューできます。(詳しい方法については、＠IT の VS CodeでMarkdownをプレビューするには？：Visual Studio Code TIPS が参考になります。)

拡張子が「.md」のファイルを開くと、エディターの右上に以下のようなアイコンが表示されます。これをクリックするとプレビューが表示されます。

日本語のチェックをする

チェック機能は CAT ツールにも付属していますし、いろいろなツールがあるのでわざわざ VS Code を使う必要はないのですが、たまに違うツールを使うと思わぬ指摘があったりします。私がたまに使っているのは「テキスト校正くん」という拡張機能です。

これは、テキストファイルの日本語をチェックしてくれる拡張機能です。Word ファイルなどをそのままチェックすることはできませんが、Word ファイルのテキストをコピーしてテキストファイル (.txt ファイル) に貼り付ければチェックできます。Trados ならエディターからすべてのテキストをコピーして貼り付ければ OK です。

テキストファイルを開くと、自動でチェックが実行され、エディターの左下にエラー数が表示されます。それをクリックすると [問題] パネルが開き、そこにエラーの詳細が表示されます。

本格的な校正は期待できませんが、「することができます」などの冗長表現のチェックは便利です。たまに使うと、びっくりするほど指摘されることがあり、自分の文章のクセがわかります。

校正ツールとしては、これ以外にも Vale (英語用)、textlint (日本語用) などがあります。が、すみません、記事にするほど理解できていないので、これらについてはまた今度にしたいと思います。もし「使っているよ」という方がいらしたら、ぜひ情報のご共有をお願い致します。

今回は以上です。VS Code のごくごく簡単な活用例を紹介しました。VS Code はプログラミングをまったくしたことのない人にとってはとっつきにくいかもしれませんが、単なる「テキストエディター」と考えれば難しくありません。AutoHotkey のスクリプトも、VS Code で書くと、なんとなくすばらしいスクリプトが書けそうな気がしてきます。雰囲気だけでも気分を高めていきましょう！

タグ：Visual Studio Code VS code AutoHotKey Vale textlint テキスト校正くん Markdown

posted by さくら at 11:39 | Comment(0) | TrackBack(0) | Trados 以外

2022年12月04日

AutoHotkey の簡単な使用例

Advent Calendar 「翻訳に役立ってくれそうなツール」の記事です。今回は、AutoHotkey の紹介です。

AutoHotkey は、スクリプトを書いてキーボードの操作を便利にカスタマイズしよう、というようなことを目的にしているツールです。既にいろいろなところで取り上げられているので、概要や設定方法などについては以下を参考にしてください。

・AutoHotKeyを使ってみよう｜翻訳者の引き出し (honyaku-hikidashi.net)

・AutoHotkeyを導入して、翻訳作業の効率を上げる | Koujou Blog

・AutoHotkeyのつぼの記事一覧 | つぼログ。 | シーブレインスタッフによる技術情報ブログ (c-brains.jp)

検索すると他にもたくさん情報が見つかりますが、私のこの記事では細かいことはすっ飛ばして、現在私が使っているごくごく簡単なスクリプトをそのままお見せしたいと思います。本当にかなり適当なスクリプトなので、もし改善案などありましたらぜひご連絡ください。

Phrase (Memsource) の訳語検索

最近、Memsource から名前が変わった Phrase は、全体的にとてもシンプルなのが特徴ですが、シンプルなだけに設定やオプションが少なく、少し使いにくく感じることもあります。その 1 つが訳語検索です。

訳語検索はショートカットキー Ctrl+k で実行できます。ただし、カーソルが原文側にあるときは原文を検索、訳文側にあるときは訳文を検索するという動作になっていて、これを変更することはできません。翻訳作業中、カーソルは編集をしている訳文側にたいていあるので、カーソルが訳文側にある状態で原文を検索するという操作が最も多くなりますが、これをキーボードだけで行おうとするとなかなか面倒です。

日英翻訳 (ja → en) をしている場合、訳文 (en) 側にカーソルがある状態で Ctrl+k を押すと、上記のように、選択していた語句を訳文 (en) から検索します。(この UI の [原文:] と [訳文:] は、あくまでどこを検索しているかを表しています。翻訳作業自体の原文と訳文ではありません。)

この状態で、原文 (ja) を検索したい場合は、入力フィールドの横にある [<->] をクリックして、再度 [検索] ボタンを押す必要があります。この [<->] を操作するショートカットキーが Phrase には用意されていないので、AutoHotkey の登場となります。

AutoHotkey で行っている操作は、以下のとおりです。

　1. タブを 2 回押して、フォーカスを入力フィールドから [<->] に移動
　2. スペースを押して、[<->] をクリックしたことにする
　3. Shift+タブを押して、フォーカスを [<->] から [検索] ボタンに移動
　4. スペースを押して、[検索] ボタンをクリックしたことにする

スクリプトは、こんな感じです。


SendInput, {Tab 2}    ;タブ 2 回
SendInput, {Space}    ;スペース 
SendInput, +{Tab}     ;Shift+タブ
SendInput, {Space}    ;スペース 

Return

スクリプトは、いたって単純です。私はこれを Ctrl+Alt+k に割り当てています。普通に Ctrl+k を押して訳語検索をした後、Ctrl+Alt+k を押すと、原文と訳文を入れ替えて再度検索ができます。

「キーボード操作じゃなくて、マウスでクリックすればいいんじゃない？」というご指摘はあるかと思いますが、私はマウスを使うと肩がこるので、できるだけキーボードを使いたいのです。ちなみに、Trados と memoQ はもう少し簡単に検索対象を切り替えられます (訳語検索の詳しい方法については、また別記事で取り上げたいと思います)。

URL の言語指定を切り替える

ウェブサイトで英語ページと日本語ページを切り替えたいことはよくあると思います。多言語対応のサイトなら、一般的に URL 内の特定の文字を変換することで切り替えられます。

　

言語指定に使われることが多い文字列は「en-us」や「ja-jp」ですが、これは各サイトによって異なります。すみません、私はその辺りはすべて手動対応で、必要になったものをその都度追加しています。そのため、下記のように、スクリプトが else if でどんどん長くなっていきます (が、ひとまず動いているので OK としています)。


Send, ^c                     
ClipWait 1                  

Sleep, 300

keyword = %clipboard%

; E to J
if InStr(keyword, "en-us") <> 0
{
    StringReplace, keyword, keyword, en-us, ja-jp, All
}
else if InStr(keyword, "hl=en") <> 0
{
    StringReplace, keyword, keyword, hl=en, hl=ja, All
}
; J to E
else if InStr(keyword, "ja-jp") <> 0
{
    StringReplace, keyword, keyword, ja-jp, en-us, All
}
else if InStr(keyword, "hl=ja") <> 0
{
    StringReplace, keyword, keyword, hl=ja, hl=en, All
}

Clipboard := keyword

 Sleep, 300

 Send,  ^v

Return

キーに割り当てるスクリプトを変更する

AutoHotkey の定番の使い方として、括弧で文字を囲む、読点とカンマを置換するといった操作がありますが、日英と英日の両方向で作業をする場合、全角半角の区別や、読点とカンマのどちらからどちらに置換するのかなどを考えると、わりと面倒なことになります。また、英日の単方向だとしてもスタイルガイドによって括弧が半角だったり全角だったりするので、作業のたびに切り替えが必要になります。

私は、同じショートカットキーに対して両方のスクリプトを書いておき、特定の作業を始めるときに、スタイルガイドを確認しながら、コメントを使ってどちらかのスクリプトを有効にするようにしています。

;Hotkey, vk1D & 8, InParentheses_HAN
Hotkey, vk1D & 8, InParentheses_ZEN

;Hotkey, vk1D & [, InSquare_HAN
Hotkey, vk1D & [, InSquare_ZEN

;Hotkey, ^!w, Replace_Ten
Hotkey, ^!w, Replace_Comma

この記事を書きながら考えてみたら、読点とカンマは、いちいち切り替えなくても自動処理できそうな気もしてきました。それは、今後の課題としたいと思います。

今回は以上です。AutoHotkey が初めてという方にはよくわからない内容だったかもしれません (すみません)。ただ、AutoHotkey は、少し時間をかけても習得して使ってみる価値があると思います。ぜひ挑戦してみてください。スクリプトはその辺からのコピペでもわりとちゃんと動きます。大丈夫です。

タグ：Memsource Phrase AutoHotKey

posted by さくら at 22:31 | Comment(0) | TrackBack(0) | Trados 以外

2022年09月30日

繰り返し処理にメモリは不要

しばらく更新が滞っておりました。今回は、繰り返しの処理を詳しく見ていきたいと思います。繰り返される文を自動的に処理することは翻訳メモリの代表的な機能のように思えますが、Trados に限っていえば、繰り返しの処理にメモリは不要です。メモリがなくても、エディタの機能だけで繰り返しは自動処理できます。

自動処理はできるのですが、この「自動」というのがやっかいです。実際に作業をしていると、自分が想定している「自動」と違って戸惑うことがよくあります。今回は、この自動動作に影響を与えている設定をいくつか紹介します。

まず、繰り返し処理の基本的な設定は [ファイル] > [オプション] > [エディタ] > [自動反映] で行います。これについては、以前の記事「CAT ツール比較：繰り返しの自動入力」を参照してください。今回は、これ以外の設定で自動反映の動作に影響を与えるものを主に取り上げます。

メモリは使わないが、メモリの設定は使う

最初に書いたように、繰り返しの自動反映にメモリは不要です。プロジェクトにメモリを 1 つも設定していなくても、以下のように自動反映は行われます。

しかし、メモリがなくても、メモリの設定は使われます。この辺りが Trados のよくわからないところですが、メモリにはいろいろと重要な設定が存在し、それが使われます。

使われる設定は、メモリの [設定] から設定する「言語リソース」と、プロジェクト設定の [翻訳メモリと自動翻訳] から設定する「ペナルティ」です。どちらも、本来はメモリのための設定であり、繰り返しの自動反映のための設定ではありませんが、これらの設定が自動反映の動作に影響を与えます。

言語リソース

では、言語リソースの設定から見ていきます。この設定はメモリに付属するものですが、下図のように、メモリを 1 つも指定していないプロジェクトでは「既定の言語リソース」が使用されます。

プロジェクトにメモリを設定した場合は、そのメモリの [設定] 画面から以下のような設定が可能になります。

今回は、言語リソースの設定のためにダミーのメモリを 1 つ設定しました。おそらく、言語リソースを直接編集することも可能でしょうが、言語リソースをどう編集するのかとか、プロジェクトを作った後に編集してもその変更は反映されるのかとか、パッケージを受け取った場合はどうなるのかとか、いろいろ考えることが多くなりそうなのでダミーのメモリを使うことにしました。ただし、メモリとの 100% 一致が発生すると検証が面倒になるので、今回は [更新] チェックボックスをオフにしてメモリが登録されないようにしています。

さて、言語リソースの設定で注意するのは [次を認識する] です。ここでチェックボックスがオンになっていないと繰り返しの自動反映でも認識がされません。ここに表示されている「日付」「頭字語」「変数」「英数字文字列」の詳細については、Trados のヘルプ「自動置換の例」を参照してください。ただ、その他の項目も含め、自動置換の動作はなかなか複雑でよくわからないことがたくさんあります。本当によくわからないので、すみません、今回は数字と頭字語だけに着目したいと思います。頭字語は、簡単にいうと「大文字の英字のみ」で構成される単語です。

たとえば、[数字] と [頭字語] のチェックボックスをオフにすると、自動反映の結果は以下のようになります。

分節 6 ～ 10 は数字の例です。数字を認識しない設定の場合、分節 6 と 7 はまったく同一なのでそれでも繰り返しと見なされますが、分節 8 ～ 10 は繰り返しになりません。分節 11 ～ 14 は頭字語の例です。これらも頭字語を認識しない設定にしていると、まったく同一でない限り繰り返しになりません。

認識しない設定にすると、むやみに自動反映されることがないので安全にはなりますが、正直にいって不便です。この設定は、繰り返しの自動反映だけでなく、メモリとのマッチや QuickPlace 機能 (ショートカットキーは Ctrl+Alt+下矢印または Ctrl+カンマ) にも影響します。ワード数やマッチ率への影響は要検討ですが、入力時の負荷だけを考えれば、たくさん認識してくれた方が助かります。

というわけで、私はいつもすべてのチェックボックスをオンにして作業しています。しかし、そうしていると繰り返しが無条件に自動反映されてしまうので、それを防ぐための手段は必要です。

少し余談ですが、プロジェクトの [翻訳メモリと自動翻訳] の設定や、メモリの [設定] から行う設定は、反映されるタイミングが実はよくわかりません。[次を認識する] のチェックボックスをオンにしても認識されなかったり、逆に、オフにしているのに認識されたりします。私が何回か試してみた結果としては、設定をした後、エディタでいったんファイルを閉じ、改めて開き直すと設定が反映されるような気がしています。今回の記事を書くためにいろいろ試したのですが、かなり混乱しました。

※※※※※※ 追記 2022/12/14 ※※※※※※※※※※※※※※※※※※※※※※※※※※※※

上記では、[次を認識する] のチェックボックスについてしか記述していませんでしたが、実は [自動置換] のチェックボックスも併せてオンにする必要がありました。すみません、[自動置換] の存在にまったく気づいていませんでした。詳細については、こちらの記事「タイピングを減らそう」を参照してください。

※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※

ペナルティ

むやみな自動反映を防ぐ手段の 1 つとして使えるのがペナルティです。設定する場所は、[プロジェクトの設定] > [言語ペア] > [すべての言語ペア] > [翻訳メモリと自動翻訳] > [ペナルティ] です。ペナルティを設定しておくと、マッチ率をペナルティ分だけ引き下げられます。「1」を設定しておけば、100% マッチでも 99% と見なされるのでさまざまな自動処理の予防になります。

今回注目するのは、既定でゼロになっている [自動ローカリゼーションによるペナルティ] と [テキスト置換によるペナルティ] の 2 つです。簡単に説明すると、「自動ローカリゼーション」は日付や数値の置換、「テキスト置換」は頭字語や英数字文字列の置換です。詳細については、Trados のヘルプ「TM ペナルティ」を参照してください。

先に説明した言語リソースで数字と頭字語を認識する設定にしていても、この 2 つのペナルティを「1」に設定すれば、繰り返しの自動反映は下図のように制限されます。まったく同一でない限り、ペナルティが効くので 100% マッチにならず自動反映はされません。

でも、やっぱり自動反映したい

上記のペナルティは、当然ながら、繰り返しの自動反映だけでなく、メモリから訳文を入力するときの動作に影響します。このため、私は必ず全項目に「1」を設定して作業しています。数字が複数あったりすると自動置換の動作は信用できないので、必ず確認する必要があります。

必ず確認する必要はあるのですが、数字だけが違う分節がずらずらと並ぶ場合など、やっぱり自動反映してほしいときはあります。その場合は、最初に挙げたエディタの設定を変えます。

[一致率の最小値] を「99」に設定し、[ユーザーへの確認メッセージ] が「常に」表示されるようにします。これで、ペナルティが効いて 99% マッチになっても自動反映が行われ、確認メッセージが毎回表示されるようになります。

注意点として、一致率の最小値を引き下げるとかなり危険な動作になることを心しておいてください。ペナルティではなく、通常の文字の違いで 99% マッチになっているものも自動反映されるので、これはあくまで一時的な設定という扱いにし、必要でなくなったらすぐに元に戻します。

確認メッセージは下図のように表示されます。「99%」の下に表示されている青色のマークは自動ローカリゼーションで置換が行われたことを示しています。(ただし、どこが置換されたのかはわかりません。そこは自分で確認するしかありません。)

このメッセージはすべての繰り返しについて毎回表示されますが、本当に確認が不要な場合は、[すべてはい] をクリックすることで一気に自動反映を適用できます。

で、結局どう設定すればいいの？

繰り返しの自動反映に関する設定の説明は以上です。繰り返しの処理にメモリは不要ですが、メモリの設定は使われるのでいろいろな注意が必要です。

私は、たいてい以下のように設定して作業しています。

　　言語リソース
　　　　・すべての項目を認識する (すべてのチェックボックスをオン)

　　ペナルティ
　　　　・すべての項目に「1」を設定する

　　エディタ
　　　　・一致率の最小値は「100」
　　　　・確認メッセージは「常に」表示する

上記のように設定した場合、まったく同一でない限り繰り返しの自動反映は行われません。ただ、今回は検証のためにメモリの更新をオフにしていましたが、通常はメモリに訳文を登録しているので、繰り返しとして自動反映がされなくても、メモリから訳文を入力できます。どうしても不便な場合は「一致率の最小値」を引き下げますが、これは危険なのでむやみには行いません。

今回は以上です。繰り返し処理の設定はかなり複雑で、私は今も試行錯誤することがあります。繰り返しがほとんど発生しない文書も多いので、設定しては忘れ、またいろいろ試す、ということを繰り返しています。

タグ：繰り返し自動反映一致率の最小値ペナルティ自動ローカリゼーションテキスト置換言語リソース頭字語

posted by さくら at 09:55 | Comment(0) | TrackBack(0) | SDL Trados Studio

最初へ .. 6 7 8 9 10 .. 最後へ