大きくする 標準 小さくする

【ブログ】翻訳テクノロジーあれこれ by 小室誠一

機械翻訳支援ツール「GreenT」試用レポート(その2)

投稿日時:2020/05/29(金) 10:34

前回はGreenTの概要をレポートしました。現在のニューラル機械翻訳の弱点は何か、それを補うための「機械翻訳支援ツール」としてのGreenTにはどのような機能があるのかを概観してから、用語集機能を試してみました。今回はもう少し詳しく見てみましょう。

GreenTを使用する主な目的の一つが「用語集」機能であることは間違いないでしょう。
期待にたがわず、用語集を作成するための便利な機能が別メニューとして付いています。

■用語の抽出機能

 

「アドイン」タブの「GG」アイコンをクリックするとGlossary Generatorが開きます。



用語の抽出は、出現頻度を基に行われます。日本語の場合は最小文字数、英語の場合は最小ワード数を指定すると、最小頻度以上の語句を抽出してくれます。

デフォルトでは、最小頻度「2」、最小ワード数「2」となっています。日本語の場合は最小文字数「3」です。
用語を抽出してみて多すぎる場合は最小頻度を増やすと良いでしょう。
連語をたくさん抽出したい場合は最小ワード数を増やしますが、「4」ぐらいが適切です。
日本語、英語の切り替えは、画面中央の「J2E」(日英)「E2J」(英日)で指定します。

<ここまでの手順>

1.用語集を作成したいWord文書を開きます
2.「アドイン」タブの「GG」アイコンをクリックします
3.Glossary Generatorが開いたら、「J2E」(日英)「E2J」(英日)の指定をします
4.最小頻度、最小文字数あるいは最小ワード数を指定します。

ここで、「用語を抽出する(T)」をクリックすると抽出できます。

以下の例では、「J2E」、最小頻度「2」、最小文字数「4」に設定しています。
原語の部分に用語が抽出されます。左の数字は出現回数です。



■訳語の取得(Google Cloud Translation)

この状態で「訳語を取得する」をクリックしてみましょう。
Google Cloud Translationによって訳語が出力されます。



任意の語句を選択すると、画面の下部で修正したり、語句を削除したりできます。
「QA」チェックも使えます。



登録する用語の編集が完了したら「テキスト形式で保存する」をクリックします。

保存された用語集はタブ区切りテキストなので、このファイルを直接手直しできます。
これがそのまま、「ユーザー用語集ファイル」となります。



編集作業を途中で中断するときは、「SnapShot」を使います。



Glossary Generatorを終了しても、再度開いて「再開する」をクリックすれば、前回の状態が復元されます。

■訳語の取得(用語集を使用する)

既存の用語集が手元にある場合、その訳語を反映することもできます。この機能を使えば、既存の用語集にマッチしない用語を省いて、スリムな用語集を作成できます。(用語集ファイルがあまり大きすぎると検索に時間がかかってMT出力が遅くなる場合があります)。
「用語集ファイル」を設定し、「用語集を使用する」にチェックを入れて「用語集を抽出する」をクリックします。



既存の用語集ファイルに登録されている用語があると、最初から訳語が入った状態で表示され、先頭に「OK」がつきます。



この状態で、「Google Cloud Translation」で「訳語を取得する」をクリックすると、まだ訳語が入っていない用語に訳語が付加されます。



用語抽出機能について、ちょっと詳しく説明しすぎたかもしれません。
他の機能も駆け足で見ておきましょう。

■プリエディット機能

基本的に機械翻訳は長い文、複雑な文は苦手です。GreenTのプリエディット機能は、文の分割が中心のようです。例えば、関係代名詞で分割します。



[Which Clause]を選択して「適用」をクリックすると、以下のように分割されます。



「GreenT」ボタンをクリックして再翻訳します。
これだけで、見違えるような訳文になりました。



■ポストエディット機能

これは、一言でいえば訳文の置換機能です。あらかじめ置換候補を登録しておくこともできます。
候補を選んで「適用」をクリックするだけなので、入力の手間が省けます。



■否定語をチェックする機能

機械翻訳では否定語が訳されないことがたまにあります。重大なエラーとなるので、否定語をチェックする機能が付いています。
以下の場合はcan’tがきちんと反映されています。
否定語があると、イタリック表示になります。



ちなみに、上図の「ポストエディット」に表示された[Repeated Phrase 2]は、「私たち」のが繰り返されていることを警告しています。
湧き出しではありませんが、「私たちの年齢の」→「同年齢の」とでもすれば良いでしょう。

GreenTには、まだまだ多くの機能があって紹介しきれませんが、興味のある方はGreenTのWebページをご覧ください。

機械翻訳を越えるGreenT
https://www.wordvbalab.com/word-addin/greent/
開発者:新田順也氏(翻訳者、プログラマー、Microsoft Word MVPをWord部門で受賞、エヌ・アイ・ティー株式会社代表取締役)

【朗報】Google Translate APIの他にDeepL利用可能になりました。
「Ver. 1.3からDeepLを利用できるようになります。現在は申請をした正規ユーザーのみご利用できます。体験版ではご利用いただけません。」(2020/5/12)

GreenTは、動画も含めた分かりやすいマニュアルが用意されているので安心です。
https://www.wordvbalab.com/word-addin/greent/manual/

コメント

名前:
Eメールアドレス:
コメント:
ファイル

画像の英字5文字を入力して下さい。:
パスワード:

プロフィール

小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
 

編集部宛投稿メール

編集部宛の投稿は以下のフォームからお送りください。

みなさまの投稿をお待ちしております。

 

【編集部宛メールフォーム】

ブログ一覧

ブログ 7日間のアクセスランキング