【ブログ】翻訳テクノロジーあれこれ by 小室誠一
「MTフェア2017」参加レポート(3)
投稿日時:2017/07/06(木) 15:33
講演の2番目は、注目のニューラル機械翻訳に関するもので、だいへん面白い内容でした。
講演2:「ニューラル機械翻訳ってどうなの?」
講演2:「ニューラル機械翻訳ってどうなの?」
中澤敏明氏(国研 科学技術振興機構)
ニューラル機械翻訳(NMT)のプロダクト化
NMT-文をバーツごとに翻訳するのではなく一つの文として扱う。
Google NMT (GNMT)―https://translate.google.com/を使う。
英語とその他の言語間しか対応していない
単語/句の対応が表示されない(文全体の対応として表示される)
単語/句の対応が表示されない(文全体の対応として表示される)

NMTの特徴
●フレーズテーブルは存在しない
単語アライメント不要、同じモデルで訓練もテストも行う
●SMTのように入力文を「置き換える」ことで翻訳するのではなく、入力文も見ながら、言語モデルのように翻訳文を作り出す
・<EOS>が(どこかで)出力されたら完了
・入力文を過不足なくカバーして翻訳することができない
●入口(入力文)と出口(翻訳文)以外は全て数値計算(行列の積など)だけで動いている

NMTの短所
●既存の(SMT用の)前処理・後処理が使えない
・事前並び替えは悪影響
・辞書が簡単には統合できない
・これまでのノウハウが活かせない
●計算量が多いので、ニューラルネットワークの学習に適したデバイス(GPU)が必須
●全然違う訳が出ることがある
●なぜそのような翻訳が出てきたかが全く説明できない
●翻訳文の流暢さは完璧に近いが正確性は完璧ではない
●NMTの主要な翻訳誤り
・平均的な翻訳精度は格段に向上するが訳抜けが起こりやすい
・たまに同じ単語を繰り返し出力
・低頻度語の翻訳に弱い
今後の展望
●NMTはここ数年で急激に発展し、平均的な翻訳精度はSMTを追い越している
●NMTの研究はまだ発展する可能性が高い
・現状のMNTはほとんど制御不可能
●現状のNMTには解決すべき課題が多く、実用的かどうかは疑問
・ざっと内容を把握する目的なら十分
・人間の翻訳の下訳として使うのはおそらく大丈夫
誤り傾向がSMTと異なるので、新たなノウハウの蓄積が必要
・翻訳結果をそのまま出版するのはやめた方がいい
(G)NMTを使う
●GNMTの結果をそのまま、もしくは多少の修正で納品する会社や翻訳者が多発
・GNMTを使ったかどうかを見分けるのが難しい
・訳抜けに気づくのが難しい
●平均的な精度は高いので、うまく使えば作業効率が向上するはず
・どのようにノウハウを蓄積するかが重要
・うまく使うためのツールの整備なども重要
●一般の人がGNMTの結果をそのまま使用し、Web上や街中に誤訳が氾濫
ニューラル機械翻訳の問題点が良く分かりました。 現在の勢いで研究が進められれば、おそらく、数年で改善されるように思われます。 産業翻訳でニューラル機械翻訳をどのように活用するか、十分に研究しておく必要がありそうです。 |
最後の講演は技術的な内容ではなく、機械翻訳をどのように収益に結び付けるかについてのものでした。
講演3:「機械翻訳の収益化の可能性」
佐藤弦(SDLジャパン株式会社)
SDL―翻訳会社
2005年 翻訳メモリ型CATツールのTrados社を買収
2010年 企業向け機械翻訳では世界トップのLanguage Weaverを買収
収益化の手段
●企業、政府へのシステムの販売
●アプリケーションなどのバックエンドでの使用
・Webページ(例:Trip Adviser)
・携帯アプリ
・API課金、ライセンス販売
汎用エンジンを産業翻訳に使用する場合の課題
●セキュリティ(情報が外に漏れる)
●カスタマイズ(用語、スタイル)
●タグの処理(基本的にMTはテキストのみ)
産業翻訳への機械翻訳の導入
●品質は重要だが、唯一の要素ではない
●GoogleやMicrosoftは、機械翻訳を産業翻訳のために開発しているわけではない
●プロセスの確立とそれに対するコンセンサスが必要(エンドクライアントがコントロールできるようにする)
●コストがかかるので翻訳できないものが大量にある。MTでコストが下がれば翻訳量が増大する可能性がある。
SDL社は、2016年11月にTrados Studio 2017を発売しました。 新機能として以下があります。 ・upLIFT機能(翻訳メモリを細分化して、部分的にマッチさせる) ・AutoSuggestのアジア言語対応 ・AdaptiveMT(自動学習するMT。リアルタイムで学習しながら改良される) 最後の自動学習MT(AdaptiveMT)が、MTを産業翻訳で活用する方法として一つの流れになると思われます。 |
コメント
プロフィール
小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
編集部宛投稿メール
最新記事
- DeepLの訳文が読みやすい理由 (2020/11/17)
- 機械翻訳支援ツール「GreenT」試用レポート(その2) (2020/05/29)
- 機械翻訳支援ツール「GreenT」試用レポート(その1) (2020/04/29)
- DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり (2020/03/27)
- 翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」 (2020/02/13)
- 機械翻訳の動向 (2020/02/03)
- 翻訳者の作業内容が変化している? (2017/10/12)
- みんなの自動翻訳をMemsourceで使ってみる(2) (2017/08/24)
- みんなの自動翻訳をMemsourceで使ってみる(1) (2017/08/03)
- Microsoftの「Try & Compare」ページ (2017/07/21)
- 音声翻訳アプリVoiceTraがニューラル機械翻訳で精度アップ (2017/07/13)
- Googleがニューラル機械翻訳の作り方を公開 (2017/07/13)
- 「MTフェア2017」参加レポート(3) (2017/07/06)
- 「MTフェア2017」参加レポート(2) (2017/07/06)
- 「MTフェア2017」参加レポート(1) (2017/07/06)
- ブログをはじめました (2017/06/29)
ブログ一覧
- 【ブログ】翻訳テクノロジーあれこれ by 小室誠一
- <新>翻訳に役立つソフトウェア活用法
翻訳ソフトや翻訳メモリソフトに限らず、翻訳業務の効率化に役立つソフトウェアを取り上げて、その活用法を紹介します。 - ■翻訳に役立つソフトウェア活用法
ブログ 7日間のアクセスランキング
- 1:第3回 フリーの翻訳メモリソフト「OmegaT」(55pv)
- 2:第9回 手軽に使える対訳ファイル作成ツール「AutoAlign」(48pv)
- 3:翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」(42pv)
- 4:第4回 英文ライティングに役立つコンコーダンサー「AntConc」(35pv)
- 5:第10回 便利なワードカウントソフト「Count Anything」(32pv)
- 6:第13回 テキストファイル比較ソフト「WinMerge」(30pv)
- 7:第1回 簡単にTMXが作成できる「Align Assist」(29pv)
- 8:みんなの自動翻訳をMemsourceで使ってみる(1)(27pv)
- 9:第2回 高機能な用語集検索ソフト「Xbench」(20pv)
- 10:みんなの自動翻訳をMemsourceで使ってみる(2)(16pv)
- 11:第1回 「EKWords - 高速キーワード抽出・集計」(15pv)
- 12:DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり(15pv)
- 13:第11回 辞書ソフトの定番「Personal Dictionary」(14pv)
- 14:第7回 校正・推敲支援ツール「Tomarigi」(12pv)
- 15:第2回 優れた用語管理ツール「xTerminology」(11pv)
- 16:第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」(11pv)
- 17:機械翻訳支援ツール「GreenT」試用レポート(その2)(8pv)
- 18:第12回 クリップボード監視ソフトなら「クリップアウト2000」(7pv)
- 19:DeepLの訳文が読みやすい理由(7pv)
- 20:翻訳者の作業内容が変化している?(6pv)