大きくする 標準 小さくする

【ブログ】翻訳テクノロジーあれこれ by 小室誠一

「MTフェア2017」参加レポート(3)

投稿日時:2017/07/06(木) 15:33

講演の2番目は、注目のニューラル機械翻訳に関するもので、だいへん面白い内容でした。

講演2:「ニューラル機械翻訳ってどうなの?」
中澤敏明氏(国研 科学技術振興機構)

ニューラル機械翻訳(NMT)のプロダクト化

NMT-文をバーツごとに翻訳するのではなく一つの文として扱う。
Google NMT (GNMT)―https://translate.google.com/を使う。
英語とその他の言語間しか対応していない
単語/句の対応が表示されない(文全体の対応として表示される)

   
NMTの特徴
●フレーズテーブルは存在しない
単語アライメント不要、同じモデルで訓練もテストも行う
●SMTのように入力文を「置き換える」ことで翻訳するのではなく、入力文も見ながら、言語モデルのように翻訳文を作り出す
・<EOS>が(どこかで)出力されたら完了
・入力文を過不足なくカバーして翻訳することができない
●入口(入力文)と出口(翻訳文)以外は全て数値計算(行列の積など)だけで動いている


NMTの短所
●既存の(SMT用の)前処理・後処理が使えない
・事前並び替えは悪影響
・辞書が簡単には統合できない
・これまでのノウハウが活かせない
●計算量が多いので、ニューラルネットワークの学習に適したデバイス(GPU)が必須
●全然違う訳が出ることがある
●なぜそのような翻訳が出てきたかが全く説明できない
●翻訳文の流暢さは完璧に近いが正確性は完璧ではない
●NMTの主要な翻訳誤り
・平均的な翻訳精度は格段に向上するが訳抜けが起こりやすい
・たまに同じ単語を繰り返し出力
・低頻度語の翻訳に弱い

今後の展望
●NMTはここ数年で急激に発展し、平均的な翻訳精度はSMTを追い越している
●NMTの研究はまだ発展する可能性が高い
・現状のMNTはほとんど制御不可能
●現状のNMTには解決すべき課題が多く、実用的かどうかは疑問
・ざっと内容を把握する目的なら十分
・人間の翻訳の下訳として使うのはおそらく大丈夫
誤り傾向がSMTと異なるので、新たなノウハウの蓄積が必要
・翻訳結果をそのまま出版するのはやめた方がいい

(G)NMTを使う
●GNMTの結果をそのまま、もしくは多少の修正で納品する会社や翻訳者が多発
・GNMTを使ったかどうかを見分けるのが難しい
・訳抜けに気づくのが難しい
●平均的な精度は高いので、うまく使えば作業効率が向上するはず
・どのようにノウハウを蓄積するかが重要
・うまく使うためのツールの整備なども重要
●一般の人がGNMTの結果をそのまま使用し、Web上や街中に誤訳が氾濫
 
ニューラル機械翻訳の問題点が良く分かりました。
現在の勢いで研究が進められれば、おそらく、数年で改善されるように思われます。
産業翻訳でニューラル機械翻訳をどのように活用するか、十分に研究しておく必要がありそうです。


最後の講演は技術的な内容ではなく、機械翻訳をどのように収益に結び付けるかについてのものでした。

講演3:「機械翻訳の収益化の可能性」
佐藤弦(SDLジャパン株式会社)


SDL―翻訳会社
2005年 翻訳メモリ型CATツールのTrados社を買収
2010年 企業向け機械翻訳では世界トップのLanguage Weaverを買収

収益化の手段
●企業、政府へのシステムの販売
●アプリケーションなどのバックエンドでの使用
・Webページ(例:Trip Adviser)
・携帯アプリ
・API課金、ライセンス販売

汎用エンジンを産業翻訳に使用する場合の課題
●セキュリティ(情報が外に漏れる)
●カスタマイズ(用語、スタイル)
●タグの処理(基本的にMTはテキストのみ)

産業翻訳への機械翻訳の導入
●品質は重要だが、唯一の要素ではない
●GoogleやMicrosoftは、機械翻訳を産業翻訳のために開発しているわけではない
●プロセスの確立とそれに対するコンセンサスが必要(エンドクライアントがコントロールできるようにする)
●コストがかかるので翻訳できないものが大量にある。MTでコストが下がれば翻訳量が増大する可能性がある。
 
SDL社は、2016年11月にTrados Studio 2017を発売しました。

新機能として以下があります。
・upLIFT機能(翻訳メモリを細分化して、部分的にマッチさせる)
・AutoSuggestのアジア言語対応
・AdaptiveMT(自動学習するMT。リアルタイムで学習しながら改良される)

最後の自動学習MT(AdaptiveMT)が、MTを産業翻訳で活用する方法として一つの流れになると思われます。






 

コメント

名前:
メールアドレス:
コメント:
ファイル
e2807e13c68416a8986a5c35ee902462.png?1508344227
画像の英字5文字を入力して下さい。:
パスワード:

プロフィール

小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、翻訳者のためのテキスト処理など、ITスキルに関する講座を担当。
また、フリーの翻訳者として毎日CATツールを使うのが嬉しくてたまらない。
ブルーグラス、バードウオッチング、俳句をこよなく愛しているが、最近は孫と遊ぶのに夢中。

編集部宛投稿メール

編集部宛の投稿は以下のフォームからお送りください。

みなさまの投稿をお待ちしております。

 

【編集部宛メールフォーム】

ブログ一覧