【ブログ】翻訳テクノロジーあれこれ by 小室誠一
Googleがニューラル機械翻訳の作り方を公開
投稿日時:2017/07/13(木) 16:46
Google Research Blogに、2017年7月12日付で「Building Your Own Neural Machine Translation System in TensorFlow」という記事が投稿されました。
原文はこちら。
https://research.googleblog.com/2017/07/building-your-own-neural-machine.html
早速、Google翻訳にかけてみました。
意味、分かりますか?
興味ある人はチュートリアルをダウンロードして研究してみましょう。
---------------------------------------------------------
TensorFlowで独自のニューラルマシン翻訳システムを構築する
2017年7月12日水曜日
Thang Luong、Research Scientist、Eugene Brevdo、Google Brain Teamスタッフソフトウェアエンジニア
機械翻訳 - 言語間の自動的な翻訳作業は、機械学習コミュニティで最も活発な研究分野の1つです。機械翻訳への多くのアプローチの中で、sequence-to-sequence( "seq2seq")モデル[1,2]は最近、大きな成功を収め、Google翻訳などの商用翻訳システムのデファクトスタンダードとなっています。センテンスの意味を把握するために深いニューラルネットワークを使用する能力しかし、OpenNMTやtf-seq2seqなどのseq2seqモデルには豊富な素材が存在しますが、高品質の翻訳システムを簡単に構築するための知識とスキルの両方を教える素材が欠けています。
本日、TensorFlow用の新しい神経機械翻訳(NMT)チュートリアルを発表し、seq2seqモデルの完全な理解と、競争力のある翻訳モデルの構築方法を紹介します。このチュートリアルでは、NMTに関するいくつかの背景知識と、バニラシステムを構築するためのコードの詳細まで説明しながら、できるだけシンプルなプロセスを作成することを目的としています。それはNMTシステムが長い文章を扱うことを可能にする重要な要素である注意機構[3]、[4]に潜んでいる。最後に、このチュートリアルでは、GoogleのNMT(GNMT)システムで主要な機能を複製して複数のGPUをトレーニングする方法について詳しく説明します。
チュートリアルには詳細なベンチマーク結果も含まれており、ユーザはそれを自分で複製することができます。私たちのモデルは、GNMTの結果と同等のパフォーマンスを持つ強力なオープンソースのベースラインを提供します[5]。 WMT'14英語 - ドイツ語の翻訳タスクで24.4BLEUポイントを獲得しました。
他のベンチマーク結果(英語 - ベトナム語、ドイツ語 - 英語)はチュートリアルで見つけることができます。
さらに、このチュートリアルでは、seq2seqモデルをきれいにすることを目的とした、完全に動的なseq2seq API(TensorFlow 1.2でリリース)を紹介します。
tf.contrib.dataの新しい入力パイプラインを使用して、動的にサイズの変更された入力シーケンスを簡単に読み込み、前処理します。
パッド付きバッチ処理とシーケンス長バケット処理を使用して、トレーニングと推論の速度を向上させます。
人気のあるアーキテクチャとトレーニングスケジュールを使用して、seq2seqモデルをトレーニングします。
グラフ内のビーム探索を使用してseq2seqモデルで推論を実行します。
マルチGPU設定のseq2seqモデルを最適化します。
我々は、これが研究コミュニティによる多くの新しいNMTモデルの創造と実験を促進することを願っています。自分の研究を始めるには、GitHubのチュートリアルをチェックしてください!
--------------------------------------------------------------------
以上、Google翻訳の日本語出力。
原文はこちら。
https://research.googleblog.com/2017/07/building-your-own-neural-machine.html
早速、Google翻訳にかけてみました。
意味、分かりますか?
興味ある人はチュートリアルをダウンロードして研究してみましょう。
---------------------------------------------------------
TensorFlowで独自のニューラルマシン翻訳システムを構築する
2017年7月12日水曜日
Thang Luong、Research Scientist、Eugene Brevdo、Google Brain Teamスタッフソフトウェアエンジニア
機械翻訳 - 言語間の自動的な翻訳作業は、機械学習コミュニティで最も活発な研究分野の1つです。機械翻訳への多くのアプローチの中で、sequence-to-sequence( "seq2seq")モデル[1,2]は最近、大きな成功を収め、Google翻訳などの商用翻訳システムのデファクトスタンダードとなっています。センテンスの意味を把握するために深いニューラルネットワークを使用する能力しかし、OpenNMTやtf-seq2seqなどのseq2seqモデルには豊富な素材が存在しますが、高品質の翻訳システムを簡単に構築するための知識とスキルの両方を教える素材が欠けています。
本日、TensorFlow用の新しい神経機械翻訳(NMT)チュートリアルを発表し、seq2seqモデルの完全な理解と、競争力のある翻訳モデルの構築方法を紹介します。このチュートリアルでは、NMTに関するいくつかの背景知識と、バニラシステムを構築するためのコードの詳細まで説明しながら、できるだけシンプルなプロセスを作成することを目的としています。それはNMTシステムが長い文章を扱うことを可能にする重要な要素である注意機構[3]、[4]に潜んでいる。最後に、このチュートリアルでは、GoogleのNMT(GNMT)システムで主要な機能を複製して複数のGPUをトレーニングする方法について詳しく説明します。
チュートリアルには詳細なベンチマーク結果も含まれており、ユーザはそれを自分で複製することができます。私たちのモデルは、GNMTの結果と同等のパフォーマンスを持つ強力なオープンソースのベースラインを提供します[5]。 WMT'14英語 - ドイツ語の翻訳タスクで24.4BLEUポイントを獲得しました。
他のベンチマーク結果(英語 - ベトナム語、ドイツ語 - 英語)はチュートリアルで見つけることができます。
さらに、このチュートリアルでは、seq2seqモデルをきれいにすることを目的とした、完全に動的なseq2seq API(TensorFlow 1.2でリリース)を紹介します。
tf.contrib.dataの新しい入力パイプラインを使用して、動的にサイズの変更された入力シーケンスを簡単に読み込み、前処理します。
パッド付きバッチ処理とシーケンス長バケット処理を使用して、トレーニングと推論の速度を向上させます。
人気のあるアーキテクチャとトレーニングスケジュールを使用して、seq2seqモデルをトレーニングします。
グラフ内のビーム探索を使用してseq2seqモデルで推論を実行します。
マルチGPU設定のseq2seqモデルを最適化します。
我々は、これが研究コミュニティによる多くの新しいNMTモデルの創造と実験を促進することを願っています。自分の研究を始めるには、GitHubのチュートリアルをチェックしてください!
--------------------------------------------------------------------
以上、Google翻訳の日本語出力。
コメント
プロフィール
小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
編集部宛投稿メール
最新記事
- 進化するOmegaT (2) (2021/12/07)
- 進化するOmegaT (1) (2021/11/25)
- DeepLの訳文が読みやすい理由 (2020/11/17)
- 機械翻訳支援ツール「GreenT」試用レポート(その2) (2020/05/29)
- 機械翻訳支援ツール「GreenT」試用レポート(その1) (2020/04/29)
- DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり (2020/03/27)
- 翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」 (2020/02/13)
- 機械翻訳の動向 (2020/02/03)
- 翻訳者の作業内容が変化している? (2017/10/12)
- みんなの自動翻訳をMemsourceで使ってみる(2) (2017/08/24)
- みんなの自動翻訳をMemsourceで使ってみる(1) (2017/08/03)
- Microsoftの「Try & Compare」ページ (2017/07/21)
- 音声翻訳アプリVoiceTraがニューラル機械翻訳で精度アップ (2017/07/13)
- Googleがニューラル機械翻訳の作り方を公開 (2017/07/13)
- 「MTフェア2017」参加レポート(3) (2017/07/06)
- 「MTフェア2017」参加レポート(2) (2017/07/06)
- 「MTフェア2017」参加レポート(1) (2017/07/06)
- ブログをはじめました (2017/06/29)
ブログ一覧
- 【ブログ】翻訳テクノロジーあれこれ by 小室誠一
- <新>翻訳に役立つソフトウェア活用法
翻訳ソフトや翻訳メモリソフトに限らず、翻訳業務の効率化に役立つソフトウェアを取り上げて、その活用法を紹介します。 - ■翻訳に役立つソフトウェア活用法
ブログ 7日間のアクセスランキング
- 1:第13回 テキストファイル比較ソフト「WinMerge」(36pv)
- 2:翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」(33pv)
- 3:第3回 フリーの翻訳メモリソフト「OmegaT」(19pv)
- 4:第10回 便利なワードカウントソフト「Count Anything」(16pv)
- 5:第1回 簡単にTMXが作成できる「Align Assist」(13pv)
- 6:第9回 手軽に使える対訳ファイル作成ツール「AutoAlign」(12pv)
- 7:第8回 翻訳ユーティリティの定番「Okapi Rainbow」(11pv)
- 8:第7回 校正・推敲支援ツール「Tomarigi」(8pv)
- 9:第5回 まだまだ使える「Wordfast Classic」(8pv)
- 10:第4回 英文ライティングに役立つコンコーダンサー「AntConc」(7pv)
- 11:第2回 高機能な用語集検索ソフト「Xbench」(7pv)
- 12:第1回 「EKWords - 高速キーワード抽出・集計」(6pv)
- 13:第2回 優れた用語管理ツール「xTerminology」(6pv)
- 14:第11回 便利なユーティリティソフト「PathText」と「WinShot」(6pv)
- 15:進化するOmegaT (2)(6pv)
- 16:第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」(5pv)
- 17:DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり(4pv)
- 18:みんなの自動翻訳をMemsourceで使ってみる(2)(4pv)
- 19:第4回 Chromeブラウザで動く翻訳支援ツール「Isometry」(3pv)
- 20:Googleがニューラル機械翻訳の作り方を公開(3pv)