大きくする 標準 小さくする

【ブログ】翻訳テクノロジーあれこれ by 小室誠一

Googleがニューラル機械翻訳の作り方を公開

投稿日時:2017/07/13(木) 16:46

Google Research Blogに、2017年7月12日付で「Building Your Own Neural Machine Translation System in TensorFlow」という記事が投稿されました。

原文はこちら。
https://research.googleblog.com/2017/07/building-your-own-neural-machine.html

早速、Google翻訳にかけてみました。
意味、分かりますか?
興味ある人はチュートリアルをダウンロードして研究してみましょう。

---------------------------------------------------------
TensorFlowで独自のニューラルマシン翻訳システムを構築する
2017年7月12日水曜日
Thang Luong、Research Scientist、Eugene Brevdo、Google Brain Teamスタッフソフトウェアエンジニア

機械翻訳 - 言語間の自動的な翻訳作業は、機械学習コミュニティで最も活発な研究分野の1つです。機械翻訳への多くのアプローチの中で、sequence-to-sequence( "seq2seq")モデル[1,2]は最近、大きな成功を収め、Google翻訳などの商用翻訳システムのデファクトスタンダードとなっています。センテンスの意味を把握するために深いニューラルネットワークを使用する能力しかし、OpenNMTやtf-seq2seqなどのseq2seqモデルには豊富な素材が存在しますが、高品質の翻訳システムを簡単に構築するための知識とスキルの両方を教える素材が欠けています。

本日、TensorFlow用の新しい神経機械翻訳(NMT)チュートリアルを発表し、seq2seqモデルの完全な理解と、競争力のある翻訳モデルの構築方法を紹介します。このチュートリアルでは、NMTに関するいくつかの背景知識と、バニラシステムを構築するためのコードの詳細まで説明しながら、できるだけシンプルなプロセスを作成することを目的としています。それはNMTシステムが長い文章を扱うことを可能にする重要な要素である注意機構[3]、[4]に潜んでいる。最後に、このチュートリアルでは、GoogleのNMT(GNMT)システムで主要な機能を複製して複数のGPUをトレーニングする方法について詳しく説明します。

チュートリアルには詳細なベンチマーク結果も含まれており、ユーザはそれを自分で複製することができます。私たちのモデルは、GNMTの結果と同等のパフォーマンスを持つ強力なオープンソースのベースラインを提供します[5]。 WMT'14英語 - ドイツ語の翻訳タスクで24.4BLEUポイントを獲得しました。
他のベンチマーク結果(英語 - ベトナム語、ドイツ語 - 英語)はチュートリアルで見つけることができます。

さらに、このチュートリアルでは、seq2seqモデルをきれいにすることを目的とした、完全に動的なseq2seq API(TensorFlow 1.2でリリース)を紹介します。
tf.contrib.dataの新しい入力パイプラインを使用して、動的にサイズの変更された入力シーケンスを簡単に読み込み、前処理します。
パッド付きバッチ処理とシーケンス長バケット処理を使用して、トレーニングと推論の速度を向上させます。
人気のあるアーキテクチャとトレーニングスケジュールを使用して、seq2seqモデルをトレーニングします。
グラフ内のビーム探索を使用してseq2seqモデルで推論を実行します。
マルチGPU設定のseq2seqモデルを最適化します。
我々は、これが研究コミュニティによる多くの新しいNMTモデルの創造と実験を促進することを願っています。自分の研究を始めるには、GitHubのチュートリアルをチェックしてください!
--------------------------------------------------------------------
以上、Google翻訳の日本語出力。

コメント

名前:
メールアドレス:
コメント:
ファイル
25624689e05ebdffae4e2fb51ffd93c2.png?1513483992
画像の英字5文字を入力して下さい。:
パスワード:

プロフィール

小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、翻訳者のためのテキスト処理など、ITスキルに関する講座を担当。
また、フリーの翻訳者として毎日CATツールを使うのが嬉しくてたまらない。
ブルーグラス、バードウオッチング、俳句をこよなく愛しているが、最近は孫と遊ぶのに夢中。

編集部宛投稿メール

編集部宛の投稿は以下のフォームからお送りください。

みなさまの投稿をお待ちしております。

 

【編集部宛メールフォーム】

ブログ一覧