【ブログ】翻訳テクノロジーあれこれ by 小室誠一
DeepLの訳文が読みやすい理由
投稿日時:2020/11/17(火) 17:14
DeepLが日本語対応になったのが今年の3月のこと。(バックナンバー)
世の中、武漢ウイルスで大騒ぎする中、自宅に引きこもってDeepLと戯れる日々を過ごしているうちにもう10か月たちました。
使っているうちに、訳文の質がだんだん良くなってきているような気がして、色々と情報を集めていると、どうもDeepLは1センテンスだけでなく前後のセンテンスの情報も手掛かりにして訳文を生成しているようです。
ということで、ちょっと実験してみました。
お馴染みのGALA(Globalization and Localization Association)のブログから引用してみます。
GALA Pulse Survey Results - Q3 2020という記事のリードの部分です。
https://www.gala-global.org/publications/gala-pulse-survey-results-q3-2020
<原文>
GALA conducted its third in a series of Pulse Surveys to help our stakeholders understand how the market has changed in 2020, as well as how industry professionals expect it will take shape in the coming months. Our results reflect a snapshot in time, with input from approximately 215 language service and technology providers. We have segmented this information by self-reported products and services, region, and company size to provide a deeper look into if and how companies are being affected. Our key takeaway from the past three months: reported recovery is on the rise.
DeepLに段落ごと貼り付けて出力したのが以下の文です。
GALAは、2020年に市場がどのように変化したか、また業界の専門家が今後数ヶ月の間にどのような形になると予想しているかをステークホルダーの皆様に理解していただくために、パルス調査シリーズの第3回目を実施しました。調査結果は、約215社の言語サービスおよびテクノロジープロバイダーからの意見を反映したスナップショットを反映しています。この情報を、自己申告した製品やサービス、地域、企業規模別にセグメント化し、企業がどのような影響を受けているのか、またどのように影響を受けているのかをより深く知ることができます。過去 3 ヶ月間の主な調査結果:報告された回復率は上昇傾向にあります。
どうですか、よく分かりますね。
次に、センテンス単位で出力してみましょう。訳文に変化はあるのでしょうか?
GALA conducted its third in a series of Pulse Surveys to help our stakeholders understand how the market has changed in 2020, as well as how industry professionals expect it will take shape in the coming months.
GALAは、2020年に市場がどのように変化したか、また業界の専門家が今後数ヶ月の間にどのような形になると予想しているかをステークホルダーの皆様に理解していただくために、パルス調査シリーズの第3弾を実施しました。
最初のセンテンスは全く同じ訳文ですね。
Our results reflect a snapshot in time, with input from approximately 215 language service and technology providers.
私たちの結果は、約215の言語サービスおよび技術プロバイダーからの意見を反映したスナップショットを反映しています。
第2センテンスの頭に注目してください。「Our results」が「私たちの結果」と訳されています。一方、パラグラフ単位で出力した方は、「調査結果は」となっています。明らかに、最初のセンテンスの「パルス調査シリーズ」の流れを受けて「調査結果は」と出力しています。ちょっと見ると大したことではないようですが、実は情報がスムーズに流れて理解しやすくなっています。
We have segmented this information by self-reported products and services, region, and company size to provide a deeper look into if and how companies are being affected.
この情報を、自己申告した製品やサービス、地域、企業規模別にセグメント化し、企業がどのような影響を受けているのか、またどのように影響を受けているのかをより深く知ることができるようにしました。
このセンテンスでは、最後の部分「より深く知ることができるようにしました」が、パラグラフ単位で出力した方は「より深く知ることができます」となっています。provideを文法的に訳せば、「できるようにしました」の方が正確ですが、それだと一瞬「誰が?」と立ち止まってしまうかもしれません。
Our key takeaway from the past three months: reported recovery is on the rise.
過去3ヶ月間の主な成果:回復の報告は増加傾向にあります。
最後のセンテンスは「主な成果」がよく分かりませんね。パラグラフ単位で出力した方では、「主な調査結果」となっていて、違和感なく読みとることでできます。
このように、一見なんでもないような訳語の選択ですが、前のセンテンスの情報を引き継いでいるので、すんなりと読めるということになります。
DeepLは、どんどん進化しているようです。これからも楽しみが尽きませんね。
世の中、武漢ウイルスで大騒ぎする中、自宅に引きこもってDeepLと戯れる日々を過ごしているうちにもう10か月たちました。
使っているうちに、訳文の質がだんだん良くなってきているような気がして、色々と情報を集めていると、どうもDeepLは1センテンスだけでなく前後のセンテンスの情報も手掛かりにして訳文を生成しているようです。
ということで、ちょっと実験してみました。
お馴染みのGALA(Globalization and Localization Association)のブログから引用してみます。
GALA Pulse Survey Results - Q3 2020という記事のリードの部分です。
https://www.gala-global.org/publications/gala-pulse-survey-results-q3-2020
<原文>
GALA conducted its third in a series of Pulse Surveys to help our stakeholders understand how the market has changed in 2020, as well as how industry professionals expect it will take shape in the coming months. Our results reflect a snapshot in time, with input from approximately 215 language service and technology providers. We have segmented this information by self-reported products and services, region, and company size to provide a deeper look into if and how companies are being affected. Our key takeaway from the past three months: reported recovery is on the rise.
DeepLに段落ごと貼り付けて出力したのが以下の文です。
GALAは、2020年に市場がどのように変化したか、また業界の専門家が今後数ヶ月の間にどのような形になると予想しているかをステークホルダーの皆様に理解していただくために、パルス調査シリーズの第3回目を実施しました。調査結果は、約215社の言語サービスおよびテクノロジープロバイダーからの意見を反映したスナップショットを反映しています。この情報を、自己申告した製品やサービス、地域、企業規模別にセグメント化し、企業がどのような影響を受けているのか、またどのように影響を受けているのかをより深く知ることができます。過去 3 ヶ月間の主な調査結果:報告された回復率は上昇傾向にあります。
どうですか、よく分かりますね。
次に、センテンス単位で出力してみましょう。訳文に変化はあるのでしょうか?
GALA conducted its third in a series of Pulse Surveys to help our stakeholders understand how the market has changed in 2020, as well as how industry professionals expect it will take shape in the coming months.
GALAは、2020年に市場がどのように変化したか、また業界の専門家が今後数ヶ月の間にどのような形になると予想しているかをステークホルダーの皆様に理解していただくために、パルス調査シリーズの第3弾を実施しました。
最初のセンテンスは全く同じ訳文ですね。
Our results reflect a snapshot in time, with input from approximately 215 language service and technology providers.
私たちの結果は、約215の言語サービスおよび技術プロバイダーからの意見を反映したスナップショットを反映しています。
第2センテンスの頭に注目してください。「Our results」が「私たちの結果」と訳されています。一方、パラグラフ単位で出力した方は、「調査結果は」となっています。明らかに、最初のセンテンスの「パルス調査シリーズ」の流れを受けて「調査結果は」と出力しています。ちょっと見ると大したことではないようですが、実は情報がスムーズに流れて理解しやすくなっています。
We have segmented this information by self-reported products and services, region, and company size to provide a deeper look into if and how companies are being affected.
この情報を、自己申告した製品やサービス、地域、企業規模別にセグメント化し、企業がどのような影響を受けているのか、またどのように影響を受けているのかをより深く知ることができるようにしました。
このセンテンスでは、最後の部分「より深く知ることができるようにしました」が、パラグラフ単位で出力した方は「より深く知ることができます」となっています。provideを文法的に訳せば、「できるようにしました」の方が正確ですが、それだと一瞬「誰が?」と立ち止まってしまうかもしれません。
Our key takeaway from the past three months: reported recovery is on the rise.
過去3ヶ月間の主な成果:回復の報告は増加傾向にあります。
最後のセンテンスは「主な成果」がよく分かりませんね。パラグラフ単位で出力した方では、「主な調査結果」となっていて、違和感なく読みとることでできます。
このように、一見なんでもないような訳語の選択ですが、前のセンテンスの情報を引き継いでいるので、すんなりと読めるということになります。
DeepLは、どんどん進化しているようです。これからも楽しみが尽きませんね。
コメント
プロフィール
小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
編集部宛投稿メール
最新記事
- DeepLの訳文が読みやすい理由 (2020/11/17)
- 機械翻訳支援ツール「GreenT」試用レポート(その2) (2020/05/29)
- 機械翻訳支援ツール「GreenT」試用レポート(その1) (2020/04/29)
- DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり (2020/03/27)
- 翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」 (2020/02/13)
- 機械翻訳の動向 (2020/02/03)
- 翻訳者の作業内容が変化している? (2017/10/12)
- みんなの自動翻訳をMemsourceで使ってみる(2) (2017/08/24)
- みんなの自動翻訳をMemsourceで使ってみる(1) (2017/08/03)
- Microsoftの「Try & Compare」ページ (2017/07/21)
- 音声翻訳アプリVoiceTraがニューラル機械翻訳で精度アップ (2017/07/13)
- Googleがニューラル機械翻訳の作り方を公開 (2017/07/13)
- 「MTフェア2017」参加レポート(3) (2017/07/06)
- 「MTフェア2017」参加レポート(2) (2017/07/06)
- 「MTフェア2017」参加レポート(1) (2017/07/06)
- ブログをはじめました (2017/06/29)
ブログ一覧
- 【ブログ】翻訳テクノロジーあれこれ by 小室誠一
- <新>翻訳に役立つソフトウェア活用法
翻訳ソフトや翻訳メモリソフトに限らず、翻訳業務の効率化に役立つソフトウェアを取り上げて、その活用法を紹介します。 - ■翻訳に役立つソフトウェア活用法
ブログ 7日間のアクセスランキング
- 1:第3回 フリーの翻訳メモリソフト「OmegaT」(62pv)
- 2:第2回 高機能な用語集検索ソフト「Xbench」(35pv)
- 3:第10回 便利なワードカウントソフト「Count Anything」(33pv)
- 4:翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」(31pv)
- 5:第9回 手軽に使える対訳ファイル作成ツール「AutoAlign」(26pv)
- 6:第1回 簡単にTMXが作成できる「Align Assist」(26pv)
- 7:第13回 テキストファイル比較ソフト「WinMerge」(26pv)
- 8:みんなの自動翻訳をMemsourceで使ってみる(1)(26pv)
- 9:DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり(17pv)
- 10:第7回 辞書ソフト「超辞典DUO」活用法(16pv)
- 11:第11回 辞書ソフトの定番「Personal Dictionary」(15pv)
- 12:第1回 「EKWords - 高速キーワード抽出・集計」(14pv)
- 13:みんなの自動翻訳をMemsourceで使ってみる(2)(14pv)
- 14:第2回 優れた用語管理ツール「xTerminology」(12pv)
- 15:機械翻訳支援ツール「GreenT」試用レポート(その1)(12pv)
- 16:第4回 英文ライティングに役立つコンコーダンサー「AntConc」(11pv)
- 17:第11回 便利なユーティリティソフト「PathText」と「WinShot」(10pv)
- 18:機械翻訳支援ツール「GreenT」試用レポート(その2)(9pv)
- 19:第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」(8pv)
- 20:第14回 テキスト解析ソフト「Analyze Assist」(8pv)