- トップ
- 【連載】 翻訳技術の言語的な基盤
- 翻訳技術の言語的な基盤 第2回 - 成田 一
翻訳技術の言語的な基盤 第2回 - 成田 一
2013/05/10
機械はどのように翻訳するのか?
機械による翻訳プロセスでは、まず形態素(「意味を担う最小の言語単位」)解析によって、文を構成する文字列を辞書と照合し、たとえば「みごとなバラが咲いた」は、実質的な意味を担う「バラ」「咲く」「みごとな」という単語と「が」「た」などの文法関係や時制を表す要素に区別する。
続く文の構造解析にあたっては、述語を検出した段階で、この述語が取り得る構造型の情報を辞書で照合し、これに基づいて他の要素の文法機能や構造関係を認定して、「[[みごとな]バラ]が[咲い]た」のような構造に解析する。次に、翻訳目標となる言語の語彙との対応を図り、その文法情報に適合する形で構造を展開して、[[Gorgeous] rose[s]] [[bloom]ed].という翻訳文に変換する。
機械による、このような原文の形態素、構造の解析と翻訳文への変換作業は、基本的に人間と変わらない。しかし、人間の場合には、原文の構造解析によって、文字通りの言語的な意味を理解するだけでなく、文脈に照らし合わせて、それに相応しい意味で解釈するとか、かなり違った比喩的な意味で解釈することもある。
たとえば、“Dr. Jekyll is a butcher.”は、butcherが「肉屋」のほかに「屠殺(とさつ)人」の意味もあることから、「ジキル博士は肉屋である」という以外に、「ジキル医師は殺害を行なっている」という比喩的な意味もある。機械では、そうした解釈まで訳文に反映することはできない。
解釈が多様なだけではない。機械翻訳では、どういう文法関係をどういう構文に翻訳するかは、予め組み込まれた設定に従う。しかし、人間の場合、同じ原文の意味を表現するのに、どういう構文や表現で翻訳するかは自由で、生成面ではかなり多様な可能性がある。“I don’t want to be burned.”は「(私は)日焼けをしたくない」でも良いが、若い女の子なら「焼けちゃう(わ)!」がピッタリかもしれない。
こうした訳文の自由度は、機械翻訳には期待できない。しかし、言語レベルで自然な構文、表現への変換を指定することは可能だ。実際、日本語では存在表現の「私には子供が三人いる」を* “There are three children in me.”ではなく、所有表現の“I have three children.”に翻訳する設定のソフトもある。
文芸作品や比喩は翻訳できるか?
機械翻訳では「文学作品に対応できない」とか、「比喩や諺は無理だろう」という声が聞かれる。文学作品と言ってもその文体は色々で、現 代作家の作品によくみられるような直截(ちょくせつ)(ちょくせつ)的、散文的なものであれば、問題なく翻訳する。仮に、英文が比喩として使われていても、その言語表現をそのまま日本語に訳せば良いのだ。
比喩としての解釈は、読み手が文化的背景を踏まえて行なうことになる。たとえば、“A rolling stone gathers no moss.”(「転石苔を付けず」)という諺は、「苔」を知識や技術やお金と捉える英国では悪い意味になり、義理やしがらみと捉える米国では良い意味になる。“a sophisticated child”も英国では「ませた子」で、米国では「ものしりな子」になる。翻訳システムは、設計上言語レベルの処理までを行い、「解釈」を目指すものではない。
プロの翻訳者は原文と訳文の微妙なズレにまで配慮する。原文の文化・社会的な背景と読み手の知識を睨んで推考するのだ。機械はとても敵わない(かなわない)。現在の機械翻訳がやっているのは、あくまで「言語処理」であって、文化的背景を斟酌するという知的な処理はしていない。ここで注意したいのは、「機械に何から何までやってもらおう」とする考え方では困るということだ。
機械翻訳が文脈を考えて訳せなくても、読み手が当たり前に頭を働かせて解釈できれば問題ない。訳文に修飾関係の誤りなどがあれば、普通文脈的におかしいので読めば分かる。機械翻訳の能力を超える知識・文脈処理を補うという形で、人間も当たり前の役割を分担するということだ。
どういった言語処理ができるのか?
機械翻訳の言語処理がどこまでできているのか、基本的な構文の処理方式について具体的に見てみよう。たとえば、「僕の女房は魚が嫌いみたいだ」は、“My wife seems to dislike a fish.”とほぼ正しく翻訳するソフトだけでなく、“The/A fish dislikes my wife.”のように、「魚が」を主語と解析する例もみられる。つまり、「女房」が「嫌い」の対象として解釈され、逆の関係で訳されているのだ。「好き・嫌い」など「感情」に関する述語は、対象を助詞「が」で表示できる、という文法的な決まりがあるわけで、それを組み込んでいたらちゃんと訳せる。
そのような述語がなければ、「が」があるために「魚」を主語とする分析が優先する。しかし、「僕の女房は、あいつは嫌いみたいだ」などが曖昧なように、「女房」が「嫌い」の対象になることもあり得る。「魚」が「感情」を持たないという情報を含めれば、その可能性を排除することもできるが、それは辞書に記載する語彙情報が深すぎると思う。なお、解析ないし生成に完全に失敗したり、「みたい」を「見たい」(本動詞+助動詞)に解析しwants [to watch it]と訳すソフトもある。
主語がないケースにどう対応するかは、ソフトにより工夫が見られる。たとえば、「[最初に議論すべき]問題」における連体修飾節には主語がない。英訳にあたって、主語を復元しなければならないと言っても、必要な情報が節内にあるわけではないので、復元もできない。では、どう対応しているか。まず、A problem [to discuss first]のように「不定詞句」を使えば主語を表さなくて済む。また、The problem [which should be discussed first]のように「受身」にしても復元が回避できる。さらにThe problem [that you should argue in the first place]のように「総称的代名詞」のyouを入れても良い。
ただ、残念ながら、*The problem [that it should discuss first]のように、文構造を維持するため、無意味な「itを入れる」設定にしているソフトもある。ほかに*The problem [which should argue (at) first]のように、「主語を補わない」というか、The problemを関係節内の文の主語に立てる、論理的におかしい直訳も見られる。言語的にかなり木目細かく対応しているものとアドホックなものがあるのだ。これ以外の問題にも、言語的な工夫で、それなりの対応ができる。
次回は「英日vs日英機械翻訳」を扱いたい。
(プロフィール)
成田一(なりた はじめ): 大阪大学名誉教授。英日対照構造論・機械翻訳・言語教育専攻。著書に『パソコン翻訳の世界』(講談社)、『日本人に相応しい英語教育』(松柏社)、共著に『日本語の名詞修飾表現』(くろしお出版)、『名詞』(研究社)ほか、『私のおすすめパソコンソフト』(岩波書店)、編著に『こうすれば使える機械翻訳』(バベルプレス)、『英語リフレッシュ講座』(大阪大学出版会)。英語教育総合学会会長。
記事一覧
- 翻訳技術の言語的な基盤 第51回 翻訳者・通訳者と自動翻訳・通訳の守備範囲 ― 成田 一 [2017/06/07]
- 翻訳技術の言語的な基盤 第50回 翻訳者・通訳者と自動翻訳・通訳の守備範囲 ― 成田 一 [2017/05/10]
- 翻訳技術の言語的な基盤 第49回 機械の守備範囲と展開 ― 成田 一 [2017/04/10]
- 翻訳技術の言語的な基盤 第48回 多言語翻訳の文法処理能力(3)英露翻訳 ― 成田 一 [2017/03/10]
- 翻訳技術の言語的な基盤 第47回 ~日英自動翻訳の翻訳能力~ ― 成田 一 [2017/02/10]
- 翻訳技術の言語的な基盤 第46回 ~中日翻訳の実力~ ― 成田 一 [2017/01/11]
- 翻訳技術の言語的な基盤 第45回 ~日中翻訳の実力 その2~ ― 成田 一 [2016/12/10]
- 翻訳技術の言語的な基盤 第44回 ~日中翻訳の実力~ ― 成田 一 [2016/11/10]
- 翻訳技術の言語的な基盤 第43回 ~日韓翻訳の実力~ ― 成田 一 [2016/10/11]
- 翻訳技術の言語的な基盤 第42回 ~多言語翻訳の文法処理能力(2)英独翻訳~ ― 成田 一 [2016/09/10]
- 翻訳技術の言語的な基盤 第41回 ~多言語翻訳の文法処理能力(1)英仏翻訳~ ― 成田 一 [2016/08/10]
- 翻訳技術の言語的な基盤 第40回 ~自動翻訳の文法処理能力~ ― 成田 一 [2016/07/11]
- 翻訳技術の言語的な基盤 第39回 ~自動翻訳の翻訳論~ ― 成田 一 [2016/06/10]
- 翻訳技術の言語的な基盤 第38回 ~日本人と欧米人にとっての多言語教育~ ― 成田 一 [2016/05/10]
- 翻訳技術の言語的な基盤 第37回 - 成田 一 [2016/04/11]
- 翻訳技術の言語的な基盤 第36回 - 成田 一 [2016/03/10]
- 翻訳技術の言語的な基盤 第35回 - 成田 一 [2016/02/10]
- 翻訳技術の言語的な基盤 第34回 - 成田 一 [2016/01/12]
- 翻訳技術の言語的な基盤 第33回 - 成田 一 [2015/12/10]
- 翻訳技術の言語的な基盤 第32回 - 成田 一 [2015/11/10]
編集部宛投稿メール
記事 7日間のアクセスランキング
- 1:草の根の真心、一輪の花から始まった絆が世界を救う(36pv)
- 2:第13回 すんなり入れる特許翻訳 ― 特許出願の中間手続の翻訳(29pv)
- 3:「ドラえもん」の版権無料化と著作権収支の関係(24pv)
- 4:【新連載】 第1回 特許翻訳入門 ―すんなり入れる特許翻訳-普通の英語から簡単に特許の英訳ができるようになる(24pv)
- 5:第17回 すんなり入れる特許翻訳 ― メールやレターでよく使う表現(22pv)
- 6:第2回 すんなり入れる特許翻訳-普通の英語から簡単に特許の英訳ができるようになる(21pv)
- 7:第10回 鍵は好奇心と「贈与」にある(21pv)
- 8:日本語に秘められた真理を探究する ― ことは(光透波)への誘い ― 第12回 「光透波は新時代を開く絶対理法」(20pv)
- 9:第4回 ギフテッドのOE(過興奮性)①(19pv)
- 10:【連載】JTA News & Topics 第168回(17pv)
ブログ最新記事
- 進化するOmegaT (2) (2021/12/07)
- 進化するOmegaT (1) (2021/11/25)
- DeepLの訳文が読みやすい理由 (2020/11/17)
- 機械翻訳支援ツール「GreenT」試用レポート(その2) (2020/05/29)
- 機械翻訳支援ツール「GreenT」試用レポート(その1) (2020/04/29)