大きくする 標準 小さくする

「翻訳支援ツールの必要性」 第2回 機械翻訳の光と影 ― 小室誠一

2016/12/26

翻訳支援ツールの必要性 


第2回 機械翻訳の光と影

小室誠一


 前回は、翻訳とメディアが深い関係にあることを、日本語ワープロの登場からインターネットの普及などを軸として振り返ってみました。そして、現在ではますます情報化が進み、翻訳の形態も大きく変化しています。マニュアルもマーケティング資料も研修資料も必要な情報はほとんどすべて、電子データとしてWebに掲載されています。Web上のデータは「ビッグデータ」と呼ばれるほど大量です。この中に翻訳すべき文書も大量にあります。これまで、大量で短納期の翻訳が困難だと思われてきたときは無かった仕事が、コンピュータの力を借りて可能になると、どんどん翻訳されるようになりました。生産技術の進歩が仕事を生み出すきっかけになっているというわけです。
 
今回は、翻訳生産性を高めるために開発されてきた機械翻訳を含めた翻訳支援ツールについて見てまいりましょう。
 

■機械翻訳と翻訳支援ツール

 
翻訳には専用の翻訳支援ツールが開発されています。
その種類は大きく分けて2つあります。
・訳文を自動的に出力してくれる「機械翻訳」ツール
・対訳データベースを活用して人間が翻訳する「翻訳メモリ」ツール
 
 機械翻訳は、当初期待を持って迎えられましたが、品質レベルの低さから冬の時代を迎えます。その一方で、対訳データベースを中心とする、翻訳メモリツールが翻訳業界(とくにローカライズ分野)で実用化し、総合的な翻訳文書管理ツールとして発展してきました。
最近では、翻訳需要の爆発的増大により、翻訳メモリに機械翻訳を統合したツールが標準的になってきています。
 

●機械翻訳の略史

 
 機械翻訳が研究され始めたのはコンピュータがつくられて間もない1940年代の終わり頃かだと言われています。その後、1957年10月4日にソ連の人工衛星スプートニクの打ち上げが成功すると、ロシア語を中心とする大量の翻訳を短期間で行う必要性が生じ、巨額の研究費が投じられるようになって、アメリカの機械翻訳研究はピークを迎えます。この年、N. チョムスキーが句構造文法理論を提唱しましたが、この言語理論はコンピュータで扱うのに適していたので、1960年頃から機械翻訳研究に取り入れられるようになりました。
日本でも、1957年頃から機械翻訳の研究が始まり、1959年には九州大学の「KT-1」、通産省工業技術院電気研究所の「やまと」といった機械翻訳システムが開発されました。
 
 1960年代に入ると、世界各国で翻訳の研究が行われ、機械翻訳への期待が高まりましたが、研究が進むにつれ、自然言語を扱う困難さが認識され、行き詰りを見せました。1965年8月に、機械翻訳は質とコストのどちらも人間の翻訳には及ばない、もっと基本的な研究をすべきだという内容のALPAC報告書がアメリカ国立アカデミーに提出されました。その結果、研究費が出されなくなり、機械翻訳の研究は一気に下火になったのです。ただし、その後も細々と地道な研究が続けられました。
 
 日本では、1982年から4年間、科学技術庁(現文部科学省)のプロジェクトが進められ、Mu という機械翻訳システムが開発されました。そして、1984年には、日本初の商用機械翻訳システム発売が富士通より発売され、実用化時代に入ったのです。
 
 1990年には、パソコン通信のNIFTY Serve で機械翻訳サービスが開始され、続いて、機械翻訳出力文を人間が修正する「後編集サービス」が株式会社バベルによって提供されるようになったのは前回書きました。ちなみに、機械翻訳のオペレータであるMTスペシャリスト養成講座がバベル翻訳外語学院によって開始されたのは1991年のことです。



(当時の「翻訳の世界」に掲載された「MTスペシャリスト養成講座」の広告)

 この時期は、翻訳会社でも機械翻訳システムを導入するところが現れ、翻訳生産に利用されましたが、訳文品質レベルが低く、修正に手間と時間とコストがかかり、生産性を向上させるツールとしては不十分であることが次第に判明してきました。
 
 1994年になると、9,800円という衝撃的な価格のPC版翻訳ソフト「コリャ英和!」がカテナから発売され、大喜びしたのを昨日のことのように覚えています。
 
 1995年にはWebページのレイアウトを保ったまま翻訳するWebブラウザ連動型の翻訳ソフトPENSEE for Internet」が発売され、インターネットの普及と相まって、一般ユーザーに機械翻訳が広まっていきました。
 
 その後、数多くの翻訳ソフトが発売され、機械翻訳ブームを迎えましたが、訳文の品質はそれほど改善されず、翻訳者が訳文を作成する道具としてはあまり普及しませんでした。つまり、原文を理解し適切な表現で訳文を作成する翻訳者の役割をコンピュータに任せることに大きな反発があったということです。その代り、翻訳エンジンを持たない「翻訳メモリ」機能を中心とする翻訳支援ツールがローカライズ翻訳などで使用されるようになり、翻訳作業に必要不可欠のツールとなって現在に至っています。
 
 2000年ごろから、対訳文書データを機械的に統計処理することで作成できる翻訳エンジンが開発されるようになり、コンピュータの高機能化、インターネットの普及による電子文書の増大、翻訳支援ツールによって大量に蓄積された翻訳メモリ(対訳文書)のおかげで急速に訳文品質が向上し、実用化されています。
 
(アジア太平洋機械翻訳協会:日本の機械翻訳の歴史
http://www.aamt.info/localportal/japan/rekishi.htm#1984-1
 

●機械翻訳の方式

 
機械翻訳の方式は時代とともに変化しており、大きく次の3つに分けられます。
 
(1) 文法ベース機械翻訳方式
 伝統的な機械翻訳方式としては、対訳辞書を用いて単語を置き換えるだけのものや、特定の言語に依存しない「中間言語」によって翻訳するものなどが研究されましたが実用には至っていません。

その中で、今日まで続いているのが文法ベース機械翻訳方式で、トランスファ方式とも呼ばれています。

この方式では、①解析→②変換→③生成のステップで翻訳を行います。
①「解析」ステップでは、源言語の形態素解析、構文解析を行う(意味解析を行う場合もある)。
②「変換」ステップでは、源言語の構造を目標言語の構造に変換(トランスファ)する。このステップでは、語彙的トランスファ、構文トランスファが行われる。
③「生成」ステップでは、目標言語の構文や意味構造に合わせた訳文を生成する。
 
このように、言語知識と自然言語処理の技術を応用したシステムとなっています。
現在、日本で発売されている翻訳ソフトはほとんどがこの方式です。
文法ベース機械翻訳の難点は、人間が文法規則をシステムに登録する必要があり、言語の持つ例外規則を網羅することは不可能であるため、訳文品質の改良に限界があることです。
 
(2) 用例ベース機械翻訳方式
 この方式は、1984年に機械翻訳研究の第一人者である長尾真先生が「A framework of a mechanical translation between Japanese and English by analogy principle」で提案した方法で、EBMT (example based machine translation:用例に基づく機械翻訳) と呼ばれています。
これは、文法ベース機械翻訳の限界を打ち破るために、翻訳例の中から似た例を見つけて訳文を作成するというものです。
 
(3) 統計ベース機械翻訳方式
 統計ベース機械翻訳は、1990年にIBM Watson research Center のブラウンらによって提案されました、大量の対訳文を統計処理することで作成した言語モデルと翻訳モデルによって翻訳する方式であり、SMT (statistical machine translation) と呼ばれています。
この方式では、高度な言語知識がなくても統計処理によって自動的に翻訳エンジンを構築でき、大量の対訳ファイルさえあれば原則的にどの言語対にも応用できます。2000年頃からこの方式の機械翻訳が実用化され、現在では主流になってきています。

 また、統計ベースの機械翻訳は、翻訳メモリ型の翻訳支援ツールにも組み込まれるようになってきました。翻訳メモリに完全マッチがない場合に、機械翻訳文が参考訳として提案される仕組みになっています。翻訳者は機械翻訳文を修正して翻訳メモリに登録することで完成訳として再利用できます。これは1990年代にさかんに行われた後編集(ポストエディット)の復活であり、時代が一巡りした感があります。
 
 統計ベースの機械翻訳が翻訳メモリツールに統合されることにより、翻訳者の役割が「ポスト・エディティング」にシフトする可能性がある。
Anthony Pym: Translation skill sets in a machine translation age, 2012
http://usuaris.tinet.cat/apym/on-line/training/2012_competence_pym.pdf
 
【関連情報】
 
Google翻訳が進化 日本語にもニューラルネット適用、自然な訳に APIも公開

http://www.itmedia.co.jp/news/articles/1611/16/news085.html
 
 米Googleは11月15日、ニューラルネットワーク技術を活用した新しい機械翻訳システム(Neural Machine Translation)を、日本語など8言語に適用したと発表した。従来に比べてより自然な翻訳が可能になり、「飛躍的な前進」としている。
 

●翻訳支援ツール

 
 1965年のALPAC(Automatic Language Processing Advisory Committee:自動言語処理諮問委員会)レポート、つまり「機械翻訳は必要ない。今後は言語の基礎研究と翻訳業務の改善に専念すべきである」という報告書により、アメリカでの機械翻訳研究は一気に冷え込み、代わって 翻訳支援ツールが開発されるきっかけとなりました。
 
 これまでにも触れてきましたが、機械翻訳エンジンを持たない、翻訳メモリ(対訳データベース)を中心機能とするソフトウェアが、翻訳作業を支援するツールとして、特にローカリゼーションの世界で利用されるようになり、翻訳支援ツールとして定着しました。このツールは、一般的にCAT (Computer Aided/Assisted Translation) ツールと呼ばれています。
現在でも最大のシェアをもつ翻訳支援ツール「Trados Translatior’s Workbench」が誕生したのは1994年で、1997年には、Microsoft 社が社内用の翻訳メモリとして Tradosを導入して一気に広まりました。
 
 この当時は、Webブラウザ連動型の翻訳ソフトが登場して注目を集めていましたが、翻訳業界では、翻訳ソフトは一般ユーザー(素人)のツールであり、プロの翻訳者が使うのは翻訳ソフトではなくCATツールであるという考えが支配的でした。
 
(SDL TranslationZone.com: Trados 30年の進化
http://www.translationzone.com/jp/campaigns/trados-30-anniversary-tab4.html
 

●今回のまとめ

 
今回は機械翻訳を中心とする翻訳支援ツールの概略を駆け足で見ました。
実際に、翻訳支援ツールを使用するかどうかにかかわらず、翻訳者は機械翻訳や翻訳メモリについて正しく理解しておくことが必要です。
 
 バベルプレスの「翻訳の世界」では創刊当時から機械翻訳に関する記事を積極的に掲載しています。記事の目次と概略は以下のMT研究会のページで見ることができます。
 
「翻訳の世界」で辿る機械翻訳の変遷

http://www.babel-edu.jp/mtsg/report/etrans30/honse-mt.htm
 
 次回は、「翻訳支援ツールとは何か」というタイトルで、本連載のメインテーマである翻訳支援ツールを重点的に取り上げます。
お楽しみに!
 
*みなさんのコメントをお待ちしております! 以下のフォームに書き込んでください。

 

小室誠一(こむろせいいち)
旅行会社、翻訳会社を経て、現在はフリーランスのローカライズ翻訳者&レビューアとして多忙を極めている。20種類以上の翻訳支援ツールを活用し、日夜生産性向上に努める。
バベル翻訳大学院で「翻訳支援ソフト徹底活用(Trados編)」などのIT科目を担当。

 

コメント

名前:
Eメールアドレス:
コメント:
ファイル

画像の英字5文字を入力して下さい。:
パスワード:

翻訳に役立つソフトウェア活用法

eTrans Technolgy 研究室宛メール

お名前:必須

Eメールアドレス:必須

Eメールアドレス(確認用):必須
(確認の為、同じものをもう一度入力してください)

記事タイトル:必須


メッセージ:

お問い合わせ種類:必須




ファイル添付: