大きくする 標準 小さくする

「翻訳支援ツールの必要性」 第3回 翻訳支援ツールとは何か ― 小室誠一

2017/01/11

翻訳支援ツールの必要性 


第3回 翻訳支援ツールとは何か

小室誠一


 前回、翻訳生産性向上のために開発された機械翻訳が必ずしも翻訳の現場に受け入れられなかった状況を駆け足で見ました。特に、ALPAC報告書以降は機械翻訳の研究自体が下火になりましたが、一方で、翻訳生産管理や言語資源の活用を目的とするツールが開発され、大量の電子データを短期間で翻訳する「ローカライズ」翻訳の世界で定着しました。これは、一般に翻訳支援ツールまたはCAT (Computer Assisted/Aided Translation) ツールと呼ばれて、機械翻訳と区別されています。
 
今回は、まずローカライズ翻訳について復習してから、翻訳支援ツールとはどのようなものかを見てまいりましょう。
 

■ローカリゼーションとは

 
 「現地化」「地域化」を意味するローカリゼーション (Localization = L10N) を一言で表現すると、「海外市場での特質、特性に合うように製品を改良する」ということになる。
(板垣政樹, 小坂貴志, 大野由美: ソフトウエアローカリゼーション実践ハンドブック. ソフト・リサーチ・センター,1999)
 
 ソフトウェアのローカリゼーションの作業内容には、技術翻訳、ソフトウェアの機能変更、ソフトウェアのデザイン変更などがあります。この中で翻訳者がかかわるのが技術翻訳、つまりメニュー項目やヘルプ文書などのテキスト情報を現地化する、リテラルローカリゼーションです。この作業では、ソフトウェア内のテキストをすべて抽出し、翻訳後に現地化されたテキストをソフトウェアに書き戻すため、必然的に翻訳支援ツールを使用することになります。ソフトウェア内のテキストは繰り返しが多く、定型化しており、用語や文体は厳密に統一するする必要があります。そのため、ローカリゼーションで使用される翻訳支援ツールは、テキストの抽出および書き戻し機能に加えて、対訳データベース(翻訳メモリ)機能と用語ベース機能が重要な要素となっていいます。
 
 翻訳生産に最もICTを活用している分野が「ローカリゼーション」です。コンピュータや技術分野の翻訳分野では、翻訳作業をローカリゼーションとして捉え、翻訳支援ツールなどを駆使した作業の効率化に勤めています。
 
 日本では、翻訳企業の取り扱い3大分野の一つがローカリゼーションを含むコンピュータ翻訳です。日本翻訳連盟の「2013年度 翻訳白書」によると、翻訳企業の主要な取り扱い分野は、「科学・工業技術文書」、「ビジネス文書(契約書・金融・経済含む)」、「コンピュータ(ソフトウエア・ハードウエア・ローカリゼーション)」が3大分野で、取り扱い言語は、英語が71.1%、次いで中国語が11%となっています。

 

●翻訳関連データの標準化

 
翻訳生産業務の効率化を推進するため、ローカリゼーション業界では各種ファイル形式の標準化が行われています。
 
 1990年に設立されたローカリゼーション業界の国際団体、LISA (Localization Industry Standards Association) では、その標準化委員会のOSCAR (Open Standard for Container/Content Allowing Reuse) が、以下のような翻訳関連のデータを標準化しました。ちなみにLISA は2011年2月に活動を終了しています。
 
・Translation Memory eXchange (TMX) ― 翻訳メモリの標準形式。翻訳支援ツールは翻訳メモリを独自形式の形式で保持していますが、XMLベースのTMXに変換することで互換性を保つことができます。OmegaT は直接TMXを翻訳メモリとして使用しています。

・Segmentation Rules eXchange (SRX) ― 翻訳支援ツールでは原文を基本的にセンテンス単位に分割して翻訳を進めます。センテンスに分割する規則を交換するための規格が SRX です。

・Term-Base eXchange (TBX) ― 用語データの交換規格。LISA の標準規格ですが、2008年にはISO基準(ISO 30042)になりました。
 
 さらに重要な規格は、XMLの応用規格を標準化する団体のOASISが作成した、翻訳データの交換規格、XLIFF (XML Localization Interchange File Format) です。
翻訳者はこれらの標準規格について正しい知識を持つ必要があります。

 

●翻訳生産フロー

 
 ローカライズ翻訳では、複数のメンバーによるプロジェクトを管理するために、標準的なワークフローに基づいて翻訳作業を行っています。翻訳支援ツールはそれらのプロジェクトを管理するツールとしての役割も持っているので、ワークフローについても確認しておく必要があります。
 
 とはいっても、各翻訳会社によってワークフローが微妙に異なることがあります。ここでは、ISO 17100(Translation services — Requirements for translation services: 翻訳サービス―翻訳サービスに関する要求事項)で規定されている翻訳ワークフローを取り上げてみましょう。というのは、このISOのワークフローがローカライズ翻訳のワークフローを下敷きにしていると思われるからです。
 
 このISO 17100 は、国際標準化機構(ISO: International Organization for Standardization)が作成し、2015年5月1日に発行したもので、翻訳サービスのプロセスを定着させ、品質を向上させるのが目的です。翻訳サービス提供者が対象となっていますが、サービスにかかわる作業者に対する要求事項が記載されているので、個人翻訳者にとっても重要です。
 
 ISO17100で示されている翻訳ワークフローは、大きく「Pre-production process and activities(制作前のプロセスおよび活動)」、「Production process(制作プロセス)」、「Post-production process(制作後プロセス)」の3つの工程からなっています。
 
 「制作前のプロセスおよび活動」は、引き合い、見積もり、クライアントとの合意、情報の取り扱い、プロジェクトの準備、翻訳リソースの管理など、翻訳サービス提供者での作業プロセスとなっている。翻訳者の業務と直接関係していないが、概略を知っておくことが望ましい。
 
「制作プロセス」は実際の翻訳生産プロセスであり、翻訳者はこのプロセスを熟知しておく必要がある。
 

・翻訳
 目標言語の言語様式や関連のプロジェクト仕様など、翻訳プロジェクトの目的に従って翻訳しなければならない。このプロセス全体を通じて、翻訳者は以下の内容に関して、この国際規格に合致したサービスを提供しなければならない。

a)特定の領域、クライアントが提供するターミノロジーやその他の参照資料を順守し、翻訳全体を通じて用語の一貫性を維持すること。
b)目標言語内容の意味が正確に表現されていること。
c)目標言語に関して文法、スペル、句読法、発音記号、その他記述様式が適切であること。
d)語彙の結束性と言葉遣いが適切であること。
e)著作権者やクライアントのスタイルガイドを順守すること。
f)地域特性や、適用すべき基準に従うこと。
g)書式を守ること。
h)目標言語内容の読者層と目的に適すること。
 
・チェック(自己チェック)
 少なくとも、翻訳者自身が訳文全体について、意味・文法・スペルなどの問題がないか、欠落やその他の誤りがないか、関連する翻訳プロジェクトの仕様を順守しているかなどを自己チェックしなければならない。
翻訳者は納品前に、必要な修正処理をすべて行わなければならない。
 
・リバイズ(バイリンガルチェック)
 翻訳サービス提供者(TSP: Translation Service Provider)は、翻訳作品を確実に訂正しなければならない。
 リバイザーは、翻訳者とは別の作業者でなくてはならないが、起点言語と目標言語に関して、翻訳者と同等の能力を有していなければならない。リバイザーは起点言語と目標言語を突き合わせて、誤りや問題点、目的に適合しているかどうかなどをすべてチェックしなければならない(バイリンガルチェック)。ここでは、「翻訳」で列挙した項目ついて、起点言語と目標言語を比較する作業も行わなければならない。
 
・レビュー(モノリンガルチェック)*必須ではない
 翻訳サービスの仕様書にレビューが含まれている場合、翻訳サービス提供者は、翻訳作品を必ずレビューしなければならない。翻訳サービス提供者はレビューアに対して、翻訳作品が合意した目的と専門分野に適合しているか評価するためにレビュー(モノリンガルチェック)を実施し、翻訳サービス提供者が修正処理を実施すべきか勧告するよう要求しなければならない。翻訳サービス提供者は、修正処理をするようレビューアに指示することもできる。レビューは、専門分野の点から正確であることや関連する文章様式が守られていることをチェックする。
 
・校正(プルーフリーディング)*必須ではない
 クライアントと翻訳サービス提供者の契約やプロジェクト仕様書に、クライアントへの納品前の校正が含まれている場合、翻訳サービス提供者は校正サービスを必ず行わなければならない。
 校正によって重要な欠陥が見つかった場合、翻訳サービス提供者は、それらの欠陥を訂正するために適切な修正処理・修正行動を取らなければならない。
 
・最終検品および引き渡し
 翻訳サービス提供者は、翻訳サービスの成果物をクライアントに納品する前に、仕様書に照らしてプロジェクトの最終検品を実施するためのプロセスを整備しなければならない。翻訳サービス提供者は、最終検品と引き渡しを済ませた後に、請求および支払手続きを行うべきである。
 最終検品によって、仕様書に適合しない欠陥が見つかった場合、翻訳サービス提供者は必要な修正処理・修正行動を取らなければならない。
 
「制作後プロセス」は、フィードバックと終結管理です。(翻訳者にとってフィードバックは大切な要素です)。
 
 このように、ISO 17100 では、翻訳者の業務として、「翻訳」と「セルフチェック」を規定しており、翻訳者以外のリバイザーによる「リバイズ」(バイリンガルチェック)を必須項目としていることに注目しましょう。

 

■翻訳支援ツールの基本機能
 
 機械翻訳エンジンを持たない、翻訳メモリを中心機能とするソフトウェアが、翻訳作業を支援するツールとして、特にローカリゼーションの世界で利用されるようになり、翻訳支援ツールとして定着したことはすでに述べました。
 
ここでは、翻訳支援ツールの基本機能はどのようなものかを見てまいりましょう。
 
(1)翻訳するテキストを抽出する
 WordやExcel、PowerPointなどOfficeソフト、あるいはInDesignなどのDTPソフトのファイル、さらにはHTMLやXMLなどのマークアップファイルから翻訳すべき原文を抽出してくれる機能です。
 翻訳支援ツールを使わない場合は、それぞれ対応するソフトウェアでファイルを開いて、原文に上書きする形で翻訳することになります。この方法では原文のレイアウトを崩してしまったり、翻訳すべき文を特定しにくかったり(HTMLやXMLなど)して、翻訳生産性が低くなります。
 
(2) テキストをセグメントに分割する
 文書を管理するという面から、通常はセンテンス単位でテキストを分割します。言語によって、分割する目印が異なります。例えば、英文ならピリオドがセンテンスの目印になりますが、「etc.」のような略語があっても不適切に分割されないようになっています。センテンス単位の対訳は翻訳メモリとして利用されます。
 
(3) 対訳セグメントを翻訳ユニットとして管理する
 翻訳するテキストを抽出した段階で、テキストの順番や文書構造の情報も含めた対訳形式に変換します。これにより、単なるテキストだけでなく、翻訳情報が付加された対訳ファイルを作成することができます。最近では業界標準のXLIFF形式がよく使われています。
 
(4) 翻訳メモリ(対訳データベース)を登録・検索する
 対訳文を保存し、高速で検索して再利用できるようにしたのが「翻訳メモリ」です。翻訳しようとしている文を翻訳メモリで検索した結果、原文が完全に一致したものが見つかれば、その訳文が対訳エディタの訳文欄に自動的に取り込まれます。完全一致がない場合でも、似たような文が見つかれば、参考訳文として検索結果画面に表示されるので、修正して利用します。翻訳が確定した訳文はすぐに「翻訳メモリ」に登録され、それ以降の検索対象となります。
 翻訳メモリは翻訳支援ツールの主な機能の一つで、用語ベース機能とともに、翻訳プロセスに組み込まれ、生産の効率化に役立っています。
 
(5)用語集を一括検索する
 翻訳メモリの検索と同時に、用語集の一括検索が実行されます。マッチした用語の訳語は簡単な操作で訳文に挿入できます。用語集は翻訳時に1件ずつ登録したり、Excelファイルなどから一括して登録したりできます。用語の統一には欠かせない機能です。
 
(6) 訳文を元のフォーマットで出力する
 翻訳支援ツールにおける最大の特長の一つが、原文のレイアウトを保持したまま翻訳できるということです。原文のファイル形式をツールに読み込んで対訳形式にする際に、レイアウトが「タグ」に変換されて保持され、訳文生成時に元のファイル形式およびレイアウトで出力されます。
 
 この他、生産管理機能、例えばワードカウント、翻訳ステータスの表示、ファイル送信ステータスの表示などがありますが、これらは翻訳者というよりプロジェクトマネージャー(PM)が利用する機能となります。

 

●良く利用されている翻訳支援ツール

 
実際にどのような翻訳支援ツールが使われているでしょうか。
一例として、「ProZ.com」でのアンケートの結果を見てみましょう。
(Translator T.O. CAT tool use by translators: what are they using?,March 28, 2013,
http://prozcomblog.com/2013/03/28/cat-tool-use-by-translators-what-are-they-using/
 
 世界各国の300,000 を超える翻訳者や通訳者が登録している、世界最大級の翻訳者コミュニティ「ProZ.com」では、翻訳支援ツールに関する調査を行っています。どのツールを使っているか、ツールを使うことになった経緯はどうか、好きなツールは、嫌いなツールは、などについてフルタイムのプロ翻訳者を対象に行われています。

 回答者の多くは5年以上翻訳業務を行っており、その内の30パーセント以上が10年以上のキャリアがあります。回答者の中心年齢は25~30才。世界中の3000人以上のフルタイムのプロ翻訳者がこの調査に回答しています。
調査の結果、利用されている翻訳支援ツールの1位は SDL Trados、2位がWordfast、3位がmemoQ となっています。
https://blogproz.files.wordpress.com/2013/03/cat_tools_used.png
 
 

■翻訳支援ツールの機能概要

 
もう少し具体的に翻訳支援ツールの機能を見て行きましょう。
ここでは、SDL Trados StudioとmemoQを取り上げます。

 

●SDL Trados Studio

 
SDL Trados Studio は、総合的な翻訳支援ツールであり、大きく分けて次の2つの機能が搭載されています。
(1) 主にプロジェクト マネージャが使用する「プロジェクト管理」機能
(2) 主に、翻訳者、編集者、校正者などが使用する「翻訳支援」機能

 
 
「プロジェクト管理」機能
 プロジェクト作成の自動化、プロジェクトデータの一元管理、プロジェクトの記録が可能であり、プロジェクト マネージャ用のツールが用意されています。プロジェクト マネージャは翻訳プロジェクトを新規作成し、プロジェクト パッケージを作成することによって、タスクをプロジェクトのチームのメンバーに配布します。

 プロジェクトチームのメンバー(翻訳者、レビュー担当者、校正者など)は、翻訳用、レビュー用にファイルを開くことができます。翻訳用モードとレビュー用モードではエディタのレイアウトが変化します。作業が完了したら返却パッケージを作成して、プロジェクトマネージャに送信します。
 
プロジェクトの設定項目としては以下のものがあります。
・原文言語と訳文言語
・ファイルに適用する翻訳メモリ
・翻訳メモリのオプション
・ファイルに適用する用語ベース
・使用する AutoSuggest 辞書
・一括処理の設定
・ファイルの種類の設定
 
「翻訳支援」機能
翻訳者が効率的に作業できるように多くの機能が用意されています。
 
対訳エディタの機能としては以下のものがあります。
・原文文書のテキストとその翻訳が、1つのエディタウィンドウに並列表示される
・テキストは WYSIWYG(What You See Is What You Get:画面で見たまま)形式で表示されるので、翻訳テキストと原文テキストの書式が一致しているかどうかを確認できる
・翻訳メモリの標準的な操作が多数自動化されている(「確定」で翻訳メモリ登録、マッチした訳文を自動入力など)
・QuickPlace を使用して、原文分節から訳文分節に認識されたタグや書式を挿入できる
・翻訳が完了したら、原文文書の翻訳済みバージョンを生成できる
 
 訳文の検証機能として、翻訳済みテキストのエラーや不統一をチェックする検証ツールがあります。文書の検証は、翻訳中または翻訳後にいつでも行うことができます。
 実行できる検証チェックには、文書検証機能(QA Checker)、用語検証機能、タグの検証機能、XML 検証機能などがあります。
 
「翻訳メモリ管理」として、以下のような機能があります。
・翻訳メモリを作成する
・翻訳メモリを開く
・翻訳メモリで翻訳単位を編集および削除する
・翻訳単位にカスタムフィールド値を割り当てる
・翻訳メモリ データを検索およびフィルター処理する
・翻訳メモリにコンテンツをインポートする
・翻訳メモリからコンテンツをエクスポートする
・言語リソース テンプレートを作成する
・整合ツール で翻訳済み文書を整合し、整合の結果を翻訳メモリに送信する
 
整合ツール
 整合ツールは以前に翻訳された文書を翻訳メモリに追加できるように翻訳単位に変換するためのツールです。

 

●memoQ

 
 memoQ もSDL Trados Studioと同様、総合的な翻訳支援ツールですが、翻訳サーバとの連動や言語資産の活用など、いくつか先進の機能が用意されています。
 
 
 memoQ の主要コンポーネントは、翻訳メモリ、ライブ文書資料、用語ベース、翻訳エディタです。通常の翻訳メモリ機能の他に、過去の翻訳を翻訳メモリと同様の手順で直接利用できるライブ文書機能、単語やフレーズといった「用語」を複数言語分格納する機能、プロジェクトの開始時に用語ベースがない場合に、ソース文書分析処理を実行して「用語と思しきフレーズ」を検出する「用語抽出処理」など、目新しい機能が搭載されています。
 
「プロジェクト」
memoQ では翻訳のタスクをプロジェクトという単位で管理します。プロジェクトには以下のものが含まれます。
・翻訳文書
・ライブ文書資料(バイリンガル文書、モノリンガル文書、バイナリファイル)
・翻訳メモリ
・用語ベース
・ ミューズ: 翻訳中に、参照資料内のセグメントを分解して提示される情報
 
「翻訳グリッド」
 文書のタブでは、文書のコンテンツが 左右対訳形式で表示される。左列は原文セグメント、右列のセルに訳文を入力します。
 
「セグメントの確定」
 セグメントの翻訳が完了したら、Ctrl + Enter を押すか、[翻訳]リボンタブから [確定]をクリックします。これにより、翻訳されたセグメントが保存されると同時に作業中翻訳メモリに登録されます。処理が完了するとカーソルが次のセグメントに進みます。
 
「翻訳結果の利用」
 セグメントを確定すると、自動的に次のセグメントがアクティブになると同時に、自動的に翻訳結果リスト上の最適一致テキストが挿入されます。
 
「オリジナルと同じ形式で訳文を保存」
翻訳済み文書を「オリジナルと同じ形式で」作成できます。
 
「バイリンガルファイル形式で文書を保存」
memoQ で開けるバイリンガル文書をエクスポートすることができます。
 
「オンラインプロジェクトで作業」
 オンラインになっている時には、同期は連続的に実行されます。オフラインになった時には文書はデスクトップドキュメントとして動作します。

 

●今回のまとめ

 
 今回は、ローカライズ翻訳のワークフローを確認し、翻訳支援ツールの機能がどのように役立つかを見てまいりました。
 
 次回は、最終回の総まとめとして、翻訳支援ソフトを活用するにあたり、どのようなスキルが必要になるのかを「情報リテラシーを見直そう」というタイトルで、考えてみたいと思います。
お楽しみに!
 
*みなさんのコメントをお待ちしております! 以下のフォームに書き込んでください。
 

小室誠一(こむろせいいち)
旅行会社、翻訳会社を経て、現在はフリーランスのローカライズ翻訳者&レビューアとして多忙を極めている。20種類以上の翻訳支援ツールを活用し、日夜生産性向上に努める。
バベル翻訳大学院で「翻訳支援ソフト徹底活用(Trados編)」などのIT科目を担当。

 

コメント

名前:
Eメールアドレス:
コメント:
ファイル

画像の英字5文字を入力して下さい。:
パスワード:

翻訳に役立つソフトウェア活用法

eTrans Technolgy 研究室宛メール

お名前:必須

Eメールアドレス:必須

Eメールアドレス(確認用):必須
(確認の為、同じものをもう一度入力してください)

記事タイトル:必須


メッセージ:

お問い合わせ種類:必須




ファイル添付: