■翻訳に役立つソフトウェア活用法
第1回 「EKWords - 高速キーワード抽出・集計」
投稿日時:2010/08/25(水) 10:39
第1回目は、日本語と英語のテキストデータからキーワードを抽出して集計する「EKWords」を取り上げます。
「EKWords」は以下のサイトからダウンロードできます。(フリーウェア)
http://www.djsoft.co.jp/products/ekwords.html
翻訳をする際に事前にキーワードを抽出して訳語を決めておくことは、作業を効率化するために重要な作業です。また、文章を素早く読んだり、要約文を作成する際にもキーワード抽出が役に立ちます。
キーワード抽出ソフトはたくさんありますが、操作が簡単で、翻訳やリーディングにすぐ利用できるものはそれほど多くありません。今回紹介する「EKWords」は、操作が非常に簡単で必要な機能が備わった、十分に実用的なソフトです。何よりも、英語の連語を効率よく抽出できるのが便利です。
<使い方>
処理したいテキストデータを画面の左側に、コピー・アンド・ペーストして、「解析」ボタンをクリックするだけで、右側の画面に解析結果が表示されます。[図1]
[図1]
解析結果画面の項目は、「キーワード」「種別」「語」「出現」「色」となっています。
「キーワード」には、貼り付けたテキストから抽出された語句が表示されます。
「種別」には、キーワードが一語か複数語句かが、「単」と「複」で表示されます。
「語」はキーワードの語数です。
「出現数」はキーワードの出現回数です。
「色」の欄をクリックすると、プルダウンのカラーメニューが表示されます。7色の中から任意の色を選択すると、左画面のテキストのキーワードがすべて選択した色になります。
キーワード一覧の任意のキーワードをダブルクリックすると、左画面のテキストの該当するキーワードが選択状態になり反転表示されますので、そのキーワードがどの部分にあるのかがすぐに分かります。複数出現した場合は、ダブルクックするごとに順番に選択された語句が移動します。
キーワード一覧の表示はデフォルトでは左寄せですが、「右寄せソート」ボタンをクリックすれば右寄せで表示されます。語句の並びも右側から並び替えられます。[図2]
[図2]
また、「フィルタ」機能を使うと、指定した語句でキーワード一覧を絞り込むことができます。
画面の右上では、いくつかのオプションを設定できます。
「英文」-- 英文テキストの場合にチェックを入れます。入れないと、1語ずつ出現数の多い順に表示されるだけで、「連語」が抽出されません
「英文」にチェックを入れるとその下の4つのオプションが選択できるようになります。
「冠詞を無視する」-- チェックを入れると、 a, an, the を除いて集計作業が行われます。冠詞の種類が重要な手掛かりになる場合以外はチェックを入れると良いでしょう。
「冠詞を the に統一する」-- 冠詞の種類よりも有無が需要な手掛かりになる場合に利用します。チェックを入れると、a, an が the に置き換えられて集計作業が行われます。「冠詞を無視する」にチェックを入れると、当然こちらはチェックできなくなります。
「末尾の進行形単語を除外」-- 最後が "...ing" で終わるキーワードが除外されます。
「数字記号で始まる語を除外」-- 特許明細書などのように、数字記号付きでキーワードを抽出するのでなればチェックを入れます。
「かな交じり語の識別除外」-- 日本語の場合のオプションなので、「英文」にチェックが入っていると選択できません。このオプションを選択すると、ひらがなが無視されるので、漢字とカタカナのキーワードを効率よく抽出できます。
<集計結果の利用>
集計結果画面の中で右クリックすると、「全てコピー」ボタンが表示されるのでクリックします。[図3]
[図3]
集計結果の内容がタブ区切りでコピーされるので、Excelなどの表計算ソフトに貼り付けるとそのまま一覧表になります。[図4]
[図4]
内容をチェックしたうえで訳語を入力すれば対訳用語集として利用できます。
翻訳ソフトに専門用語辞書をセットして一括出力すれば迅速に用語集を作成することも可能です。
また、要約文を作成する際に、抽出したキーワードをWordの検索と置換機能を使ってボールド表示させておけば、効率的に必要なセンテンスを選別できるでしょう。
アイデア次第でいろいろと活用できます。お試しください。
コメント
プロフィール
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
編集部宛投稿メール
最新記事
- 【試用レポート】『PC-Transer 翻訳スタジオ V19』 (2011/11/24)
- 第13回 便利なWebスクラップソフト「紙copi Lite」 (2011/02/25)
- 第12回 辞書機能の優れた翻訳ソフト「LogoVista PRO 2011」 (2011/02/10)
- 第11回 辞書ソフトの定番「Personal Dictionary」 (2011/01/25)
- 第10回 便利なワードカウントソフト「Count Anything」 (2011/01/10)
- 第9回 手軽に使える対訳ファイル作成ツール「AutoAlign」 (2010/12/25)
- 第8回 みんなで使える翻訳支援統合エディタ「QRedit」 (2010/12/10)
- 第7回 辞書ソフト「超辞典DUO」活用法 (2010/11/25)
- 第6回 クラウド型の翻訳ツール「Google 翻訳者ツールキット」 (2010/11/10)
- 第5回 総合的翻訳支援ソフト「PC-Transer 翻訳スタジオ2011」 (2010/10/25)
- 第4回 英文ライティングに役立つコンコーダンサー「AntConc」 (2010/10/10)
- 第3回 フリーの翻訳メモリソフト「OmegaT」 (2010/09/25)
- 第2回 優れた用語管理ツール「xTerminology」 (2010/09/10)
- 第1回 「EKWords - 高速キーワード抽出・集計」 (2010/08/25)
ブログ一覧
- 【ブログ】翻訳テクノロジーあれこれ by 小室誠一
- <新>翻訳に役立つソフトウェア活用法
翻訳ソフトや翻訳メモリソフトに限らず、翻訳業務の効率化に役立つソフトウェアを取り上げて、その活用法を紹介します。 - ■翻訳に役立つソフトウェア活用法
ブログ 7日間のアクセスランキング
- 1:第3回 フリーの翻訳メモリソフト「OmegaT」(55pv)
- 2:第9回 手軽に使える対訳ファイル作成ツール「AutoAlign」(48pv)
- 3:翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」(42pv)
- 4:第4回 英文ライティングに役立つコンコーダンサー「AntConc」(35pv)
- 5:第10回 便利なワードカウントソフト「Count Anything」(32pv)
- 6:第13回 テキストファイル比較ソフト「WinMerge」(30pv)
- 7:第1回 簡単にTMXが作成できる「Align Assist」(29pv)
- 8:みんなの自動翻訳をMemsourceで使ってみる(1)(27pv)
- 9:第2回 高機能な用語集検索ソフト「Xbench」(20pv)
- 10:みんなの自動翻訳をMemsourceで使ってみる(2)(16pv)
- 11:第1回 「EKWords - 高速キーワード抽出・集計」(15pv)
- 12:DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり(15pv)
- 13:第11回 辞書ソフトの定番「Personal Dictionary」(14pv)
- 14:第7回 校正・推敲支援ツール「Tomarigi」(12pv)
- 15:第2回 優れた用語管理ツール「xTerminology」(11pv)
- 16:第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」(11pv)
- 17:機械翻訳支援ツール「GreenT」試用レポート(その2)(8pv)
- 18:第12回 クリップボード監視ソフトなら「クリップアウト2000」(7pv)
- 19:DeepLの訳文が読みやすい理由(7pv)
- 20:翻訳者の作業内容が変化している?(6pv)