<新>翻訳に役立つソフトウェア活用法
第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」
投稿日時:2013/10/10(木) 14:30

第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」

今回も引き続きテキストエディタの紹介です。VxEditorは非常に軽快に動作するテキストエディタですが、他のソフトにはない特色があります。
複数のファイルをまとめて検索するGrep機能は、すでに活用されていることと思いますが、普通のテキストエディタでは、WordやPDFなどのバイナリ文書ファイルを検索することはできません。VxEditorに付属するVxGrepならそれが可能になります。
VxEditor(フリーソフト)は以下のページからダウンロードできます。
http://dr-x.jimdo.com/
「アーカイブ版」と「インストーラ版」があります。
「アーカイブ版」はダウンロードしたファイルを解凍して適当な場所に置いて実行します。
「インストーラ版」はsetup.exeを実行するとデフォルトでC:\Tools\VxEditorにインストールされます。
■VxEditorを使ってみる
早速、VxEditor.exeをダブルクリックして起動してみましょう(図1)。
非常にシンプルな画面です。
このソフトのコンセプトは、ワープロなどメインに使用するソフトを補完するツールとして使用することなので、「高速性」「シンプルなSDI方式のインターフェース」「高機能な検索機能」「文字コードの自動判別」といったところがメインの機能になります。
(図1)
編集のアンドゥは何回でもできます。デフォルトでは10000回となっています(図2)。
こんなに元に戻すことはまずないでしょう。
(図2)
検索置換ではPerl5互換の正規表現が使えます(図3)。
正規表現がうろ覚えでも、検索語と置換語ボックスの右側にあるボタンをクリックすれば、おもな記号を入力できます。
(図3)
筆者がVxEditorの機能の中でもっとも気に入っているのが、画面の半透明化です。
「ウインドウ」→「半透明化」をクリックすると、エディタの画面が透き通って、下の画面がうっすらと見えるようになります(図4)。
これなら、画面を切り替えて背後のページを確認する必要もなくなります。
(図4)
■VxGrepを使ってみる
それではいよいよVxGrepを使ってみましょう。
「検索」→「ファイルから検索」をクリックします(図5)。
(図5)
「VxGrep」画面が開いたら、「検索対象」の右側にある四角いボタンを押してフォルダの指定を行います。左側のボタンがフォルダ、右側のボタンがファイルの指定となります(図6)。
「PDF、WORD、EXCEL、一太郎などからテキスト要素を取り出す」にチェックを入れれば、バイナリ文書の検索が可能になります。
(図6)
それでは試しに、筆者が収集した機械翻訳関連の論文PDFファイル2252個の入った「mt-archive」フォルダを指定して、「post edit」というキーワードで検索してみましょう。
PDFファイルからテキストが抽出され、全文検索されます。
検索結果は2画面で表示されます(図7)。
上の画面はファイル名と検索キーワードを含む行。下の画面は選択した行が含まれる本文。
(図7)
選択した行の上で右クリックすると、小さなメニューが開いて「閲覧」「ファイルを実行」「ファイルを検索」を実行することができます(図8)。
(図8)
「閲覧」をクリックすると本文のテキストが別画面で開きます。
「ファイルを実行」をクリックすると、元のPDFが開きます。ただし、検索キーワードが含まれるページが表示されるのではなく、1ページ目が表示されます。ここが残念なところです。
「ファイルを検索」をクリックすると、このファイルだけ指定した形で検索されます。
検索結果を保存するには「ファイル」→「タグファイルの保存」を実行します(図9)。
(図9)
これで検索結果一覧は保存できますが、PDFから抽出されたテキストを保存したい場合は、「閲覧」で別画面で開いてから「名前を付けて保存」します。
VxEditorのような小回りの利く小道具は、うまく使えば効率化に役立つでしょう。
複数のファイルをまとめて検索するGrep機能は、すでに活用されていることと思いますが、普通のテキストエディタでは、WordやPDFなどのバイナリ文書ファイルを検索することはできません。VxEditorに付属するVxGrepならそれが可能になります。
VxEditor(フリーソフト)は以下のページからダウンロードできます。
http://dr-x.jimdo.com/
「アーカイブ版」と「インストーラ版」があります。
「アーカイブ版」はダウンロードしたファイルを解凍して適当な場所に置いて実行します。
「インストーラ版」はsetup.exeを実行するとデフォルトでC:\Tools\VxEditorにインストールされます。
■VxEditorを使ってみる
早速、VxEditor.exeをダブルクリックして起動してみましょう(図1)。
非常にシンプルな画面です。
このソフトのコンセプトは、ワープロなどメインに使用するソフトを補完するツールとして使用することなので、「高速性」「シンプルなSDI方式のインターフェース」「高機能な検索機能」「文字コードの自動判別」といったところがメインの機能になります。
(図1)

編集のアンドゥは何回でもできます。デフォルトでは10000回となっています(図2)。
こんなに元に戻すことはまずないでしょう。
(図2)

検索置換ではPerl5互換の正規表現が使えます(図3)。
正規表現がうろ覚えでも、検索語と置換語ボックスの右側にあるボタンをクリックすれば、おもな記号を入力できます。
(図3)

筆者がVxEditorの機能の中でもっとも気に入っているのが、画面の半透明化です。
「ウインドウ」→「半透明化」をクリックすると、エディタの画面が透き通って、下の画面がうっすらと見えるようになります(図4)。
これなら、画面を切り替えて背後のページを確認する必要もなくなります。
(図4)

■VxGrepを使ってみる
それではいよいよVxGrepを使ってみましょう。
「検索」→「ファイルから検索」をクリックします(図5)。
(図5)

「VxGrep」画面が開いたら、「検索対象」の右側にある四角いボタンを押してフォルダの指定を行います。左側のボタンがフォルダ、右側のボタンがファイルの指定となります(図6)。
「PDF、WORD、EXCEL、一太郎などからテキスト要素を取り出す」にチェックを入れれば、バイナリ文書の検索が可能になります。
(図6)

ちなみに検索できるファイル形式は以下の通りです(マニュアルから引用)。
.sxw OpenOffice.org Writer
.sxc OpenOffice.org Calc
.sxi OpenOffice.org Impress
.sxd OpenOffice.org Draw
.odt Open Document (text documemts)
.ods Open Document (spreadsheet documemts)
.odp Open Document (presentation documemts)
.odg Open Document (drawing documemts)
.docx/.docm WORD 2007
.xlsx/.xlsm Excel 2007
.pptx/.pptm PowerPoint 2007
.doc WORD ver5.0/95/97/2000/Xp/2003
.xls Excel ver5.0/95/97/2000/Xp/2003
.ppt PowerPoint 97/2000/Xp/2003
.rtf リッチテキスト
.jaw/jtw 一太郎 ver5
.jbw/juw 一太郎 ver6
.jfw/jvw 一太郎 ver7
.jtd/jtt 一太郎 ver8/9/10/11/12
.oas/oa2/oa3 OASYS/Win
.bun 新松/松5/松6
.wj2/wj3/wk3/wk4/123 Lotus 123
.wri Windows3.1 Write
.pdf Adobe PDF
.mht
.html HTML
.eml OutlookExpressのMailエクスポート形式
それでは試しに、筆者が収集した機械翻訳関連の論文PDFファイル2252個の入った「mt-archive」フォルダを指定して、「post edit」というキーワードで検索してみましょう。
PDFファイルからテキストが抽出され、全文検索されます。
検索結果は2画面で表示されます(図7)。
上の画面はファイル名と検索キーワードを含む行。下の画面は選択した行が含まれる本文。
(図7)

選択した行の上で右クリックすると、小さなメニューが開いて「閲覧」「ファイルを実行」「ファイルを検索」を実行することができます(図8)。
(図8)

「閲覧」をクリックすると本文のテキストが別画面で開きます。
「ファイルを実行」をクリックすると、元のPDFが開きます。ただし、検索キーワードが含まれるページが表示されるのではなく、1ページ目が表示されます。ここが残念なところです。
「ファイルを検索」をクリックすると、このファイルだけ指定した形で検索されます。
検索結果を保存するには「ファイル」→「タグファイルの保存」を実行します(図9)。
(図9)

これで検索結果一覧は保存できますが、PDFから抽出されたテキストを保存したい場合は、「閲覧」で別画面で開いてから「名前を付けて保存」します。
VxEditorのような小回りの利く小道具は、うまく使えば効率化に役立つでしょう。
コメント
プロフィール
小室誠一
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
1990年から機械翻訳のユーザーとして活用法の研究を行う。
バベル翻訳大学院で、「翻訳者のためのテキスト処理」「翻訳支援ツール徹底活用」など、ITスキルに関する講座を担当。
編集部宛投稿メール
最新記事
- 第15回 総合的翻訳支援ソフト「PC-Transer 翻訳スタジオ V21」 (2013/12/25)
- 第14回 テキスト解析ソフト「Analyze Assist」 (2013/12/10)
- 第13回 テキストファイル比較ソフト「WinMerge」 (2013/11/25)
- 第12回 クリップボード監視ソフトなら「クリップアウト2000」 (2013/11/10)
- 第11回 便利なユーティリティソフト「PathText」と「WinShot」 (2013/10/25)
- 第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」 (2013/10/10)
- 第9回 翻訳作業に便利なテキストエディタ「Apsaly」 (2013/09/25)
- 第8回 翻訳ユーティリティの定番「Okapi Rainbow」 (2013/09/10)
- 第7回 校正・推敲支援ツール「Tomarigi」 (2013/08/25)
- 第6回 翻訳者のためのHTMLエディタ 「TagAssist」 (2013/08/10)
- 第5回 まだまだ使える「Wordfast Classic」 (2013/07/25)
- 第4回 Chromeブラウザで動く翻訳支援ツール「Isometry」 (2013/07/10)
- 第3回 HTML編集用テキストエディタ「Crescent Eve」 (2013/06/25)
- 第2回 高機能な用語集検索ソフト「Xbench」 (2013/06/10)
- 第1回 簡単にTMXが作成できる「Align Assist」 (2013/05/25)
ブログ一覧
- 【ブログ】翻訳テクノロジーあれこれ by 小室誠一
- <新>翻訳に役立つソフトウェア活用法
翻訳ソフトや翻訳メモリソフトに限らず、翻訳業務の効率化に役立つソフトウェアを取り上げて、その活用法を紹介します。 - ■翻訳に役立つソフトウェア活用法
ブログ 7日間のアクセスランキング
- 1:第3回 フリーの翻訳メモリソフト「OmegaT」(55pv)
- 2:第9回 手軽に使える対訳ファイル作成ツール「AutoAlign」(48pv)
- 3:翻訳精度スコアBLEUを簡単に計算できるツール「シンプルMTスコア」(42pv)
- 4:第4回 英文ライティングに役立つコンコーダンサー「AntConc」(35pv)
- 5:第10回 便利なワードカウントソフト「Count Anything」(32pv)
- 6:第13回 テキストファイル比較ソフト「WinMerge」(30pv)
- 7:第1回 簡単にTMXが作成できる「Align Assist」(29pv)
- 8:みんなの自動翻訳をMemsourceで使ってみる(1)(27pv)
- 9:第2回 高機能な用語集検索ソフト「Xbench」(20pv)
- 10:みんなの自動翻訳をMemsourceで使ってみる(2)(16pv)
- 11:第1回 「EKWords - 高速キーワード抽出・集計」(15pv)
- 12:DeepL翻訳が日本語対応になった ― 翻訳英文法もびっくり(15pv)
- 13:第11回 辞書ソフトの定番「Personal Dictionary」(14pv)
- 14:第7回 校正・推敲支援ツール「Tomarigi」(12pv)
- 15:第2回 優れた用語管理ツール「xTerminology」(11pv)
- 16:第10回 バイナリ文書対応のGrep検索が便利な「VxEditor」(11pv)
- 17:機械翻訳支援ツール「GreenT」試用レポート(その2)(8pv)
- 18:第12回 クリップボード監視ソフトなら「クリップアウト2000」(7pv)
- 19:DeepLの訳文が読みやすい理由(7pv)
- 20:翻訳者の作業内容が変化している?(6pv)