2009年11月20日金曜日

OCR

OCR(文字認識してテキストにしてくれるソフト)を探していましたが、いまいちこれといったいいフリーのツールがありませんでした。それでやむなく(^^; MSさんを利用。MS Officeをインストールしていると、Microsoft Office Document Image WriterというプリンタドライバとMicrosoft Office Document Imagingというツールが入っているようです。Office2003からでしょうか? それで次のようにします。まずOCRしたいPDFファイルなどを用意します。最初からTIFなどの画像ファイルなら(1)は不要です。

(1)Microsoft Office Document Image Writer(プリンタドライバ)で、PDFファイルからtifファイルへ変換
(2)スタート→すべてのプログラム→Microsoft Office→Microsoft Officeツール→Microsoft Office Document Imagingで画像ファイルを読み込みOCRする

日本語も英語もそこそこの認識率という気がしました。

2009年11月17日火曜日

OpenOffice:Writer:いろいろ

Writerを使っていていろいろ起こったことをまとめておきます。順不同なので見にくいですが(^^;

論文提出1週間前に マスター文書でのクロスリファレンスがうまくいかない! ということが判明しました。どうすりゃいいんだ。 ということで結局、参照番号直打ちのはめに(^^; これからはTexに移行したいと思っています orz

とりあえず、見つけたことをリストしておきます。

・図が枠(図をWriterに貼りつけて図表番号などを付けると枠が出来ます。)の幅いっぱいだったらマスターに取り込んでなんかしたとき(マスターをPDFに書いたときとか)に消えることがある。
少し小さめにして、枠の幅より小さくしたら今のところOK.

・図をコピーして改行などが変(何か図の後に大きくスペースがあくとか)になったら、図あるいは図の枠を選択して、アンカーを「文字として」→「段落に」とか逆にとかしてみると直る。

・マスタードキュメントで図や表の番号に付けるセクションの設定(Fig.3.3.1とかの3.3の部分)は マスタードキュメントのテキスト部分(それ以外は編集不可能なので)挿入→フィールド→変数→図(に使っている変数名)とした状態で右の方のドロップダウンボックスのレベルというところで1(Fig. 3.1とかにする場合)、2(Fig. 3.3.1とかにする場合)などと設定する。

・マスタードキュメントを使うと図番号がずれることが判明。図番号の変数名を変えると良いらしいが、そうすると図の目次が使えなくなってしまった(^^; その変数を入れられないので。
→3.1~3.3と分けていた文書を3章としてまとめたら、ちゃんと参照できるようになった(^^;

・表のリストのところで「表の索引 1」の「段落スタイルの設定」の「アウトラインと番号付け」タブでアウトラインレベルを設定(レベル1とか2)すると目次を作るときにそれが取り込まれ(目次作成の設定レベルが指定したレベル以上だったら)目次に表のリストの内容が出てきてしまったりする(^^;

・マスター文書にはサブ文書で図のアンカーをページにしているとマスター文書にその図が取り込まれないようだ。アンカーを「段落」あるいは「文字として」にしているとちゃんと取り込まれる。ただし、アンカーを「段落」としていると改ページが変になり、白紙のページが入ってしまったりする。結局「文字として」以外はマスター文書と一緒に使うには使い物にならない。

・図表のリストの作成
→目次を作るのと同じ要領で「挿入」→「目次と索引」→「目次と索引」とする。
出てくるWindowで種類を選ぶ(「図の索引」とか)。
適当なタイトル(List of Figuresとか)を入れる。
対象はドキュメント全体。
内容は図表番号。カテゴリーは図番をつけたスタイル。僕の場合はFig.
表示はすべて(これでFig.1.1 abc という風に出てくる)
「スタイル」タブでレベルのところがタイトルとレベル1が出ていて、それぞれ「図の索引 見出し」と「図の索引 1」となっていることを確認。他にするとうまくいかなかった。
これでOKで、図の索引が出来ます。

・目次で番号の後にスペースを空けるには「目次/表の編集」Windowで「項目」タブを選び、「構成」のところで章番号のあとにスペースを入力する。
OpenOffice Tips:目次にリンクをつける
に書いてあるのだが、僕の場合、「目次/表の編集」の構成のところで章番号ボタンが2つ並んでいたりするようなレベルがあった。どうしてこうなったか分からないが直せないので、新たにマスター文書を作り直した(^^; → 「目次/表の編集」の構成のところの下にある章番号ボタンを押すと章番号の項目が増えるようだ(^^; これを押していたのね。

・3.1~3.3章の図のキャプションのところはFig.スタイルとする。ここはFig.3.2.1などのようにレベル2を参照する図番とするため。それ以外は直接 章を参照し、Fig.2.1などとするため「図表番号」スタイルとすること。

・マスター文書で全体の書式を設定するには
スタイルと書式設定Windowを開き、「ページスタイル」を選んで、そこの「標準」右クリックし、出てきたドロップダウンメニューの「変更」を選ぶと通常の文書(マスター文書でない文書)の書式→ページとしたのと同じWindowが開く。

・書式→ページ
「ページ」タブ→A4、余白 左右3.0cm 上下2.0cm
レイアウト設定 ページレイアウト→左右
「ヘッダ」タブ→ヘッダをつけるにチェック
左右ページ同じ内容のチェックをはずす(左右で右寄せ、左寄せ等を変えるため)
間隔 0.5cm
高さ 0.5cm
高さ自動調整にチェック
詳細ボタン→外枠→線を引く位置でヘッダのどこに線を引くかを決めてスタイルで太さなどを決める。先に左右ページ同じ内容のチェックが外れているとここでの設定が反対側のページに反映されないようだ。よって左右同じ内容にチェックした状態でここを設定し、その後、左右同じ内容のチェックをはずして、好みの指定に変更するのがよさそうだ。

「フッタ」タブ→フッタをつけるにチェック
左右ページ同じ内容にチェック
間隔 0.5cm
高さ 0.5cm
高さ自動調整にチェック
詳細ボタン→外枠→線を引く位置でヘッダのどこに線を引くかを決めてスタイルで太さなどを決める。

2009年11月3日火曜日

Firefox:addon:AFOM

Firefoxを使ってるとどうも大量にメモリが消費されている感じがしたのでタスクマネージャで調べてみました。するとなんと200MB、時には400MBも消費していることが分かりました(^^; なんとかならないかと思いアドオンを探したところ次のようなものを見つけました。

AFOM recovers Memory Leakage within a running instance of the Firefox browser application.
Note: ( Windows Only )

作者のホームページ

これを入れると メモリ消費量が増えてくるたびに活躍して、時には10MB以下にまで掃除されます。入れておくだけで勝手にやってくれるようで、体感もこころなしか快適です。

2通りのバージョン(2.*と3.*)があって2.*用はFirefoxのみを対象としていて、3.*(といいつつここでは4.2となっていますが(^^;)はFirefox起動中に下記のアプリケーションも見てくれるそうです。

AFOM 3.* Memory Recovery for Firefox, TweetDeck, Seesmic, Google Earth Desktop, iTunes9 and Songbird Desktop Applications.

Thunderbirdにもほしいですが、こちらはないようですね。