« 2010年8月 | トップページ | 2011年1月 »

2010年9月

2010年9月12日 (日)

バンダイ純正ジムスナイパー2が出た!

注文してあったジムスナイパー2が届いたので、ガンコレのジムスナイパーIIと2ショット写真。

Gim_sniper2

ROBOT魂のジムスナイパーII

サイズ的には1/144くらい。

子供たちにいじられて部品をなくされるといやなので、すぐに箱にしまって隠した。


| | コメント (0) | トラックバック (0)

2010年9月 4日 (土)

ES-D200でOCRを使ったレビュー

レビューというより自分用のメモ書き。
人が書いたOCR術などを読んでしまうと先入観ができてしまうので、自分で実験してから読もうと思う。

ES-D200には3種類のOCRがある(らしい)。
1.ADBE Acrobat
2.読んde!!ココ
3.EPSON Event Manager

3はスキャンとOCRを同時にやるみたいなのでパス。スキャンはスキャン、OCRはOCRと分けて作業したいので。
将来OCRの性能があがるだろうから、原画のJPEGファイルはとっておく予定。

まず、原画の作成・・・スキャン設定をどうするか検証する。
スキャン設定としては
1.解像度・・・300dpi, 600dpi
2.色数・・・グレイスケール、モノクロ
3.画質補正・・・なし、輪郭シャープ

と8通りある。
OCR保存したいのはソースファイルなどがのっているコンピューター雑誌なので、雑誌のとある1ページを使って試す。

まずACROBATを使って600dpiでのOCR結果の比較をしてみる。
日本語はどれもほぼ完ぺきな認識。問題なし。
ソースコード部分は、グレイ補正なしのほうがいい感じ。 グレイ・シャープのほうが誤認識が多い。
モノクロは論外。ソース部分がグレイのバック時黒で文字が書いてあり、まったく認識されていなかった。

次に600dpiと300dpiを比較。モノクロは論外なのでグレイの補正なしで比較。

大見出しは600dpiでは文字として認識されなかった(大きすぎ?)が、300dpiは認識されていいた。

ソースコードの認識は、
600dpi
> CTweetOverlayltem.javal
> public class TweetOverlayItem extends OverlayItem {
> Tweet tweet;
> pub lic TweetOverlayItem(GeoPoint point,
> String title,
> St ring snippet,
> Tweet tweet) {

300dpi
> (TweetOverlayltem.java)
> pUblic class TweetOverlayItem extends OverlayItem {
> Tweet tweet;
> public TweetOverlayItem(GeoPoint point,
> 5t ring ti tle,
> 5t ring snippet,
> Tweet tweet) {

600dpiは左かっこがCになっている箇所がかなりある(ほとんど)。しかし300dpiの「String」を「5tring」と認識しているのはちょっとまずい。
しかし600dpiのほうもほどほどに誤認識があるので誤差と考えると、画像サイズ的に300dpiのほうがいい?

300dpi ・・・ 1.2MB。600dpi ・・・ 3.7MB。

次に読んde!!ココ。
300dpiグレイスケール補正なし
日本語は問題なし。▼や■という記号をちゃんと認識している。タイトル・サブタイトルという大きい文字も認識。
ソースコードは・・・・
> (TweetOverlayltemjava)
> P〕blic ctaSS TweetOvertayItemext即ds Overlay夏teml
> Tweet tweet;
> pubticTweetOverlayItem(GeoPointpoint.
> Stri咽titte.
> String snlPPet,
> Tweet軸eet)‡
> SUPer(POint.titte.Snippet);
> this.tweet=tWeet;
> ナ
> ナ
ボロボロ・・・。補正ありも同じ。モノクロ補正なしは文字として認識はしていたが同じくボロボロ。

次に600dpiグレイスケール補正なし。
日本語は問題なし。

> (1両eetOverlayltemJava)
> publicclassTweetOvertayItemextendsOverlayItemt
> Tweet tweet;
> pubucTweetOverlay工tem(GeoPo土ntpolnt
> String titte,
> String snlPPet
> Tweet tweet)t
> super(POint,titte,Snippet);
> this.tweet=tWeet;
> )
> )
かなり良い。"}"が")"となるのはいまいちだけど、検索には使わないのでOK。大文字・小文字も検索には関係ないのでOK。
グレイスケール補正ありはボロボロ。モノクロは認識すらされなかった。

使い勝手はAcrobatのほうがいい。
Actobatのほうは、600dpiも300dpiも結果はあまり変わらないので小さいほうがいい。

結論
1.色調はグレースケール
2.輪郭補正はなし
3.OCRはAcrobat
4.サイズは300dpiで十分

300dpi グレイスケール補正なし画像はこちら

Ocr300dpigray


| | コメント (0) | トラックバック (2)

2010年9月 2日 (木)

最近のホビージャパンはでかかった

HOBBY JAPANも電子化しようとばらしてスキャンにセットしたら・・・ES-D200に入らなかった。
A4より少し大きめまでスキャンできるが、ホビージャパンの場合5mmほど切らないとセットできない。
電撃HOBBYしか電子化できないと半分は紙で残ってしまうが、とりあえずホビージャパン以外を全部電子化してから考えることにする。

2011年1月21日追記-------------------
 最近はカンナはやめてでっかいカッターで解体しています。
ホビージャパンや最近の電撃ホビーは15mmくらい幅を縮める必要があるので、両サイドを8mmづつ切り取っています。
---------------------------追記終わり

バックナンバーはデータでダウンロード販売してほしいなぁ。

できたら最新刊もデータでほしいな。2重に買わなくて済むので。

今日はES-D200がなぜスキャン後の処理が遅いのか、いろいろ試して検証した。

メモリ不足? CPU不足?

使用環境はソニーバイオTypeS CPU Corei7 2.67GHz メモリ8GB

スキャン開始前

Cpu1

50ページ(25枚)スキャン完了直後・後処理が残っている状態

Cpu2

メモリ使用量が1GB弱増えているが8GB積んでいるので問題ないはず。
CPUもほとんど使ていない。もうちょっと使てほしいな。

スキャンに2分弱、後処理に15分ほど・・・。

ディスクの書き込み速度の問題?

使っているディスクは磁気ディスク。
ワークディスクはCドライブ固定のようなので書き出し先をmicroSDカードにしてみるが、処理速度は変わらず。
Cドライブが激しく点滅していたのでワークでいろいろやっているようだが、ワークの設定画面ではCドライブしか選択できない。

枚数の問題かと考え40ページに減らしてやってみると、後処理は10分以上かかった。先日やったときは数分で終わったはずなのに。

設定の問題?

使用しているソフトはEpsonScan。EventManagerというのでもスキャンできるが設定画面などがEpsonScanと違うので、使い慣れているほうにした。

Epson_scan

解析処理が動いていそうなのは用紙サイズ自動とイメージタイプ自動。
カラーとモノクロページを混在でスキャンしているのでカラーとモノクロを判断してくれるイメージタイプ自動ははずせない。
ためしに用紙サイズ自動をA4にしてみる・・・電撃HOBBYはちょうどA4サイズなので。

40ページ、50ページ、60ページみなスキャン時間とおなじくらいの後処理時間で終わった。5分弱。

サイズ自動検出なんてたいした処理じゃないのになぜ。CPU使ってないし。改善を望みます。

| | コメント (0) | トラックバック (1)

« 2010年8月 | トップページ | 2011年1月 »