閉じる

図鑑のデジタル化プロジェクト

Acrobat9による和名索引の OCR結果を眺めてみた。
精度は 9割超えると思う…思うけど、「ロ」と「□」系や濁音系の誤認識が目立つな。
英文ならと思って学名索引には期待したけど、こちらも似たようなレベル。
どちらにしろ、「違っているのがわかった時点で直せばいいや」が許されるなら使えなくもないってところか。
今回はそういうケースなのでざっと眺めて気がついた点だけ直して採用。
ScanSnap FI-S1500のシートフィーダだけど、かなり紙質に左右されるな。
ハゼガイドブックや本州のウミウシはスムーズに行ったけど、日本の海水魚をスキャンしたら滑りまくってかなりの時間を要した。

コメントを残す

メールアドレスが公開されることはありません。必須項目には印がついています *

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)