図鑑のデジタル化プロジェクト

Acrobat9による和名索引の OCR結果を眺めてみた。
精度は 9割超えると思う…思うけど、「ロ」と「□」系や濁音系の誤認識が目立つな。
英文ならと思って学名索引には期待したけど、こちらも似たようなレベル。
どちらにしろ、「違っているのがわかった時点で直せばいいや」が許されるなら使えなくもないってところか。
今回はそういうケースなのでざっと眺めて気がついた点だけ直して採用。
ScanSnap FI-S1500のシートフィーダだけど、かなり紙質に左右されるな。
ハゼガイドブックや本州のウミウシはスムーズに行ったけど、日本の海水魚をスキャンしたら滑りまくってかなりの時間を要した。

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル