読んとは?

テキストのほか、Word/Excel/PDFなど、紙原稿の情報をさまざまな形式で利用できるようにしてくれるOCRソフト
スキャナなどから取り込んだ画像の文字を、高い精度でデジタルデータ化できるOCRソフト。認識結果をExcel/PDFなどの形式にワンタッチで出力できるほか、斜めの画像を平面に補正する機能などを備える。「読んde!!ココ」は、多彩な機能(モード)を搭載した“All-in-One OCRソフト”。用意された機能をユーザが迷わず使いこなせるよう、起動後にはまず、「スマートナビ」が表示される。「スマートナビ」で選択できるのは、出力形式さえ選べば、ほぼフルオートで認識を行える「ワンタッチ認識」どの自動認識を有効にするかをユーザが選択できる「カスタマイズ認識」スキャンから認識までをすべてユーザが指定できる「ステップ認識」認識機能をWordやExcelにアドインする「Wordから認識」スキャナとプリンタと組み合わせて原稿を複写する「コピー機能」の各モード。画面左側のメニューまたは上部に配置されたボタンアイコンから選択できる。いずれも、選択したモードごとに専用のウィンドウが開き、作業を行える。最も簡単な操作で認識を行えるのが「ワンタッチ認識」だ。元原稿からWord文書(RTF)や一太郎文書のファイルを出力したり、表形式の原稿からExcelファイルを出力したりできるほか、PDFファイルを出力することも可能だ。「ワンタッチ認識」では、原稿のスキャンから文字領域の認識、出力ファイルの作成までほぼ全自動で行われるので、ユーザはスキャナに原稿をセットしたあとは、待っているだけでよい。そのほか、読み込んだ画像からテキストを抽出し、合成音声で読み上げる「紙原稿の読み上げ」や、文字認識を行わず、単純なビットマップ画像を生成する「画像ファイル化」といった機能も呼び出せる。「カスタマイズ認識」は、ワンタッチ認識の各ステップで自動的に適用される「濃淡調整」「傾き補正」「領域選択」「ノイズ除去」といった各機能を、ユーザが手動で選択できるモード。印刷の薄い原稿やカラー原稿など、自動ではうまく認識できない場合に適する。「ステップ認識」では、すべてのステップをユーザが一つひとつ対話的に確認しながら実行できる(従来からの「OCRソフト」の使い勝手を実現するものと考えればよい)。認識時に発生した「誤認識」文字なども、スキャン画像と対比しつつ、手動で修正することが可能。元原稿のすべてをスキャンするのではなく、一部分だけを認識して取り込むような場合に適したモードだ。元原稿となる画像の取り込みは通常、イメージスキャナから行うが、BMPファイルなど、既存の画像ファイルを読み込むことも可能。デジタルカメラで撮影された画像を入力とする「デジカメ入力」機能もあり、スキャナで取り込み切れない大きな原稿などにも対応できる。デジタルカメラの場合、平面に置かれた紙などを斜めから撮影した画像があるが、スキャナ取り込みと同じように平面に補正する機能があり、正しい認識を行えるようにしてくれる。複数ページの原稿を連続認識する機能も搭載。また、両面原稿の取り込みに対応しないスキャナ用として、片面ずつを連続認識したあと、これらを並べ替える「両面スキャン機能」もある。認識精度は従来バージョンに比べ、さらに向上。Wordや一太郎などの文書ファイルへの出力では、元原稿における文字サイズなどを再現して出力できる。表組みは表形式のままで認識できる上、元原稿に図などが挿入されている場合には、出力される文書内にその図がそのまま貼り付けられるなど、元原稿と変わらない体裁でデジタルデータ化することが可能だ。
コンピュータ全盛の時代になっても、新聞や雑誌、各種書籍など、紙媒体によって提供される情報は非常に多い。いつでもどこでも手軽に読めるという点で、紙のメリットは大きいが、保存する際の容積や重量、検索性といった点では、やはり電子化された情報の方が上だ。いまさら説明するまでもなく、「OCR」はこうした「紙媒体」と「電子化された情報」の橋渡しをしてくれるソフトのことを指す。ただ、最近のOCRは、いわゆる「Optical Character Reader」の範囲にはとどまっていないし、そうでなければ使い勝手が悪い。どういうことかというと、単に文字を読み取ってそれを文字コードに変換できるだけでは、意味がないのではないかということだ。私たちが普段利用する印刷物には、文字だけが印刷されているわけではない。写真や挿絵などがふんだんに含まれている。仮にOCRで文字だけが読めたとしても、それら「画像」情報が取り込めなければ、価値は半減してしまう。文字情報の占める割合が比較的大きな新聞でさえ、見出し文字のサイズやレイアウトなどを工夫して、読みやすくする努力をしているのだ。そう考えると、OCRも元原稿の画像、レイアウト、文字サイズなどをできる限り忠実に再現する「ビジュアル再現能力」が求められるようになってくる。今回紹介した「読んde!!ココ」は、まさにそうした、ビジュアル情報を再現する能力に長けたOCRソフトだ。正確な文字認識が行えるのはもはや当然。Word/Excel/一太郎文書やPDFによって、いかに元原稿のビジュアル情報が再現できるか──今後のOCRはこうした方面に進化していくのだろう、と感じさせるに十分な性能を持っている。
ソフトの目指すところと主な特徴このソフトで目指したものは“All-in-One OCR”です。「読んde!!ココ」があれば、「紙原稿をさまざまな用途に活用できる」というのが特徴です。表原稿や文書原稿も、簡単な操作でWord、一太郎、Excelデータに変換できます。また、電子ファイリングやデータ配信でよく利用させているPDFファイルの作成も可能です。そして、スキャナとプリンタを利用して、原稿をそのままコピーする便利な「コピー機能」も搭載しています。開発中に苦労した点「読んde!!ココ Ver.10」では、操作体系の見直しを行っています。既存のユーザアンケート結果をもとに、目的の操作をさらに「簡単に」「わかりやすく」「すぐに使いはじめられる」とするにはどうしたらよいか、という点で苦労しました。ユーザにお勧めする使い方「読んde!!ココ」では、用途に応じて便利な機能がたくさんあります。用途に合わせてツールを使い分けると、効率よく目的を達成できます。紙原稿を1枚だけPDFにしたり、Word文書やExcelデータにする場合──「ワンタッチ認識」機能がお勧めです。複数枚の紙原稿を連続で処理したい場合──大量文書の処理に最適な「OCRファクトリー」をご利用ください。「複雑な構成の原稿を認識したい」「認識結果を正しく修正してから保存したい」場合──原稿の取り込みから認識結果の保存まで手動でステップを踏んで実行できる「読んde!!ココ」をご利用ください。Word、Excel、一太郎、Acrobatから直接認識したい場合──アドイン機能を使って、WordやExcel等のメニューに「読んde!!ココ」を追加すると、WordやExcel等から利用できるようになります。コピーをとりたい場合──スキャナとプリンタを利用して手軽にコピーができる「スキャナde!!コピー」機能をご利用ください。今後のバージョンアップ予定認識精度の向上はもちろんですが、スキャナやプリンタ、デジカメをフルに活用して、さまざまな用途に利用できるものに進化させていきたいと思います。
Ripplexアドレス帳さまざまなWebサービスと連携し、友だち探しを行うこともできるアドレス帳ソフト
Vectorrow重力を操作して4方向に「落下」しながらゴールを目指すステージクリア型アクションゲーム
名番(め〜ばん)Lightパソコンで受信したメールのレポートを携帯電話に送信してくれるメールチェッカ
ファイナンシャルプランナーが作った家計簿「入力マット」機能でスピーディな入力を可能にした多機能家計簿ソフト
《おすすめアミューズメント通信》 街創造 画面上に「街」が作られ、発展していく様子を眺められるスクリーンセーバ
デジタルシュレッダーアイコンにドラッグ&ドロップするだけで、データを復元不可能な状態にしてくれるファイル削除ソフト
ゆきんこレギオンライフルやバズーカで雪玉を発射し、敵のヘリコプターや戦車を撃つ雪合戦アクションゲーム
IndeTerminatePLUS ALPHAおっとりとした主人公と強気な仲間たちが手紙届けの旅に出るファンタジーRPG
補 足 : 試用は体験版で行える。体験版の試用期間は30日間。体験版は製品版に比べて、読み上げ機能がないなど、一部機能制限がある。アップグレード版もある
上で紹介したソフト(およびその関連ソフト)のダウンロードページにジャンプします。ダウンロードページからソフトをダウンロードできます。ダウンロードページには、作者データページへのリンクもあります。
(複数価格あり)読んde!!ココ Ver.13 ダウンロード版 認識精度がさらに進化したNo,1OCRソフトの最新版! (128,367K)
ベクターソフトニュース、スポットライト、PickUpに関するご意見・ご感想は editor@vector.co.jp まで

[ 64] 読んde!!ココ - ベクターソフトニュース
[引用サイト]  http://www.vector.co.jp/magazine/softnews/040306/n0403062.html

高精度のノイズ除去機能を搭載した日本語/英語対応のOCRソフト。高い認識率で文字を読み取ることができる。「読んde!!ココ」は、画像などのデータから文字を読み取ることができる“定番”OCRソフト。使いやすさと認識精度の高さで定評がある。新バージョンの13では、日本語・英語あわせて約24万6千語の言語解析辞書と新アルゴリズムを搭載。従来バージョンから一層の認識率の向上を果たした。読み取りでは、読み取ったデータから文字以外のノイズを取り除く「ノイズ認識・除去」機能が強化された。新アルゴリズムの搭載により、ノイズの除去効率が向上。文字情報を残しつつ、ノイズのみを高い精度で除去できる。これにより、ざらついた紙や、下地に色の付いた紙での認識能力もアップした。(赤ペンなどで記入された)色付きの手書きメモ部分を自動で取り除くこともできる。文字が含まれる領域を検索する「領域抽出モジュール」も改善された。かすれた罫線がある領域を的確に検出し、帳票や囲み記事など、さまざまなレイアウトの紙面を読み取ることができる。複数ページを読み取る際に無地ページが含まれている場合は、そのまま残すか、自動的に消去するかも指定できる。両面原稿と片面原稿が混在するときや、書籍を読み取るときなど、何も書かれていないページを取り除くことで、無駄なデータを作ることなくデータを保存できる。読み取りなどの機能は、「読んde!!ココ」のランチャにあたる「スマートナビ」から実行できる。ワンタッチ認識:出力形式を指定するだけで自動変換自動で認識:手順をカスタマイズした上で自動変換ステップで認識:一つひとつの処理を手動で行うWordなどから認識:ほかのアプリケーションへのアドインを設定原稿をコピー:スキャナとプリンタを用いて紙原稿をコピーなどをボタンひとつで選択・実行することが可能だ。対応スキャナの多さや、読み取りの柔軟性は従来バージョンから変わらない。スキャナはTWAIN対応機種のほとんどをサポートする。専用のインタフェース画面が用意され、スキャナの機種にかかわらず、統一した操作感でスキャンを行える。読み取り対象には、画像ファイルはもちろん、PDFファイル、クリップボードにあるデータ、表示画面など、さまざまなデータを指定できる。OCR認識の結果は、テキスト/RTF、Excel、PowerPoint、一太郎の各形式と、PDF/HTML/WRI/CSV/SYLK形式でファイルに出力できる。PDFでは「イメージのみのPDF」「テキスト情報を埋め込んだ透明テキスト付きPDF」を指定することが可能。あらかじめ指定した領域の文字列だけをCSVで保存することも可能で、必要な情報だけを取り出して効率的にデータベース化できる。ユーザがカスタマイズした読み取り手順で連続読み取りを行う「OCRファクトリー」機能では、保存時の指定方法が強化された。あらかじめ指定した連番でファイル名を付けられるのはもちろん、既存の連番に続く番号を付けたり、OCR処理日時を付けたりもできる。従来同様、「認識元の画像ファイル名を流用して保存」「認識結果のファイル名で保存」を選択することも可能だ。そのほか、エプソンのオフィリオ シナジーウェア「Document Storage」「Document Browser」との連携機能も追加された。オフィリオ シナジーウェアではドキュメントファイルの管理を一元的に行うことが可能で、OCR認識で作成したファイルを直接「Document Storage」のファイルボックスに転送・登録できるようになる。登録時に、元原稿に含まれる特定領域の認識結果を“分類情報”として付加することも可能。例えば、元原稿に印字されたコード名などを分類情報として「Document Storage」に渡せるため、「Document Storage」側で自動的に分類・保存が行える。スキャナから読み取り、ドキュメントを整理するまでのワークフローを一本化することができ、ドキュメント整理の効率化に役立つ。
オフィスのペーパーレス化が叫ばれて、いったい何年経ったことだろう。だが、(会社によって事情は異なるのだろうが)相変わらず職場の机は「紙」の資料の山。最新資料はともかく、ちょっと古めの情報になると大きなファイルに閉じられたコピーの中から探し回る、ということは相変わらず多いのではないだろうか。なぜペーパーレス化が進まないのか。まっ先に思いつく理由のひとつは、紙という媒体がいまだ低コストで、情報を入力・伝達する能力に優れているということ。確かに、文字を入力して送信するだけなら、いまやテキストエディタや電子メールの方が早い。しかし、これに図が含まれるようになると立場は逆転する。メモ帳の隅にさらさらっ、と図を描くだけで思考が整理できる「紙のメリット」は、まだほとんどのパソコンでは実現できていない。さらに悪いことに、そのようにして紙に書かれた情報を効率よくデジタル化するのはまだまだ難しい。文字を自動的に認識し、図を取り込み、整理・検索できるようにする、という効率的な手段は少ないのである。「読んde!!ココ」シリーズは、そうした難しい課題に長期にわたって挑み続けてきたソフトだ。手書き文字ではなく活字文字を対象としたOCRソフトであるものの、それでもなおこの分野には、長いノウハウが必要だ。さらに、図や表を含んだ複雑な原稿となると、なおさら読み取りは難しい。「読んde!!ココ」のような歴史の長いソフトでないと歯が立たない。そうした数少ない貴重なソフトである「読んde!!ココ」だが、新バージョンの特徴は、ドキュメントの「整理」「分類」に力を入れはじめたということのようだ。もちろん認識精度の向上にも力を入れてはいるとはいえ、それだけではなく、さらに「次の段階」に進もうとする気概が感じられる。これが日本のオフィスを変革する原動力となるのかどうか。なかなか興味深い。
ソフトを開発しようと思った動機、背景文書管理ソフトおよびスキャナとの連携を強化することにより、強力なドキュメントソリューションを提供することが大きな目標としてあります。開発中に苦労した点文書の電子化処理に関する、お客さまの潜在的な要望を浮き彫りにし、それを今回の新機能にどうやって盛り込むかということが最も大変でした。さまざまな検討を行った結果、大量文書の電子化処理の効率化および低品質原稿の認識精度向上にポイントを絞って、新機能を提供させていただいております。ユーザにお勧めする使い方<その1>自動OCR処理機能である「OCRファクトリー」がより便利になりました。「白紙除去」機能の搭載、および「ファイル名の設定」※機能改良により、OCRの自動処理をより効率的に行えるようになっています。また、弊社の文書管理ソフトDocument Storageとの連携機能も大幅に強化しおります。「OCRファクトリー」と併用していただくことにより、大量の紙原稿を効率的に管理していただけるようになっています。※OCRファクトリー機能において、認識結果保存ファイル名に日付、時刻、連番等を簡単に指定できるファイル名書式設定機能<その2>かすれ罫線原稿について、「かすれ罫線抽出」機能で領域抽出を行うことにより、より高い領域抽出精度を得ることができます。<その3>PDF出力機能において、英文レイアウトの再現精度を大幅に向上しております。英語文書をPDF形式で保管する方にはおすすめです。今後のバージョンアップ予定これからも、OCR技術を核としたドキュメントリューションを提供していきたいと考えております。どうぞよろしくお願いいたします。
Ripplexアドレス帳さまざまなWebサービスと連携し、友だち探しを行うこともできるアドレス帳ソフト
Vectorrow重力を操作して4方向に「落下」しながらゴールを目指すステージクリア型アクションゲーム
名番(め〜ばん)Lightパソコンで受信したメールのレポートを携帯電話に送信してくれるメールチェッカ
ファイナンシャルプランナーが作った家計簿「入力マット」機能でスピーディな入力を可能にした多機能家計簿ソフト
《おすすめアミューズメント通信》 街創造 画面上に「街」が作られ、発展していく様子を眺められるスクリーンセーバ
デジタルシュレッダーアイコンにドラッグ&ドロップするだけで、データを復元不可能な状態にしてくれるファイル削除ソフト
ゆきんこレギオンライフルやバズーカで雪玉を発射し、敵のヘリコプターや戦車を撃つ雪合戦アクションゲーム
IndeTerminatePLUS ALPHAおっとりとした主人公と強気な仲間たちが手紙届けの旅に出るファンタジーRPG
上で紹介したソフト(およびその関連ソフト)のダウンロードページにジャンプします。ダウンロードページからソフトをダウンロードできます。ダウンロードページには、作者データページへのリンクもあります。
(複数価格あり)読んde!!ココ Ver.13 ダウンロード版 認識精度がさらに進化したNo,1OCRソフトの最新版! (128,367K)
ベクターソフトニュース、スポットライト、PickUpに関するご意見・ご感想は editor@vector.co.jp まで

[ 65] 読んde!!ココ - ベクターソフトニュース
[引用サイト]  http://www.vector.co.jp/magazine/softnews/070227/n0702273.html

セイコーエプソンのOCRソフト「読んde!!ココ」の新バージョンでは、「かすれ領域抽出機能」によって認識精度が改善した。「OCRファクトリー」でファイル登録までの手順を自動化も可能だ。
最新版では、OCRの基本部分となる認識精度の向上を図った。新機能として、「かすれ領域抽出機能」を搭載。この機能は原稿をぼかして認識することで、何度もコピーしたり、FAXで受信した原稿の罫線のかすれを低減し、罫線が多い原稿のレイアウト解析精度を高めるものだ。
かすれ領域抽出機能は「弱」「中」「強」の3段階から選べる。かすれた原稿の読み取りがうまくいかない場合には、まず「弱」から順番に強度を上げて使う。原稿をぼかしても、文字はぼかさずに取り込むが、まれに文字領域を画像領域として認識してしまう“副作用”もある。ただし、全体としては「この機能によって4%程度、認識精度が改善した」(同社)という。
このほかの新機能では、「白紙除去機能」を搭載。読み取った画像のうち白紙のページを自動的に消去するため、大量の紙文書のうち無駄なページを電子化せずに済む――というわけだ。また、スキャン時のゴミ画像を除去する「ノイズ除去機能」は前バージョンよりも精度を高め、カラー原稿にも新たに対応した。
従来通り「OCRファクトリー」を利用すると、紙文書のスキャンからデータ保存までの手順を複数登録して処理を自動化できる。今回のバージョンアップでは、ファイル名の保存パターンを追加した。 これまでは「指定した連番」「元画像のファイル名」「認識結果のファイル名」で保存が可能だったが、新しく「続きからの連番」「処理時刻の付加」「ユーザーが定義したファイル名」でも保存できるようになった。
さらに、ファイル管理ソフト「Document Storage」やWeb情報共有ソフト「Document Browser」を利用すると、1回の操作で文書の電子化からこれらのソフトへのファイル登録までが完了する。
ソースネクストは、名刺をスキャンして文字を読み取り、住所録を作成できるソフトウェア「本格読取 おまかせ名刺管理 2」などを11月3日に発売する。
まだまだなくならない「紙」の情報。紙の資料をPDFに変換できるスキャナを使った簡単整理術をご紹介しよう。
3分LifeHacking:電話番号を携帯にメールする時に気をつけたいこと外出している人に電話番号を伝言するとき、携帯電話のメールは便利。だが、電話番号の書き方を間違えると、携帯電話から直接電話できないことがあるのだ。
シゴトハック研究所:今日のやる気を未来に“繰り越す”には?【解決編】どうやったらスムーズに仕事に“取りかかる”ことができるのでしょうか。“仕事エンジン”のかけ方を考えてみましょう。
樋口健夫の「笑うアイデア、動かす発想」:ウソのためのウソ社内の悪口はポジティブフィードバックする。だが、この悪口より性質が悪いのは「ウソ」だ。会社の損害を与えることもあるし、ビジネスパーソンとしての人生を終わらせるぐらいのダメージを被ることもあるのだ。
シゴトハック研究所:今日のやる気を未来に“繰り越す”には?【問題編】「キリが悪い──」。せっかく取りかかれた仕事なので、終わりまでやってしまおう! と思ったことはありませんか。「やる気」の予見ができれば、こうしたこともコントロールできるのですが……。
ライフハック テンプレート:#054 愚痴免罪符あなたの周りに、いつも愚痴ばかり言っている人はいませんか? 本人のためにも愚痴を言うことへの免罪符を作って、差し上げてみましょう。
組み込みエンジニアだって、将来のキャリアやキャリアパスは不安。しかし、その前に考えるべきことがあるという
誰しも身に覚えがある大失敗の数々。でも怖くない! そこから何かを学べばいいのだから。リアル新人も座談会形式でコメント。さて?
あなたの身近な出来事にも、アルゴリズムが隠れている。「この命令が使えなかったらどう処理しよう?」と、考えてみるのも面白い
24位:速度はレーザー、使い勝手はインクジェット──その両方を備えた、これからのビジネスプリンタとは?
jobtxt1 += '30代で派遣・フリーの仕事はなくなるのか?43歳エンジニアと派遣会社担当者に聞いた';
jobtxt2 += '匿名|最高25社から査定結果が届く。査定|プロが鑑定するあなたの市場価値';

[ 66] ITmedia Biz.ID:かすれた原稿の認識精度が向上――「読んde!!ココ」最新版
[引用サイト]  http://www.itmedia.co.jp/bizid/articles/0701/22/news061.html



お気に入り



  • track feed
    • seo