製品概要
【RS2OCRについて】
イメージデータの文字をOCR処理して、テキスト文書へ出力
通常はイメージデータ内の文字に対し、選択やコピーなどの処理を行えません。
イメージデータに対し、OCR(文字自動認識)処理を行いテキストデータ(TEXT,RTF形式等)に変換することで、その結果を検索やコピーなどの処理を行えるようになります。
本プログラムはイメージデータをOCR処理して、テキスト文書へ出力するソフトです。
さらに、取得した情報を利用して、他の弊社製品(KDコンバート)(別売り)を呼び出し、入力データを変換することが可能です。

サポートフォーマット
読み込み可能なフォーマットは以下の通りです。
| 読み込み可能なフォーマット | |
|---|---|
|
|
主な編集機能
【入力処理に関するもの】
- 非常に多くのラスターデータ(モノクロ、カラー)の入力をサポート(DocuWorksデータも可能)
- 入力データのヘッダ情報を与える事が可能です。
- ラスターデータの色を反転することが可能です。
- 入力がマルチページファイルの場合、処理を行うページ番号を指定することが出来ます。
- 入力データのサイズは最大6A0まで可能です。
※OCR処理範囲はA3までですので、クリッピング処理を行うか縮小機能を使用することでテキスト出力する事が可能になります。 - A3以上のデータを入力した場合、A3サイズに収まる様に縮小しOCR処理を行う事が可能です。
【出力処理に関するもの】
- OCR処理したテキストデータは下記の形式で出力が可能です。
- テキスト形式
- RTF形式
- HTML形式
- XML形式
- XLS形式
- RTF(リッチテキスト)で出力する場合、下記の設定が可能です。
- 出力文字フォント
- 出力文字のサイズ
- 出力文字の色
- クリッピング範囲の情報(座標を出力する事が可能です)を出力する事が可能です
- 認識したイメージ情報を利用し、他の弊社製品(KDコンバートシリーズ)を呼び出し、入力データを変換することも可能です。
- 他のモジュールを呼び出すタイミングの指定(入力データを分割して出力)
【OCRエンジンに関するもの】
- OCR処理エンジンは下記の2種類から選択することが可能です。
- メディアドライブ(株)活字文書OCRライブラリ
- DocuWorks内蔵OCRエンジン
※「DocuWorks内蔵OCRエンジン」を使用する場合は、DocuWorks(ver6.x)がインストールされている必要があります。
- 文字認識範囲指定が可能(全景(最大A3サイズ)も可能)
- クリッピング範囲の指定が可能
- 指定方法は下記の通りです
- 外部からテキストによる指定
- 定型サイズから選択
- 認識処理時に下記情報の出力が可能です
- 認識した文字列毎の開始位置
- 作成日時
- ページ番号
- 入力ファイル名
- 文字大きさ(高さ)
- 認識した文字数、など
- 下記設定は「活字文書OCRライブラリ」を使用する場合のみ有効です
- 認識辞書のあるフォルダの指定
- 学習文字ファイルの指定(ユーザが作成した学習文字ファイルを指定)
- ノイズの強度の設定
- 接触罫線の除去
- 認識させる文字の種別を設定
- 認識言語の設定
- 日本語知識処理(認識言語が日本語の場合のみ有効)
- 検出したいキーワードの指定
- 座標原点位置の指定
- 検出したいキーワードの検索範囲
- OCR処理範囲の設定
【バッチ処理に関するもの】
- バッチファイル名
- 指定されたファイル又はディレクトリ内のファイルを一括処理したい時に利用します。
Q&Aと関連ページ
- RS2OCRに関するQ&A
- テキスト抽出・合成関連製品
(KDコンバートシリーズでテキスト抽出・合成に関する製品をまとめたページです。) - 自動認識関連の変換ソフト
(KDコンバートシリーズで自動認識に関する製品をまとめたページです。)
価格表
【RS2OCR】
【対応OS】
Windows 2000
Windows XP
Windows Vista
Windows 7
※対応OSは32bit版のみとなります。
| 型番 | 製品名 | 製品概要 | 価格 (税抜き) |
|---|---|---|---|
| KD-RAS0654 | RS2OCR | ラスターデータの文字をOCR処理してテキスト変換 |
30万円 |