カーネルコンピュータシステム

PDF2OCR

製品概要

PDF2OCRについて

  • イメージPDFの文字をOCR処理して、テキスト文書へ出力
    通常はイメージPDF内の文字に対し、選択やコピーなどの処理を行えません。
    OCR(文字自動認識)処理を行いテキストデータ(TEXT,RTF形式など)に変換することで、
    その結果に対して検索やコピーなどの処理を行えるようになります。

主な機能

入力処理に関するもの

  • 入力がマルチページファイルの場合、処理を行うページ番号を指定することが出来ます。
  • テキスト形式のPDFからテキスト情報を出力する事が可能です。

出力処理に関するもの

  • OCR処理したテキストデータは下記の形式で出力が可能です。
    • テキスト形式
    • RTF形式
    • HTML形式
    • XML形式
    • XLS形式
    • 透明テキスト付きPDF形式
  • RTF(リッチテキスト)で出力する場合、下記の設定が可能です。
    • 出力文字フォント
    • 出力文字のサイズ
    • 出力文字の色

OCRエンジンに関するもの

  • 文字認識範囲指定が可能(全景(最大A3サイズ)も可能)
  • クリッピング範囲の指定が可能
    • 外部からテキストによる指定
    • 定型サイズから選択
  • 認識処理時に下記情報の出力が可能です。
    • 認識した文字列毎の開始位置
    • 文字の大きさ(高さ)
    • 認識した文字数、など
  • 認識辞書のあるフォルダの指定
  • 学習文字ファイルの指定(ユーザが作成した学習文字ファイルを指定)
  • ノイズの強度の設定
  • 接触罫線の除去
  • 認識させる文字の種別を設定
  • 認識言語の設定
  • 座標原点位置の指定
  • OCR処理範囲の設定

対応データ形式

出力可能なフォーマット(モノクロ/カラー)

  • TEXT
  • RTF
  • XML
  • HTML
  • XLS
  • 透明テキスト付きPDF

簡易マニュアル

Q&Aと関連ページ

動作環境

対応OS

  • Windows XP(SP3以降)(32bit版)
  • Windows Vista(32bit版)
  • Windows 7(32/64bit)
  • Windows 8 / Windows 8.1(32/64bit)
  • Windows 10(32/64bit)
  • Windows Server 2003(SP1以降)(32bit版)
  • Windows Server 2008(32bit版)
  • Windows Server 2008 R2
  • Windows Server 2012 / Windows Server 2012 R2
  • Windows Server 2016

価格表

型番 製品名 価格 (税抜)
KD-RAS0656 PDF2OCR 30万円
  • 製品定価にサポート費用は含まれていません。別途サポート費用が必要です。
    >>詳細はこちら
  • 価格は、1台のマシン(1CPU)に対して1インストールの価格設定です(サーバーへのインストール可)。
    購入本数によってボリュームディスカウントがあります。

関連製品

製品名 製品概要
RS2OCR イメージからテキスト情報を抽出
RS3PST_OCR ラスターからPDFへ変換+OCR機能追加版
RSTX3PST_OCR ラスターからPDFへ変換+OCR機能追加版+テキスト合成機能追加版
RSBAR3PST_OCR ラスターからPDFへ変換+OCR機能追加+バーコード+テキスト合成機能追加版

更新履歴

2019年12月13日

バージョンアップを行いました。(ver 2.1.4)

2019年4月19日

バージョンアップを行いました。(ver 2.1.3)

2018年10月26日

バージョンアップを行いました。(ver 2.1.2)

  • PDF 2.0のセキュリティ(Acrobat X相当)に対応しました。
TOP