JPWO2021053510A5

JPWO2021053510A5 -

Info

Publication number: JPWO2021053510A5
Application number: JP2022515803A
Authority: JP
Publication date: 2022-12-16
Anticipated expiration: 2040-09-15

Claims

文書を処理する方法であって、
前記文書を、該文書を画素値のセットとして表すビットマップ画像に変換することと、
前記ビットマップ画像からの画素値のセットを行総和値のセットおよび列総和値のセットに集約することと、
局所フーリエ変換を前記行総和値のセットおよび前記列総和値のセットに適用して前記行総和値のセットおよび前記列総和値のセットの周波数表現のセットを生成することと、
前記周波数表現のセットで識別される少なくとも１つの分離位置に基づいて、前記ビットマップ画像を画像部分のセットに分解することと、
前記画像部分のセットをテキスト認識システムに送信することと、
を含む、方法。
前記行総和値のセットを行総和信号にまとめることと、
前記列総和値のセットを列総和信号にまとめることと、
前記局所フーリエ変換を前記行総和信号に適用して行周波数表現を生成し、前記局所フーリエ変換を前記列総和信号に適用して列周波数表現を生成することと、
をさらに含む、請求項１に記載の方法。
前記行周波数表現においてゼロ周波数領域を識別することであって、前記ゼロ周波数領域は、前記ビットマップ画像内の隣接する行の間で前記行総和値のセットのサブセットに変化がないことに対応する、識別することと、
前記ゼロ周波数領域内で前記分離位置を選択することと、
をさらに含む、請求項１または２に記載の方法。
前記分解することの前に、前記方法は、
前記ビットマップ画像の第１のビットマップ境界領域のセットに対応する前記列周波数表現における第１のゼロ周波数領域のセットを識別することと、
前記ビットマップ画像の第２のビットマップ境界領域のセットに対応する前記行周波数表現における第２のゼロ周波数領域のセットを識別することと、
前記ビットマップ画像から前記第１のビットマップ境界領域のセットおよび前記第２のビットマップ境界領域のセットを除去することと、
をさらに含む、請求項１、２、または３に記載の方法。
前記画像部分のセットは第１の画像部分および第２の画像部分を含み、前記方法は、
前記第１の画像部分からの画素値のサブセットを行総和値のサブセットおよび列総和値のサブセットに集約することと、
前記局所フーリエ変換を前記行総和値のサブセットおよび前記列総和値のサブセットに適用して周波数表現のサブセットを生成することと、
前記周波数表現のサブセットで識別される少なくとも１つの異なる分離位置に基づいて、前記第１の画像部分を第３の画像部分および第４の画像部分に再帰的に分解することと、
をさらに含む、請求項１～４のいずれか一項に記載の方法。
前記周波数表現のセットは、前記行総和値のセットに対応する行周波数表現を含み、前記画像部分のセットは第１の画像部分および第２の画像部分を含み、前記方法は、
前記第１の画像部分に対応する前記行周波数表現の部分を評価することと、
前記評価することから、ゼロ周波数信号スパン・サイズと非ゼロ周波数信号スパン・サイズとの最小の線形結合を特定することと、
前記最小の線形結合が前記第１の画像部分の高さに近いか否かを判定することと、
前記最小の線形結合が前記第１の画像部分の高さに近いと判定したことに応答して、前記第１の画像部分の分解を終了することと、
をさらに含む、請求項１～５のいずれか一項に記載の方法。
前記テキスト認識システムによって、前記画像部分のセットのそれぞれに光学文字認識を適用してテキスト部分のセットを生成することであって、前記テキスト部分のセット内の各テキスト部分は、前記画像部分の１つに対応する、生成すること
をさらに含む、請求項１～６のいずれか一項に記載の方法。
前記文書を変換することは、
画素強度のセットを含む黒／白の画像に前記文書を変換することと、
前記画素強度のセットを正規化して前記ビットマップ画像の前記画素値のセットを生成することと、
を含む、請求項１～７のいずれか一項に記載の方法。
１つまたは複数のプロセッサと、
前記プロセッサのうちの少なくとも１つに結合されたメモリと、
前記メモリに記憶され、アクションを実行することによって文書を処理するために前記プロセッサのうちの少なくとも１つによって実行されるコンピュータ・プログラム命令のセットと、
を含む情報ハンドリング・システムであって、前記アクションは、
前記文書を、該文書を画素値のセットとして表すビットマップ画像に変換することと、
前記ビットマップ画像からの画素値のセットを行総和値のセットおよび列総和値のセットに集約することであって、前記ビットマップ画像は文書の画素化された表現である、集約することと、
局所フーリエ変換を前記行総和値のセットおよび前記列総和値のセットに適用して前記行総和値のセットおよび前記列総和値のセットの周波数表現のセットを生成することと、
前記周波数表現のセットで識別される少なくとも１つの分離位置に基づいて、前記ビットマップ画像を画像部分のセットに分解することと、
前記画像部分のセットをテキスト認識システムに送信することと、
を含む、情報ハンドリング・システム。
前記プロセッサは、
前記行総和値のセットを行総和信号にまとめることと、
前記列総和値のセットを列総和信号にまとめることと、
前記局所フーリエ変換を前記行総和信号に適用して行周波数表現を生成し、前記局所フーリエ変換を前記列総和信号に適用して列周波数表現を生成することと、
を含む追加のアクションを実行する、請求項９に記載の情報ハンドリング・システム。
前記プロセッサは、
前記行周波数表現においてゼロ周波数領域を識別することであって、前記ゼロ周波数領域は、前記ビットマップ画像内の隣接する行の間で前記行総和値のセットのサブセットに変化がないことに対応する、識別することと、
前記ゼロ周波数領域内で前記分離位置を選択することと、
を含む追加のアクションを実行する、請求項９または１０に記載の情報ハンドリング・システム。
前記分解することの前に、前記プロセッサは、
前記ビットマップ画像の第１のビットマップ境界領域のセットに対応する前記列周波数表現における第１のゼロ周波数領域のセットを識別することと、
前記ビットマップ画像の第２のビットマップ境界領域のセットに対応する前記行周波数表現における第２のゼロ周波数領域のセットを識別することと、
前記ビットマップ画像から前記第１のビットマップ境界領域のセットおよび前記第２のビットマップ境界領域のセットを除去することと、
を含む追加のアクションを実行する、請求項９、１０、または１１に記載の情報ハンドリング・システム。
前記画像部分のセットは第１の画像部分および第２の画像部分を含み、前記プロセッサは、
前記第１の画像部分からの画素値のサブセットを行総和値のサブセットおよび列総和値のサブセットに集約することと、
前記局所フーリエ変換を前記行総和値のサブセットおよび前記列総和値のサブセットに適用して周波数表現のサブセットを生成することと、
前記周波数表現のサブセットで識別される少なくとも１つの異なる分離位置に基づいて、前記第１の画像部分を第３の画像部分および第４の画像部分に再帰的に分解することと、
を含む追加のアクションを実行する、請求項９～１２のいずれか一項に記載の情報ハンドリング・システム。
前記周波数表現のセットは、前記行総和値のセットに対応する行周波数表現を含み、前記画像部分のセットは第１の画像部分および第２の画像部分を含み、前記プロセッサは、
前記第１の画像部分に対応する前記行周波数表現の部分を評価することと、
前記評価することから、ゼロ周波数信号スパン・サイズと非ゼロ周波数信号スパン・サイズとの最小の線形結合を特定することと、
前記最小の線形結合が前記第１の画像部分の高さに近いか否かを判定することと、
前記最小の線形結合が前記第１の画像部分の高さに近いと判定したことに応答して、前記第１の画像部分の分解を終了することと、
を含む追加のアクションを実行する、請求項９～１３のいずれか一項に記載の情報ハンドリング・システム。
前記プロセッサは、
前記テキスト認識システムによって、前記画像部分のセットのそれぞれに光学文字認識を適用してテキスト部分のセットを生成することであって、前記テキスト部分のセット内の各テキスト部分は、前記画像部分の１つに対応する、生成すること
を含む追加のアクションを実行する、請求項９～１４のいずれか一項に記載の情報ハンドリング・システム。
請求項１～８のいずれか一項に記載の方法をコンピュータに実行させるためのコンピュータ・プログラムを記憶したコンピュータ可読記憶媒体。
命令を含むコンピュータ・プログラムであって、前記命令は、前記プログラムがコンピュータによって実行された場合に、請求項１～８のいずれか一項に記載の方法を前記コンピュータに実行させる、コンピュータ・プログラム。