JP2018116701A - 印鑑画像の処理装置、方法及び電子機器 - Google Patents
印鑑画像の処理装置、方法及び電子機器 Download PDFInfo
- Publication number
- JP2018116701A JP2018116701A JP2018003969A JP2018003969A JP2018116701A JP 2018116701 A JP2018116701 A JP 2018116701A JP 2018003969 A JP2018003969 A JP 2018003969A JP 2018003969 A JP2018003969 A JP 2018003969A JP 2018116701 A JP2018116701 A JP 2018116701A
- Authority
- JP
- Japan
- Prior art keywords
- seal
- seals
- candidate
- image
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
- Image Input (AREA)
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】本発明は、印鑑画像の処理装置、方法及び電子機器を提供する。【解決手段】前記処理方法は、2つ以上の印鑑に対応する同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;前記候補印鑑の印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び、関連印鑑であると確定された場合、2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成することを含む。【選択図】図1
Description
本発明は、画像処理の技術分野に関し、特に、印鑑画像の処理装置、方法及び電子機器に関する。
印鑑が、昔の書籍(ドキュメント)中の重要な情報源の一つである。今のところ、画像認識に基づく印鑑マッチング技術により、印鑑と書籍(ドキュメントとも称される)との間の関係を形成することができる。例えば、オフラインで大量の書・絵作品から印鑑画像を抽出することで、これらの印鑑画像の特徴を得て印鑑データベースに記憶することができ、また、検索により得られた印鑑画像に関す情報を用いて、関連する書・絵作品の所在位置などを特定することができる。
しかし、本発明の発明者は、次のようなことを発見した。即ち、今までの研究は、主に、印鑑と書籍(又は、ドキュメント)との間の関係に集中し、印鑑と印鑑との間の相互関係が有効にマイニングされていない。
本発明の目的は、印鑑とドキュメントとの間の関係に基づいて、印鑑間の関連付けをさらにマイニングして形成することで、より正確な情報を得ることができる印鑑画像の処理装置、方法及び電子機器を提供することにある。
本実施例の第一側面によれば、印鑑画像の処理装置が提供され、それは、
スキャンされたドキュメント画像から複数の印鑑画像を抽出するための印鑑画像抽出ユニットであって、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識(ID)を含む、印鑑画像抽出ユニット;
画像マッチングに基づいて、印鑑とドキュメントとの間の関係を形成するための印鑑・ドキュメント関係形成ユニット;
2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とするための候補印鑑確定ユニット;
所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を得るための印鑑内容認識ユニット;
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定するための関連印鑑確定ユニット;及び
前記2つ以上の候補印鑑が関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成するための印鑑・印鑑関係形成ユニットを含む。
スキャンされたドキュメント画像から複数の印鑑画像を抽出するための印鑑画像抽出ユニットであって、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識(ID)を含む、印鑑画像抽出ユニット;
画像マッチングに基づいて、印鑑とドキュメントとの間の関係を形成するための印鑑・ドキュメント関係形成ユニット;
2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とするための候補印鑑確定ユニット;
所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を得るための印鑑内容認識ユニット;
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定するための関連印鑑確定ユニット;及び
前記2つ以上の候補印鑑が関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成するための印鑑・印鑑関係形成ユニットを含む。
本実施例の第二側面によれば、印鑑画像の処理方法が提供され、それは、
スキャンされたドキュメント画像から複数の印鑑画像を抽出し、そのうち、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識を含み;
画像マッチングに基づいて、印鑑とドキュメントとの間の関係を形成し;
2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し;
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
前記2つ以上の候補印鑑が関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成することを含む。
スキャンされたドキュメント画像から複数の印鑑画像を抽出し、そのうち、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識を含み;
画像マッチングに基づいて、印鑑とドキュメントとの間の関係を形成し;
2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し;
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
前記2つ以上の候補印鑑が関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成することを含む。
本実施例の第三側面によれば、電子機器が提供され、前記電子機器は、上述の印鑑画像の処理装置を含む。
本発明の実施例の有益な効果は、2つ以上の印鑑に対応する同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;前記候補印鑑の印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び、関連印鑑と確定された場合、2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成することにより、印鑑間の関連付けをマイニングして形成することで、大量の新しい情報を得ることができるだけでなく、印鑑間の関係情報の正確性を大幅に向上させることで、より正確な情報を取得することもできる。
以下、添付した図面を参照しながら、本発明を実施するための好適な形態を詳細に説明する。なお、以下に開示の実施形態は、例示に過ぎず、本発明を限定するものでない。
本発明の実施例は、印鑑画像の処理方法を提供する。図1は、本発明の実施例における印鑑画像の処理方法を示す図である。図1に示すように、印鑑画像の処理方法100は、次のようなステップを含む。
ステップ101:スキャンされたドキュメント画像から複数の印鑑画像を抽出し、そのうち、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識(ID)を含み;
ステップ102:画像マッチングに基づいて、印鑑とドキュメントとの間の関係を形成し;
ステップ103:2つ以上の印鑑に対応する同じドキュメントの数量を統計(カウント)し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
ステップ104:所定の印鑑データベースに基づいて、前記候補印鑑の画像の内容を認識し、前記候補印鑑の画像に対応する印鑑内容を取得し;
ステップ105:前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
ステップ106:前記2つ以上の候補印鑑が前記関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成する。
ステップ102:画像マッチングに基づいて、印鑑とドキュメントとの間の関係を形成し;
ステップ103:2つ以上の印鑑に対応する同じドキュメントの数量を統計(カウント)し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
ステップ104:所定の印鑑データベースに基づいて、前記候補印鑑の画像の内容を認識し、前記候補印鑑の画像に対応する印鑑内容を取得し;
ステップ105:前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
ステップ106:前記2つ以上の候補印鑑が前記関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成する。
本実施例では、ドキュメント(例えば、昔の書籍)画像の印鑑画像の抽出について、例えば、カラーに基づく分析方法により実現することができる。例えば、印鑑が使用する印肉が一般的に赤色であるため、画像から色チャンネルのうちの赤色部分を抽出し、その後、2値化により赤色印鑑の範囲を取得し、そして、該範囲中で印鑑画像の抽出を行うことができる。
本実施例では、印鑑画像に対応するドキュメントの標識を該印鑑画像の1つの属性としても良い。例えば、ある印鑑画像P1がドキュメント2の画像から抽出された場合、ドキュメント2の標識(例えば、番号又は名称)を該印鑑画像P1のドキュメント属性とすることができる。
本実施例では、予め印鑑データベースを形成することができ、例えば、大量の書・絵作品から印鑑画像を抽出し、これらの印鑑画像の特徴を得て該印鑑データベースに記憶することができ、また、人工注釈の方法でこれらの印鑑画像の語義(意味)情報を得ることもできる。
図2は、本発明の実施例における印鑑画像の一例を示す図であり、ある印鑑画像(例えば、印鑑1で表される)のケースを示している。例えば、専門家の鑑定により、該印鑑1の印鑑内容(即ち、印文)が「古里瞿氏」であることを知ることができる。
図3は、本発明の実施例における印鑑画像の他の例を示す図であり、ある印鑑画像(例えば、印鑑2で表される)のケースを示している。例えば、専門家の鑑定により、該印鑑2の印鑑内容(即ち、印文)が「鉄琴銅剣楼」であることを知ることができる。
印鑑データベースでは、これらの印鑑画像の特徴と、対応する印文とを関連付けることができる。これにより、ある印鑑画像と、印鑑データベース中の画像とのマッチングを行うことで、対応する印文を得ることができ、又は、ある印文と、印鑑データベース中の文字との比較を行うことで、対応する印鑑画像を取得することができる。
本実施例では、大量ひいては膨大な印鑑やドキュメントについて、画像マッチングにより、印鑑とドキュメントとの間の関係を形成することができる。
例えば、抽出された印鑑画像のうちの任意の2つに対して画像マッチングを行っても良い。任意の2つの印鑑画像に対してマッチングを行った後に、類似度スコアを取得することができる。前記類似度スコアが所定のスコア閾値(例えば、経験値に基づいて予め設定されても良い)よりも大きい場合、前記2つ印鑑画像が同一印鑑に由来すると確定し、その後、前記2つ印鑑画像の属性を合併しても良い。
例えば、抽出された印鑑画像と、印鑑データベース中の印鑑画像とに対して画像マッチングを行っても良い。ある印鑑画像と、前記印鑑データベース中の印鑑画像との画像マッチングを行った後に、類似度スコアを得ることができる。前記類似度スコアが所定のスコア閾値(例えば、経験値に基づいて予め設定されても良い)よりも大きい場合、前記2つ印鑑画像が同一印鑑に由来すると確定し、その後、該印鑑画像の属性と、前記印鑑データベース中の該印鑑画像の属性とを合併することができる。
これにより、印鑑とドキュメントとの関連付け図を生成することができる。
図4は、本発明の実施例における印鑑とドキュメントとの関連付けを示す図である。図4に示すように、例えば、印鑑1(対応する印文は「古里瞿氏」である)は、ドキュメント1(対応する名称は、「蒙史一巻」)、ドキュメント2(対応する名称は、「懐古堂印稿二巻」である)、ドキュメント3(対応する名称は「賢良進巻八巻」である)、ドキュメント4(対応する名称は「清館印譜初集一巻続集一巻」である)、ドキュメント5(対応する名称は「使規一巻使緬付録一巻」である)と関連付けることができる。
図4に示すように、例えば、印鑑2(対応する印文は「鉄琴銅剣楼」である)は、ドキュメント1(対応する名称は「蒙史一巻」である)、ドキュメント2(対応する名称は「懐古堂印稿二巻」である)、ドキュメント3(対応する名称は「賢良進巻八巻」である)、ドキュメント4(対応する名称は「清館印譜初集一巻続集一巻」である)と関連付けることができる。
図4に示すように、ドキュメントに対応する属性は、さらに、関連作者又は編集者など、例えば、
(外1)
などを含んでも良い。また、図4は、印鑑とドキュメントとの関連付け図の一部の内容のみを示しているが、本発明は、これに限定されない。
(外1)
などを含んでも良い。また、図4は、印鑑とドキュメントとの関連付け図の一部の内容のみを示しているが、本発明は、これに限定されない。
本実施例では、2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とすることができる。
例えば、図4中の印鑑1(対応する印文は「古里瞿氏」である)及び印鑑2(対応する印文は「鉄琴銅剣楼」である)は、すべて、ドキュメント1、2、3及び4に対応し、即ち、同じドキュメントの数量は4である。所定の数量閾値が3である場合、該同じドキュメントの数量は該数量閾値よりも大きいため、この2つ印鑑は候補の関連印鑑であると確定することができる。
本実施例では、関連印鑑は、例えば、次のような場合であり、即ち、印鑑の所有者が同じ人であり、又は、同じ家族に属し、又は、同じ蔵書機構に属すなどである。なお、本発明は、これに限定されず、他の関連関係によるものであっても良い。
即ち、例えば、関連印鑑が複数のドキュメントに共同で出現し得るというような特徴を利用することができる。2つの印鑑がN(所定閾値Nthre以上)個のドキュメントに同時に出現した場合、この2つの印鑑が候補の関連印鑑であると判断することができる。また、合併する方式で、すべての候補の関連印鑑を見つけることができる。
本実施例では、所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し、その後、前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定することができる。
1つの実施方式では、2つ以上の候補印鑑に対応する印鑑内容について、サーチエンジンを用いて検索することができ、前記2つ以上の候補印鑑に対応する印鑑内容がすべて関連検索結果に出現した場合、前記2つ以上の候補印鑑が関連印鑑であると確定することができる。
例えば、印鑑1に対応する印文「古里瞿氏」及び印鑑2に対応する印文「鉄琴銅剣楼」について、サーチエンジン(例えば、Google、百度(Baidu;中国の中国語サーチエンジンである)、又は、ある知識データベースなど)を用いて検索を行い、この2つの印文がすべて関連検索結果(例えば、同一ウェブページ、又は、同一知識データベースのある章、節、段落など)に出現した場合、前記2つ以上の印鑑に対応する印鑑内容が関連すると確定することができる。
ここで、「百度」による検索を例として、「古里瞿氏 鉄琴銅剣楼」をキーワードとして検索すると、表1に示すような一部の検索結果(中国語のみ)を得ることができる。
表1に示すように、検索による結果中で、これらのキーワードは、すべて、同一ホームページの同一段落にある。よって、印鑑1及び印鑑2が関連印鑑であると確定することができる。なお、表1は、検索結果の1つの例のみを示しているが、本発明は、これに限定されない。
もう1つの実施方式では、語義に基づいて2つ以上の候補印鑑に対応する印鑑内容に対して分析を行っても良い。前記2つ以上の候補印鑑に対応する印鑑内容の語義が同じであり又は類似した場合、前記2つ以上の候補印鑑が関連印鑑であると確定しても良い。
例えば、人工分析(例えば、経験ありの専門家による分析)又は機器分析(例えば、テキスト理解)などにより、関連印鑑であるかを確定することができる。例えば、テキスト理解により、印鑑1(対応する印文は「古里瞿氏」である)の所有者が「瞿紹基」であり、彼が「鉄琴銅剣楼」(印鑑2に対応する)の創始者であることを発見することができるので、印鑑1及び印鑑2が関連印鑑であると確定することができる。
本実施例では、2つ以上の候補印鑑が関連印鑑であると確定した場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成することができる。例えば、印鑑に「関連印鑑」の属性を加え、また、対応する関連印鑑の標識を加えても良い。
本実施例では、さらに、印鑑と印鑑との間の関係に基づいて、印鑑とドキュメントとの間の関係を更新することができる。例えば、関連印鑑を1つの大カテゴリに合併するとともに、対応するドキュメントも合併し、これにより、この類の印鑑に関する1つのドキュメント集合を形成することができる。
これにより、印鑑間の関連付けをマイニングして形成することで、大量の新しい情報を得ることができる。例えば、図4に示す実例では、印鑑1と印鑑2との間の関連関係を確定すれば、図4中の印鑑2とドキュメント5とが関連付けられていなくても、印鑑1とドキュメント5との関係、及び、印鑑1と印鑑2との関係に基づいて、印鑑2をドキュメント5と関連付けることができ、これにより、新しい情報を得ることができる。
また、候補印鑑をもとに、さらに、印鑑内容に基づいて、関連印鑑であるかを判断することで、印鑑とドキュメントとの間の関係情報の正確性を向上させることができ、これにより、得られた情報をより信頼性の高いものにすることができる。例えば、図4に示す実例では、印鑑1とドキュメント1との間の繋がりが画像マッチングにより形成され、画像認識に誤差が存在する可能性があるため、このような繋がりの信頼性は、僅か50%を有する可能性がある。印鑑1と印鑑2との間の関連関係を確定しており、且つ印鑑2とドキュメント1との間にも繋がりがある場合、印鑑1とドキュメント1との間の繋がりは信頼できるものであるとしても良く、例えば、信頼性は、90%まで向上することが可能である。
図5は、本発明の実施例における印鑑画像の処理方法を示す他の図である。2つの印鑑を例としてより詳しく説明する。図5に示すように、印鑑画像の処理方法500は、次のようなステップを含んでも良い。
ステップ501:スキャンされたドキュメント画像から複数の印鑑画像を抽出し、そのうち、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識を含み;
ステップ502:画像マッチングにより、印鑑とドキュメントとの間の関係を形成し;
ステップ503:2つの印鑑を選択し;
ステップ504:2つ印鑑に対応する同じドキュメントの数量が閾値以上であるかを判断し、同じドキュメントの数量が所定の数量閾値以上である場合、ステップ505を実行し、同じドキュメントの数量が所定の数量閾値より小さい場合、ステップ503を実行して、2つの印鑑を再び選択し;
ステップ505:前記2つの印鑑を関連付けられる候補印鑑とし;
ステップ506:所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し;
ステップ507:印鑑内容に基づいて、この2つ候補印鑑が関連印鑑であるかを判断し、はいの場合、ステップ508を実行し、いいえの場合、ステップ503を実行して、2つの印鑑を再び選択し、例えば、サーチエンジンを用いて印鑑内容について検索を行っても良く、又は、語義に基づいて印鑑内容について分析を行っても良いが、本発明は、これに限定されず;
ステップ508:前記2つの候補印鑑のために、印鑑と印鑑との間の関係を形成し;
ステップ509:所定条件を満足したかを判断し、はいの場合、ステップ510を実行し、いいえの場合、ステップ503を実行して、2つの印鑑を再び選択し、そのうち、所定条件は、例えば、所定時間を超えたか、又は、所定処理回数を超えたか、又は、全ての印鑑が処理されたかなどであっても良く;
ステップ510:印鑑と印鑑との間の関係に基づいて、印鑑とドキュメントとの間の関係を更新する。
ステップ502:画像マッチングにより、印鑑とドキュメントとの間の関係を形成し;
ステップ503:2つの印鑑を選択し;
ステップ504:2つ印鑑に対応する同じドキュメントの数量が閾値以上であるかを判断し、同じドキュメントの数量が所定の数量閾値以上である場合、ステップ505を実行し、同じドキュメントの数量が所定の数量閾値より小さい場合、ステップ503を実行して、2つの印鑑を再び選択し;
ステップ505:前記2つの印鑑を関連付けられる候補印鑑とし;
ステップ506:所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し;
ステップ507:印鑑内容に基づいて、この2つ候補印鑑が関連印鑑であるかを判断し、はいの場合、ステップ508を実行し、いいえの場合、ステップ503を実行して、2つの印鑑を再び選択し、例えば、サーチエンジンを用いて印鑑内容について検索を行っても良く、又は、語義に基づいて印鑑内容について分析を行っても良いが、本発明は、これに限定されず;
ステップ508:前記2つの候補印鑑のために、印鑑と印鑑との間の関係を形成し;
ステップ509:所定条件を満足したかを判断し、はいの場合、ステップ510を実行し、いいえの場合、ステップ503を実行して、2つの印鑑を再び選択し、そのうち、所定条件は、例えば、所定時間を超えたか、又は、所定処理回数を超えたか、又は、全ての印鑑が処理されたかなどであっても良く;
ステップ510:印鑑と印鑑との間の関係に基づいて、印鑑とドキュメントとの間の関係を更新する。
なお、図5は、本発明の実施例についての例示に過ぎず、本発明は、これに限定されない。例えば、各ステップ間の実行順序を適切に変更しても良く、又は、幾つかのステップを増減しても良い。言い換えると、当業者は、上述の内容に基づいて適切に変更しても良く、即ち、図5の記載に限定されない。
上述の実施例から分かるように、2つ以上の印鑑に対応する同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;前記候補印鑑の印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び、関連印鑑であると確定した場合、2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成することにより、印鑑間の関連付けをマイニングして形成することで、大量の新しい情報を得ることができるだけでなく、印鑑とドキュメントとの間の関係情報の正確性を大幅に向上させることで、より信頼性の高い情報を得ることもできる。
本発明の実施例は、印鑑画像の処理装置を提供し、本発明の実施例は、実施例1の印鑑画像の処理方法に対応するため、同じ内容は、省略される。
図6は、本発明の実施例における印鑑画像の処理装置を示す図である。図6に示すように、印鑑画像の処理装置600は、次のようなものを含む。
印鑑画像抽出ユニット601:スキャンされたドキュメント画像から複数の印鑑画像を抽出し、そのうち、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識(ID)を含み;
印鑑・ドキュメント関係形成ユニット602:画像マッチングにより、印鑑とドキュメントとの間の関係を形成し;
候補印鑑確定ユニット603:2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
印鑑内容認識ユニット604:所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し;
関連印鑑確定ユニット605:前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
印鑑・印鑑関係形成ユニット606:前記2つ以上の候補印鑑が前記関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成する。
印鑑・ドキュメント関係形成ユニット602:画像マッチングにより、印鑑とドキュメントとの間の関係を形成し;
候補印鑑確定ユニット603:2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
印鑑内容認識ユニット604:所定の印鑑データベースに基づいて、前記候補印鑑の画像に対して内容認識を行い、前記候補印鑑の画像に対応する印鑑内容を取得し;
関連印鑑確定ユニット605:前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
印鑑・印鑑関係形成ユニット606:前記2つ以上の候補印鑑が前記関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成する。
図6に示すように、印鑑画像の処理装置600は、さらに、次のようなものを含んでも良い。
印鑑・ドキュメント関係更新ユニット607:前記印鑑と印鑑との間の関係に基づいて、前記印鑑とドキュメントとの間の関係を更新する。
図7は、本発明の実施例における印鑑・ドキュメント関係形成ユニットを示す図である。図7に示すように、印鑑・ドキュメント関係形成ユニット602は、次のようなものを含んでも良い。
印鑑マッチングユニット701:抽出された各2つの印鑑画像に対して画像マッチングを行い、又は、抽出された印鑑画像と、前記印鑑データベース中の印鑑画像とに対して画像マッチングを行い、類似度スコアを得る。
図7に示すように、印鑑・ドキュメント関係形成ユニット602は、さらに、次のようなものを含んでも良い。
同一印鑑確定ユニット702:前記類似度スコアが所定のスコア閾値以上の場合、前記2つ印鑑画像が同一印鑑に由来すると確定し;及び
属性合併ユニット703:前記2つ印鑑画像の属性に対して合併を行う。
属性合併ユニット703:前記2つ印鑑画像の属性に対して合併を行う。
本実施例では、関連印鑑確定ユニット605は、具体的に、前記2つ以上の候補印鑑に対応する印鑑内容についてサーチエンジンを用いて検索を行い、前記2つ以上の候補印鑑に対応する印鑑内容がすべて関連検索結果に出現した場合、前記2つ以上の候補印鑑が前記関連印鑑であると確定するように構成される。
本実施例では、関連印鑑確定ユニット605は、具体的に、さらに、語義に基づいて前記2つ以上の候補印鑑に対応する印鑑内容に対して分析を行い、前記2つ以上の候補印鑑に対応する印鑑内容の語義が同じであり又は類似した場合、前記2つ以上の候補印鑑が前記関連印鑑であると確定するように構成される。
なお、以上では、本発明に関連する各部品又はモジュールのみについて説明したが、本発明は、これに限定されない。印鑑画像の処理装置の他の部品又はモジュールについては、関連技術を参照することもできる。
上述の実施例から分かるように、2つ以上の印鑑に対応する同じドキュメントの数量が所定の数量閾値以上である場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;前記候補印鑑の印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び、関連印鑑であると確定した場合、2つ以上の候補印鑑のために印鑑と印鑑との間の関係を形成することにより、印鑑間の関連付けをマイニングして形成することで、大量の新しい情報を得ることができるだけでなく、印鑑とドキュメントとの間の関係情報の正確性を大幅に向上させることで、より信頼性の高い情報を得ることもできる。
本発明の実施例は、さらに、電子機器を提供し、それは、実施例2に記載の印鑑画像の処理装置を含むので、その内容は、ここに合併される。該電子機器は、例えば、コンピュータ、サーバ、ワークステーション、ラップトップコンピュータ、スマートフォンなどであっても良いが、本発明は、これに限定されない。
図8は、本発明の実施例における電子機器を示す図である。図8に示すように、電子機器800は、中央処理装置(CPU)810及び記憶器820を含んでも良く、記憶器820は、中央処理装置810に接続される。そのうち、該記憶器820は、各種のデータを記憶することができ、また、情報処理用のプログラムを記憶することもでき、且つ中央処理装置100の制御下で該プログラムを実行することができる。
1つの実施方式中、印鑑画像の処理装置600の機能は、中央処理装置810に統合することができる。そのうち、中央処理装置810は、実施例1に記載の印鑑画像の処理方法を実現し得るように構成されても良い。
もう1つの実施方式では、印鑑画像の処理装置600は、中央処理装置810と別々で配置することができる。例えば、印鑑画像の処理装置600を、中央処理装置810に接続されるチップとして構成し、中央処理装置810の制御により、印鑑画像の処理装置600の機能を実現しても良い。
例えば、中央処理装置810は、次のような制御を行うように構成されても良く、即ち、スキャンされたドキュメント画像から複数の印鑑画像を抽出し;画像マッチングにより印鑑とドキュメントとの間の関係を形成し;2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;所定の印鑑データベースに基づいて前記候補印鑑の画像の内容を認識し、前記候補印鑑の画像に対応する印鑑内容を取得し;前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び、前記2つ以上の候補印鑑が前記関連印鑑であると確定した場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成する。
また、図8に示すように、電子機器800は、さらに、入力出力(I/O)ユニット830及び表示器840などを含んでも良い。そのうち、これらの部品の機能は、従来技術に類似したので、ここでは、詳しい説明を省略する。なお、電子機器800は、必ずしも図8中の全ての部品を含む必要がない。また、電子機器800は、さらに、図8に無い部品を含んでも良く、これについては、従来技術を参照することができる。
本発明の実施例は、さらに、コンピュータ可読プログラムを提供し、そのうち、電子機器中で前記プログラムを実行する時に、前記プログラムは、コンピュータに、前記電子機器中で実施例1に記載の印鑑画像の処理方法を実行させる。
本発明の実施例は、さらに、コンピュータ可読プログラムを記憶した記憶媒体を提供し、そのうち、前記コンピュータ可読プログラムは、コンピュータに、電子機器中で実施例1に記載の印鑑画像の処理方法を実行させる。
本発明の実施例による装置、方法などは、ソフトウェアにより実現されても良く、ハードェアにより実現されてもよく、ハードェア及びソフトウェアの組み合わせにより実現されても良い。また、本発明は、このようなコンピュータ可読プログラムにも関し、即ち、前記プログラムは、ロジック部品により実行される時に、前記ロジック部品に、上述の装置又は構成要素を実現させることができ、又は、前記ロジック部品に、上述の方法又はそのステップを実現させることができる。さらに、本発明は、上述のプログラムを記憶するための記憶媒体、例えば、ハードディスク、磁気ディスク、光ディスク、DVD、フレッシュメモリなどにも関する。
以上、本発明の好ましい実施形態を説明したが、本発明はこの実施形態に限定されず、本発明の趣旨を離脱しない限り、本発明に対するあらゆる変更は本発明の技術的範囲に属する。
Claims (10)
- 印鑑画像の処理装置であって、
スキャンされたドキュメント画像から複数の印鑑画像を抽出するための印鑑画像抽出ユニットであって、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識を含む、印鑑画像抽出ユニット;
画像マッチングにより、印鑑とドキュメントとの間の関係を形成するための印鑑・ドキュメント関係形成ユニット;
2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とするための候補印鑑確定ユニット;
所定の印鑑データベースに基づいて、前記候補印鑑の画像の内容を認識し、前記候補印鑑の画像に対応する印鑑内容を得るための印鑑内容認識ユニット;
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定するための関連印鑑確定ユニット;及び
前記2つ以上の候補印鑑が前記関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成するための印鑑・印鑑関係形成ユニットを含む、処理装置。 - 請求項1に記載の処理装置であって、
前記印鑑と印鑑との間の関係に基づいて、前記印鑑とドキュメントとの間の関係を更新するための印鑑・ドキュメント関係更新ユニットをさらに含む、処理装置。 - 請求項1に記載の処理装置であって、
前記印鑑・ドキュメント関係形成ユニットは、
抽出された任意の2つの印鑑画像に対して画像マッチングを行い、又は、抽出された任意の印鑑画像と前記印鑑データベース中の印鑑画像とに対して画像マッチングを行い、類似度スコアを得るための印鑑マッチングユニットを含む、処理装置。 - 請求項3に記載の処理装置であって、
前記印鑑・ドキュメント関係形成ユニットは、
前記類似度スコアが所定のスコア閾値以上である場合、2つの印鑑画像が同一印鑑に由来すると確定するための同一印鑑確定ユニット;及び
前記2つ印鑑画像の属性に対して合併を行うための属性合併ユニットをさらに含む、処理装置。 - 請求項1に記載の処理装置であって、
前記関連印鑑確定ユニットは、前記2つ以上の候補印鑑に対応する印鑑内容についてサーチエンジンを用いて検索し、前記2つ以上の候補印鑑に対応する印鑑内容がすべて関連検索結果に出現した場合、前記2つ以上の候補印鑑が前記関連印鑑であると確定する、処理装置。 - 請求項1に記載の処理装置であって、
前記関連印鑑確定ユニットは、語義に基づいて、前記2つ以上の候補印鑑に対応する印鑑内容に対して分析を行い、前記2つ以上の候補印鑑に対応する印鑑内容の語義が同じであり又は類似した場合、前記2つ以上の候補印鑑が前記関連印鑑であると確定する、処理装置。 - 印鑑画像の処理方法であって、
スキャンされたドキュメント画像から複数の印鑑画像を抽出し、抽出された印鑑画像の属性は、少なくとも、対応するドキュメントの標識を含み;
画像マッチングンにより、印鑑とドキュメントとの間の関係を形成し;
2つ以上の印鑑に対応する同じドキュメントの数量を統計し、同じドキュメントの数量が所定の数量閾値以上の場合、前記2つ以上の印鑑を関連付けられる候補印鑑とし;
所定の印鑑データベースに基づいて、前記候補印鑑の画像の内容を認識し、前記候補印鑑の画像に対応する印鑑内容を取得し;
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定し;及び
前記2つ以上の候補印鑑が前記関連印鑑であると確定された場合、前記2つ以上の候補印鑑のために、印鑑と印鑑との間の関係を形成することを含む、処理方法。 - 請求項7に記載の処理方法であって、
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定することは、
前記2つ以上の候補印鑑に対応する印鑑内容についてサーチエンジンを用いて検索を行い;
前記2つ以上の候補印鑑に対応する印鑑内容がすべて関連検索結果に出現した場合、前記2つ以上の候補印鑑が前記関連印鑑であると確定することを含む、処理方法。 - 請求項7に記載の処理方法であって、
前記印鑑内容に基づいて、2つ以上の前記候補印鑑が関連印鑑であるかを確定することは、
語義に基づいて、前記2つ以上の候補印鑑に対応する印鑑内容に対して分析を行い;及び
前記2つ以上の候補印鑑に対応する印鑑内容の語義が同じであり又は類似した場合、前記2つ以上の候補印鑑が前記関連印鑑であると確定することを含む、処理方法。 - 請求項1〜6のうちの任意の1項に記載の印鑑画像の処理装置を含む、電子機器。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710042059.0 | 2017-01-20 | ||
CN201710042059.0A CN108334800B (zh) | 2017-01-20 | 2017-01-20 | 印章图像的处理装置、方法以及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018116701A true JP2018116701A (ja) | 2018-07-26 |
Family
ID=62922958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018003969A Pending JP2018116701A (ja) | 2017-01-20 | 2018-01-15 | 印鑑画像の処理装置、方法及び電子機器 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2018116701A (ja) |
CN (1) | CN108334800B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784835A (zh) * | 2021-01-21 | 2021-05-11 | 恒安嘉新(北京)科技股份公司 | 圆形印章的真实性识别方法、装置、电子设备及存储介质 |
WO2021088659A1 (zh) * | 2019-11-06 | 2021-05-14 | 胡金钱 | 电子签章载入方法和装置 |
CN114898382A (zh) * | 2021-10-12 | 2022-08-12 | 北京九章云极科技有限公司 | 一种图像处理方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101488214B (zh) * | 2008-01-15 | 2011-07-27 | 中国科学院软件研究所 | 一种扩展防伪数字水印和电子印章信息量的方法 |
AU2009101052A4 (en) * | 2009-10-15 | 2009-12-17 | Darbyshire, Adam Mr | Remote Witnessing System |
JP5578188B2 (ja) * | 2012-02-17 | 2014-08-27 | コニカミノルタ株式会社 | 画像処理装置、画像処理装置の制御方法、および、プログラム |
JP2016177605A (ja) * | 2015-03-20 | 2016-10-06 | 株式会社リコー | 電子印鑑、送信プログラム、送信方法、情報処理装置、情報処理プログラム、情報処理方法および認証システム |
US9946924B2 (en) * | 2015-06-10 | 2018-04-17 | Accenture Global Services Limited | System and method for automating information abstraction process for documents |
-
2017
- 2017-01-20 CN CN201710042059.0A patent/CN108334800B/zh active Active
-
2018
- 2018-01-15 JP JP2018003969A patent/JP2018116701A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021088659A1 (zh) * | 2019-11-06 | 2021-05-14 | 胡金钱 | 电子签章载入方法和装置 |
CN112784835A (zh) * | 2021-01-21 | 2021-05-11 | 恒安嘉新(北京)科技股份公司 | 圆形印章的真实性识别方法、装置、电子设备及存储介质 |
CN112784835B (zh) * | 2021-01-21 | 2024-04-12 | 恒安嘉新(北京)科技股份公司 | 圆形印章的真实性识别方法、装置、电子设备及存储介质 |
CN114898382A (zh) * | 2021-10-12 | 2022-08-12 | 北京九章云极科技有限公司 | 一种图像处理方法及装置 |
CN114898382B (zh) * | 2021-10-12 | 2023-02-21 | 北京九章云极科技有限公司 | 一种图像处理方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108334800B (zh) | 2021-09-24 |
CN108334800A (zh) | 2018-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11580763B2 (en) | Representative document hierarchy generation | |
CN108701161B (zh) | 为搜索查询提供图像 | |
US8155444B2 (en) | Image text to character information conversion | |
US10049096B2 (en) | System and method of template creation for a data extraction tool | |
US9286526B1 (en) | Cohort-based learning from user edits | |
JP2018116701A (ja) | 印鑑画像の処理装置、方法及び電子機器 | |
CN106815253B (zh) | 一种基于混合数据类型数据的挖掘方法 | |
US20200210746A1 (en) | Floating form processing based on topological structures of documents | |
CN110750297B (zh) | 一种基于程序分析和文本分析的Python代码参考信息生成方法 | |
JP2014056503A (ja) | 多言語環境でのコミュニケーションに適する非テキスト要素を特定するためのコンピュータ実装方法、プログラム、および、システム | |
US20230138491A1 (en) | Continuous learning for document processing and analysis | |
CN117272959A (zh) | 基于bert模型的表单低代码生成方法及系统 | |
CN113255369B (zh) | 文本相似度分析的方法、装置及存储介质 | |
US20150199582A1 (en) | Character recognition apparatus and method | |
US20230134218A1 (en) | Continuous learning for document processing and analysis | |
US20210073258A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN114003750A (zh) | 物料上线方法、装置、设备及存储介质 | |
CN112100336A (zh) | 一种档案的保存时间鉴定方法、装置及存储介质 | |
CN110083817B (zh) | 一种命名排歧方法、装置、计算机可读存储介质 | |
US20150026553A1 (en) | Analyzing a document that includes a text-based visual representation | |
US11868726B2 (en) | Named-entity extraction apparatus, method, and non-transitory computer readable storage medium | |
CN116681042B (zh) | 基于关键字提取的内容概要生成方法、系统及介质 | |
US20230326225A1 (en) | System and method for machine learning document partitioning | |
Wu | An Evaluation Framework of Optical Music Recognition in Numbered Music Notation | |
JP2004178044A (ja) | 属性抽出方法及びその装置及び属性抽出プログラム |