TW419628B - Image processing method and apparatus and memory meidum - Google Patents

Image processing method and apparatus and memory meidum Download PDF

Info

Publication number
TW419628B
TW419628B TW085115012A TW85115012A TW419628B TW 419628 B TW419628 B TW 419628B TW 085115012 A TW085115012 A TW 085115012A TW 85115012 A TW85115012 A TW 85115012A TW 419628 B TW419628 B TW 419628B
Authority
TW
Taiwan
Prior art keywords
image
image processing
line
patent application
text
Prior art date
Application number
TW085115012A
Other languages
English (en)
Inventor
Nobuhiko Tezuka
Original Assignee
Canon Kk
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Kk filed Critical Canon Kk
Application granted granted Critical
Publication of TW419628B publication Critical patent/TW419628B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

Λ c: Α7 Β7 經濟‘邱中央梂準局員工消費合作社印装 五、發明説明(i ) 發明背景 發明領域 本發明係關於OCR (光學字元辨認)裝置,拷貝機 、 \傳眞機等之影像處理裝置\且更特別而言X係關於一種 影像處理方法和裝置和記憶介質\其可適當的由包括一表 _ 1 - _ 影像之輸入影像中抽取字元。^ 本發明亦關於影像處理方法和裝置以及記憶介質,當 字元影像由輸入表影像抽出時,其可辨別輸X表之格式和 適當的抽取字元影像。 本發明亦關於影像處理方法和裝置以及記憶介質,其 可自動的辨別包括在輸入影像中之表影像之屬性,而無需 由使用者手動的指定該靥性。 相關背景技藝 具有自動區域分割功能之〇C R裝置執行處理以自動 的辨別由尺所圍繞之影像當成表影像,並抽取由表之尺所 圍繞之胞當成一影像區域。 在字元辨識後,藉由在由一字元區域所獲得之辨識結 果之字元串間插入接附碼和在線間插入返回碼,在字元之 辨認完成後,由表影像所抽取之胞之資訊反射至文件資料 ,藉此可使資料輕易的供應至表計算軟體等。 但是,依照前述之習知技藝’當當成字元辨認之靶之 表影像爲不具側尺之表,如圃7所示時’由於安排在垂直 _-- 方向之多數項目當成一字元菡域辨別’和輸入表不同之格 (請先閔讀背面之注意事項再填寫本頁) Λ. 訂 本紙張尺度適用中國國家標準(CNS ) Α4規格(210x297公廣) 經濟部中央標準局員工消費合作社印裝 4 1 962 8 ^ a? _B7_—__ 五、發明説明(2 ) 式文件可獲得,旦如此會迫使操作者校正此格式爲輸入表 之格式之操作,如此會增加操作者之負擔。 發明槪要 如上所述,依照本發明,一線影像由影像資訊中抽取 ,依辱所抽皂之線影像之特1性而辨別._影靥性,I 儲存該辨別靥性以相關於該影像資訊,因此,指示輸入之 表影像爲具有側尺f之表或((尺之表之表屬性無需由 操作者手動指定,表屬性可自動的辨別,日可改善極作性 - ' 〇 如上所述,依照本發明,藉由設定影像資訊爲由尺所 圍繞之影像資訊,多數包括在由尺所圍繞之一胞中之項目 可自動的辨別。 如上所述,依照本發明,藉由設定影像資訊爲可光學 讀出之影像資訊,則光學讀出影像可自動的處理,而無需 操作鍵等。 ~ 如上所述,依照本發明,藉由辨識線影像當成一字元 --------. 和與字元辨識之結果—起輸出一線定界限碼,則即使在文 件由字元辨識形成後,表之格式亦可保持。 如上所述,依照本發明,藉.由依照輸出資訊顯示一文 件,輸入影像之字元辨識之_結果和表之格式_可1題__示圈像 平面上確認。 如上所述,依照本發明,輸入影像資訊分割成由尺所 圍繞之小影像區域’線影像由分割小影像區域之影像資訊 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐)-- 1' .^1 n I I 1 I--ϊ I :衣----- !訂 (請先閱讀背面之注意事項再填寫本頁) 4 1 962 8 'Hi A7 B7 經濟部中央標率局員工消#合作社印製 五 、發明説明 ( 3 ) 1 1 中 抽 取 且 包 括 在 輸 入 影 像 資 訊 中 之 線 影 像 依 照 設 置 有 線 1 影 像 之 小 影 像 域 之 位 置 關 係 和 在 小 影 像 區 域 中 之 位 置 而 1 1 排 序 , 因 此 5 可 適 當 的 辨 別 不 具 有 側 尺 之 特 殊 表 之 格 式 0 I 請 1 I 如 上 所 述 , 依 照 本 發 明 藉 由 辨 別 影 像 資 訊 之 屬 性 並 先 閱 1 1 讀 1 I 依 照 屬 性 辨 別 機 稱 之 辨 別 結 果 決 定 線 影 像 之 抽 取 是 否 執 行 背 ι6 1 I 之 1 Ϊ 適 當 的 處 理 只 在 適 當 的 例 中 執 行 因 此 即 使 在 文 件 由 注 意 1 事 1 字 元 辨 認 所 形 成 後 9 表 之 格 式 亦 可 保 持 0 項 再 1 4 1 jT 寫 本 頁 1 圖 式 簡 單 說 明 •w· 1 圖. 1 爲 影 像 處 理 裝 置 之 功 能 構 造 之 方 塊 圖 1 ί 圖 2 爲 整 個 處 理 之 流 程 圖 1 圖 3 爲 表 屬 性 辨 別 處 理 之 流 程 ΓΒΓΪ 圖 _訂 I 圖 4 爲 不 具 有 側 尺 之 表 之 處 理 之 流 程 rerj 圖 1 1 圖 5 爲 表 屬 性 辨 別 處 理 所 執 行 之 表 影 像 之 圖 例 1 1 I 圖 6 爲 不 具 有 側 尺 之 表 之 處 理 之 說 明 圖 和 1 1 圖 7 爲 習 知 表 影 像 處 理 之 說 明 圖 0 1 1 較 佳 實 施 例 之 詳 細 說 明 -1 1 1 圖 1 爲 本 發 明 之 影 像 處 理 裝 置 之 功 能 構 造 之 方 塊 圖 0 1 | 參 考 數 字 1 0 1 表 示 输 入 單 元 用 以 输 入 由 成 字 元 辛 識 之 g 1 1 標 之 影 像 資 訊 和 由 操 作 者 所 執 行 之 各 種 指 示 0 輸 入 單 元 1 1 0 1 具 有 鍵 盤 以 執 行 文 件 編 輯 〇 關 於 影 像 資 訊 之 輸 入 1 I 方 • -> » 囬 1 影 像 資 訊 可 利 用 可 光 學 的 讀 取 已 光 學 讀 取 之 原 件 或 i 1 影 像 資 訊 之 掃 描 機 輸 入 9 且 亦 可 經 由 一 記 億 裝 置 或 通 信 機 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 4 1 962 8 at Β7 經濟部4-失樣準局員工消費合作社印焚 五、發明説明(4 ) 構输入。參考數字1 0 2表示一處理器(CPU·)用以執 行裝置之控制和算術操作以及每個處理單元之控制,依照 流程圖之控制程式:1 0 3表示一記憶用以儲存用於處理 器1 0 2之控制程式,以執行如流程圖所示之處理,並儲 存使用於各種處理之資料或在各種處理中發生之資料。關 於儲存在記憶1 0 3中之依照本發明之處理之控制程式, 可使用儲存在例如F D或C D _ R 0M之記憶介質之控制 程式,該記憶介質可與裝置分離,或是使用由其它終端經 由一通信線供應之控制程式,並將其儲存。參考數字 1 0 4.表示用以輸出算術運算處理之結果,影像處理之結 果,和影像資料之输出單元。输出單元1 〇 4包括例如 CRT,液晶顯示器等顯示器,例如LBP,彩色噴墨印 表機等之印表機,和用以輸出至其它端或外部記憶機構之 輸出端。參考數字1 0 5表示用以排序段落和包括在影像 資訊中之句子之標題之排序單元:1 0 6表示用以執行影 像資訊之Μ域分割處理之區域分割器;1 0 7表示藉由偵 測和分析表影像之特性而用以自動的辨別包括在影像資訊 中之表影像之屬性之表屬性辨別器;1 0 8爲用以執行由 包括在影像資訊中之表影像抽取一表格式且形成一文件之 處理之表處理;和1 0 9爲用以由重量抽取一字元影像和 辨識所抽取之影像之字元辨識器。 圖2爲整個處理之流程圖,其由來自輸入單元1 〇 1 之影像之輸入至來自輸出單元1 0 4當成文件資料之字元 辨識和產生而執行一段期間。控制程式已儲存在記憶 {请先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS ) Α4规格(210Χ 297公釐) 419628 ^ A7 經濟部中央標準局員工消費合作社印焚 ______B7_五、發明説明(5 ) 1 0 3中,且由處理器1 〇 2之控制所執行。· 影像資訊由輸入單元1 0 1輸入(S 2 0 1 )。輸入 之影像資訊亦可由包括在输出單元1 0 4中之顯示機構顯 示,且亦可由操作者確認。輸入影像以區域分割器1 〇 6 分割成區域,且抽取例如文件,分離器,圖形,表等影像 資料區域(S 2 0 2 )。抽取影像資料區域之資訊乃儲存 在記憶1 0 3中。關於區域分割之詳細方法,可參考如日 本專利申請案No . 4-2 4 3 2 5 2所揭示之技術。關 於區域分割之結果,當表影像包括在輸入影像中時(在 S 2 0 3中是肯定的),則進行到步驟S 2 0 4 ,且執行 自動辨別表影像之屬性之處理(S 2 0 4 )。在步驟 S 2 ϋ 4中之表影像之屬性之自動辨別處理之詳細情形如 圖3之流程圖所示,且將說明於後。就步驟S 2 0 4之表 屬性之辨別結果而言,當表影像爲不具側尺之表時(在 S 2 0 5中爲肯定的),則進行到步驟S 2 0 6 ,並執行 不具有側R之表處理。在步驟S 2 '"0 6中之不具側尺之表 之表處理爲用以抽取在字元單元之單元基礎上(相當於一 胞)之處理,並在所抽取之字元之單元基礎上排序以保持 無側尺之表影像之表格式並形成一文件,其悖於後參考圖 4詳細說明。關於在步驟S 2 0 4中之表屬性之辨別結果 而言,當表影像爲具有側尺之影像時(在S 2 0 5中是否 定的),則進行至步驟S 2 0 9 ,並執行具有側尺之表之 表處理。在步驟S 2 0 9中用於具有側尺之表之表處理爲 用以抽取胞且排序所抽取之胞之處理,以保持表格式和形 (請先閲讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) A7 4 19 62 8 1 ____B7____ 五、發明说明(6 ) 成一文件。在排序處理中,依照由左至右和由上至下之順 序增加編號。在此例中之順序和在圖4之流程圖中之步驟 S 4 0 2之順序相同,其將說明於後。 當在步驟S 2 0 3中決定表之存在與否和在步驟 S 2 0 6或S 2 0 9中完成處理時,則進行到步驟 S 2 0 7,並以排序單元1 0 5排序由除了輸入影像之表 影像之句子部份所構成之標題和本體段落。當排序時,如 果句子寫在水平方向中,則排序由右至左執行。和上述相 同的方式,相關於垂直方向,排序由上至下進行。 在.步驟S 2 0 8中,以字元辨識器1 0 9執行字元辨 識處理,且字元串依照加在步驟2 0 6 ,S 2 0 9和 S 2 0 7之順序輸出,並完成輸入影像之文件資訊。相關 於包括在表影像中之字元之輸出,當成指示胞定界限之碼 之接附碼乃安插在股之間,且當成指示線定界限之碼之轉 回碼乃安插在線之間。 …如上所述,藉由執行圖2之流程圖所示之處理,即使 當不具有側尺之表包括在輸入影像中時,不具側尺之表亦 可自動的辨別而無需由使用者手動的指定比一事實,此種 表之表格式可保持,且可形成一文件。 以下參考圖3之流程圖說明由在步驟S 2 0 4中之表 屬性辨別器1 0 7所執行之表屬性自動辨別處理。在此處 理中之目標爲由在步驟S 2 0 2中之區域分割處理所決定 當成表影像之區域中之影像,且如圖5所示。 在表影像5 0中,由尺所圍繞之胞(胞1至4 )首先 本紙伕尺度適用中國國家橾準(CNS ) Μ規格(2丨OXW公釐)_ I- -- n n -- n - n I 展-- (請先閲讀背面之注意事項再填寫本頁) 訂 經濟部中央標隼局貝工消费合作社印製 4 1 9 62 8 4 經濟部中央標準局員工消費合作社印掣 A7 B7_五、發明説明(7 ) 抽取且計數在每胞中之字元線之數目(S 3 0 1)。例如 ,胞1至3具有6條線且胞4具有兩條線。而後,相關於 在步驟S 3 0 1中抽取之所有胞,執行在步驟S 3 0 2和 S 3 0 3中之辨別處理。在步驟S 3 0 2中之處理爲用以 辨別在步驟S 3 0 1中計數之線之數目是否等於或大於3 。在步驟S 3 0 3中之處理爲用以辨別包括在胞中之字元 影像之高度和字元影像之垂直字元方向中之間隔6間之關 係,並用以辨別6是否大於等於3 a。當胞在步驟 S 3 0 2或S 3 0 3中受判斷之結果是肯定時,此胞之表 影像即.認爲爲不具側尺之表,且不具側尺之表之靥性乃儲 存在儲存有表影像之菡域資訊之記憶1 0 3中(S 3 0 4 )。相關於所有當成目標之表影像之胞,當在步驟 S 3 0 2和S 3 0 3中之結果是否定時,則認定表影像爲 具有側尺之表,且具有側尺之表之屬性乃儲存在儲存有表 影像之區域資訊之記億1 0 3中。由於在步驟S 3 0 2中 決定在圖5中所示之表影像之每個胞1至3中,線之數目 等於3或更多,並決定在胞4中介於兩線間之間隔較大且 b > 3 a,則不具側尺之表之屬性乃儲存在記憶1 Q 3中 ,在步驟S304中。 / 藉由圖3之流程圖之處理,包括在输入影像中之表影 像爲具有側尺之表影像或不具有側尺之表影像可自動的辨 別而無需由操作者手動的指定。 以下參考圖4之流程圖說明在步驟S 2 0 6中以表處 理器1 0 8執行之不具側尺之表之處理。在此處理中之目 - I - - - » n ^^1 I— I ^^1 Hr ^^1------ - . - . (請先閱讀背面之注意事項再填寫本頁) 本紙浪尺度適用中國國家標隼(CNS ) A4規格(210乂297公釐) 經濟部中央標準局員工消費合作社印裂 :9 62 8竭 A7 B7五、發明説明(8 ) 標爲由在步驟S 2 0 2中之區域分割處理所決定當成表影 像之區域之影像,且和如圖6所示之表影像6 0相似。 由表影像6 0所抽取之胞1至3乃在線單元基礎上分 割成數塊(S 4 0 1 )。胞1分成5個線塊。胞2和3亦 相似的分成5個線塊。在步驟S 4 0 1中分割之塊乃排序 (S 4 0 2 )。此種排序由左至右且由上至下執行。因此 ,此種排序處理乃執行以使胞1之頂塊設定至第一順序( 1),胞2之頂塊設定至(2),和胞3之頂塊設定至( 3)。由於胞完成在側向中之胞3上,排序移位在較下方 向,並.執行以使來自胞1頂部之第二塊設定至(4 ),來 自胞2之頂部之第二塊設定至(5 )……。此種排序資訊 和塊資訊一起儲存在記憶1 0 3中。 如上所述,由於在一胞中之多數項目藉由在一線單元 基礎上抽取塊,並執行排序,不具側尺之表和具側尺之表 以相似之方式,因此,可對每個胞執行字元串之抽取和排 序,且文件可依照排序而形成,因此可保持表格式。 (請先閱讀背*之注意事項再填寫本頁) 本纸乐尺度適用中國國家標準(CNS ) A4規格(210x297公釐) 11

Claims (1)

  1. 饵辨#.年if. ^^Ί-'-Ί'ί^-^κ-'ν.ιν-.ΛΚν'·'-,·*. 4 1 9 62 8 ^ ( t ^ A8 冬f年丨U 第85115012號專利申請案g _中立申諸專刺簸圊條正本D8民國88年11月呈_ 六、 申請專利範圍 1 . 一種影像處理裝置,其使用於一影像之文字辨別 ,該裝置包含: 尺線抽取機構,用以抽取界定包含由尺線所包圍之胞 之一表之尺線, 文字線抽取機構,用以從每個胞文字線抽取,每個文 字線包含文.字之相關線: 分割機構,用以分割每個胞成爲包含相關文字線之多 數塊;和 記憶機構,用以儲存指示介於文字線和相關塊間之資 訊,以保持表之形式* 2 .如申請專利範圍第1項之影像處理裝置,進一步 包含一判斷機構,用以判斷包含介於表之項目間之側尺線 之表影像之E域之胞是否已省略,和,如果是,該分割機 構可操作以分割胞成爲包含相關項目之塊· 3 .如申請專利範圍第1項之影像處理裝置,其中該 文字線之抽取乃在一表區域中之一影像中執行* 4 .如申請專利範圍第1項之影像處理裝置,進一步 包含一判斷機構,用以判斷該塊之相關位置關係,和指定 機構,用以根據相關位置關係之判斷而指定每個塊之順序 5 .如申請專利範圍第4項之影像處理裝置,其中每 個塊之順序之指定由頂部至底部執行· 6 ·如申請專利範圍第4項之影像處理裝置,其中每 個塊之順序之指定由左至右執行· 本紙張尺度適用中國0家標準(CNS)A4規格(210x297公爱)-1 - (锖先Η讀背面之注意事項再填寫本頁) A--------訂---------線 經濟部智慧財產局貝工消费合作杜印製 419628 4 六、申請專利範圍 7. 如申請專利範圍第1項之影像處理裝置,進一步 包含辨別機構用以辨別和建檔文字在該文字線中。 8. 如申請專利範圍第1項之影像處理裝置,其中該 塊包括單一線之一影像· 9 ♦如申請專利範圍第1項之影像處理裝置,其中每 個該多數之.新胞分別給予一胞順序號碼· 1 0 .如申請專利範園第1項之影像處理裝置,其中 影像爲光學讀取之影像* 1 1 · 一種影像處理方法,其使用於一影像之文字辨 別,該方法包含之步驟爲: 抽取界定包含由尺線所包園之胞之一表之尺線: 抽取毎個胞文字線,每個文字線包含文字之相關線; 分割每個胞成爲包含相關文字線之多數塊;和 儲存指示介於文字線和相關塊間之資訊,以保持表之 形式· 12,如申請專利範圍第11項之影像處理方法,進 一步包含之步驟爲,判斷包含介於表之項目間之側尺線之 表影像之區域之胞是否已省略,和,如果是,則操作該分 割步驟以分割胞成爲包含相關項目之塊· 1 3 ·如申請專利範圍第1 1項之影像處理方法,其 中該文字線之抽取乃在一表區域中之一影像中執行· 14.如申請專利範圍第11項之影像處理方法,進 一步包含用以判斷該塊之相關位置關係,和用以根據相關 位置關係之判斷而指定每個塊之順序β 本紙張尺度適用中理.國家摞準(CNS>A4規格(210 x 297公釐> -2 - (請先W讀背面之注意事項再填寫本頁) -^!| 訂·! - ----線, 經濟部智慧財產局員工消霣合作杜印製 4 Hi 8 2 6 9 A8B8C8D8 圍範利 專·請 中 、六 1 5.如申請專利範圍第1 4項之影像處理方法,其 中每個塊之順序之指定由頂部至底部執行。 16·如申請專利範圍第14項之影像處理方法,其 中每個塊之順序之指定由左至右執行· 1 7 *如申請專利範圍第項之影像處理方法,進一 步包含用以.辨別和建槽文字在該文字線中之步驟。 1 8 如申請專利範圔第1 1項之影像處理方法,其 中該塊包括單一線之一影像* 1 9 .如申請專利範圍第1 1項之影像處理方法,其 中毎個該多數之新胞分別給予一胞晅序號.碼* 2 0 .如申請專利範圍第1 1項之影像處理方法,其 中影像爲光學讀取之影像。 21.—種記g介質,用以儲存控制影像處理裝置之 程式,而該程式包含之步驟爲: 抽取界定包含由尺線所包圔之胞之一表之尺線; 抽取每個胞文字線,每個文字線包含文字之相關線; 分割每個胞成爲包含相關文字線之多數塊;和 備存指示介於文字線和相關塊間之資訊,以保持表之 形式* 本紙張尺度適用中國a家林準(CNSM4規格(210 x 297公«> - 3 - <請先閱讀背面之注意事項再填寫本頁) -衣·1 — 111 — ·111 — 11—· 經濟部智慧財產局貝工消费合作社印製
TW085115012A 1995-12-14 1996-12-05 Image processing method and apparatus and memory meidum TW419628B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32563395A JP3814320B2 (ja) 1995-12-14 1995-12-14 画像処理方法及び装置

Publications (1)

Publication Number Publication Date
TW419628B true TW419628B (en) 2001-01-21

Family

ID=18179032

Family Applications (1)

Application Number Title Priority Date Filing Date
TW085115012A TW419628B (en) 1995-12-14 1996-12-05 Image processing method and apparatus and memory meidum

Country Status (7)

Country Link
US (1) US6275608B1 (zh)
EP (1) EP0779593B1 (zh)
JP (1) JP3814320B2 (zh)
KR (1) KR100268367B1 (zh)
CN (1) CN1099800C (zh)
DE (1) DE69624663T2 (zh)
TW (1) TW419628B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001150745A (ja) * 1999-11-30 2001-06-05 Canon Inc 画像処理装置および方法
US7054871B2 (en) * 2000-12-11 2006-05-30 Lucent Technologies Inc. Method for identifying and using table structures
JP4242796B2 (ja) * 2004-03-12 2009-03-25 パナソニック株式会社 画像認識方法及び画像認識装置
JP4645498B2 (ja) * 2006-03-27 2011-03-09 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4491488B2 (ja) * 2008-03-03 2010-06-30 シャープ株式会社 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法
US8887038B2 (en) 2010-10-08 2014-11-11 Business Objects Software Limited Extrapolating tabular structure in a freeform document
JP5952428B2 (ja) 2012-01-23 2016-07-13 マイクロソフト コーポレーション ボーダレステーブル検出エンジン
CN104067293B (zh) 2012-01-23 2017-07-25 微软技术许可有限责任公司 矢量图分类引擎
JP2013161268A (ja) * 2012-02-06 2013-08-19 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP5701839B2 (ja) 2012-10-26 2015-04-15 株式会社東芝 電子機器および方法
US9953008B2 (en) 2013-01-18 2018-04-24 Microsoft Technology Licensing, Llc Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally
JP5717831B2 (ja) * 2013-12-10 2015-05-13 株式会社東芝 電子機器および手書き文書処理方法
CN104156683A (zh) * 2014-06-30 2014-11-19 黄志康 公安出入境表格的自动录入系统
JP6481204B2 (ja) * 2015-11-13 2019-03-13 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
US20170220858A1 (en) * 2016-02-01 2017-08-03 Microsoft Technology Licensing, Llc Optical recognition of tables
US10592738B2 (en) * 2017-12-01 2020-03-17 International Business Machines Corporation Cognitive document image digitalization
JP6795770B2 (ja) * 2019-02-06 2020-12-02 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
CN113408323B (zh) * 2020-03-17 2023-03-03 华为技术有限公司 表格信息的提取方法、装置、设备及存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
JP2812982B2 (ja) * 1989-04-05 1998-10-22 株式会社リコー 表認識方法
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
JPH04243252A (ja) 1991-01-18 1992-08-31 Fuji Photo Film Co Ltd ハロゲン化銀感光材料の現像処理方法
JPH05188919A (ja) * 1992-01-14 1993-07-30 Hitachi Ltd 文書可視化処理方法
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
EP0587450B1 (en) * 1992-09-11 2004-11-17 Canon Kabushiki Kaisha Image processing method and apparatus
JPH0696275A (ja) 1992-09-11 1994-04-08 Canon Inc 画像処理装置
US5625719A (en) * 1992-10-19 1997-04-29 Fast; Bruce B. OCR image preprocessing method for image enhancement of scanned documents
JP2789971B2 (ja) * 1992-10-27 1998-08-27 富士ゼロックス株式会社 表認識装置
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
US5737442A (en) * 1995-10-20 1998-04-07 Bcl Computers Processor based method for extracting tables from printed documents

Also Published As

Publication number Publication date
JPH09167246A (ja) 1997-06-24
DE69624663D1 (de) 2002-12-12
JP3814320B2 (ja) 2006-08-30
EP0779593B1 (en) 2002-11-06
EP0779593A2 (en) 1997-06-18
EP0779593A3 (en) 1998-02-11
US6275608B1 (en) 2001-08-14
CN1158044A (zh) 1997-08-27
KR970049402A (ko) 1997-07-29
CN1099800C (zh) 2003-01-22
KR100268367B1 (ko) 2000-10-16
DE69624663T2 (de) 2003-07-03

Similar Documents

Publication Publication Date Title
TW419628B (en) Image processing method and apparatus and memory meidum
US6909805B2 (en) Detecting and utilizing add-on information from a scanned document image
JP4366108B2 (ja) 文書検索装置、文書検索方法及びコンピュータプログラム
US8005300B2 (en) Image search system, image search method, and storage medium
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JPH04321183A (ja) ファイリング装置の文書登録方法
JP2020042320A (ja) 画像認識装置、画像認識方法、及び画像認識プログラム
JPS5947641A (ja) 名刺デ−タベ−ス作成装置
JP2014026660A (ja) データ生成装置およびデータ生成方法
WO2007070010A1 (en) Improvements in electronic document analysis
TWI285849B (en) Optical character recognition device, document searching system, and document searching program
JP4518212B2 (ja) 画像処理装置及びプログラム
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
CN113449763A (zh) 信息处理装置以及记录媒体
JPH1063744A (ja) 文書のレイアウト解析方法及びシステム
JP5531493B2 (ja) 文字認識装置、文字認識方法、プログラム及び記録媒体
JP3548234B2 (ja) 文字認識方法及び装置
JPH10207981A (ja) 帳票認識方法
JP2006134079A (ja) 画像処理装置及びプログラム
JP7037237B1 (ja) データ処理装置、データ処理方法及びプログラム
JP3000349B2 (ja) キー入力編集方法及び編集装置
Kaur Classification of printed and handwritten Gurmukhi text using labeling and segmentation technique
JPH1116020A (ja) 商品券識別方法及び装置

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees