TW419628B - Image processing method and apparatus and memory meidum - Google Patents
Image processing method and apparatus and memory meidum Download PDFInfo
- Publication number
- TW419628B TW419628B TW085115012A TW85115012A TW419628B TW 419628 B TW419628 B TW 419628B TW 085115012 A TW085115012 A TW 085115012A TW 85115012 A TW85115012 A TW 85115012A TW 419628 B TW419628 B TW 419628B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- image processing
- line
- patent application
- text
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Processing Or Creating Images (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Description
Λ c: Α7 Β7 經濟‘邱中央梂準局員工消費合作社印装 五、發明説明(i ) 發明背景 發明領域 本發明係關於OCR (光學字元辨認)裝置,拷貝機 、 \傳眞機等之影像處理裝置\且更特別而言X係關於一種 影像處理方法和裝置和記憶介質\其可適當的由包括一表 _ 1 - _ 影像之輸入影像中抽取字元。^ 本發明亦關於影像處理方法和裝置以及記憶介質,當 字元影像由輸入表影像抽出時,其可辨別輸X表之格式和 適當的抽取字元影像。 本發明亦關於影像處理方法和裝置以及記憶介質,其 可自動的辨別包括在輸入影像中之表影像之屬性,而無需 由使用者手動的指定該靥性。 相關背景技藝 具有自動區域分割功能之〇C R裝置執行處理以自動 的辨別由尺所圍繞之影像當成表影像,並抽取由表之尺所 圍繞之胞當成一影像區域。 在字元辨識後,藉由在由一字元區域所獲得之辨識結 果之字元串間插入接附碼和在線間插入返回碼,在字元之 辨認完成後,由表影像所抽取之胞之資訊反射至文件資料 ,藉此可使資料輕易的供應至表計算軟體等。 但是,依照前述之習知技藝’當當成字元辨認之靶之 表影像爲不具側尺之表,如圃7所示時’由於安排在垂直 _-- 方向之多數項目當成一字元菡域辨別’和輸入表不同之格 (請先閔讀背面之注意事項再填寫本頁) Λ. 訂 本紙張尺度適用中國國家標準(CNS ) Α4規格(210x297公廣) 經濟部中央標準局員工消費合作社印裝 4 1 962 8 ^ a? _B7_—__ 五、發明説明(2 ) 式文件可獲得,旦如此會迫使操作者校正此格式爲輸入表 之格式之操作,如此會增加操作者之負擔。 發明槪要 如上所述,依照本發明,一線影像由影像資訊中抽取 ,依辱所抽皂之線影像之特1性而辨別._影靥性,I 儲存該辨別靥性以相關於該影像資訊,因此,指示輸入之 表影像爲具有側尺f之表或((尺之表之表屬性無需由 操作者手動指定,表屬性可自動的辨別,日可改善極作性 - ' 〇 如上所述,依照本發明,藉由設定影像資訊爲由尺所 圍繞之影像資訊,多數包括在由尺所圍繞之一胞中之項目 可自動的辨別。 如上所述,依照本發明,藉由設定影像資訊爲可光學 讀出之影像資訊,則光學讀出影像可自動的處理,而無需 操作鍵等。 ~ 如上所述,依照本發明,藉由辨識線影像當成一字元 --------. 和與字元辨識之結果—起輸出一線定界限碼,則即使在文 件由字元辨識形成後,表之格式亦可保持。 如上所述,依照本發明,藉.由依照輸出資訊顯示一文 件,輸入影像之字元辨識之_結果和表之格式_可1題__示圈像 平面上確認。 如上所述,依照本發明,輸入影像資訊分割成由尺所 圍繞之小影像區域’線影像由分割小影像區域之影像資訊 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐)-- 1' .^1 n I I 1 I--ϊ I :衣----- !訂 (請先閱讀背面之注意事項再填寫本頁) 4 1 962 8 'Hi A7 B7 經濟部中央標率局員工消#合作社印製 五 、發明説明 ( 3 ) 1 1 中 抽 取 且 包 括 在 輸 入 影 像 資 訊 中 之 線 影 像 依 照 設 置 有 線 1 影 像 之 小 影 像 域 之 位 置 關 係 和 在 小 影 像 區 域 中 之 位 置 而 1 1 排 序 , 因 此 5 可 適 當 的 辨 別 不 具 有 側 尺 之 特 殊 表 之 格 式 0 I 請 1 I 如 上 所 述 , 依 照 本 發 明 藉 由 辨 別 影 像 資 訊 之 屬 性 並 先 閱 1 1 讀 1 I 依 照 屬 性 辨 別 機 稱 之 辨 別 結 果 決 定 線 影 像 之 抽 取 是 否 執 行 背 ι6 1 I 之 1 Ϊ 適 當 的 處 理 只 在 適 當 的 例 中 執 行 因 此 即 使 在 文 件 由 注 意 1 事 1 字 元 辨 認 所 形 成 後 9 表 之 格 式 亦 可 保 持 0 項 再 1 4 1 jT 寫 本 頁 1 圖 式 簡 單 說 明 •w· 1 圖. 1 爲 影 像 處 理 裝 置 之 功 能 構 造 之 方 塊 圖 1 ί 圖 2 爲 整 個 處 理 之 流 程 圖 1 圖 3 爲 表 屬 性 辨 別 處 理 之 流 程 ΓΒΓΪ 圖 _訂 I 圖 4 爲 不 具 有 側 尺 之 表 之 處 理 之 流 程 rerj 圖 1 1 圖 5 爲 表 屬 性 辨 別 處 理 所 執 行 之 表 影 像 之 圖 例 1 1 I 圖 6 爲 不 具 有 側 尺 之 表 之 處 理 之 說 明 圖 和 1 1 圖 7 爲 習 知 表 影 像 處 理 之 說 明 圖 0 1 1 較 佳 實 施 例 之 詳 細 說 明 -1 1 1 圖 1 爲 本 發 明 之 影 像 處 理 裝 置 之 功 能 構 造 之 方 塊 圖 0 1 | 參 考 數 字 1 0 1 表 示 输 入 單 元 用 以 输 入 由 成 字 元 辛 識 之 g 1 1 標 之 影 像 資 訊 和 由 操 作 者 所 執 行 之 各 種 指 示 0 輸 入 單 元 1 1 0 1 具 有 鍵 盤 以 執 行 文 件 編 輯 〇 關 於 影 像 資 訊 之 輸 入 1 I 方 • -> » 囬 1 影 像 資 訊 可 利 用 可 光 學 的 讀 取 已 光 學 讀 取 之 原 件 或 i 1 影 像 資 訊 之 掃 描 機 輸 入 9 且 亦 可 經 由 一 記 億 裝 置 或 通 信 機 1 1 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 4 1 962 8 at Β7 經濟部4-失樣準局員工消費合作社印焚 五、發明説明(4 ) 構输入。參考數字1 0 2表示一處理器(CPU·)用以執 行裝置之控制和算術操作以及每個處理單元之控制,依照 流程圖之控制程式:1 0 3表示一記憶用以儲存用於處理 器1 0 2之控制程式,以執行如流程圖所示之處理,並儲 存使用於各種處理之資料或在各種處理中發生之資料。關 於儲存在記憶1 0 3中之依照本發明之處理之控制程式, 可使用儲存在例如F D或C D _ R 0M之記憶介質之控制 程式,該記憶介質可與裝置分離,或是使用由其它終端經 由一通信線供應之控制程式,並將其儲存。參考數字 1 0 4.表示用以輸出算術運算處理之結果,影像處理之結 果,和影像資料之输出單元。输出單元1 〇 4包括例如 CRT,液晶顯示器等顯示器,例如LBP,彩色噴墨印 表機等之印表機,和用以輸出至其它端或外部記憶機構之 輸出端。參考數字1 0 5表示用以排序段落和包括在影像 資訊中之句子之標題之排序單元:1 0 6表示用以執行影 像資訊之Μ域分割處理之區域分割器;1 0 7表示藉由偵 測和分析表影像之特性而用以自動的辨別包括在影像資訊 中之表影像之屬性之表屬性辨別器;1 0 8爲用以執行由 包括在影像資訊中之表影像抽取一表格式且形成一文件之 處理之表處理;和1 0 9爲用以由重量抽取一字元影像和 辨識所抽取之影像之字元辨識器。 圖2爲整個處理之流程圖,其由來自輸入單元1 〇 1 之影像之輸入至來自輸出單元1 0 4當成文件資料之字元 辨識和產生而執行一段期間。控制程式已儲存在記憶 {请先閱讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS ) Α4规格(210Χ 297公釐) 419628 ^ A7 經濟部中央標準局員工消費合作社印焚 ______B7_五、發明説明(5 ) 1 0 3中,且由處理器1 〇 2之控制所執行。· 影像資訊由輸入單元1 0 1輸入(S 2 0 1 )。輸入 之影像資訊亦可由包括在输出單元1 0 4中之顯示機構顯 示,且亦可由操作者確認。輸入影像以區域分割器1 〇 6 分割成區域,且抽取例如文件,分離器,圖形,表等影像 資料區域(S 2 0 2 )。抽取影像資料區域之資訊乃儲存 在記憶1 0 3中。關於區域分割之詳細方法,可參考如日 本專利申請案No . 4-2 4 3 2 5 2所揭示之技術。關 於區域分割之結果,當表影像包括在輸入影像中時(在 S 2 0 3中是肯定的),則進行到步驟S 2 0 4 ,且執行 自動辨別表影像之屬性之處理(S 2 0 4 )。在步驟 S 2 ϋ 4中之表影像之屬性之自動辨別處理之詳細情形如 圖3之流程圖所示,且將說明於後。就步驟S 2 0 4之表 屬性之辨別結果而言,當表影像爲不具側尺之表時(在 S 2 0 5中爲肯定的),則進行到步驟S 2 0 6 ,並執行 不具有側R之表處理。在步驟S 2 '"0 6中之不具側尺之表 之表處理爲用以抽取在字元單元之單元基礎上(相當於一 胞)之處理,並在所抽取之字元之單元基礎上排序以保持 無側尺之表影像之表格式並形成一文件,其悖於後參考圖 4詳細說明。關於在步驟S 2 0 4中之表屬性之辨別結果 而言,當表影像爲具有側尺之影像時(在S 2 0 5中是否 定的),則進行至步驟S 2 0 9 ,並執行具有側尺之表之 表處理。在步驟S 2 0 9中用於具有側尺之表之表處理爲 用以抽取胞且排序所抽取之胞之處理,以保持表格式和形 (請先閲讀背面之注意事項再填寫本頁) 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) A7 4 19 62 8 1 ____B7____ 五、發明说明(6 ) 成一文件。在排序處理中,依照由左至右和由上至下之順 序增加編號。在此例中之順序和在圖4之流程圖中之步驟 S 4 0 2之順序相同,其將說明於後。 當在步驟S 2 0 3中決定表之存在與否和在步驟 S 2 0 6或S 2 0 9中完成處理時,則進行到步驟 S 2 0 7,並以排序單元1 0 5排序由除了輸入影像之表 影像之句子部份所構成之標題和本體段落。當排序時,如 果句子寫在水平方向中,則排序由右至左執行。和上述相 同的方式,相關於垂直方向,排序由上至下進行。 在.步驟S 2 0 8中,以字元辨識器1 0 9執行字元辨 識處理,且字元串依照加在步驟2 0 6 ,S 2 0 9和 S 2 0 7之順序輸出,並完成輸入影像之文件資訊。相關 於包括在表影像中之字元之輸出,當成指示胞定界限之碼 之接附碼乃安插在股之間,且當成指示線定界限之碼之轉 回碼乃安插在線之間。 …如上所述,藉由執行圖2之流程圖所示之處理,即使 當不具有側尺之表包括在輸入影像中時,不具側尺之表亦 可自動的辨別而無需由使用者手動的指定比一事實,此種 表之表格式可保持,且可形成一文件。 以下參考圖3之流程圖說明由在步驟S 2 0 4中之表 屬性辨別器1 0 7所執行之表屬性自動辨別處理。在此處 理中之目標爲由在步驟S 2 0 2中之區域分割處理所決定 當成表影像之區域中之影像,且如圖5所示。 在表影像5 0中,由尺所圍繞之胞(胞1至4 )首先 本紙伕尺度適用中國國家橾準(CNS ) Μ規格(2丨OXW公釐)_ I- -- n n -- n - n I 展-- (請先閲讀背面之注意事項再填寫本頁) 訂 經濟部中央標隼局貝工消费合作社印製 4 1 9 62 8 4 經濟部中央標準局員工消費合作社印掣 A7 B7_五、發明説明(7 ) 抽取且計數在每胞中之字元線之數目(S 3 0 1)。例如 ,胞1至3具有6條線且胞4具有兩條線。而後,相關於 在步驟S 3 0 1中抽取之所有胞,執行在步驟S 3 0 2和 S 3 0 3中之辨別處理。在步驟S 3 0 2中之處理爲用以 辨別在步驟S 3 0 1中計數之線之數目是否等於或大於3 。在步驟S 3 0 3中之處理爲用以辨別包括在胞中之字元 影像之高度和字元影像之垂直字元方向中之間隔6間之關 係,並用以辨別6是否大於等於3 a。當胞在步驟 S 3 0 2或S 3 0 3中受判斷之結果是肯定時,此胞之表 影像即.認爲爲不具側尺之表,且不具側尺之表之靥性乃儲 存在儲存有表影像之菡域資訊之記憶1 0 3中(S 3 0 4 )。相關於所有當成目標之表影像之胞,當在步驟 S 3 0 2和S 3 0 3中之結果是否定時,則認定表影像爲 具有側尺之表,且具有側尺之表之屬性乃儲存在儲存有表 影像之區域資訊之記億1 0 3中。由於在步驟S 3 0 2中 決定在圖5中所示之表影像之每個胞1至3中,線之數目 等於3或更多,並決定在胞4中介於兩線間之間隔較大且 b > 3 a,則不具側尺之表之屬性乃儲存在記憶1 Q 3中 ,在步驟S304中。 / 藉由圖3之流程圖之處理,包括在输入影像中之表影 像爲具有側尺之表影像或不具有側尺之表影像可自動的辨 別而無需由操作者手動的指定。 以下參考圖4之流程圖說明在步驟S 2 0 6中以表處 理器1 0 8執行之不具側尺之表之處理。在此處理中之目 - I - - - » n ^^1 I— I ^^1 Hr ^^1------ - . - . (請先閱讀背面之注意事項再填寫本頁) 本紙浪尺度適用中國國家標隼(CNS ) A4規格(210乂297公釐) 經濟部中央標準局員工消費合作社印裂 :9 62 8竭 A7 B7五、發明説明(8 ) 標爲由在步驟S 2 0 2中之區域分割處理所決定當成表影 像之區域之影像,且和如圖6所示之表影像6 0相似。 由表影像6 0所抽取之胞1至3乃在線單元基礎上分 割成數塊(S 4 0 1 )。胞1分成5個線塊。胞2和3亦 相似的分成5個線塊。在步驟S 4 0 1中分割之塊乃排序 (S 4 0 2 )。此種排序由左至右且由上至下執行。因此 ,此種排序處理乃執行以使胞1之頂塊設定至第一順序( 1),胞2之頂塊設定至(2),和胞3之頂塊設定至( 3)。由於胞完成在側向中之胞3上,排序移位在較下方 向,並.執行以使來自胞1頂部之第二塊設定至(4 ),來 自胞2之頂部之第二塊設定至(5 )……。此種排序資訊 和塊資訊一起儲存在記憶1 0 3中。 如上所述,由於在一胞中之多數項目藉由在一線單元 基礎上抽取塊,並執行排序,不具側尺之表和具側尺之表 以相似之方式,因此,可對每個胞執行字元串之抽取和排 序,且文件可依照排序而形成,因此可保持表格式。 (請先閱讀背*之注意事項再填寫本頁) 本纸乐尺度適用中國國家標準(CNS ) A4規格(210x297公釐) 11
Claims (1)
- 饵辨#.年if. ^^Ί-'-Ί'ί^-^κ-'ν.ιν-.ΛΚν'·'-,·*. 4 1 9 62 8 ^ ( t ^ A8 冬f年丨U 第85115012號專利申請案g _中立申諸專刺簸圊條正本D8民國88年11月呈_ 六、 申請專利範圍 1 . 一種影像處理裝置,其使用於一影像之文字辨別 ,該裝置包含: 尺線抽取機構,用以抽取界定包含由尺線所包圍之胞 之一表之尺線, 文字線抽取機構,用以從每個胞文字線抽取,每個文 字線包含文.字之相關線: 分割機構,用以分割每個胞成爲包含相關文字線之多 數塊;和 記憶機構,用以儲存指示介於文字線和相關塊間之資 訊,以保持表之形式* 2 .如申請專利範圍第1項之影像處理裝置,進一步 包含一判斷機構,用以判斷包含介於表之項目間之側尺線 之表影像之E域之胞是否已省略,和,如果是,該分割機 構可操作以分割胞成爲包含相關項目之塊· 3 .如申請專利範圍第1項之影像處理裝置,其中該 文字線之抽取乃在一表區域中之一影像中執行* 4 .如申請專利範圍第1項之影像處理裝置,進一步 包含一判斷機構,用以判斷該塊之相關位置關係,和指定 機構,用以根據相關位置關係之判斷而指定每個塊之順序 5 .如申請專利範圍第4項之影像處理裝置,其中每 個塊之順序之指定由頂部至底部執行· 6 ·如申請專利範圍第4項之影像處理裝置,其中每 個塊之順序之指定由左至右執行· 本紙張尺度適用中國0家標準(CNS)A4規格(210x297公爱)-1 - (锖先Η讀背面之注意事項再填寫本頁) A--------訂---------線 經濟部智慧財產局貝工消费合作杜印製 419628 4 六、申請專利範圍 7. 如申請專利範圍第1項之影像處理裝置,進一步 包含辨別機構用以辨別和建檔文字在該文字線中。 8. 如申請專利範圍第1項之影像處理裝置,其中該 塊包括單一線之一影像· 9 ♦如申請專利範圍第1項之影像處理裝置,其中每 個該多數之.新胞分別給予一胞順序號碼· 1 0 .如申請專利範園第1項之影像處理裝置,其中 影像爲光學讀取之影像* 1 1 · 一種影像處理方法,其使用於一影像之文字辨 別,該方法包含之步驟爲: 抽取界定包含由尺線所包園之胞之一表之尺線: 抽取毎個胞文字線,每個文字線包含文字之相關線; 分割每個胞成爲包含相關文字線之多數塊;和 儲存指示介於文字線和相關塊間之資訊,以保持表之 形式· 12,如申請專利範圍第11項之影像處理方法,進 一步包含之步驟爲,判斷包含介於表之項目間之側尺線之 表影像之區域之胞是否已省略,和,如果是,則操作該分 割步驟以分割胞成爲包含相關項目之塊· 1 3 ·如申請專利範圍第1 1項之影像處理方法,其 中該文字線之抽取乃在一表區域中之一影像中執行· 14.如申請專利範圍第11項之影像處理方法,進 一步包含用以判斷該塊之相關位置關係,和用以根據相關 位置關係之判斷而指定每個塊之順序β 本紙張尺度適用中理.國家摞準(CNS>A4規格(210 x 297公釐> -2 - (請先W讀背面之注意事項再填寫本頁) -^!| 訂·! - ----線, 經濟部智慧財產局員工消霣合作杜印製 4 Hi 8 2 6 9 A8B8C8D8 圍範利 專·請 中 、六 1 5.如申請專利範圍第1 4項之影像處理方法,其 中每個塊之順序之指定由頂部至底部執行。 16·如申請專利範圍第14項之影像處理方法,其 中每個塊之順序之指定由左至右執行· 1 7 *如申請專利範圍第項之影像處理方法,進一 步包含用以.辨別和建槽文字在該文字線中之步驟。 1 8 如申請專利範圔第1 1項之影像處理方法,其 中該塊包括單一線之一影像* 1 9 .如申請專利範圍第1 1項之影像處理方法,其 中毎個該多數之新胞分別給予一胞晅序號.碼* 2 0 .如申請專利範圍第1 1項之影像處理方法,其 中影像爲光學讀取之影像。 21.—種記g介質,用以儲存控制影像處理裝置之 程式,而該程式包含之步驟爲: 抽取界定包含由尺線所包圔之胞之一表之尺線; 抽取每個胞文字線,每個文字線包含文字之相關線; 分割每個胞成爲包含相關文字線之多數塊;和 備存指示介於文字線和相關塊間之資訊,以保持表之 形式* 本紙張尺度適用中國a家林準(CNSM4規格(210 x 297公«> - 3 - <請先閱讀背面之注意事項再填寫本頁) -衣·1 — 111 — ·111 — 11—· 經濟部智慧財產局貝工消费合作社印製
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP32563395A JP3814320B2 (ja) | 1995-12-14 | 1995-12-14 | 画像処理方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW419628B true TW419628B (en) | 2001-01-21 |
Family
ID=18179032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW085115012A TW419628B (en) | 1995-12-14 | 1996-12-05 | Image processing method and apparatus and memory meidum |
Country Status (7)
Country | Link |
---|---|
US (1) | US6275608B1 (zh) |
EP (1) | EP0779593B1 (zh) |
JP (1) | JP3814320B2 (zh) |
KR (1) | KR100268367B1 (zh) |
CN (1) | CN1099800C (zh) |
DE (1) | DE69624663T2 (zh) |
TW (1) | TW419628B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001150745A (ja) * | 1999-11-30 | 2001-06-05 | Canon Inc | 画像処理装置および方法 |
US7054871B2 (en) * | 2000-12-11 | 2006-05-30 | Lucent Technologies Inc. | Method for identifying and using table structures |
JP4242796B2 (ja) * | 2004-03-12 | 2009-03-25 | パナソニック株式会社 | 画像認識方法及び画像認識装置 |
JP4645498B2 (ja) * | 2006-03-27 | 2011-03-09 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP4491488B2 (ja) * | 2008-03-03 | 2010-06-30 | シャープ株式会社 | 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法 |
US8887038B2 (en) | 2010-10-08 | 2014-11-11 | Business Objects Software Limited | Extrapolating tabular structure in a freeform document |
JP5952428B2 (ja) | 2012-01-23 | 2016-07-13 | マイクロソフト コーポレーション | ボーダレステーブル検出エンジン |
CN104067293B (zh) | 2012-01-23 | 2017-07-25 | 微软技术许可有限责任公司 | 矢量图分类引擎 |
JP2013161268A (ja) * | 2012-02-06 | 2013-08-19 | Fuji Xerox Co Ltd | 画像処理装置およびプログラム |
JP5701839B2 (ja) | 2012-10-26 | 2015-04-15 | 株式会社東芝 | 電子機器および方法 |
US9953008B2 (en) | 2013-01-18 | 2018-04-24 | Microsoft Technology Licensing, Llc | Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally |
JP5717831B2 (ja) * | 2013-12-10 | 2015-05-13 | 株式会社東芝 | 電子機器および手書き文書処理方法 |
CN104156683A (zh) * | 2014-06-30 | 2014-11-19 | 黄志康 | 公安出入境表格的自动录入系统 |
JP6481204B2 (ja) * | 2015-11-13 | 2019-03-13 | キヤノンマーケティングジャパン株式会社 | 情報処理装置と、その処理方法及びプログラム |
US20170220858A1 (en) * | 2016-02-01 | 2017-08-03 | Microsoft Technology Licensing, Llc | Optical recognition of tables |
US10592738B2 (en) * | 2017-12-01 | 2020-03-17 | International Business Machines Corporation | Cognitive document image digitalization |
JP6795770B2 (ja) * | 2019-02-06 | 2020-12-02 | キヤノンマーケティングジャパン株式会社 | 情報処理装置と、その処理方法及びプログラム |
CN113408323B (zh) * | 2020-03-17 | 2023-03-03 | 华为技术有限公司 | 表格信息的提取方法、装置、设备及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4998285A (en) * | 1988-03-11 | 1991-03-05 | Kabushiki Kaisha Toshiba | Character recognition apparatus |
JP2812982B2 (ja) * | 1989-04-05 | 1998-10-22 | 株式会社リコー | 表認識方法 |
JP2940936B2 (ja) * | 1989-06-06 | 1999-08-25 | 株式会社リコー | 表領域識別方法 |
JP2930612B2 (ja) * | 1989-10-05 | 1999-08-03 | 株式会社リコー | 画像形成装置 |
JP2713622B2 (ja) * | 1989-11-20 | 1998-02-16 | 富士通株式会社 | 表形式文書読取装置 |
JPH03290774A (ja) * | 1990-04-06 | 1991-12-20 | Fuji Facom Corp | 文書画像の文章領域抽出装置 |
JPH04243252A (ja) | 1991-01-18 | 1992-08-31 | Fuji Photo Film Co Ltd | ハロゲン化銀感光材料の現像処理方法 |
JPH05188919A (ja) * | 1992-01-14 | 1993-07-30 | Hitachi Ltd | 文書可視化処理方法 |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
EP0587450B1 (en) * | 1992-09-11 | 2004-11-17 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JPH0696275A (ja) | 1992-09-11 | 1994-04-08 | Canon Inc | 画像処理装置 |
US5625719A (en) * | 1992-10-19 | 1997-04-29 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents |
JP2789971B2 (ja) * | 1992-10-27 | 1998-08-27 | 富士ゼロックス株式会社 | 表認識装置 |
JP3302147B2 (ja) * | 1993-05-12 | 2002-07-15 | 株式会社リコー | 文書画像処理方法 |
US5737442A (en) * | 1995-10-20 | 1998-04-07 | Bcl Computers | Processor based method for extracting tables from printed documents |
-
1995
- 1995-12-14 JP JP32563395A patent/JP3814320B2/ja not_active Expired - Fee Related
-
1996
- 1996-12-04 US US08/760,211 patent/US6275608B1/en not_active Expired - Lifetime
- 1996-12-05 TW TW085115012A patent/TW419628B/zh not_active IP Right Cessation
- 1996-12-06 EP EP96308875A patent/EP0779593B1/en not_active Expired - Lifetime
- 1996-12-06 DE DE69624663T patent/DE69624663T2/de not_active Expired - Fee Related
- 1996-12-13 CN CN96119794A patent/CN1099800C/zh not_active Expired - Fee Related
- 1996-12-13 KR KR1019960065050A patent/KR100268367B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JPH09167246A (ja) | 1997-06-24 |
DE69624663D1 (de) | 2002-12-12 |
JP3814320B2 (ja) | 2006-08-30 |
EP0779593B1 (en) | 2002-11-06 |
EP0779593A2 (en) | 1997-06-18 |
EP0779593A3 (en) | 1998-02-11 |
US6275608B1 (en) | 2001-08-14 |
CN1158044A (zh) | 1997-08-27 |
KR970049402A (ko) | 1997-07-29 |
CN1099800C (zh) | 2003-01-22 |
KR100268367B1 (ko) | 2000-10-16 |
DE69624663T2 (de) | 2003-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW419628B (en) | Image processing method and apparatus and memory meidum | |
US6909805B2 (en) | Detecting and utilizing add-on information from a scanned document image | |
JP4366108B2 (ja) | 文書検索装置、文書検索方法及びコンピュータプログラム | |
US8005300B2 (en) | Image search system, image search method, and storage medium | |
JP3292388B2 (ja) | 文書画像の復号なしに文書を要約するための方法と装置 | |
JP2575539B2 (ja) | 書類上の金額フィールドの位置特定方法および識別方法 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JPH04321183A (ja) | ファイリング装置の文書登録方法 | |
JP2020042320A (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
JPS5947641A (ja) | 名刺デ−タベ−ス作成装置 | |
JP2014026660A (ja) | データ生成装置およびデータ生成方法 | |
WO2007070010A1 (en) | Improvements in electronic document analysis | |
TWI285849B (en) | Optical character recognition device, document searching system, and document searching program | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
CN113449763A (zh) | 信息处理装置以及记录媒体 | |
JPH1063744A (ja) | 文書のレイアウト解析方法及びシステム | |
JP5531493B2 (ja) | 文字認識装置、文字認識方法、プログラム及び記録媒体 | |
JP3548234B2 (ja) | 文字認識方法及び装置 | |
JPH10207981A (ja) | 帳票認識方法 | |
JP2006134079A (ja) | 画像処理装置及びプログラム | |
JP7037237B1 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP3000349B2 (ja) | キー入力編集方法及び編集装置 | |
Kaur | Classification of printed and handwritten Gurmukhi text using labeling and segmentation technique | |
JPH1116020A (ja) | 商品券識別方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |