TWI795292B - 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式 - Google Patents

文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式 Download PDF

Info

Publication number
TWI795292B
TWI795292B TW111118179A TW111118179A TWI795292B TW I795292 B TWI795292 B TW I795292B TW 111118179 A TW111118179 A TW 111118179A TW 111118179 A TW111118179 A TW 111118179A TW I795292 B TWI795292 B TW I795292B
Authority
TW
Taiwan
Prior art keywords
character
candidate
similar
characters
processing unit
Prior art date
Application number
TW111118179A
Other languages
English (en)
Other versions
TW202234289A (zh
Inventor
北見淳
Original Assignee
日商日立系統股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商日立系統股份有限公司 filed Critical 日商日立系統股份有限公司
Publication of TW202234289A publication Critical patent/TW202234289A/zh
Application granted granted Critical
Publication of TWI795292B publication Critical patent/TWI795292B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Character Discrimination (AREA)

Abstract

本發明所欲解決的問題在於提供一種更恰當地提案類似的文字列候補的技術。 為了解決此問題,本發明的文字候補提案裝置,具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的文字列;受託處理部,其接收一個以上的文字並接受提出該文字的外觀類似的文字候補的委託;對照處理部,其通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理部,其將由所述對照處理部進行對照的結果命中的所述外觀類似的文字的候補的組合作為候補文字進行輸出。

Description

文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式
本發明關於文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式。本發明要求2019年9月9日提出的日本專利申請編號2019-163641的優先權,對於承認基於文獻引用的結合的指定國,該申請中記載的內容通過引用結合在本申請中。
專利文獻1中,記載了:“資訊處理裝置具備:從圖像資料提取文字列(字串)的文字提取部224;作成包含與輸入文字對應的1個或2個以上的轉換候補文字的轉換候補清單的列表作成部244;通過比較所述轉換候補列表中包含的所述1個或2個以上的轉換候補文字與由所述文字提取部所提取的文字列,從而指定轉換目標的文字的指定部248;以及,生成包含由所述指定部所指定的所述轉換目標的文字的顯示畫面的顯示控制部252”。
[先前技術文獻] (專利文獻) 專利文獻1:日本特開2018-163413號公報
[發明所欲解決的問題] 上述技術,能夠提示文字的候補,但是如果文字識別錯誤,則難以獲得恰當的結果。
本發明的目的在於提供一種更恰當地提案類似的文字列候補的技術。
[解決問題的技術手段] 本申請包含多個用於解決上述課題的至少一部分的方案,但若舉出其例,則如以下所述。本發明的一個態樣所涉及的資訊處理裝置具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的文字列;受託處理部,其接收一個以上的文字並接受提出該文字的外觀類似的文字候補的委託;對照處理部,其通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理部,其將由所述對照處理部進行對照的結果命中的所述外觀類似的文字的候補的組合作為候補文字進行輸出。
並且,例如,也可以是,上述的文字候補提案裝置中,具備類似文字登記處理部,其在輸出所述候補文字後,接受到與所述受託處理部所接收的所述文字的任一個類似的文字的情況下,如果是所述類似文字記憶部未記憶的類似關係,則使所述類似文字記憶部進行記憶。
並且,例如,也可以是,上述的文字候補提案裝置中,所述實存文字記憶部中保存有實際存在的人名的文字列,所述受託處理部接受提出人名的委託來作為提出所述文字候補的委託,所述候補文字發送處理部將所述外觀類似的文字的候補的組合作為人名的候補文字進行輸出。
並且,例如,也可以是,上述的文字候補提案裝置中,所述實際存在的人名的文字列被劃分為姓和名,所述文字候補提案裝置具備姓名判別處理部,其所接收的所述文字劃分為姓和名而使所述對照處理部進行對照。
並且,例如,也可以是,上述的文字候補提案裝置中,特徵在於,所述姓名判別處理部,針對所接收的所述文字,指定通過變化斷開姓和名的位置從而劃分為姓和名的組合,針對各組合的姓和名雙方,在由所述對照處理部進行對照的結果獲得命中的情況下,作為所述候補文字。
並且,例如,也可以是,上述的文字候補提案裝置中,特徵在於,所述候補文字發送處理部,將所述候補文字按照出現頻率進行排序並輸出。
並且,例如,也可以是,上述的文字候補提案裝置中,特徵在於,所述受託處理部接收的所述文字是讀取手寫文字並進行了識別的文字。
並且,本發明的另一個態樣所涉及的手寫文字識別系統,包括:文字候補提案裝置;業務終端,其通過網路與所述文字候補提案裝置可通訊地連接;以及,讀取裝置,其回應來自所述業務終端的指示而讀取手寫文字;所述手寫文字識別系統的特徵在於:所述業務終端具備:文字識別部,其從所述讀取裝置獲得所述手寫文字並進行文字識別;委託處理部,其向所述文字候補提案裝置發送由所述文字識別部所識別的文字並委託文字候補的提案;以及,目視確認處理部,其顯示由所述文字候補提案裝置輸出的文字候補;所述文字候補提案裝置具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的文字列;受託處理部,其接收一個以上的文字並接受提出該文字的外觀類似的文字候補的委託;對照處理部,其通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理部,其將由所述對照處理部進行對照的結果命中的所述外觀類似的文字的候補的組合作為候補文字進行輸出。
並且,本發明的另一個態樣所涉及的手寫文字識別方法,是由手寫文字識別系統進行的手寫文字識別方法,所述手寫文字識別系統包括:文字候補提案裝置;業務終端,其通過網路與所述文字候補提案裝置可通訊地連接;以及,讀取裝置,其回應來自所述業務終端的指示而讀取手寫文字;所述手寫文字識別方法的特徵在於:所述業務終端執行以下步驟:文字識別步驟,在該文字識別步驟中,從所述讀取裝置獲得所述手寫文字並進行文字識別;委託處理步驟,在該委託處理步驟中,向所述文字候補提案裝置發送在所述文字識別步驟所識別的文字並委託文字候補的提案;以及,目視確認處理步驟,在該目視確認處理步驟中,顯示所述文字候補提案裝置輸出的文字候補;所述文字候補提案裝置具備:類似文字記憶部,其記憶文字的外觀的類似關係;以及,實存文字記憶部,其記憶實際存在的文字列;並且,所述文字候補提案裝置執行以下步驟:受託處理步驟,在該受託處理步驟中,接收一個以上的文字並接受提出該文字的外觀類似的文字候補的委託;對照處理步驟,在該對照處理步驟中,通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理步驟,在該候補文字發送處理步驟中,將在所述對照處理步驟進行對照的結果命中的所述外觀類似的文字的候補的組合作為候補文字進行輸出。
並且,本發明的另一個態樣所涉及的程式,其使電腦進行支援手寫文字的識別的處理,所述電腦具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的文字列;以及,處理部;所述程式的特徵在於,使所述處理部實施以下步驟:受託處理步驟,在該受託處理步驟中,接收一個以上的文字並接受提出該文字的外觀類似的文字候補的委託;對照處理步驟,在該對照處理步驟中,通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理步驟,在該候補文字發送處理步驟中,將在所述對照處理步驟進行對照的結果命中的所述外觀類似的文字的候補的組合作為候補文字進行輸出。
[發明的效果] 根據本發明,能夠提供能夠恰當地評價文章的內容的技術。
上述以外的課題、構成以及效果通過以下實施方式的說明可得以明瞭。
以下,基於附圖對適用本發明的一個態樣所涉及的實施方式的手寫文字識別系統1進行說明。以下的實施方式中出於方便需要時分成多個部分或者多個實施方式進行說明,但是除了特別明示的情況,這些部分或這些實施方式並非處於互不相關的的關係,而是處於一方是另一方的一部分或全部的變形例、詳細說明或補充說明等的關係。
並且,以下的實施方式中,言及要素的數等(包括個數、數值、量、範圍等)的情況下,除了特別明示的情況及原理上認為顯然是限定於特定的數的情況等之外,並不限定於該特定的數,可以是特定的數以上,也可以是特定的數以下。
而且,以下的實施方式中,除了特別明示的情況及原理上認為顯然是必須的情況等之外,其構成要素(也包括要素步驟等)當然並非是必須的。
同樣地,在以下的實施方式中,當言及構成要素等的形狀、位置關係等時,除了特別明示的情況及原理上認為顯然不是這樣的情況等之外,包含實質上近似或類似於該形狀等的情況等。上述數值以及範圍也與此相同。
並且,用於說明實施方式的所有附圖中,原則上針對相同的構件標注相同的標記,並省略其重複說明。
圖1是舉例示出本實施方式所涉及的手寫文字識別系統的概要的方塊圖。對於手寫文字識別系統1,使用者通過使用業務終端200通過瀏覽器等連接到文字候補提案裝置100而進行利用,但是不限於此,也可以是,文字候補提案裝置100的各功能作為應用軟體搭載到業務終端200。
另外,由業務終端200連接文字候補提案裝置100的情況下,通過LAN(Local Area Network:局域網)、WAN(Wide Area Network:廣域網路)、互聯網、行動電話網等、或者作為將這些複合起來的通訊網的網路50進行連接。該網路也可以是行動電話通訊網等無線通訊網上的VPN(Virtual Private Network:虛擬私人網路絡)等。
手寫文字識別系統1的應用例可以舉出這樣的例子,即:手寫文字識別系統1是伴隨規定的書面文件(例如,保險的申請書、銀行帳戶的開設申請書等按照規定的格式手寫輸入姓名的書面文件)的處理的業務系統等。
此時,就用戶而言,可想到在規定的書面文件的規定的欄目手寫填入姓名,要對大量的書面文件進行事務處理,通過電腦處理而進行大量的資訊處理從效率方面而言大為有利,因此姓名等的手寫的記述一般多通過OCR(Optical Character Recognition:光學文字辨識)進行數位化。
在此,紙質文書的文字資料電子化技術在進步,但是出現一定比率的誤讀、未讀等,並不存在對所有的手寫文字能夠完全地識別的技術。因此,最終通過人的目視確認文字是否一致,而這樣的目視作業成為阻礙文書的文字資料電子化成本降低的原因之一。具體而言,在讀取了姓名的情況下,雖然採用了與姓、名等關於姓名的資料庫進行對照以提高文字的識別率的手法,但是有難以讀取的文字、容易混淆的文字等,仍然發生以目視確認是否發生誤讀的成本。
也就是說,在所讀取的文字包含誤讀的情況下,例如,OCR等文字識別引擎將正確的姓“川本”誤讀為“小木”的情況下,因為針對錯誤的“小木”與各資料庫進行對照,因此有正確的“川本”的候補的優先順序降低或者候補漏掉的可能性。
並且,在採用的是對於姓部分和名部分的填寫欄目沒有加以明確區分而填寫全名作為姓名的格式的情況下,如果識別不出正確的姓,則甚至會有察覺不到發生了誤讀的情況。例如,將“小山田伸”(Xiaoshantian Shen)這一全名的“田”誤讀為“由”,則會有將姓識別為“小山”(Xiaoshan)並將以“由”起頭的“由伸”(Youshen)等名作為候補的可能性。
有鑑於此,本申請將OCR等文字識別引擎所讀取的文字是錯誤的情況也作為前提,除了與關於姓和名的DB(資料庫)進行對照,還增加與記錄了過去OCR等文字識別引擎誤讀較多的文字的資訊的類似文字進行對照。據此,恰當地擴大包含容易發生誤讀的文字的讀取文字的候補的範圍,將有優先順序降低或者候補漏掉的可能性的文字也作為候補,並且,在進行了姓和名的判別處理的基礎上進行候補文字的選別。並且,這樣的類似文字,能夠通過文字的目視確認作業而使新的類似文字資訊不斷地積累,從而達到提高文字識別的精確度。
本實施方式所涉及的業務終端200是用於將那樣的規定的書面文件進行數位化的業務的終端。讀取裝置300是掃描器、攝像裝置等,回應來自業務終端200的指示而以圖像等讀取規定的書面文件,並將所讀取的手寫文字圖像遞交給業務終端200。
在該業務中,業務終端200,接受到手寫文字圖像,則通過OCR進行數位化而轉換為文字列資訊,向文字候補提案裝置100發送所轉換的文字列並從文字候補提案裝置100接受所提出的候補文字。而且,業務終端200選擇性地顯示候補文字,將使用者所選擇的候補文字作為數位化資訊進行利用。
另外,讀取裝置300,不限於掃描器,也可以是帶攝像頭的行動電話終端、帶攝像頭的平板電腦終端等能夠將圖像作為資料進行讀取的設備,也可以是通過網路50與業務終端200可通訊地連接的構成。
並且,讀取裝置300不是必須的裝置,也可以是,文字候補提案裝置100或者業務終端200通過網路50從其他裝置接收已讀取的圖像資料、已進行了文字識別的資料而提案文字候補。
圖2是示出手寫文字識別系統的構成的例子的圖。文字候補提案裝置100中,記憶部110、處理部120以及通訊部130互相通過匯流排等可通訊地連接。
記憶部110包括受領資料記憶部111、實存文字記憶部112、類似文字記憶部115以及候補文字記憶部116。實存文字記憶部112中保存實際存在的人名、固有名詞等文字列。例如,實存文字記憶部112包括姓記憶部113以及名記憶部114。例如,日本人的姓,據說有30萬種以上,被確認為實際存在的姓保存於記憶部113中。
圖3是示出受領資料記憶部的資料結構例的圖。受領資料記憶部111包括受託日111A、委託企業ID111B、文書編號111C、文字識別編號111D以及識別文字代碼111E。受託日111A是指定從業務終端200接受文字候補提案的委託的日期的資訊。委託企業ID111B是指定委託了文字候補提案的企業的資訊。文書編號111C是指定成為文字候補提案的委託對象的文書(文書的圖像資料)的資訊。文字識別編號111D是指定識別對象的文書中包含的各個文字的資訊。識別文字代碼111E是對各個文字從外觀進行識別的結果獲得的文字的文字代碼。
圖4是示出姓記憶部的資料結構例的圖。姓記憶部113包括姓識別符113A、姓113B、文字數113C以及出現頻率113D。姓識別符113A是將姓從其他姓進行識別的資訊。姓113B是姓的書寫資訊。文字數113C是姓的書寫上的文字數。出現頻率113D是姓的總體中的出現頻率。
圖5是示出名記憶部的資料結構例的圖。名記憶部114包括名識別符114A、名114B、文字數114C以及出現頻率114D。名識別符114A是將名從其他名進行識別的資訊。名114B是名的書寫資訊。文字數114C是名的書寫上的文字數。出現頻率114D是名的總體中的出現頻率。
圖6是示出類似文字記憶部的資料結構例的圖。類似文字記憶部115包括文字代碼115A、類似文字代碼115B、出現頻率115C以及記憶日115D。文字代碼115A是互相處於類似關係的文字中作為基準的文字的代碼。類似文字代碼115B是與以文字代碼115A指定的文字外觀上類似的文字的代碼。出現頻率115C是在文字的使用中作為類似關係出現的頻率。記憶日115D是指定作為類似關係記憶的日期的資訊。
圖7是示出候補文字記憶部的資料結構例的圖。候補文字記憶部116包括文字識別編號116A以及候補文字代碼116B。文字識別編號116A是指定識別對象的文書中包含的各個文字的資訊。候補文字代碼116B是與OCR所識別的文字不同的文字候補的代碼,是類似且實際存在的文字的代碼。
處理部120包括受託處理部121、姓名判別處理部122、對照處理部123、類似文字登記處理部124以及候補文字發送處理部125。
受託處理部121接受來自業務終端200的文字候補的提案委託。在接受了多個文字列的文字候補的提案的情況下,姓名判別處理部122,指定將姓名的劃分位置一個文字一個文字地進行變化而斷開的姓和名的組合,並判別作為姓名是否成立。對照處理部123,與實存文字記憶部112進行對照,判定是否是實際存在的文字候補。類似文字登記處理部124,將由業務終端200報告的文字作為未登記的類似關係,登記到類似文字記憶部115。候補文字發送處理部125,將由對照處理部123進行對照的結果命中的外觀類似的文字的候補的組合作為候補文字進行輸出。具體而言,候補文字發送處理部125,通過向業務終端200輸出(發送)保存於候補文字記憶部116的候補從而實現提出。通訊部130通過網路50與其他裝置進行通訊。
業務終端200中,記憶部210、處理部220以及通訊部230互相通過匯流排等可通訊地連接。
記憶部210包括文字記憶部211、候補文字記憶部212以及圖像記憶部213。
圖8是示出文字記憶部的資料結構例的圖。文字記憶部211包括圖像資料編號211A、讀取日211B、文字識別編號211C以及圖像211D。
圖像資料編號211A是指定讀取裝置300所讀取的文字列的圖像的資訊。讀取日211B是指定讀取裝置300讀取了文書的日期的資訊。文字識別編號211C是指定識別對象的文書中包含的各個文字的資訊。圖像211D是指定以文字識別編號211C指定的文字單獨的圖像資料(讀取裝置300所讀取的圖像的一部分)的資訊。
圖9是示出圖像記憶部的資料結構例的圖。圖像記憶部213包括圖像資料編號213A、文書編號213B、讀取日213C以及圖像213D。
圖像資料編號213A是指定讀取裝置300所讀取的文字列的圖像的資訊。文書編號213B是指定成為文字候補提案的委託對象的文書(文書的圖像資料)的資訊。讀取日213C是指定讀取裝置300讀取了文書的日期的資訊。圖像213D是指定讀取裝置300所讀取的圖像的資訊。
處理部220包括文字識別部221、委託處理部222、目視確認處理部223以及類似文字報告處理部224。文字識別部221是所謂的OCR引擎,分析從讀取裝置300獲得的手寫文字圖像而識別文字。
委託處理部222,為了排除因為文字識別部221誤讀而引起的返回、手續出錯等,向文字候補提案裝置100委託精確度高的候補文字的提案。
目視確認處理部223,進行選擇性地顯示以便能夠以目視確認由文字候補提案裝置100輸出的各個文字候補,接受來自使用者的對任一候補的選擇。
類似文字報告處理部224,接受使用者識別為類似的文字的文字的輸入,向文字候補提案裝置100進行報告以便作為類似文字進行登記。
通訊部230通過網路50與其他裝置進行通訊。
除此之外,雖未圖示,但是,業務終端200具備:輸入部,其接受來自用戶的輸入;以及輸出部,其輸出畫面、賬表等各種輸出資訊。例如,輸入部接受各種輸入,例如打字、觸摸、輕拂(flick)輸入等各種接觸輸入、語音輸入或者視線輸入等。
圖10是示出文字候補提案裝置100的硬體構成例的圖。文字候補提案裝置100具備由所謂的伺服器裝置、工作站、個人電腦、智慧手機或者平板電腦終端的殼體來實現的硬體構成。文字候補提案裝置100具備運算裝置101、主記憶裝置102、輔助記憶裝置103、通訊裝置104以及連接各裝置的匯流排107。業務終端200也同樣構成。並且,除此之外,業務終端200還具備觸控式螢幕、鍵盤、麥克風、顯示器等輸入輸出裝置。
運算裝置101是例如CPU(Central Processing Unit)等運算裝置。
主記憶裝置102是例如RAM(Random Access Memory:隨機存取記憶體)等記憶體裝置。
輔助記憶裝置103是能夠記憶數位資訊的所謂的硬碟(Hard Disk Drive)、SSD(Solid State Drive:固態硬碟)或者快閃記憶體等非揮發性記憶裝置。
通訊裝置104,是網卡等有線通訊裝置,或者是無線通訊裝置。
上述文字候補提案裝置100的受託處理部121、姓名判別處理部122、對照處理部123、類似文字登記處理部124、以及候補文字發送處理部125,由使運算裝置101進行處理的程式來實現。該程式記憶於主記憶裝置102、輔助記憶裝置103或者未圖示的ROM裝置內,執行之際載入於主記憶裝置102,由運算裝置101來執行。
並且,文字候補提案裝置100的記憶部110,由主記憶裝置102以及輔助記憶裝置103來實現。並且,通訊部130,由通訊裝置104來實現。以上是文字候補提案裝置100的硬體構成例。
文字候補提案裝置100的構成,按照處理內容,能夠分類為更多的構成要素。並且,也能夠對一個構成要素進行分類以便執行更多的處理。
並且,各處理部(受託處理部121、姓名判別處理部122、對照處理部123、類似文字登記處理部124以及候補文字發送處理部125)也可以由實現各自的功能的專用的硬體(ASIC(Application Specific Integrated Circuit:專用積體電路)、GPU(Graphics Processing Unit:圖形處理單元)等)構築。並且,各處理部的處理可以由一個硬體來執行,也可以由多個硬體來執行。
接著,說明本實施方式的手寫文字識別系統1的動作。
圖11是示出手寫文字識別的全體處理流程的例子的圖。手寫文字識別處理通過由使用者從業務終端200指示開始而起動。
首先,業務終端200向讀取裝置300請求文書的圖像資料的讀取(步驟S10)。具體而言,文字識別部221指示讀取裝置300開始掃描或者攝像。
讀取裝置300,接受來自業務終端200的請求,讀取該文書的圖像,並作成圖像資料向業務終端200處進行應答(步驟S11)。
業務終端200的文字識別部221,受領來自讀取裝置300的圖像資料,記憶到圖像記憶部213,並以OCR引擎執行文字識別處理(步驟S12)。而且,將所識別的文字資料保存到文字記憶部211(步驟S13)。另外,也可以構成為:該OCR引擎實裝到設置於業務終端200可連接的網路上的個人電腦終端、伺服器終端等,通過由業務終端200指示文字識別處理從而執行處理。
而且,在業務終端200中,由委託處理部222向文字候補提案裝置100發送所識別的文字,並委託文字候補的提案處理(步驟S14)。
而且,文字候補提案裝置100的受託處理部121,從業務終端200受領所識別的文字並保存到受領資料記憶部111(步驟S15)。
而且,對照處理部123將所受領的文字資料與實存文字記憶部112以及類似文字記憶部115進行對照(步驟S16)。
而且,對照處理部123,選別候補文字,並保存到候補文字記憶部116(步驟S17)。
而且,候補文字發送處理部125向業務終端200處發送候補文字(步驟S18)。
業務終端200的委託處理部222,受領候補文字,並保存到候補文字記憶部212(步驟S19)。
而且,目視確認處理部223輸出對候補文字與圖像記憶部的圖像進行比較的畫面(步驟S20)。更具體而言,例如,該畫面中顯示由讀取裝置300所讀取的手寫文字圖像以及多個該候補文字以便能夠選擇輸入。
在接受到來自使用者的類似文字的登記指示的情況下,類似文字報告處理部224,如果除了候補文字之外有以單文字類似的文字則接受輸入,並向文字候補提案裝置100進行應答(步驟S21)。
文字候補提案裝置100的類似文字登記處理部124,受領類似文字,在類似文字記憶部115未保存的情況下,進行保存(步驟S22)。
以上是手寫文字識別的全體處理流程的例子。通過手寫文字識別的全體處理,能夠更恰當地提案類似的文字列候補。
圖12是示出姓名劃分對照處理的流程的例子的圖。姓名劃分對照處理是將手寫文字識別的全體處理流程中的步驟S16至S18的處理一連串地進行的處理的例子。
首先,姓名判別處理部122指定總文字數n(步驟S1601)。例如,在姓名“小山田伸”為候補提示的對象的文字列的情況下,姓名判別處理部122將各個漢字“小”、“山”、“田”、“伸”各作為一個文字,指定總文字數n為“4”。
而且,姓名判別處理部122進行分解為:從前頭起d(d為1以上且不足n,初始值為1)個文字作為姓,剩餘的文字作為名(步驟S1602)。
對照處理部123,將構成姓的文字一個字一個字地進行分解而與類似文字記憶部115進行對照,將類似的文字的組合與姓記憶部113進行對照而選出實際存在的姓候補(步驟S1603)。
而且,姓名判別處理部122判定類似文字記憶部115中是否搜尋不到相符的姓候補(步驟S1604)。在搜尋不到姓候補的情況下(步驟S1604的“是”的情況下),姓名判別處理部122將控制推進到後述的步驟S1611。
在有搜尋到姓候補的情況下(步驟S1604的“否”的情況下),姓名判別處理部122判定姓記憶部113中是否有搜尋到與該姓候補中的至少一個相符的姓(步驟S1605)。在姓記憶部113中搜尋不到相符的姓的情況下(步驟S1605的“否”的情況下),姓名判別處理部122將控制推進到後述的步驟S1611。
在姓候補中有搜尋到與姓記憶部113相符的姓的情況下(步驟1605的“是”的情況下),姓名判別處理部122暫時保管所選出的所有的姓候補(步驟S1606)。
而且,對照處理部123,將構成名的文字一個字一個字地進行分解而與類似文字記憶部115進行對照,將類似的文字的組合與名記憶部114進行對照而選出實際存在的名候補(步驟S1607)。
而且,姓名判別處理部122,判定類似文字記憶部115中是否搜尋不到相符的名候補(步驟S1608)。在搜尋不到名候補的情況下(步驟S1608的“是”的情況下),姓名判別處理部122將控制推進到後述的步驟S1611。
在有搜尋到名候補的情況下(步驟S1608的“否”的情況下),姓名判別處理部122判定名記憶部114中是否有搜尋到與該名候補中的至少一個相符的名(步驟S1609)。在名記憶部114中搜尋不到相符的名的情況下(步驟S1609的“否”的情況下),姓名判別處理部122將控制推進到後述的步驟S1611。
在名候補中有搜尋到與名記憶部114相符的名的情況下(步驟S1609的“是”的情況下),姓名判別處理部122暫時保管所選出的所有的名候補(步驟S1610)。
而且,姓名判別處理部122將姓的文字數d增值(+1)(步驟S1611)。
而且,姓名判別處理部122判定姓的文字數d是否與總文字數n一致(步驟S1612)。在不一致的情況下(步驟S1612的“否”的情況下),姓名判別處理部122將控制返回步驟S1602。
在姓的文字數d與總文字數n一致的情況下(步驟S1612的“是”的情況下),姓名判別處理部122判定是否有搜尋到暫時保管的姓候補和名候補(姓長度+名長度與總文字數n一致的)的組,也就是說判定是否有作為結果命中的姓名的組合(步驟S1613)。
在搜尋不到暫時保管的姓候補和名候補(姓長度+名長度與總文字數n一致的)的組的情況下(步驟S1613的“否”的情況下),候補文字發送處理部125向業務終端200通知不能判別(步驟S1614)。
在有搜尋到暫時保管的姓候補和名候補(姓長度+名長度與總文字數n一致的)的組的情況下(步驟S1613的“是”的情況下),候補文字發送處理部125向業務終端200發送候補文字(步驟S1801)。此時,候補文字發送處理部125,針對暫時保管的每個姓候補和名候補的組,按照出現頻率的順序排序並發送。也就是說,候補文字發送處理部125按照出現頻率高的文字構成的姓候補和名候補的順序進行發送。
以上是姓名劃分對照處理的流程的例子。通過姓名劃分對照處理,能夠針對由一個以上的文字而成的姓名,變化姓名的劃分位置並適用各自的類似文字,指定實際存在的候補。例如,上述的姓名“小山田伸”的情況下,“田”與“由”是類似文字,能夠指定包含以下候補的候補文字,即:將兩個文字的姓“小山”和剩餘部分的名“由伸”作為候補;以及將三個文字的姓“小山田”和剩餘部分的名“伸”作為候補。
圖13是示出候補文字受領處理的流程的例子的圖。候補文字受領處理是將手寫文字識別的全體處理流程中的步驟S19至S21的處理一連串地進行的處理的例子。
首先,委託處理部222使所受領的候補文字記憶到候補文字記憶部212(步驟S191)。
而且,目視確認處理部223對候補文字與手寫文字圖像進行確認顯示(步驟S201)。該確認顯示的畫面例在後面記述。
而且,目視確認處理部223接受候補文字的選擇輸入(步驟S202)。據此,確定手寫文字的數位化。
並且,類似文字報告處理部224判定是否有新的類似文字的輸入(步驟S211)。在沒有新的類似文字的輸入的情況下(步驟S211的“否”的情況下),類似文字報告處理部224結束候補文字受領處理。
在有新的類似文字的輸入的情況下(步驟S211的“是”的情況下),類似文字報告處理部224向文字候補提案裝置100發送成為新的類似文字的資訊(步驟S212)。
以上是候補文字受領處理的流程的例子。通過候補文字受領處理,能夠從文字候補提案裝置100受領候補文字,一邊與手寫文字進行比較一邊對候補進行選擇輸入。並且,能夠在發覺到類似文字的情況下,向文字候補提案裝置100進行報告,委託登記為新的類似文字。
圖14是示出類似文字登記處理的流程的例子的圖。在候補文字受領處理中成為類似文字的資訊由業務終端200發送到文字候補提案裝置100的情況下,在文字候補提案裝置100開始類似文字登記處理。
首先,類似文字登記處理部124判定所受領的類似文字的資訊是否已記憶於類似文字記憶部115(步驟S2201)。
在所受領的類似文字的資訊未記憶於類似文字記憶部115的情況下(步驟S2201的“否”的情況下),類似文字登記處理部124一對一地指定類似文字的組合(將處於類似關係的文字分解為一對一的組合)(步驟S2202)。
並且,類似文字登記處理部124,針對互相類似的文字的雙方,分別將彼此作為類似保存到類似文字記憶部115(步驟S2203)。
在所受領的類似文字的資訊已記憶於類似文字記憶部115的情況下(步驟S2201的“是”的情況下),類似文字登記處理部124向業務終端200通知已有登記(步驟S2204)。
而且,類似文字登記處理部124,針對互相類似的文字的雙方,分別使彼此的出現頻率增加規定量(步驟S2205)。
以上是類似文字登記處理的流程的例子。通過類似文字登記處理,能夠在業務終端200委託登記的類似文字是新的關係的情況下登記為類似,在已有登記的情況下提高出現頻率。
圖15是示出候補提示畫面的例子的圖。候補提示畫面400是在手寫文字識別全體處理流程的步驟S20、候補文字受領處理的步驟S201輸出的畫面。進行目視確認的原資料(由讀取裝置300讀取的手寫文字圖像)顯示於原資料顯示區域401,作為進行目視確認的對象的候補文字顯示於姓候補顯示區域402以及名候補顯示區域403。姓候補顯示區域402以及名候補顯示區域403中顯示文字候補提案裝置100作為出現率最高的候補提案的候補文字。姓候補決定按鈕404,接受到輸入,則使姓候補顯示區域402中所示的姓確定。名候補決定按鈕405,接受到輸入,則使名候補顯示區域403中所示的名確定。
下個候補以下的候補文字,分別按照出現頻率的順序被排序並被可選擇地清單顯示於姓下個候補顯示區域406以及名下個候補顯示區域407。姓下個候補顯示區域406以及名下個候補顯示區域407接受清單的文字的選擇。姓下個候補決定按鈕408,接受到輸入,則使姓下個候補顯示區域406中被選擇的姓確定。名下個候補決定按鈕409,接受到輸入,則使名下個候補顯示區域407中被選擇的名確定。
類似文字登記區域410以及類似文字登記區域411分別接受文字的輸入。登記按鈕412,接受到輸入,則作為處於類似關係的文字接受被輸入到類似文字登記區域410以及類似文字登記區域411的文字,並使向文字候補提案裝置100的登記處理開始。也就是說,目視確認的結果,目視作業負責人(用戶)有覺得有必要作為新的類似文字登記的文字的情況下,能夠通過向類似文字登記區域410以及類似文字登記區域411輸入該文字,並選擇登記按鈕412,從而進行登記。並且,根據需要,接受到對返回按鈕413、下個畫面按鈕414的輸入,則遷移到前後的業務畫面。
圖16是示出姓候補提示例的圖。適用了本實施方式的手寫文字識別系統1,即使在讀取裝置300以及文字識別部221誤讀了的情況下,所提示的候補中包含正確答案的文字的可能性也會高,對此具體地進行表述。
在OCR等文字識別引擎將正確答案的姓“川本”(a)誤讀為“小木”(b)的情況下,如果針對誤讀的“小木”(b)進行與實際存在的姓之間的對照,則會有發生本來是正確答案的“川本”(a)的文字候補的優先順序降低或者候補漏掉的可能性。
針對誤讀的“小木”(b),分解文字為“小”(c)和“木”(d),分別與類似文字記憶部115進行對照,分別按照出現頻率高的順序指定類似文字(e、f)。接著,通過將出現頻率高的文字彼此合成而成的姓與姓記憶部113進行對照,從而選別候補文字(g)並排序。據此,即使在有誤讀的情況下,也能夠通過執行與類似文字記憶部115之間的對照,避免正確答案的“川本”(a)的優先順序降低或者候補漏掉,同時可期望提高文字識別率。
以上是實施方式所涉及的手寫文字識別系統的例子。通過該實施方式所涉及的手寫文字識別系統的例子,針對讀取了手寫文字的圖像,能夠更恰當地提案類似的文字列候補,因此使用者只要從提示的候補中進行選擇就能夠順利地進行手寫文字的讀取業務。
並且,在上述實施方式的例子中,舉出姓名作為手寫文字的對象的例子,但是不限於此,通過更換進行對照的實存文字記憶部112,也能夠適用於住址等其他的所有的文字資料。
並且,上述實施方式的技術性要素,可以單獨地適用,也可以分成程式部件和硬體部件這樣的多個部分來適用。
以上,針對本發明,以實施方式為中心進行了說明。
1:手寫文字識別系統 50:網路 100:文字候補提案裝置 110:記憶部 111:受領資料記憶部 112:實存文字記憶部 113:姓記憶部 114:名記憶部 115:類似文字記憶部 116:候補文字記憶部 120:處理部 121:受託處理部 122:姓名判別處理部 123:對照處理部 124:類似文字登記處理部 125:候補文字發送處理部 130:通訊部 200:業務終端 210:記憶部 211:文字記憶部 212:候補文字記憶部 213:圖像記憶部 220:處理部 221:文字識別部 222:委託處理部 223:目視確認處理部 224:類似文字報告處理部 230:通訊部 300:讀取裝置
圖1是舉例示出實施方式所涉及的手寫文字識別系統的概要的方塊圖。 圖2是示出手寫文字識別系統的構成的例子的圖。 圖3是示出受領資料記憶部的資料結構例的圖。 圖4是示出姓記憶部的資料結構例的圖。 圖5是示出名記憶部的資料結構例的圖。 圖6是示出類似文字記憶部的資料結構例的圖。 圖7是示出候補文字記憶部的資料結構例的圖。 圖8是示出文字記憶部的資料結構例的圖。 圖9是示出圖像記憶部的資料結構例的圖。 圖10是示出文字候補提案裝置的硬體構成例的圖。 圖11是示出手寫文字識別的全體處理流程的例子的圖。 圖12是示出姓名劃分對照處理的流程的例子的圖。 圖13是示出候補文字受領處理的流程的例子的圖。 圖14是示出類似文字登記處理的流程的例子的圖。 圖15是示出候補提示畫面的例子的圖。 圖16是示出姓候補提示例的圖。
國內寄存資訊 (請依寄存機構、日期、號碼順序註記) 無
國外寄存資訊 (請依寄存國家、機構、日期、號碼順序註記) 無
1:手寫文字識別系統
50:網路
100:文字候補提案裝置
200:業務終端
300:讀取裝置

Claims (9)

  1. 一種文字候補提案裝置,其特徵在於,具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的人名的文字列;受託處理部,其接收一個以上的文字並接受提出該文字的外觀類似的人名的文字候補的委託;對照處理部,其通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理部,其將由所述對照處理部進行對照的結果命中的所述外觀類似的文字的候補的組合作為人名的候補文字進行輸出;其中,所述候補文字發送處理部,按照每個所述外觀類似的文字的候補的出現頻率高的順序進行排序,並輸出組合了的人名的候補文字。
  2. 如請求項1所述之文字候補提案裝置,其中,具備類似文字登記處理部,其在輸出所述候補文字後,接受到與所述受託處理部所接收的所述文字的任一個類似的文字的情況下,如果是所述類似文字記憶部未記憶的類似關係,則使所述類似文字記憶部進行記憶。
  3. 如請求項1所述之文字候補提案裝置,其中, 所述實際存在的人名的文字列被劃分為姓和名,所述文字候補提案裝置具備姓名判別處理部,其將所接收的所述文字劃分為姓和名而使所述對照處理部進行對照。
  4. 如請求項3所述之文字候補提案裝置,其中,所述姓名判別處理部,針對所接收的所述文字,指定通過變化斷開姓和名的位置從而劃分為姓和名的組合,針對各組合的姓和名雙方,在由所述對照處理部進行對照的結果獲得命中的情況下,作為所述候補文字。
  5. 如請求項4所述之文字候補提案裝置,其中,所述候補文字發送處理部,將所述候補文字按照出現頻率進行排序並輸出。
  6. 如請求項1所述之文字候補提案裝置,其中,所述受託處理部接收的所述文字是讀取手寫文字並進行了識別的文字。
  7. 一種手寫文字識別系統,包括:文字候補提案裝置;業務終端,其通過網路與所述文字候補提案裝置可通訊地連接;以及,讀取裝置,其回應來自所述業務終端的指示而讀取手寫文字;所述業務終端具備:文字識別部,其從所述讀取裝置獲得所述手寫文字並進行文字識別;委託處理部,其向所述文字候補提案裝置發送由所述文字識別部所識別的文字並委託文字候補的提案;以 及,目視確認處理部,其顯示由所述文字候補提案裝置輸出的文字候補;所述文字候補提案裝置具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的人名的文字列;受託處理部,其接收一個以上的文字並接受提出該文字的外觀類似的人名的文字候補的委託;對照處理部,其通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理部,其將由所述對照處理部進行對照的結果命中的所述外觀類似的文字的候補的組合作為人名的候補文字進行輸出;其中,所述候補文字發送處理部,按照每個所述外觀類似的文字的候補的出現頻率高的順序進行排序,並輸出組合了的人名的候補文字。
  8. 一種手寫文字識別方法,是由手寫文字識別系統進行的手寫文字識別方法,所述手寫文字識別系統包括:文字候補提案裝置;業務終端,其通過網路與所述文字候補提案裝置可通訊地連接;以及,讀取裝置,其回應來自所述業務終端的指示而讀取手寫文字; 所述業務終端執行以下步驟:文字識別步驟,在該文字識別步驟中,從所述讀取裝置獲得所述手寫文字並進行文字識別;委託處理步驟,在該委託處理步驟中,向所述文字候補提案裝置發送在所述文字識別步驟所識別的文字並委託文字候補的提案;以及,目視確認處理步驟,在該目視確認處理步驟中,顯示所述文字候補提案裝置輸出的文字候補;所述文字候補提案裝置具備:類似文字記憶部,其記憶文字的外觀的類似關係;以及,實存文字記憶部,其記憶實際存在的人名的文字列;並且,所述文字候補提案裝置執行以下步驟:受託處理步驟,在該受託處理步驟中,接收一個以上的文字並接受提出該文字的外觀類似的人名的文字候補的委託;對照處理步驟,在該對照處理步驟中,通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理步驟,在該候補文字發送處理步驟中,將在所述對照處理步驟進行對照的結果命中的所述外觀類似的文字的候補的組合作為人名的候補文字進行輸 出;其中,所述候補文字發送處理部,按照每個所述外觀類似的文字的候補的出現頻率高的順序進行排序,並輸出組合了的人名的候補文字。
  9. 一種程式,其使電腦進行支援手寫文字的識別的處理,所述電腦具備:類似文字記憶部,其記憶文字的外觀的類似關係;實存文字記憶部,其記憶實際存在的人名的文字列;以及,處理部;所述程式的特徵在於,使所述處理部實施以下步驟:受託處理步驟,在該受託處理步驟中,接收一個以上的文字並接受提出該文字的外觀類似的人名的文字候補的委託;對照處理步驟,在該對照處理步驟中,通過與所述類似文字記憶部進行對照,從而指定與所接收的所述文字外觀類似的文字的候補,將所述外觀類似的文字的候補的組合與所述實存文字記憶部所記憶的所述實際存在的文字列進行對照;以及,候補文字發送處理步驟,在該候補文字發送處理步驟中,將在所述對照處理步驟進行對照的結果命中的所述外觀類似的人名的文字的候補的組合作為候補文字進行輸出;其中,所述候補文字發送步驟中,按照每個所述外觀 類似的文字的候補的出現頻率高的順序進行排序,並輸出組合了的人名的候補文字。
TW111118179A 2019-09-09 2020-09-08 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式 TWI795292B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-163641 2019-09-09
JP2019163641A JP7297610B2 (ja) 2019-09-09 2019-09-09 文字候補提案装置、手書文字識別システム、手書文字識別方法およびプログラム

Publications (2)

Publication Number Publication Date
TW202234289A TW202234289A (zh) 2022-09-01
TWI795292B true TWI795292B (zh) 2023-03-01

Family

ID=74864169

Family Applications (2)

Application Number Title Priority Date Filing Date
TW109130732A TWI766360B (zh) 2019-09-09 2020-09-08 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式
TW111118179A TWI795292B (zh) 2019-09-09 2020-09-08 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW109130732A TWI766360B (zh) 2019-09-09 2020-09-08 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式

Country Status (5)

Country Link
JP (2) JP7297610B2 (zh)
KR (2) KR102572500B1 (zh)
CN (1) CN112789624A (zh)
TW (2) TWI766360B (zh)
WO (1) WO2021049070A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI814564B (zh) * 2022-08-31 2023-09-01 台灣大哥大股份有限公司 文字圖像拆分系統及其方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680160A (zh) * 2013-11-26 2015-06-03 冲电气工业株式会社 信息处理装置、系统、以及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02195489A (ja) * 1989-01-25 1990-08-02 Hitachi Ltd 文字認識の後処理装置
JP2892376B2 (ja) * 1989-07-06 1999-05-17 沖電気工業株式会社 文字認識処理装置
JP4066507B2 (ja) * 1998-05-11 2008-03-26 日本電信電話株式会社 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
JP6822261B2 (ja) 2017-03-24 2021-01-27 沖電気工業株式会社 情報処理装置、プログラムおよび情報処理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680160A (zh) * 2013-11-26 2015-06-03 冲电气工业株式会社 信息处理装置、系统、以及方法

Also Published As

Publication number Publication date
TWI766360B (zh) 2022-06-01
KR20210032380A (ko) 2021-03-24
TW202115603A (zh) 2021-04-16
JP7297610B2 (ja) 2023-06-26
JP2023110102A (ja) 2023-08-08
JP7490861B2 (ja) 2024-05-27
KR102465524B1 (ko) 2022-11-11
WO2021049070A1 (ja) 2021-03-18
TW202234289A (zh) 2022-09-01
KR102572500B1 (ko) 2023-08-30
JP2021043570A (ja) 2021-03-18
KR20220153096A (ko) 2022-11-17
CN112789624A (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
JP6871840B2 (ja) 計算機及び文書識別方法
JP2018124656A (ja) 画像処理装置とその制御方法、及びプログラム
KR101840643B1 (ko) 화상처리장치 및 그 제어 방법
JP4991407B2 (ja) 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法
TWI795292B (zh) 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式
JP2016024488A (ja) 画像処理装置および画像処理装置の制御方法
JP2016018454A (ja) 画像処理装置および画像処理装置の制御方法
US20060139315A1 (en) Apparatus and method for inputting alphabet characters on keypad
KR102201930B1 (ko) 문서 정보를 포함한 이미지 파일의 자동 문서화 장치 및 방법
JP7029813B2 (ja) 辞書作成装置、辞書作成方法及び辞書作成プログラム
CN112445911A (zh) 工作流程辅助装置、系统、方法及存储介质
JP7021496B2 (ja) 情報処理装置及びプログラム
JP7268389B2 (ja) 情報処理装置及びプログラム
JP7271987B2 (ja) 情報処理装置及びプログラム
JP5752073B2 (ja) データ修正装置
JP2016111482A (ja) 画像処理装置および画像処理装置の制御方法
JP2004046388A (ja) 情報処理システムおよび文字修正方法
JP2008152357A (ja) テキスト認識システム、テキスト認識方法、テキスト認識プログラム
CN111539240A (zh) 信息处理装置、储存介质及信息处理方法
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム
JP2011100332A (ja) 姓名による属性解析方法、プログラム及びシステム
JP6024118B2 (ja) 文字読取装置及び文字認識方法
JP2024002779A (ja) 本人確認業務支援装置及び本人確認業務支援方法
JPH11120294A (ja) 文字認識装置および媒体
JP3929560B2 (ja) 誤記自動修正方法、読取装置、および誤記自動修正プログラムを記録したコンピュータ読み取り可能な記憶媒体