TW421764B - Input character string estimation and identification apparatus - Google Patents

Input character string estimation and identification apparatus Download PDF

Info

Publication number
TW421764B
TW421764B TW089114382A TW89114382A TW421764B TW 421764 B TW421764 B TW 421764B TW 089114382 A TW089114382 A TW 089114382A TW 89114382 A TW89114382 A TW 89114382A TW 421764 B TW421764 B TW 421764B
Authority
TW
Taiwan
Prior art keywords
search
migration
text
character
item
Prior art date
Application number
TW089114382A
Other languages
English (en)
Inventor
Keiko Gunji
Koyo Katsura
Soshiro Kuzunuki
Masaki Miura
Toshimi Yokota
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP12536096A external-priority patent/JP3275704B2/ja
Priority claimed from JP22480896A external-priority patent/JPH1063750A/ja
Priority claimed from JP26193696A external-priority patent/JP3205516B2/ja
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of TW421764B publication Critical patent/TW421764B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Description

A7 421764 __B7_________ 五、發明說明() 1 <發明之詳細說明> <發明之領域> 本發明係關於將輸入圖案予以辨識*然後顯示其結果 之圖案辨識裝置,特別是有關於將地址或定形化句子等固 定文字列以手寫輸入之圖案辨識裝置》 <先前技術> 在PenPc (筆輸入電腦)等之帳單處理等中,有 很多是要輸入地址或定形化句子者*習知之地址或定形化 句子之輸入方法有(1 )利用選單選擇或(2 )以文字辨 識及選單之組合輸入郵地區號,則可以選單顯示選擇關連 之地址之方法(3 )辨識予寫輸入文字,然後以單字字典 將其候補作最佳化之方法等· (1 )的選單方法,係如文獻「容許有文字位置偏差 之無框書寫地址之辨識」(日本電子資訊通信學會論文集 D-2,1994年1月版)所揭示者,在像地址這樣的 被階層化之資料,從上位階層起依序向下位選擇(例如, 「莰城縣」-「日立市」—「大;和町」這樣)之方法是 一般常見的。而如果要输入「日立市」時,到底「日立市 j是在那一縣,例如到底是「莰城縣j或是「栃木縣」, 當我們無法知道時*就無法選擇「日立市」•這是一個大 問題。 C 2 )之輸入郵政區號時,以選單表示相關連之地址 之方法,係只將郵地區號以文字输入,之後,從郵地區號 本紙張尺度適用中國國家標準(CNS)A4蜆格(210 X 297公釐) I Μ---rifl—ί 裝 - ---..---- 訂·!I---•線 (讀先閱讀背面之注意事項 #寫本頁》 經濟部智慧財產局員工消費合作社印製 -4 ~ 經濟部智慧財產局員工消費合作社印製 421TB4 a? B7 五、發明說明() 2 所決定之地名係以選單選擇,所以,比較容易輸入。但是 ,自己地址之郵地區號雖然記得住,但是’要連其它地區 的郵地區號都能記住是比較困難的。 (3 )之辨識手寫輸入文字,而以單字字典將其候補 最佳化之方法,使用圓式作說明。圖3係習知之文字辨識 構成圖。將圖案輸入板a 1所輸入之手寫圖案與辨識字典 a 2匹配,辨識文字a 3,將所獲得之候補文字與單字字 典a 6作單字比對b7,然後將該當之單字顯示於LCD a 8 ° 圖4係使用習知之文字辨識輸入地址時之動作概要圖 。例如,爲了要輸入「莰城縣 日立市 大❖扣町」,必 需要將「莰城縣 日立市 大各扣町」全部以手寫輸入規 定之地址輸入區域b 1 >於是’進於文字辨識a 3 ’將所 獲得之候補文字1使用單字字典a 6,從最上位階層之都 道府縣開始作單字比對’將候補文字作最佳化’將其結果 作爲候補文字輸出。 以前,之所以要從最上位之階層開始存取地址這樣的 階層資料,是因爲一般的階層之應上位資料量愈少,只要 上位決定了,則可以確定下位之候補。如果’假設在以前 之系統•輸入「大:扣」關鍵字’然後檢索單字字典,則 到底在那一層也不知道’所以’只好對大約1 . 5MB之 單字字典作全文檢索,這對於像在線(On Line) 文字辨識這樣需要應答性者而言’並不實用。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 1 ^--ΙΊ--I 1 I I I I ill·!— -----11-^. (請先閱讀背面之江意事項 J寫本頁) 經濟部智慧財產局員工消费合作社印製 421764 A7 _____B7 ___五、發明說明() 3 ((地址單字字典之例)) 都道府縣:約5 0個X約3文字X 2位元組=約3 Ο Ο B 市町村:約4 0 0 0個x約3文字X 2位兀組=約2 . 5 K B 之下:約1 60000個x約4文字x2位元組=約 1 . 3 Μ B 合計:約1 5 Μ Β ) 但是,如習知方式這樣’要將例如「莰城縣 日立市 大;扣町」之長地址全部以手寫輸入,所以,對於使用者 而言是非常不便的。 <發明所欲解決之問題> 上述習知技術(1 )〜(3 )之共通問題點*在文字 辨識利用之例,係必需要將地址或定形句子等全部以手寫 輸入,對於使用者而言,是非常麻煩的’而且,如果要從 最上位以外之階層開始探索單字字典*則探索需要大量時 間,又,在以選單選擇時,像地址這樣爲階層構造時,則 如果上位不知道,就無法選擇下位β 本發明之目的係要提供一種只要將作爲關鍵之文字( 例如「大❖扣」或「〜戎扣町j )以手寫输入*就可以推 測剩下之文字列(例如「莰城縣 日立市」)•而將其辨 識結果之文字列全體輸出(例如「莰城縣 日立市大* 扣町」)而獲得之圖案辨識裝置。 I ------- l· I — J β ·!ιι1ιι_ (請先閱讚背面之注意事項 W寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) 6 A7 421T64 ____B7______ 五、發明說明() 4 <解決問題之手段> 本發明係具有辨識被输入文字列之辨識手段,而將被 辨識之結果予以表示之文字辨識裝置,其特徵爲,設有: 將複數之單字階層化而辨識各單字之單字識別資訊及階層 資訊予以記憶之單字字典:及至少將從某文字遷移到其它 文字之機率及其遷移關係之文字組合所對應之單字辨識資 訊予以記憶之文字遷移機率表:及將上述辨識手段所獲得 之候補文字列,使用上述文字遷移機率表予以最佳化之手 段;及依據被最佳化之候補文字到所對應之單字識別資訊 ,檢索上述單字字典,抽出對應上述階層資訊之未輸入單 字之檢索手段》 藉此,例如,即使只輸入「大办私町」時•利用上述 最佳化手段所最佳化之候補文字之「大❖私町」被抽出, 依據該文字列所對應之單字識別資訊,使單字字典被檢索 ,藉由與該單字識別資訊一起被記憶之階層資訊,抽出「 大戎尔町」之上位階層上「莰城縣日立市」,所.以•可 獲得包含未輸入文字列之「莰城縣日立市大各扣町』 之辨識結果。 又.1本發明之其它特徵,係在具有辨識被輸入文字列 之辨識手段,而顯示被辨識結果之文字辨識裝置,係具有 :事先將複數之文字列群分別記憶於固有的地址之字典: 及至少將從某文字遷移到其它文字之機率與包含有上述複 數文字列群之中處於上述遷移關係之文字之組合之文字列 群之地址,分別予以對應記億之文字遷移機率表;及將上 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) --J-------——( — 1— ----I.----訂--- - - (諳先Μ讀背面之沒意事項»»*寫本頁) 經濟部智慧財產局員工消費合作社印製 7 經濟部智慧財產局員工消费合作社印製 42丨764 A7 __B7 五、發明說明(E) 5 述辨識手段所獲得之候補文字,使用上述文字遷移機率表 予以最佳化之手段:利用上述被最佳化之候補文字列所對 應之文字列群之地址,存取上述字典*將該地址所對應之 上述字典中之文字列群,作爲辨識結果而予以顯示· <實施例> 以下,利用圚式,說明將本發明應用於以手寫输入地 址之裝置例。 圓2係本發明之一實施例之手寫輸入地址辨識裝置之 動作概要圖。以描査第a 9,對地址輸入區域b 1手寫輸 入成爲地址關鍵之文字之「大各扣j於是•手寫之筆畫.( 筆跡)被文字辨識a 3所辨識*而獲得關鍵字之候補文字 、第一候捕「大每扣」及第二候補「犬上對於這些 候補文字,參照文字遷移機率表a 4之文字間之遷移機率 ((文字A—(文字B)之機率),及文字之出現機率機 率表a 8,而要怎樣地組合候補文字,可使文字列之出現 機率變高,以使文字列之出現機率變高之方式,使候補文 字之順序最佳化•更者,參照文字遷移機率表之候捕單字 No.,求得包含處於候補文字列之字遷移之單字指示器 。在圖之例中*將「大為扣j與候補文字組合,則出現機 率會變高•從文字遷移機率表,求得包含(大及( 石一扣)之單字之指示器No · Al 1 ·在本方式中,於 文字辨識之後處理所用之遷移機率表上,新設量單字字典 中之單字指示器,藉此,可以高速地存儲目的單字•而, 本纸張兄度適用中國國家標準<CNS)A4規格<210 X 297公楚> — ^ — — — — — — — — — * — — — — — ·11111!11 {請先閱讀背面之注t事項一寫本頁) 8 A7 4 2Π64 B7_____ 五、發明說明() 6 如果單字字典中該當單字如果知道了,藉由單字字典之階 層資訊,上位階層可被求得•在此例中,最下位之階層的 「大办扣町」被求得,所以上位可求將「莰城縣 日立市 」•所以,雖然只手寫輸入「大占扣」,但是就可將從地 址之開.頭,候補顯示「莰城縣 曰立市 大*扣町」《 圖1係本發明之一實施例之手寫輸入地址辨識裝置之 機能方塊圖》使用圖1簡單說明動作。藉由將描畫筆a 9 在圖案輸入板a 1上滑動,而使手寫文字圖案被輸入。將 被輸入之手寫圖案與辨識字典a 2之文字圖案作匹配來作 文字辨識a 3。爲了將文字辨識結果所獲得之候補文字 之候補順位最佳化,參照事先經過學習作成之具有包含文 字間之遷移機率及文字遷移之單字字典中之候補單字之指 示器之遷移機率表a 4及文字之出現機率表a 8,以文字 列之出現機率變高之方式,來將候補順位最佳化,同時, 求得相當之最佳化之文字列之單字字典中之單字之指示器 (a 5) *將上述方法所求得之單字字典a 6之單字與候 補文字列比對,從單字字典之階層資訊求得相當之單字及 其前後之資訊(a7)。將求得之結果顯示於LCD a 8 e 又,本發明之特徵:〔1〕遷移機率表a4之作成方 法,〔2〕使用遷移機率表a 4,將候補文字作爲文字列 之出現機率變高之方式來作候補順位最佳化,而且,求得 最佳化之文字列之包含文字遷移之對單字之指示器之方法 ,〔3〕利用求得之單字之指示器,推測包含手寫輸入單 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公芨) --;----"I ---HI— ----l· I I 訂-! 線 <請先閱讀背面之泫意事項一 J寫本頁) 經濟部智慧財產局員工消费合作社印製 A7 421764 __ B7 五、發明說明(7) 字(關鍵字)之文字列之方法,〔4〕推測之文字列之顯 示方法•這些在後面都會利用圖作說明· 圖5係本發明之一實施例之手寫输入地址辨識裝置之 硬體構成圖。將輸入圖案與字典圖案匹配之機能’將圖案 匹配所獲得之候補文字作最佳化,求得包含候補文字之單 字之指示器之機能,將候補文字作單字比對再檢索前後之 資訊之機能,係藉由例如記億於ROM c 5之程式以 CPU c 3續出來實現》又,關於各機能,在後面會利 用圇面作詳細說明。 〔1〕遷移機率表a 4之作成方法 圖6係說明遷移機率表a 4之作成方法之流程圓。首 先,首先,讀出學習用的單字字典a 6 (dl)。關於讀 出的單字*計算單字中所包含之文字之出現次數(d 2 ) ,將其記錄於出現次數表d 3。接著,計算文字遷移次數 表(d4),記錄於遷移次數表d6。接著,於遷移次數 表d 6,記錄包含文字遷移之原來的單字之單字No .( 單字之指示器)(d5) ·例如,在單字「大办和」之例 中,文字之出現次數,分別爲「大」、「為」、「和」各 1次,文字遷移次數,係「大—為」及「❖—加」分別被 計數1次。又,「大—及「A —尔」之候補單字 No _記錄著單字「大各办」之單字N〇 .。對於單字字 典a6中之全部單字,重覆進行上述之處理dl〜d6。 之後•參照上述處理所作成之文字出現次數表d 3及文字 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ----------------i I I l· I I I 訂·! I 1 I I (請先W讀背面之注意事項t 寫本頁) 經濟部智慧財產局負工消費合作社印製 A7 421764 _____B7____ 五、發明說明() 8 遷移次數表d 6,依成包含文字間之邊移機率及文字遷移 之候補單字No·之資訊之遷移機率表a4(d9)。更 者,如果需要,參照文字出現次數表d 3,作成記述每個 文字之出現機率之文字出現機率表d8 (d7)。關於各 表之構成,利用以下圖式作說明· 圖7係單字字典之概要圖。此處以地址之單字字典a 6爲例。比字典係成爲都道府縣•市町村、以下之階層化 之構造*各要素係由單字N 〇 .(單字之位置資訊),上 位單字No. *單字(文字列)所構成。要存取各單字, 可藉由單字No.存取。又,單字之階層關係可藉由上位 單字N 〇 .知道》 圖8係文字出現次數表之概要圓•文字出現次數表 d 3,記憶著於學習用單字字典中各文字所出現之次數, 被用作計數學習用單字中之全文字數》 圖9及文字遷移次數表之概要圖。文字遷移次數表d 6 ,係作爲記錄學習用單字字典中出現之各文字遷移次數 表,及包含文字遷移之單字之No .(候補單字No .) 所用。 圖1 0係文字出現機率表之概要圖。例如,文字「曰 j之出現機率,係以出現機率(日)=出現次數(日)/ 全文字數來表示*所以,要作成文字出現機率表d 8 ·只 要參照文字出現次數表d 3,求得各文字之出現次數•記 錄於文字出現機率表d 8即可· 圖1 1係文字遷移機率表之概要圓。例如,文字遷移 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) I Ji i 1---I I--- * 裝 ---l· — IJ 訂--------I 線 (請先W讀背面之注意事項厂i寫本頁) 經濟部智慧財產局員工消費合作社印製 -11 - 4 ^ 1 7 ίί 4 Α7 _____Β7 五、發明說明() 9 广曰-立」之遷移機率,係以遷移機率(日—立)=遷移 次數(日—立)/出現次數(日)來表示·所以,要作成 文字遷移機率表a 4,只要參照文字出現次數表d 3及文 字遷移次數表d 6,求得各文字之遷移機率,記錄於文字 遷移機率表a 4即可。 藉由以上之處理,可作成具有對單字字典之單字之指 示器之遷移機率表a 4 »又,在本實施例中,係使用單字 N 〇 .作爲識別單字字典中之各單字之單字識別資訊,但 是並不只限於此,也可以是符號資訊。又,同樣地,使用 單字N 〇 .作爲表示單字字典中之單字間之階層關係,但 是並不只限於此,只要是可以表示階層關係者都可,例如 符號資訊也可》 〔2〕遷移機率之後處理(候補文字之最佳化及候補單字 之指示器之決定)方法 圖1 2係使用遷移機率表進行文字辨識後處理之概要 圖。如圖所示,輸入圖案「大丢和」之候補文字’爲第一 候補「大為扣」•第二候捕「犬々扣」。又,此處即使文 字辨識結果有錯,因爲表示可以遷移機率之候補文字之最 佳化對應,所以特別以不同於圖2之例之誤辨識「大❖办 j之例來作說明。候補文字之組合,可如圖所示之8種。 對於這些文字組,參照文字遷移機率表•求得文字列之出 現機率及單字字典中之單字候補之單字指示器•文字列之 出現機率高之候補文字之組合,係最佳之組合(通路)· 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ----,--I -----裝 ill·! — 訂·!!!線 (請先閱讀背面之沈意事項V、寫本頁> 經濟部智慧財產局員工消費合作社印製 -12 - Α7 421764 ΐ Β7 ______ 五、發明說明(1(j) 所以,以其文字組與候補單字Ν ο . —起作爲遷移機率後 處理之結果。 首先,敘述文字列之出現機率之計算方法。 一般而言,文字列S 1、S 2 ......... S η之出現機率 ,可以下式求得。 〔數1〕 出現機率(s 1 ,S 2 .......... s η ) =出現機率(SI) X遷移機率(S1 — S2) X… ......遷移機率(S n — 1-^S η .........(數1 ) 圖的候捕文字之組合No . 3之「大❖扣j之例,係 如下所示· 出現機率(大占扣)=出現機率(大)X遷移機率( 大—為)X遷移機率(办->#) 具體而言,藉由遷移機率表a 4及出現機率表a 8, 求得下式之值。 〔數2〕 出現機率(大*扣) = (18/89274)x(l/18)x( 2/15) X ¢2/198) = 14940x10 -8% .........(數 2 ) 其次,說明求得候補單字No ·(單字字典中之單字 候補之指示器)之方法。文字列SI ’ S2 ......... Sn之 本纸張尺度適用中國國家標準<CNS>A4規格(210 X 297公釐) I ^ I I ί ------- · I I I l· II I I I I I —1 I I (請先閱讀背面之注帝孝項i /寫本頁> 經濟部智慧財產局員工消費合作社印製 -13 - 經濟部智慧財產局員工消费合作社印製 421T6 4 A7 ____B? _____ 五、發明說明(j ' 候補單字Ν ο .可以用下式求出β 〔數3〕 候補單字 Ν 〇 ( S 1,S 2.......... S η ) =候補單字ν 〇 . ( s 1 — s 2 ) η.........η候補單 字 Ν 〇 . ( S η - 1 — S π ).........數 3 圖之例爲文字列「大办和」時,利用文字遷移機率表 a 4可得下式。 〔數4〕 候補單字No .(大戎扣) =η候補單字No (大—办)D候補單字No .( 為扣) = (Α11)Π(Α11,Α12) =A 1 1 .......(數 4 ) 在比例中,藉由及(η),可收來候補於「大各扣町 」(All),取或(U),候補可以爲「大务咖町J及 「戎办¢)原町j •這時,考慮其一致性,可以使「大戎扣 町」成爲第1候補》 藉由上述方法,將以文字辨識所符之候補文字作爲文 字列之出現機率變高之方式予以最佳化,而可以求得最佳 化之候補文字列之候補單字No.(單字之指示器)。又 ,依據上述之方法,即使只輸入例如「大❖扣町」的一部 分之「;尔」,也可以使「大办扣町」及「厶和Φ原町」 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) .--:----.------ --裝 ----^--11 訂·!----線 <請先閱讀背面之注意事項.*·/寫本頁) -14 - 經濟部智慧財產局員工消費合作社印5衣 ____________ 五、發明說明(j 成爲候補β 〔3〕包含手寫输入之單字(關鍵字)之文字列之推測方 法 接華對於包含最佳化之候補文字列(手寫输入之關鍵 字)之文字列全體之推測方法,利用圖式作說明》 圖13係利用後處理結果推測文字列之概要圖•在此 例中*表示出以遷移機率之後處理,而得到關鍵字(候補 文字)「大;私」及候補單字No . Al 1之情況。如圄 所示,關鍵字「大❖办」在單字字典中只有1個,由於是 最下位之階層,所以,上位之文字列「莰城縣 日立市」 被決定。而手寫文字「大而和」之全體之推測結果•係表 示候補文字列「莰城縣 日立市 大*尔町」* 圖2 2係與圖1 3相同之例,但是手寫文字「大办办 」之候補文字列*係以文字列推測結果之「莰城縣 曰立 市 大石扣町」及沒有推測結果之文字辨識結果之「大戎 私町」作爲兩方之候補而輸出•而使使用者可以選擇者爲 其特徵。像這樣,使從關鍵字推測之文字列及沒有推測之 關鍵字之兩方作爲候補,則使用者可選擇喜歡的一方,此 爲其優點》 圖1 4係利用後處理結果推測文字列之概要圖•在此 例中,表示遷移機率之後處理結果*單字字典之中間階層 之單字「日立」(候補單字No.1)之情況•由圖可知 ,由於關鍵字「日立」在單字字典表中只有1個,所以, 本紙張尺度適用中國國家標準<CNS)A4規格(210x297公爱) I J- I I J· — — — — — —I* * — — — — — all — — — — — — (請先閱讀背面之注意事項K /.寫本頁> - 15 _ A7 421764 _______B7______ 五、發明說明(j 上位階層之文字列「莰城縣」被決定。但是’由於下位之 階層爲複數,所以,例如以「莰域縣 日立市 大各扣町 j 「莰城縣 日立市 ❖咖Φ町」.........之複數顯示作爲 候補,讓使用者選擇也可。 圍15係與圖14相同地以後處理之結果單字字典之 中間階層之單字「日立」(候補單字Ν 〇 · A 1 )遷移機 率所獲得之下位候補爲複數之例。在此圖之例中’單字字 典中保持有各都市之人口資訊,在複數之某下位階層之中 ,將人口較多之町作爲優先之高候捕順位來顯示’而使操 作性提高。 圖1 6係與圖1 5相似*單字字典中係以單字間之遷 移機率代替人口資料。將複數之某下位階層之中,遷移機 率高之單字優先地以高候補順位顯示,藉此*可提高操作 性·該單字間之遷移機率•可以從地名經常出現之教科書 等來學習。又,較簡單地作法,係利用都市人口來決定次 數予以學習也可。 圖21係與圖14同樣地獲得後處理之結果單字字典 之中間階層之關鍵字「日立」(單字No.Al),而下 位候補無法單一決定之例•與圖1 4不同之處,係只表示 了候補單一決定之「莰城縣 日立市」,無法單一決定之 市町村以下*使用者要再次輸入》 由上可知,比關鍵字還上位之階層,係可以自動地單 一地推測,比關鍵字下位之候補爲複數時,由於無法單一 決定,所以,可以提示選單或只再輸入該部份· 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) --7 !.1 ------裝!^--II 訂·! •線 {請先閱讀背面之注意事項K W寫本頁) 經濟部智慧財產局員工消費合作社印製 -16 - 421764 A7 ___B7________ 五、發明說明(j 〔4〕推測之文字列之顯示方法 <碕先閱讀背面之注意事項"'-寫本頁) 其次,說明以上述方法求得文字列候補之顯示之方法 。圊1 7〜圖2 0,係表示推測之文字列之顯示形態之圖 。都是輸入「大*办町」,顯示推測辨識結果之文字列^ 莰城縣 日立市 太為办町」,但是改變各顯示之位爲其 特徵。 在圖1 7中,於手寫「大而加町」的附近’顯示候補 文字列「莰域縣 日立市 大;加町」之中之「大❖私町 」的部份》在此顯示方法中,有手寫筆跡與辨識結果之候 補比對容易之優點。 而圖1 8係從手寫「大办扣町」之位置附近起,顯示 出「莰城縣 日立市 大石尔町」。在此顯示方法中,由 於手寫文字與候補文字列之頭對齊,所以結果顯示開始位 置很容易瞭解,爲其利點* 經濟部智慧財產局員工消费合作社印製 在圖1 9中,係以手寫之「大;扣町」之位置爲中心 ,顯示出候補文字列「莰城縣 日立市 大办尔町」。在 此顯示方法中,手寫文字與候補文字列之位置,就整體來 看最接近,所以不必移動觀點部可看別全體爲其優點* 在圖2 0中,係使手寫之「大戎和町j之終了位置與 候補文字列「莰城縣 日立市 大而扣町」之最後的文字 之位置對齊,來予以顯示。在此顯示方法中•對於慣用右 手者,在拿筆的手之下不會隱藏有候補文字列爲其優點。 如圖1 7〜圖2 0,各特徵有各顯示方法,但是系統 本紙張尺度適用中國國家標準(CNS)A4規格(210 * 297公釐) -17 - A7 A7 經濟部智慧財產局員工消費合作社印製 B7 五、發明說明(2 也可以決定1個適當之方法,也可以使使用者從複數之顯 示方法中選擇適合自己之顯示方法也可。 又,在圖1 7〜圖2 0中,係將候補文字列中之關鍵 字「大為扣」反轉顯示,使成爲容易瞭解,但是,例如也 使可使用將字型改變等之其它方法。又,也可以不特別地 改變反轉顯示或字型等。 以上,依據本實施例,在輸入地址這樣的階層資料或 定形句子等時,只要輸入關鍵文字,即可推測文字列整體 ,將候補予以顯示•又,可以高速地存取單字字典予以單 字比對,即使是如上述之實施例這樣,單字字典被階層化 ,也可以不論其階層之上位。下位之關係,進行高速存取 〇 依據本發明,只要將關鍵文字以手寫輸入,就會推測 剩餘的文字列,將辨識結果之文字列全體輸出,所以,使 操作方便性大爲提高。 其次,使用辨識被輸入之文字圖案’從被階層化之單 字字典、文字遷移機率表推測未輸入之單字之文字辨識裝 置,藉由輸入製藥公司名、藥品名' 藥品號碼之一部份, 可立刻檢索製藥之處方目的,使用上之注意半項等,或者 由輸入患者的名字的一部份,而可檢索關於患者之病歷、 治療之醫療檢索裝置之使用例。 圖2 3係本發明之一實施例之醫療檢索裝置之機能方 塊圖。 在繪圖板a201上,以描畫筆a209 ’記述文字 本紙張尺度適用中圉國家標準(CNS>A4規格(210 * 297公蜚) --- !--—— — — — — · I I I l· n I ^ — — — — — —— (請先閲讀背面之;i帝?事項H.··..寫本頁) -18 - 經濟部智慧財產局員工消费合作社印製 B7 五、發明說明(j 圖案。被輸入之文字圓案,與事先登錄於辨識字典 a 2 0 2之文字圖案作匹配,將每個被輸入之文字圖案, 輸出辨識文字、候補文字。參照具有包含文字間遷移機率 及文字遷移之單字字典a 2 0 6之候補單字之指示器之遷 移機率表s 204及文字之出現表a 208,以使文字列 之出現機率變高之方式,使候補順位最佳化•同時,求得 最佳化之文字列相當之單字字典中的單字的指示器( a 205)。將以這種方法所求得之單字字典s 206之 單字與候補文字列比對,從單字字典求得相當之單字及其 前後之資訊(s207)。 a 2 1 0係記述本發明之藥劑之處方目的,使用上之 注意事項、副作用、其它藥劑使用時之注意事項之表: a 2 1 1係記述患者之病歷、治療等之表:a 2 1 2係病 院之工作人員(醫生、護士、藥劑師、檢驗技師、清潔工 等)之在院記錄表。 將求得之結果,顯示於LCDa208» 以下,使用圖23、24、25 ,說明輸入藥劑號碼 的一部份,來檢索薬劑之處方目的,使用上之注意事項、 副作用、其它藥劑使用時之注意事項之一實施例。 圖2 4亦薬劑檢索裝置之動作概要圖· 在圖24中,在薬劑輸入區域a 201 ,以描畫筆 a209,輸入藥劑號碼之「TRN」•手寫之筆畫,與 字典a 2 0 2參照,於文字辨識部a 3,輸出第一候補「 TRN」、第2候補「TKM」等《從這些候補文字事先 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) — -19 - I J- I I 1*1 I I I ----it I l· — — — (猜先閱讀背面之注意事項一V 、:寫本頁) 經濟部智慧財產局員工消費合作社印製 42Π6 4 a: B7 五、發明說明(j 被作成之藥劑關係之遷移機率表a 2 〇 4、文字出現機率 表a208 (圖24未表示),可知藥劑輸入區a201 之輸入文字爲「T」—「Rj —「N」爲機率最高,所以 從文字遷移機率表a 2 0 4 ’可知藥劑號碼爲「TRN」 ,而獲得指示器X 4。指示器X 4參照藥劑之單字字典a 204,可知該藥劑爲「卜,而製藥公司爲「 莰城製藥」。 在此說明中,如製藥公司、藥名知道了 *則參照記述 有2 5之藥劑之處方目的,使用上之注意事項、副作用、 其它藥使用時之注意事項之表a 2 0 9,與鋰製藥劑一起 則作用會增強。又,與阿斯匹林一起則作用被減弱等之事 項立刻可知。 在患者名稱區域a201處,以描畫筆a209 ,輸 入患者名稱「一朗」。手寫之筆畫與字典a 2 0 2作參照 ,在文字辨識部a 2 0 3處獲得第一候補「一朗」,第二 候補「一郎」等 •這些候捕文字,從事先所作成之患者 關係之遷移機率表a 204、文字出現機率表a 208 ( 未示於圖24)可知*輸入區域a 20 1之輸入文字爲「 一 j —「朗」之機率最高,所以從文字遷移機率表 a204 ·患者各爲「一朗」而獲得指示器C2。至者, 參照指示器C 2之患者關係之單字字典a 2 0 4 ,可知患 者名爲「山形一朗」,爲內科患者。 更者’醫師’護士只要更新該患者之病歷、治療之記 錄表a 1 〇即可· 本紙張尺度適用中國國家標準(CNS)A4規格<210 X 297公发) — J '-----— I -裝· — ! -^--I I I I 1 ί I I (請先Μ讀背面之注意Μ-項产,-¾本頁) -20 - A7 4 217 6 4 _______B7________ 五、發明說明(j <請先閱讚背面之i意事項H V寫本頁) 在剛在的例子中,係對對患者作說明,但是對於大醫 院的工作人員,例如,醫師 '護士、檢測技師等之記錄、 勤務記錄,也可以同樣地更行。這時,要事先作成職員之 在藉、勤務關係等之單字字典。 此實施例並不只限於大醫院、一般的公司之勤務記錄 也可。 像這樣,只要以手寫輸入薬的一部份、患者名稱之一 部、工作人員名稱之一部份,就可立刻檢索薬之用途、注 意事項、患者之治療記錄等*所以操作之方便性大爲提萵 〇 其次,說明用於圖書檢索系統時之例· 圖2 7係表示圖書檢索系統之構成· 經濟部智慧財產局員工消費合作社印製 圖中,a301爲圖案輸入板,a302爲LCD ( 液晶顯示裝置),a303爲文字辨識,a304爲文字 辨識字典,a 305爲主處理部,a 306爲利用者管理 部,a307爲利用者原薄* a308爲借出之資料· a 3 0 9爲借出處理部> a 1 〇爲圓書檢索處理部, a 3 1 1爲標題檢索處理部,a 3 1 2爲標題遷移機率表 • a 3 1 3爲作者名稱檢索處理部,a 3 1 4爲作者遷移 機率表,a 3 1 5爲配架處理部,a 3 1 6爲配架資料, a317接受處理部,a318爲檢索表作成部, a319爲藏書表,a320爲作者表.a321爲出版 社表,a 3 2 2爲藏書原薄,a 3 2 3爲出版社檢索處理 部,a 324爲出版社遷移機率表,a 325係關鍵字檢 本紙張尺度適用令舀國家標準(CNS)A4規格(210 * 297公釐) -21 - 經濟部智慧財產局員工消費合作社印製 、' A7 ______B7______ 五、發明說明(j 索處理部,a 3 2 6係關鍵字遷移機率表,a 3 2 7係關 鍵字表,a 3 2 8係卡讀取器。 在此圖書檢索系統中,使用者對系統之輸入,係以在 圖案輸入板a 1上以手寫文字等之輸入來進行》而系統對 使用考之輸出,係藉由L CD a 3 0 2之顯示來進行。 以下,說明本圖書檢索系統之動作· 當本系一起動,則主處理部a 3 0 5,將選單顯示於 LCDa 302 ·本圖書檢索系統準備有借出/圖書檢索 /配架導引之選單•作爲圖睿館使用者之選單,準備有利 用者管理/接受之選單,作爲圖書館之管理用者之選單· 當使用者選擇了借出選單,則主處理部a 3 0 5,將 借出處理指示借出處理部a 3 0 9,借出處理I係利用者 借書或借書預約時所使用之選單。借出處理部a 3 0 9, 係介由主處理a 3 0 5將適當之訊息顯示於LCD a 302,藉此,催促使用者,將事先所發行之使用者卡 片,以讀卡器a 3 2來讀取,獲得使用者號碼•將設號碼 交給使用者管理部a306。使用者管理部a306 *與 使用者原薄比對,進行確認於使用者號碼是否登錄爲可借 出者之情況,同時,將現在的借出狀況、預約狀況等關於 該使用者之利用資訊,從利用者原薄a 3 0 7讀出,交到 借出處理部a309。利用者原薄a307,登記著各使 用者號碼之利用者姓名、地址、連絡處等、及其它圖之利 用狀況等。 借出處理部a 3 0 9,如果於利用者管理部a 3 0 6 本紙張尺度適用中國國家標準(CNS)A4規格(210X 297公釐〉 I d I 1 I*— J 1 蒙 I I — · I I I l· I! 3 (請先閱讀背面之;i意事項Η '寫本I) -22 - B7 B7 經濟部智慧財產局員工消f合作社印製 五、發明說明() 20 無法確認使用者,會將請連絡管理者之訊息顯示於L C D ,處理於此中止。又,配合使用者資訊,將過期之借出書 籍之催促或預約狀況之介紹等顯示於L CD a 3 0 2。又 ,借出處理部a 3 0 9,在可確認使用者時,以對話方式 ,接受使用者之圖書之借出或借出預約之登記,將此登記 於借出資料a 308。借出資料a 308,係記錄各圖書 之借出狀況之資料。 其次,當配架導引選單被選擇時,主處理部a 5 ·將 配架導引處理指示配架處理部a 3 1 5。配架導引處理, 係導引使用者該書之位置之處理。配架導引處理部 a 3 1 5,係當利用者指定想找之圖書時·則從配架資料 a 3 1 6,讀出記錄各圖書之配架狀況之資料,如圖2 8 之W 4所示,各圖書之位置,藉由詢問借出處理部 a 3 0 9可得,將於圓書之借出狀況等之簡單介紹一起介 由主處理部a305顯示於LCDa302 >又,配合需 要,顯示詳細內容。 其次·當使用者管理選單被選擇時,主處理部a 3 0 5,將利用者管理處理指示利用者管理部a 3 0 6, 利用者管理處理,係進行未登錄之利用者之新登錄處理· 在此處理中,利用者管理部a 3 0 6 *催促圖書之管 理者,獲得管理者登錄號碼,進行管理者之確認。如果無 法作管理者之確認,則會出現請連絡管理者之訊息,然後 將處理於此處中斷。如果可以確認管理者’則接受未登錄 之使用者姓名、地址等之個人資料之輸入’配給使用者號 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公发〉 I ----1-------· I ---„--— —訂·!!· (請先閱讀背面之注意事項* 寫本頁) -23 - 經濟部智慧財產局具工消費合作社印製 A7 B7 五、發明說明(2]) 碼,然後登記於利用者原薄a 307 »這時’也可以發行 利用者卡片。 其次,當接受選單被選擇時,主處理部a 305 ’對 接受處理部a 3 1 7指示進行接受處的。 接受處理,係進行對未登錄之圖書作爲新藏書而予以 登錄之處理。 接受處理部a 3 1 7,係當接受了圚書館之管理者來 的新藏書之圓書標題、作者名、出版社等之書籍資訊’及 管理者所給予該圖書之關鍵字所構成之圖書資料,則將其 交給檢索表之作成部a 3 1 9。檢索表作成部a 3 1 8, 接收了圖書資料,則將克登記於藏書原薄a 3 2 2,同時 ,接著,或於適當時期,依據藏書原薄所記錄之圖書資料 ,更新標題遷移機率表a 3 1 2、作者遷移機率表 a314、出版社遷移機率表a324、關鍵字遷移機率 表a326、藏書表a319、作者表a320、出版社 表a321,關鍵字表a327之內容。 圖29係表示藏書原薄a322之構成。 如圖所示,於藏書原薄a 3 2 2登記者對應該各圖書 識別號碼之藏書號碼之標題、作者、出版社、關鍵字之項 目之資料· 其次,於圖3 0表示藏書表a 3 1 9、作者表a 320、出版社表a321之構成。 藏書表a 3 1 9 ’係將與藏書原薄a 3 2 2相同之資 訊,作成適於檢索之形態。藏書表a 3 1 9 ,係將對應於 本紙張尺度適用中园國家標準<CNS)A4規格(210x297公爱) I J I I !| I I I I · . I l· I I I 訂----— II <請先Μ讀背面之注意事項* _寫本頁) -24 - 經濟部智慧財產局員工消費合作社印製 421764 at ____B7______ 五、發明說明() 22 藏書號碼之標題、作者號碼、出版社號碼、關鍵字號碼予 以保持。 又,作者表a 3 2 0,係對作者名稱給予一作者號碼 ,記錄著對應於各作者號碼之作者名稱及該作者之圖書之 藏書號碼*又,出版社表a321,係對出版社給予一出 版社號碼*記錄著對應各出版社號碼之出版社及該出版社 所發行之圖書之藏書號碼。 又,此處,關鍵字表a327之構成,係省略圖示, 但是*關鍵字表a 3 2 7係對關鍵字分配一關鍵字號碼, 對各關鍵字對應著關鍵字及該關鍵字所給予之圖書之藏書 號碼之表。 又,此處,對於藏書號碼,標題幾乎爲1對1,所以 ,在藏書表a 3 1 9 *於藏書表3 1 9之各項目之中,只 有標題係將標題資料直接記述而構成者,但是,另外設置 對應標題號碼及標題及藏書號碼之表,在藏書表a 3 1 9 上將標題號碼記錄上,以代替標題|如此也可》 其次,以圖3 1表示標題遷移機率a 3 1 2之構成 。作者姓名遷移機率表a 3 1 4、出版社遷移機率表 a324、關鍵字遷移機率表a326 ·也具有與圖示之 標題遷移機率表a 3 1 2相同之構成。 更且|在標題遷移機率表a 3 1 2,保持著全藏書之 標題所包含之各文字之出現次數及文字間之遷移次數及包 含文字間之各遷移之圖書藏書號碼。圖之最左側1 0 1〜 1 0 5,係表示於全藏書之標題之中,「0」出現2 7次 I J------II---- ·!Γ— — — 訂--------"5^ ί請先闇讀背面之注t事項声寫本頁)
經濟部智慧財產局員工消費合作社印製 421764 a: ________B7_________ 五、發明說明(j 、「只j出現108次、「夕」出現250次之名文字之 出現次數。將該出現次數以全部之文字數去除,則爲其文 字之出現機率。又,圖左起第2列之1 10〜1 17,係 表示例如於¾シ* 101相連之110,在之後* y"出現次數爲10次者:介由與101相 連之1 1 1 ,係於•之後出現次數爲17次者 ,像這樣表示2文字間之遷移次數者。該次數以前側之文 字之出現次數來除,即爲其文字之遷移機率。又•圖中 1 2 1〜1 3 5 ,係表示將藏書號碼例如'之文字 間之遷移次數1 1 0直接或間接連接之1 2 1〜1 2 3, 其藏書號碼B i 、B j + a、B j之圖書係將連接之文字 間之遷移次數所對應之文字遷移¾シス,含於其標題中之 情況。又,圖中ilNul1#係表示連接之終點· 但是,標題遷移機率,也可以用3 2這樣來表示。 在此構成,係適用於記錄標題之讀出假名(日文)或 英文之情況時。即,圖3 2之構成係考量讀取假名之片假 名或平假名文字有7 0字左右之情況,可比圖3 8之構成 更有效率地登錄出現次數或遷移次數或藏書號碼者· 以下,說明於單選中當圖書檢索選單被選擇時所進行 之圖書檢索處理。 在圖2 7中,於選單中當圓書檢索選單被選擇,則對 圖書檢索處理部a 3 1 0,指示圖書檢索處理* 在圖3 3係表示此圖書檢索處理之處理頤序· 如圖所示,在此處理中,首先利用順序P 1 *指定使 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ----------— I— * - I - K--I - 1111111 <請先閱讀背面之注意事項戶'寫本1> -26 - 經濟部智慧財產局員工消費合作社印製 __________B7________ 五、發明說明(j 用者•這是與借出處理部a 3 0 9所說明之使用者之確認 相同地進行,如果無法確認使用者,則會顯示請連絡管理 者之訊息於L CD a 3 0 2,然後在此處中斷處理。但是 ,即使是無法確認使用者時,也還是當成客人處理’利用 以下之赙序P 2繼續進行處理也可*另一方面,如果可確 認使用者時,則進入順序P 2 · 在下一個順序P 2中,利用者給予檢索之關鍵字及各 關鍵字之權值。即,在LCDa 30 2上顯示圖34之視 窗W1 ,在視窗W1之檢索鈕被按押時,在各項目利用者 所輸入之文字列,作爲被關鍵字之項目之關鍵字’而被接 受。作爲各項目之關鍵字而使之文字列•係可接受複數者 :利用者可藉由在文字列間輸入空白鍵*來指定文字列之 區隔。又,這時•在本實施例,由於係使用手寫介面,所 以,將L CD a 3 0 2上所顯示之圖3 4之視窗W2之相 當於各項目之框內之圖案輸入板a 3 0 1上之位置以手寫 輸入之文字作辨識,將辨識結果•顯示於視窗W1之項目 框內之遊檫位置》 又,各關鍵字之權值,係當各項目之框中輸入文字列 時,顯示各文字列之權值輸入視窗W4,對於該權值输入 視窗W4之來有使用者之輸入•而被接受處理。如果沒有 輸入時,當作權值1處理。當權值輸入權值輸入視窗W4 後(如果其它的文字列之輸入如果開始了),藉由() 內之顯示,對於各文字列所輸入之權值作一顯示。又,也 可以設定作爲關鍵字之各文字列之優先順序•來代替權值 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公蹵) -----'---1----裝-----^----訂-----線 <請先«讀背面之注意事項Λ,..寫本頁) -27 - A7 B7 421764 五、發明說明() 25 此處,作爲這樣的檢索關鍵字之各文字列之權值,也 可以例如藉由使用者對檢索關鍵文字列是確定地記著或摸 糊不消者,來使利用者附予權值•即,權值係例如當相要 檢索之標題中之單字確定地記著時,將該單字作爲檢索關 鍵文字列,而給予高權值,如果想檢索之標題中之其它單 字只模糊地記著*則對於該單字,給予作爲探索關鍵文字 列之小權值•又*權值或優先順序,也可以預先對每個預 設定正確值,當沒有使用者之設定時 > 就使用此值。正確 值只有資料庫設計者或圚書管理者可以設定* 在圖3 4中,係標題項目之|介面,之檢索關鍵文字 列之權值爲1, |設計',作者項目之^橫田 <>爲1者。 在圖3 3之Ρ3〜Ρ 5中,圓書檢索處理部a 3 1 0 1係將文字列之有輸入之各項目之檢索|對各項目所對應 之各檢索處理部(標題檢索處理部a 3 1 1 、作者姓名檢 索處理部a313、出版社檢索處理部a323、關鍵字 檢索處理部a 3 2 5 )作指示(在圖中只表示3標題檢索 處理部a311,作者姓名檢索處理部a313)。例如 ,在順序P 2,在標題項目如果有文字列之輸入時,將被 輸入各文字列之檢索,對標題檢索處理部a 3 1 1作指示 。但是,如果在P 2中,如果於視窗W1之項目不定的項 目上有文字列輸入時,將被输入之各文字列之檢索’指示 所有的檢索處理部(標題檢索處理部a 3 1 1 ’作者姓名 檢索處理部a 3 1 3、出版社檢索處理3 3 2 3 '關鍵字 ^紙張尺度適用中圉國家標準(CNS)A4規格(210 X 297公釐) I J I I —.1 — — — — — — — -Jill· — — — ^ ·111!1111 (請先閱讀背面之注意事項* 寫本頁) 經濟部智慧財產局員工消費合作社印製 -28 - 42176 4 A7 B7__________ 五、發明說明() 26 撿索處理部a325)進行。 以下,各檢索處理部(標題檢索處理部a 3 1 1 ,作 者姓名檢索處理部a 3 1 3、出版社檢索處理部a 2 3、 關鍵字檢索處理部a 3 2 5 )所進行之檢索中,以標題處 理部a 3 1 1所進行之檢索爲例作一說明· 標題檢索處理部a 3 1 1,利用P4,進行P4所指 示之檢索文字列之檢索•各文字列之檢索如下。 即,在此檢索*參照標題遷移機率表a312,求得 文字列與標題之文字間遷移之一致數之遷移一致度爲上位 之圖書之藏書號碼。或求得遷移一致度不爲0之所有的藏 書號碼。 例如’作爲關鍵而輸入之介面^及標題v 夕一 7工_只之設計技術J之遷移一致度,爲彳 —y .......-»"只之合計7次’與標題「7 U _ t才: > 夕一 7二一只」之遷移一致度,爲夕一一...........只之5次 ,與標題「妇庭之設計」之遷移一致度爲0次。而如果求 遷移一致度不爲0之所有藏書號碼時,成爲求得標題「7 yvシy>r >少_7二一只®設計技術」之圖書藏書號碼 及標題「V U t> 夕一 7二一只」之圖書之藏書號碼 〇 具體地說,在圖3 1之標題遷移機率表a 3 1 2中1 抽出作爲關鍵之文字列中所包含之每2文字之文字遷移所 連接之藏書號碼|使各藏書號碼之出現數,作爲其藏書號 碼之圖書之標題及作爲關鍵文字列之遷移一致度,求得遷 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐〉 --Γ--Ii 111 — · — - · I I I l· I 訂!!11· <^ <請先閱讀背面之注意事項A .寫本頁) 經濟部智慧財產局員工消費合作社印製 -29 - 經濟部智慧財產局員工消費合作社印製 421T64 at 一 B7 五、發明說明(j 移一致度爲4位之藏書號碼或遷移一致度不爲0之藏書號 碼•例如作爲關鍵文字列者爲tシ只© ^ ,則對於文字列 所包含之文字遷移— ,圖31之藏書號碼Bk、
Bk+1(124、125)被抽出,對於文字列所包含 之文字遷移,藏書號碼Bk、Bi+l被抽出 ,被抽出之藏書號碼B k之遷移一致度爲2次,藏書號碼 Bk + 1、B i +1之遷移一致度爲1次· 像這樣,如果藏書號碼求得了,則標題檢索處理部a 3 1 1 ,將各文字列所求得之藏書號碼之清單•與求得之 遷移一致度一起,交給圖書檢索處理部a 1 0,作者姓名 檢索處理部a313,出版社檢索處理部a323、關鍵 字檢索處理部a 3 2 5也進行同樣的處理· 在圖33之順序p7中|圖書檢索處理部a310, 將標題檢索處理部a 3 1 1 |作者姓名檢索處理部a 313 ,出版社檢索處理部a323 ,關鍵字檢索處理部 a 3 2 5所傳來之對作爲關鍵之各文字列所檢索之藏書號 碼之清單所包含之藏書號碼•依據各藏書號碼所求得之遷 移一致度及對於各文字列剛才使用者所輸入之權值•予以 換排列,將對應藏書表a319 ,作者表a320,出版 社表a 3 2 1、關鍵字表a 3 2 7所求得之各藏書號碼之 圖書資料|以改排列後之藏書號碼之排列,介由主處理部 a305 ,顯示於圖35所示之LCDa302。此改排 列係如以下這樣進行。 例如,如果沒有設定權值或優先順位,而只對1個項 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) --;---.-------I i I I l·---^*· I —---II (請先閱讀背面之注意事項¾寫本頁) -30 - A7 421764 _____B7_—__ 五、發明說明(j 目以1個文字列作爲關鍵字來設定時,以獲得之遷移一致 度之順序排列。又,如果權值或優先順位沒有設定,而只 對1個項目,以N個文字列作爲關鍵字來設定時,各圖書 之N個的遷移一致度之總和、或積、或其它的函數之變換 結果,以大的順序排列•又,如果權值或優先順序沒有設 定,對於K個項目,以Μ個文字列作爲關鍵字設定時,以 獲得Κ個xM個之遷移一致度之總和*或積或其它的函數 之變換結果之順序排列β這時,對合對應之文字列之長度 而求得之遷移一致度上給予權值|然後求得各遷移一致度 之總和或其它函數之變換結果•以其大的順序排列也可。 又,例如,項目標題之關鍵文字列,項目作者姓名之 關鍵文字列之順序,設定優先順序時•以標題檢索處理部 a 3 1 1所求得之遷移一致度之大者在上之方式,將藏書 號碼重排,之後,標題檢索處理部a 3 1 1求得之遷移一 致度爲相同之中,作者名稱檢索處理部a 3 1 2所求得之 遷移一致度之大者在上之方式*將藏書號碼重排* · 這時,在標題檢索處理部所求得之作者名稱檢索處理 部a 1 2所沒有求得之藏書號碼之作者姓名檢索處理部a 3 2所.求之遷移一致度當作0。對於每一項目,複數之文 字列當作關鍵字而設定者也同樣地處理•進行遷移一致度 及優先順序之重排。 又,例如,作爲項目標題之關鍵之文字列 ' 介面#之 權值爲2,項目標題之關鍵文字列之•設計之權值爲 1 *項目作者姓名之關鍵文字字1橫田#之權值爲1而設 -31 - --:---------- ·裝--I--r I--訂·! <請先W讀背面之注意事項,®骂本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS)A4規格(210x 297公釐) 421764 五、發明說明(d 經濟部智慧財產局員工消費合作社印製 定 時 1 像 以 下 這 樣 求 得 權 值 遷 移 — 致 度 9 以 大 者 在 上 之 方 式 > 重 排 藏 書 號 碼 〇 以 下 之 1 V > 係 表 示 以 標 題 作 者 姓 名 、 出 版 社 之 順, 序 所 示 之 圖 書 資 料 > 及 其 附 有 權 值 遷 移 —- 致 度 之 求 法 〇 i Ύ y V シ V y 夕 一 X 一 設 計 技 術 橫 田 他 Y Η G 社 : 與 吖 > 夕 — X 一 之 遷 移 — 致 度 —► y 等等» … … —> : 7 次 與 % 設 計 fr 之 遷 移 一 致 度 設 —> 計 ; 1 次 與 橫 田 • 之 遷 移 — 致 度 ; 橫 —^ 田 ; 1 次 附: 有 權 值 遷 移 一 致 度 ; 7 X 2 + 1 + 1 1 6 i i • 曰 立 fi 今 > 夕 — 工 — 橫 田 他 $ >; 堂 與 y 9 — 7 工 — 之 遷 移 — 致 度 —► y … … … — : 7 次 與 設 計 # 之 遷 移 一 致 度 設 —> 計 : 0 次 與 % 橫 田 之 遷 移 — 致 度 ; 橫 田 : 1 次 附 有 權 值 遷 移 — 致 度 7 X 2 + 0 + 1 = 1 5 i i i y Ύ y Λ > 夕 J- — 只 (D 最 適 SOi άΧ 計 山 田 他 曰 本 館 : 與 % > 夕 — X 一 之 遷 移 一 致 度 —► > … … 一 ; 5 次 與 設 計 m 之 遷 移 — 致 度 ; 設 計 : 1 次 與 % 橫 田 縛 之 遷 移 一 致 度 ; 橫 分 田 ; 0 次 附 有 權 值 遷 移 — 致 度 5 X 2 + 1 + 0 1 1 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) I J I I ---------裝 ilIJ---- 訂 -------線 (請先閲讀背面之泫意事項芦:寫本頁) -32 - 42176 4 A7 _______B7 五、發明說明() 30 1 1 / · 一 b V 夕 — 7 X — 夕 — 著 Li 子 © 童話社 • 與 y 夕 一 工 一 之 遷 移 一 致 度 ; 夕 —¥ — … … l»t — —只: 5 次 與 '設 .計 Μ 之 遷 移 __. 致 度 ; 設 — 計 0 次 與 '橫 田 袢 之 遷 移 一 致 度 橫 —> 田 0 次 附有權 值 遷 移 — 致 度 : 5 X 2 + 0 + 0 = 1 0 1 J . 朽 庭 CD 設 計 > 橫 田 太 郎 大 邸 宅 社 與 y 夕 — 工 一 摩 之 遷 移 一 致 度 ; 0 次 與 (設 計 • 之 遷 移 一 致 度 * 設 計 ; 1 次 與 m 田 <r 之 遷 移 一 致 度 · 橫 —► 田 ; 1 次 附有權 值 遷 移 一 致 度 ; 0 X 2 + 1 + 1 = 2 以 上 » 係 以 利 用 者 所 輸 入 之 文 字 列 作 爲 關 鍵 字 之 檢 索 結果顯 示 實 現 之 情 況 〇 在 圖 3 3 之 圖 書 檢 索 處 理 ♦ 不 只 是 在 L C D a 3 1 2 {請先閱讀背面之注意事項声‘寫本頁) 經濟部智慧財產局員工消費合作社印製 顯示檢索結果*從利用者所顯示之檢索結果之中選擇圖書 ,而使利用選擇之圖書之配置導引處理或借出處理成爲可 能。 即,在P 5顯示之圓書清單中*特定圖書被選擇,則 將此圖書之配置導引處理之實行,委託配架處理a 3 1 5 。接受依賴之配架處理a 3 1 5 ’實行以圖書之上述配置 導引處理,如果,還有借出預約要求被使用者輸入時(P 10),將關於此圖書之借出處理委託借出處理部a 309 »接受了委託之借出處理部a309 ’係實行關於 本纸張尺度適用中國國家標準(CNS)A4規格(210 * 297公釐) -33 - 經濟部智慧財產局員工消費合作社印製 42H64_^___ 五、發明說明(31> 比圖書之上述借出處理,將處理回到圖書檢索處理部a 3 1 0。藉由借出處理部a 3 0 9,回來處理時,及在 p8de圖書沒有被選擇時,圖書檢索處理部a3lO, 從利用者接受終了撿索或繼續檢索之指示,要終了時,係 將處琿終了,要繼續時,係反覆P2之處理。 以上,說明了本實施例之圓書檢索系統。 又,在以上之說明中,除了檢索對象之項目(標題, 作者名稱、出版社、關鍵字)之外,準備了各檢索處理部 及各遷移機率表類,但是•對於2個以上之項目,也可以 擁有1個檢索處理部及表類,例如,對各項目之讀出假名 之檢索等,共通地擁有表時,則記億體尺寸可縮小。 又,不特別因那一項目而進行檢索時* (1)準備各 項目共通之檢索處理部及遷移機率表,藉此進行各項目共 通之檢索,(2)對所有的項目進行探索。可用其中任何 一方法進行。這時,遷移一致度、權值或優先順序進行重 排,然後顯示檢索結果。 又,各遷移機率表(標題遷移機率表、作者姓名遷移 機率表、出版社遷移機率表'關鍵字遷移機率表),也可 以用以下之方式構成。 即,西洋書等之圖書資料爲英文時,英文足以每個單 字來區隔*所以,以下述之構成比較有利。 即*對應單字號碼、單字、包含該單字之圖書之藏書 號碼之單字表*係構成與作者表a 3 2 0相同者,又,對 應(文字遷移、單字號碼)之單字文字遷移表,係構成爲 良紙張尺度適用中國國家標準(CNS)A4規格(210 * 297公爱) 1 J I I -----11111¾^--I--rlj — ^* — — — — — 1— (請先閱讀背面之注意事項> 罵本頁) —34 - 4 2 口 6 4 a- _ - _ B7 經濟部智慧財產局員工消費合作社印製 五、發明說明() 32 與圖3 2之標題遷移機率表a 3 1 2相同者,更者,以此 爲本從關鍵文字列之文字遷移,求得單字號碼及遷移一致 度,更者,設置以此爲本,求得藏書號碼及一致度之單字 檢索處理部之構成也可。 或各遷移機率表(標題遷移機率表、作者姓名遷移機 率表、出版社遷移機率表,關鍵字遷移機率表),也可以 如下構成》 即,標題遷移機率表a312,係由對應(單字遷移 ,包含該單字遷移之藏書號碼)之標題表,及對應(文字 遷移、單字號碼)之單字文字遷移表所構成,標題檢索處 理部a 3 1 1 ,由以這些表爲基礎從關鍵文字列之文字遷 移,求得單字號碼及遷移一致度,更者,以此爲基礎,求 得藏書號碼及一致度而構成者也可。標題以外的項目,也 可以這樣地構成。又,這時,單字表可爲每項都有*也可 以是各項目共通擁有· 又,在上述之說明中,係直接對各遷移機率表(標題 遷移機率表、作者姓名遷移機率表、出版社遷移機率表、 關鍵字遷移機率表)記錄藏書號碼*但是,各遷移機率表 ,例如,作者姓名遷移機率表a 3 1 4,先登記包含各文 字遷移之作者號碼,以代替包含文字遷移之作者姓名之圖 書之藏書號碼,對應於此之藏書號碼,係以檢索作者表a 3 2 0而獲得者也可· 又,在以上說明中,記錄於各邊移機率表(標題遲移 機率表,作者姓名遷移機率表、出版社遷移機率表、關鍵 I 4 I I 1·1 t ! I I 1 I t · II I Γ I I I ^ illllllf (請先Μ讀背面之注意事項* 寫本頁} 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -35 - 經濟部智慧財產局員工消費合作杜印製 Α7 Β7 五、發明說明() 33 字遷移機率表)之文字之出現次數、或文字間之遷移次數 ,雖沒有像上述這樣用於一致度之算出,但是,例如,作 爲關鍵文字列所包含之文字遷移之中,上述之遷移機率小 之文字遷移包含於標題中時,可以使具有該棟題之圖書之 遷移一致度更高也可。遷移機率較小之文字遷移,即很少 的文字遷移,與遷移機率大即到處都有之文字遷移相比, 表示出標題之固有特徵所致。 又,在以上之實施例中,對於附有權值之遷移一致度 低之圖書資料•可從顯示對象中省略。或*依照附有權值 遷移一致度之順序,只以規定數之圖書資料作爲顯示對象 也可》 如上所述,依據本實施例之圖書檢索系統,依據對複 數之關鍵字所設定之權值或優先順位,可以將檢索結果重 排顯示|所以,利用者可以用更符合撿索意圖之形態,而 得到檢索結果。 如上所述,本發明可提供以更照利用者之檢索意圖之 形態,進行檢索或檢索結果之提示之檢索系統· 其次,將使用者一般所使用之多項目之資料庫•以只 附加項目之屬性等各項目之檢索方法之單純資訊*作簡單 模糊檢索之方法作一說明。使用者|對多項目資料之各項 目,指示(1)檢索/不檢索,(2)項目間之優先順位 ,(3)項目之屬性。藉此,汎用檢索系統,自動地作成 模糊檢索用之文字遷移索引資料,進行依據文字列之一部 份錯誤或靥性之意思模糊(例如:顏色:青水色、紺、 本紙張尺度適用t國國家標準(CNS)A4規格(210 * 297公芨) 1 -7 I ί —--- I - · 1! l· ! I 訂·! (請先W讀背面之注意事項>4'寫本I ) -36 - 421T64 A7 B7 五、發明說明( 青-»水色、樹),東西:才uyi? —卑一 7*/1/才卜>夕、 石扣九(柳丁 —葡萄柚、橘子),之檢索·本實施例係表 示〔1〕使用同義詞等之類似表之模糊檢索,[2〕包含 畫像資料等之非標準資料(檢索對象外資料)之多項目資 料之模糊檢索,〔3〕文字遷移-單字索引之模糊檢索之 3例。 經濟部智慧財產局員工消費合作社印製 C 1 ) 在 ,可進 色、紺 k y夕 圖 說明。 ,上述 典S 〇 補文字 S 0 〇 移,與)so 。包含 引,到 候補文 所以, 使用同義字 本實施例, 行容許依據 (青—水色 ' * 如 Λ/ ( 1係表示本 利用圖案輸 筆畫,在文 0 3之比較 (複數文字 4,被分解 文字遷移索 0 5比對, 特定之文字 時可存取多 字列被分解 即使從圖案 之模糊 具有每 屬性之 、紺) 柳丁、 發明之 入板S 字辨識 ,作文 )•在 或2文 引作成 如果有 遷移之 項目資 成文字 輸入板 檢索 1個資料之屬性之類似表1藉此 意思模糊(例如;顔色:青—水 ,東西: 葡萄柚* 一實施例 0 0 1, 部S 〇 0 字辨識I 辨識結果 字之組( 工具所事 被登錄, 資料地址 料庫S 0 遷移,以 S 0 0 1 橘子) 之構成 手寫筆 2,藉 得到候 最佳化 文字遷 先作成 則成爲 |被記 0 6 〇 文字遷 所輸入 之檢索* 圖。簡單 畫被輸入 由與文字 補文字。 及資料推 移)。各 之文字遷 候補之文 載於文字 在以上之 移單位査 之文字列 地作一 *於是 辨識字 上述候 測部 文字遷 移索引 字遷移 遷移索 處理, 索引* 或文字 1 4 I I —i n I I I i I - i I I l· I I I ^ « — — — — — — II (請先閱讀背面之注意事項声寫本頁) 各纸張尺度適用中囷國家標準(CNS)A4規格(210 X 297公《 ) 37 421764 A7 ---- B7 經濟部智慧財產局員工消費合作社印製 五、發明說明() 35 辨識S 〇 〇 2之結果有錯誤,也可作爲項目之資料之檢索 〇 更者,爲了求得與被輸入之資料意思相近之資料,從 多項目資料之中取出者,被傳送到類似資料推測部 S007。取出之資料,係如屬性定義表之定義,與符合 項目屬性之類似表比較,求得與取出之資料類似之資料· 類似之資料,再被傳送到資料推測部S 〇 0 4,可對包含 類資料之多項目資料庫S 〇 〇 6之資料之到進行存取· 藉此,可檢索包含從圖案輸入板S 〇 〇 1所输入之文 字列之資料,及接近於資料意思之資料。其次,依據資料 庫優先定義部S 〇 1 1之定義,求得所求之資料之優先度 。而,依據檢索結果顯示範圍定義部S 0 1 2之定義*從 求得的資料之中,依據優先度高之順序,階段地顯示於 LCD S013 ,在容許模糊度之檢索,檢索上所取出 之資料數變多,但是,藉由這樣地將優先度高之物開始階 段地顯示,而可使利用者很容易地從檢索結果選出該當者 〇 以上係使用表示同義詞之類似度之類似表,容許意思 模糊度之汎用模糊檢索之構成、動作概要作說明》 其次,將圖3 6之記載之表示概要以圖3 7表示,說 明其表之內容* S 0 0 3係文字辨識字典,例如,使文字圖案與其文 字符號對應,而記億。 S 0 〇 5係文字遷移索引表•使文字遷移(2文字 (讀先W讀背面之注意事項声、寫本頁) 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公笼> ____ 一 38 - 421764 A7 經濟部智慧財產局員工消費合作社印製 _____B7____五、發明說明() 36 三組)與包含該文字遷移之多項目資料庫之地址成對而予 以記憶。這是當作檢索多項目資料庫時之索引來用的。又 ,索引表係檢索用索引作成工具將多項目資料分解或2文 字之組(文字遷移)等,自動地作成 S.0 06係多項目資料底之例*在此例中,爲No , 1 「商品名」、N〇2 「尺寸j 、N〇3「價格j之3項 目之資料。 S 0 1 4係檢索對象指定表,從多項目資料庫S 0 〇 6項目中,指定成爲檢索對象者。之所以要設此表,係在 多項目資料庫中,畫像資料或音樂資料等文字之模糊檢索 不想成爲對象之資料被含有時,明白表示想檢索者及不想 檢索者。在此例中,係對No . 1 「商品名」' N 〇 . 2 「尺寸」、No 3 「價格」3項目全部作檢索對象· S 0 〇 1 5係屬性定義者。本表係表示多項目資料庫 S 0 0 6之各項目資料爲如何性質之資料。在本模糊檢索 中,從該屬性定義表所明示之屬性*參照合於屬性之類似 表,於各項目之資料,可求出意思相近之資料。 S 0 〇 8係類似表之一例,在此例中,係對於「尺寸 j之類似度作表現•表係記載著「尺寸j及其「基準值j 。此基準值之差小的尺寸同表,表示相類似。 S 0 0 9也是類似表之一例,在此例中,表現「商品 名」之物品等一般物品之類似度。此處,表現一般東西之 類似度之代表性之表,係利用「同義詞」·同類詞係如圖 所示將東西及與其相關之東西,分成上位階層及下位階層 — I II — - --II - ^ I------I <請先閲讀背面之注意ί項144寫本頁) 本紙張尺度適用令國國家標準(CNS)A4規格(210 X 297公爱) -39 - 421764 五、發明說明( 來表示。以階層連繫,階層間愈近表示愈相近。 (請先聞讀背面之注意事項声寫本頁> S008、S009係表示靥性爲「尺寸」及「同義 詞」之類似表之例’類似表還可以表示屬性「顏色」之類 似性者,或「明暗」「非常細」.........等各種屬性者(關 於「奪色」之類似表,在第2個實施例作說明)。 又,對於屬性,也有如「數值」等,不用特意準備者 ,即可明白類似性者•對於這樣的屬性•可以不設類似表 S 0 1 1係資料庫優先順序定義表。檢索結果 '完全 —致者是沒有的,例如*某資料其「商品名」一致,別的 資料,「尺寸」一致。這時,「商品」一致之資料與r尺 寸」一致之資料之中,那一個資料優先表示等之半項先予 定義,藉此,接近使用者所需要之資訊之物,可優先被表 示· 經濟部智慧財產局員工消費合作社印製 進行容許模糊度之檢索,則一般可獲得多數之候補· 如果將多數之候補一次顯示,則可能使選擇候補變的困難 。爲了使這樣的問題點消失’從優先度高之檢索結果起, 優先度低之檢索結果,階段地顯示即可· S 0 1 2係檢索結果顯τκ範圍定義表。在此例中,於 檢索結果顯不範圍定義表上,將「顯示階段」及各階段所 顯示之資料與輸入一致到什麼程序之「一致度」予以對應 記載。在此例中,將顯示階段以「一致度」分開,但是, 除此之外’以檢索結果之「個數」分開,或「不同度」等 分開也可11 本紙張尺度通用中國國家標準(CNS)A4規格(210 X 297公爱) 40 B7 五、發明說明(j (請先閲讀背面之注意事項乒寫本頁) 以上,係使用圖3 7之模糊檢索所用之表作說明。一 般而言,多項目資料庫S 0 0 6或檢索對象指定表 s 〇 1 4、資料庫優先順序定義SO 1 1 、屬性定義表S 〇15,係使用者定義,類似表S008、S009,係 事先系統準備*同義詞現在一般被使用,所以,可簡單地 被使用》 其次,使用圖3 8說明模糊檢索之處理流程。 經濟部智慧財產局員工消費合作社印製 從圖案輸入板S001 ,輸入手寫文字「才k'/fj 。於是*文字辨識部S 〇 0 2對手寫文字進行文字辨識, 而得到辨識結果之候補文字「第一候補:才、第2 候補:才(S021) •這些候捕文字,個以2 文字組合,而得如S 0 2 2這樣的候補文字遷移。這些候 補文字遷移,與文字遷移索引S 0 0 5作比較,如果登錄 於文字遷移索引•則取得包含該文字遷移之資料之地址( S023)。在圖2例中,「才—yj兩方 都以003 . 1之索引被登錄。如「才—レJ及「レ —> 」這樣,以同樣地003.1之索引,夾著繫著, 組合、地址003作爲有候捕。 更者,如果參照多項目資料庫S 〇 〇 6之地址0 0 3 ,則可立即獲得「才L . 180 (柳丁,L · 180)」之資料。在上面,獲得接近手寫輸入文字「 才レ>テ」之資料r才レ>^シ·L·180(柳丁L 18〇)j 。但是,更者,可探索接近「才柳丁 〕」之意思之資料*看屬性定義者S015,則「才|^> 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公爱) 41 421764 Α7 --- Β7 五、發明說明(d 經濟部智慧財產局員工消費合作社印製 j 取 出 之 Γ 才 > j ( 具 有 同 義 詞 ( S 0 0 9 ) 之 才 y j 之 項 @ * 則 厂 才 厂 * b 類 J ( 橘 子 類 ) J 0 0 9 ) 之 厂 * λ/ 類 j 之 概 念 > 除 了 Γ 才 y j 之 J 〇 於 是 t 以 厂 * hj j 作 S 0 2 4 相 同 之 方 法 1 得 到 庫 S 0 0 6 之 資 料 0 0 1 厂 Μ • 1 6 0 ) j C 而 對 於 這 樣 被 檢 索 之 資 相 近 等 , 計 數 與 手 寫 輸 入 文 0 在 園 之 例 中 * 0 0 3 厂 才 入 文 字 ♦ 與 優 先 度 最 高 之 商 1 0 0 0 3 0 0 0 點 « 0 係 由 於 作 爲 商 品 名 之 類 似 資 顯 示 係 於 顯 示 範 圍 定 義 1 0 0 0 點 以 上 第 二 階 段 1 階 段 顯 示 0 0 3 厂 才 L • 1 8 0 元 J • 如 果 > 使 指 示 y 則 第 二 階段 t 也 顯 示 巧 ( 橘 子 • Μ • 1 6 0 元 ) 以 上 係 本 實 施 例 之 處 理 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公发) S 〇 0 3 . 1 ).即商品名, 靥性•而,看同樣詞之「 之上位概念’記載者 。於是,再看同義詞(S 項目,則「為办九類J之下位 外’記載著「办扣九(橘子) 爲候補,以與上述S002〜 包含「❖扣4」之多項目資料 戎扣九·Μ· 160 (橘子· 料*從取出之文字之數《意思 字之「一致度J ( S 0 2 5 ) b>^«L.180」,係輸 品名有3文字一致,爲3 X 01 「务扣 Λ/·Μ· 160」 料而被檢索*爲500點· 表上,定義第一階段爲 爲500點以上,首先,在第 丹(橘子 * 用者希望,進行「再檢索」之 0 0 1 「办扣九·Μ·160 j β之流程。 — l-lll-n — — — — — — t ---Γ — — — — <請先閱讀背面之注意事項> .寫本頁) -42 - 421764 B7 經濟部智慧財產局員工湞費合作社印製 五、發明說明(j [2〕附有畫像資料多項目資料之模糊檢索 其次,說明圖像資料等,包含在文字檢索不作爲檢索 對象之資料之多項目資料庫模糊檢索系統· 圖3 9中,表示包含非標準資料(圖像資料)之多項 目資料庫S 〇 〇 6之一例。包含畫像等之不是標準資料之 多項目資料庫S 〇 〇 6,一般係分爲標準資料部S 〇 〇 6 一 1 ’及標準以外之資料部(畫像資料等)S〇〇6 — 2 ,而,標準資料部S006 — 1,及標準以外之資料部( 畫像資料)S 0 0 6 — 2,係例如以畫像資料之指示器等 予以接連。 這時,以檢索對象指定表(S014),從多項目資 料庫中’明示成爲檢索對象者。在此例中,從關於車資訊 之資料之中,以「車名」,「顏色」、「年式」爲檢索對 象’ 「畫像指示器」爲檢索對象外•如此,藉由明示檢索 對象’於多項目資料中即使包含不適於文字列庫之檢索之 資料’也可以只檢索適於文字列庫之檢索之項目I S0 15係屬性指定表。此處,「車名」當作一般「 文字列」來處理•「顏色」爲屣性「色_(,「年式j爲屬 性「數值j之指定。 S 0 8 8係「顏色」之類似表《如「顏色」之類似關 係’以一次元所不能表現之類似性,可以用二次元以上者 表現。在例中,以向量座標表現「顏色」,以向量之差表 現類似度(不同度)》 圖4 0係表示檢索用索引依成工具之構成。檢索用索 I J I I 11 -----I I — — — — — — — ! — — — {請先M讀背面之注意事項声 '.寫本頁) 本紙張尺度適用中园國家標準(CNS〉A4規格(210 * 297公釐) -43 - 421764 " 經濟部智慧財產局員工消費合作社印製 五、發明說明(4ί) 引自動生成部S 0 0 3 1 ,參照檢索對象指定表SO 1 4 ,從多項目資料庫S 〇 0 6之文字資料部S 〇 〇 6 — 1之 中,確認那一個項目爲檢索對象。更者,參照屬性定義者 S 0 1 5 ’確認那一個項目爲檢索對象。更者,參照屬性 定義表S015,確認檢索對象之項目之屬性•對於檢索 對象之項目,配合各屬性,解析資料,作爲檢索用索引 S005。該檢索用索引,如圖所示,可以於各項目( SO 〇 5_ 1〜S 〇 0 5 — 3 )作成,也可以將檢索項目 全體一起作成。 圖4 1係檢索用索引之一例•此例中,「車名」與「 顔色」之項目•係每項目,將資料分解成2文字之組1文 字遷移〕,與包含該文字遷移之資料之地址一起記億。關 於「年式j ,由於屬於爲數值之指定,所以作成以數值之 部份作爲索引之索引表。 圖4 2係表示檢索系統之構成。只說明與圖3 6之檢 索系統之構成之不同處·在本實施例中,檢索用畫面自動 生成部S 0 3 1 ,即使使用者或應用不作檢索用之畫面, 也會自動地顯示檢索用之板。又,檢索用索引表,係如前 述,對每項目予以複數保持。由於每項目有檢索用索引, 所以*在此例中,將辨識結果最佳化及資料推測部 S 0 0 4,分成每項目之辨識結果最佳化及資料推測部 S 0 0 4 — 1 ·及總合辨識結果最佳化及資料推測部 S004—2而構成。檢索對象之多項目資料庫S006 ,係被分成標準庫之資部S 0 〇 6 — 1 ,及標準以外之資 ^式張尺度適用中國國家標(CNS)A4規格(210 * 297公轚) " 一 44 _ ---------裝 - ---^--— I 訂------! I 線 (請先閱讀背面之注意事項要i·寫本頁> 42Π64 at ____ B7 經濟部智慧財產局員工消費合作社印製 五、發明說明(j 料部(畫像資料等)S〇〇6 — 2,所以,在進行標準庫 之資料部S 0 〇 6 _ 1之檢索之後,標準以外之資料部( 畫像資料等)S 〇 0 6 — 2之資料予以顯示之非標準資料 統合部SO 3 2被設立。 圖.4 3係利用檢索用畫面自動生成部s 0 3 1 ,所作 成之撿索用關鍵字輸入板S 〇 4 1之側。撿索用板,係將 多項目資料庫之項目之中,作爲檢索對象而被定義之項目 關鍵字輸入框,作爲項目指定關鍵字输入框而予以顯示。 更者,自由關鍵字输入框也顯示,不指示項目之輸入也接 受。自由關鍵字檢索之時•被输入之關鍵字,總合檢索部 對於所有的檢索用索引作參照而檢索•又,關鍵字係配合 各項目之資料長,來輸入即可•如果,在畫面上配置不完 時,給予滾動桿* 圖4 4係利用檢索用畫面自動生成部S 〇 3 1所作成 之檢索結果顯示板S 0 4 3之例•在檢索結果之中,顯示 檢索非對象之項目,或不顯示而例如顯示畫像資料之指示 器之數值。 圖4 5係應用從檢索系統收受檢索結果,顯示畫像之 例。如此,只在應用側,進行含畫像之處,在檢索系統側 ,以只處理標準庫之資料部S 0 0 6 — 1之方式,進行工 作分擔也可· 圖4 6係表示總合辨識結果最佳化及資料推測部 S 0 0 4_2之處理流程》簡單地說明*檢索用關鍵字輸 入板S 0 4 1所輸入之關鍵字,如果是自由關鍵字,則使 -I J I I —ί I---*11— - I I {請先閱讀背面之注意事項真寫本頁) 訂·- -線. 本紙張尺度適用中囤國家標準(CNS)A4規格(210 X 297公釐) -45 - 421764 A7 經濟部智慧財產局員工消f合作社印製 -------B7________五、發明說明(j 用所有的項目之檢索用索引進行檢索*如果,如項目指定 關鍵字也被输入,則藉由與項目之辨識結果最佳化及資料 推測部S004— 1 ,檢索指定項目,输出OR資訊•如 果’沒有自由關鍵字之輸入,而只有指定項被輸入,則藉 由與項目之辨識結果最佳化及資料推測部SO 0 4— 1, 進行指定項目之檢索,輸出檢索結果》 以上係就畫像資料等包含在文字檢索上不作爲檢索對 象之資料之多項目資料庫之模糊檢索系統之說明。 〔3〕文字遷移-單字索引之模糊檢索 於圖4 7表示文字遷移-單字索引類似表之模糊檢索 之概要,此例係如圖示,在檢索用索引上·先記載文字遷 移。資料(單字)*資料之類似性評價值》包含單字之多 項目資料之No.(也可以是地址)之資訊*爲其特徵。 像這樣,於索引上包含文字遷移,而使得即使有如「力-尹力· >」及「力一f·•方y」這樣的表記錯誤,也可以予以 吸收,而進行檢索。當然,也可救濟使用者的一部份輸入 錯誤。更者,以單字單位,構成多項目資料庫之索引,配 合單字間之類似性,先排列單字索引,藉此,當某單字被 檢索時,則可以立刻求得包含與其接近之單字之資料· 在圖例中,對檢索用關鍵字輸入板,指定「力-浐4 方>· 9號*赤· 5000月(卡迪槍· 9號·紅色· 5000日幣)」進行檢索。於是,接近使用者希望之檢 索結果,第1_位「No - 9力一力·> •赤· 9號. I J I I ----I I — I ί i II Γ I I I I I I 1 I I — I {諳先《讀背面之注意事項鼻.寫本頁> 本纸張尺度適用令國囷家標準(CNS)A4規格(210 X 297公g ) ~ 46 ^ A7 Β7 經濟部智慧財產曷員工消費合作社印製 五、發明說明(j 4900月(No . 9 .卡迪槍.紅色· 9號.4900 曰幣)」被顯示出。更者,接著,類似結果,第2位「力 力*>·夕彳>· 9號· 4700H (卡迪槍.葡萄 色· 9號· 4700日幣)」,第3位「力一于*力*>· ΰ >夕· 9號· 5400丹(卡貼槍•粉紅.9號. 5400日幣)」等也立刻被求出· 以上是文字遷移一單字索引之模糊檢索之概要。 藉由以上之述敘,可救濟多項目資料庫之使用者輸入 錯誤或多項目資料本身的一部份之不完全,更者,可作意 思接近資料者之模糊檢索》 <圖式說明> 圖1係本發明之一實施例之手寫輸入地址辨識裝置之 機能方塊圖· 圖2係本發明之一實施例之手寫輸入地址辨識裝置之 動作概要圖= 圖3係習知之文字辨識裝置之構成圚》 圖4係表示使用習知之文字辨識裝置輸入地址時之動 作概要圖。 圖5係本發明之一實施例之手寫輸入地址辨識裝置之 硬體構成圖》 圖6係說明文字遷移機率表之作成方法之流程圖。 圖7係單字字典之概要圖。 圖8係文字出現次數表之概要圖。 I 1 I--,---- - ill·!·訂.! — <碕先wtl背面之;i意事項戶、寫本I > 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐)
I -47 - 經濟部智慧財產局員工消費合作社印製 42Π6 A A7 _______B7____ __五、發明說明(^ 圖9係文字遷移次數表之概要圖。 圖1 0爲文字出現機率之概要圖。 圓1 1爲文字遷移機率表之槪要圖。 圊1 2爲使用遷移機率表進行文字辨識後處理方法之 概要圖。 圖13係利用後處理結果推測文字列之概要圖。 圖1 4係利用後處理結果推測文字列之概要圚* 圖1 5係利用後處理結果推測文字列之概要圖。 圖1 6係利用後處理結果推測文字列之概要圖。 圖1 7表示推測之文字列之顯示形態圖* 圖1 8表示推測之文字列之顯示形態圖。 圖1 9表示推測之文字列之顯示形態圖》 圖2 0表示推測之文字列之顯示形態圖。 圖2 1係利用後處理結果推測文字列之概要圖· 圖2 2係利用後處理結果推測文字列之概要圖。 圖2 3係本發明之一實施例之手寫醫療檢索裝置之機 能方塊圖。 圖2 4係本發明之一實施例之手寫藥劑檢索裝置之動 作說明圖。 圖2 5係敘述藥劑處方目的|使用上注意點、副作用 、其它藥劑使用時之注意點之表之說明圖。 圓2 6係本發明之一實施例之以手寫之患者名字檢索 裝置之動作之說明圖。 _圖2 7係表示圖書檢索系統之構成方塊圖。_ 本紙張尺度適用中關家標準(CNS>A4規格(21G X 297公爱) 1 _ - 48 - — lllLlllllt— — ' I I I l· I I I ^ -1IIII — — — C請先閱讀背面之注意事項戶V寫本頁> Β7 Β7 經濟部智慧財產局員Η消費合作社印製 五、發明說明(j 圇2 8係表示進行以配架導引處理之顯示例之圖· 圖2 9係表示藏書原薄之構成之圖β 圖3 0係表示藏書表、作者表、出版處表之構成圖。 圖3 1係表示標題遷移機率表之構成之圖· 圖3 2係表示標題遷移機率表之構成圖。 圖3 3係表示圖書檢索處理之處理順序之流程圖β 圖3 4係表示在圖書檢索處理中,爲了接受檢索關鍵 字而進行之顯示例之圖。 圖3 5係表示在圖書檢索處理中所進行之檢索結果之 顯示例之圖。 圖36係顯示檢索表。 圖3 7係顯示模糊檢索所用之表。 圖3 8係說明模糊檢索之處理流程》 圖3 9顯示包含非標準資料之多項目資料庫之一例* 圖4 0顯示檢索用索引依成工具之構成· 圖41檢索用索引之一例。 圖4 2顯示檢索系統之構成。 圖4 3利用檢索用畫面自動生成部,所作成之檢索用 關鍵字輸入板之例· 圖4 4利用檢索用畫面自動生成部所作成檢索結果顯 示板之例。 圖4 5應用從檢索系統收受檢索結果顯示畫像之例* 圖4 6顯示總合辨識結果最佳化及資料推測部之處理 流程。 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) n Lr ^ I I ^ I 1 I n I I ^ ^ ^ I» 1· · n -l .1 ^ ^ ii t <碕先w讀背面之i£.t事項於V寫本頁> -49 - A7 _______B7____五、發明說明(j圖4 7顯示文字遷移一單字索引類似表之模糊檢索概 要
Is* - I HI I I I I I I I --— {請先閱讀背面之注意事項Wv 寫本頁) -I6* •線 經濟部智慧財產局員工消費合作杜印製 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公t ) -50 -

Claims (1)

  1. Α2Π64 A8B8C8D8 經濟部智慧財產局員工消費合作社印製 六、申請專利範圍 1 _ —種檢索系統,係將複數之文字列作爲檢索關鍵 字’進行儲存於資料庫之資訊之檢索;其特徵爲:具備有 輸入手段,係接受利用者所輸入之複數文字列,及利 用者所輸入之各文字列之權值或優先度;及 檢索手段,係將接受之文字列作爲各檢索之關鍵字, 進行儲存於上述資料庫之資訊之探索:及 候補順位決定手段,係將檢索之各資訊之作爲檢索結 果要輸出之順位之候補順位,作爲依據該資訊檢索之檢索 關鍵字所用之文字列之權值或優先度之順位之候補順位決 定手段。 2 .如申請專利範圍第1項之檢索系統*其中上述撿 索手段,係配合接受之複數文字列所包含之文字遷移,與 檢索對象資訊中所包含之文字之遷移之一致度之遷移一致 度,進行資訊檢索; 上述候補順位決定手段,係將上述被檢索之各資訊之 候補位,將檢索之各資訊之遷移一致度,以該資訊之檢索 作爲檢索關鍵字使用之文字列之權值或優先度,來給予權 值之值,作爲其順位。 3·如申請專利範圍第1或2項之檢索系統,其中具 有以依據上述候補順位之順序,输出被檢索之各資訊之输 出手段。 4 .如申請專利範圍第1或2項之檢索系統,其中上 述資料庫所存儲之各資訊·係由各複數之項目所構成;上 --.1----I-----· I — I — I I I 訂.—ill - (請先wtt背*之注意事項再^鳥本頁) 本纸張尺度適用中國國家標準(CNS)A4規格(210 X 297公发) _ - 51 - 491764 is 經濟部智慧財產局員Η消費合作社印*'# 六、申請專利範圍 述输入手段,係接受利用者對上述每各項目1個或複數輸 入之複數文字列,及利用者所输入之各文字列之權值或優 先度:上述檢索手段,係將接受之複數之文字列,作爲各 該文字列被輪入之項目之檢索關鍵字,於各項目,進行上 述資料庫所爲儲之資訊之檢索· 5 .如申請專利範圍第4項之檢索系統,其中上述輸 入手段,係對於文字列之權值或優先值,係接受對於該文 字列被輸入之項目,利用者所設定或規定之資料庫所預先 設定之權值或優先度· 6 —種檢索系統,係保持指定檢索對象之項目之資 枓屬性之屬性指定表,及配合上述屬性,表示資料類似關 係之類似表,即使不與被輸入之關鍵字完全一致,也可以 以類似資料作爲檢索結果》 7 . —種檢索系統,係保持有檢索顯示範圍定義者, 係記述檢索結果之顯示階段,與該階段所顯示之檢索結果 之關鍵字之一致度,或檢索個數等,而將檢索結果階段地 顯示。 8 .—種檢索系統’係保持優先順序定義者,係表示 檢索結果之中,使多項目之那個項目之資料一致者優先表 示:從優先者高之檢索結果來顯示* 9 . 一種檢索系統,係屣於多項目資料庫之檢索系統 ,係保持有: 多項目之資料庫:及 檢索對象指定者,係指定多項目之中,作爲檢索對象 <請先Μ讀背面之法意事項再為本頁> 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) ' 52 - A8 B8 C8 D8 42176 六、申請專利範圍 之項目;及 屬性指定者,係指定檢索對象之項目之資料之屬性; 及 類似表,係配合上述靥性,表示資料之類似關係;及 檢索用索引’係作爲參照檢索對象之資料用者:及 優先順序定義表,係表示要使檢索結果之中,多項目 的那一個項目之資料爲一致者使其優先:及 檢索顯示範圔定義者,係記述檢索結果之顯示階段, 與該階段所顯示之檢索結果之關鍵字之一致度或檢索個數 等; 即使與被輸入之關鍵字不完全一致;文字列相似或意 思相近之資料,從接近被输入之關鍵字者開始,配合使用 者之優先者,以階段來顯示· 1 0 .—種檢索系統,係不只是指定:多項目資料庫 、從多項目之中指定作爲檢索對象之項目之檢索對象指定 表、指定檢索對象之項目之資料之屬性之屬性指定表*表 示要使檢索結果之中多項目的那一個項目之資料一致者予 以優先之優先順序定義者,而且自動地生成檢索用索引, 將接近被輸入之關鍵之資料予以顯示者。 1 1 _ 一種檢索系統,係上述類似表爲表示「顏色· 物品•明暗等」之資料類似關係· 1 2 . —種檢索系統,其特徵上述類似表係使用同義 詞* 本紙張尺度適用中國國家標準(CNS>A4規格(210 X 297公芨) — It-------i -裝.I — I f I 訂· - - - --- (請先閲讀背面之注意事項再A··寫本頁) 經濟部智慧財產局員工消費合作社印製 53
TW089114382A 1996-05-21 1997-04-29 Input character string estimation and identification apparatus TW421764B (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP12536096A JP3275704B2 (ja) 1996-05-21 1996-05-21 入力文字列推測認識装置
JP22480896A JPH1063750A (ja) 1996-08-27 1996-08-27 医療検索装置
JP26193696A JP3205516B2 (ja) 1996-10-02 1996-10-02 検索システム

Publications (1)

Publication Number Publication Date
TW421764B true TW421764B (en) 2001-02-11

Family

ID=27315109

Family Applications (2)

Application Number Title Priority Date Filing Date
TW086105652A TW490643B (en) 1996-05-21 1997-04-29 Estimated recognition device for input character string
TW089114382A TW421764B (en) 1996-05-21 1997-04-29 Input character string estimation and identification apparatus

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW086105652A TW490643B (en) 1996-05-21 1997-04-29 Estimated recognition device for input character string

Country Status (6)

Country Link
US (2) US6097841A (zh)
EP (1) EP0841630B1 (zh)
KR (1) KR100475266B1 (zh)
CN (1) CN1143240C (zh)
DE (1) DE69724910T2 (zh)
TW (2) TW490643B (zh)

Families Citing this family (76)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6616703B1 (en) * 1996-10-16 2003-09-09 Sharp Kabushiki Kaisha Character input apparatus with character string extraction portion, and corresponding storage medium
US6572660B1 (en) * 1998-08-20 2003-06-03 Russell I. Okamoto Method and system for creating hyperlinks and hyperlinked documents from the direct manipulation of information (“Drag and link” operation)
US7712053B2 (en) * 1998-12-04 2010-05-04 Tegic Communications, Inc. Explicit character filtering of ambiguous text entry
US7679534B2 (en) * 1998-12-04 2010-03-16 Tegic Communications, Inc. Contextual prediction of user words and user actions
US7881936B2 (en) * 1998-12-04 2011-02-01 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US7720682B2 (en) 1998-12-04 2010-05-18 Tegic Communications, Inc. Method and apparatus utilizing voice input to resolve ambiguous manually entered text input
US8938688B2 (en) 1998-12-04 2015-01-20 Nuance Communications, Inc. Contextual prediction of user words and user actions
US7130487B1 (en) * 1998-12-15 2006-10-31 Matsushita Electric Industrial Co., Ltd. Searching method, searching device, and recorded medium
JP3958902B2 (ja) * 1999-03-03 2007-08-15 富士通株式会社 文字列入力装置及び方法
ATE242506T1 (de) 1999-03-18 2003-06-15 British Columbia Ltd 602531 Dateneingabe für personalrechnergeräte
US7293231B1 (en) 1999-03-18 2007-11-06 British Columbia Ltd. Data entry for personal computing devices
JP4280355B2 (ja) * 1999-05-06 2009-06-17 富士通株式会社 文字認識装置
US7143350B2 (en) * 1999-06-30 2006-11-28 Microsoft Corporation Method and system for character sequence checking according to a selected language
JP3480404B2 (ja) * 1999-12-22 2003-12-22 日本電気株式会社 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
JP2003521030A (ja) * 2000-01-17 2003-07-08 キム、ミンキュン キーパッドでの字母入力装置及びその方法
US6847734B2 (en) * 2000-01-28 2005-01-25 Kabushiki Kaisha Toshiba Word recognition method and storage medium that stores word recognition program
US6944344B2 (en) * 2000-06-06 2005-09-13 Matsushita Electric Industrial Co., Ltd. Document search and retrieval apparatus, recording medium and program
US7024042B2 (en) * 2000-10-04 2006-04-04 Fujitsu Limited Word recognition device, word recognition method, and storage medium
CA2323856A1 (en) * 2000-10-18 2002-04-18 602531 British Columbia Ltd. Method, system and media for entering data in a personal computing device
GB0115830D0 (en) * 2001-06-28 2001-08-22 Coredata Ltd Data management
JP3907161B2 (ja) * 2001-06-29 2007-04-18 インターナショナル・ビジネス・マシーンズ・コーポレーション キーワード検索方法、キーワード検索端末、コンピュータプログラム
US7158678B2 (en) * 2001-07-19 2007-01-02 Motorola, Inc. Text input method for personal digital assistants and the like
JP3997459B2 (ja) * 2001-10-02 2007-10-24 株式会社日立製作所 音声入力システムおよび音声ポータルサーバおよび音声入力端末
AUPR824601A0 (en) 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and system (npw004)
US20030138144A1 (en) * 2001-12-18 2003-07-24 Stefan Lynggaard Address matching
US7130470B1 (en) * 2002-03-15 2006-10-31 Oracle International Corporation System and method of context-based sorting of character strings for use in data base applications
US8583440B2 (en) * 2002-06-20 2013-11-12 Tegic Communications, Inc. Apparatus and method for providing visual indication of character ambiguity during text entry
JP4145603B2 (ja) 2002-08-05 2008-09-03 富士通株式会社 文字列入力装置及び方法
US7490296B2 (en) * 2003-01-31 2009-02-10 Microsoft Corporation Utility object for specialized data entry
AU2003900865A0 (en) 2003-02-26 2003-03-13 Silverbrook Research Pty Ltd Methods, systems and apparatus (NPW010)
CN1303564C (zh) * 2003-06-12 2007-03-07 摩托罗拉公司 改进的电子设备中字符输入的识别方法
US7567239B2 (en) * 2003-06-26 2009-07-28 Motorola, Inc. Method and system for message and note composition on small screen devices
US7508984B2 (en) * 2003-07-31 2009-03-24 Ricoh Company, Ltd. Language recognition method, system and software
US7464331B2 (en) * 2003-08-18 2008-12-09 Microsoft Corporation System and method for validating hierarchically-organized messages
US8095364B2 (en) 2004-06-02 2012-01-10 Tegic Communications, Inc. Multimodal disambiguation of speech recognition
US8552984B2 (en) * 2005-01-13 2013-10-08 602531 British Columbia Ltd. Method, system, apparatus and computer-readable media for directing input associated with keyboard-type device
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US20060271552A1 (en) * 2005-05-26 2006-11-30 Venture Capital & Consulting Group, Llc. Targeted delivery of content
DE102005031656A1 (de) * 2005-07-06 2007-01-11 Siemens Ag Verfahren zur Auswahl einer Bezeichung
US9025890B2 (en) * 2006-05-26 2015-05-05 Nec Corporation Information classification device, information classification method, and information classification program
JP4893167B2 (ja) * 2006-08-30 2012-03-07 富士通株式会社 認証方法
US8082240B2 (en) * 2007-02-28 2011-12-20 Classe Qsl, S.L. System for retrieving information units
CA2581824A1 (en) * 2007-03-14 2008-09-14 602531 British Columbia Ltd. System, apparatus and method for data entry using multi-function keys
US7650445B2 (en) * 2007-09-12 2010-01-19 Motorola, Inc. System and method for enabling a mobile device as a portable character input peripheral device
JP2009157482A (ja) * 2007-12-25 2009-07-16 Kyocera Corp 文書編集装置及び文書編集方法
TWI374391B (en) 2008-05-27 2012-10-11 Ind Tech Res Inst Method for recognizing writing motion and trajectory and apparatus for writing and recognizing system
US8645417B2 (en) * 2008-06-18 2014-02-04 Microsoft Corporation Name search using a ranking function
CN101398902B (zh) * 2008-09-27 2012-07-04 宁波新然电子信息科技发展有限公司 一种自然手写阿拉伯字母联机识别方法
US20100153405A1 (en) 2008-10-14 2010-06-17 Johnson Brian M Systems and methods to search a data source based on a compatability via a specification
US8914359B2 (en) * 2008-12-30 2014-12-16 Microsoft Corporation Ranking documents with social tags
JP4735726B2 (ja) * 2009-02-18 2011-07-27 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20110060985A1 (en) * 2009-09-08 2011-03-10 ABJK Newco, Inc. System and Method for Collecting a Signature Using a Smart Device
KR101301534B1 (ko) * 2009-12-14 2013-09-04 한국전자통신연구원 이형태 자동 구축 방법 및 장치
US8463731B2 (en) * 2010-02-17 2013-06-11 Google Inc. Translating user interaction with a touch screen into text
CN101894160B (zh) * 2010-07-21 2012-02-08 同方知网(北京)技术有限公司 一种智能检索方法
JP5699570B2 (ja) * 2010-11-30 2015-04-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5807342B2 (ja) * 2011-02-21 2015-11-10 富士ゼロックス株式会社 文字認識装置及びプログラム
US9594539B1 (en) * 2011-02-23 2017-03-14 Amazon Technologies, Inc. Using applications of items in item searches
CN102354350A (zh) * 2011-11-03 2012-02-15 厦门市智业软件工程有限公司 实现快速录入电子病历信息的方法
CN103164388B (zh) * 2011-12-09 2016-07-06 北大方正集团有限公司 一种版式文件中结构化信息获取的方法及装置
KR101222486B1 (ko) 2012-04-13 2013-01-16 주식회사 페타바이 비결정적 유한 오토마타의 비결정성을 선택적으로 제거하기 위한 방법, 서버, 단말 장치 및 컴퓨터 판독 가능한 기록 매체
JP5832980B2 (ja) * 2012-09-25 2015-12-16 株式会社東芝 手書き入力支援装置、方法およびプログラム
US9015195B1 (en) 2013-01-25 2015-04-21 Google Inc. Processing multi-geo intent keywords
US10228819B2 (en) 2013-02-04 2019-03-12 602531 British Cilumbia Ltd. Method, system, and apparatus for executing an action related to user selection
DE112013006764T5 (de) * 2013-03-04 2015-11-19 Mitsubishi Electric Corporation Suchvorrichtung
KR102073102B1 (ko) 2013-03-21 2020-02-04 삼성전자 주식회사 언어인식을 위한 언어모델 db, 언어인식장치와 언어인식방법, 및 언어인식시스템
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
WO2016074212A1 (en) * 2014-11-14 2016-05-19 Volkswagen China Investment Co., Ltd. Control method and control apparatus for navigation system
CN104571821B (zh) * 2014-12-30 2018-09-04 北京奇虎科技有限公司 一种长句定位方法和装置
CN105468743B (zh) * 2015-11-25 2018-12-28 钟岑 一种智能诊断手术编码检索方法
JP6526608B2 (ja) * 2016-09-06 2019-06-05 株式会社東芝 辞書更新装置およびプログラム
CN106408798A (zh) * 2016-09-22 2017-02-15 上海寰果信息科技有限公司 Pos 机打印方法及打印系统
CN106528605A (zh) * 2016-09-27 2017-03-22 武汉工程大学 一种基于规则的中文地址解析方法
CN107247724B (zh) * 2017-04-27 2018-07-20 腾讯科技(深圳)有限公司 转移概率矩阵更新、信息识别方法及装置、计算机设备
JP2019139592A (ja) * 2018-02-13 2019-08-22 シャープ株式会社 文字認識装置、文字認識方法
CN113590895B (zh) * 2021-07-28 2023-04-25 西华大学 一种字符串检索方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4654875A (en) * 1983-05-23 1987-03-31 The Research Foundation Of State University Of New York System to achieve automatic recognition of linguistic strings
US5067165A (en) * 1989-04-19 1991-11-19 Ricoh Company, Ltd. Character recognition method
JPH02308384A (ja) * 1989-05-24 1990-12-21 Toshiba Corp 住所認識装置
US5020019A (en) * 1989-05-29 1991-05-28 Ricoh Company, Ltd. Document retrieval system
JPH03122770A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想文書検索方法
US5321833A (en) * 1990-08-29 1994-06-14 Gte Laboratories Incorporated Adaptive ranking system for information retrieval
US5377281A (en) * 1992-03-18 1994-12-27 At&T Corp. Knowledge-based character recognition
JPH0684006A (ja) * 1992-04-09 1994-03-25 Internatl Business Mach Corp <Ibm> オンライン手書き文字認識方法
JPH0793467A (ja) * 1993-09-22 1995-04-07 Toshiba Corp 住所読取システム
US5826260A (en) * 1995-12-11 1998-10-20 International Business Machines Corporation Information retrieval system and method for displaying and ordering information based on query element contribution
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
US5909510A (en) * 1997-05-19 1999-06-01 Xerox Corporation Method and apparatus for document classification from degraded images

Also Published As

Publication number Publication date
EP0841630B1 (en) 2003-09-17
CN1143240C (zh) 2004-03-24
KR100475266B1 (ko) 2005-07-11
TW490643B (en) 2002-06-11
EP0841630A3 (en) 1999-09-01
CN1173684A (zh) 1998-02-18
DE69724910D1 (de) 2003-10-23
US20010028742A1 (en) 2001-10-11
US6097841A (en) 2000-08-01
US6751605B2 (en) 2004-06-15
KR970076347A (ko) 1997-12-12
DE69724910T2 (de) 2004-07-15
EP0841630A2 (en) 1998-05-13

Similar Documents

Publication Publication Date Title
TW421764B (en) Input character string estimation and identification apparatus
Milosevic et al. A framework for information extraction from tables in biomedical literature
Ehrmann et al. Extended overview of CLEF HIPE 2020: named entity processing on historical newspapers
CN114616572A (zh) 跨文档智能写作和处理助手
Candela et al. A linked open data framework to enhance the discoverability and impact of culture heritage
CN111324771B (zh) 视频标签的确定方法、装置、电子设备及存储介质
CN112035675A (zh) 医疗文本标注方法、装置、设备及存储介质
Moreno-Ortiz et al. Design and validation of annotation schemas for aspect-based sentiment analysis in the tourism sector
RU61442U1 (ru) Система автоматизированного упорядочения неструктурированного информационного потока входных данных
JP2011513810A (ja) 用語識別方法および装置
Kim et al. Automatic annotation of bibliographical references in digital humanities books, articles and blogs
Siddiqui et al. Evaluation and enrichment of Arabic sentiment analysis
US8082240B2 (en) System for retrieving information units
Dahlberg et al. A distributional semantic online lexicon for linguistic explorations of societies
Van Wierst et al. BolVis: visualization for text-based research in philosophy
Havens et al. Uncertainty and inclusivity in gender bias annotation: An annotation taxonomy and annotated datasets of British English text
US11954153B2 (en) Knowledge insight capturing system
Saoudi et al. Trends and challenges of Arabic Chatbots: Literature review
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム
Miloševic A multi-layered approach to information extraction from tables in biomedical documents
Quamruzzaman Named entity extraction in historical Australian newspaper text
TW202349325A (zh) 一種語意分析商標類別推薦系統及其方法
JPH0793345A (ja) 文書検索装置
JPH0944521A (ja) インデックス作成装置および文書検索装置

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MM4A Annulment or lapse of patent due to non-payment of fees