TWI747172B - 外字管理系統 - Google Patents

外字管理系統 Download PDF

Info

Publication number
TWI747172B
TWI747172B TW109105915A TW109105915A TWI747172B TW I747172 B TWI747172 B TW I747172B TW 109105915 A TW109105915 A TW 109105915A TW 109105915 A TW109105915 A TW 109105915A TW I747172 B TWI747172 B TW I747172B
Authority
TW
Taiwan
Prior art keywords
foreign
character
information
characters
foreign character
Prior art date
Application number
TW109105915A
Other languages
English (en)
Other versions
TW202117580A (zh
Inventor
野島伸一
關口晉
Original Assignee
日商日本加除出版股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商日本加除出版股份有限公司 filed Critical 日商日本加除出版股份有限公司
Publication of TW202117580A publication Critical patent/TW202117580A/zh
Application granted granted Critical
Publication of TWI747172B publication Critical patent/TWI747172B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

一種能夠針對分別通過獨自判斷在電腦系統中持續採用/登記新的外字的多個組織體,進行一定程度上的統一或標準的外字資訊管理的外字管理系統。外字管理系統包括:外字管理伺服器,具有外字主要資料庫、類似性資料庫、顧客資訊資料庫、外字主編輯處理部以及外字資訊取得處理部;以及多個組織體的電腦系統,各組織體的電腦系統具有具備與所保有的文字基礎管理系統聯動地進行外字主要資料庫的對照、字形的類似性判定、新外字的登記處理的功能的外字管理軟體。

Description

外字管理系統
本發明涉及在電腦系統中可以一併管理日文中的正字(常用漢字)以及外字(非常用漢字,電腦打不出來,用代碼代替)的文字資訊的文字基礎管理系統,特別是提供一種在具有不同的文字體系的多個組織的電腦系統中也能夠統一管理正字以及外字的文字資訊的組成。
在電腦系統中,定義有用於處理文字(漢字、片假名、平假名、字母等)的標準文字代碼。除了JIS碼、Shift_JIS碼這樣的日本國內標準以外,還有EUC、Unicode這樣的國際標準。在很多電腦系統中採用標準規格的文字代碼,從而容易實現不同的電腦系統之間的文字資訊的交換。
在日本使用的漢字之中,存在意思或讀法相同但是字形不同的異體字。
圖8表示這種異體字的例。如圖所示,已知針對常用日本漢字體的「斉」、「辺」、「広」等存在多個異體字(同意、同音、異體的文字群)。日文中的各異體字會被賦予不同的文字代碼,若異體字的數量龐大,則很難對所有異體字賦予標準文字代碼。雖然未被賦予標準文字代碼但是實際上在各種系統上被加以利用的異體字被登記為外字(非常用字,電腦打不出來,用代碼代替)。 在各系統中,將常用漢字體的文字代碼、異體字的標準文字代碼、外字的文字代碼作為同一異體字組而建立關聯來登記。
除了上述以外,有時對於同音同義且字形顯著不同的字(「野」和「埜」(日語讀音都是「
Figure 109105915-A0305-02-0003-10
」)等,下同)、字形明顯相似但是不同音不同義的字(「柿(日語讀音是「
Figure 109105915-A0305-02-0003-11
」,在日語裡是木屑或薄木板的意思,下同)」和「柿(日語讀音是「
Figure 109105915-A0305-02-0003-12
」,在日語裡是柿子的意思)」等,下同),也作為同一異體字組而建立關聯來登記。
這樣,各組織體在電腦系統中具有獨自的外字群。為了組織體彼此的合併、組織體之間的資訊交換,提出了將分別獨自存在的外字群彼此對應起來的構成。
專利文獻1公開了基於OCR識別出的文字的點圖案確定外字的技術,專利文獻2公開了基於預先儲存的外字特徵資訊確定外字的技術,專利文獻3公開了預先對字形不同的每個文字賦予主代碼並進行不同系統之間的對應的技術。
〔專利文獻1〕日本特開2011-128688號公報
〔專利文獻2〕日本特開2006-179026號公報
〔專利文獻3〕日本特開2010-009532號公報
如上所述那樣提出了在不同組織體的電腦系統間相互使獨自保有的外字群建立對應關係的各種構成。但是,外字通常是新出現且通過各組織體的獨自判斷來採用/登記的。通過根據上述的文字形狀確定外字的方法無法統一應當以何種程度的類似性作為基準,通過基於預先儲存的資訊建立對應關係的方法無法應對新產生的字形。
其結果,如圖8所示,在各種組織體的電腦系統中每天持續登記新的外字群的狀況下,無法始終使這些不同的系統間的外字群建立對應關係或者無法賦予具有共通性的代碼。
本發明鑒於以上情況完成,提供一種針對通過各自獨自判斷在電腦系統中持續採用/登記新的外字的多個組織體能夠進行一定程度上的統一性或標準性的外字資訊管理的外字管理系統。
鑒於上述要解決的課題銳意研究的結果,本申請的發明人想到了設置統一保有各組織體的電腦系統所保有的外字體系的外字管理伺服器,並針對在各組織體中隨時任意地新發生且採用/登記的外字收集/蓄積資訊,受理來自各組織體的外字的對照,從而能夠對所有的外字體系進行一元化管理,從而完成了本發明。
即,本發明提供一種外字管理系統,是包括多個組織體的電腦系統和外字管理伺服器的外字管理系統,該外字管理系統的特徵在於,所述外字管理伺服器具有:外字主要資料庫,儲存外字的字形資料、該外字管理伺服器中的識別碼、一個以上的所述組織體的電腦系統中的識別碼;顧客資訊資料庫,儲存與多個所述組織體相關的資訊;外字主編輯處理部,編輯所述外字主要資料庫的登記內容;以及外字資訊取得處理部,取得在所述組織體的電腦系統中新登記的外字的資訊並登記到所述外字主要資料庫,所述組織體的電腦系統具有:外字管理軟體,該外字管理軟體是與該電腦系統所保有的文字基礎管理系統聯動地工作,該外字管理軟體具有:外字主要資料庫對照部,參照所述外字 管理伺服器的外字主要資料庫,對照外字;類似性判定處理部,判定文字彼此的字形的類似性;以及新外字登記處理部,向所述外字管理伺服器發送在所述文字基礎管理系統中新登記的外字的資訊。
在本發明的外字管理系統中,特徵在於,當輸入了所述組織體的電腦系統的文字基礎管理系統不具備資訊的第一外字時,所述外字主要資料庫對照部參照所述外字管理伺服器的外字主要資料庫取得相應的外字的資訊,並提供給所述文字基礎管理系統。
由此,各組織體的電腦系統的文字基礎管理系統並不是獨自登記原先並未保有的外字,而是能夠作為將本系統中的登記資訊關聯起來的外字來進行登記。
在本發明的外字管理系統中,特徵在於,針對所述第一外字,從所述外字管理伺服器的外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊並提供給所述文字基礎管理系統。
由此,針對與本系統中已登記的外字相比雖然字形不同但是在一定程度上類似的外字,也能夠看作是與登記外字相同來進行確定,能夠防止亂髮字形稍有不同的外字的新登記。
在本發明的外字管理系統中,特徵在於,所述類似性判定處理部在參照所述外字主要資料庫取得了與所述第一外字的字形類似的兩個以上的外字的資訊的情況下,使用戶選擇採用哪個外字。
由此,能夠實現在外字的類似性判定中包括了基於人的判斷的半自動的運用。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器的外字主要資料庫儲存外字的分組資訊和屬於相應組的各外字的推薦度的資訊,針對所述第一外字,在從所述外字管理伺服器的外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊、與該一個以上的外字屬於同一組的外字及其推薦度的資訊,根據推薦度的序列向用戶提示所取得的外字,使用戶選擇採用哪個外字。
由此,能夠促進在各組織體的電腦系統中起用推薦度高的外字。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器的外字主要資料庫儲存有外字的分組資訊和屬於相應組的各外字的推薦度的資訊,針對所述第一外字,在從所述外字管理伺服器的外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊、與該一個以上的外字屬於同一組的外字及其推薦度的資訊,在所取得的外字之中採用推薦度最高的外字。
由此,在各組織體的電腦系統中能夠起用遵從本系統管理者的策略的外字。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器具有保有與字形的類似性相關的資訊的類似性資料庫,所述類似性判定處理部在從所述外字主要資料庫取得與所述第一外字的字形類似的一個以上的外字的資訊時,參照所述外字管理伺服器的類似性資料庫來判定字形的類似性。
優選基於已知的類似文字識別技術構築類似性資料庫,若存在新技術的進步,則更新資料庫。
在本發明的外字管理系統中,特徵在於,針對所述第一外字,在從所述外字管理伺服器的外字主要資料庫無法取得資訊且也無法取得字形類似的外字的資訊的情況下,所述新外字登記處理部取得在相應文字基礎管理系統中作為外字新登記時所賦予的該第一外字的識別碼,將新登記的外字的資訊包含在內發送給所述外字管理伺服器。
由此,在本系統中,能夠集中地一元化管理在各組織體的電腦系統中隨時任意新登記的外字的資訊。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器的外字主要資料庫儲存外字的對應正字資訊、部首資訊以及意思資訊之中的至少一個。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器具有針對所述各組織體的電腦系統組態所述外字管理軟體並進行更新的軟體配置處理部。
在本發明的外字管理系統中,所述外字管理伺服器具有:系統間外字對應資料生成處理部,生成用於使在不同的兩個以上的組織體的電腦系統間所保有的外字資訊建立對應關係的系統間外字對應資料,所述系統間外字對應資料至少包括兩個以上的組織體間的電腦系統中的外字的識別碼的對應表。
由此,即使是在各組織體的電腦系統中隨時任意新登記外字的狀況下,也可以使這些組織間的外字的資訊建立對應關係。
此外,本發明提供一種外字管理系統,包括與多個組織體的電腦系統所保有的文字基礎管理系統聯動地進行外字管理的外字管理伺服器,該外字管理系統的特徵在於,所述外字管理伺服器具有:外字主要資料庫,儲存外字 的字形資料、該外字管理伺服器中的識別碼、一個以上的所述組織體的電腦系統中的識別碼;顧客資訊資料庫,儲存與多個所述組織體相關的資訊;外字主編輯處理部,編輯所述外字主要資料庫的登記內容;外字主要資料庫對照部,使所述組織體的電腦系統進行參照了所述外字主要資料庫的外字的對照;類似性判定處理部,判定文字彼此的字形的類似性;以及外字資訊取得處理部,取得在所述組織體的電腦系統的文字基礎管理系統中新登記的外字的資訊並登記到所述外字主要資料庫。
在本發明的外字管理系統中,特徵在於,當輸入了所述組織體的電腦系統的文字基礎管理系統中沒有資訊的第一外字時,從該電腦系統接收了該第一外字的資訊的所述外字管理伺服器通過所述外字主要資料庫對照部,參照所述外字管理伺服器的外字主要資料庫取得相應的外字的資訊並提供給該電腦系統。
由此,各組織體的電腦系統的文字基礎管理系統並不是獨自登記原先並未保有的外字,而是能夠作為將本系統中的登記資訊關聯起來的外字來進行登記。
在本發明的外字管理系統中,特徵在於,針對所述第一外字,在從外字主要資料庫無法取得資訊的情況下,所述外字管理伺服器通過所述類似性判定處理部,參照所述外字主要資料庫取得與該第一外字的字形類似的一個以上的外字的資訊並提供給相應電腦系統。
由此,針對與本系統中已登記的外字相比雖然字形不同但是在一定程度上類似的外字,也能夠看作是與登記外字相同來進行確定,能夠防止亂髮字形稍有不同的外字的新登記。
在本發明的外字管理系統中,特徵在於,所述類似性判定處理部在參照所述外字主要資料庫取得了與所述第一外字的字形類似的兩個以上的外字的資訊的情況下,向相應電腦系統提示所述兩個以上的外字的資訊,使得選擇採用哪個外字。
由此,能夠實現在外字的類似性判定中包括了基於人的判斷的半自動的運用。
在本發明的外字管理系統中,特徵在於,所述外字主要資料庫儲存外字的分組資訊和屬於相應組的各外字的推薦度的資訊,針對所述第一外字,在從所述外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊以及與該一個以上的外字屬於同一組的外字及其推薦度的資訊並提供給相應電腦系統。
由此,能夠促進在各組織體的電腦系統中起用推薦度高的外字。
在本發明的外字管理系統中,特徵在於,所述外字主要資料庫儲存外字的分組資訊和屬於相應組的各外字的推薦度的資訊,針對所述第一外字,在從所述外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊以及與該一個以上的外字屬於同一組的外字及其推薦度的資訊,並從所取得的外字之中將推薦度最高的外字提供給相應電腦系統。
由此,在各組織體的電腦系統中能夠起用遵從本系統管理者的策略的外字。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器具有保有與字形的類似性相關的資訊的類似性資料庫,所述類似性判定處理部在從 所述外字主要資料庫取得與所述第一外字的字形類似的一個以上的外字的資訊時,參照所述外字管理伺服器的類似性資料庫來判定字形的類似性。
優選基於已知的類似文字識別技術構築類似性資料庫,若存在新技術的進步,則更新資料庫。
在本發明的外字管理系統中,特徵在於,所述外字資訊取得處理部取得在相應文字基礎管理系統中作為外字新登記時所賦予的所述第一外字的識別碼,將新登記的外字的資訊包含在內登記到所述外字管理伺服器。
由此,在本系統中,能夠集中地一元化管理在各組織體的電腦系統中隨時任意新登記的外字的資訊。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器的外字主要資料庫儲存外字的對應正字資訊、部首資訊以及意思資訊之中的至少一個。
在本發明的外字管理系統中,特徵在於,所述外字管理伺服器具有:系統間外字對應資料生成處理部,生成用於使在不同的兩個以上的組織體的電腦系統間所保有的外字資訊建立對應關係的系統間外字對應資料,所述系統間外字對應資料至少包括兩個以上的組織體間的電腦系統中的外字的識別碼的對應表。
由此,即使是在各組織體的電腦系統中隨時任意新登記外字的狀況下,也可以使這些組織間的外字的資訊建立對應關係。
如以上說明,根據本發明的外字管理系統,能夠針對在各種組織體中隨時任意新發生且被採用/登記的外字收集/蓄積資訊並受理來自各組織體的外字的對照,從而對所有的外字體系進行一元化管理。
此外,即使在各組織體的電腦系統中隨時任意新登記外字的狀況下,也能夠對其一元化地建立對應關係,針對在各組織體中新發生且被採用/登記的外字也能夠建立對應關係。
圖1是示意性表示本發明的外字管理系統的整體構成的圖。
圖2是示意性表示圖1所示的外字管理伺服器的內部(系統)構成的圖。
圖3是示意性表示圖2所示的外字主要資料庫的資料表構成例的圖。
圖4是示意性表示圖1所示的其中一個組織體的電腦系統的內部(系統)構成的圖。
圖5是表示本發明的外字管理系統中的外字對照/登記處理的流程的流程圖。
圖6是表示在本發明的外字管理系統中生成的系統間外字對應資料的資料表構成例的圖。
圖7是在本發明的外字管理系統中使用戶選擇登記外字的候補時的畫面顯示例。
圖8是用於說明在日本使用的漢字的異體字的圖。
圖9是用於說明在不同的組織體的電腦系統中被登記的標準文字群以及外字群的狀況的圖。
以下,參照附圖,詳細說明用於實施本發明的外字管理系統的優選實施方式。圖1~圖7是例示本發明的實施方式的圖,在這些圖中,附加了同一符號的部分表示同一物,基本的構成以及動作是相同的。
系統構成
圖1是示意性表示本發明的外字管理系統的整體構成的圖。
如圖1所示,本發明的外字管理系統取如下的方式,即,通過通訊網路,連接了作為伺服器側的外字管理伺服器和作為客戶側的多個組織體的電腦系統。
圖2是示意性表示圖1所示的外字管理伺服器的內部(系統)構成的圖。
在圖2中,外字管理伺服器具有資料庫群,該資料庫群包括:外字主要資料庫,保有外字的字形、識別碼、對應正字資訊、部首資訊、意思資訊等;類似性資料庫,保有與外字字形的類似性相關的資訊;以及顧客資訊資料庫,保有作為本外字管理系統的利用者的顧客的資訊。此外,作為軟體處理部,具有:外字主編輯處理部,編輯外字主要資料庫的登記內容;軟體配置處理部,針對作為利用者的各組織體配置用於利用本外字管理系統的軟體並進行更新;外字資訊取得處理部,從作為利用者的各組織體取得新登記的外字的資訊;以及系統間外字對應資料生成處理部,生成用於使在不同的組織體的系統間所保有的外字資訊建立對應關係的資料。此外,具備輸入輸出單元、通訊單元、暫時儲存單元等一般的處理所需的手段。
圖3是示意性表示圖2所示的外字主要資料庫的資料表構成例的圖。
在圖3中,外字主要資料庫針對各外字保有用於識別的外字代碼、字形資料、對應的正字的資訊、作為字形的構成要素的部首的資訊、意思資訊、採用該外字的顧客系統中的識別碼(顧客固有代碼1,2,...)。
圖4是示意性表示圖1所示的其中一個組織體的電腦系統的內部(系統)構成的圖。
在圖4中,組織體的電腦系統作為已有的文字基礎管理系統,具有正字資料庫、外字資料庫以及外字登記處理部(在此,僅表示與本發明相關聯的構成要素)。此外,作為與本發明的外字管理系統相關的軟體群,具有外字主要資料庫對照部、類似性判定處理部以及新外字登記處理部。此外,具備輸入輸出單元、通訊單元、暫時儲存單元等一般的處理所需的手段。
外字管理處理的詳細
以下,詳細說明圖1~4所示那樣構成的本發明的外字管理系統中的外字管理處理的詳細情況。
(1)外字對照/登記處理
在組織體的電腦系統中處理新的(文字基礎管理系統未保有的)外字的情況下,該系統所裝的外字管理軟體進行新的外字的對照/登記處理。
圖5是表示該外字對照/登記處理的流程的流程圖。
在圖5中,若受理外字的字形資料(手寫文字資料等)的輸入,則首先,參照本系統的外字資料庫,與已登記的外字進行對照。對照通過字形的比較來進行,基於預定的基準判定字形是否一致。在此,設為本系統的外字資料庫中無登記的情況。
因此,外字管理軟體通過外字主要資料庫對照部,參照外字管理伺服器的 外字主要資料庫,對輸入外字和已登記的外字進行對照。
在有登記的情況下,取得該外字的記錄。接受所述的記錄,文字基礎管理系統的外字登記處理部將輸入外字的字形資料和該外字的資訊登記到外字資料庫。此時,向外字管理伺服器通知賦予給輸入外字的文字代碼,在外字主要資料庫中登記為該外字在該系統中的顧客固有代碼。
在沒有登記的情況下,進一步參照外字主要資料庫,檢索具有與輸入外字的字形在一定程度以上字形類似的字形的外字,取得該外字的資訊。外字管理軟體的類似性判定處理部利用外字管理伺服器的類似性資料庫,在所取得的外字之中,判定與輸入外字字形最類似的外字,並在外字資料庫登記輸入外字的字形資料和該外字的資訊。該類似性判定處理可以通過利用了基於已知的類似文字識別技術蓄積在類似性資料庫中的讓步的軟體處理自動進行。或者,也可以使用戶從幾個候補中進行選擇等半自動地進行。此時,向外字管理伺服器通知賦予給輸入外字的文字代碼,在外字主要資料庫中登記為該外字在該系統中的顧客固有代碼。
即使參照外字主要資料庫也沒有發現具有與輸入外字的字形在一定程度以上字形類似的字形的外字的情況下,輸入外字被登記為新外字。
文字基礎管理系統的外字登記處理部受理與輸入外字對應的正字、讀法、意思等資訊(優選是以圖3所示的外字主要資料庫的登記資訊為准的資訊專案)的輸入,在外字資料庫登記輸入外字的字形資料和它們的資訊。
外字管理軟體通過新外字登記處理部取得在外字資料庫新登記的外字的資訊(包括賦予給該外字的文字代碼),併發送給外字管理伺服器。
接收了這些資訊的外字管理伺服器的外字資訊取得處理部在外字主要資料 庫中作為新的外字來進行登記處理。
通過具有以上的外字對照/登記處理的功能,在本發明的外字管理系統中,在作為本系統的利用者的多個組織體的任一個中輸入了新的外字的情況下,即使該組織體的文字基礎管理系統並未保有,也能夠針對外字管理伺服器的外字主要資料庫所保有的外字,在與其登記資訊進行關聯的基礎上在該文字基礎管理系統中登記為新的外字。此外,針對該組織體的文字基礎管理系統和外字管理伺服器的外字主要資料庫都未保有的新的外字,也能夠在這兩者中登記為新的外字。
即,外字管理伺服器能夠保有本系統的利用者空間內的所有外字的資訊,各組織體的文字基礎管理系統能夠始終保有與外字管理伺服器所保有的外字資訊建立了關聯的外字資訊。
另外,如果是開始新利用本系統的組織體,則優選針對該組織體的文字基礎管理系統所保有的所有的外字資訊,進行外字對照/登記處理。由此,能夠吸收該文字基礎管理系統所保有但外字管理伺服器未保有的外字的資訊,且能夠使該文字基礎管理系統所保有的外字資訊與外字管理伺服器所保有的外字資訊建立關聯。
(2)系統間外字對應資料生成處理
如上所述,各組織體的文字基礎管理系統始終保有與外字管理伺服器所保有的外字資訊建立了關聯的外字資訊。但是,在不同組織體的文字基礎管理系統彼此之間,所保有的外字資訊不可能完全一致。因此,在這些組織體的電腦系統間進行資訊通訊時,會發生無法識別的外字。
為了應對該問題,本發明的外字管理系統通過外字管理伺服器的系統間外字對應資料生成處理部,進行生成系統間外字對應資料的處理。該生成處理回應於來自任意組織體的外字管理軟體的請求來進行,或者回應於外字管理伺服器的管理者進行的指示/操作來進行。或者,也可以在滿足預先設定的規定條件時進行。
規定條件是指,例如每隔一定期間生成(更新)或在相關的組織體系統中存在新的外字登記時生成(更新)等。
圖6是表示在本發明的外字管理系統中生成的系統間外字對應資料的資料表構成例的圖。
圖6例示的A公司與B公司之間的系統間外字對應資料針對各外字記錄包括外字管理伺服器的外字主要資料庫中的外字代碼、A公司系統中的固有代碼、B公司系統中的固有代碼等。在此,外字管理伺服器的外字主要資料庫的外字代碼和/或字形資料不是必要構成要素。
在受理了這樣生成的系統間外字對應資料的A公司系統以及B公司系統中,能夠使本系統所保有的外字和對方系統所保有的外字一對一地建立對應關係,因此即使互相所保有的外字的體系不同,也能夠毫無問題地進行兩者間的資料交換等處理。
其他的系統構成例
本發明的外字管理系統能夠取在上述中說明的方式以外的系統構成。
例如,可以是在外字管理伺服器側配置圖4所示的各組織體的電腦系統中的外字管理軟體的功能的構成。此時,外字管理伺服器還具備圖4所示的外字主要資料庫對照部、類似性判定處理部以及新外字登記處理部。另一方面,在 各組織體的電腦系統中,變成僅具有訪問外字管理伺服器且進行必要的資訊通訊的功能的系統構成(所謂的ASP型、雲型的系統構成)。此時,外字管理伺服器的新外字登記處理部有必要具備用於在各組織體的電腦系統中迅速檢測存在新的外字登記的情況並取得其資訊的任意構成。此外,在外字管理伺服器中不需要軟體配置處理部。
本發明的外字管理系統通過該系統構成,能夠執行在上述中說明的外字管理處理。
又一其他系統構成例
另外,本發明的外字管理系統中的類似性判定處理部可以取在上述中說明的方式以外的構成。
在本例中,圖2所示的外字管理伺服器的外字主要資料庫分組儲存外字。外字的分組化方法如以下所示那樣有多種,可以完成其中的一個或多個分組化。
(1)與相同的正字對應的組
例如,分組了與正字「斉」對應的「齋」、「齎」、「齊」(以上均為日語漢字)、...等。
(2)意思不同但字形的類似度高的組
例如,分组了「柿(日語讀音『
Figure 109105915-A0305-02-0017-13
』,在日語裡是木屑或薄木板的意思)」和「柿(日語讀音『
Figure 109105915-A0305-02-0017-14
』,在日語裡是柿子的意思)」等。
(3)字形的類似度低但是意思相同或字的組成相同的組
例如,分组了「野」和「埜」(日語讀音都是「
Figure 109105915-A0305-02-0017-15
」)等。
外字主要資料庫還針對上述的外字組所包含的各外字儲存預定的推薦度。推薦度可以由本系統管理者任意設定,例如,可以使用IPA或JIS的水準。
在圖4所示的組織體的電腦系統中,輸入外字的字形資料,外字管理軟體通過外字主要資料庫對照部參照外字管理伺服器的外字主要資料庫,對輸入外字和已登記的外字進行對照,在不存在字形一致的外字的登記的情況下,如上所述那樣,類似性判定處理部進一步參照外字主要資料庫,以字形的類似度為線索,從登記外字取得對應的候補。
此時,類似性判定處理部能夠以上述的外字組為單位取得候補。例如,在輸入外字與「齋」類似的情況下,將屬於與正字「斉」對應的組的全部登記外字作為候補來取得。此時,還一併取得該組內的各登記外字的推薦度的資訊。
從外字管理伺服器的外字主要資料庫取得了與輸入外字對應的多個登記外字的候補的類似性判定處理部向用戶提示該候補,並敦促用戶選擇。此時,能夠以與推薦度相應的序列顯示登記外字的候補,誘導用戶容易選擇推薦度高的登記外字。圖7表示這種畫面顯示的例。或者,也可以以與推薦度相應的序列僅顯示推薦度在一定值以上的候補。或者,也可以不依賴於用戶選擇,而是自動起用推薦度最高的候補。
通過這種構成,在各組織體的電腦系統中能夠促進推薦度高的外字的起用。即,在用戶側的各組織體中,不需要特定的成本或勞動力就能夠實現根據文字基礎資訊的配備以及國際標準化這樣的政策的外字管理系統的運用。
以上,示出了以日文漢字為例的具體的實施方式說明了本發明的外字管理系統,但是本發明並不限於此。本領域中具有通常知識者應當能夠在不 脫離本發明的宗旨的範圍內,對上述各實施方式中的外字管理伺服器、各組織體的電腦系統等的構成以及功能施加各種變更、改良。
〔產業上的可利用性〕
如圖1~7所示,本發明的外字管理系統可通過在包括電腦的CPU、記憶體、輔助儲存裝置、顯示器、輸入裝置等的硬體資源上構築的OS、應用程式、資料庫、網路系統等實現,並且可使用上述的硬體資源具體地實現外字的登記資訊的管理這樣的資訊處理,因此相當於利用了自然法則的技術思想,能夠在軟體產業中加以利用。

Claims (19)

  1. 一種外字管理系統,包括多個組織體的電腦系統和外字管理伺服器,其中,所述外字管理伺服器具有:外字主要資料庫,儲存外字的字形資料、該外字管理伺服器中的識別碼、一個以上的所述組織體的電腦系統中的識別碼;顧客資訊資料庫,儲存與多個所述組織體相關的資訊;外字主編輯處理部,編輯所述外字主要資料庫的登記內容外字資訊取得處理部,取得在所述組織體的電腦系統中新登記的外字的資訊並登記到所述外字主要資料庫;以及系統間外字對應資料生成處理部,生成用於使在不同的兩個以上的組織體的電腦系統間所保有的外字資訊建立對應關係的系統間外字對應資料,所述系統間外字對應資料至少包括兩個以上的組織體間的電腦系統中的外字的識別碼的對應表,所述組織體的電腦系統具有外字管理軟體,該外字管理軟體與該電腦系統所保有的文字基礎管理系統聯動地工作且具備:外字主要資料庫對照部,參照所述外字管理伺服器的外字主要資料庫,對照外字;類似性判定處理部,判定文字彼此的字形的類似性;以及新外字登記處理部,向所述外字管理伺服器發送在所述文字基礎管理系統中新登記的外字的資訊。
  2. 如請求項1所述的外字管理系統,其中,當輸入了所述組織體的電腦系統的文字基礎管理系統不具備資訊的第一外字時, 所述外字主要資料庫對照部參照所述外字管理伺服器的外字主要資料庫取得相應的外字的資訊,並提供給所述文字基礎管理系統。
  3. 如請求項2所述的外字管理系統,其中,針對所述第一外字,從所述外字管理伺服器的外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊並提供給所述文字基礎管理系統。
  4. 如請求項3所述的外字管理系統,其中,所述類似性判定處理部在參照所述外字主要資料庫取得了與所述第一外字的字形類似的兩個以上的外字的資訊的情況下,使用戶選擇採用哪個外字。
  5. 如請求項2所述的外字管理系統,其中,所述外字管理伺服器的外字主要資料庫儲存外字的分組資訊和屬於相應組的各外字的推薦度的資訊,針對所述第一外字,在從所述外字管理伺服器的外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊、與該一個以上的外字屬於同一組的外字及其推薦度的資訊,根據推薦度的序列向用戶提示所取得的外字,使用戶選擇採用哪個外字。
  6. 如請求項2所述的外字管理系統,其中,所述外字管理伺服器的外字主要資料庫儲存有外字的分組資訊和屬於相應組的各外字的推薦度的資訊, 針對所述第一外字,在從所述外字管理伺服器的外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊、與該一個以上的外字屬於同一組的外字及其推薦度的資訊,在所取得的外字之中採用推薦度最高的外字。
  7. 如請求項3至6中任一項所述的外字管理系統,其中,所述外字管理伺服器具有保有與字形的類似性相關的資訊的類似性資料庫,所述類似性判定處理部在從所述外字主要資料庫取得與所述第一外字的字形類似的一個以上的外字的資訊時,參照所述外字管理伺服器的類似性資料庫來判定字形的類似性。
  8. 如請求項2至6中任一項所述的外字管理系統,其中,針對所述第一外字,在從所述外字管理伺服器的外字主要資料庫無法取得資訊且也無法取得字形類似的外字的資訊的情況下,所述新外字登記處理部取得在相應文字基礎管理系統中作為外字新登記時所賦予的該第一外字的識別碼,將新登記的外字的資訊包含在內發送給所述外字管理伺服器。
  9. 如請求項1至6中任一項所述的外字管理系統,其中,所述外字管理伺服器的外字主要資料庫儲存外字的對應正字資訊、部首資訊以及意思資訊之中的至少一個。
  10. 如請求項1至6中任一項所述的外字管理系統,其中,所述外字管理伺服器具有針對所述各組織體的電腦系統組態所述外字管理軟體並進行更新的軟體配置處理部。
  11. 一種外字管理系統,包括與多個組織體的電腦系統所保有的文字基礎管理系統聯動地進行外字管理的外字管理伺服器,其中,所述外字管理伺服器具有:外字主要資料庫,儲存外字的字形資料、該外字管理伺服器中的識別碼、一個以上的所述組織體的電腦系統中的識別碼;顧客資訊資料庫,儲存與多個所述組織體相關的資訊;外字主編輯處理部,編輯所述外字主要資料庫的登記內容;外字主要資料庫對照部,使所述組織體的電腦系統進行參照了所述外字主要資料庫的外字的對照;類似性判定處理部,判定文字彼此的字形的類似性;外字資訊取得處理部,取得在所述組織體的電腦系統的文字基礎管理系統中新登記的外字的資訊並登記到所述外字主要資料庫;以及系統間外字對應資料生成處理部,生成用於使在不同的兩個以上的組織體的電腦系統間所保有的外字資訊建立對應關係的系統間外字對應資料,所述系統間外字對應資料至少包括兩個以上的組織體間的電腦系統中的外字的識別碼的對應表。
  12. 如請求項11所述的外字管理系統,其中,當輸入了所述組織體的電腦系統的文字基礎管理系統中沒有資訊的第一外字時, 從該電腦系統接收了該第一外字的資訊的所述外字管理伺服器通過所述外字主要資料庫對照部,參照所述外字管理伺服器的外字主要資料庫取得相應的外字的資訊並提供給該電腦系統。
  13. 如請求項12所述的外字管理系統,其中,針對所述第一外字,在從所述外字主要資料庫無法取得資訊的情況下,所述外字管理伺服器通過所述類似性判定處理部,參照所述外字主要資料庫取得與該第一外字的字形類似的一個以上的外字的資訊並提供給相應電腦系統。
  14. 如請求項13所述的外字管理系統,其中,所述類似性判定處理部在參照所述外字主要資料庫取得了與所述第一外字的字形類似的兩個以上的外字的資訊的情況下,向相應電腦系統提示所述兩個以上的外字的資訊,使得選擇採用哪個外字。
  15. 如請求項12所述的外字管理系統,其中,所述外字主要資料庫儲存外字的分組資訊和屬於相應組的各外字的推薦度的資訊,針對所述第一外字,在從所述外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊以及與該一個以上的外字屬於同一組的外字及其推薦度的資訊並提供給相應電腦系統。
  16. 如請求項12所述的外字管理系統,其中,所述外字主要資料庫儲存外字的分組資訊和屬於相應組的各外字的推薦度的資訊, 針對所述第一外字,在從所述外字主要資料庫無法取得資訊的情況下,所述類似性判定處理部參照所述外字主要資料庫,取得與該第一外字的字形類似的一個以上的外字的資訊以及與該一個以上的外字屬於同一組的外字及其推薦度的資訊,並從所取得的外字之中將推薦度最高的外字提供給相應電腦系統。
  17. 如請求項13至16中任一項所述的外字管理系統,其中,所述外字管理伺服器具有保有與字形的類似性相關的資訊的類似性資料庫,所述類似性判定處理部在從所述外字主要資料庫取得與所述第一外字的字形類似的一個以上的外字的資訊時,參照所述外字管理伺服器的類似性資料庫來判定字形的類似性。
  18. 如請求項12至16中任一項所述的外字管理系統,其中,所述外字資訊取得處理部取得在相應文字基礎管理系統中作為外字新登記時所賦予的所述第一外字的識別碼,將新登記的外字的資訊包含在內登記到所述外字管理伺服器。
  19. 如請求項11至16中任一項所述的外字管理系統,其中,所述外字管理伺服器的外字主要資料庫儲存外字的對應正字資訊、部首資訊以及意思資訊之中的至少一個。
TW109105915A 2019-10-23 2020-02-24 外字管理系統 TWI747172B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-192783 2019-10-23
JP2019192783A JP6713657B1 (ja) 2019-10-23 2019-10-23 外字管理システム

Publications (2)

Publication Number Publication Date
TW202117580A TW202117580A (zh) 2021-05-01
TWI747172B true TWI747172B (zh) 2021-11-21

Family

ID=71103986

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109105915A TWI747172B (zh) 2019-10-23 2020-02-24 外字管理系統

Country Status (3)

Country Link
JP (1) JP6713657B1 (zh)
CN (1) CN112699210B (zh)
TW (1) TWI747172B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009532A (ja) * 2008-06-30 2010-01-14 Fujitsu Ltd 変換管理装置
CN103186511A (zh) * 2011-12-31 2013-07-03 北京大学 汉字造字方法和设备、构造字体库的方法
CN104424196A (zh) * 2013-08-20 2015-03-18 北大方正集团有限公司 补字的排序存储方法及装置、创建补充字库的方法及装置
TW201527990A (zh) * 2014-01-06 2015-07-16 Academia Sinica 雲端字形服務系統
CN105528345A (zh) * 2014-09-28 2016-04-27 北大方正集团有限公司 终端、服务器和补字方法
JP2016162040A (ja) * 2015-02-27 2016-09-05 株式会社日立製作所 文書データ処理方法およびシステム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5151697A (en) * 1990-10-15 1992-09-29 Board Of Regents Of The University Of Washington Data structure management tagging system
US6389166B1 (en) * 1998-10-26 2002-05-14 Matsushita Electric Industrial Co., Ltd. On-line handwritten Chinese character recognition apparatus
US6603478B1 (en) * 2000-04-21 2003-08-05 Dynalab, Inc. System, method and a computer readable medium for improving character access
JP3602480B2 (ja) * 2001-07-12 2004-12-15 株式会社リコー フォント提供システム、フォント切替システム、文字検索システム、フォント管理サーバ、そのクライアント、フォント提供方法、フォント切替方法、文字コード変換方法、文字検索方法、及びそのプログラム
JP2004334708A (ja) * 2003-05-09 2004-11-25 Nec System Technologies Ltd 外字管理システムおよび外字管理方法
CN1801050A (zh) * 2005-01-06 2006-07-12 名伦通讯科技公司 输入国际语文文字的系统及方法
TW200919210A (en) * 2007-07-18 2009-05-01 Steven Kays Adaptive electronic design
JP2010165302A (ja) * 2009-01-19 2010-07-29 National Printing Bureau 外字検索システム及び外字検索方法
US20100231598A1 (en) * 2009-03-10 2010-09-16 Google Inc. Serving Font Glyphs
CN106294742B (zh) * 2016-08-10 2019-05-14 中国科学技术大学 一种航天发射场安全可靠性数据库构建方法及分析与评估系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009532A (ja) * 2008-06-30 2010-01-14 Fujitsu Ltd 変換管理装置
CN103186511A (zh) * 2011-12-31 2013-07-03 北京大学 汉字造字方法和设备、构造字体库的方法
CN104424196A (zh) * 2013-08-20 2015-03-18 北大方正集团有限公司 补字的排序存储方法及装置、创建补充字库的方法及装置
TW201527990A (zh) * 2014-01-06 2015-07-16 Academia Sinica 雲端字形服務系統
CN105528345A (zh) * 2014-09-28 2016-04-27 北大方正集团有限公司 终端、服务器和补字方法
JP2016162040A (ja) * 2015-02-27 2016-09-05 株式会社日立製作所 文書データ処理方法およびシステム

Also Published As

Publication number Publication date
CN112699210A (zh) 2021-04-23
TW202117580A (zh) 2021-05-01
JP6713657B1 (ja) 2020-06-24
CN112699210B (zh) 2024-07-05
JP2021068166A (ja) 2021-04-30

Similar Documents

Publication Publication Date Title
JP5862893B2 (ja) 文書分析システム、文書分析方法及び文書分析プログラム
US20220222292A1 (en) Method and system for ideogram character analysis
WO2019194051A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP2016024488A (ja) 画像処理装置および画像処理装置の制御方法
TWI747172B (zh) 外字管理系統
US20230186028A1 (en) Information processing apparatus, information processing method, and storage medium
US8265377B2 (en) Cursive handwriting recognition with hierarchical prototype search
JP2009093581A (ja) 類義語検索管理システム
JP2011154602A (ja) 文字列管理装置、文字列登録方法、文字列検索方法および文字列管理プログラム
US20120201420A1 (en) Object Recognition and Describing Structure of Graphical Objects
US9224040B2 (en) Method for object recognition and describing structure of graphical objects
JP6807201B2 (ja) 情報処理装置
JP2016111482A (ja) 画像処理装置および画像処理装置の制御方法
CN114782971B (zh) 一种财务凭证图像识别方法及系统
JP2010134766A (ja) 文書データ処理装置およびそのプログラム
JP7017027B2 (ja) 検索装置、検索プログラム、および検索システム
JPH1173392A (ja) ユーザid決定方法及び方式
JP3868303B2 (ja) 名称変換プログラム及び装置
JPH10162103A (ja) 文字認識装置
KR101393642B1 (ko) 문서 인식 장치 및 방법과 이에 관한 기록매체
JP2000029891A (ja) リレーショナルデータベース管理システムへのデータ作成装置
JPH10207606A (ja) 文字入力方式
JP2004094802A (ja) 光学的文字認識装置および同装置の訂正入力制御方法
JP2015213289A (ja) 画像処理装置および画像処理装置の制御方法
TW201820121A (zh) 電子檔案資料擷取系統及其方法