TWI418997B - Intelligent template comparison of Chinese address translation methods and computer program storage media - Google Patents

Intelligent template comparison of Chinese address translation methods and computer program storage media Download PDF

Info

Publication number
TWI418997B
TWI418997B TW99118072A TW99118072A TWI418997B TW I418997 B TWI418997 B TW I418997B TW 99118072 A TW99118072 A TW 99118072A TW 99118072 A TW99118072 A TW 99118072A TW I418997 B TWI418997 B TW I418997B
Authority
TW
Taiwan
Prior art keywords
address
code
street
chinese
information
Prior art date
Application number
TW99118072A
Other languages
English (en)
Other versions
TW201145047A (en
Original Assignee
Chunghwa Telecom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chunghwa Telecom Co Ltd filed Critical Chunghwa Telecom Co Ltd
Priority to TW99118072A priority Critical patent/TWI418997B/zh
Publication of TW201145047A publication Critical patent/TW201145047A/zh
Application granted granted Critical
Publication of TWI418997B publication Critical patent/TWI418997B/zh

Links

Landscapes

  • Machine Translation (AREA)

Description

智慧型樣板比對中文地址轉譯方法及其電腦程式的儲存媒體
本發明係關於一種地址轉換方法,特別係一種可自動將客戶地址轉換為系統可處理之代碼格式地址之方法,不需透過系統畫面點選街道門牌資訊或人工輸入代碼,即可達到自動化代碼置換之機制。
地址資料一直是企業與客戶間聯繫溝通的重要橋樑,掌握正確的客戶地址,企業便能有效進行各項行銷業務的分析與推廣,其中準確且即時地提供、滿足客戶所需服務更是建立及鞏固忠實顧客群的不二法門,故企業必須能有效掌握、處理地址資訊,在客戶有需求時立即準確定位並調派相關資源以提供最即時之服務。
為有效處理全國繁雜的地址資料,目前已有許多利用代碼代表中文地址的方法論、裝置或系統,其中以降低儲存空間、不同語言地址資料彼此互譯、代碼表規劃為主要的發展軸。
然而詳加審視,可發現其大都著重在規劃一套以代碼取代中文地址的方法,據此建立代碼資料庫,爾後即可透過系統畫面以點選地名或直接輸入代碼之方式即刻產生地址代碼並儲存,欲讀取出中文地址時,再直接自代碼轉譯為中文地址並輸出。如中華民國專利公告第I235930號「客戶地址多重模式輸入及五碼郵遞區號轉換方法」及第I292878號「利用代碼方式轉換原始地址資料以達到減少地址儲存空間的方法」所揭示之重點均在如何以代碼方式輸入並儲存地址,可看出自地址代碼轉為中文地址之技術已然漸趨成熟,但對於如何直接自中文地址轉換為地址代碼的方法則未有相關且詳細的揭露。
雖然代碼機制能加速處理流程並節省資料的儲存空間,但在操作時須先知道對應的代碼或編碼方法,方能順利轉換。
即便利用如同中華民國專利公告第I235930號「客戶地址多重模式輸入及五碼郵遞區號轉換方法」所提出之智慧型的畫面輸入地址資料的系統能減少人工查找地址代碼之麻煩,但系統畫面仍需使用者依照縣、市、鄉、鎮、街道、巷弄、號、棟、樓、室等地址單位分別輸入資料才能有效轉換,就操作上仍有些許不便,若能直接輸入中文地址再由系統自行轉換為地址代碼並處理,定能更加提升整體程序的處理效率並創造更多的機會與商機。特別於大量資料輸入時,此效益將更加顯著。
由此可見,上述習用方式仍有諸多缺失,實非一良善之設計,而亟待加以改良。
本案發明人鑑於上述習用方式所衍生的各項缺點,乃亟思加以改良創新,並經多年苦心孤詣潛心研究後,終於成功研發完成本件一種智慧型樣板比對中文地址轉譯方法及其電腦程式的儲存媒體。
本發明之主要目的在於提供一種可重覆使用且多方共用之簡便應用程序(Application Programming Interface,API),使各類有轉換中文地址需求之系統或使用者均能簡單運用,只要使用者端機器同時運作此應用程序,以及任一可分層傳送地址資訊於用戶端之資訊派送應用程序,即使不安裝複雜的應用系統,亦能達成轉換之效。
本發明之次要目的在於提供一種訂單受理系統處理大批批次檔案產生大量訂單資料時,可直接將中文地址轉為代碼格式地址資料之轉換方法,除能減少操作畫面時需分欄填寫地址資料所浪費的操作時間,更能避免訂單成立後還要請專人負責更正相關地址、處理資源調訂或施工異常狀況之延滯,準確完成服務,徹底落實顧客關係管理。
另外,由於現行供裝服務系統所使用的路名代碼對應之街道單位相當繁雜,除常用的路、街之外,巷、弄、鄰、里、村、段、號…等地址單位甚或其所衍生之各類特殊組合,如”里+巷”、”路+巷+弄+衖”…等皆有可能成為尋找路名代碼之比對單位。除此之外,由於早期無法順利處理文字巷弄或地標的問題,亦建立了許多稀奇古怪的文字巷弄代碼,其涵蓋之地址單位更是廣泛,搜尋此類特殊文字巷弄代碼之困難度實不亞於前述之路名代碼亦或甚艱,致使直接自中文地址轉換為代碼格式地址之效能遲遲無法達成,實為現行智慧型的畫面輸入地址資料的系統之憾。
針對前述需求,本發明亦能提供一種可直接並自動化轉換中文地址為代碼格式地址的方法。透過位於使用者端之可分層傳送地址資訊的資訊派送應用程序的輔助,縮小搜尋比對範圍並提升效率,藉以解決因街道單位、特殊文字巷弄單位過於冗雜造成先前技術轉換困難的問題。
為達上述目的,本發明所揭露之智慧型樣板比對中文地址轉譯方法包含下列步驟:
一、啟動使用者端可分層傳送地址資訊的資訊派送應用程序。此應用程序所使用之地址資訊乃依「大於0之N級行政區、街道單位、街道資訊」架構分別存取。以中華民國行政區規劃架構為例,共可分成「一級行政區、二級行政區、街道單位、街道資訊」等四層架構,初始時僅載入一級行政區資料,其後可依需求,分層載入二級行政區、街道單位及詳細街道資訊;
二、中文地址正規化,例如,將輸入資料一律轉換為半形字體,再將簡體字轉為繁體字,一律以阿拉伯字數表示數字…等;
三、以下列各種RegularExpression Parser分層進行地址單位關鍵字剖析,取得各地址關鍵字前之關鍵詞,例如,「仁愛路」經剖析後,可確認其關鍵字為「路」,而其關鍵詞為「仁愛」;
1.行政區Parser(國家,一級行政區,二級行政區):((.{1,})國|(.{1,})縣|(.{1,})市)((.{1,})市|(.{1,})鄉|(.{1,})鎮|(.{1,})區)(.{1,})
2.里村Parser(里,村):((.{1,})里|(.{1,})村)(.{1,})
3.鄰Parser(鄰):(([0-9]{1,3})鄰)(.{1,})
4.路街Parser(路,街):(((.{1,})路|(.{1,})街))(.{1,})
5.段Parser(段):(([0-9]{1,2})段|([一,二,三,四,五,六,七,八,九,十]{1,1})段)(.{1,})
6.巷弄Parser(巷,弄):((.{1,5})巷|(.{1,5})弄)(.{1,})
7衖號Parser(衖,號):((.{1,4})衖|([0-9]{1,4})號)(.{1,})
8.號之Parser(號之):((^之{1,1})([0-9]{1,3}$))|((^之{1,1})([0-9]{1,3})([]{1,})(.{1,}))
9.棟樓Parser(棟,樓):((.{1,3})棟|(.{1,3})樓)(.{1,})
10.樓之Parser(樓之):((^之{1,1})(.{1,3}$))|((^之{1,1})(.{1,3})([]{1,})(.{1,}))
11.室Parser(室):((.{1,4})室)(.{1,})
12.室之Parser(室之):((^之{1,1})(.{1,3}$))|((^之{1,1})(.{1,3})([]{1,})(.{1,}))
四、提取地址資訊集中的第一層資訊集合─一級行政區,例如,載入「台中縣」資訊集合並包含其下所有二級行政區之名稱;
五、提取地址資訊集合中的第二層資訊集合─二級行政區,例如,載入「和平鄉」資訊集合並包含其下所有街道單位;
六、提取地址資訊集合中的第三層資訊集合─街道,例如,跟據步驟三所解析出來的街道單位取得台中縣和平鄉「路」資訊集合,包含所有台中縣和平鄉「路」的路名及其路名代碼;
七、尋找路名代碼,例如,將扣除了行政區名稱後剩下的中文地址與步驟六的資訊集合內容一一比對,找出最大相似者並輸出該代碼,若無相似者則再返回步驟六,提取其他街道資訊集合進行搜尋,否則提示查無對應之路名代碼;
八、尋找特殊文字巷弄代碼,例如,若步驟七所尋得之路名代碼可對應到某一特殊文字巷弄資訊集合,則取得該資訊集合,並將其內容一一與扣除街道名稱後所剩餘的中文地址進行比對,找出最大相似者並輸出該代碼,若無則移至步驟九;
久、組成簡式代碼格式地址資料,例如,將除了行政區名稱、街道名稱與特殊文字巷弄名稱之外,由步驟三所取得之各地址單位關鍵詞組成簡寫代碼格式;
十、產生標準格式的代碼地址資料,例如,將步驟七、步驟八、步驟九所得到之資料轉為標準代碼格式資料,產生標準代碼格式地址資料並輸出。
請參閱圖一所示,為本發明一種智慧型樣板比對中文地址轉譯方法之流程圖,其步驟包含:步驟一: 使用可分層傳送地址資訊的資訊派送應用程序,並將依照圖二所示之中華民國行政區規劃架構劃分為「一級行政區、二級行政區、街道單位、街道資訊」等四層架構儲存為地址資訊集100;步驟二:對欲轉譯之中文地址進行正規化程序,使其以易於辨識之國字數字表示101;步驟三:將正規化後的中文地址分層進行地址單位關鍵字剖析程序,取得各地址關鍵字前之關鍵詞102;步驟四:依據上述剖析結果,提取地址資訊集的第一層資訊集合103,並請參閱圖三及圖四所示,包含一級行政區及其下所有二級行政區之名稱,若無法提取,則輸出錯誤訊息,請使用者檢視原始資料是否錯誤,更正後再重新進行轉換;步驟五:依所提取之二級行政區之名稱從地址資訊集中提取包含其下所有街道單位104,並請參閱圖五所示;步驟六:依所提取之街道單位從地址資訊集中提取其資訊集合,包含路名及其路名代碼105;步驟七:將扣除了行政區名稱後剩下的欲轉譯之中文地址與步驟六的資訊集合內容一一比對,找出最大相似者並輸出該代碼,若無相似者則再返回步驟六106,提取其他街道資訊集合進行搜尋,否則提示查無對應之路名代碼107;步驟八:若步驟七所尋得之路名代碼可對應到某一特殊文字巷弄資訊集合,則取得該資訊集合,並將其內容一一與扣除街道名稱後所剩餘的中文地址進行比對,找出最大相似者並輸出該代碼108;步驟九:組成簡式代碼格式地址資料,將除了行政區名稱、街道名稱與特殊文字巷弄名稱之外,由步驟三所取得之各地址單位關鍵詞組成簡寫代碼格式109;步驟十:將步驟七、步驟八及步驟九所得到之資料轉為標準代碼格式資料,產生標準代碼格式地址資料並輸出110。
請參閱圖六所示,為本發明一種智慧型樣板比對中文地址轉譯方法於尋找路名代碼之第一實施流程圖,其步驟包含:步驟一:以扣除行政區名稱後的中文地址為輸入內容200;步驟二:若地址關鍵字剖析結果有明確的街道單位201,則於提取該二級行政區內對應的地址單位資訊集合,與輸入內容進行比對202;步驟三:若該二級行政區包含其他特殊標地標資訊集合203,則提取其他地標地址資料集中尋找中文地址之子集204並與輸入內容進行比對;步驟四:取出所有比對合格之地址資料,找出最大子集(最相似者)205,擇取最大相似者之路名代碼並輸出或是錯誤提示206。
請參閱圖七所示,為本發明一種智慧型樣板比對中文地址轉譯方法於尋找路名代碼之第二實施流程圖,其步驟包含:步驟一:以扣除行政區名稱後的中文地址為輸入內容300;步驟二:至地址資料集中鎖定一街道全名,輸出路名代碼與街道全名301,並結束流程;步驟三:判斷中文地址是否包含該街道全名302;步驟四:未包含該街道全名則在地址資料集中判斷是否尚有未比對的街道資料303;沒有則顯示錯誤訊息提示,有未比對的則回到步驟二。
請參閱圖八所示,為本發明一種智慧型樣板比對中文地址轉譯方法於尋找特殊文字巷弄代碼之實施流程圖,其步驟包含:步驟一:以扣除行政區名稱及街道名稱後的中文地址為輸入內容400;步驟二:若該輸入內容包含文字巷弄或無法以地址關鍵字辨別之資訊401,則以路名代碼進行搜尋,至特殊文字文字巷弄集中鎖定一特殊文字巷弄全名402;步驟三:判斷輸入內容是否與該潛在特殊文字巷弄資訊集合比對403,符合則擇取最大相似者之特殊文字巷弄代碼並輸出,並結束流程;不符合則顯示查無特殊文字巷弄訊息提示404,並結束流程。
以下以一實施案例,說明本發明種智慧型樣板比對中文地址轉譯方法,將中文地址:中縣和平鄉中興路三段環山一巷六十三號五樓A棟502室之3 轉譯為中華民國專利公告第I235930號所提出之簡式代碼格式:C G696 N63 GA F5 R502 M3 ,再轉譯為標準代碼格式:CG696 63 A 5 5023 之實施方式:請參閱圖一所示,圖中所示係為本發明中文地址轉換為代碼格式地址之流程示意圖,而以下將以圖一為闡述主軸,開始說明如何將上述中文地址轉為簡式代碼格式地址,再進一步將簡式代碼格式地址轉為標準代碼格式地址;首先,啟動使用者端任一可分層傳送地址資訊的資訊派送應用程序;其下所有地址資料均依照中華民國行政區規劃之5市18縣2直轄市架構分別儲存(請參閱圖二),並直接顯示各一級行政區之名稱,以利後續各提取地址資訊集合步驟之施行;接著,進行中文地址正規化,將未正規化輸入地址100「中縣和平鄉中興路三段環山一巷六十三號A棟五樓502室之3」進行下列正規化步驟:(1)全形轉半形:所有文字一律轉為半形字體;(2)使行政區名稱完整:將「中縣」以「台中縣」取代;(3)國字數字/阿拉伯數字轉換:將地址關鍵字”號、號之、樓、樓之、室、室之”所屬關鍵詞數字部分一律改以阿拉伯數字取代,即將「環山一巷六十三號A棟五樓502室之3」改為「環山一巷63號A棟5樓502室之3」;而“巷、弄、衖”需視其內容,若其關鍵詞全為國字數字,代表為單純的數字巷弄,可以阿拉伯數字全數取代,否則將維持原輸入的文字巷弄衖樣貌,不進行轉換,故「環山一巷」內的「一」不需改為數字「1」;接下來,將正規化後的中文地址「台中縣和平鄉中興路三段環山一巷63號A棟5樓502室之3」傳入地址單位關鍵字剖析程序101進行剖析:使用前述12項之RegularExpression Parser逐一解析,分析結果為「台中」縣「和平」鄉「中興路」路「三」段「環山一」巷「63」號「A」棟「5」樓「502」室之「3」,其中一級行政區為台中縣,二級行政區為和平鄉,街道單位為「路」、「巷」;依據上述剖析結果,鎖定一級行政區資訊集合之流程103將指示資訊派送應用程序提取一級行政區台中縣地址資訊集合,內容包含台中縣所轄之所有市、鄉、鎮名稱,如圖三及圖四;若無法提取,則輸出錯誤訊息,請使用者檢視原始資料是否錯誤,更正後再重新進行轉換。
鎖定一級行政區後,鎖定二級行政區地址資訊集合之流程104將指示資訊派送應用程序提取二級行政區和平鄉之地址資訊集合,內容包含和平鄉所轄之所有街道單位:”路、街、其他地標”等,如圖五;若前項剖析結果無二級行政區資料,則預設此一級行政區第一個所轄之二級單位為目前二級行政區。若無法提取,則輸出錯誤訊息,請使用者檢視原始資料是否錯誤,更正後再重新進行轉換;接續將進行尋找路名代碼流程105,因路名代碼為組成標準代碼格式地址資料之重要關鍵,萬不可缺,故另將詳細施行方法列於圖六,敬請參閱;依據上述剖析結果,本範例約略包含兩類街道單位”路”及”巷”,但和平鄉內所轄之街道單位僅”路、街、其他地標”,故判別201確認此例有明確的街道單位”路”;流程202將指示資訊派送應用程序提取和平鄉”路”街道單位地址資訊集合,並以不包含行政區資料之中文地址200「中興路三段環山一巷63號A棟5樓502室之3」為比對標的,而流程202將於該地址資訊集合中尋找子集,而此尋找子集之詳細流程則敬請參閱「圖七」。以此例而言,流程202尋得子集{中興路};無論是否有明確的街道單位,只要該二級行政區內含有「其他地標」地址資訊集合使判別203成立,則流程204皆將執行,於該其他地標地址資訊集合中尋找不包含行政區資料之中文地址200「中興路三段環山一巷63號A棟5樓502室之3」之子集,詳細流程同圖七。以此例而言,流程204尋得子集「中興路三段環山一巷」;匯整流程202及204所得之不包含行政區資料之中文地址200「中興路三段環山一巷63號A棟5樓502室之3」的地址資料子集{中興路,中興路三段環山一巷},經找尋與其最大相似者的流程205確認,因後者之街道名稱最長,故與其最為相似,輸出其路名代碼CG696予後續程序接續處理;若上述之地址資料子集不存在,且尚有未搜尋之二級行政區存在使判別106成立,則將重覆流程104,重新鎖定任一其他尚未搜尋之二級行政區,進行路名代碼搜尋。若已無尚未搜尋之二級行政區,則輸出錯誤訊息,請使用者檢視原始資料是否錯誤,更正後再重新進行轉換;因去除行政區與街道名稱後仍存在剩餘的中文地址400「63號A棟5樓502室之3」,使判別107成立,故需執行程序108,確認是否存在特殊文字巷弄之內容,詳細施行細節請參閱圖八;由於中文地址400「63號A棟5樓502室之3」不包含文字巷弄及無法以地址關鍵字剖析之內容,故判別401不成立,不需繼續進行特殊文字巷弄代碼之搜尋,直接移至圖一之流程109;若去除行政區與街道名稱後仍存在剩餘的中文地址400包含”巷”、”弄”或其他地址關鍵字剖析無法解譯之辭藻,例如,”後面”、”巷子口”、”廟口前”等奇怪字眼,則需進一步執行流程402至404,尋找中文地址400之地址資料子集,再輸出最大相似者之名稱與代碼;最後,運用流程109依照中華民國專利公告第I235930號「客戶地址多重模式輸入及五碼郵遞區號轉換方法」所訂定之簡式地址代碼格式,將前述各步驟所取得之路名代碼、特殊文字巷弄代碼及去除行政區與街道名稱後仍存在剩餘的中文地址400對應之地址關鍵字剖析結果組成簡式地址代碼格式。以此例而言,即將{CG700,「63」號「A」棟「5」樓「502」室之「3」}作為程序109之輸入內容,進而產生簡式代碼格式地址資料「C G696 N63 GA F5 R502 M3」;由於現行智慧型的畫面輸入地址資料的系統即具備讓使用者自行輸入簡式代碼格式地址資料,並將之轉為標準80Bytes地址代碼格式之功能,故可直接加以運用,以流程110將上述簡式代碼格式地址資料「C G696 N63 GA F5 R502 M3」轉換為「CG696 63 A 5 502 3」之標準地址代碼格式資料並輸出。
本發明所提供之智慧型樣板比對中文地址轉譯方法與其他現行智慧型的畫面輸入地址資料的系統相比較之下,具備下列優點:
1.本發明提供一種可直接自動化轉譯中文地址為代碼格式地址資料的方法,即使不需透過繁複的系統畫面操作,亦可進行轉換,提供更具效益且精確之服務品質。
2.本發明可有效縮小地址資料轉換時之搜尋範圍,大幅提升中文地址轉譯為代碼格式地址之效率。
3.本發明所提出之分層地址單位關鍵字剖析方法除可幫助進行中文地址與代碼格式地址的轉換,更能將其有效解構中文地址之功能廣泛應用於日後進行中文地址與其他不同語言地址間轉換,達成多向地址轉譯之效。
4.本發明可解決需額外耗費人工進行更正作業之缺點,有效減少不必要的人工往返滯延時間。
上列詳細說明係針對本發明之一可行實施例之具體說明,惟該實施例並非用以限制本發明之專利範圍,凡未脫離本發明技藝精神所為之等效實施或變更,均應包含於本案之專利範圍中。
綜上所述,本案不但在技術思想上確屬創新,並能較習用物品增進上述多項功效,應已充分符合新穎性及進步性之法定發明專利要件,爰依法提出申請,懇請 貴局核准本件發明專利申請案,以勵發明,至感德便。
100...中文地址
101...正規化
102...地址單位關鍵字剖析
103...鎖定一級行政區地址資料集
104...鎖定二級行政區地址資料集
105...尋找路名代碼
106...尚有未搜尋的二級行政區地址資料集
107...街道全名之後有其他門牌資訊
108...尋找特殊文字巷弄代碼
109...將路名代碼、特殊文字巷弄代碼及其他門牌資訊、延伸地址等轉為地址簡碼代碼
110...轉為標準地址代碼
200...中文地址(不含行政區)
201...有明確的街道單位
202...在該街道單位地址資料集中尋找中文地址之子集
203...所在二級行政區包含「其他地標」地址資料集
204...在該其他地標地址資料集中尋找中文地址之子集
205...在所尋得的中文地址子集中找出最大子集(最相似者)
206...路名代碼或錯誤提示
300...中文地址(不含行政區)
301...至地址資料集中鎖定一街道全名
302...中文地址是否包含此街道全名
303...地址資料集中尚有未比對的街道資料
400...中文地址(不含行政區及街道全名)
401...包含文字巷弄或無法以地址關鍵字辦別之資訊
402...至特殊文字巷弄資料集中鎖定一特殊文字巷弄全名
403...中文地址是否包含此特殊文字巷弄全名
404...特殊文字巷弄資料集中尚有未比對的特殊文字巷弄資料
圖一為本發明一種智慧型樣板比對中文地址轉譯方法之流程圖;
圖二為本發明一種智慧型樣板比對中文地址轉譯方法於地址資訊集合建構時所依據之中華民國行政區規劃架構示意圖;
圖三為本發明一種智慧型樣板比對中文地址轉譯方法於提取第一層級地址資訊集合之實施示意圖;
圖四為本發明一種智慧型樣板比對中文地址轉譯方法於提取第二層級地址資訊集合之實施示意圖;
圖五為本發明一種智慧型樣板比對中文地址轉譯方法於提取第三層級地址資訊集合之實施示意圖;
圖六係為本發明一種智慧型樣板比對中文地址轉譯方法於尋找路名代碼之實施流程圖;
圖七為本發明一種智慧型樣板比對中文地址轉譯方法於尋找路名代碼之前置作業流程圖;
圖八為本發明一種智慧型樣板比對中文地址轉譯方法於尋找特殊文字巷弄代碼之實施流程圖。
100...中文地址
101...正規化
102...地址單位關鍵字剖析
103...鎖定一級行政區地址資料集
104...鎖定二級行政區地址資料集
105...尋找路名代碼
106...尚有未搜尋的二級行政區地址資料集
107...街道全名之後有其他門牌資訊
108...尋找特殊文字巷弄代碼
109...將路名代碼、特殊文字巷弄代碼及其他門牌資訊、延伸地址等轉為地址簡碼代碼
110...轉為標準地址代碼

Claims (7)

  1. 一種智慧型樣板比對中文地址轉譯方法,其步驟包含:步驟一:使用可分層傳送地址資訊的資訊派送應用程序,係依「大於0之N級行政區、街道單位、街道資訊」架構分別儲存各級地址資料;步驟二:對欲轉譯之中文地址進行正規化程序,使其以易於辨識之國字數字表示;步驟三:將正規化後的中文地址分層進行地址單位關鍵字剖析,取得各地址關鍵字前之關鍵詞;步驟四:依取得之關鍵詞進行分層提取地址資訊集合之程序,以取得包含一級行政區、二級行政區、街道單位及街道資訊之地址資訊;步驟五:依取得之街道單位及街道資訊尋找路名代碼;步驟六:若取得之街道單位及街道資訊包含文字巷弄或無法以地址關鍵字辨別之資訊,則於對應的潛在特殊文字巷弄資訊集合中尋找特殊文字巷弄代碼;步驟七:將路名代碼、特殊文字巷弄代碼及其他扣除行政區名稱、街道名稱、特殊文字巷弄名稱後的中文地址關鍵字剖析結果組成簡式地址代碼格式資料;及步驟八:將簡式地址代碼格式資料轉換為標準之地址代碼格式資料。
  2. 如申請專利範圍第1項所述之一種智慧型樣板比對中文地址轉譯方法,其中該步驟二之正規化程序之步驟更包含:a.將輸入之中文地址全形轉為半形;b.使不完整之行政區名稱完整;c.將地址關鍵字”號、號之、樓、樓之、室、室之”所屬關鍵詞數字部分改以阿拉伯數字取代;d.如地址關鍵字為“巷、弄、衖”,則先檢視其內容,若經判斷為有意義的文字巷弄衖,則將維持原樣貌,不進行轉換。
  3. 如申請專利範圍第1項所述之一種智慧型樣板比對中文地址轉譯方法,其中該步驟四分層進行地址單位關鍵字剖析的步驟更包含:a.將中文地址分層,以語意分析表示各層之關鍵字;b.以語意分析之關鍵字剖析輸入之中文地址,取得各地址關鍵字前之關鍵詞。
  4. 如申請專利範圍第3項所述之一種智慧型樣板比對中文地址轉譯方法,其中該關鍵字係:a.表示一「行政區」之語意b.表示一「里村」之語意;c.表示一「鄰」之語意;d.表示一「路街」之語意;e.表示一「段」之語意;f.表示一「巷弄」之語意;g.表示一「衖號」之語意;h.表示一「號之」之語意;i.表示一「棟樓」之語意;j.表示一「樓之」之語意;k.表示一「室」之語意;l.表示一「室之」之語意。
  5. 如申請範圍第1項所述之一種智慧型樣板比對中文地址轉譯方法,其中該步驟五尋找路名代碼的步驟包含:a.以扣除行政區名稱後的中文地址為輸入內容;b.若地址關鍵字剖析結果有明確的街道單位,則於提取該二級行政區內對應的地址單位資訊集合,與輸入內容進行比對;c.若該二級行政區包含其他特殊標地標資訊集合,則提取之並與輸入內容進行比對;d.取出所有比對合格之地址資料,擇取最大相似者之路名代碼並輸出。
  6. 如申請範圍第1項所述之一種智慧型樣板比對中文地址轉譯方法,其中該步驟六尋找特殊文字巷弄代碼的步驟包含:a.以扣除行政區名稱及街道名稱後的中文地址為輸入內容;b.若該輸入內容包含文字巷弄或無法以地址關鍵字辨別之資訊,則以路名代碼進行搜尋,找出其對應的潛在特殊文字巷弄資訊集合;c.將輸入內容與該潛在特殊文字巷弄資訊集合進行比對,擇取最大相似者之特殊文字巷弄代碼並輸出。
  7. 一種內儲程式之電腦可讀取紀錄媒體,當電腦載入該程式並執行後,可完成如申請專利範圍第1~6項任一項所述之方法。
TW99118072A 2010-06-04 2010-06-04 Intelligent template comparison of Chinese address translation methods and computer program storage media TWI418997B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW99118072A TWI418997B (zh) 2010-06-04 2010-06-04 Intelligent template comparison of Chinese address translation methods and computer program storage media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW99118072A TWI418997B (zh) 2010-06-04 2010-06-04 Intelligent template comparison of Chinese address translation methods and computer program storage media

Publications (2)

Publication Number Publication Date
TW201145047A TW201145047A (en) 2011-12-16
TWI418997B true TWI418997B (zh) 2013-12-11

Family

ID=46765804

Family Applications (1)

Application Number Title Priority Date Filing Date
TW99118072A TWI418997B (zh) 2010-06-04 2010-06-04 Intelligent template comparison of Chinese address translation methods and computer program storage media

Country Status (1)

Country Link
TW (1) TWI418997B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930869B (zh) * 2020-08-11 2024-02-06 上海寻梦信息技术有限公司 地址纠偏方法、装置、电子设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI235930B (en) * 2003-10-21 2005-07-11 Chunghwa Telecom Co Ltd Multi-mode input of customer address and 5-digit zip code transformation method
TW200712932A (en) * 2005-09-19 2007-04-01 Eastern Home Shopping & Leisure Co Ltd Address verification method and system thereof
TWI317488B (en) * 2005-11-04 2009-11-21 Webgenie Information Ltd Method for automatically detecting similar documents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI235930B (en) * 2003-10-21 2005-07-11 Chunghwa Telecom Co Ltd Multi-mode input of customer address and 5-digit zip code transformation method
TW200712932A (en) * 2005-09-19 2007-04-01 Eastern Home Shopping & Leisure Co Ltd Address verification method and system thereof
TWI317488B (en) * 2005-11-04 2009-11-21 Webgenie Information Ltd Method for automatically detecting similar documents

Also Published As

Publication number Publication date
TW201145047A (en) 2011-12-16

Similar Documents

Publication Publication Date Title
CN101542475B (zh) 用于对具有象形表意内容的数据进行搜索和匹配的系统和方法
CN102395965B (zh) 用于在数据库中搜索对象的方法
CN106447346A (zh) 一种智能电力客服系统的构建方法及系统
CN107609052A (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN105224622A (zh) 面向互联网的地名地址提取与标准化方法
CN107145577A (zh) 地址标准化方法、装置、存储介质及计算机
CN104679867B (zh) 基于图的地址知识处理方法及装置
US20050144177A1 (en) Patent analysis and formulation using ontologies
CN110781670B (zh) 基于百科知识库和词向量的中文地名语义消歧方法
WO2015027835A1 (zh) 一种通信地址查询邮政编码的系统及终端
CN112612863B (zh) 一种基于中文分词器的地址匹配方法及系统
CN111259160B (zh) 知识图谱构建方法、装置、设备及存储介质
CN109933797A (zh) 基于Jieba分词及地址词库的地理编码方法和系统
CN110990520B (zh) 一种地址编码方法、装置、电子设备和存储介质
CN102622413A (zh) 一种回答自然语言问题的方法与装置
CN115630648A (zh) 面向人机对话的地址要素解析方法、系统与计算机可读介质
CN102402684B (zh) 确定证书类型的方法和装置以及翻译证书的方法和装置
Sheeren et al. A data‐mining approach for assessing consistency between multiple representations in spatial databases
TWI418997B (zh) Intelligent template comparison of Chinese address translation methods and computer program storage media
Pan et al. Natural language aided visual query building for complex data access
CN112084773A (zh) 一种基于词库双向最大匹配法的电网停电地址匹配方法
CN117010398A (zh) 一种基于多层知识感知的地址实体识别方法
CN109614457B (zh) 一种基于深度学习的地理信息的识别方法及装置
CN107391690A (zh) 一种处理文献信息的方法
CN115495594A (zh) 基于城市公共设施决策案例的知识图谱融合方法及系统

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees