TWM604438U - 姓名編碼比對裝置 - Google Patents

姓名編碼比對裝置 Download PDF

Info

Publication number
TWM604438U
TWM604438U TW109209480U TW109209480U TWM604438U TW M604438 U TWM604438 U TW M604438U TW 109209480 U TW109209480 U TW 109209480U TW 109209480 U TW109209480 U TW 109209480U TW M604438 U TWM604438 U TW M604438U
Authority
TW
Taiwan
Prior art keywords
customer
character
name
sanction
score
Prior art date
Application number
TW109209480U
Other languages
English (en)
Inventor
邱國明
林美邑
張嘉容
范育銘
蔡玉玲
葉明軒
Original Assignee
臺灣銀行股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 臺灣銀行股份有限公司 filed Critical 臺灣銀行股份有限公司
Priority to TW109209480U priority Critical patent/TWM604438U/zh
Publication of TWM604438U publication Critical patent/TWM604438U/zh

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

為快速且精確地篩選是否有制裁名單中的可疑客戶,提供姓名編碼比對裝置,其包括標準化模組、比對評分模組、加權評分模組及結果判斷模組。標準化模組標準化客戶字元編碼及制裁字元編碼。比對評分模組根據多個評分演算法,比對客戶字元編碼及制裁字元編碼以輸出評分分數。加權評分模組在客戶背景與制裁背景資料相同時,輸出加權加分分數。結果判斷模組選擇評分分數中最高者,加總加權加分分數以得到最終分數,在最終分數大於辨識度門檻值時,輸出客戶姓名。藉此即可快速、精確且結合多種客觀評分演算法,得到具有參考價值的客戶比對結果。

Description

姓名編碼比對裝置
本新型涉及一種姓名之編碼及比對裝置,尤其是用以快速且客觀地比對至少二不同資料中,是否具有相同或相似姓名的姓名編碼比對裝置。
銀行因受有資恐防制法的規範,故須對其金融往來客戶進行安全性調查。例如,銀行須根據所公告的制裁資料 (如可疑人物之姓名及其關係人之姓名),以對也具有與制裁資料相同姓名的客戶,進行帳戶及對應資金上的控管,藉以落實資恐防制法所欲達到的目的。
然而,在判斷客戶是否具有與制裁資料相同的姓名時,常因不管是客戶資料或制裁資料的資料量大,且其資料格式並未統一,而無法快速且精確地進行辨識及篩選。因此,如何快速且精確地根據制裁資料,以針對各銀行之客戶資料進行辨識及篩選,進而達到資恐防制的功效,即成為所屬技術領域中有待解決的問題。
為解決上述問題,本新型發展出一種姓名編碼比對方法,透過快速掃描客戶資料及制裁資料,並依據客戶資料及制裁資料中之姓名進行字元編碼,各經編碼之字元即包括字元拼音編碼及對應之拼音編號編碼。接著,再將經編碼之字元,透過多個評分演算法進行評分,並選出在多個評分演算法中的最高評分分數。接著,再將最高評分分數與加權分數進行加總,得到最終分數。接著,根據最終分數及辨識度門檻值,即可針對上述客戶姓名進行相似度的判讀。例如,當最終分數大於辨識度門檻值時,上述客戶姓名即為可疑制裁人物,應再進一步對其進行交易資金監控等後續動作;而當最終分數小於或等於辨識度門檻值時,上述客戶姓名即得排除為可疑制裁人物之可能性。
具體而言,本新型之一實施例提供一種姓名編碼比對方法,包括以下步驟。
接收客戶資料,客戶資料包括客戶姓名及客戶背景。
接收制裁資料,制裁資料包括制裁姓名及制裁背景資料。
標準化客戶姓名,並對應客戶姓名之每一字元輸出客戶字元編碼,其中客戶字元編碼包括客戶字元拼音及客戶拼音編號。
標準化制裁姓名,並對應制裁姓名之每一字元輸出制裁字元編碼,其中制裁字元編碼包括制裁字元拼音及制裁拼音編號。
根據多個評分演算法,比對客戶字元編碼及制裁字元編碼,以對應客戶姓名輸出多個評分分數。
比對客戶背景及制裁背景資料。
當任一客戶背景與對應之制裁背景資料相同時,輸出加權加分分數,以及當任一客戶背景與對應之制裁背景資料不同時,輸出加權減分分數。
選擇評分分數中分數最高者,並加總加權加分分數及加權減分分數,以得到最終分數。
當最終分數大於辨識度門檻值時,輸出對應之客戶姓名。
依據一實施例,其中評分演算法包括精準演算法。上述精準演算法係用以比對客戶字元編碼與制裁字元編碼,且其中當客戶字元編碼與制裁字元編碼完全相同時,對應輸出評分分數為100分;以及當客戶字元編碼與制裁字元編碼不同時,對應輸出評分分數為0分。
依據另一實施例,其中評分演算法包括模糊演算法。上述模糊演算法係用以比對客戶字元拼音與制裁字元拼音,且其中當客戶字元拼音與制裁字元拼音完全相同時,對應輸出評分分數,且評分分數大於辨識度門檻值;以及當客戶字元拼音與制裁字元拼音不同時,對應輸出評分分數為0分。
依據又一實施例,其中評分演算法包括涵蓋演算法。上述涵蓋演算法係用以比對客戶字元拼音與制裁字元拼音,以根據基本分數、命中字數比及名單命中值,透過式(1)-(3)計算得出評分分數,其中:
Figure 02_image001
式(1);
Figure 02_image003
式(2);以及
Figure 02_image005
式(3)。
依據又一實施例,上述姓名編碼比對方法更包括標準化規則,以根據上述標準化規則來標準化客戶資料及制裁資料,其中上述標準化規則包括:大小寫邏輯、省略邏輯,以及刪除邏輯。
其中,大小寫邏輯係自動轉換客戶資料及制裁資料中之小寫英文字元為大寫英文字元。轉換邏輯係自動轉換客戶資料及制裁資料中之亂碼字元為空白字元。省略邏輯係自動刪減客戶資料及制裁資料中之特定字元,其中上述特定字元包括稱謂、職稱及股份(限)公司。刪除邏輯係自動刪除客戶姓名及制裁姓名中之重疊字元。
本新型之一實施例除了提供一種姓名編碼比對方法之外,本新型之另一實施例更進一步提供一種姓名編碼比對裝置,可安裝在智慧型裝置、數位電子裝置及其任意組合中之系統或裝置中,其中上述姓名編碼比對裝置包括資料庫、標準化模組、比對評分模組、加權評分模組,以及結果判斷模組。
上述資料庫係用以接收並儲存客戶資料及制裁資料,其中上述客戶資料包括客戶姓名及客戶背景,且上述制裁資料包括制裁姓名及制裁背景資料。
上述標準化模組係用以通訊連接資料庫,接收客戶資料及制裁資料,以標準化客戶姓名及制裁姓名,並對應客戶姓名之每一字元輸出客戶字元編碼,對應制裁姓名之每一字元輸出制裁字元編碼,其中上述客戶字元編碼包括客戶字元拼音及客戶拼音編號,上述制裁字元編碼包括制裁字元拼音及制裁拼音編號。
上述比對評分模組係用以通訊連接標準化模組,接收客戶字元編碼及制裁字元編碼,以根據多個評分演算法,比對客戶字元編碼及制裁字元編碼,以對應客戶姓名輸出多個評分分數。
上述加權評分模組係用以通訊連接資料庫,接收並比對客戶背景及制裁背景資料,當任一客戶背景與對應之制裁背景資料相同時,輸出加權加分分數,以及當任一客戶背景與對應之制裁背景資料不同時,輸出加權減分分數。
上述結果判斷模組係用以通訊連接比對評分模組及加權評分模組,接收評分分數、加權加分分數及加權減分分數,選擇評分分數中分數最高者,並加總加權加分分數及加權減分分數,以得到最終分數,當最終分數大於辨識度門檻值時,輸出對應之客戶姓名。
依據一實施例,其中評分演算法包括精準演算法。上述精準演算法係用以比對客戶字元編碼與制裁字元編碼,且其中當客戶字元編碼與制裁字元編碼完全相同時,對應輸出評分分數為100分;以及當客戶字元編碼與制裁字元編碼不同時,對應輸出評分分數為0分。
依據另一實施例,其中評分演算法包括模糊演算法。上述模糊演算法係用以比對客戶字元拼音與制裁字元拼音,且其中當客戶字元拼音與制裁字元拼音完全相同時,對應輸出評分分數,且評分分數大於辨識度門檻值;以及當客戶字元拼音與制裁字元拼音不同時,對應輸出評分分數為0分。
依據又一實施例,其中評分演算法包括涵蓋演算法。上述涵蓋演算法係用以比對客戶字元拼音與制裁字元拼音,以根據基本分數、命中字數比及名單命中值,透過式(1)-(3)計算得出評分分數,其中:
Figure 02_image001
式(1);
Figure 02_image003
式(2);以及
Figure 02_image005
式(3)。
依據又一實施例,上述標準化模組更包括標準化規則,以根據上述標準化規則來標準化客戶資料及制裁資料,其中上述標準化規則包括:大小寫邏輯、省略邏輯,以及刪除邏輯。
其中,大小寫邏輯係自動轉換客戶資料及制裁資料中之小寫英文字元為大寫英文字元。轉換邏輯係自動轉換客戶資料及制裁資料中之亂碼字元為空白字元。省略邏輯係自動刪減客戶資料及制裁資料中之特定字元,其中上述特定字元包括稱謂、職稱及股份(限)公司。刪除邏輯係自動刪除客戶姓名及制裁姓名中之重疊字元。
根據上述,本新型因此可達到以下功效:
(1) 可針對大量的客戶資料及制裁資料進行邏輯性的字音編碼,而可獲得具有格式統一的資料。
(2) 透過優化的邏輯性字音編碼 (例如刪除姓名中重疊字元),而可減少在姓名編碼及比對時的資料處理量及負荷量,以加速整體的姓名比對及評分速度。
(3) 透過多種評分演算法及其對應之評分規則,可依使用者所需精確度進行調整,並藉由比較各評分分數中最高分者,而可獲得客觀且具有可信度的比較結果。
(4) 除了比較客戶姓名及制裁姓名之外,更比較對應至各制裁姓名之制裁背景資料(例如其所屬國籍、生日、身份證字號或護照號碼等),藉以加權評分分數,以更直接且精確地反映各客戶潛在的資恐風險。
有鑑於上述待克服的問題,本新型之一實施例發展出一種姓名編碼比對方法,能快速地且具邏輯地將客戶資料及制裁資料進行掃描及字元編碼,經編碼之字元可包括字元拼音及對應之拼音編號。接著,透過多個評分演算法,以針對各客戶姓名進行評分,並選出在上述評分演算法中的最高評分。同時,更根據客戶背景資料及制裁背景資料進行比對,以將最高評分分數結合加權演算法之加權分數,得到最終分數。
接著,例如當最終分數大於所給定的辨識度門檻值時,上述客戶姓名即為可疑制裁人物,應再進一步對其進行交易資金監控等後續動作;而當最終分數小於或等於辨識度門檻值時,上述客戶姓名即得排除為可疑制裁人物之可能性。亦即,根據所有評分演算法中之最高評分分數、經加權演算法加權後的最終分數,以及所給定的辨識度門檻值,即可自動對各客戶姓名進行客觀且精確的相似度判讀,快速得知其是否為可疑的應受制裁客戶。
為更清楚說明本新型之實施方式,請參閱圖1,圖1所繪為根據本新型一實施例之一種姓名編碼比對方法之流程示意圖。
在圖1中,依據一實施例提供一種姓名編碼比對方法100。如步驟110,接收客戶資料及制裁資料,其中上述客戶資料包括客戶姓名及客戶背景,且上述制裁資料包括制裁姓名及制裁背景資料。上述制裁資料可為向外部單位採購的名單,或者為銀行內部透過下述的字音編碼進行編碼。
值得一提的是,上述客戶資料及制裁資料更可包括與客戶或制裁名單不相關的資料,例如上述客戶資料或制裁資料可為報章雜誌之文章 (其中包括許多垃圾或廣告資料),亦即上述客戶資料可不僅由客戶姓名所組成,而上述制裁資料亦可不僅由制裁姓名所組成。
另外,上述客戶資料及制裁資料皆可透過電文方式或經加密之電文方式進行傳送。其中,上述經加密之電文方式可為任何能將數位資料變更為難以讀取的密文內容,且須經解密才能還原為可讀內容的方法。
此外,上述客戶姓名及制裁姓名可為中文姓名或其他非中文姓名 (例如英文或日文姓名等),且上述客戶背景及制裁背景資料例如可分別包括所屬國籍、生日、身份證字號、護照號碼、性別、身高及體重等具有身份辨識性的基本資料。
如步驟120,標準化客戶姓名,並對應客戶姓名之每一字元輸出客戶字元編碼,其中上述客戶字元編碼包括客戶字元拼音及客戶拼音編號。
例如,客戶姓名為「李娟娟」,則分別對應「李、娟、娟」共三字,進行客戶字元編碼。具體而言,以單一「娟」字為例,經編碼後之客戶字元編碼可為「JYUAN01」,其中對應之上述字元拼音即為「JYUAN」,而客戶拼音編號則為「01」。可進一步說明的是,上述客戶拼音編號係用以區分「娟」之同音字,例如鵑 (可編為JYUAN02)、捐 (JYUAN03) 等,依此類推。據此,「李、娟、娟」經編碼後可為「LEE01」、「JYUAN01」及「JYUAN01」。
此外,又例如客戶姓名中具有同義異形字 (例如「峰」及「峯」,或「黃」及「黄」等),將被判讀為同一字元,亦即經客戶字元編碼後,同義異形字將具有相同的客戶字元編碼,包括字元拼音及客戶拼音編號皆相同。
依據一實施例,上述姓名編碼比對方法更包括標準化規則,以透過上述標準化規則來標準化客戶資料及制裁資料,其中上述標準化規則可包括大小寫邏輯、轉換邏輯、省略邏輯,以及刪除邏輯。
上述大小寫邏輯係自動轉換客戶資料及制裁資料中之小寫英文字元為大寫英文字元,例如將小寫字元「Miss 李娟娟」一律轉換為大寫英文字元「MISS 李娟娟」。
上述轉換邏輯係自動轉換客戶資料及制裁資料中之亂碼字元為空白字元,例如將亂碼字元「@李$娟#娟」轉換為「 李 娟 娟」(亦即將亂碼字元轉換為三格空白字元)。
上述省略邏輯係自動刪減客戶資料及制裁資料中之特定字元,其中上述特定字元包括稱謂、職稱及股份(限)公司,例如將「李娟娟女士」,刪除特定字元「女士」並轉換為「李娟娟」。
上述刪除邏輯係自動刪除客戶姓名及制裁姓名中之重疊字元,例如將「李娟娟」,刪除重疊字元「娟娟」中之任一「娟」字,並轉換為「李娟」。
接著,如步驟122,標準化制裁姓名,並對應制裁姓名之每一字元輸出制裁字元編碼,其中上述制裁字元編碼包括制裁字元拼音及制裁拼音編號。上述制裁字元編碼之示例,可參閱前述客戶字元編碼中之舉例,兩者之編碼規則及概念相同,在此即不再贅述。
接著,如步驟124,根據多個評分演算法,比對經編碼之客戶字元編碼及經編碼之制裁字元編碼,以如步驟126,對應客戶姓名輸出多個評分分數。其中上述評分演算法可包括精準演算法、模糊演算法,以及涵蓋演算法,亦即可自包括精準演算法、模糊演算法以及涵蓋演算法之群組中任意選擇至少二或三種演算法,並將其作為上述評分演算法,以對應客戶姓名輸出多個評分分數。
以下分別就上述精準演算法、模糊演算法以及涵蓋演算法,說明如下。
依據又一實施例,其中評分演算法可包括精準演算法。
上述精準演算法係比對客戶字元編碼與制裁字元編碼。上述精準演算法之判斷規則為當客戶字元編碼與制裁字元編碼完全相同 (包括各字元拼音及各字元順序) 時,對應輸出評分分數為100分,以及當客戶字元編碼與制裁字元編碼不同時,對應輸出評分分數為0分。
例如,客戶姓名及客戶字元編碼分別為「李娟娟」及「LEE01+JYUAN01」,制裁姓名及制裁字元編碼分別為「李鵑鵑」及「LEE01+JYUAN02」。透過精準演算法之判斷規則,因客戶字元編碼 (LEE01+JYUAN01) 與制裁字元編碼 (LEE01+JYUAN02) 不同 (未命中),故對應客戶姓名「李娟娟」及「精準演算法」之評分分數為「0分」。
或例如,可進一步再連結至外部的文字資料庫,並根據上述文字資料庫將客戶字元編碼「LEE01+JYUAN01」編碼為「JHHDFB-$$$$12345$」,制裁字元編碼「LEE01+JYUAN02」編碼為「JHHDFB-$$12345$75」。透過精準演算法之判斷規則,即可判定兩者之字元編碼並不相同 (未命中),故對應客戶姓名「李娟娟」及「精準演算法」之評分分數為「0分」。
依據又一實施例,其中評分演算法可包括模糊演算法。
上述模糊演算法係比對客戶字元拼音與制裁字元拼音。而上述模糊演算法其規則為當客戶字元拼音與制裁字元拼音完全相同時,對應輸出評分分數,且評分分數大於辨識度門檻值,以及當客戶字元拼音與制裁字元拼音不同時,對應輸出評分分數為0分。
例如,客戶姓名及客戶字元編碼分別為「李娟娟」及「LEE01+JYUAN01」,制裁姓名及制裁字元編碼分別為「李鵑鵑」及「LEE01+JYUAN02」。透過模糊演算法之判斷規則,因客戶字元拼音 (LEE+JYUAN) 與制裁字元拼音 (LEE+JYUAN) 相同 (命中),故對應客戶姓名「李娟娟」及「模糊演算法」之評分分數為「86分」 (假設所給定的辨識度門檻值為85分)。
依據又一實施例,其中評分演算法可包括涵蓋演算法。
上述涵蓋演算法係比對客戶字元編碼與制裁字元編碼,以根據基本分數、命中字數比及名單命中值,透過下式(1)-(3)計算得出評分分數,其中:
Figure 02_image001
式(1);
Figure 02_image003
式(2);以及
Figure 02_image005
式(3)。
例如,客戶姓名及客戶字元編碼分別為「李娟娟」及「LEE01+JYUAN01」,制裁姓名及制裁字元編碼分別為「李鵑鵑」及「LEE01+JYUAN02」。透過涵蓋演算法之判斷規則,在上式(3)中之客戶姓名之字元數為「2」,客戶字元編碼 (LEE01+JYUAN01) 與制裁字元編碼 (LEE01+JYUAN02) 相同之字元數為「1」(亦即LEE01),故透過上式(3)計算可得「命中字數比」為「50%」(= 1/2)。接著,透過上式(2)及「命中字數比」為「50%」,可得「名單命中值」為「1」。接著,透過上式(1)及預先給定的基本分數 (例如為60分),計算可得「評分分數」為「80」(= (60×1) + 50%×(100-60) )。因此,對應客戶姓名「李娟娟」及「涵蓋演算法」之評分分數為「80分」。
同時,如步驟130,接收客戶資料及制裁資料,以比對客戶資料中之客戶背景資料及制裁資料中之制裁背景資料。其中,當任一客戶背景資料與對應之制裁背景資料相同時,輸出加權加分分數,以及當任一客戶背景資料與對應之制裁背景資料不同時,輸出加權減分分數。
例如,客戶姓名及其所屬國籍及生日分別為「李娟娟」、「臺灣」及「1989年10月1日」,制裁姓名及其所屬國籍及生日分別為「李鵑鵑」、「臺灣」及「1965年10月1日」。根據「所屬國籍」之比對欄位,應判斷為「相同」,則輸出加權加分分數為「+5分」;而根據「生日」之比對欄位,則應判斷為「相差10年以上」,輸出加權減分分數為「-21分」(同時,判斷規則亦可包括,若生日「相同」或「相差10年以內」,則輸出加權加分分數為+5分)。因此,對應客戶姓名「李娟娟」及「加權演算法」之加權分數為「-16分」。
又例如,當「護照」或「身份證字號」等可直接得知身份之比對欄位,當應判斷為「相同」時,則輸出加權加分分數為「+100分」,亦即直接將對應客戶判定為高度可疑的應受制裁客戶,強迫命中。
接著,如步驟140,選擇多個評分分數中分數最高者,並將分數最高者與加權加分分數及加權減分分數相加總,以如步驟150,得到最終分數。如步驟160,判斷最終分數是否高於預先給定的辨識度門檻值,例如當最終分數大於辨識度門檻值時,則如步驟170,輸出對應之客戶姓名,以及當最終分數小於或等於辨識度門檻值時,則判斷為不相似且結束上述姓名編碼比對方法100。
例如,整理上述三種評分演算法 (包括精準演算法、模糊演算法以及涵蓋演算法) 及加權演算法,針對客戶姓名「李娟娟」之姓名編碼及比對結果,請見下表1。
表1
評分演算法 評分分數 最高分者 加權演算法之加權分數 最終分數
精準演算法 0 86 -16 70
模糊演算法 86
涵蓋演算法 80
辨識度門檻值 85
最終結果 不相似
註:○ 標示者為各評分分數中最高者。
其中,上述三種評分演算法中最高分者為「86分」(對應至模糊演算法),且加權演算法之加權分數為「-16分」,計算求得最終分數即為「70分」。相較於預先給定的辨識度門檻值 (例如為85分),應判定客戶姓名「李娟娟」之姓名比對最終結果為「不相似」(未命中),即結束上述姓名編碼比對方法100。
另外,請參閱圖2,圖2所繪為根據本新型一實施例之一種姓名編碼比對裝置之示意圖。與上述姓名編碼比對方法100相對應,本新型另一實施例再揭露另一種姓名編碼比對裝置200,其包括資料庫210、標準化模組220、比對評分模組230、加權評分模組240,以及結果判斷模組250。
其中,上述姓名編碼比對裝置200、資料庫210、標準化模組220、比對評分模組230、加權評分模組240以及結果判斷模組250,可安裝在智慧型裝置、數位電子裝置及其任意組合中之系統或裝置中,包括桌上型電腦、筆記型電腦、智慧型手機、平板電腦、數位相機及其他數位電子裝置。
關於上述資料庫210,進一步說明如下。
上述資料庫210係用以接收並儲存客戶資料及制裁資料,其中上述客戶資料包括客戶姓名及客戶背景資料,且上述制裁資料包括制裁姓名及制裁背景資料。上述客戶資料及制裁資料所包含內容,已如前所述,在此即不再贅述。
關於上述標準化模組220,進一步說明如下。
上述標準化模組220係用以通訊連接資料庫210,接收客戶資料及制裁資料,以標準化客戶姓名及制裁姓名,並對應客戶姓名之每一字元輸出客戶字元編碼,對應制裁姓名之每一字元輸出制裁字元編碼,其中客戶字元編碼包括客戶字元拼音及客戶拼音編號,且制裁字元編碼包括制裁字元拼音及制裁拼音編號。上述客戶姓名及制裁姓名所包含內容及標準化說明,已如前所述,在此即不再贅述。
其中,依據一實施例,上述標準化模組220更包括標準化規則,以根據上述標準化規則來標準化客戶資料及制裁資料,其中上述標準化規則包括大小寫邏輯、轉換邏輯、省略邏輯,以及刪除邏輯。
上述大小寫邏輯係自動轉換客戶資料及制裁資料中之小寫英文字元為大寫英文字元。詳細已如前所述,在此即不再贅述。
上述轉換邏輯係自動轉換客戶資料及制裁資料中之亂碼字元為空白字元。詳細已如前所述,在此即不再贅述。
上述省略邏輯係自動刪減客戶資料及制裁資料中之特定字元,其中上述特定字元可包括稱謂、職稱及股份(限)公司。詳細已如前所述,在此即不再贅述。
上述刪除邏輯係自動刪除客戶姓名及制裁姓名中之重疊字元。詳細已如前所述,在此即不再贅述。
關於上述比對評分模組230,進一步說明如下。
上述比對評分模組230係用以通訊連接標準化模組220,接收客戶字元編碼及制裁字元編碼,以根據複數個評分演算法,比對客戶字元編碼及制裁字元編碼,以對應客戶姓名輸出複數個評分分數。
依據另一實施例,上述評分演算法可包括精準演算法。上述精準演算法係比對客戶字元編碼與制裁字元編碼,其中,當客戶字元編碼與制裁字元編碼完全相同時,對應輸出評分分數為100分;以及當客戶字元編碼與制裁字元編碼不同時,對應輸出評分分數為0分。詳細已如前所述,在此即不再贅述。
依據又一實施例,上述評分演算法可包括模糊演算法。上述模糊演算法係比對客戶字元拼音與制裁字元拼音,其中,當客戶字元拼音與制裁字元拼音完全相同時,對應輸出評分分數,且評分分數大於辨識度門檻值;以及當客戶字元拼音與制裁字元拼音不同時,對應輸出評分分數為0分。詳細已如前所述,在此即不再贅述。
依據又一實施例,上述評分演算法可包括涵蓋演算法。上述涵蓋演算法係比對客戶字元編碼與制裁字元編碼,以根據基本分數、命中字數比及名單命中值,透過式(1)-(3)計算得出評分分數,其中:
Figure 02_image001
式(1);
Figure 02_image003
式(2);以及
Figure 02_image005
式(3)。詳細已如前所述,在此即不再贅述。
關於上述加權評分模組240,進一步說明如下。
上述加權評分模組240係用以通訊連接資料庫210,接收並比對客戶背景資料及制裁背景資料,當任一客戶背景資料與對應之制裁背景資料相同時,輸出加權加分分數,當任一客戶背景資料與對應之制裁背景資料不同時,輸出加權減分分數。詳細已如前所述,在此即不再贅述。
關於上述結果判斷模組250,進一步說明如下。
上述結果判斷模組250係用以通訊連接比對評分模組230及加權評分模組240,接收評分分數、加權加分分數及加權減分分數,選擇評分分數中分數最高者,並加總加權加分分數及加權減分分數,以得到最終分數,當最終分數大於預先給定的辨識度門檻值時,輸出對應之客戶姓名。詳細已如前所述,在此即不再贅述。
綜合上述姓名編碼比對方法以及對應的姓名編碼比對裝置,透過快速將客戶資料及制裁資料依照標準化規則標準化,並建立字音編碼。接著,透過多個評分演算法比較客戶資料及制裁資料,並選擇經多個評分演算法中最高分者,再與加權分數加總後所得到的最終分數。接著,比較最終分數及辨識度門檻值,即可得出整合上述各評分演算法之精確且具綜合比較性的比對結果。藉此,可提供各銀行在針對其客戶資料進行辨識及篩選時,有效、客觀且快速地達到資恐防制的功效。
本新型在本文中僅以較佳實施例揭露,然任何熟習本技術領域者應能理解的是,上述實施例僅用於描述本新型,並非用以限定本新型所主張之專利權利範圍。舉凡與上述實施例均等或等效之變化或置換,皆應解讀為涵蓋於本新型之精神或範疇內。因此,本新型之保護範圍應以下述之申請專利範圍所界定者為準。
100:姓名編碼比對方法 110-170:步驟 122、124、126、132:步驟 200:姓名編碼比對裝置 210:資料庫 220:標準化模組 230:比對評分模組 240:加權評分模組 250:結果判斷模組
為讓本新型之上述和其他目的、特徵、優點與實施例能更明顯易懂,所附附圖之說明如下: 圖1所繪為根據本新型一實施例之一種姓名編碼比對方法之流程示意圖。 圖2所繪為根據本新型一實施例之一種姓名編碼比對裝置之示意圖。
200:姓名編碼比對裝置
210:資料庫
220:標準化模組
230:比對評分模組
240:加權評分模組
250:結果判斷模組

Claims (5)

  1. 一種姓名編碼比對裝置,可安裝在智慧型裝置、數位電子裝置及其任意組合中之系統或裝置中,包括: 一資料庫,接收並儲存一客戶資料及一制裁資料,其中該客戶資料包括一客戶姓名及一客戶背景資料,該制裁資料包括一制裁姓名及一制裁背景資料; 一標準化模組,通訊連接該資料庫,接收該客戶資料及該制裁資料,以標準化該客戶姓名及該制裁姓名,並對應該客戶姓名之每一字元輸出一客戶字元編碼,對應該制裁姓名之每一字元輸出一制裁字元編碼,其中該客戶字元編碼包括一客戶字元拼音及一客戶拼音編號,制裁字元編碼包括一制裁字元拼音及一制裁拼音編號; 一比對評分模組,通訊連接該標準化模組,接收該些客戶字元編碼及該些制裁字元編碼,以根據複數個評分演算法,比對該些客戶字元編碼及該些制裁字元編碼,以對應該客戶姓名輸出複數個評分分數; 一加權評分模組,通訊連接該資料庫,接收並比對該客戶背景資料及該制裁背景資料,當任一該客戶背景資料與對應之該制裁背景資料相同時,輸出一加權加分分數,當任一該客戶背景資料與對應之該制裁背景資料不同時,輸出一加權減分分數;以及 一結果判斷模組,通訊連接該比對評分模組及該加權評分模組,接收該些評分分數、該加權加分分數及該加權減分分數,選擇該些評分分數中分數最高者,並加總該加權加分分數及該加權減分分數,以得到一最終分數,當該最終分數大於一辨識度門檻值時,輸出對應之該客戶姓名。
  2. 如請求項1所述的姓名編碼比對裝置,其中該些評分演算法包括: 一精準演算法,比對該客戶字元編碼與該制裁字元編碼,其中: 當該客戶字元編碼與該制裁字元編碼完全相同時,對應輸出該評分分數為100分;以及 當該客戶字元編碼與該制裁字元編碼不同時,對應輸出該評分分數為0分。
  3. 如請求項1所述的姓名編碼比對裝置,其中該些評分演算法包括: 一模糊演算法,比對該客戶字元拼音與該制裁字元拼音,其中: 當該客戶字元拼音與該制裁字元拼音完全相同時,對應輸出該評分分數,且該評分分數大於該辨識度門檻值;以及 當該客戶字元拼音與該制裁字元拼音不同時,對應輸出該評分分數為0分。
  4. 如請求項1所述的姓名編碼比對裝置,其中該些評分演算法包括: 一涵蓋演算法,比對該客戶字元編碼與該制裁字元編碼,以根據一基本分數、一命中字數比及一名單命中值,透過式(1)-(3)計算得出該評分分數,其中:
    Figure 03_image001
    式(1);
    Figure 03_image003
    式(2);以及
    Figure 03_image005
    式(3)。
  5. 如請求項1-4中任一項所述的姓名編碼比對裝置,其中該標準化模組更包括一標準化規則,以標準化該客戶資料及該制裁資料,該標準化規則包括: 一大小寫邏輯,自動轉換該客戶資料及該制裁資料中之一小寫英文字元為一大寫英文字元; 一轉換邏輯,自動轉換該客戶資料及該制裁資料中之一亂碼字元為一空白字元; 一省略邏輯,自動刪減該客戶資料及該制裁資料中之一特定字元,該特定字元包括稱謂、職稱及股份(限)公司;以及 一刪除邏輯,自動刪除該客戶姓名及該制裁姓名中之一重疊字元。
TW109209480U 2020-07-23 2020-07-23 姓名編碼比對裝置 TWM604438U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW109209480U TWM604438U (zh) 2020-07-23 2020-07-23 姓名編碼比對裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109209480U TWM604438U (zh) 2020-07-23 2020-07-23 姓名編碼比對裝置

Publications (1)

Publication Number Publication Date
TWM604438U true TWM604438U (zh) 2020-11-21

Family

ID=74203887

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109209480U TWM604438U (zh) 2020-07-23 2020-07-23 姓名編碼比對裝置

Country Status (1)

Country Link
TW (1) TWM604438U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732754A (zh) * 2020-12-26 2021-04-30 中国农业银行股份有限公司 一种信息匹配方法及装置
TWI788688B (zh) * 2020-07-23 2023-01-01 臺灣銀行股份有限公司 姓名編碼比對裝置及其方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI788688B (zh) * 2020-07-23 2023-01-01 臺灣銀行股份有限公司 姓名編碼比對裝置及其方法
CN112732754A (zh) * 2020-12-26 2021-04-30 中国农业银行股份有限公司 一种信息匹配方法及装置

Similar Documents

Publication Publication Date Title
US11475143B2 (en) Sensitive data classification
US20170091321A1 (en) Document classification system, document classification method, and document classification program
AU2021388096B2 (en) Systems and methods for relevance-based document analysis and filtering
US20160232630A1 (en) System and method in support of digital document analysis
CN112686022A (zh) 违规语料的检测方法、装置、计算机设备及存储介质
TWM604438U (zh) 姓名編碼比對裝置
CN109933644B (zh) 一种字符串匹配方法及装置
JP5723067B1 (ja) データ分析システム、データ分析方法、および、データ分析プログラム
US20240193522A1 (en) Citation and policy based document classification
US20170075986A1 (en) Document analysis system, document analysis method, and document analysis program
JP5098631B2 (ja) メール分類システム、メール検索システム
CN116342141A (zh) 一种空壳企业识别方法、装置和设备
CN109918639B (zh) 一种基于深度学习技术和规则库的银行授信文本解析方法
JP6534255B2 (ja) 不正取引検知システム
CN114492323A (zh) 一种基于电子投标文件比对的围串标行为检测方法及装置
CN113591476A (zh) 一种基于机器学习的数据标签推荐方法
TWI788688B (zh) 姓名編碼比對裝置及其方法
JP6124936B2 (ja) データ分析システム、データ分析方法、および、データ分析プログラム
US11681966B2 (en) Systems and methods for enhanced risk identification based on textual analysis
JP6534256B2 (ja) 名寄せプログラム
Slavin et al. The method of search for falsifications in copies of contractual documents based on N-grams
JP2001243281A (ja) リスク分析システム及びその方法、保険設計システム及びその方法、保険約款作成方法、並びにコンピュータ上で動作するリスク分析プログラム、保険設計プログラム又は保険約款作成プログラムを記録した記録媒体
Saket et al. Cost Sensitive Approach to Ethereum Transactions Fraud Detection using Machine Learning
KR102451168B1 (ko) 사기피해 정보 제공 방법 및 프로그램
JP7289425B2 (ja) 受給者管理システム、受給者管理方法、および、受給者管理プログラム