JP7260380B2 - 情報処理装置及び顧客情報解析方法 - Google Patents

情報処理装置及び顧客情報解析方法 Download PDF

Info

Publication number
JP7260380B2
JP7260380B2 JP2019075620A JP2019075620A JP7260380B2 JP 7260380 B2 JP7260380 B2 JP 7260380B2 JP 2019075620 A JP2019075620 A JP 2019075620A JP 2019075620 A JP2019075620 A JP 2019075620A JP 7260380 B2 JP7260380 B2 JP 7260380B2
Authority
JP
Japan
Prior art keywords
customer
information
customer information
list
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019075620A
Other languages
English (en)
Other versions
JP2020173646A (ja
Inventor
篤哉 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MUFG Bank Ltd
Original Assignee
MUFG Bank Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MUFG Bank Ltd filed Critical MUFG Bank Ltd
Priority to JP2019075620A priority Critical patent/JP7260380B2/ja
Publication of JP2020173646A publication Critical patent/JP2020173646A/ja
Application granted granted Critical
Publication of JP7260380B2 publication Critical patent/JP7260380B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、顧客送金のための電文に含まれる顧客情報を解析する技術に関する。
銀行間における送金の指示は、一般的に、電文の送受信により行われ、電文の規格としてSWIFTフォーマットが知られている。SWIFTフォーマットは、国際銀行間金融通信協会(Society for Worldwide Interbank Financial Telecommunication:SWIFT)によって提供され、顧客送金や銀行間の国際送金などに利用される。SWIFTフォーマットは、メッセージの種類によって規格が定められており、例えば、顧客送金のための電文はMT103と呼ばれている。
顧客送金のための電文は、顧客(受取人)の情報を含むが、電文に示された顧客を特定するために電文の顧客情報解析が行われる。顧客情報解析の方法として、例えば、特許文献1が知られている。ここでの顧客情報解析は、まず、各顧客に予めキーワードとなる単語を紐づけしておき、その上で、電文の文字列を単語ごとに分割し、分割された単語と紐づけられた単語とを照合する。照合の結果、一致した単語がある場合、その単語に紐づけられた顧客を電文に示された顧客として特定する。
特開2006-99345号公報
しかしながら、特許文献1に記載の顧客情報解析では、各顧客に対して単語を紐づける作業が別途必要であり、作業者への負担は軽減されないという問題があった。さらに、顧客間で紐づけられた単語が重複してしまうと、顧客を絞り込むことが困難になるという問題もあった。そのため、顧客情報解析における処理速度は向上せず、また、作業者の作業効率はそれほど改善されていない。
本発明は、上記問題に鑑み、顧客情報解析において、情報処理装置の処理時間の短縮、及び作業者の負担を軽減し、作業効率の向上を図ることを課題の一つとする。
本発明の一実施形態に係る情報処理装置は、文字列に含まれる第1識別情報をデータベースで検索して生成される検索リストと、文字列に含まれる第2識別情報を複数の単語に分割して生成される検索単語リストと、を照合し、検索単語リストの少なくとも一つの単語を含むレコードの候補リストを生成する。
検索リストを生成する第1処理部と、検索単語リストを生成する第2処理部と、候補リストを生成する第3処理部を含んでいてもよい。
データベースは、レコードに顧客情報を含む顧客情報データベースであり、検索リストは、顧客情報を含む顧客検索リストであり、候補リストは、顧客情報を含む顧客候補リストであってもよい。
また、本発明の一実施形態に係る顧客情報解析方法は、文字列から第1識別情報を抽出し、顧客情報データベースから第1識別情報を含むレコードを抽出して顧客検索リストを生成し、文字列から第2識別情報を抽出し、第2識別情報を複数の単語に分割して検索単語リストを生成し、顧客検索リストと検索単語リストとを照合して、検索単語リストの単語を含むレコードの顧客候補リストを生成する。
顧客情報データベースはサーバーに記憶されていてもよい。
第1識別情報が顧客情報データベースに含まれない場合、第1処理部は、文字列に含まれる顧客情報を顧客情報データベースに追加してもよい。
文字列は、SWIFTフォーマットのMT103に含まれていてもよい。また、文字列は、タグ59のフィールドに含まれていてもよい。
第1識別情報は、顧客の口座番号を含んでいてもよい。
第2識別情報は、顧客の名称を含んでいてもよい。
文字列に含まれる記号「/」に続く数字列を第1識別情報として抽出してもよい。
第2処理部は、分割された複数の単語から不要単語リストに含まれる単語を除外し、検索単語リストを生成してもよい。
顧客候補リストを生成する場合、検索単語リストに含まれる単語との一致数による重み付けを行ってもよい。
顧客候補リストを生成する場合、検索単語リストの順序による重み付けを行ってもよい。
顧客候補リストを生成する場合、検索単語リストの単語の文字数による重み付けを行ってもよい。
本発明の一実施形態に係る顧客情報解析を用いる顧客送金システムを示すブロック図である。 本発明の一実施形態に係る顧客情報解析に用いられる電文を示す概略図である。 本発明の一実施形態に係る顧客情報解析を処理する情報処理装置を示すブロック図である。 本発明の一実施形態に係る顧客情報解析を処理する情報処理装置を示すブロック図である。 本発明の一実施形態に係る顧客情報解析の処理を示すフローチャートである。アタッチメントの概略図である。 本発明の一実施形態に係る顧客情報解析の顧客検索リストを生成する処理ステップを示すフローチャートである。 本発明の一実施形態に係る顧客情報解析の顧客検索リストを生成する処理ステップの具体例である。 本発明の一実施形態に係る顧客情報解析の検索単語リストを生成する処理ステップを示すフローチャートである。 本発明の一実施形態に係る顧客情報解析の検索単語リストを生成する処理ステップの具体例である。 本発明の一実施形態に係る顧客情報解析の顧客候補リストを生成する処理ステップを示すフローチャートである。 本発明の一実施形態に係る顧客情報解析の顧客候補リストを生成する処理ステップの具体例である。 本発明の一実施形態に係る顧客情報解析の顧客候補リストの具体例である。
以下、本発明の一実施形態について、図面を参照しながら詳細に説明する。以下に示す実施形態は本発明の実施形態の一例であって、本発明は、この実施形態に限定して解釈されるものではない。すなわち、以下に説明する複数の実施形態に公知の技術を適用して変形をして、様々な態様で実施をすることが可能である。
本明細書において、「データベース」とは、蓄積された情報であって、情報処理装置を用いて処理(例えば、情報の追加、削除、検索など)することができるようにデータとして管理されるものをいう。また、「レコード」とは、データベースを構成する単位の一つであって、管理される対象の1件分の情報が含まれる。なお、レコードに含まれる情報は、一つの項目だけでなく、複数の項目が含まれていてもよい。例えば、顧客情報データベースであれば、各顧客がレコードとして管理され、各レコードには、顧客番号、口座番号、又は顧客情報などの項目が含まれていてもよい。
<第1実施形態>
[1.顧客送金システム]
始めに、顧客情報解析が必要とされる顧客送金システムについて説明する。
図1に、本発明の一実施形態に係る顧客情報解析を用いる顧客送金システムを示す。顧客送金システムは、顧客送金のための電文の顧客情報解析を行う情報処理装置10Bと、顧客情報データベースを記憶するサーバー20Bと、を含む。
具体的には、図1は、依頼人Xが、B銀行の顧客Y(受取人)の銀行口座へ送金する場合のフローを示す。A銀行の情報処理装置10Aは、A銀行の顧客情報などが記憶されたサーバー20Aに接続されている。同様に、B銀行の情報処理装置10Bも、B銀行の顧客情報などが記憶されたサーバー20Bに接続されている。依頼人Xは、直接又はインターネットを通じてA銀行に、B銀行の顧客Xの銀行口座に送金するよう依頼する。依頼を受けたA銀行は、依頼人、顧客Y及び口座番号などの送金に関する情報を含む、顧客送金のための電文を作成する。電文は、暗号化されたデータに変換され、ネットワークを通じてA銀行からB銀行に送信される。電文を受信したB銀行は、情報処理装置10B及びサーバー20Bを用いて本実施形態に係る顧客情報解析を行い、電文の顧客Yと判定される顧客情報が含まれるレコードを含む顧客候補リストを作成する。B銀行の作業者は、顧客候補リストを確認し、電文の顧客Yが顧客候補リストの中の顧客情報と一致すると判断できた場合は、特定されたB銀行の顧客Yの口座番号52への送金の手続き処理を進める。
本実施形態に係る顧客情報解析は、後述する[4.顧客情報解析]で詳細を説明するが、2つの識別情報を基にして段階的に顧客情報を絞りことにより、情報処理装置の負荷を軽減又は分散することができる。その結果、顧客情報解析における処理速度の向上を図ることができる。
また、顧客候補リストの生成にあたり、電文に示される顧客Yとの一致度を示す重み付けが行われることが好ましい。作業者が顧客候補リストを確認する際、重みを判断基準として顧客を特定することができるため、作業者の負担が軽減され、作業効率を向上することができる。
[2.電文]
続いて、顧客情報解析の解析対象である顧客送金のための電文について説明する。
図2(A)に、本発明の一実施形態に係る顧客情報解析に用いられる電文を示す。具体的には、図2(A)は、SWIFTフォーマットのMT103(顧客口座振込電文)である。
図2(A)に示す電文は、「:52A:」で示されるタグ52A、「:57A:」で示されるタグ57A及び「:59:」で示されるタグ59など、所定の内容が示される複数のフィールドが規定されている。例えば、タグ52Aは「Ordering Institution(Payer’s Bank)」(支払人の銀行)、タグ57Aは「Account with Institution(Beneficiary’s Bank)」(受益者の銀行)、及びタグ59は「Beneficiary」(受益者)と規定されており、それぞれに関連する情報が示されている。
送金のために必要となる顧客情報はタグ59に含まれており、タグ59には、受益者、すなわち、送金の受取人の口座番号、名称、住所などが入力されている。改行コードである「CrLf」を除くと、記号「/」の後に、文字列「001-1234567 BANK OF TOKYO-MITSUBISHI UFJ HEAD OFFICE 7-1 MARUNOUCHI, CHIYODA-KU, TOKYO, JAPAN」が示されている。文字列の中の最初の数字列「001-1234567」は、銀行の支店番号(又は店番)「001」と口座番号「1234567」とが「-」で連結されている。店番は入力されない場合もある。数字列に続く第1文字列「BANK OF TOKYO-MITSUBISHI UFJ HEAD OFFICE」は、受取人の名称を表している。また、第1文字列に続く第2文字列「7-1 MARUNOUCHI, CHIYODA-KU, TOKYO, JAPAN」は、受取人の住所を表している。以上を整理すると、MT103のタグ59に含まれる文字列は、記号「/」の後に、顧客情報として、受取人の口座番号、名称、及び住所がその順番で示されている。
MT103のタグ59は、依頼人による依存が大きいフィールドであるところ、同じ送金先の受取人であっても、依頼人が異なると受取人の名称が異なる場合が多い。また、送金元の銀行において、作業者が手作業で入力することも少なくなく、作業者によって受取人の名称が異なって入力される場合もあり得る。例えば、図2(B)及び図2(C)に、同じ受取人でありながら、図2(A)のタグ59に示された受取人に関する情報と異なっている例を示す。図2(B)に示す例は、「OFFICE」の「O」と「FFICE」との間にスペースが挿入されたものである。これは、「O」と「FFICE」との間に改行コードが挿入された場合に起こり得る。また、図2(C)に示す例は、「BANK OF TOKYO-MITSUBISHI UFJ」の各単語の頭文字を取り、「BTMU」と省略されたものである。
受取人の銀行口座がある銀行の顧客情報データベースに図2(A)に示す顧客情報しか登録されていない場合、図2(B)又は図2(C)の顧客情報を含む電文では顧客情報データベースと顧客情報が一致しないため、受取人の銀行口座への送金の手続きを進めることはできない。しかしながら、このような場合において、本実施形態に係る顧客情報解析を行うことで、銀行の顧客情報データベースから電文との一致度の高い顧客情報を含むレコードを抽出した顧客候補リストが生成される。作業者は、顧客候補リストを確認し、軽微な違いであれば、電文を補正するだけで、送金の手続きを進めることができる。そのため、本実施形態に係る顧客情報解析は、作業者の顧客情報を確認する時間を短縮することができる。
以上、SWIFTフォーマットのMT103を電文の一例として説明したが、本実施形態に係る顧客情報解析の適用できる対象はこれに限られない。少なくとも顧客の口座番号及び顧客の名称を含む顧客情報を含む電文であれば、あらゆる電文に対して適用することができる。
[3.情報処理装置]
図3に、本発明の一実施形態に係る顧客情報解析を処理する情報処理装置10を示す。情報処理装置10は、第1処理部100、第2処理部200、第3処理部300、及び記憶部400を含む。また、情報処理装置10は、サーバー20と通信し、サーバー20に記憶されている情報又はデータベースを読み出すことができる。
情報処理装置10は、例えば、コンピュータであり、演算手段としてCPU(Central Processing Unit:中央演算処理装置)を含む。CPUは、顧客情報解析プログラムを読み込むことで、第1処理部100、第2処理部200、又は第3処理部300として機能し、所定の処理を実行することができる。なお、1個のCPUで第1処理部100、第2処理部200、及び第3処理部300の処理を実行することもでき、複数のCPUを設けて、各々のCPUに第1処理部100、第2処理部200、又は第3処理部300の処理を実行させることもできる。
また、情報処理装置10は、記憶部400を含む。記憶部400は、RAM(Random Access Memory)、ROM(Read Only Memory)、又はハードディスクを含むことができる。例えば、一時的な情報はRAMに記憶し、恒久的な情報はハードディスクに記憶することができる。また、顧客情報解析プログラムはROMに記憶しておいてもよい。記憶部400は、本実施形態に係る顧客情報解析の中で生成される、顧客検索リスト430、検索単語リスト440、又は顧客候補リストを記憶することができる。一方、サーバー20には、顧客情報解析で必要となる顧客情報データベース410及び不要単語リスト420が記憶されている。なお、顧客情報データベース410又は不要単語リスト420は、記憶部400に記憶されていてもよい。また、必要に応じて、サーバー20から顧客情報データベース410又は不要単語リスト420を読み出し、記憶部400に記憶することもできる。
顧客情報データベース410には、過去の顧客情報解析において、異なる顧客(顧客情報データベースの顧客情報と一致しない顧客)と判定された顧客情報が、各顧客ごとにレコードとして登録されている。なお、顧客情報データベース410への登録は、顧客情報解析だけでなく、他の解析や手続きによって行われてもよい。顧客情報としては、少なくとも顧客の口座番号及び名称が含まれ、顧客の住所が含まれていてもよい。また、各顧客のレコードには、顧客情報だけでなく、銀行内で顧客を管理するための顧客番号を含むこともできる。
不要単語リスト420は、顧客の名称として識別力を発揮しない単語が登録されている。そのような単語としては、例えば、助詞の「THE」、前置詞の「OF」、「FROM」、又は「FOR」、若しくは、会社名として一般的な「OFFICE」、「Co」、「LTD」等であるが、これに限られない。
次に、第1処理部100、第2処理部200、及び第3処理部300での処理の概要について説明する。なお、各処理のより詳細な構成については、後述する[4.顧客情報解析]で説明する。
第1処理部100は、顧客送金のための電文内の文字列から第1識別情報として受取人の口座番号を抽出し、顧客情報データベース410の各レコードの顧客情報と第1識別情報とを照合する。顧客情報データベース410に、第1識別情報を含む顧客情報が存在する場合、顧客情報データベース410から第1識別情報を含むレコードを抽出して顧客検索リスト430を生成する。生成された顧客検索リスト430は、記憶部400に記憶される。
第2処理部200は、顧客送金のための電文内の文字列から第2識別情報として受取人の名称を抽出し、複数の単語に分割する。また、第2識別情報の単語の並び順に、先頭から所定の数の単語を抽出した検索単語リスト440を生成する。その際、分割された単語が不要単語リスト420に含まれている場合には、その分割された単語を除外して検索単語リスト440を生成する。生成された検索単語リスト440は、記憶部400に保存される。
第3処理部300は、顧客検索リスト430と検索単語リスト440とを照合する。顧客検索リスト430のレコードの顧客情報に、検索単語リスト440の単語が含まれる場合、顧客検索リスト430から検索単語リスト440の単語を含む顧客情報を抽出して顧客候補リスト450を生成する。なお、顧客候補リスト450には、重み付けとして、顧レコードごとに検索単語リストの単語と一致した単語数を含むようにすることができる。生成された顧客候補リスト450は、記憶部400に保存される。
銀行の作業者は、顧客候補リスト450を確認し、顧客送金のための電文に示された受取人の名称及び口座番号が顧客候補リスト450の中の顧客情報と一致すると判断できた場合は、その顧客情報から特定された受取人の銀行口座に送金するための手続きを進めることができる。
図4に、情報処理装置10の変形例を示す。
図4に示す情報処理装置10は、サーバー20の一部に設けられている。銀行の作業者は、個人の情報処理端末からサーバー20にアクセスし、サーバー20を通じて情報処理装置10を起動し、情報処理解析を行う。サーバー20は複数のパーティションに分けられていてもよく、異なるパーティションの記憶部を用いて顧客情報解析を行うこともできる。例えば、図4に示すように、顧客情報解析で生成される、顧客検索リスト430、検索単語リスト440、及び顧客候補リスト450は、情報処理装置10と同じパーティション内の第1記憶部400-1に記憶することができる。一方、顧客情報解析以外でも使用される、顧客情報データベース410又は420は、情報処理装置10と異なるパーティション内の第2記憶部400-2に記憶することができる。
上記変形例では、サーバー20に複数のパーティションを設ける構成について説明したが、複数のサーバー20(例えば、第1サーバー20-1及び第2サーバー20-2)を用い、第1サーバー20-1に情報処理装置10を設け、第2サーバー20-2に第2記憶部400-2を設ける構成とすることもできる。
[4.顧客情報解析]
図5~図12を用いて、本発明の一実施形態に係る顧客情報解析について説明する。
図5に、本発明の一実施形態に係る顧客情報解析の処理のフローチャートを示す。顧客情報解析は、少なくとも、第1処理部100で実行され、電文の第1識別情報との照合から顧客検索リスト430が生成される処理ステップ(S100)と、第2処理部200で実行され、電文の第2識別情報との照合から検索単語リスト440が生成される処理ステップ(S200)と、第3処理部300で実行され、顧客検索リスト430と検索単語リスト440との照合から顧客候補リスト450が生成される処理ステップ(S300)とを含む。以下、各処理ステップの詳細について説明する。
図6に、本発明の一実施形態に係る顧客情報解析の顧客検索リスト430を生成する処理ステップ(S100)のフローチャートを示す。
第1処理部100は、顧客送金のための電文内の顧客情報が含まれる文字列を特定する(S110)。顧客送金のための電文はフォーマットが規定されている場合が多く、電文内の所定のフィールドに受取人に関する情報が示されている。例えば、SWIFTフォーマットのMT103の場合、タグ59に受取人に関する情報が含まれているため、タグ59のフィールドを受取人に関する情報が含まれる文字列として特定することができる。
次に、特定された文字列の中から、第1識別情報を抽出するための識別記号を特定する(S120)。第1識別情報は受取人の口座番号を含む数字列である。そのため、連続する数字が表れる直前の文字又は記号を識別記号とすることができる。例えば、SWIFTフォーマットのMT103の場合、タグ59に含まれる「/」に続く数字列は受取人の口座番号を表す。そのため、記号「/」を第1識別情報を抽出するための識別記号とすることができる。
次に、識別記号を基にして文字列から第1識別情報を抽出する(S130)。上述したように、第1識別情報は受取人の口座番号を含む数字列である。数字列には受取人の口座番号以外の番号、例えば、銀行番号又は店番が含まれる場合もある。しかしながら、このような場合であっても、銀行番号又は店番と口座番号とはスペースや「-」等によって区切られているため、口座番号を特定することはを特定することは可能である。
次に、第1処理部100は、記憶部400から顧客情報データベース410を読み込み、顧客情報データベース410の各レコードの顧客情報と第1識別情報とを照合し、第1識別情報を含む顧客情報があるか否かの判定を行う(S140)。顧客情報データベース410に第1識別情報を含む顧客情報がない場合、顧客情報データベース410に電文内の顧客情報を新たな顧客のレコードとして登録し(S150)、更新された顧客情報データベース410を記憶部400に記憶して処理ステップを終了する。一方、顧客情報データベース410に第1識別情報を含む顧客情報がある場合、顧客情報データベース410から第1識別情報を含むレコードを抽出する(S160)。
最後に、第1処理部100は、抽出された顧客情報から顧客検索リスト430を生成する(S160)。顧客検索リスト430は、記憶部400に記憶され、第1処理部による処理ステップが終了する。
図7を用いて、本発明の一実施形態に係る顧客情報解析の顧客検索リスト430を生成する処理ステップ(S100)について、より具体的に説明する。
図7(A)は、図2(A)に示すSWIFTフォーマットのMT103のタグ59の抜粋である。上述したように、タグ59に受取人に関する情報が含まれているため、タグ59に対して本実施形態に係る顧客情報解析が行われる。第1処理部100は、タグ59の文字列を特定し、さらに識別記号「/」を特定する。また、第1処理部100は、識別記号「/」に続く数字列「7654321」を第1識別情報として抽出する。なお、数字列「7654321」は受取人の口座番号を示す。
第1処理部100は、顧客情報データベース410を読み出し、顧客情報データベース410の各レコードと第1識別情報「7654321」とを照合する。図7(B)は、説明のために、顧客情報データベース410のレコードに含まれる顧客番号及び顧客情報の一部である口座番号を抜粋し、表にまとめたものである。表のNo.2及びNo.4の口座番号が第1識別情報「7654321」と一致する。No.2及びNo.4を抜粋した表を図7(C)に示す。顧客番号の欄からわかるように、顧客情報解析を行う銀行において、「837-1234567」と「002-7891234」とで管理された2人の顧客が存在している。このように第1識別情報のみでは受取人を特定することができないが、一定範囲の受取人に絞り込むことは可能である。特に、第1識別情報は数字列のみで構成されるため、第1識別情報の抽出及び第1識別情報との照合は容易であり、この処理は短時間で実行することが可能である。
第1処理部100は、顧客情報データベース410から第1識別情報「7654321」を含むレコードを抽出し、顧客検索リスト430を生成する。図7(D)に、顧客検索リスト430の一例を示す。図7(D)に示す顧客情報の欄は、過去の顧客情報解析の処理で登録されたものであり、たとえ同じ顧客番号であっても、異なる顧客のレコードとして登録されている。顧客検索リスト430は、記憶部400に記憶される。
図8は、本発明の一実施形態に係る顧客情報解析の検索単語リスト440を生成する処理ステップ(S200)のフローチャートを示す。
第2処理部200は、顧客送金のための電文内の顧客情報が含まれる文字列の第1識別情報に続く文字列から第2識別情報を抽出する(S210)。第2識別情報は、受取人の名称を含む。MT103のタグ59の場合、受取人の口座番号に続いて、受取人の名称及び住所が含まれる。そのため、第1識別情報に続く文字を第2識別情報として抽出することができる。なお、住所は、最初に番地を示す数字が表れる場合が多い。そのため、第2識別情報を抽出する場合、文字の先頭から数字が表れるまでを第2識別情報として抽出することもできる。この場合、第2識別情報のデータ量が小さくなるため、処理時間を短縮することができる。
次に、第2識別情報を所定の区切り文字を用いて単語ごとに分割する(S220)。区切り文字としては、例えば、スペースや、「、」、「,」、「.」、「-」、「(」、「)」等の記号であるが、これに限られない。区切り文字は、顧客情報解析プログラムに含まれていてもよく、記憶部400に記憶されていてもよい。なお、第2識別情報を単語に分割した場合であっても、単語の並び順は第2識別情報と同様とする。
次に、第2処理部200は、記憶部400から不要単語リスト420を読み込み、分割された単語が不要単語リスト420に含まれるか否かの判定を行う(S230)。分割された単語が不要単語リスト420に含まれている場合、その分割された単語を除外する。分割された単語の全てについて上記判定を繰り返し、不要単語リスト420に含まれる単語を除外する。なお、不要リストに含まれる単語を除外した場合であっても、単語の並び順は変えないものとする。
次に、第2処理部200は、分割された単語から所定の数の単語を抽出する(S250)。単語の抽出は、分割された単語の並び順の先頭から行われる。上述したように、第2識別情報は受取人の名称を含むが、第2識別情報の後半部分は受取人の住所が含まれている可能性が高い。そのため、第2識別情報の並び順の先頭から単語を抽出することで、受取人の住所をノイズとして除去することができる。また、抽出する単語の数は、10個以下、好ましくは8個以下、さらに好ましくは5個以下である。抽出する単語の数が少なければ、後述する顧客検索リスト430との照合における処理時間を短縮することができる。
最後に、第2処理部200は、抽出された単語を基に、検索単語リスト440を生成する(S260)。検索単語リスト440は、記憶部400に記憶され、第2処理部による処理ステップが終了する。
図9を用いて、本発明の一実施形態に係る顧客情報解析の検索単語リスト440を生成する処理ステップ(S200)について、より具体的に説明する。
図9(A)は、図7(A)に示す文字列のうち、第1識別情報に続く、抽出された第2識別情報「BANK OF TOKYO-MITSUBISHI UFJ HEAD OFFIC 7-1 MARUNOUCHI, CHIYODA-KU, TOKYO, JAPAN」である。第2識別情報を、スペース、「,」、「-」を区切り文字として単語ごとに分割すると、図9(B)に示すように、「BANK」、「TOKYO」、「MITSUBISHI」、「UFJ」、「HEAD」、「7」、「1」、「MARUNOUCHI」、「CHIYODA」、「KU」、「TOKYO」、「JAPAN」の単語に分割される。
ここで、不要単語リスト420に、「OF」及び「OFFICE」が含まれているものとし、これらの単語を除外したものが図9(C)である。単語に分割し、不要単語リスト420に含まれる単語を除外した後も、単語の並び順は第2識別情報と同様である。さらに、抽出する単語の数が5個である場合、第2処理部200は、図9(D)に示すように、分割された単語の先頭から5個の単語、「BANK」、「TOKYO」、「MITSUBISHI」、「UFJ」、「HEAD」を抽出し、これらの単語を含む検索単語リスト440を生成する。検索単語リスト440は、記憶部400に記憶される。
図10は、本発明の一実施形態に係る顧客情報解析の顧客候補リスト450を生成する処理ステップ(S300)のフローチャートを示す。
第3処理部300は、記憶部400から顧客検索リスト430及び検索単語リスト440を読み込み、顧客検索リスト430の各レコードの顧客情報と検索単語リスト440とを照合する(S310)。また、各レコードごとに、検索単語リスト440に含まれる単語と一致する単語の数をカウントする。
次に、第3処理部300は、一致する単語の数が0(ゼロ)のレコードがあるか否かの判定を行う(S320)。顧客検索リスト430の中に一致する単語の数が0のレコードがある場合、そのレコードを除外する(S330)。顧客検索リスト430に含まれるレコードの全てについて上記判定を繰り返し、第3処理部300は、顧客候補リスト450を生成する(S340)。
結果として、顧客候補リスト450には、電文の受取人の口座番号が一致し、かつ、受取人の名称の一部と一致する顧客情報が含まれる。作業者は、顧客候補リスト450を確認し、電文の受取人の顧客情報と顧客候補リスト450の中の顧客情報とが一致すると判断できた場合は、その顧客情報から特定された受取人の銀行口座に送金するための手続きを進めることができる。なお、顧客候補リスト450は、一致する単語の数の多い顧客の順に並び替えられることが好ましい。作業者は、一致する単語の数が多い順番に顧客情報を確認することができるため、作業者の作業時間を短縮することができる。
図11を用いて、本発明の一実施形態に係る顧客情報解析の顧客候補リスト450を生成する処理ステップ(S300)について、より具体的に説明する。
図11(A)は、図7(D)に示す顧客検索リスト430と図9(D)に示す検索単語リスト440とを照合し、一致する単語の数を(1)欄に示したものである。図11(A)の1行目のレコードの顧客情報は、検索単語リスト440中の「BANK」、「TOKYO」、「MITSUBISHI」、「UFJ」、「HEAD」の5個の単語が一致するため、(1)欄に5が示されている。また、図11(A)の2行目のレコードの顧客情報は、「BANK」、「TOKYO」、「MITSUBISHI」の3個の単語が一致するため、(1)欄に3が示されている。
図11(B)に、顧客候補リスト450の一例を示す。検索単語リスト440と一致する単語がない顧客が除外されている。(1)欄には検索単語リスト440と一致する単語の数が示されているが、一致する単語の数を重みとした重み付けが行われているともいえる。重みが大きい方が電文との一致度が高いため、重みの大きい順に顧客を並べ替えてもよい。
作業者は、顧客候補リスト450において重みが大きい順に顧客情報を確認し、電文に示された受取人に関する情報が顧客候補リスト450の中の顧客情報と一致すると判断できた場合は、特定された受取人の銀行口座に送金するための手続きを進める。顧客候補リスト450は、顧客情報が絞り込まれているだけでなく、重み付けが行われているため、作業者は、電文の受取人との一致度が高い顧客情報から確認することができる。そのため、作業者の作業時間を短縮することができ、作業効率が向上する。
図12を用いて、顧客候補リスト450を生成するステップS340の変形例について説明する。
顧客候補リスト450を生成する場合、さらなる重み付けを導入することも可能である。すなわち、顧客候補リスト450は、一致した単語の数以外の重みを含むこともできる。複数の重みを含むことで、一つの重みが一致する顧客が複数存在する場合に、別の重みを考慮して顧客を絞り込むことができる。
図12(A)~図12(C)において、(1)欄は一致した単語の数による第1の重みであり、(2)欄はそれとは別の重みである。なお、本変形例においては、図12(A)~図12(C)に示す1行目のレコードの顧客情報が「TOKYO-MITSUBISHI」ではなく、「TOKYO-MITUBISI」となっている点で、図11(B)と異なっている。
図12(A)は、検索単語リスト440に含まれる単語の順序による重み付けを導入した場合である。電文から受取人の名称を含む第2識別情報を抽出する際、受取人の名称が短い場合には、受取人の住所が含まれて抽出される場合があり得る。この場合、受取人の住所は後半部分に含まれる。そのため、検索単語リスト440に含まれる単語の並び順において、先頭の単語の重みを大きく、語尾の単語の重みを小さくするように重み付けを行う。例えば、図9(D)に示す検索単語リスト440において、単語の並び順に、「BANK」の重みを5、「TOKYO」の重みを4、「MITSUBISHI」の重みを3、「UFJ」の重みを2、「HEAD」の重みを1として重み付けを行う。図12(A)の1行目のレコードの顧客情報は、「BANK」、「TOKYO」、「UFJ」、「HEAD」の4個が一致し、それぞれの重みを加算した合計は12(=5+4+2+1)である。そのため、(1)欄には「4」、(2)欄には「12」が示される。一方、2行目のレコードの顧客情報は、「BANK」、「TOKYO」、「MITSUBISHI」、「UFJ」の4個が一致し、それぞれの重みを加算した合計は14(=5+4+3+2)である。そのため、(1)欄には「4」、(2)欄には「14」が示される。
図12(B)は、検索単語リスト440に含まれる単語の文字数による重み付けを導入した場合である。単語の文字数が多い場合には誤記等が含まれる場合も多いため、文字数の多い単語が一致する場合には顧客情報が一致している可能性が高い。そのため、文字数の多い単語の重みを大きく、文字数の少ない単語の重みを小さくする。例えば、「BANK」の重みを4、「TOKYO」の重みを5、「MITSUBISHI」の重みを10、「UFJ」の重みを3、「HEAD」の重みを4として重み付けを行う。図12(B)の1行目のレコードの顧客情報は、「BANK」、「TOKYO」、「UFJ」、「HEAD」の4個が一致し、それぞれの重みを加算した合計は16(=4+5+3+4)である。そのため、(1)欄には「4」、(2)欄には「16」が示される。一方、2行目のレコードの顧客情報は、「BANK」、「TOKYO」、「MITSUBISHI」、「UFJ」の4個が一致し、それぞれの重みを加算した合計は22(=4+5+10+3)である。そのため、(1)欄には「4」、(2)欄には「22」が示される。
さらに、図12(A)に示す単語の順序による重み付けと図10(B)に示す単語の文字数による重み付けとを組み合わせた重み付けも可能である。複数の重み付けを組み合わせる場合、各単語に設定されたそれぞれの重みを乗算すればよい。図12(C)は、10(A)に示した重み付けと、10(B)に示した重み付けを考慮した重み付けを導入した場合である。図12(C)の1行目のレコードの顧客情報は、「BANK」、「TOKYO」、「UFJ」、「HEAD」の4個が一致し、それぞれの重みを加算した合計は50(=5×4+4×5+2×3+1×4)である。そのため、(1)欄には「4」、(2)欄には「50」が入力される。一方、図12(C)の2行目のレコードの顧客情報は、「BANK」、「TOKYO」、「MITSUBISHI」、「UFJ」の4個が一致し、それぞれの重みを加算した合計は76(=5×4+4×5+3×10+2×3)である。そのため、(1)欄には「4」、(2)欄には「76」が入力される。
作業者は、顧客候補リスト450の(2)欄の重みの大きい順番である、2行目の顧客情報、1行目の顧客情報の順に確認すればよく、3行目の顧客情報を確認することなく送金の手続きを進めることができる。そのため、作業者の作業時間の短縮を図ることができ、作業効率が向上する。
また、図12(A)~図12(C)からわかるように、いずれの場合も(2)欄に示された重みは、2行目のレコードの顧客情報が最も大きい。電文の受取人に関する情報は「001-1234567 BANK OF TOKYO-MITSUBISHI UFJ HEAD OFFICE 7-1 MARUNOUCHI, CHIYODA-KU, TOKYO, JAPAN」であるため、全体的に比較すると、1行目のレコードの顧客情報の方が良く一致している。しかしながら、顧客情報データベース410に登録された「TOKYO-MITUBISI」部分を含む顧客情報は、そもそも電文に示される可能性が低い顧客情報であり、今後も一致する可能性の低い情報、いわゆるノイズである。本実施形態に係る顧客情報解析を行えば、そのような顧客情報が重みの違いとして表れる。そのため、今後の顧客情報解析において一致する可能性の低い顧客情報を含むレコードを顧客情報データベース410から削除し、新たに電文の顧客情報を登録することができる。すなわち、重み付けを行うことで、顧客情報データベース410のノイズを発見し、除去することができる。そのため、顧客情報データベース410の判定すべき対象を減らすことができ、顧客情報解析における処理速度を向上させることができる。
以上説明したように、本実施形態に係る顧客情報解析は、電文の顧客情報の一部を使用して照合判定を行い、顧客候補リストを生成するため、顧客情報解析における処理時間の短縮を図ることができる。また、顧客候補リストが一定の範囲に絞られているとともに、重み付けが行われているため、作業者の作業時間を短縮することができる。その結果、作業者の負担が軽減し、作業効率が向上する。
本発明の実施形態として上述した各実施形態は、相互に矛盾しない限りにおいて、適宜組み合わせて実施することができる。また、各実施形態を基にして、当業者が適宜構成要素の追加、削除もしくは設計変更を行ったもの、又は、工程の追加、省略もしくは条件変更を行ったものも、本発明の要旨を備えている限り、本発明の範囲に含まれる。
上述した各実施形態によりもたらされる作用効果とは異なる他の作用効果であっても、本明細書の記載から明らかなもの、又は、当業者において容易に予測し得るものについては、当然に本発明によりもたらされるものと解される。
10、10A、10B:情報処理装置、 20、20A、20B:サーバー、 20-1:第1サーバー、 20-2:第2サーバー、 52A、57A、59:タグ、 100:第1処理部、 200:第2処理部、 300:第3処理部、 400:記憶部、 400-1:第1記憶部、 400-2:第2記憶部、 410:顧客情報データベース、 420:不要単語リスト、 430:顧客検索リスト、 440:検索単語リスト、 450:顧客候補リスト

Claims (26)

  1. 文字列に含まれる第1識別情報をデータベースで検索して生成される検索リストと、前記文字列に含まれる第2識別情報を複数の単語に分割して生成される検索単語リストと、を照合し、前記検索単語リストの少なくとも一つの単語を含むレコードの候補リストを生成する情報処理装置。
  2. 前記検索リストを生成する第1処理部と、前記検索単語リストを生成する第2処理部と、前記候補リストを生成する第3処理部を含む請求項1に記載の情報処理装置。
  3. 前記データベースは、レコードに顧客情報を含む顧客情報データベースであり、
    前記検索リストは、顧客情報を含む顧客検索リストであり、
    前記候補リストは、顧客情報を含む顧客候補リストである請求項2に記載の情報処理装置。
  4. 前記顧客情報データベースはサーバーに記憶されている請求項3に記載の情報処理装置。
  5. 前記第1識別情報が前記顧客情報データベースに含まれない場合、前記第1処理部は、前記文字列に含まれる顧客情報を前記顧客情報データベースに追加する請求項3又は請求項4のいずれか一に記載の情報処理装置。
  6. 前記文字列は、SWIFTフォーマットのMT103に含まれる請求項3乃至請求項5のいずれか一に記載の情報処理装置。
  7. 前記文字列は、タグ59のフィールドに含まれる請求項6に記載の情報処理装置。
  8. 前記第1識別情報は、顧客の口座番号を含む請求項3乃至請求項7のいずれか一に記載の情報処理装置。
  9. 前記第2識別情報は、顧客の名称を含む請求項3乃至請求項8のいずれか一に記載の情報処理装置。
  10. 前記文字列に含まれる記号「/」に続く数字列を前記第1識別情報として抽出する請求項3乃至請求項9のいずれか一に記載の情報処理装置。
  11. 前記第2処理部は、分割された複数の単語から不要単語リストに含まれる単語を除外し、前記検索単語リストを生成する請求項3乃至請求項10のいずれか一に記載の情報処理装置。
  12. 前記第3処理部は、前記検索単語リストに含まれる単語との一致数による重み付けを行う請求項3乃至請求項11のいずれか一に記載の情報処理装置。
  13. 前記第3処理部は、前記検索単語リストの順序による重み付けを行う請求項3乃至請求項12のいずれか一に記載の情報処理装置。
  14. 前記第3処理部は、前記検索単語リストの単語の文字数による重み付けを行う請求項3乃至請求項13のいずれか一に記載の情報処理装置。
  15. 文字列から第1識別情報を抽出し、顧客情報データベースから前記第1識別情報を含むレコードを抽出して顧客検索リストを生成し、
    前記文字列から第2識別情報を抽出し、前記第2識別情報を複数の単語に分割して検索単語リストを生成し、
    前記顧客検索リストと前記検索単語リストとを照合して、前記検索単語リストの単語を含むレコードの顧客候補リストを生成する顧客情報解析方法。
  16. 前記顧客情報データベースはサーバーに記憶されている請求項15に記載の顧客情報解析方法。
  17. 前記第1識別情報が前記顧客情報データベースに含まれない場合、前記文字列に含まれる顧客情報を前記顧客情報データベースに追加する請求項15又は請求項16のいずれか一に記載の顧客情報解析方法。
  18. 前記文字列は、SWIFTフォーマットのMT103に含まれる請求項15乃至請求項17のいずれか一に記載の顧客情報解析方法。
  19. 前記文字列は、タグ59のフィールドに含まれる請求項18に記載の顧客情報解析方法。
  20. 前記第1識別情報は、顧客の口座番号を含む請求項15乃至請求項19のいずれか一に記載の顧客情報解析方法。
  21. 前記第2識別情報は、顧客の名称を含む請求項15乃至請求項20のいずれか一に記載の顧客情報解析方法。
  22. 前記文字列から前記第1識別情報を抽出する場合において、前記文字列に含まれる記号「/」に続く数字列を前記第1識別情報として抽出する請求項15乃至請求項21のいずれか一に記載の顧客情報解析方法。
  23. 前記検索単語リストを生成する場合において、分割された複数の単語から不要単語リストに含まれる単語を除外する請求項15乃至請求項22のいずれか一に記載の顧客情報解析方法。
  24. 前記顧客候補リストを生成する場合において、前記検索単語リストに含まれる単語との一致数による重み付けを行う請求項15乃至請求項23のいずれか一に記載の顧客情報解析方法。
  25. 前記顧客候補リストを生成する場合において、前記検索単語リストの順序による重み付けを行う請求項15乃至請求項24のいずれか一に記載の顧客情報解析方法。
  26. 前記顧客候補リストを生成する場合において、前記検索単語リストの単語の文字数による重み付けを行う請求項15乃至請求項25のいずれか一に記載の顧客情報解析方法。
JP2019075620A 2019-04-11 2019-04-11 情報処理装置及び顧客情報解析方法 Active JP7260380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019075620A JP7260380B2 (ja) 2019-04-11 2019-04-11 情報処理装置及び顧客情報解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019075620A JP7260380B2 (ja) 2019-04-11 2019-04-11 情報処理装置及び顧客情報解析方法

Publications (2)

Publication Number Publication Date
JP2020173646A JP2020173646A (ja) 2020-10-22
JP7260380B2 true JP7260380B2 (ja) 2023-04-18

Family

ID=72831642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019075620A Active JP7260380B2 (ja) 2019-04-11 2019-04-11 情報処理装置及び顧客情報解析方法

Country Status (1)

Country Link
JP (1) JP7260380B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056005A (ja) 2000-08-14 2002-02-20 Nri & Ncc Co Ltd 企業コード自動付与装置
JP2004272665A (ja) 2003-03-10 2004-09-30 Fujitsu Ltd 金融商品支援方法
JP2005275880A (ja) 2004-03-25 2005-10-06 Getronics Japan Ltd 字句をデータに変換する装置、方法及びプログラム
JP2006190093A (ja) 2005-01-06 2006-07-20 Oki Electric Ind Co Ltd Ocr為替集中処理システム
JP2013200675A (ja) 2012-03-23 2013-10-03 Japan Research Institute Ltd 電文解析装置および電文解析プログラム
JP2014006758A (ja) 2012-06-26 2014-01-16 Hitachi Systems Ltd 保存文書出庫管理システム及び保存文書出庫管理方法
JP2016122265A (ja) 2014-12-24 2016-07-07 株式会社日本総合研究所 入金結果通知システム及びその方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232871A (ja) * 1997-02-19 1998-09-02 Sharp Corp 検索装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002056005A (ja) 2000-08-14 2002-02-20 Nri & Ncc Co Ltd 企業コード自動付与装置
JP2004272665A (ja) 2003-03-10 2004-09-30 Fujitsu Ltd 金融商品支援方法
JP2005275880A (ja) 2004-03-25 2005-10-06 Getronics Japan Ltd 字句をデータに変換する装置、方法及びプログラム
JP2006190093A (ja) 2005-01-06 2006-07-20 Oki Electric Ind Co Ltd Ocr為替集中処理システム
JP2013200675A (ja) 2012-03-23 2013-10-03 Japan Research Institute Ltd 電文解析装置および電文解析プログラム
JP2014006758A (ja) 2012-06-26 2014-01-16 Hitachi Systems Ltd 保存文書出庫管理システム及び保存文書出庫管理方法
JP2016122265A (ja) 2014-12-24 2016-07-07 株式会社日本総合研究所 入金結果通知システム及びその方法

Also Published As

Publication number Publication date
JP2020173646A (ja) 2020-10-22

Similar Documents

Publication Publication Date Title
JP5613307B2 (ja) データベース内に近似文字列照合を実装するための方法およびシステム
US20080235227A1 (en) Systems and methods to extract data automatically from a composite electronic document
KR20070013867A (ko) 카테고리별 검색 로직을 이용한 상품 검색 시스템 및 방법
US20090144357A1 (en) Use of template messages to optimize a software messaging system
US20070156583A1 (en) Clearing receivables with improved search
JP2020520609A (ja) 電子メッセージのフィルタリング
US20230205755A1 (en) Methods and systems for improved search for data loss prevention
CN108133357A (zh) 一种人才推荐方法及计算设备
US9516089B1 (en) Identifying and processing a number of features identified in a document to determine a type of the document
JP6406653B1 (ja) 表認識処理装置
CN116862372A (zh) 订单拆分方法及装置、存储介质、计算机设备
US20240241863A1 (en) Information processing device, information processing system, information processing method and program
JP7260380B2 (ja) 情報処理装置及び顧客情報解析方法
CN111242751B (zh) 快件订单更新方法、装置、设备及存储介质
JP7272037B2 (ja) 情報処理装置及びプログラム
CN116244353A (zh) 一种计数方法及装置、存储介质、计算机设备
JP6250307B2 (ja) 画像情報処理装置及び画像情報処理方法
KR20060119439A (ko) 질의어를 다양한 로직에 따라 처리하여 매칭되는 결과를출력하는 질의어 매칭 방법 및 시스템
CN111460281B (zh) 信息推送的优化方法及装置、存储介质、终端
WO2022124913A1 (en) Systems and methods for improved transaction reconciliation
JP2017224218A (ja) カタログ検索システム、方法、プログラム
KR101137056B1 (ko) 자동 상품모델 추천 로직을 이용한 상품 정보 등록 방법 및시스템
US20140270575A1 (en) Methods and systems for capture processing
JP7500181B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
WO2022180815A1 (ja) 情報処理プログラム、情報処理方法及び情報処理装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20190509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190509

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230406

R150 Certificate of patent or registration of utility model

Ref document number: 7260380

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150