JP2019530046A - コンピュータシステムからのユーザ情報の収集 - Google Patents

コンピュータシステムからのユーザ情報の収集 Download PDF

Info

Publication number
JP2019530046A
JP2019530046A JP2019500507A JP2019500507A JP2019530046A JP 2019530046 A JP2019530046 A JP 2019530046A JP 2019500507 A JP2019500507 A JP 2019500507A JP 2019500507 A JP2019500507 A JP 2019500507A JP 2019530046 A JP2019530046 A JP 2019530046A
Authority
JP
Japan
Prior art keywords
preset
text information
information
entry
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019500507A
Other languages
English (en)
Other versions
JP6777807B2 (ja
Inventor
リー,フゥイ
ヂォン,グァンハイ
ツァオ,インピン
Original Assignee
アリババ グループ ホウルディング リミテッド
アリババ グループ ホウルディング リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アリババ グループ ホウルディング リミテッド, アリババ グループ ホウルディング リミテッド filed Critical アリババ グループ ホウルディング リミテッド
Publication of JP2019530046A publication Critical patent/JP2019530046A/ja
Application granted granted Critical
Publication of JP6777807B2 publication Critical patent/JP6777807B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Circuits Of Receivers In General (AREA)
  • Preliminary Treatment Of Fibers (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

ユーザサービス情報からのユーザ情報に関連するテキスト情報が識別される。事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合が実行され、前記階層照合は種々の照合方法を含み、前記事前設定リストは前記ユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む。前記階層照合に基づいて、前記ユーザ情報が特定される。

Description

[優先権主張]
本願は、2016年7月7日に提出された中国特許出願第No.201610532453.8号の優先権を主張し、その内容全体が参照により本明細書に組み込まれる。
本開示は、コンピュータシステムからのユーザ情報の収集に関し、特に、モバイル及び関連するコンピューティングシステムに関する。
特にモバイルコンピューティングデバイス、その機能、及びその関連技術に関するインターネット技術の継続する発展及びその利用を考慮すると、生成されるデータ量は指数関数的に増え続けている。生成されたデータから抽出されたユーザ情報(例えば、ユーザの背景(バックグラウンド)又はその他の情報)は、組織及び他のエンティティ(実体)にとって有益になり得る。例えば、抽出されたユーザ情報は、様々なエンティティの決定及び運営に有益な価値あるデータを提供できる。
本開示は、コンピュータシステムから、特にはモバイルシステム及び関連するコンピューティングシステムから、ユーザ情報を収集するための、コンピュータにより実施される方法、コンピュータプログラム製品、及び、コンピュータシステムを含む、方法及びシステムについて述べる。
実施においては、ユーザサービス情報からユーザ情報に関連するテキスト情報が識別される。事前設定リスト(事前設定されたリスト)内の事前設定背景識別情報に基づいて、テキスト情報に階層照合が実行される。ここで、階層照合は種々の照合方法を含み、事前設定リストは、ユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む。ユーザ情報は、階層照合に基づいて特定される。
先に述べた実施は、コンピュータにより実施される方法;コンピュータにより実施される方法を実行するためにコンピュータ読み取り可能命令を格納する非一時的なコンピュータ読取可能媒体;及び、非一時的なコンピュータ読取可能媒体に格納されたコンピュータにより実施される方法/命令を実行するように構成されたハードウェアプロセッサへ相互作動可能に接続するコンピュータメモリを含むコンピュータにより実施されるシステム;を用いて実施可能である。
本明細書で述べる主題は、下記の利点の1つ以上を実現するように特定の実施において実施できる。第一に、ここに述べるアプローチを用いて、ユーザサービス情報から獲得されたテキスト情報と、事前設定背景識別情報リストとに基づいて階層型の照合アプローチを実行することにより、ユーザ情報(例えば、ユーザの現在の雇用主、住所、電話番号、生年月日、学歴、支出パターン、旅行データ、知人、組織上の所属等のユーザ背景情報、又は、その他のユーザ情報)を自動的に収集できる。この階層照合には、テキスト情報からユーザ情報を抽出するための種々の照合方法を含めることができる。階層照合により、各種クオリティ(例えば、構造化/組織化テキスト情報や自由形式のテキスト情報、取得元が未知ソースであるか既知ソースであるかにかかわらない)のテキスト情報の照合を可能にする照合方法の選択もできるようになる。第二に、記載のアプローチは、ユーザによる手作業での情報入力の必要性を減らすことで、ユーザ背景情報収集の効率を向上させることができる。第三に、記載のアプローチは、ユーザ情報を、定義された標準形式(例えば、大学の正式名称の省略形ではなく正式名称)で提供できる。第四に、記載のアプローチは、モバイルインターネット技術及びオンラインインターネットを使用するアクティビティとの統合が可能である。その他の利点は当業者には明らかになろう。
本明細書の主題の1つ以上の実施の詳細を、詳細な説明、特許請求の範囲、添付図面において述べる。主題のその他の特徴、態様、利点は、詳細な説明、特許請求の範囲、添付図面から明らかになろう。
図1は、一の実施による、ユーザ情報を収集する方法の例を示すフローチャートである。
図2は、一の実施による、ユーザ情報を収集する方法の例を示す追加のフローチャートである。
図3は、一の実施による、ユーザ情報を収集する方法の特定の例を示す追加のフローチャートである。
図4は、一の実施による、ユーザ情報を収集するコンピューティングデバイスの例を示すブロック図である。
図5は、一の実施による、ユーザ情報を収集するコンピューティングデバイスの例を示す別のブロック図である。
図6は、一の実施による、本開示で述べる既述のアルゴリズム、方法、機能、工程、フロー、手順に関連する計算機能を提供するために用いられる、コンピュータシステムの例を示すブロック図である。
様々な図面における同様の参照番号及び名称は同様の要素を示す。
以下の詳細な説明は、コンピュータシステム、特にはモバイルシステム及び関連のコンピューティングシステムからのユーザ情報の収集に関する説明であり、当業者が、1つ以上の特定の実施に照らして、開示の主題を作り上げ、これを使用できるようにするために提示される。開示の実施に対して、様々な改変、改造、置き換えを行うことができるが、それは当業者にとっては容易であろう。又、定義される一般原理を、本開示の範囲から逸脱することなく、他の実施及び用途に適用できる。いくつかの例では、記述する主題を理解する上で不必要な詳細は、記述される1つ以上の実施が不必要な詳細によって不明瞭となってしまわないようにという理由で、そして、不必要な詳細は当業者の技量のうちであるという理由で、省略できる。本開示は、記述又は図示された実施に限定されるのではなく、記述される原理及び特徴と矛盾しない最も広い範囲に一致する。
ユーザ情報(例えば、ユーザの雇用主、住所、電話番号、生年月日、学歴、支出パターン、旅行データ、知人、組織上の所属等のユーザ背景情報、又は、その他のユーザ情報)を収集する従来の方法は、通常、ユーザが所望の情報を手作業でコンピューティングデバイス(ラップトップパソコン、モバイルコンピューティングデバイス、又はその他のコンピューティングデバイス等)に入力する必要がある。例えば、ユーザが銀行でクレジットカードを申請する場合、ユーザは、通常、大学情報(特定の学校及び他の学校関連のデータ)を含む背景情報を提供する必要がある。次に、大学情報を用いて、例えば詳細な教育背景といった追加情報を抽出できる。しかし、これらの従来方法は、多数のユーザの背景情報を得るには非効率である。加えて、従来の方法は、通常、オフラインで実行される(例えば、筆記具と紙の形式や閉鎖型ネットワークに接続された機能限定的なコンピューティングデバイスを用いる)。特にモバイルコンピューティングデバイスに関連する最新のインターネット技術を考えた場合に、従来の方法は限定的で、必要もなくリソース集約的である(例えば、帳票処理、データ入力などのために銀行職員の起用を検討する)。
高いレベルで、ユーザサービス(例えば、オンラインショッピング、取引、又はチャットサービス)から取得されるテキスト情報に基づいてユーザ情報を自動抽出するメカニズムが、前述のアプローチにより提供される。階層型の照合(マッチング)アプローチは、取得されたテキスト情報と、事前設定された背景識別リストとの間で実行される。ユーザ情報は、階層照合の結果に基づいて特定される。実施によっては、この階層照合には、テキスト情報からユーザ情報を抽出するための種々の照合方法を含めることができる。階層照合により、各種クオリティ(例えば、構造化/組織化テキスト情報や自由形式のテキスト情報、取得元が未知ソースであるか既知ソースであるかにかかわらない)のテキスト情報の照合を可能にする照合方法の選択もできるようになる。
図1は、一の実施による、ユーザ情報を収集するための方法100の例を示すフローチャートである。明瞭に提示するために、方法100について、他の図面に関連して概括的に以下説明する。しかし、方法100は、例えば、何れか適切なシステム、環境、ソフトウェア、若しくはハードウェアにより、又は、システムと、環境と、ソフトウェアと、ハードウェアとの適宜な組み合わせにより実行できることが分かる。実施によっては、方法100の様々なステップを、並行して、組み合せで、ループで、又は、任意の順序で実行できる。
ステップ101で、ユーザ適用可能サービスからの情報を用いて、ユーザ情報に関するテキスト情報が獲得される。実施によっては、ユーザサービスは、例えば、ユーザにより又はその他のオンラインサービスで毎日使われる、取引、コメント、登録、又はチャットサービスを含むことができる。実施によっては、テキスト情報はアルファベットと数字とを組み合わせた、ユーザが読めるデータを含む。当業者にとっては言うまでもなく、前述のアプローチは、本開示と矛盾しない他のデータタイプ/形式(例えば、2進、16進、及び、暗号化データ)で使うこともできる。
ユーザ情報は、教育情報(例えば、ユーザが在学する学校、又は、過去に在学した学校)、雇用情報(例えば、ユーザの現在又は過去の雇用主)、又は、本開示に沿う他の情報を含んでよい。実施によっては、選択的な構成をサービス需要に従って実行できる。例えば、学歴に関し、学生寮登録サービス、学生ローンサービス、キャンパスカード課金サービス、学校決済サービス、及び他の適用可能なサービス等、様々な適用可能サービスから、学校名に関連するテキスト情報を収集できる。例えば、獲得されたユーザの学歴のテキスト情報は「復旦大学(Fudan University)」又は「復旦大学のXキャンパス」を含むことができる。雇用背景情報については、配達サービス又はその他の適用可能なサービスから取得した配達先所在地情報及び雇用主所在地情報等の雇用主名に関連するテキスト情報を、様々な適用可能なサービスから収集できる。方法100はステップ101からステップ102へ進む。
ステップ102で、獲得されたテキスト情報に階層照合法を実行する。実施によっては、階層照合は、データ格納部に(例えば、データベース内の1つのリスト又はフラットファイルとして)格納されている事前設定背景識別情報に基づく。階層照合操作は、優先順序が付けられた複数の層の照合を含むことができ、ここで、各照合層は種々の照合方法に対応する。実施によっては、照合方法、照合方法間の順序、照合方法の数、又は、階層照合法を実行する他の態様を、手作業で、又は、動的に構成できる。例えば、1つ以上の照合方法を、構成データ内で事前に定義できる、又は、例えば、取得されたテキスト情報の種別、量、クオリティに動的に基づくことができる。実施によっては、階層照合は効率性(例えば、照合速度、厳密性、又は、本開示と矛盾しないその他の理由)のために動的に調整できる。
実施によっては、事前設定リストは、ユーザ情報に関連する事前設定背景識別情報を格納できる。実施によっては、事前設定背景識別情報は、特定のユーザ(又は、ユーザのグループ)とユーザ情報とに関連する学校名、雇用主名、及び、その他識別名を含むことができる。例えば、事前設定リストは複数のエントリを含むことができ、各エントリは異なる学校名又は異なる雇用主名に対応する。実施によっては、学歴情報、全国統一の学校名リストをデータベース(例えば、公共の全国的に利用可能なデータベース、私的データベース、又はその他のデータソース)から取得し、事前設定リストとして提供できる。学校が閉鎖、合併、校名変更されているケース、或いは、その他の特殊な状況では、事前設定リストは学校のオリジナル名称を含むことができ、オリジナル名称と現在の名称との間にマッピング関係を確立できる。「北大(Beida)」(つまり、「北京大学(Beijing University)」の省略形)及び「浙大(Zheda)」(つまり、「浙江大学(Zhejiang University)」の省略形)のような省略形が学校名に含まれるケースでは、事前設定リストは学校名の省略形を含むことができ、省略形と学校名(例えば、部分名、フルネーム、又はフルネームと部分名の両方)との間にマッピング関係を確立できる。
実施によっては、階層照合法で用いられる種々の照合方法は種々の照合精度で構成できる。典型的な実施では、種々の照合方法は、照合精度の降順に従って照合に利用される。例えば、まず、獲得されたテキスト情報を事前設定リストからの事前設定背景識別情報と比較することにより、完全照合方法を実行できる。獲得されたテキスト情報を事前設定リスト内の各エントリと比較して、完全な照合を得ることができる。獲得されたテキスト情報が事前設定リスト内のエントリと完全に照合する場合には(例えば、テキスト情報からの「北京大学」が事前設定リスト内の「北京大学」と完全に照合する場合には)、完全な照合が見つかったとみなされ、この完全な照合結果(例えば、「北京大学」)が第1の結果データ集合に保存される。実施によっては、照合した結果を、第1の結果データ集合に保存する前に更に処理できる。例えば、この更なる処理は、圧縮、暗号化、コード化、及び本開示と矛盾しないその他の処理を含んでよい。実施によっては、第1の結果データ集合は、例示の方法100の操作を実行するコンピューティングデバイスのメモリ又は別の場所に格納できる。
実施によっては、完全な照合が形成できない場合には、獲得されたテキスト情報が事前設定リストの1つのエントリを含むか、又は、それに含まれるか、を特定することにより、獲得されたテキスト情報にファジー照合方法を実行できる。例えば、獲得されたテキスト情報が事前設定リストの1つのエントリを含む、又は、それに含まれる場合、ファジー照合を形成でき、対応する照合関係を保持できる。例えば、事前設定リストが「復旦大学(Fudan University)」のエントリを有する場合には、このエントリにテキスト情報「復旦(Fudan)」が含まれ、一方、「復旦大学学生寮(Fudan University student dormitory)」がこのエントリを含んでいる。そのため、「復旦」と「復旦大学学生寮」の両方が事前設定リストのエントリ「復旦大学」とファジー照合できる。更に、獲得されたテキスト情報が、事前設定リストの唯一のエントリとファジー照合するとみなすことができる場合、一意のファジー照合を形成でき(つまり、ファジー照合が一意性条件を満たす)、対応するファジー照合結果(例えば、唯一照合した事前設定リストのエントリ内の学校名又は雇用主名)を第2の結果データ集合に保存できる。実施によっては、獲得されたテキスト情報が、事前設定リストの唯一のエントリを含む又はこれに含まれる場合には、一意性条件が満たされる。第1の結果データ集合と類似の方式で、照合した結果を、第2の結果データ集合に保存する前に、(例えば、比較、暗号化、コード化、及び、本開示と矛盾しないその他の処理により)更に処理できる。実施によっては、第2の結果データ集合を、例示の方法100の操作を実行するコンピューティングデバイスのメモリ又は別の場所に格納できる。
実施によっては、ファジー照合結果が見つからない場合、又は、一意のファジー照合を形成できない場合、最大の共通部分サブシーケンスアルゴリズムを用いて、獲得されたテキスト情報に第3のタイプの照合方法を実行できる。共通部分サブシーケンスアルゴリズムで、獲得されたテキスト情報と事前設定リスト内の各エントリとの間で文字列類似度を計算する。獲得されたテキスト情報に最も類似するとみなされるエントリ(例えば、文字列類似値が最も高いエントリ)を照合結果としてみなし、第3の結果データ集合に保存できる。第1及び第2の結果データ集合に類似する方法で、照合結果を、第3の結果データ集合に保存する前に更に処理できる(例えば、比較、暗号化、コード化、及び本開示と矛盾しないその他の処理)。実施によっては、第3の結果データ集合は、例示の方法100の操作を実行するコンピューティングデバイスのメモリ又は別の場所に格納できる。
実施によっては、類似値が、定義された閾値よりも高い場合には、最も高い類似値に対応したエントリを照合結果であるとみなすことができる。実施によっては、この閾値は、照合の正確性又は本開示と矛盾しない他の値に基づいて、手作業で又は動的に構成できる。例えば、この閾値は60%、70%などの値、又はその他の値とすることができる。方法100はステップ102からステップ103へ進む。
ステップ103にて、獲得されたテキスト情報を用い、階層照合の結果(すなわち、該当する場合、1つ以上の照合結果の集合)に基づいて、ユーザ情報を特定する。具体的な例として、階層照合によって学校名が「北京大学」と特定された場合には、この学校名を用いてユーザの学歴的な背景情報を特定できる。実施によっては、学歴情報はユーザの学校のランキングを含んでよい。例えば、実施によっては、大学ランキング情報を、データベース、例示の方法100の操作を実行するコンピューティングデバイスのメモリ、又は、別の場所に格納できる。ユーザの学校のランキングは、データベースや特定のメモリ位置から取り出すことができる。この例では、「北京大学」はランクが高い大学(中国国内のトップテンの大学にランキングされている)とみなされるので、このユーザの学歴は、ランクの低い他の大学よりも比較的クオリティが高いとみなすことができる。これに対し、学校名が100位のランクの学校であると特定された場合には、ユーザの学歴は「北京大学」よりも比較的クオリティが低いとみなすことができる。ステップ103の後、方法100は停止する。
図2は、一の実施による、ユーザ情報を収集する方法200を示す追加のフローチャートである。方法200は、図1で述べた方法100の操作の下位レベルとして示されている。明瞭に説明するために、以下の説明では、方法200について本明細書の他の図面に関連して概括的に述べる。しかし、方法200は、例えば、任意の適切なシステム、環境、ソフトウェア、ハードウェアにより、又は、システムと、環境と、ソフトウェアと、ハードウェアとの組み合わせにより、適宜、実行できる。実施によっては、方法200の様々なステップを、並行して、組み合わせで、ループで、又は、任意の順序で実行できる。
ステップ201で(図1のステップ101と類似する)、ユーザ情報に関するテキスト情報をユーザサービス情報から獲得する。実施によっては、ユーザサービスから獲得されたテキスト情報をトリミング又はクリーニングし、トリミング又はクリーニングしたテキスト情報に、図1のステップ102及び図2のステップ202乃至204で述べた階層照合を実行できる。トリミング又はクリーニングしたテキスト情報は、階層照合方法の成功率を向上させることができる。例えば、或るサービスから獲得されたテキスト情報は「浙江工業大学(Zhejian University of Technology)(教科書料金と入試登録料金)」である。事前設定リスト内の学校名との完全な照合を形成するテキスト情報について、括弧と括弧内の文字(つまり「(教科書料金と入試登録料金)」)を削除して、短縮形式のテキスト情報を残し(ここでは「浙江工業大学」)、完全な照合を形成できるようにすることができる。
別の例として、テキスト情報「Y大学のXキャンパス(分校)」、例えば、「中国医科学大学の瀋北キャンパス(Shenbei campus of Chinese Medical Science University)」や「東北石油大学の秦皇島分校(Qinhuangdao branch of Northeast Petroleum University)」について、テキスト情報内のデータ「Xキャンパス(分校)」をフィルタリングして、残りのテキスト情報が事前設定リストと完全な照合を形成できるようにすることができる。方法200はステップ201からステップ202へ進む。
ステップ202で、獲得されたテキスト情報が事前設定リスト内の事前設定背景識別情報と完全に照合するかどうかを特定することにより、獲得されたテキスト情報に第1の照合方法を実行できる。図1で述べるように、事前設定リストは、学校名や雇用主名のような、ユーザ情報に関連する事前設定背景識別情報を格納する。獲得されたテキスト情報を事前設定リスト内の各エントリと比較できる。事前設定リスト内のテキストエントリが、獲得されたテキスト情報と同一である(例えば、“Beijing”=“Beijing”)場合には、完全な照合が表示され、第1の照合結果を取得したとみなされる。事前設定リスト内のエントリが、獲得されたテキスト情報と完全に照合しない場合には、第1の照合結果は取得されなかったとみなされる。方法200はステップ202からステップ203へ進む。
ステップ203で、第1の照合結果が取得されたとみなされない場合には、獲得されたテキスト情報が、事前設定リストの唯一のエントリを含むか又はこれに含まれるかどうかを特定することで、獲得されたテキスト情報に第2の照合方法を実行できる。例えば、獲得されたテキスト情報が「北京大学の学生寮棟」であり、事前設定した学校名リスト内の唯一のエントリ(つまり、「北京大学」)を含む場合には、獲得されたテキストはエントリ「北京大学」とファジー照合し、一意性条件を満たすとみなせる。その結果、第2の照合結果「北京大学」が取得されたとみなされる。
第2の例として、獲得されたテキスト情報は「清華大学の教育棟及び北京大学の学生寮棟(teaching building of Tsinghua University and dormitory building of Beijing University)」であり、事前設定した学校名リストは一方のエントリ「清華大学」と、他方のエントリ「北京大学」を有する。このケースでは、獲得されたテキスト情報は事前設定リストの2つのエントリを含むので、獲得されたテキスト情報は事前設定リストとファジー照合するとみなせるが、一意性条件を満たすとはみなされない。その結果、第2の照合結果は取得されなかったとみなされる。
第3の例として、獲得されたテキスト情報が「復旦」であり、又、事前設定した学校名リストの唯一のエントリである「復旦大学」内に含まれている場合には、取得したテキストはエントリ「復旦大学」とファジー照合し、一意性条件を満たすとみなせる。その結果、第2の照合結果「復旦大学」を取得したとみなされる。
第4の例として、獲得されたテキスト情報は「北京」であり、事前設定した学校名リストが取得したテキストを含む複数のエントリを含む(例えば、「北京大学」、「北京理工大学」、「北京航空航天大学」)。このケースでは、獲得されたテキスト情報は事前設定リストの複数のエントリ内に含まれるため、獲得されたテキスト情報は事前設定リストとファジー照合するが、一意性条件を満たさないとみなされる。その結果、第2の照合結果は取得されなかったとみなされる。実施によっては、第2の照合方法は、省略形の学校名又は雇用主名に関する事前設定したリストから、照合したエントリを特定することもできる。
実施によっては、ステップ203にて第2の照合結果を取得したとみなされた場合には、事前設定リストを第2の照合結果に従って更新できる。例えば、獲得されたテキスト情報「復旦」の第2の照合結果が照合したエントリ「復旦大学」である場合、テキスト「復旦」(つまり、「復旦大学」の省略形)を、事前設定した学校名リストに保存し、照合した非省略形のエントリ「復旦大学」にリンクさせることができる。実施によっては、より多くの第1のタイプ又は第2のタイプの照合結果を取得するために、更新された事前設定リストを用いて、その他の獲得されたテキスト情報に第2の照合方法を実行できる。事前設定リストを、省略形の学校名「復旦」を含めることによって更新した後で、テキスト情報「復旦」が第1のタイプの照合結果に正確に照合し得て、省略形のエントリ「復旦」にリンクされた非省略形のエントリ「復旦大学」を第1の結果データ集合に保存できる。更新された事前設定リストによって、獲得されたテキスト情報間でのより高い照合率を達成でき、階層照合の精度が向上し、更に、ユーザ情報の収集精度が向上する。方法200はステップ203からステップ204へ進む。
ステップ204にて、ステップ203で第2の照合結果を取得したとみなされない場合には、事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいて、獲得されたテキスト情報に第3の照合方法を実行できる。事前設定した類似式は、2つの文字列間、単語ベクトル間、又は、本開示と矛盾しないその他のデータ形式間の類似性を示す類似値を計算するために使用できる。例えば、先述したように、類似性の計算は最大の共通部分サブシーケンスアルゴリズムに基づくことができる。
実施によっては、獲得されたテキスト情報と事前設定リストの各エントリとの間の類似値を事前設定した類似式を用いて計算し、最大の類似値を特定する。例えば、事前設定リストが100個のエントリを有する場合、100個の類似値を計算できる。計算された100個の類似値のうちの最大類似値を特定できる。最大類似値が事前設定閾値以上である場合、この最大類似値に対応するエントリが第3の照合結果として機能できる。
実施によっては、事前設定閾値は、所望の照合精度に基づいて手作業で又は動的に設定できる。例えば、この閾値は60%、70%、又は何らかの他の値であってよい。場合によっては、事前設定リスト内の、取得されたテキストに最も類似するエントリは正確な照合でない可能性があり、この状況に対処するために、閾値を用いて照合精度を制御することができる。例えば、事前設定閾値を、所望の高い照合精度に対しては大きな値とし、所望の低い照合精度に対しては小さい値とすることができる。例えば、90%の閾値は、獲得されたテキストと、第3の照合方法に対する事前設定リスト内のエントリとの間の高い類似度が成功であるとみなされることを必要とし、40%の閾値は、獲得されたテキストと、第3の照合方法に対する事前設定リスト内のエントリとの間の低い類似度が成功であるとみなされることを必要とする。
実施によっては、最大の共通部分サブシーケンスアルゴリズムを用いて、獲得されたテキスト情報と、事前設定リスト内のエントリとの間の類似値を計算できる。例えば、獲得されたテキストとエントリについて、最長の共通部分サブ文字列長を計算できる。次に、最長の共通部分サブ文字列長をエントリの文字列長で除算することで、類似値を計算する。例えば、実施によっては、獲得されたテキスト情報Aと事前設定リスト内のエントリBとの間の類似値D(A、B)を、以下の事前設定した類似式により計算できる。

D(A,B)=AとBとの間の最長の共通部分サブ文字列長/文字列Bの長さ
実施によっては、共通部分サブ文字列長とエントリ文字列長とは、テキスト情報の特定の言語に依存してよい。例えば、テキストが中国語の場合には、共通部分サブ文字列と文字列長は中国語文字数にて計算できる。テキストが英語の場合には、サブ文字列と文字列長は単語数にて計算できる。一例として、取得したテキストAが文字列長3(3単語)の「Tongji domitory building(同済大学学生寮棟)」であり、事前設定した学校名リスト内のエントリBが文字列長2(2単語)の「Tongi University(同済大学)」である。AとBの間の最長の共通部分サブ文字列は長さ1を持つ「Tongji(同済)」であり、D(A,B)=1/2である。方法200はステップ204からステップ205へ進む。
ステップ205で、ユーザの背景識別情報を、ステップ202乃至ステップ204における3つの照合方法からの第1、第2、第3の照合結果から取得できる。階層照合が成功の場合、第1、第2、第3の照合結果のうち1つが取得されたとみなされ、これをユーザの背景識別情報とみなすことができる。方法200はステップ205からステップ206へ進む。
ステップ206にて、ユーザ情報を、ステップ205で取得された背景識別情報に基づいて特定できる。例えば、ユーザの学歴情報に関連するテキスト情報に階層照合を実行し、第2の照合結果が取得されたとみなされた場合には、ユーザに対応する学校名を、第2の照合結果(例えば、「清華大学」)から取得できる。学校名を用いてユーザの学歴背景を特定できる。ステップ206後、方法200は停止する。
実施によっては、ユーザ情報を反映する大量のテキスト情報を取得できる。獲得されたテキスト情報の全て又はそのサブセットに、図1のステップ102又は図2のステップ202乃至ステップ204で述べた階層照合と解析とを実行できる。更に、第1の照合方法の照合精度は第2の照合方法の照合精度よりも高くてよく、第2の照合方法の照合精度は第3の照合方法の照合精度よりも高くてよい。
図3は、一の実施による、ユーザ情報を収集する特定の例示の方法300を示す更なるフローチャートを示す。明瞭に説明するために、方法300について本明細書の他の図面に関連して、以下、概括的に述べる。しかし、方法300は、例えば、任意の適切なシステム、環境、ソフトウェア、ハードウェアによって、又は、システムと、環境と、ソフトウェアと、ハードウェアとの組み合わせによって、適宜、実行されてよい。実施によっては、方法300の様々なステップは並行して、組み合わせで、ループで、又は任意の順序で実行できる。
ステップ301にて、ユーザの学歴に関連するテキスト情報(例えば、ユーザ配送先住所情報、学生ローン情報他)を様々なサービスから収集する。方法300はステップ301からステップ302へ進む。
ステップ302にて、図2のステップ201で述べたように、獲得されたテキスト情報にデータクリーニングを実行する。クリーニングされたテキスト情報を学校の記録とみなすことができる。方法300はステップ302からステップ303へ進む。
ステップ303にて、第1の照合方法(例えば、先述した照合方法)を実行する。学校の記録を、事前設定した学校名リスト内の各学校名と比較する。学校の記録が事前設定した学校名リスト内の或る学校名と同じである場合には、完全な照合が見つかったとみなされ、第1の照合結果(例えば、リストからの照合した学校名)を得たとみなされる。方法300はステップ303からステップ304へ進む。
ステップ304にて、第1の照合結果を第1の結果の集合S1に保存する。方法300はステップ304からステップ305へ進む。
ステップ303で学校の記録が完全に照合しない場合には、ステップ305にて、第2の照合方法(例えば、先述した方法と同じ方法)を実行できる。学校の記録が、事前設定した学校名リスト内の唯一の学校名を含むか又はこれに含まれている場合には、学校の記録はファジー照合し、一意性条件を満たすとみなすことができるので、第2の照合結果(例えば、事前設定した学校名リストからの照合した唯一の学校名)が取得されたとみなされる。方法300はステップ305からステップ306へ進む。
ステップ306で、第2の照合結果を第2の結果の集合S2に保存する。方法300はステップ306からステップ307へ進む。
ステップ307で、学校名リストが第2の照合結果に従って更新される。例えば、学校の記録を事前設定学校名リストに追加し、照合した学校名にリンクすることができる。更新された事前設定学校名リストに基づいて、照合しなかった他の学校の記録に第1及び第2の照合方法を実行できる。
ステップ305で学校の記録を照合できない場合には、ステップ308にて、事前設定した類似式を用いて第3の照合方法を実行できる。例えば、学校の記録と、事前設定学校名リスト内の各学校名との間で類似値を計算できる。実施によっては、算出した最大の類似値が事前設定閾値以上である場合に、第3の照合結果(最大の類似値に対応した学校名)が取得されたとみなされる。方法300はステップ308からステップ309へ進む。
ステップ309で、第3の照合結果を第3の結果の集合S3に保存する。その結果、ユーザに対応する学校名をS1、S2、S3から取得できる。ステップ309後、方法300は停止する。
図4は、一の実施による、例示のユーザ情報を収集するコンピューティングデバイスを示すブロック図である。コンピューティングデバイス400は、取得ユニット41、照合ユニット42、収集ユニット43を含むことができ、これらは、ハードウェア、ソフトウェア、又はその両方で実施できる。取得ユニット41は、図1のステップ101、図2のステップ201で述べたように、ユーザサービス情報から、ユーザ情報に関連するテキスト情報を取得できる。照合ユニット42は、図1のステップ102、図2のステップ202乃至204で述べたように、事前設定リスト内の事前設定背景識別情報に基づいて、テキスト情報に階層照合を実行できる。収集ユニット43は、図1のステップ103、図2のステップ205乃至206で述べたように、階層照合の結果に従って、ユーザ情報を収集できる。
図5は、一の実施による、例示のユーザ情報を収集するコンピューティングデバイス500を示す別のブロック図である。図5は、図4で述べた例示のコンピューティングデバイス400のコンポーネントの下位図である。
コンピューティングデバイス500は、取得ユニット51、照合ユニット52、収集ユニット53を含むことができ、これらは、ハードウェア、ソフトウェア、又はその両方で実施できる。取得ユニット51は、図1のステップ101、図2のステップ201で述べたように、ユーザサービス情報からユーザ情報に関連するテキスト情報を取得できる。照合ユニット52は、図1のステップ102、図2のステップ202乃至204で述べたように、事前設定リスト内の事前設定背景識別情報に基づいて、テキスト情報に階層照合を実行できる。収集ユニット53は、図1のステップ103、図2のステップ205乃至206で述べたように、階層照合の結果に従ってユーザ情報を収集できる。
照合ユニット52は、計算モジュール521、取得モジュール522、照合モジュール523を含むことができ、これらは、ハードウェア、ソフトウェア、又はその両方で実施できる。計算モジュール521は、テキスト情報と、事前設定リスト内の事前設定背景識別情報の各エントリとの間の類似値を、事前設定した類似式を用いて計算できる。例えば、先述したように、計算モジュール521は、テキスト情報と事前設定背景識別情報との間の最長の共通部分サブ文字列長を計算し、最長の共通部分サブ文字列長を事前設定背景識別情報の文字列長で除算して類似値を取得できる。取得モジュール522は、最大類似値に対応する事前設定背景識別情報を特定できる。照合モジュール523は、最大類似値が事前設定閾値以上であるかどうかを特定することにより、テキスト情報に第3の照合を実行できる。
収集ユニット53は、取得モジュール531と収集モジュール532とを含むことができ、これらはハードウェア、ソフトウェア、又はその両方で実施できる。取得モジュール531は、第1、第2、第3の照合結果からユーザの背景識別情報を取得できる。実施によっては、第1、第2、第3の照合結果を、データベース、又は、コンピューティングデバイス500のメモリ若しくは別の場所に格納できる。収集モジュール532は、取得モジュール531が取得した背景識別情報に従ってユーザ情報を収集できる。
コンピューティングデバイス500は更新ユニット54を含むことができ、これはハードウェア、ソフトウェア、又はその両方で実施できる。先述したように、何らかの第2の照合結果がある場合には、更新ユニット54は、例えば、事前設定リストに第2の照合結果を追加することにより、第2の照合結果に従って事前設定リストを更新できる。
コンピューティングデバイス500はクリーニングユニット55を更に含むことができ、これはハードウェア、ソフトウェア、又はその両方で実施できる。先述したように、クリーニングユニット55はテキスト情報にデータクリーニングを実行できる。照合ユニット52は、クリーニング済みのテキストデータに階層照合を実行できる。
ユーザ情報を収集するコンピューティングデバイス400又は500は、少なくともプロセッサ又はメモリを含むことができる。取得ユニット41又は51、照合ユニット42又は52、収集ユニット43又は53、更新ユニット54、クリーニングユニット55は、プログラムユニットとしてメモリに格納され、プロセッサによって実行されて対応する機能を実現できる。コンピュータで実行可能な1つ以上の命令を含むコンピュータプログラム製品を使用して、少なくとも図1乃至図3で述べる方法ステップを実行できる。
図6は、本開示で述べる既述のアルゴリズム、方法、機能、工程、フロー、手順に関連する計算機能を提供する、実施による例示のコンピュータシステム600のブロック図である。図示のコンピュータ602は、サーバ、デスクトップコンピュータ、ラップトップ/ノートパソコン、無線データポート、スマートフォン、携帯情報端末(PDA)、タブレットコンピューティングデバイス等のあらゆるコンピューティングデバイス、これらコンピューティングデバイス内の1つ以上のプロセッサ、又は、コンピューティングデバイスの物理的又は仮想インスタンス(又はその両方)を含むあらゆるその他の適切な処理デバイスを包含するものとする。加えて、コンピュータ602は、キーパッド、キーボード、タッチ画面、又はユーザ情報を受信できる他のデバイス、を含む入力デバイスと;デジタルデータ、ビジュアル又はオーディオ情報(又は、情報の組み合わせ)、又はグラフィカルユーザインターフェース(GUI)を含む、コンピュータ602の作動に関連する情報を伝送する出力デバイスと;を有するコンピュータを含むことができる。
コンピュータ602は、クライアント、ネットワークコンポーネント、サーバ、データベース、他の永続性(persistency)、又は、本開示で述べる主題を実行するコンピュータシステムの任意の他のコンポーネント、としての役割(或いは、これら役割の組み合わせ)において機能を果たす。図示のコンピュータ602はネットワーク630と通信可能に接続している。実施によっては、コンピュータ602の1つ以上のコンポーネントは、クラウドコンピューティングベースで、ローカルで、グローバルで、又はその他環境(若しくは、組み合わせ環境)で作動するように構成できる。
コンピュータ602は、高いレベルで、ここで述べる主題に関連するデータ及び情報を受信する、送信する、処理する、格納する、又は管理するように作動可能な電子コンピューティングデバイスである。実施によれば、コンピュータ602は、アプリケーションサーバ、電子メールサーバ、ウェブサーバ、キャッシングサーバ、ストリーミングデータサーバ、若しくはその他サーバ(若しくは、組み合わせサーバ)を含む、又は、それと通信可能に接続してよい。
コンピュータ602は、クライアントアプリケーションからの要求(例えば、別のコンピュータ602の実行)をネットワーク630上で受信し、受信した要求を、適切なソフトウェアアプリケーションを用いて処理することにより、受信した要求に応答できる。加えて、要求を、内部ユーザから(例えば、コマンドコンソールから、又は、その他の適切なアクセス方法で)、外部若しくはサードパーティから、他の自動アプリケーションから、又は、あらゆるその他の適切なエンティティ、個人、システム、若しくはコンピュータから、コンピュータ602へ送ることができる。
コンピュータ602のコンポーネントの各々はシステムバス603を用いて通信できる。実施によっては、コンピュータ602のいずれか又は全てのコンポーネント、ハードウェア又はソフトウェア(又はハードウェアとソフトウェア両方の組み合わせ)は、アプリケーションプログラミングインターフェース(API)612又はサービス層613(又はAPI612とサービス層613の組み合わせ)を用いてシステムバス603上で、相互に又はインターフェース604(又は、その両方の組み合わせ)に接続できる。API612は、ルーチン、データ構造、及びオブジェクトクラスの仕様を含むことができる。API612は、コンピュータ言語依存又は非依存のいずれかであってよく、コンプリートインターフェース、シングルファンクション、更にはAPIセットとも称される。サービス層613は、コンピュータ602、又はコンピュータ602に通信可能に接続する他のコンポーネント(図示の有無を問わない)にソフトウェアサービスを提供する。コンピュータ602の機能は、全てのサービス消費者がこのサービス層を用いてアクセスできるものであってよい。サービス層613により提供されるようなソフトウェアサービスは、再使用可能な定義された機能を、定義されたインターフェースを介して提供する。例えば、インターフェースは、Java(登録商標)、C++で書かれたソフトウェア、又は、拡張マークアップ言語(XML)形式や他の適切な形式にてデータを提供する他の適切な言語で書かれたソフトウェアであってよい。コンピュータ602の内蔵コンポーネントとして例証しているが、代替の実施は、API612又はサービス層613を、コンピュータ602の他のコンポーネント又はコンピュータ602に通信可能に接続した他のコンポーネント(図示の有無を問わない)に関連するスタンドアロンコンポーネントとしても例示できる。更に、API612又はサービス層613の、いずれか又は全ての部分は、本開示の範囲から逸脱せずに、別のソフトウェアモジュールの子モジュール若しくはサブモジュール、企業アプリケーション、又はハードウェアモジュールとして実施されてもよい。
コンピュータ602はインターフェース604を含む。図6ではシングルインターフェースとして図示されているが、コンピュータ602の特定のニーズ、要望、又は特定の実施に従って、2つ以上のインターフェース604を使用してもよい。インターフェース604はコンピュータ602により用いられて分散環境内でネットワーク630に接続された他のシステム(図示の有無を問わない)と通信する。一般に、インターフェース604は、ソフトウェア又はハードウェア(又はソフトウェアとハードウェアの組み合わせ)内のコード化された論理を備え、ネットワーク630と通信するように作動できる。より具体的には、インターフェース604は、ネットワーク630又はインターフェースのハードウェアが図示のコンピュータ602内又はその外部で物理信号を通信するように作動できるよう、通信に関連する1つ以上の通信プロトコルをサポートするソフトウェアを含んでもよい。
コンピュータ602はプロセッサ605を含む。図6では1つのプロセッサとして図示されているが、特定のニーズ、要望、又はコンピュータ602の特定の実施により、1つ以上のプロセッサを使用できる。概して、プロセッサ605は命令を実行し、データを扱って、本開示で述べているように、コンピュータ602の動作、及びあらゆるアルゴリズム、方法、機能、工程、フロー、手順を実行する。
コンピュータ602は、ネットワーク630に接続可能なコンピュータ602又は他のコンポーネント(又は、その両方の組み合わせ)(図示の有無を問わない)のためのデータを保持できるデータベース606を更に含む。例えば、データベース606は、インメモリ、又は従来型、又は本開示と矛盾しない、データを格納する他の種類の、データベースであってよい。実施によっては、データベース606は、特定のニーズや要望、又は、コンピュータ602及び記載された機能の特定の実施に従って、2つ以上の異なるデータベースタイプ(例えば、ハイブリッドインメモリや従来のデータベース)の組み合わせであってよい。図6にはシングルデータベース606として図示されているが、特定のニーズ、要望、又はコンピュータ602及び記載された機能の特定の実施に従って、2つ以上のデータベース(同一タイプ、又は異なるタイプの組み合わせのもの)を使用できる。データベース606はコンピュータ602の一体型コンポーネントとして図示されているが、代替の実施では、データベース606はコンピュータ602の外部にあってよい。
コンピュータ602は、ネットワーク630に接続できるコンピュータ602又は他のコンポーネント(又は、その両方の組み合わせ)のためのデータを保持できるメモリ607を更に含む(図示の有無を問わない)。メモリ607は本開示と矛盾しないあらゆるデータを格納できる。実施によっては、メモリ607は、特定のニーズ、要望、又はコンピュータ602及び記載の機能の特定の実施に従って、2つ以上の異なるタイプのメモリ(例えば、半導体と磁気記憶装置の組み合わせ)であってよい。図6では単一メモリ607として図示されているが、特定のニーズ、要望、又はコンピュータ602及び記載の機能の特定の実施に従って、2つ以上のメモリ607(同一タイプ、又は異なるタイプの組み合わせのもの)であってよい。メモリ607はコンピュータ602の一体型コンポーネントとして図示されているが、代替の実施では、メモリ607はコンピュータ602の外部にあってよい。
アプリケーション608は、特定のニーズ、要望、又は、特に本開示で記載の機能に関連するコンピュータ602の特定の実施に従って機能を提供するアルゴリズムソフトウェアエンジンである。例えば、アプリケーション608は1つ以上のコンポーネント、モジュール、又はアプリケーションとして機能できる。更に、単一アプリケーション608として図示されているが、アプリケーション608はコンピュータ602上で複数のアプリケーション608として実施できる。加えて、コンピュータ602と一体型として図示されているが、代替の実施では、アプリケーション608はコンピュータ602の外部にあってよい。
コンピュータ602は電源614を更に含むことができる。電源614は、ユーザによる交換可能又は交換不能に構成できる充電可能又は充電不能なバッテリを含むことができる。実施によっては、電源614は電力変換又は管理回路(充電、スタンバイ、又はその他の電力管理機能)を含むことができる。実施によっては、電源614は、例えばコンピュータ602に給電したり、充電バッテリに充電したりすることができるように、コンピュータ602をソケット又は他の電源に差し込むための電源プラグを含むことができる。
ネットワーク630上で通信を行うコンピュータ602を含むコンピュータシステムと結合して関連する、又はその外部に、任意数のコンピュータ602が存在してよい。更に、用語「クライアント」「ユーザ」その他の適切な専門用語は、本開示の範囲から逸脱せずに、適宜、相互に置き換え可能に用いることができる。更に、本開示は、多くの(複数の)ユーザが1つのコンピュータ602を使用できる、又は、1人のユーザが複数のコンピュータ602を使用できるものとする。
記載のコンピュータシステムからユーザ情報を収集するアプローチは、従来のユーザ情報の収集を技術的に改善する。例えば、記載の階層照合アプローチは、照合機能全体をユーザ情報収集の一部として改善するように、手作業で又は動的に構成できる。加えて、ユーザ情報収集に適用できるその他の技術的態様(例えば、データ暗号化、動的/静的キャッシング、ネットワークスロットリング、プロセッサ管理、データ格納管理、時間的/地理的位置の考慮、コンピュータ/データベースクラスタリング)は、例えば速度、効率性、コンピューティングリソースの使用、ネットワーク帯域幅、又はコンピュータデータ格納を改善するために、階層照合アプローチの使用と併せて(手作業で又は動的に)構成できる。
特定の例として、階層照合アプローチの1つ以上の方法は、サーバの1つ以上の属性(例えば、プロセッサタイプ、メモリ、量/速度、データ格納能力)の構成に基づいてサーバの処理を最大化するべく、記載のコンピューティングシステム(例えば、図4、図5、図6)の1つ以上のコンポーネントによって選択されることができる。別の例として、キャッシング技術は、1つ以上のコンピューティングコンポーネントに利用されることができ、獲得されたテキストデータの受信速度を向上させ、サーバの処理能力を最大化する(例えば、処理される照合をサーバの能力として可能な限り迅速に処理でき、又、記載のコンピュータシステムによって最終的に使用されるようにメモリにキャッシュできる)。加えて、キャッシング技術の使用はネットワークトラフィック管理及び最適化の向上を助けることが可能である。別の例として、記載のアプローチは全体の照合効率を高めるために用いることができるため、処理効率を向上させ、よりよく管理できるようになる。向上した照合効率により、記載のコンピューティングシステムの様々なコンポーネントによって用いるために結果データをより迅速に特定し、データをより高速にユーザへ返し、アプリケーションソフトウェア及びモバイルコンピューティングデバイスをより応答性に優れたものにすることができる。
記載の主題の実施は、1つ以上の特徴を単独で、又は組み合わせて含むことができる。
例えば、第1の実施において、コンピュータにより実施される方法は:ユーザサービス情報からのユーザ情報に関連するテキスト情報を識別するステップと;事前設定リスト内の事前設定背景識別情報に基づいて、テキスト情報に階層照合を実行するステップであって、階層照合は種々の照合方法を含み、事前設定リストはユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む、前記識別するステップと;階層照合に基づいてユーザ情報を特定するステップと;を含む。
前出の及び他の記載された実施は各々、以下の特徴の1つ以上をオプションで含む。
事前設定リスト内の事前設定背景識別情報に基づいてテキスト情報に階層照合を実行するステップは:テキスト情報が事前設定リスト内の1つのエントリと同じであるかどうかを特定することにより、テキスト情報に第1の照合を実行するステップと;不成功の第1の照合に応答して、テキスト情報が、事前設定リストの唯一のエントリを含む又はこれに含まれるかどうかを特定することにより、テキスト情報に第2の照合を実行するステップと;不成功の第2の照合に応答して、事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいて、テキスト情報に第3の照合を実行するステップと;を更に備える、第1の特徴(以下の特徴のいずれかと組み合わせが可能)。
事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいて、テキスト情報に第3の照合を実行するステップは:事前設定した類似式を用いて、テキスト情報と事前設定リスト内の各エントリとの間の類似値を計算するステップと;最大の類似値を特定するステップと;最大の類似値が事前設定閾値以上であるかどうかを特定するステップと;を更に備える、第2の特徴(以下の特徴のいずれかと組み合わせが可能)。
事前設定した類似式を用いて、テキスト情報と事前設定リスト内の各エントリとの間の類似値を計算するステップは:テキスト情報と事前設定リスト内の該特定のエントリとの間の最長の共通部分サブ文字列長を計算するステップと;最長の共通部分サブ文字列長を該特定のエントリの文字列長で除算するステップと;を更に備える、第3の特徴(以下の特徴のいずれかと組み合わせが可能)。
成功の第2の照合に応答し、第2の照合に基づいて事前設定リストを更新するステップを更に備える、第4の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
階層照合に基づいてユーザ情報を特定するステップは、第1の照合、第2の照合、又は第3の照合に基づいてユーザ情報を特定するステップを更に備える、第5の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
テキスト情報にデータクリーニングを実行するステップと;クリーニングしたテキスト情報に階層照合を実行するステップと;を更に備える、第6の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
第2の実施において、操作を実行するために、コンピュータシステムで実行可能な1つ以上の命令を格納する、非一時的なコンピュータ読取可能媒体は:ユーザサービス情報からのユーザ情報に関連するテキスト情報を識別すること;事前設定リスト内の事前設定背景識別情報に基づいてテキスト情報に階層照合を実行することであって、階層照合は種々の照合方法を含み、事前設定リストは、ユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む、前記実行すること;及び、階層照合に基づいてユーザ情報を特定すること;を含む。
前出の及び他の記載された実施は各々、以下の特徴の1つ以上をオプションで含んでよい。
事前設定リスト内の事前設定背景識別情報に基づいてテキスト情報に階層照合を実行することは:事前設定リストテキスト情報が事前設定リスト内の1つのエントリと同じであるかどうかを特定することにより、テキスト情報に第1の照合を実行すること;不成功の第1の照合に応答して、テキスト情報が、事前設定リストの唯一のエントリを含むか又はこれに含まれているかどうかを特定することにより、テキスト情報に第2の照合を実行すること;及び、不成功の第2の照合に応答して、事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいてテキスト情報に第3の照合を実行すること;の1つ以上の命令を更に含む、第1の特徴(以下の特徴のいずれかと組み合わせが可能)。
事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいてテキスト情報に第3の照合を実行することは:事前設定した類似式を用いて、テキスト情報と事前設定リスト内の各エントリとの間の類似値を計算すること;最大類似値を特定すること;及び、最大類似値が事前設定閾値以上であるかどうかを特定すること;の1つ以上の命令を更に備える第2の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
事前設定した類似式を用いて、テキスト情報と事前設定リスト内の各エントリとの間の類似値を計算することは:テキスト情報と事前設定リスト内の該特定のエントリとの間の最長の共通部分サブ文字列長を計算すること;及び、最長の共通部分サブ文字列長を該特定のエントリの文字列長で除算すること;の1つ以上の命令を更に備える第3の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
操作は、成功した第2照合に応答し、事前設定リストを第2の照合に基づいて更新する1つ以上の命令を更に備える、第4の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
階層照合に基づいてユーザ情報を特定することは、第1の照合、第2の照合、又は第3の照合に基づいてユーザ情報を特定する1つ以上の命令を更に備える、第5の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
テキスト情報にデータクリーニングを実行すること;及び、クリーニングされたテキスト情報に階層照合を実行すること;の1つ以上の命令を更に備える、第6の特徴(前出又は以下の特徴のいずれかと組み合わせが可能)。
第3の実施において、コンピュータにより実施されるシステムは:コンピュータメモリと;コンピュータメモリと相互作動可能に接続し、以下の操作を実行するよう構成されたハードウェアプロセッサと;を含み、該操作は:ユーザサービス情報からのユーザ情報に関連するテキスト情報を識別する操作と;事前設定リスト内の事前設定背景識別情報に基づいてテキスト情報に階層照合を実行する操作であって、階層照合は種々の照合方法を含み、事前設定リストはユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む、前記実行する操作と;階層照合に基づいてユーザ情報を特定する操作と;を含む。
前出の及びその他の記載された実施は各々、1つ以上の以下の特徴をオプションで含む。
事前設定リスト内の事前設定背景識別情報に基づいてテキスト情報に階層照合を実行する操作は:テキスト情報が事前設定リスト内の1つのエントリと同じであるかどうかを特定することにより、テキスト情報に第1の照合を実行し;不成功の第1の照合に応答し、テキスト情報が、事前設定リストの唯一のエントリを含むか又はこれに含まれているかどうかを特定することにより、テキスト情報に第2の照合を実行し;及び、不成功の第2の照合に応答し、事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいて、テキスト情報に第3の照合を実行するよう構成される、第1の特徴(以下の特徴のいずれかと組み合わせが可能)。
事前設定リスト内の事前設定背景識別情報と、事前設定した類似式とに基づいて、テキスト情報に第3の照合を実行する操作は:事前設定した類似式を用いてテキスト情報と事前設定リスト内の各エントリとの間の類似値を計算し;最大類似値を特定し;最大類似値が事前設定閾値以上であるかどうかを特定するよう更に構成される、第2の特徴(前出及び以下の特徴のいずれかと組み合わせが可能)。
事前設定した類似式を用いてテキスト情報と事前設定リスト内の各エントリとの間の類似値を計算する操作は:テキスト情報と事前設定リスト内の該特定のエントリとの間の最大の共通部分サブ文字列長を計算し;最長の共通部分サブ文字列長を該特定のエントリの文字列長で除算するよう更に構成される、第3の特徴(前出及び以下の特徴のいずれかと組み合わせが可能)。
成功の第2の照合に応答して、第2の照合に基づいて、事前設定リストを更新するよう更に構成され;階層照合に基づいてユーザ情報を特定する操作は、第1の照合、第2の照合、又は第3の照合に基づいてユーザ情報を特定するよう更に構成される、第4の特徴(前出及び以下の特徴のいずれかと組み合わせが可能)。
テキスト情報にデータクリーニングを実行するように更に構成される、第5の特徴(前出及び以下の特徴のいずれかと組み合わせが可能)。
クリーニングされたテキスト情報に階層照合を実行するように更に構成される、第6の特徴(前出及び以下の特徴のいずれかと組み合わせが可能)。
本明細書に記載の主題及び機能操作の実施は、デジタル電子回路にて、有形に具現化されたコンピュータソフトウェア又はファームウェアにて、あるいは、コンピュータハードウェアにて実施でき、これらは、本明細書で開示された構造及び構造的均等物、又は1つ以上のこれらの組み合わせを含む。記載された主題のソフトウェアの実施は、1つ以上のコンピュータプログラムとして、つまり、データ処理装置により実行されるために、又は、データ処理装置の作動を制御するために、有形且つ非一時的で、コンピュータ読み取り可能コンピュータ格納媒体上でコード化されたコンピュータプログラム命令の1つ以上のモジュールとして実施できる。代替として、又は、加えて、プログラム命令は、適切な受信側装置へ送信されてデータ処理装置により遂行される情報をコード化するべく生成された、マシン生成された電気信号、光信号、又は電磁信号のような人工的に生成された伝搬信号内/上でコード化することができる。コンピュータ格納媒体は、マシン読み取り可能格納デバイス、マシン読み取り可能格納基板、ランダム若しくはシリアルアクセスメモリデバイス、又はコンピュータ格納媒体の組み合わせであってよい。
「リアル−タイム(real−time)」「リアルタイム(real time)」「リアルタイム(realtime)」、「リアル(高速)タイム(real (fast) time)(RTF)」「ほぼリアルタイム(NRT)」「準リアル−タイム(quasi real−time)」、又は類似の用語(当業者に理解されるとおり)は、動作とレスポンスが時間的に近似することで、個人は動作とレスポンスが実質的に同時に起こっていると認識することを意味する。例えば、個人がデータにアクセスする動作と、これに続く、データを表示するレスポンス(又は、データ表示の開始)との時間差は、1ミリ秒未満、1秒未満、又は5秒未満であってよい。要求されたデータは瞬時に表示される(又は、その表示が開始される)必要はないが、記載のコンピューティングシステムの処理制限と、データの収集、正確な測定、解析、処理、格納、又は送信に要する時間とを考慮したうえで、意図的な遅延なく表示される(又は、表示が開始される)。
用語「データ処理装置」「コンピュータ」又は「電子コンピュータデバイス」(又は、当業者により理解される均等物)は、データ処理ハードウェアを意味し、データを処理するためのあらゆる種類の装置、デバイス、マシンを包含し、これには例えば、プログラム可能なプロセッサ、コンピュータ、又は複数のプロセッサ若しくはコンピュータが含まれる。上記の装置は、例えば、中央処理ユニット(CPU)、FPGA(フィールドプログラマブルゲートアレイ)、ASIC(特定用途向け集積回路)のような専用論理回路であってもよいか、又はこれを更に含んでもよい。実施によっては、データ処理装置又は専用論理回路(若しくは、データ処理装置又は専用論理回路の組み合わせ)はハードウェア若しくはソフトウェアベース(又は、ハードウェアとソフトウェアベースの両者の組み合わせ)であってよい。上記の装置は、コンピュータプログラムのための遂行環境を作成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、又は遂行環境の組み合わせを構成するコードを含んでよい。本開示は、例えばLINUX(登録商標)、UNIX(登録商標)、WINDOWS(登録商標)、MAC OS、ANDROID(登録商標)、IOSのような従来のオペレーティングシステム、又はあらゆるその他の適切な従来型オペレーティングシステムを用いる又は用いない、データ処理装置の使用を考慮する。
コンピュータプログラムは、プログラム、ソフトウェア、ソフトウェアアプリケーション、モジュール、ソフトウェアモジュール、スクリプト、又はコードとも呼ばれ、コンパイラ型言語若しくはインタプリタ型言語、又は宣言型言語若しくは手続き型言語を含むあらゆるプログラミング言語の形式で書くことができ、スタンドアロンプログラムとしての形式、又は、モジュール、コンポーネント、サブルーチン、若しくはコンピューティング環境での使用に適したその他のユニットとしての形式のような、あらゆる形式において展開できる。コンピュータプログラムは、ファイルシステム内のファイルに対応してよいが、対応している必要はない。プログラムは他のプログラム又はデータを保持するファイルの一部に格納でき、例えば、マークアップ言語文書に格納された、当該のプログラム専用の単独のファイルに格納された、又は、例えば1つ以上のモジュール、サブプログラム、コードの各部を格納するファイルのような複数の統合されたファイルに格納された、1つ以上のスクリプトであってよい。コンピュータプログラムは1台のコンピュータ上で、又は1箇所に位置する、又は複数の場所に分散されて通信ネットワークで相互接続された複数のコンピュータ上で遂行されるように展開できる。様々な図面で図示されたプログラムの各部は、様々な特徴及び機能を様々な物体、方法、又はその他の処理によって実施する個々のモジュールとして示されているが、プログラムは、或いは、多数の(複数の)サブモジュール、サードパーティサービス、コンポーネント、ライブラリ等を適宜含んでもよい。これに対し、様々なコンポーネントの特徴及び機能を適宜1つのコンポーネントに組み合わせることができる。計算による特定を行うために用いる閾値は、静的に、動的に、又は静的と動的の両方によって特定できる。
本明細書で述べている方法、処理、又は論理フローは、入力されたデータで動作して出力を生成することによって機能を実行するために、1つ以上のコンピュータプログラムを遂行する1つ以上のプログラム可能なコンピュータによって実行できる。方法、処理、又は論理フローはCPU、FPGA、ASICのような専用論理回路によっても実行でき、装置はCPU、FPGA、ASICのような専用論理回路としても実施できる。
コンピュータプログラムの遂行に適したコンピュータは、汎用マイクロプロセッサ、専用マイクロプロセッサ、その両方、又はあらゆるその他の種類のCPUに基づくことができる。一般に、CPUはメモリから命令及びデータを受信し、命令及びデータをメモリに書き込む。コンピュータに必須の素子は、命令を実行又は遂行するCPUと、命令及びデータを格納する1つ以上のメモリデバイスである。一般に、コンピュータは、例えば磁気ディスク、光磁気ディスク、光学ディスクのような、データを格納するための1つ以上の大容量格納デバイスを含むか、これらに動作可能に接続するか、これらからデータを受信するか、これらにデータを送信するか、又は送受信の両方を行う。しかし、コンピュータがこれらのデバイスを設けている必要はない。更に、コンピュータは別のデバイスに組み込まれてよく、別のデバイスには、いくつか例を挙げれば、例えばモバイルフォン、パーソナルデジタルアシスタント(PDA)、モバイルオーディオ又はビデオプレーヤ、ゲーム機、全地球測位システム(GPS)受信機、或いは、ユニバーサルシリアルバス(USB)フラッシュドライブのような小型格納デバイスがある。
コンピュータプログラム命令及びデータの格納に適したコンピュータ読取可能媒体(適宜、一時的又は非一時的)は、全ての形式の永久/非永久、又は揮発性/不揮発性のメモリ、媒体、メモリデバイスを含む。これには、例えば、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、フラッシュメモリデバイスといった半導体メモリデバイス;例えば、テープ、カートリッジ、カセット、内蔵型/取り外し可能型ディスクといった磁気デバイス;光磁気ディスク;例えば、デジタルビデオディスク(DVD)、CD−ROM、DVD+/−R、DVD−RAM、DVD−ROM、HD−DVD、BLU−RAY(BD)、その他の光学メモリ技術といった光学メモリデバイスが含まれる。メモリは様々なオブジェクト又はデータを格納してもよく、これには、キャッシュ、クラス、フレームワーク、アプリケーション、モジュール、バックアップデータ、ジョブ、ウェブページ、ウェブページテンプレート、データ構造、データベーステーブル、動的情報を格納するリポジトリ、並びにいずれのパラメータ、変数、アルゴリズム、命令、規則、制約、又はこれらへの参照を含むあらゆるその他の適切な情報が含まれる。加えて、メモリは、あらゆるその他の適切なデータ、例えば、ログ、ポリシー、セキュリティ又はアクセスデータ、報告ファイル、並びにその他を含んでよい。プロセッサ及びメモリは専用論理回路によって捕捉されるか、又はこれに内蔵することができる。
ユーザとの対話を提供するために、本明細書に記載の主題の実施は、情報をユーザに表示するための、CRT(陰極線管)、LCD(液晶ディスプレイ)、LED(発光ダイオード)、又はプラズマモニタといった表示デバイスと、ユーザがコンピュータに入力を提供することを可能にする、例えばマウス、トラックボール、又はトラックパッドといった、キーボード及びポインティングデバイスとを設けたコンピュータ上で実施できる。入力はタッチ画面を用いて提供されてもよく、タッチ画面としては、感圧性を有するタブレットコンピュータ表面、容量性感知若しくは電気感知を用いるマルチタッチ画面、又は、他のタイプのタッチ画面が挙げられる。その他の種類のデバイスを用いてユーザとの対話を提供することもでき;例えば、ユーザに提供されるフィードバックは、視覚的フィードバック、聴覚的フィードバック、触覚的フィードバックといったあらゆる形式の感知フィードバックであってよく;ユーザからの入力は、音響、音声、触覚入力を含むあらゆる形式で受信されてよい。加えて、コンピュータは、ユーザが使用しているデバイスとの間で文書を送受信することでユーザと対話でき、例えば、ウェブブラウザから受信した要求に応答して、ユーザのクライアントデバイス上のウェブブラウザにウェブページを送信することにより、ユーザと対話できる。
用語「グラフィカルユーザインターフェース」又は「GUI」は、1つ以上のグラフィカルユーザインターフェースと、特定のグラフィカルユーザインターフェースの各表示部とを説明するために、単数形又は複数形で用いられてよい。そのため、GUIは、情報を処理し、その情報結果をユーザに効率的に提示する、ウェブブラウザ、タッチ画面、又は、コマンドラインインターフェース(CLI)を非限定的に含む、グラフィカルユーザインターフェースを表してよい。一般に、GUIは複数のユーザインターフェース(UI)素子を含んでよく、そのいくつか又は全ては、インタラクティブフィールド、プルダウンリスト、ボタンのようなウェブブラウザに関連している。これら及びその他のUI素子は、ウェブブラウザの機能に関連する、又は、これを表してよい。
本明細書に記載の主題の実施は、例えばデータサーバとしてバックエンドコンポーネントを含むか、又は、例えばアプリケーションサーバといったミドルウェアコンポーネントを含むか、又は、ユーザが本明細書に記載の主題の実施物と対話できるようにするための例えばグラフィカルユーザインターフェースやウェブブラウザを実施されるクライアントコンピュータといったフロントエンドコンポーネントを含むか、又は、1つ以上のかかるバックエンド、ミドルウェア、フロントエンドコンポーネントの任意の組み合わせを含む、コンピューティングシステムにおいて実施できる。システムのコンポーネントは、任意の形態若しくは媒体の配線又は無線のデジタルデータ通信(或いは、データ通信の組み合わせ)、例えば通信ネットワークにより、相互接続することができる。通信ネットワークの例には、ローカルエリアネットワーク(LAN)、無線アクセスネットワーク(RAN)、大都市圏ネットワーク(MAN)、広域ネットワーク(WAN)、ワールドワイドインターオペラビリティフォーマイクロウェーブアクセス(WIMAX)、無線ローカルエリアネットワーク(WLAN)が含まれ、これらは、例えば802.11a/b/g/n又は802.20(或いは、802.11xと802.20の組み合わせ、若しくは、本開示と矛盾しないその他のプロトコル)、インターネットの全体又は一部、又は、1つ以上の場所に位置したあらゆるその他の通信システム(或いは、通信ネットワークの組み合わせ)が含まれる。ネットワークは、例えば、ネットワークアドレス間のインターネットプロトコル(IP)パケット、フレームリレーフレーム、非同期転送モード(ATM)セル、音声、ビデオ、データ、又はその他の適切な情報(或いは、通信タイプの組み合わせ)を用いて通信してもよい。
コンピューティングシステムはクライアントとサーバとを含むことができる。クライアントとサーバは一般には互いに離れており、典型的には通信ネットワークを介して相互作用(対話)する。クライアントとサーバの関係は、それぞれのコンピュータ上において実行され、かつ互いにクライアント・サーバ関係を有するコンピュータプログラムにより生じる。
本明細書は多くの具体的な実施の詳細を含むが、これは、どの発明の範囲及び請求対象の範囲に対する限定としてではなく、むしろ、特定の発明の特定の実施に特化し得る特徴の説明として解釈されねばならない。本明細書中で個別の実施に照らして説明される特定の特徴は、組み合わせて1つの実施にて実施することもできる。これに対し、1つの実施に照らして説明される様々な特徴を、複数の実施として別々に、又は、適切なサブコンビネーションにて実施することもできる。更に、先に述べた特徴は、特定の組み合わせで作用するものとして述べられ、又、主にそのように請求されてはいるが、いくつかのケースでは、請求された組み合わせの1つ以上の特徴をこの組み合わせから切り離すことができ、請求された組み合わせを下位組み合わせ、又は下位組み合わせの変形へと導いてもよい。
主題の特定の実施について説明してきた。説明した実施の改変や置き換え、及び他の実施は、当業者にとって明白であるように、以下の特許請求の範囲に包含される。各操作は、図面又は特許請求の範囲に、特定の順序で示されているが、望ましい結果を得るには、そのような操作を、示された特定の順序で、若しくは、連続する順序で実行する、又は、提示される全ての操作を実行する(操作によってはオプションとみなしてもよい)必要がある、と理解すべきではない。特定の状況ではマルチタスク又は並行処理(又は、マルチタスクと並行処理の組み合わせ)が有利であり、又は、適切であると思われる場合には実行されてよい。
更に、先に述べた実施における様々なシステムモジュール及び構成部分の分離又は統合は、全ての実施において必要であると理解すべきではなく、記載のプログラムコンポーネント及びシステムを、一緒に、単体のソフトウェア製品に統合できる、又は、複数のソフトウェア製品にパッケージ化することができる、と理解すべきである。
したがって、先に述べた実施の例は本開示を定義又は制約するものではない。その他の変更、置換え、改変は、本開示の主旨及び範囲から逸脱しない限り可能である。
更に、請求される何れの実施も、少なくとも、コンピュータにより実施される方法と;コンピュータ読取可能方法を実行するために、コンピュータ読取可能命令を格納する非一時的コンピュータ読取可能媒体と;コンピュータにより実施される方法を実行するよう、又は、非一時的コンピュータ読取可能媒体に格納された命令を実行するよう構成されたハードウェアプロセッサに相互作動可能に接続するコンピュータメモリを含むコンピュータシステムに適用できると思料される。
100,200,300 ユーザ情報を収集する方法
400,500 コンピューティングデバイス
600 コンピュータシステム
602 コンピュータ
603 システムバス
604 インターフェース
605 プロセッサ
606 データベース
607 メモリ
608 アプリケーション
612 アプリケーションプログラミングインターフェース(API)
613 サービス層
614 電源
630 ネットワーク

Claims (20)

  1. ユーザサービス情報からのユーザ情報に関連するテキスト情報を識別するステップと;
    事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合を実行するステップであって、前記階層照合は種々の照合方法を含み、前記事前設定リストは、前記ユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む、前記実行するステップと;
    前記階層照合に基づいて前記ユーザ情報を特定するステップと;を備える、
    コンピュータにより実施される方法。
  2. 事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合を実行するステップは:
    前記テキスト情報が前記事前設定リスト内の1つのエントリと同じであるかどうかを特定することにより、前記テキスト情報に第1の照合を実行するステップと;
    不成功の前記第1の照合に応答して、前記テキスト情報が、前記事前設定リストの唯一のエントリを含むか又はこれに含まれているかどうかを特定することにより、前記テキスト情報に第2の照合を実行するステップと;
    不成功の前記第2の照合に応答して、前記事前設定リスト内の前記事前設定背景識別情報と、事前設定した類似式とに基づいて、前記テキスト情報に第3の照合を実行するステップと;を更に備える、
    請求項1に記載のコンピュータにより実施される方法。
  3. 前記事前設定リスト内の前記事前設定背景識別情報と、事前設定した類似式とに基づいて、前記テキスト情報に第3の照合を実行するステップは:
    前記事前設定した類似式を用いて、前記テキスト情報と前記事前設定リスト内の各エントリとの間の類似値を計算するステップと;
    最大類似値を特定するステップと;
    前記最大類似値が事前設定閾値以上であるかどうかを特定するステップと;を更に備える、
    請求項2に記載のコンピュータにより実施される方法。
  4. 前記事前設定した類似式を用いて、前記テキスト情報と前記事前設定リスト内の各エントリとの間の類似値を計算するステップは:
    前記テキスト情報と、前記事前設定リスト内の該特定のエントリとの間の最長の共通部分サブ文字列長を計算するステップと;
    前記最長の共通部分サブ文字列長を該特定のエントリの文字列長で除算するステップと;を更に備える、
    請求項3に記載のコンピュータにより実施される方法。
  5. 成功の前記第2の照合に応答し、前記事前設定リストを前記第2の照合に基づいて更新するステップを更に備える、
    請求項2に記載のコンピュータにより実施される方法。
  6. 前記階層照合に基づいて前記ユーザ情報を特定するステップは:
    前記第1の照合、前記第2の照合、又は前記第3の照合に基づいて前記ユーザ情報を特定するステップを更に備える、
    請求項2に記載のコンピュータにより実施される方法。
  7. 前記テキスト情報にデータクリーニングを実行するステップと;
    クリーニングされた前記テキスト情報に前記階層照合を実行するステップと;を更に備える、
    請求項1に記載のコンピュータにより実施される方法。
  8. 操作を実行するためにコンピュータシステムにより実行可能な1つ以上の命令を格納する、非一時的なコンピュータ読取可能媒体であって、前記操作は:
    ユーザサービス情報からのユーザ情報に関連するテキスト情報を識別すること;
    事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合を実行することであって、前記階層照合は種々の照合方法を含み、前記事前設定リストは、前記ユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む、前記実行すること;
    前記階層照合に基づいて前記ユーザ情報を特定すること;を備える、
    非一時的なコンピュータ読取可能媒体。
  9. 事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合を実行することは:
    前記テキスト情報が前記事前設定リスト内の1つのエントリと同じであるかどうかを特定することにより、前記テキスト情報に第1の照合を実行すること;
    不成功の前記第1の照合に応答して、前記テキスト情報が、前記事前設定リストの唯一のエントリを含むか又はこれに含まれているかどうかを特定することにより、前記テキスト情報に第2の照合を実行すること;
    不成功の前記第2の照合に応答して、前記事前設定リスト内の前記事前設定背景識別情報と、事前設定した類似式とに基づいて、前記テキスト情報に第3の照合を実行すること;の命令のうち1つ以上を更に備える、
    請求項8に記載の非一時的なコンピュータ読取可能媒体。
  10. 前記事前設定リスト内の前記事前設定背景識別情報と、事前設定した類似式とに基づいて、前記テキスト情報に第3の照合を実行することは:
    前記事前設定した類似式を用いて、前記テキスト情報と前記事前設定リスト内の各エントリとの間の類似値を計算すること;
    最大類似値を特定すること;
    前記最大類似値が事前設定閾値以上であるかどうかを特定すること;の1つ以上の命令を更に備える、
    請求項9に記載の非一時的なコンピュータ読取可能媒体。
  11. 前記事前設定した類似式を用いて、前記テキスト情報と前記事前設定リスト内の各エントリとの間の類似値を計算することは:
    前記テキスト情報と、前記事前設定リスト内の該特定のエントリとの間の最長の共通部分サブ文字列長を計算すること;
    前記最長の共通部分サブ文字列長を該特定のエントリの文字列長で除算すること;の1つ以上の命令を更に備える、
    請求項10に記載の非一時的なコンピュータ読取可能媒体。
  12. 前記操作は、成功の前記第2の照合に応答して、前記事前設定リストを前記第2の照合に基づいて更新する1つ以上の命令を更に備える、
    請求項9に記載の非一時的なコンピュータ読取可能媒体。
  13. 前記階層照合に基づいて前記ユーザ情報を特定することは:
    前記第1の照合、前記第2の照合、又は前記第3の照合に基づいて、前記ユーザ情報を特定する1つ以上の命令を更に備える、
    請求項9に記載の非一時的なコンピュータ読取可能媒体。
  14. 前記テキスト情報にデータクリーニングを実行すること;
    クリーニングした前記テキスト情報に前記階層照合を実行すること;の1つ以上の命令を更に備える、
    請求項8に記載の非一時的なコンピュータ読取可能媒体。
  15. コンピュータメモリと;
    前記コンピュータメモリに相互作動可能に接続し、操作を実行するよう構成されたハードウェアプロセッサと;を備え、
    前記操作は:
    ユーザサービス情報からのユーザ情報に関連するテキスト情報を識別する操作と;
    事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合を実行する操作であって、前記階層照合は種々の照合方法を含み、前記事前設定リストは、前記ユーザ情報に関連する種々の事前設定背景識別情報を格納する複数のエントリを含む、前記実行する操作と;
    前記階層照合に基づいて前記ユーザ情報を特定する操作と;を備える、
    コンピュータにより実施されるシステム。
  16. 事前設定リスト内の事前設定背景識別情報に基づいて、前記テキスト情報に階層照合を実行する操作は:
    前記テキスト情報が前記事前設定リスト内の1つのエントリと同じであるかどうかを特定することにより、前記テキスト情報に第1の照合を実行し;
    不成功の前記第1の照合に応答して、前記テキスト情報が、前記事前設定リストの唯一のエントリを含むか又はこれに含まれているかどうかを特定することにより、前記テキスト情報に第2の照合を実行し;
    不成功の前記第2の照合に応答して、前記事前設定リスト内の前記事前設定背景識別情報と、事前設定した類似式とに基づいて、前記テキスト情報に第3の照合を実行する;よう更に構成された、
    請求項15に記載のコンピュータにより実施されるシステム。
  17. 前記事前設定リスト内の前記事前設定背景識別情報と、事前設定した類似式とに基づいて、前記テキスト情報に第3の照合を実行することは:
    前記事前設定した類似式を用いて、前記テキスト情報と前記事前設定リスト内の各エントリとの間の類似値を計算し;
    最大類似値を特定し;
    前記最大類似値が事前設定閾値以上であるかどうかを特定する;よう更に構成された、
    請求項16に記載のコンピュータにより実施されるシステム。
  18. 前記事前設定した類似式を用いて、前記テキスト情報と前記事前設定リスト内の各エントリとの間の類似値を計算することは:
    前記テキスト情報と前記事前設定リスト内の該特定のエントリとの間の最大の共通部分サブ文字列長を計算し;
    前記最長の共通部分サブ文字列長を該特定のエントリの文字列長で除算する;よう更に構成された、
    請求項17に記載のコンピュータにより実施されるシステム。
  19. 成功の前記第2の照合に応答して、前記事前設定リストを前記第2の照合に基づいて更新するように更に構成され、
    前記階層照合に基づいて前記ユーザ情報を特定する操作は:
    前記第1の照合、前記第2の照合、又は前記第3の照合に基づいて、前記ユーザ情報を特定するよう更に構成された、
    請求項16に記載のコンピュータにより実施されるシステム。
  20. 前記テキスト情報にデータクリーニングを実行し;
    クリーニングされた前記テキスト情報に前記階層照合を実行する;よう更に構成された、
    請求項15に記載のコンピュータにより実施されるシステム。
JP2019500507A 2016-07-07 2017-07-07 コンピュータシステムからのユーザ情報の収集 Active JP6777807B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201610532453.8 2016-07-07
CN201610532453.8A CN106909600A (zh) 2016-07-07 2016-07-07 用户背景信息的收集方法及装置
US15/643,963 2017-07-07
PCT/US2017/041134 WO2018009823A1 (en) 2016-07-07 2017-07-07 Collecting user information from computer systems
US15/643,963 US10936636B2 (en) 2016-07-07 2017-07-07 Collecting user information from computer systems

Publications (2)

Publication Number Publication Date
JP2019530046A true JP2019530046A (ja) 2019-10-17
JP6777807B2 JP6777807B2 (ja) 2020-10-28

Family

ID=59206511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019500507A Active JP6777807B2 (ja) 2016-07-07 2017-07-07 コンピュータシステムからのユーザ情報の収集

Country Status (14)

Country Link
US (1) US10936636B2 (ja)
EP (1) EP3482301A1 (ja)
JP (1) JP6777807B2 (ja)
KR (1) KR102202326B1 (ja)
CN (1) CN106909600A (ja)
AU (1) AU2017292019A1 (ja)
BR (1) BR112019000188A2 (ja)
CA (1) CA3030075C (ja)
MX (1) MX2019000101A (ja)
PH (1) PH12019500052A1 (ja)
RU (1) RU2718422C1 (ja)
SG (1) SG11201900102YA (ja)
TW (1) TWI673617B (ja)
WO (1) WO2018009823A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959958B (zh) 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN109947873B (zh) * 2017-08-14 2021-11-23 清华大学 景点知识地图构建方法、装置、设备及可读存储介质
CN110019992B (zh) * 2017-09-14 2021-02-02 腾讯科技(深圳)有限公司 一种数据处理方法和装置
US10909317B2 (en) * 2019-07-26 2021-02-02 Advanced New Technologies Co., Ltd. Blockchain-based text similarity detection method, apparatus and electronic device
CN112887423B (zh) * 2021-02-24 2021-12-07 三川智慧科技股份有限公司 一种远程调试水表的方法及系统
CN114547404B (zh) * 2022-01-10 2023-02-17 普瑞纯证医疗科技(苏州)有限公司 一种大数据平台系统

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6324534B1 (en) * 1999-09-10 2001-11-27 Requisite Technology, Inc. Sequential subset catalog search engine
US20050004799A1 (en) * 2002-12-31 2005-01-06 Yevgenly Lyudovyk System and method for a spoken language interface to a large database of changing records
GB0325626D0 (en) * 2003-11-03 2003-12-10 Infoshare Ltd Data aggregation
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
JP5076575B2 (ja) 2007-03-19 2012-11-21 日本電気株式会社 同義表現抽出システム、同義表現抽出方法、及び同義表現抽出プログラム
JP2009009295A (ja) * 2007-06-27 2009-01-15 Fujitsu Ltd アンケート方法、情報処理装置及びプログラム
US7769778B2 (en) * 2007-06-29 2010-08-03 United States Postal Service Systems and methods for validating an address
US20090119581A1 (en) * 2007-11-05 2009-05-07 Verizon Data Services Inc. Method and apparatus for providing auto-completion of information using strings
US9049117B1 (en) * 2009-10-21 2015-06-02 Narus, Inc. System and method for collecting and processing information of an internet user via IP-web correlation
WO2011119864A1 (en) * 2010-03-24 2011-09-29 Findly, Inc. Automated profile standardization and competency profile generation
US20130132358A1 (en) * 2011-11-18 2013-05-23 Rawllin International Inc. Consumer information aggregator and profile generator
US9665638B2 (en) * 2012-10-30 2017-05-30 FHOOSH, Inc. Systems and methods for secure storage of user information in a user profile
US9449056B1 (en) * 2012-11-01 2016-09-20 Intuit Inc. Method and system for creating and updating an entity name alias table
CN103020230A (zh) * 2012-12-14 2013-04-03 中国科学院声学研究所 一种语义模糊匹配方法
US9413827B2 (en) * 2013-02-25 2016-08-09 Qualcomm Incorporated Context aware actions among heterogeneous internet of things (IOT) devices
US20150032729A1 (en) * 2013-07-23 2015-01-29 Salesforce.Com, Inc. Matching snippets of search results to clusters of objects
US10949904B2 (en) * 2014-10-04 2021-03-16 Proz.Com Knowledgebase with work products of service providers and processing thereof
US10296546B2 (en) * 2014-11-24 2019-05-21 Adobe Inc. Automatic aggregation of online user profiles
US10133813B2 (en) * 2015-08-12 2018-11-20 Adobe Systems Incorporated Form value prediction utilizing synonymous field recognition
CN106060113B (zh) * 2016-05-10 2019-07-02 腾讯科技(深圳)有限公司 账号推送方法及装置

Also Published As

Publication number Publication date
JP6777807B2 (ja) 2020-10-28
EP3482301A4 (en) 2019-05-15
SG11201900102YA (en) 2019-02-27
CN106909600A (zh) 2017-06-30
TW201810093A (zh) 2018-03-16
US20180011928A1 (en) 2018-01-11
KR102202326B1 (ko) 2021-01-14
MX2019000101A (es) 2019-12-05
PH12019500052A1 (en) 2019-10-21
CA3030075C (en) 2020-09-29
WO2018009823A1 (en) 2018-01-11
TWI673617B (zh) 2019-10-01
US10936636B2 (en) 2021-03-02
KR20190026853A (ko) 2019-03-13
CA3030075A1 (en) 2018-01-11
RU2718422C1 (ru) 2020-04-02
AU2017292019A1 (en) 2019-01-31
EP3482301A1 (en) 2019-05-15
BR112019000188A2 (pt) 2019-04-24

Similar Documents

Publication Publication Date Title
JP6777807B2 (ja) コンピュータシステムからのユーザ情報の収集
JP6803980B1 (ja) 信頼されたイニシャライザを用いない秘密分散
US11727075B2 (en) Enhancing accuracy of presented search keywords
US20180024943A1 (en) Risk identification based on address matching
US10762382B2 (en) Image recognition based on augmented reality
US10872070B2 (en) Distributed data processing
JP2019532445A (ja) 多義コードを使用した類似度検索
US20150088841A1 (en) Techniques for correlating data in a repository system
JP6678829B2 (ja) ユーザ信用評価
US10579666B2 (en) Computerized cognitive recall assistance
US10929412B2 (en) Sharing content based on extracted topics
US10803071B2 (en) Presenting a data handling method on a graphical user interface
US10484342B2 (en) Accuracy and security of data transfer to an online user account
EP3493076A1 (en) Cognitive decision system for security and log analysis using associative memory mapping in graph database
US20180096056A1 (en) Matching arbitrary input phrases to structured phrase data
AU2021210221B2 (en) Performing search based on position information
US20240086437A1 (en) Hybrid database interface with intent expansion
US20240104068A1 (en) System and method for analyzing file system data using a virtual file system generated using a metadata backup
US20200210438A1 (en) Enhanced query performance prediction for information retrieval systems
US20180203932A1 (en) Enhanced information retrieval

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200518

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201008

R150 Certificate of patent or registration of utility model

Ref document number: 6777807

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250