JP6594988B2 - 住所テキストを処理する方法及び機器 - Google Patents
住所テキストを処理する方法及び機器 Download PDFInfo
- Publication number
- JP6594988B2 JP6594988B2 JP2017542458A JP2017542458A JP6594988B2 JP 6594988 B2 JP6594988 B2 JP 6594988B2 JP 2017542458 A JP2017542458 A JP 2017542458A JP 2017542458 A JP2017542458 A JP 2017542458A JP 6594988 B2 JP6594988 B2 JP 6594988B2
- Authority
- JP
- Japan
- Prior art keywords
- address
- text
- address text
- original
- texts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 66
- 238000000034 method Methods 0.000 title claims description 60
- 239000012634 fragment Substances 0.000 claims description 82
- 238000010606 normalization Methods 0.000 claims description 73
- 230000008569 process Effects 0.000 description 34
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9574—Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
サービスシステム内の利用者の社会的な関係によるサークル(以下、社会的関係サークル)に従って少なくとも1つの住所集合を決定することであって、少なくとも1つの住所集合内の各住所集合は少なくとも2つのオリジナル住所テキストを含む、決定すること、及び
住所集合に対応する目的住所テキストを得るために、住所集合内のオリジナル住所テキストに対して正規化処理を住所集合ごとに実行することを含む。
サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定するように構成される決定モジュールであって、少なくとも1つの住所集合内の各住所集合は少なくとも2つのオリジナル住所テキストを含む、決定モジュールと、
住所集合に対応する目的住所テキストを得るために、住所集合内のオリジナル住所テキストに対して正規化処理を住所集合ごとに実行するように構成される正規化モジュールとを含む。
本願の実施形態における技術的解決策をより明確に説明するために、実施形態又は従来技術に関する説明の中で使用する添付図面を以下で簡潔に紹介する。以下の説明の中の添付図面が本願の一部の実施形態を示すことが明らかである。創造的な取組みを行うことなしに、添付図面に従う他の添付図面も当業者なら得ることができる。
本願の実施形態の目的、技術的解決策、及び利点をより明確にするために、本願の一部の実施形態の技術的解決策を添付図面に関して以下で明確且つ完全に説明する。記載する実施形態は、本願の実施形態の全てではなく一部であることが明らかである。創造的な取組みを行うことなしに本願の実施形態に基づいて当業者が得る他の全ての実施形態が本願の保護範囲に属する。
101:サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定することであって、少なくとも1つの住所集合内の各住所集合は少なくとも2つのオリジナル住所テキストを含む、決定すること、及び
102:住所集合に対応する目的住所テキストを得るために、住所集合内のオリジナル住所テキストに対して正規化処理を住所集合ごとに実行することを含む。
住所集合内の2つのオリジナル住所テキストそれぞれの特徴に従って前記2つのオリジナル住所テキスト間の類似度を住所テキスト処理機器によって計算すること、及び住所集合に対応する目的住所テキストを得るために、前記2つのオリジナル住所テキストが前記2つのオリジナル住所テキストのうちの1つに正規化され得るかどうかを、前記2つのオリジナル住所テキスト間の類似度に従って判定することを含み得る。
特徴が標準的断片特徴である場合、住所テキスト処理機器は、SimHashアルゴリズムを使用することによって前記2つのオリジナル住所テキストそれぞれの標準的断片特徴を処理して、標準的断片特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を得ることができる。
サービスシステム内の各利用者の社会的関係サークルを決定し、
各利用者が使用する住所テキスト及び各利用者の社会的関係サークル内の利用者が使用する住所テキストを取得して、住所集合を構成するように特に構成され得る。
住所集合内の2つのオリジナル住所テキストそれぞれの特徴に従って、前記2つのオリジナル住所テキスト間の類似度を計算し、
住所集合に対応する目的住所テキストを得るために、前記2つのオリジナル住所テキストが前記2つのオリジナル住所テキストのうちの1つに正規化され得るかどうかを、前記2つのオリジナル住所テキスト間の類似度に従って判定するように特に構成され得る。
住所集合内の2つのオリジナル住所テキストそれぞれの特徴を抽出し、前記2つのオリジナル住所テキストの標準的断片特徴、経度及び緯度の特徴、並びに英数字の特徴のうちの少なくとも1つの特徴を取得し、
少なくとも1つの特徴のうちの特徴ごとに、その特徴に対応する前記2つのオリジナル住所テキスト間の類似度を、その特徴に従って計算するように更に特に構成され得る。
特徴が標準的断片特徴である場合、SimHashアルゴリズムを使用することによって前記2つのオリジナル住所テキストそれぞれの標準的断片特徴を処理して、標準的断片特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を取得し、
特徴が経度及び緯度の特徴である場合、経度/緯度距離アルゴリズムを使用することによって前記2つのオリジナル住所テキストそれぞれの経度及び緯度の特徴を処理して、経度及び緯度の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を取得し、
特徴が英数字の特徴である場合、ジャカード係数アルゴリズムを使用することによって前記2つのオリジナル住所テキストそれぞれの英数字の特徴を処理して、英数字の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を取得するように、更に構成され得る。
正規化モジュール32は、同じオリジナル住所テキストに対応する少なくとも2つの目的住所テキストに対して正規化処理を行うように更に構成することができる。
同じオリジナル住所テキストに対応する少なくとも2つの目的住所テキストにそれぞれ対応するオリジナル住所テキスト内に含まれる標準的な住所の断片の断片共通集合を取得し、
同じオリジナル住所テキストに対応する少なくとも2つの目的住所テキストに対する正規化処理を、断片共通集合に従って行うように特に構成され得る。
Claims (26)
- 住所テキストを処理する方法であって、
サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定することであって、前記少なくとも1つの住所集合の各住所集合は少なくとも2つのオリジナル住所テキストを含む、決定すること、及び
前記住所集合に対応する目的住所テキストを得るために、前記住所集合内のオリジナル住所テキストに対して正規化を住所集合ごとに実行すること
を含む、方法。 - サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定することが、
前記サービスシステム内の利用者の社会的関係サークルを決定すること、及び
前記利用者が使用する住所テキスト及び前記社会的関係サークル内の利用者が使用する住所テキストを取得して住所集合を構成すること
を含む、請求項1に記載の方法。 - 前記住所集合に対応する目的住所テキストを得るために、前記住所集合内のオリジナル住所テキストに対して正規化を実行することが、
前記住所集合内の2つのオリジナル住所テキストそれぞれの特徴に従って、前記2つのオリジナル住所テキスト間の類似度を決定すること、及び
前記住所集合に対応する目的住所テキストを得るために、前記2つのオリジナル住所テキストが前記2つのオリジナル住所テキストのうちの1つに正規化され得るかどうかを、前記類似度に従って判定すること
を含む、請求項1に記載の方法。 - 前記住所集合内の2つのオリジナル住所テキストそれぞれの特徴に従って、前記2つのオリジナル住所テキスト間の類似度を決定することが、
前記2つのオリジナル住所テキストそれぞれの標準的断片特徴、経度及び緯度の特徴、又は英数字の特徴のうちの少なくとも1つを抽出すること、及び
前記抽出された特徴に対応する前記2つのオリジナル住所テキスト間の類似度を、抽出された特徴それぞれに従って決定すること
を含む、請求項3に記載の方法。 - 前記特徴に対応する前記2つのオリジナル住所テキスト間の類似度を、抽出された特徴それぞれに従って決定することは、
前記抽出された特徴が標準的断片特徴であることに応じて、SimHashアルゴリズムを使用することによって、標準的断片特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定すること、
前記抽出された特徴が経度及び緯度の特徴であることに応じて、経度/緯度距離アルゴリズムを使用することによって、経度及び緯度の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定すること、及び
前記抽出された特徴が英数字の特徴であることに応じて、ジャカード係数アルゴリズムを使用することによって、英数字の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定すること
を含む、請求項4に記載の方法。 - 目的住所テキストとオリジナル住所テキストとの間の対応関係に従い、同じオリジナル住所テキストに対応する少なくとも2つの目的住所テキストを決定すること、及び
前記少なくとも2つの目的住所テキストに対して正規化を行うこと
を更に含む、請求項1に記載の方法。 - 前記少なくとも2つの目的住所テキストに対して正規化を行うことが、
前記少なくとも2つの目的住所テキストにそれぞれ対応するオリジナル住所テキスト内に含まれる標準的な住所の断片の断片共通集合を取得すること、及び
前記少なくとも2つの目的住所テキストに対する正規化を前記断片共通集合に従って行うこと
を含む、請求項6に記載の方法。 - 前記少なくとも2つの目的住所テキストに対する正規化を前記断片共通集合に従って行うことが、
前記断片共通集合が、前記少なくとも2つの目的住所テキストのうちの1つを表すことに応じて、前記少なくとも2つの目的住所テキストを、前記断片共通集合が表す前記目的住所テキストへ正規化すること
を含む、請求項7に記載の方法。 - 前記断片共通集合及び前記断片共通集合が表す前記目的住所テキストを特徴知識ベース内に記憶すること
を更に含む、請求項8に記載の方法。 - 住所テキスト処理機器であって、
サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定するように構成される決定モジュールであって、前記少なくとも1つの住所集合の各住所集合は少なくとも2つのオリジナル住所テキストを含む、決定モジュールと、
前記住所集合に対応する目的住所テキストを得るために、前記住所集合内のオリジナル住所テキストに対して正規化を住所集合ごとに実行するように構成される正規化モジュールと
を含む、機器。 - 前記決定モジュールが、
前記サービスシステム内の利用者の社会的関係サークルを決定し、
前記利用者が使用する住所テキスト及び前記社会的関係サークル内の利用者が使用する住所テキストを取得して住所集合を構成する
ように更に構成される、請求項10に記載の機器。 - 前記正規化モジュールが、
前記住所集合内の個々の2つのオリジナル住所テキストの特徴に従って前記2つのオリジナル住所テキスト間の類似度を決定し、
前記住所集合に対応する目的住所テキストを得るために、前記2つのオリジナル住所テキストが前記2つのオリジナル住所テキストのうちの1つに正規化され得るかどうかを、前記類似度に従って判定する
ように更に構成される、請求項10に記載の機器。 - 前記正規化モジュールが、
前記2つのオリジナル住所テキストの標準的断片特徴、経度及び緯度の特徴、又は英数字の特徴のうちの少なくとも1つを抽出し、
前記抽出された特徴に対応する前記2つのオリジナル住所テキスト間の類似度を、抽出された特徴それぞれに従って決定する
ように更に構成される、請求項12に記載の機器。 - 前記正規化モジュールは、
前記抽出された特徴が標準的断片特徴である場合、SimHashアルゴリズムを使用することによって、標準的断片特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定し、
前記抽出された特徴が経度及び緯度の特徴である場合、経度/緯度距離アルゴリズムを使用することによって、経度及び緯度の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定し、
前記特徴が英数字の特徴である場合、ジャカード係数アルゴリズムを使用することによって、英数字の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定する
ように更に構成される、請求項13に記載の機器。 - 前記決定モジュールは、目的住所テキストとオリジナル住所テキストとの間の対応関係に従い、同じオリジナル住所テキストに対応する少なくとも2つの目的住所テキストを決定するように更に構成され、
前記正規化モジュールは、前記少なくとも2つの目的住所テキストに対して正規化を行うように更に構成される、
請求項10に記載の機器。 - 前記正規化モジュールが、
前記少なくとも2つの目的住所テキストにそれぞれ対応するオリジナル住所テキスト内に含まれる標準的な住所の断片の断片共通集合を取得し、
前記少なくとも2つの目的住所テキストに対する正規化を前記断片共通集合に従って行う
ように更に構成される、請求項15に記載の機器。 - 前記少なくとも2つの目的住所テキストのうちの1つを前記断片共通集合が表す場合、前記断片共通集合及び前記断片共通集合が表す前記目的住所テキストを記憶するように構成される特徴知識ベースを更に含む、請求項16に記載の機器。
- 命令のセットを格納する非一時的コンピュータ可読媒体であって、前記命令のセットは、住所テキスト処理機器に、住所テキストを処理する方法を行わせるように、前記住所テキスト処理機器の少なくとも一つのプロセッサによって実行可能であり、前記方法が、
サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定することであって、前記少なくとも1つの住所集合の各住所集合は少なくとも2つのオリジナル住所テキストを含む、決定すること、及び
前記住所集合に対応する目的住所テキストを得るために、前記住所集合内のオリジナル住所テキストに対して正規化を住所集合ごとに実行すること
を含む、非一時的コンピュータ可読媒体。 - サービスシステム内の利用者の社会的関係サークルに従って少なくとも1つの住所集合を決定することが、
前記サービスシステム内の利用者の社会的関係サークルを決定すること、及び
前記利用者が使用する住所テキスト及び前記社会的関係サークル内の利用者が使用する住所テキストを取得して住所集合を構成すること
を含む、請求項18に記載の非一時的コンピュータ可読媒体。 - 前記住所集合に対応する目的住所テキストを得るために、前記住所集合内のオリジナル住所テキストに対して正規化を実行することが、
前記住所集合内の2つのオリジナル住所テキストそれぞれの特徴に従って、前記2つのオリジナル住所テキスト間の類似度を決定すること、及び
前記住所集合に対応する目的住所テキストを得るために、前記2つのオリジナル住所テキストが前記2つのオリジナル住所テキストのうちの1つに正規化され得るかどうかを、前記類似度に従って判定すること
を含む、請求項18に記載の非一時的コンピュータ可読媒体。 - 前記住所集合内の2つのオリジナル住所テキストそれぞれの特徴に従って、前記2つのオリジナル住所テキスト間の類似度を決定することが、
前記2つのオリジナル住所テキストそれぞれの標準的断片特徴、経度及び緯度の特徴、又は英数字の特徴のうちの少なくとも1つを抽出すること、及び
前記特徴に対応する前記2つのオリジナル住所テキスト間の類似度を、抽出された特徴それぞれに従って決定すること
を含む、請求項20に記載の非一時的コンピュータ可読媒体。 - 前記特徴に対応する前記2つのオリジナル住所テキスト間の類似度を、抽出された特徴それぞれに従って決定することは、
前記抽出された特徴が標準的断片特徴であることに応じて、SimHashアルゴリズムを使用することによって、標準的断片特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定すること、
前記抽出された特徴が経度及び緯度の特徴であることに応じて、経度/緯度距離アルゴリズムを使用することによって、経度及び緯度の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定すること、及び
前記抽出された特徴が英数字の特徴であることに応じて、ジャカード係数アルゴリズムを使用することによって、英数字の特徴の次元上での前記2つのオリジナル住所テキスト間の類似度を決定すること
を含む、請求項21に記載の非一時的コンピュータ可読媒体。 - 前記命令のセットは、
目的住所テキストとオリジナル住所テキストとの間の対応関係に従い、同じオリジナル住所テキストに対応する少なくとも2つの目的住所テキストを決定すること、及び
前記少なくとも2つの目的住所テキストに対して正規化を行うこと
を前記住所テキスト処理機器が更に行うように、前記住所テキスト処理機器の前記少なくとも一つのプロセッサによって実行可能である、請求項18に記載の非一時的コンピュータ可読媒体。 - 前記少なくとも2つの目的住所テキストに対して正規化を行うことが、
前記少なくとも2つの目的住所テキストにそれぞれ対応するオリジナル住所テキスト内に含まれる標準的な住所の断片の断片共通集合を取得すること、及び
前記少なくとも2つの目的住所テキストに対する正規化を前記断片共通集合に従って行うこと
を含む、請求項23に記載の非一時的コンピュータ可読媒体。 - 前記少なくとも2つの目的住所テキストに対する正規化を前記断片共通集合に従って行うことが、
前記断片共通集合が、前記少なくとも2つの目的住所テキストのうちの1つを表すことに応じて、前記少なくとも2つの目的住所テキストを、前記断片共通集合が表す前記目的住所テキストへ正規化すること
を含む、請求項24に記載の非一時的コンピュータ可読媒体。 - 前記命令のセットは、
前記断片共通集合及び前記断片共通集合が表す前記目的住所テキストを特徴知識ベース内に記憶すること
を前記住所テキスト処理機器が更に行うように、前記住所テキスト処理機器の前記少なくとも一つのプロセッサによって実行可能である、請求項25に記載の非一時的コンピュータ可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510079914.6 | 2015-02-13 | ||
CN201510079914.6A CN105988988A (zh) | 2015-02-13 | 2015-02-13 | 文本地址处理方法及装置 |
PCT/CN2016/073441 WO2016127904A1 (zh) | 2015-02-13 | 2016-02-04 | 文本地址处理方法及装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018510410A JP2018510410A (ja) | 2018-04-12 |
JP2018510410A5 JP2018510410A5 (ja) | 2018-12-06 |
JP6594988B2 true JP6594988B2 (ja) | 2019-10-23 |
Family
ID=56615030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017542458A Active JP6594988B2 (ja) | 2015-02-13 | 2016-02-04 | 住所テキストを処理する方法及び機器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10795964B2 (ja) |
EP (1) | EP3258397A4 (ja) |
JP (1) | JP6594988B2 (ja) |
KR (1) | KR102079860B1 (ja) |
CN (1) | CN105988988A (ja) |
SG (2) | SG10201907254XA (ja) |
WO (1) | WO2016127904A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105988988A (zh) | 2015-02-13 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 文本地址处理方法及装置 |
CN108460046A (zh) * | 2017-02-21 | 2018-08-28 | 菜鸟智能物流控股有限公司 | 一种地址聚合的方法以及设备 |
CN108804398A (zh) * | 2017-05-03 | 2018-11-13 | 阿里巴巴集团控股有限公司 | 地址文本的相似度计算方法及装置 |
CN113591453A (zh) * | 2018-04-10 | 2021-11-02 | 百融云创科技股份有限公司 | 人为填写的地址文本相似度处理方法和系统 |
CN110417841B (zh) * | 2018-04-28 | 2022-01-18 | 阿里巴巴集团控股有限公司 | 地址归一化处理方法、装置和系统、数据处理方法 |
CN108876440B (zh) * | 2018-05-29 | 2021-09-03 | 创新先进技术有限公司 | 区域划分方法和服务器 |
CN109033225A (zh) * | 2018-06-29 | 2018-12-18 | 福州大学 | 中文地址识别系统 |
CN109388634B (zh) * | 2018-09-18 | 2024-05-03 | 平安科技(深圳)有限公司 | 地址信息的处理方法、终端设备及计算机可读存储介质 |
CN111274811B (zh) * | 2018-11-19 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 地址文本相似度确定方法以及地址搜索方法 |
CN109635063A (zh) * | 2018-12-06 | 2019-04-16 | 拉扎斯网络科技(上海)有限公司 | 地址库的信息处理方法、装置、电子设备和存储介质 |
CN111435360B (zh) * | 2019-01-15 | 2023-08-29 | 菜鸟智能物流控股有限公司 | 地址类型识别方法和装置以及电子设备 |
CN111488334B (zh) * | 2019-01-29 | 2023-04-14 | 阿里巴巴集团控股有限公司 | 数据处理方法及电子设备 |
CN111723164B (zh) * | 2019-03-18 | 2023-12-12 | 阿里巴巴集团控股有限公司 | 地址信息的处理方法和装置 |
CN110598791A (zh) * | 2019-09-12 | 2019-12-20 | 深圳前海微众银行股份有限公司 | 地址相似度评价方法、装置、设备及介质 |
CN110851669A (zh) * | 2019-10-17 | 2020-02-28 | 清华大学 | 基于地理位置信息的机构命名排歧方法及装置 |
CN111522901B (zh) * | 2020-03-18 | 2023-10-20 | 大箴(杭州)科技有限公司 | 文本中地址信息的处理方法及装置 |
US11159458B1 (en) | 2020-06-10 | 2021-10-26 | Capital One Services, Llc | Systems and methods for combining and summarizing emoji responses to generate a text reaction from the emoji responses |
CN112287671A (zh) * | 2020-09-29 | 2021-01-29 | 深圳市跨越新科技有限公司 | 基于simhash的地址解析方法及系统 |
CN112711950A (zh) * | 2020-12-23 | 2021-04-27 | 深圳壹账通智能科技有限公司 | 地址信息抽取方法、装置、设备及存储介质 |
CN113761867A (zh) * | 2020-12-29 | 2021-12-07 | 京东城市(北京)数字科技有限公司 | 地址识别方法、装置、计算机设备及存储介质 |
CN115225609B (zh) * | 2021-04-20 | 2024-06-25 | 大金(中国)投资有限公司 | 用户数据处理方法及装置、服务器 |
CN114048797A (zh) * | 2021-10-20 | 2022-02-15 | 盐城金堤科技有限公司 | 确定地址相似度的方法、装置、介质及电子设备 |
CN116402050B (zh) * | 2022-12-26 | 2023-11-10 | 北京码牛科技股份有限公司 | 一种地址归一化及补充方法、装置、电子设备及存储介质 |
CN115952779B (zh) * | 2023-03-13 | 2023-09-29 | 中规院(北京)规划设计有限公司 | 一种位置名称校准方法、装置、计算机设备及存储介质 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003067596A (ja) | 2001-08-30 | 2003-03-07 | Fujitsu Ltd | 売り手買い手の場所マッチング装置 |
JP3803961B2 (ja) * | 2001-12-05 | 2006-08-02 | 日本電信電話株式会社 | データベース生成装置、データベース生成処理方法及びデータベース生成プログラム |
US7885901B2 (en) * | 2004-01-29 | 2011-02-08 | Yahoo! Inc. | Method and system for seeding online social network contacts |
US7743048B2 (en) * | 2004-10-29 | 2010-06-22 | Microsoft Corporation | System and method for providing a geographic search function |
JP4687089B2 (ja) * | 2004-12-08 | 2011-05-25 | 日本電気株式会社 | 重複レコード検出システム、および重複レコード検出プログラム |
US20140230030A1 (en) * | 2006-11-22 | 2014-08-14 | Raj Abhyanker | Method and apparatus for geo-spatial and social relationship analysis |
US8050690B2 (en) | 2007-08-14 | 2011-11-01 | Mpanion, Inc. | Location based presence and privacy management |
US20090319515A1 (en) * | 2008-06-02 | 2009-12-24 | Steven Minton | System and method for managing entity knowledgebases |
US20120317217A1 (en) * | 2009-06-22 | 2012-12-13 | United Parents Online Ltd. | Methods and systems for managing virtual identities |
US20120051657A1 (en) * | 2010-08-30 | 2012-03-01 | Microsoft Corporation | Containment coefficient for identifying textual subsets |
CN101996247B (zh) * | 2010-11-10 | 2013-02-20 | 百度在线网络技术(北京)有限公司 | 地址数据库的建构方法及装置 |
CN102024024B (zh) * | 2010-11-10 | 2013-07-10 | 百度在线网络技术(北京)有限公司 | 地址数据库的建构方法及装置 |
KR101556714B1 (ko) * | 2011-01-03 | 2015-10-02 | 네이버 주식회사 | 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
US20120215853A1 (en) * | 2011-02-17 | 2012-08-23 | Microsoft Corporation | Managing Unwanted Communications Using Template Generation And Fingerprint Comparison Features |
KR20120124581A (ko) | 2011-05-04 | 2012-11-14 | 엔에이치엔(주) | 개선된 유사 문서 탐지 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
US8676937B2 (en) * | 2011-05-12 | 2014-03-18 | Jeffrey Alan Rapaport | Social-topical adaptive networking (STAN) system allowing for group based contextual transaction offers and acceptances and hot topic watchdogging |
US8515964B2 (en) * | 2011-07-25 | 2013-08-20 | Yahoo! Inc. | Method and system for fast similarity computation in high dimensional space |
CN102955832B (zh) * | 2011-08-31 | 2015-11-25 | 深圳市华傲数据技术有限公司 | 一种通讯地址识别、标准化的系统 |
JP5866176B2 (ja) * | 2011-10-31 | 2016-02-17 | 日本郵便株式会社 | 住所録管理システム、住所録管理方法及び住所録管理プログラム |
JP5676517B2 (ja) | 2012-04-12 | 2015-02-25 | 日本電信電話株式会社 | 文字列類似度計算装置、方法、及びプログラム |
CN103425648B (zh) * | 2012-05-15 | 2016-04-13 | 腾讯科技(深圳)有限公司 | 关系圈的处理方法和系统 |
CN103428164B (zh) * | 2012-05-15 | 2015-07-01 | 腾讯科技(深圳)有限公司 | 用户社交网络关系圈划分方法和系统 |
CN102682128B (zh) * | 2012-05-17 | 2017-08-29 | 厦门雅迅网络股份有限公司 | 一种用于兴趣点信息的排重方法 |
US8719280B1 (en) * | 2012-10-16 | 2014-05-06 | Google Inc. | Person-based information aggregation |
US20140214895A1 (en) * | 2013-01-31 | 2014-07-31 | Inplore | Systems and method for the privacy-maintaining strategic integration of public and multi-user personal electronic data and history |
CN103473289A (zh) * | 2013-08-30 | 2013-12-25 | 深圳市华傲数据技术有限公司 | 一种通信地址补全的装置及方法 |
CN105320657A (zh) * | 2014-05-30 | 2016-02-10 | 中国电信股份有限公司 | 兴趣点数据融合方法和系统 |
CN104660581A (zh) * | 2014-11-28 | 2015-05-27 | 华为技术有限公司 | 一种为业务策略确定目标用户的方法、装置及系统 |
CN105988988A (zh) | 2015-02-13 | 2016-10-05 | 阿里巴巴集团控股有限公司 | 文本地址处理方法及装置 |
US10242258B2 (en) * | 2015-09-30 | 2019-03-26 | Microsoft Technology Licensing, Llc | Organizational data enrichment |
-
2015
- 2015-02-13 CN CN201510079914.6A patent/CN105988988A/zh active Pending
-
2016
- 2016-02-04 EP EP16748705.7A patent/EP3258397A4/en not_active Withdrawn
- 2016-02-04 JP JP2017542458A patent/JP6594988B2/ja active Active
- 2016-02-04 SG SG10201907254XA patent/SG10201907254XA/en unknown
- 2016-02-04 KR KR1020177025509A patent/KR102079860B1/ko active IP Right Grant
- 2016-02-04 WO PCT/CN2016/073441 patent/WO2016127904A1/zh active Application Filing
- 2016-02-04 SG SG11201706625YA patent/SG11201706625YA/en unknown
-
2017
- 2017-08-11 US US15/675,177 patent/US10795964B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR20170117481A (ko) | 2017-10-23 |
US20170337292A1 (en) | 2017-11-23 |
US10795964B2 (en) | 2020-10-06 |
CN105988988A (zh) | 2016-10-05 |
EP3258397A1 (en) | 2017-12-20 |
SG10201907254XA (en) | 2019-09-27 |
JP2018510410A (ja) | 2018-04-12 |
WO2016127904A1 (zh) | 2016-08-18 |
EP3258397A4 (en) | 2017-12-20 |
SG11201706625YA (en) | 2017-09-28 |
KR102079860B1 (ko) | 2020-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6594988B2 (ja) | 住所テキストを処理する方法及び機器 | |
US11003896B2 (en) | Entity recognition from an image | |
WO2017215370A1 (zh) | 构建决策模型的方法、装置、计算机设备及存储设备 | |
CN111400504B (zh) | 企业关键人的识别方法和装置 | |
CN110610196B (zh) | 脱敏方法、系统、计算机设备和计算机可读存储介质 | |
CN111343162B (zh) | 系统安全登录方法、装置、介质及电子设备 | |
US10628465B2 (en) | Generating a ranked list of best fitting place names | |
CN110908980B (zh) | 用户标识映射关系建立方法、系统、设备及存储介质 | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
CN114372133A (zh) | 查询信息问答方法、相关装置及计算机程序产品 | |
CN109034199B (zh) | 数据处理方法及装置、存储介质和电子设备 | |
KR20190015410A (ko) | 학습-기반 그룹 태깅을 위한 시스템 및 방법 | |
US20180219964A1 (en) | Method and system to convert globally unique identifiers to electronic data interchange document identifiers | |
CN110309244B (zh) | 一种目标点定位的方法和装置 | |
CN111930891B (zh) | 基于知识图谱的检索文本扩展方法及相关装置 | |
CN110599278A (zh) | 聚合设备标识符的方法、装置和计算机存储介质 | |
CN110266834B (zh) | 基于互联网协议地址的地区查找方法及装置 | |
CN112784596A (zh) | 一种识别敏感词的方法和装置 | |
CN113204613B (zh) | 地址生成方法、装置、设备和存储介质 | |
CN113220949B (zh) | 一种隐私数据识别系统的构建方法及装置 | |
CN112017634B (zh) | 数据的处理方法、装置、设备以及存储介质 | |
CN111954154B (zh) | 定位方法及装置、计算机可读存储介质以及电子设备 | |
CN114638308A (zh) | 一种获取对象关系的方法、装置、电子设备和存储介质 | |
CN111104420A (zh) | 数据处理方法、系统、电子设备及可读存储介质 | |
CN108052566A (zh) | 城市元素信息处理方法、装置、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181023 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190910 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6594988 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |