JP2023519049A - Poi状態情報を取得する方法、及び装置 - Google Patents
Poi状態情報を取得する方法、及び装置 Download PDFInfo
- Publication number
- JP2023519049A JP2023519049A JP2022521351A JP2022521351A JP2023519049A JP 2023519049 A JP2023519049 A JP 2023519049A JP 2022521351 A JP2022521351 A JP 2022521351A JP 2022521351 A JP2022521351 A JP 2022521351A JP 2023519049 A JP2023519049 A JP 2023519049A
- Authority
- JP
- Japan
- Prior art keywords
- poi
- text
- semantic
- semantic unit
- vector representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000001419 dependent effect Effects 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims description 46
- 230000004927 fusion Effects 0.000 claims description 29
- 230000014509 gene expression Effects 0.000 claims description 21
- 238000002372 labelling Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims 2
- 238000001914 filtration Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000005065 mining Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 2
- 238000013434 data augmentation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Library & Information Science (AREA)
- Computer Security & Cryptography (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本開示は、コンピュータ技術の分野に関し、特に、人工知能技術の分野におけるビッグデータ技術に関する。
インターネットから予め設定された期間内のPOI情報を含むテキストを取得するステップと、
予めトレーニングされたPOI状態識別モデルを使用して前記テキストを識別し、前記テキスト内の2つ組を取得するステップであって、前記2つ組は、POI名称と当該POI名称に対応するPOI状態情報を含むステップと、を含み、
前記POI状態識別モデルは、前記テキスト内の各第1のセマンティック単位のベクトル表現を取得し、前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得し、前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得し、各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行う。
トレーニングデータを取得するステップであって、前記トレーニングデータは、テキストと、当該テキストに含まれるPOI名称とPOI状態のラベルラベリング結果とを含むステップと、
前記テキストをPOI状態識別モデルの入力とし、前記テキストに含まれるPOI名称とPOI状態のラベルラベリング結果を前記POI状態識別モデルのターゲット予測結果として、前記POI状態識別モデルをトレーニングするステップと、を含み、
前記POI状態識別モデルは、前記テキスト内の各第1のセマンティック単位のベクトル表現を取得し、前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得し、前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得し、各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行う。
インターネットから予め設定された期間内のPOI情報を含むテキストを取得するテキスト取得ユニットと、
予めトレーニングされたPOI状態識別モデルを使用して前記テキストを識別し、前記テキスト内の2つ組を取得する状態識別ユニットであって、前記2つ組は、POI名称と当該POI名称に対応するPOI状態情報を含む状態識別ユニットと、を含み、
前記POI状態識別モデルは、
前記テキスト内の各第1のセマンティック単位のベクトル表現を取得するセマンティック表現モジュールと、
前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得するセマンティック依存表現モジュールと、
前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得する表現融合モジュールと、
各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行うラベル予測モジュールと、を含む。
トレーニングデータを取得するための取得ユニットであって、前記トレーニングデータは、テキストと、当該テキストに含まれるPOI名称とPOI状態のラベルラベリング結果とを含む取得ユニットと、
前記テキストをPOI状態識別モデルの入力とし、前記テキストに含まれるPOI名称とPOI状態のラベルラベリング結果を前記POI状態識別モデルのターゲット予測結果として、前記POI状態識別モデルをトレーニングするトレーニングユニットと、を含み、
前記POI状態識別モデルは、
前記テキスト内の各第1のセマンティック単位のベクトル表現を取得するセマンティック表現モジュールと、
前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得するセマンティック依存表現モジュールと、
前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得する表現融合モジュールと、
各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行うラベル予測モジュールと、を含む。
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサと通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行させる。
201では、トレーニングデータを取得し、トレーニングデータは、テキストと、当該テキストに含まれるPOI名称とPOI状態のラベルラベリング結果とを含む。
301では、予めトレーニングされたPOI識別器を使用してインターネットからPOI名称を含むテキストを取得する。
第1の方式:第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に、当該第1のセマンティック単位の融合ベクトルを取得する。
Tp={B-NEW、I-NEW、B-RELOCATE、I-RELOCATE、B-RENAME、I-RENAME、B-CLOSE、I-CLOSE、B-NONE、I-NONE、O}
その中、B、I、及びOは、当該文字がPOI名称の開始、中間、及び非POI名称であることを示す。
501では、インターネットから予め設定された期間内のPOI情報を含むテキストを取得する。
第1の方式:第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に、当該第1のセマンティック単位の融合ベクトルを取得する。
取得ユニット01は、トレーニングデータを取得するために用いられ、トレーニングデータは、テキストと、当該テキストに含まれるPOI名称とPOI状態のラベルラベリング結果とを含む。
セマンティック表現モジュールは、テキスト内の各第1のセマンティック単位のベクトル表現を取得するために用いられる。
第1の方式:第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に当該第1のセマンティック単位の融合ベクトル表現を取得する。
テキスト取得ユニット11は、インターネットから予め設定された期間内のPOI情報を含むテキストを取得するために用いられる。
セマンティック表現モジュールは、テキスト内の各第1のセマンティック単位のベクトル表現を取得するために用いられる。
第1の方式:第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に当該第1のセマンティック単位の融合ベクトル表現を取得する。
インターネットから最近1ヶ月以外のPOI情報を含むテキストを取得し、これらのテキストは、数が多い可能性があり、いくつかの例を示し:
インターネットテキスト1:上海大学科学技術パークと上海望源企業発展有限会社は在宝山区羅森宝ビジネスセンターに上大望源科学技術パークを開設した。
インターネットテキスト2:その前に火岩大峡谷は景勝地を申告する時、既に烏龍山大峡谷に改名した。
インターネットテキスト3:嵩明県不動産登録センターは2019年6月28日に秀嵩街66号に移転し、移転期間中は業務を一時停止した。
インターネットテキスト4:三江源の自然生態環境を保護するために、年保玉則景勝地は既に全面的に閉鎖した。
インターネットテキスト1に対応する2つ組:(上大望源科学技術パーク、新規);
インターネットテキスト2に対応する2つ組:(火岩大峡谷、改名);
インターネットテキスト3に対応する2つ組:(嵩明県不動産登録センター、移転)
インターネットテキスト4に対応する2つ組:(年保玉則景勝地、閉鎖)。
1)本開示ではPOI情報を含むインターネットテキストからPOI名称とPOI名称に対応するPOI状態情報をマイニングすることによって、POI状態変更イベントに対するインターネットのタイムリー反映を十分に使用し、状態変更が発生するPOI情報を人工的に決定する方式と比較して、人件費を節約し、時効性と精度を向上させる。
Claims (31)
- インターネットから予め設定された期間内のPOI情報を含むテキストを取得するステップと、
予めトレーニングされたPOI状態識別モデルを使用して前記テキストを識別し、前記テキスト内の2つ組を取得するステップであって、前記2つ組は、POI名称と当該POI名称に対応するPOI状態情報を含むステップと、を含み、
前記POI状態識別モデルは、前記テキスト内の各第1のセマンティック単位のベクトル表現を取得し、前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得し、前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得し、各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行う、
関心地点POI状態情報を取得する方法。 - インターネットから予め設定された期間内のPOI情報を含むテキストを取得するステップは、
インターネットから予め設定された期間内のテキストを取得するステップと、
予めトレーニングされたPOI識別器を使用して、取得されたテキストに対してPOI情報識別を行うステップと、
POI情報を含むテキストを保持するステップと、を含む、
請求項1に記載の関心地点POI状態情報を取得する方法。 - 前記POI識別器は、
POIデータベースからPOI情報を抽出し、
抽出されたPOI情報を使用してインターネットで検索し、
検索されたテキストと対応するPOI情報を使用してラベル予測モデルをトレーニングすることにより、取得される
請求項2に記載の関心地点POI状態情報を取得する方法。 - 前記テキスト内の各第1のセマンティック単位のベクトル表現を取得するステップは、
プリトレーニング言語モデルを使用して前記テキスト内の各第1のセマンティック単位に対してセマンティック特徴の抽出を行い、各第1のセマンティック単位のベクトル表現を取得するステップを含む、
請求項1に記載の関心地点POI状態情報を取得する方法。 - 前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得するステップは、
前記テキストに対して構文分析を行って前記テキストのセマンティック依存ツリーを取得するステップと、
前記セマンティック依存ツリーに対応する有向グラフを取得するステップであって、前記有向グラフ内の各ノードは、前記各第2のセマンティック単位であるステップと、
リレーショナルグラフ畳み込みニューラルネットワークRGCNを使用して前記有向グラフ内の各ノードのベクトル表現を取得するステップと、を含む、
請求項1に記載の関心地点POI状態情報を取得する方法。 - 前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得するステップは、
第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に当該第1のセマンティック単位の融合ベクトル表現を取得するステップと、又は、
各第2のセマンティック単位のベクトル表現を第1のセマンティック単位に対して注意力処理を行い、当該第1のセマンティック単位の融合ベクトル表現を取得するステップと、を含む、
請求項1に記載の関心地点POI状態情報を取得する方法。 - 前記各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行うステップは、
条件付き確率場CRFモデルを使用して各第1のセマンティック単位の融合ベクトルをマッピングし、各第1のセマンティック単位のラベルを取得するステップを含み、前記ラベルは、対応する第1のセマンティック単位がPOI名称とPOI状態であるか否かを示す、
請求項1に記載の関心地点POI状態情報を取得する方法。 - 前記第1のセマンティック単位は文字であり、前記第2のセマンティック単位は単語である、
請求項1~7のいずれか一項に記載の関心地点POI状態情報を取得する方法。 - トレーニングデータを取得するステップであって、前記トレーニングデータは、テキストと、当該テキストに含まれるPOI名称とPOI状態のラベルラベリング結果とを含むステップと、
前記テキストをPOI状態識別モデルの入力とし、前記テキストに含まれるPOI名称とPOI状態のラベルラベリング結果を前記POI状態識別モデルのターゲット予測結果として、前記POI状態識別モデルをトレーニングするステップと、を含み、
前記POI状態識別モデルは、
前記テキスト内の各第1のセマンティック単位のベクトル表現を取得し、前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得し、前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得し、各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行う、
POI状態識別モデルを確立する方法。 - トレーニングデータを取得するステップは、
シードテキストと、前記シードテキストに含まれるPOI名称と当該POI名称に対応するPOI状態のラベルラベリング結果を取得するステップと、
POIデータベースにおける前記シードテキストに含まれるPOI名称と同じタイプであるPOI名称で、前記シードテキスト内のPOI名称を置き換え、拡張テキストを取得するステップと、
前記シードテキストと前記拡張テキストから前記トレーニングデータを取得するステップと、を含む、
請求項9に記載のPOI状態識別モデルを確立する方法。 - 前記シードテキストを取得するステップは、
インターネットからPOI名称を含むテキストを取得するステップと、
POI状態変化情報を表す単語を含む予め確立された辞書を使用して前記POI名称を含むテキストからPOI状態変化情報を含まないテキストをフィルタリングし、前記シードテキストを取得するステップと、を含み、
請求項10に記載のPOI状態識別モデルを確立する方法。 - 前記テキスト内の各第1のセマンティック単位のベクトル表現を取得するステップは、
プリトレーニング言語モデルを使用して前記テキスト内の各第1のセマンティック単位に対してセマンティック特徴の抽出を行い、各第1のセマンティック単位のベクトル表現を取得するステップを含む、
請求項9に記載のPOI状態識別モデルを確立する方法。 - 前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得するステップは、
前記テキストに対して構文分析を行って前記テキストのセマンティック依存ツリーを取得するステップと、
前記セマンティック依存ツリーに対応する有向グラフを取得するステップであって、前記有向グラフ内の各ノードは、前記各第2のセマンティック単位であるステップと、
リレーショナルグラフ畳み込みニューラルネットワークRGCNを使用して前記有向グラフ内の各ノードのベクトル表現を取得するステップと、を含む、
請求項9に記載のPOI状態識別モデルを確立する方法。 - 前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得するステップは、
第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に当該第1のセマンティック単位の融合ベクトル表現を取得するステップと、又は、
各第2のセマンティック単位のベクトル表現を第1のセマンティック単位に対して注意力処理を行い、当該第1のセマンティック単位の融合ベクトル表現を取得するステップと、を含む、
請求項9に記載のPOI状態識別モデルを確立する方法。 - 前記各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行うステップは、
条件付き確率場CRFモデルを使用して各第1のセマンティック単位の融合ベクトルをマッピングし、各第1のセマンティック単位のラベルを取得するステップを含み、前記ラベルは、POI名称とPOI状態であるか否かを示す、
請求項9に記載のPOI状態識別モデルを確立する方法。 - インターネットから予め設定された期間内のPOI情報を含むテキストを取得するテキスト取得ユニットと、
予めトレーニングされたPOI状態識別モデルを使用して前記テキストを識別し、前記テキスト内の2つ組を取得する状態識別ユニットであって、前記2つ組は、POI名称と当該POI名称に対応するPOI状態情報を含む状態識別ユニットと、を含み、
前記POI状態識別モデルは、
前記テキスト内の各第1のセマンティック単位のベクトル表現を取得するセマンティック表現モジュールと、
前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得するセマンティック依存表現モジュールと、
前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得する表現融合モジュールと、
各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行うラベル予測モジュールと、を含む、
POI状態情報を取得する装置。 - 前記テキスト取得ユニットは、インターネットから予め設定された期間内のテキストを取得し、予めトレーニングされたPOI識別器を使用して、取得されたテキストに対してPOI情報識別を行い、POI情報を含むテキストを保持する、
請求項16に記載のPOI状態情報を取得する装置。 - 前記セマンティック表現モジュールは、プリトレーニング言語モデルを使用して前記テキスト内の各第1のセマンティック単位に対してセマンティック特徴の抽出を行い、各第1のセマンティック単位のベクトル表現を取得する、
請求項16に記載のPOI状態情報を取得する装置。 - 前記セマンティック依存表現モジュールは、前記テキストに対して構文分析を行って前記テキストのセマンティック依存ツリーを取得し、前記セマンティック依存ツリーに対応する有向グラフを取得し、前記有向グラフ内の各ノードは、前記各第2のセマンティック単位であり、リレーショナルグラフ畳み込みニューラルネットワークRGCNを使用して前記有向グラフ内の各ノードのベクトル表現を取得する、
請求項16に記載のPOI状態情報を取得する装置。 - 前記表現融合モジュールは、第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に当該第1のセマンティック単位の融合ベクトル表現を取得するか、又は、各第2のセマンティック単位のベクトル表現を第1のセマンティック単位に対して注意力処理を行い、当該第1のセマンティック単位の融合ベクトル表現を取得する、
請求項16に記載のPOI状態情報を取得する装置。 - 前記ラベル予測モジュールは、条件付き確率場CRFモデルを使用して各第1のセマンティック単位の融合ベクトルをマッピングし、各第1のセマンティック単位のラベルを取得し、前記ラベルは、対応する第1のセマンティック単位がPOI名称とPOI状態であるか否かを示す、
請求項16に記載のPOI状態情報を取得する装置。 - 前記第1のセマンティック単位は文字であり、前記第2のセマンティック単位は単語である、
請求項16から21のいずれか一項に記載のPOI状態情報を取得する装置。 - トレーニングデータを取得する取得ユニットであって、前記トレーニングデータは、テキストと、当該テキストに含まれるPOI名称とPOI状態のラベルラベリング結果とを含む取得ユニットと、
前記テキストをPOI状態識別モデルの入力とし、前記テキストに含まれるPOI名称とPOI状態のラベルラベリング結果を前記POI状態識別モデルのターゲット予測結果として、前記POI状態識別モデルをトレーニングするトレーニングユニットと、を含み、
前記POI状態識別モデルは、
前記テキスト内の各第1のセマンティック単位のベクトル表現を取得するセマンティック表現モジュールと、
前記テキストのセマンティック依存情報に基づいて前記テキスト内の各第2のセマンティック単位のベクトル表現を取得するセマンティック依存表現モジュールと、
前記各第1のセマンティック単位のベクトル表現と前記各第2のセマンティック単位のベクトル表現を融合処理し、前記各第1のセマンティック単位の融合ベクトル表現を取得する表現融合モジュールと、
各第1のセマンティック単位の融合ベクトル表現に基づいてPOI名称とPOI状態のラベル予測を行うラベル予測モジュールと、を含む、
POI状態識別モデルを確立する装置。 - 前記取得ユニットは、シードテキストと、前記シードテキストに含まれるPOI名称と当該POI名称に対応するPOI状態のラベルラベリング結果を取得し、POIデータベースにおける前記シードテキストに含まれるPOI名称と同じタイプであるPOI名称で、前記シードテキスト内のPOI名称を置き換え、拡張テキストを取得し、前記シードテキストと前記拡張テキストから前記トレーニングデータを取得する、
請求項23に記載のPOI状態識別モデルを確立する装置。 - 前記セマンティック表現モジュールは、プリトレーニング言語モデルを使用して前記テキスト内の各第1のセマンティック単位に対してセマンティック特徴の抽出を行い、各第1のセマンティック単位のベクトル表現を取得する、
請求項23に記載のPOI状態識別モデルを確立する装置。 - 前記セマンティック依存表現モジュールは、前記テキストに対して構文分析を行って前記テキストのセマンティック依存ツリーを取得し、前記セマンティック依存ツリーに対応する有向グラフを取得し、前記有向グラフ内の各ノードは、前記各第2のセマンティック単位であり、リレーショナルグラフ畳み込みニューラルネットワークRGCNを使用して前記有向グラフ内の各ノードのベクトル表現を取得する、
請求項23に記載のPOI状態識別モデルを確立する装置。 - 前記表現融合モジュールは、第2のセマンティック単位が第1のセマンティック単位を含む場合、当該第1のセマンティック単位のベクトル表現と当該第2のセマンティック単位のベクトル表現をスプライシングした後に当該第1のセマンティック単位の融合ベクトル表現を取得するか、又は、各第2のセマンティック単位のベクトル表現を第1のセマンティック単位に対して注意力処理を行い、当該第1のセマンティック単位の融合ベクトル表現を取得する、
請求項23に記載のPOI状態識別モデルを確立する装置。 - 前記ラベル予測モジュールは、条件付き確率場CRFモデルを使用して各第1のセマンティック単位の融合ベクトルをマッピングし、各第1のセマンティック単位のラベルを取得し、前記ラベルは、POI名称とPOI状態であるか否かを示す、
請求項23に記載のPOI状態識別モデルを確立する装置。 - 少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1から15のいずれか一つに記載の方法を実行する、
電子機器。 - コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1から15のいずれか一つに記載の方法を実行させる、
非一時的なコンピュータ読み取り可能な記憶媒体。 - プロセッサによって実行される時に請求項1から15のいずれか一つに記載の方法を実現する、
コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110199748.9 | 2021-02-22 | ||
CN202110199748.9A CN112925995B (zh) | 2021-02-22 | 2021-02-22 | 获取poi状态信息的方法及装置 |
PCT/CN2021/107381 WO2022174552A1 (zh) | 2021-02-22 | 2021-07-20 | 获取poi状态信息的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023519049A true JP2023519049A (ja) | 2023-05-10 |
JP7362998B2 JP7362998B2 (ja) | 2023-10-18 |
Family
ID=76170181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022521351A Active JP7362998B2 (ja) | 2021-02-22 | 2021-07-20 | Poi状態情報を取得する方法、及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11977574B2 (ja) |
EP (1) | EP4075303A4 (ja) |
JP (1) | JP7362998B2 (ja) |
KR (1) | KR20220120545A (ja) |
CN (1) | CN112925995B (ja) |
WO (1) | WO2022174552A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112925995B (zh) | 2021-02-22 | 2022-01-28 | 北京百度网讯科技有限公司 | 获取poi状态信息的方法及装置 |
CN113838461B (zh) * | 2021-08-20 | 2022-11-01 | 北京百度网讯科技有限公司 | 智能语音交互方法、装置、设备和计算机存储介质 |
CN113807102B (zh) * | 2021-08-20 | 2022-11-01 | 北京百度网讯科技有限公司 | 建立语义表示模型的方法、装置、设备和计算机存储介质 |
CN118016058A (zh) * | 2022-11-10 | 2024-05-10 | 脸萌有限公司 | 语音识别方法、装置及电子设备 |
CN116595992B (zh) * | 2023-07-19 | 2023-09-19 | 江西师范大学 | 一种术语及类型的二元组单步抽取方法及其模型 |
CN117093661B (zh) * | 2023-10-16 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 地图数据的处理方法、装置、电子设备以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010008142A (ja) * | 2008-06-25 | 2010-01-14 | Aisin Aw Co Ltd | 車載ナビゲーション装置 |
CN109145219A (zh) * | 2018-09-10 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
CN110851738A (zh) * | 2019-10-28 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 获取poi状态信息的方法、装置、设备和计算机存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8892355B2 (en) * | 2011-12-21 | 2014-11-18 | Telenav, Inc. | Navigation system with point of interest validation mechanism and method of operation thereof |
CN110709828A (zh) * | 2017-06-08 | 2020-01-17 | 北京嘀嘀无限科技发展有限公司 | 使用条件随机域模型确定文本属性的系统及方法 |
CN107977361B (zh) * | 2017-12-06 | 2021-05-18 | 哈尔滨工业大学深圳研究生院 | 基于深度语义信息表示的中文临床医疗实体识别方法 |
CN110020224B (zh) | 2017-12-28 | 2021-07-23 | 中国移动通信集团辽宁有限公司 | 地图兴趣点数据的关联方法、装置、设备及介质 |
US10803253B2 (en) * | 2018-06-30 | 2020-10-13 | Wipro Limited | Method and device for extracting point of interest from natural language sentences |
CN109145315B (zh) * | 2018-09-05 | 2022-03-18 | 腾讯科技(深圳)有限公司 | 文本翻译方法、装置、存储介质和计算机设备 |
CN111191107B (zh) * | 2018-10-25 | 2023-06-30 | 北京嘀嘀无限科技发展有限公司 | 使用标注模型召回兴趣点的系统和方法 |
JP6832322B2 (ja) | 2018-11-02 | 2021-02-24 | 株式会社トヨタマップマスター | 探索装置、探索方法、探索プログラムおよび記録媒体 |
CN110276023B (zh) * | 2019-06-20 | 2021-04-02 | 北京百度网讯科技有限公司 | Poi变迁事件发现方法、装置、计算设备和介质 |
CN111339774B (zh) * | 2020-02-07 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 文本的实体关系抽取方法和模型训练方法 |
US11774264B2 (en) * | 2020-02-13 | 2023-10-03 | Naver Corporation | Method and system for providing information to a user relating to a point-of-interest |
CN111444726B (zh) * | 2020-03-27 | 2024-02-09 | 河海大学常州校区 | 基于双向格子结构的长短时记忆网络的中文语义信息提取方法和装置 |
US11297466B1 (en) * | 2020-04-24 | 2022-04-05 | Allstate Insurance Company | Systems for predicting and classifying location data based on machine learning |
US11983716B2 (en) * | 2020-05-26 | 2024-05-14 | Paypal, Inc. | Evaluating user status via natural language processing and machine learning |
CN111783416B (zh) | 2020-06-08 | 2024-05-03 | 青岛科技大学 | 一种利用先验知识构建文档图像数据集的方法 |
US20210390392A1 (en) * | 2020-06-15 | 2021-12-16 | Naver Corporation | System and method for processing point-of-interest data |
CN111783461A (zh) * | 2020-06-16 | 2020-10-16 | 北京工业大学 | 一种基于句法依存关系的命名实体识别方法 |
US11720346B2 (en) * | 2020-10-02 | 2023-08-08 | International Business Machines Corporation | Semantic code retrieval using graph matching |
CN112925995B (zh) | 2021-02-22 | 2022-01-28 | 北京百度网讯科技有限公司 | 获取poi状态信息的方法及装置 |
-
2021
- 2021-02-22 CN CN202110199748.9A patent/CN112925995B/zh active Active
- 2021-07-20 US US17/754,464 patent/US11977574B2/en active Active
- 2021-07-20 EP EP21870474.0A patent/EP4075303A4/en not_active Withdrawn
- 2021-07-20 KR KR1020227011606A patent/KR20220120545A/ko not_active Application Discontinuation
- 2021-07-20 WO PCT/CN2021/107381 patent/WO2022174552A1/zh unknown
- 2021-07-20 JP JP2022521351A patent/JP7362998B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010008142A (ja) * | 2008-06-25 | 2010-01-14 | Aisin Aw Co Ltd | 車載ナビゲーション装置 |
CN109145219A (zh) * | 2018-09-10 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
CN110851738A (zh) * | 2019-10-28 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 获取poi状态信息的方法、装置、设备和计算机存储介质 |
Non-Patent Citations (1)
Title |
---|
六瀬 聡宏 外: "Twitterを用いた大規模災害時における情報提供システム", FIT2013 第12回情報科学技術フォーラム 講演論文集 第4分冊, JPN6023018301, 20 August 2013 (2013-08-20), JP, pages 651 - 652, ISSN: 0005054956 * |
Also Published As
Publication number | Publication date |
---|---|
US11977574B2 (en) | 2024-05-07 |
US20230409626A1 (en) | 2023-12-21 |
CN112925995B (zh) | 2022-01-28 |
KR20220120545A (ko) | 2022-08-30 |
CN112925995A (zh) | 2021-06-08 |
WO2022174552A1 (zh) | 2022-08-25 |
EP4075303A4 (en) | 2022-11-09 |
JP7362998B2 (ja) | 2023-10-18 |
EP4075303A1 (en) | 2022-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7362998B2 (ja) | Poi状態情報を取得する方法、及び装置 | |
US11709999B2 (en) | Method and apparatus for acquiring POI state information, device and computer storage medium | |
CN112329467B (zh) | 地址识别方法、装置、电子设备以及存储介质 | |
CN107210035B (zh) | 语言理解系统和方法的生成 | |
JP7283009B2 (ja) | 対話理解モデルの訓練方法、装置、デバイス及び記憶媒体 | |
WO2021232724A1 (zh) | 提取地理位置点空间关系的方法、训练提取模型的方法及装置 | |
CN112507715A (zh) | 确定实体之间关联关系的方法、装置、设备和存储介质 | |
CN108363698A (zh) | 兴趣点关系识别方法及装置 | |
JP2009037603A (ja) | クエリー要件展開器およびクエリー要件展開方法 | |
KR102593171B1 (ko) | 정보 처리 방법, 장치, 전자 기기 및 저장 매체 | |
CN111274358A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
US20130232147A1 (en) | Generating a taxonomy from unstructured information | |
WO2021212826A1 (zh) | 用于检索地理位置的相似度模型建立方法和装置 | |
WO2021212827A1 (zh) | 检索地理位置的方法、装置、设备和计算机存储介质 | |
JP2022091122A (ja) | 汎化処理方法、装置、デバイス、コンピュータ記憶媒体及びプログラム | |
CN115017425A (zh) | 地点检索方法、装置、电子设备以及存储介质 | |
CN112000929A (zh) | 一种跨平台数据分析方法、系统、设备及可读存储介质 | |
CN113807102B (zh) | 建立语义表示模型的方法、装置、设备和计算机存储介质 | |
CN117010398A (zh) | 一种基于多层知识感知的地址实体识别方法 | |
Mehta et al. | Natural Language processing approach and geospatial clustering to explore the unexplored geotags using media | |
Qiu et al. | Integrating NLP and Ontology Matching into a Unified System for Automated Information Extraction from Geological Hazard Reports | |
CN108959555B (zh) | 查询式的扩展方法、装置、计算机设备及存储介质 | |
Wang et al. | Construction of bilingual knowledge graph based on meteorological simulation | |
Chen et al. | Construction Methods of Knowledge Mapping for Full Service Power Data Semantic Search System | |
CN112905884B (zh) | 生成序列标注模型的方法、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230912 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7362998 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |