JP2023510665A - リスク予測モデルの確立方法、領域リスク予測方法、及び対応装置 - Google Patents

リスク予測モデルの確立方法、領域リスク予測方法、及び対応装置 Download PDF

Info

Publication number
JP2023510665A
JP2023510665A JP2021576944A JP2021576944A JP2023510665A JP 2023510665 A JP2023510665 A JP 2023510665A JP 2021576944 A JP2021576944 A JP 2021576944A JP 2021576944 A JP2021576944 A JP 2021576944A JP 2023510665 A JP2023510665 A JP 2023510665A
Authority
JP
Japan
Prior art keywords
region
network
sample
risk
risk prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021576944A
Other languages
English (en)
Other versions
JPWO2022134480A5 (ja
Inventor
フアン、ジジョウ
チョウ、ジンボ
ズオ、アン
リウ、ジ
ション、ハオイ
ドウ、デジン
ワン、ハイフェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2023510665A publication Critical patent/JP2023510665A/ja
Publication of JPWO2022134480A5 publication Critical patent/JPWO2022134480A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/90Services for handling of emergency or hazardous situations, e.g. earthquake and tsunami warning systems [ETWS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Emergency Management (AREA)
  • Environmental & Geological Engineering (AREA)

Abstract

Figure 2023510665000001
本開示は、人工知能技術の分野でのビッグデータ技術に関するリスク予測モデルの確立方法、領域リスク予測方法、及び対応装置を開示する。具体的な実現方案は、各サンプル領域のリスクレベルと所属地域リスクレベルのラベリング結果を含むトレーニングデータを取得し、トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に符号化ネットワークと分類ネットワークを使用してリスク予測モデルを取得し、符号化ネットワークは、サンプル領域の領域特徴を使用して符号化して各サンプル領域の特徴表現を取得し、判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、トレーニングターゲットは、判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む。
【選択図】図1

Description

[優先権情報]
本開示は、出願日が2020年12月21日であり、出願番号が2020115159533であり、発明の名称が「リスク予測モデルの確立方法、領域リスク予測方法、及び対応装置」である中国特許開示の優先権を主張する。
本開示は、コンピュータアプリケーション技術の分野に関し、特に、人工知能技術の分野のビッグデータ技術に関する。
疫病の伝播、生物災害、気象災害などの突発的な公共事件は、人々の生産、生活、又は安全にすべて大きい影響を及ぼす。領域リスクをタイムリー且つ正確に予測する場合、事件危害の拡大を効果的に防止し、適切な予防措置を講じることができ、大きな意義がある。
本開示は、領域リスク予測の実現を容易にするためにリスク予測モデルの確立方法、領域リスク予測方法、及び対応装置を提供する。
本開示の第1の態様によれば、リスク予測モデルの確立方法を提供し、
サンプル領域セットと、前記サンプル領域セットにおける各サンプル領域のリスクレベルと各サンプル領域が属する地域のリスクレベルのラベリング結果を含むトレーニングデータを取得するステップと、
前記トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に前記初期モデル内の符号化ネットワークと分類ネットワークを使用して前記リスク予測モデルを取得するステップと、を含み、
前記符号化ネットワークは、サンプル領域の領域特徴を使用して、符号化して各サンプル領域の特徴表現を取得し、前記判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、前記分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、前記初期モデルのトレーニングターゲットは、前記判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、前記分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む。
本開示の第2の態様によれば、領域リスク予測方法を提供し、
ターゲットセルの領域特徴を抽出するステップと、
前記領域特徴をリスク予測モデルに入力し、前記リスク予測モデルによって出力された結果に基づいて前記ターゲット領域のリスクレベルを決定するステップと、を含み、
前記リスク予測モデルは、上記の方法を使用して予め確立される。
本開示の第3の態様によれば、リスク予測モデルの確立装置を提供し、
サンプル領域セットと、前記サンプル領域セットにおける各サンプル領域のリスクレベルと各サンプル領域が属する地域のリスクレベルのラベリング結果を含むトレーニングデータを取得するためのデータ取得ユニットと、
前記トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に前記初期モデル内の符号化ネットワークと分類ネットワークを使用して前記リスク予測モデルを取得するためのモデルトレーニングユニットと、を含み、
前記符号化ネットワークは、サンプル領域の領域特徴を使用して、符号化して各サンプル領域の特徴表現を取得し、前記判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、前記分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、前記初期モデルのトレーニングターゲットは、前記判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、前記分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む。
本開示の第4の態様によれば、領域リスク予測装置を提供し、
ターゲットセルの領域特徴を抽出するための特徴抽出ユニットと、
前記領域特徴をリスク予測モデルに入力し、前記リスク予測モデルによって出力された結果に基づいて前記ターゲット領域のリスクレベルを決定するためのリスク予測ユニットと、を含み、
前記リスク予測モデルは、上記の装置によって予め確立される。
本開示の第5の態様によれば、電子機器を提供し、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが上記の方法を実行する。
本開示の第6の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ命令は、前記コンピュータに上記の方法を実行させる。
本開示の第7の態様によれば、コンピュータプログラム製品を提供し、コンピュータプログラムを含み、前記コンピュータプログラムがプロセッサによって実行される時に上記の方法を実現する。
上記の技術的解決策から分かるように、本開示は、リスク予測モデルの確立方法を提供し、当該確立されたリスク予測モデルに基づいてターゲット領域に対するリスク予測を実現することができ、事件危害の拡大を効果的に防止することができ、適切な予防措置を講じることができる。
本明細書で説明された内容は、本開示の実施例の肝心なまたは重要な特徴を特定することを意図しておらず、本開示の範囲を制限するためにも使用されないことを理解されたい。本開示の他の特徴は、以下の明細書を通じて容易に理解できる。
図面は、本開示をより良く理解するためのものであり、本開示を限定しない。
本開示の実施例により提供されるリスク予測モデルの確立方法のフローチャートである。 本開示の実施例により提供されるトレーニング初期モデルの概略構造図である。 本開示の実施例により提供されるリスク予測モデルの概略構造図である。 本開示の実施例により提供される領域リスク予測方法である。 本開示により提供されるリスク予測モデルの確立装置の構造図である。 本開示により提供される領域リスク予測装置の構造図である。 本開示の実施例を実現するための電子機器のブロック図である。
以下、図面に基づいて、本開示の例示の実施例を説明する。理解を容易にするために、本開示の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本開示の範囲及びび精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及びび修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
現在、疫病などの突発的な公共事件に対する従来のリスク予測方式では、感染されたユーザの時間および空間分布、伝染病の伝播速度、伝播経路などを使用して予測する伝染病モデルなどが主に使用される。このようなモデルは疫病に対して十分な理解と正確な状況の把握を必要とし、十分な専門知識の背景が必要である。しかし、多くの場合疫病の伝播は突発的であり、発症はヒステリシスを有し(例えば、潜伏期間を有し、潜伏期間内の患者に典型的な的な症状は現れない)、リスク予測の正確性が不足する可能性がある。また、このような伝染病モデルは、通常、既に疫病が伝播した地域に対して予測能力を有するが、まだ疫病が発生していない地域については予測できない。
本開示により提供されるリスク予測モデルを確立する方式では、異なるリスクレベル地域の領域の特徴と異なるリスクレベル領域の自体の特徴を学習することによって、これらの特徴に基づいて未知のリスク状況の領域に対してリスクレベルの予測を行うことを実現することができる。以下は実施例を組み合わせて本開示により提供される方式を詳細に説明する。
図1は本開示の実施例により提供されるリスク予測モデルの確立方法のフローチャートである。図1に示すように、当該方法は、以下のようなステップを含むことができる。
101では、トレーニングデータを取得し、トレーニングデータは、サンプル領域セットと、サンプル領域セットにおける各サンプル領域のリスクレベルと各サンプル領域が属する地域のリスクレベルのラベリング結果を含む。
本開示では各リスクレベル地域における各リスクレベル領域をサンプルとして予め収集することができる。その中、地域の範囲は領域の範囲より大きい。例えば、地域は、1つの省、1つの都市、1つの行政区などであってもよい。領域は、1つのセル、1つの街路、1つの学校、1つの建物、1つの工場などであってもよい。
地域のリスクレベルは、高リスク、低リスクなどの2種類に分類することができ、高リスク、中リスク、低リスク、無リスクなどの複数種類に分類することもできる。領域のリスクレベルは、高リスク、低リスクなどの2種類に分類することもでき、高リスク、中リスク、低リスク、無リスクなどの複数種類に分類することもできる。具体的な分類する方式と分類する粒度は、本開示では限定しない。
トレーニングデータでは、各サンプル領域の前記地域のリスクレベルと、各サンプル領域のリスクレベルを予めラベリングして、後続のモデルトレーニングプロセスで使用することができる。
102では、トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に初期モデル内の符号化ネットワークと分類ネットワークを使用してリスク予測モデルを取得する。
符号化ネットワークはサンプル領域から抽出された領域特徴を使用して、各サンプル領域の特徴表現を符号化して取得し、判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、初期モデルのトレーニングターゲットは、判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む。
上記の技術的解決策から分かるように、本開示はリスク予測モデルの確立方法を提供し、当該確立されたリスク予測モデルに基づいてターゲット領域に対するリスク予測を実現することができ、事件危害の拡大を効果的に防止することができ、適切な予防措置を講じることができる。
以下は実施例を組み合わせて上記の実施例の各ステップを詳細に説明する。また、本開示により提供される方式が疫病リスク予測に好適に適用できるため、後続の実施例では、疫病リスク予測を例として説明する。
上記のステップ101では、予めに都市を高リスク都市と低リスク都市の2種類として分類したと仮定すると、既知の高リスク都市からいくつかの高リスクセルと低リスクセルをそれぞれ選択し、既知の低リスク都市からいくつかの低リスクセル(通常、低リスク都市には高リスクセルがない)をそれぞれ選択する。具体的な分類する方式は、都市及びセルにおける疫病の感染及び伝播状況で決定される。選択されたこれらのセルをサンプル領域セットとして構成し、これらのセルに対して前記都市のリスクレベルとセルリスクレベルをそれぞれラベリングして、トレーニングデータを構成する。
さらに、トレーニングデータ内の各セルに対して領域特徴をそれぞれ抽出することができる。本開示で抽出された領域特徴は、周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴のうちの少なくとも1つを含むことができる。従来の伝染病モデルとは異なり、本開示で使用されるこれらの領域特徴は、確認された症例と関係ないため、前期経験のない疫病未爆発都市は、同様にセルリスクの予測を行うことができる。以下はこれらの特徴についてそれぞれ詳細に説明する。
周辺の予め設定されたタイプのPOI特徴:
1つのセル周囲の生活施設は、通常、当該セルが疫病の影響を受ける確率と関係がある。例えば、1つのセルが基本的な生活施設が不足すると高リスクに直面する可能性があり、住民はより多くの地方に行って生活必需品を手に入れると、路上で感染する可能性が存在する。基本的な生活施設が不足するセルは、通常、良好な管理が不足し、同様に感染されるリスクが高くなる。
以上の考慮に基づいて、1つのセル周辺の予め設定されたタイプのPOI特徴は、以下の2種類を含むことができるが、限定しない。
第1:セルと最寄りの予め設定されたタイプPOIの距離情報。本開示では、病院、診療所、学校、学前教育機関、バス停留所、地下鉄駅、空港、鉄道駅、長距離バスターミナル、ショッピングモール、スーパーマーケット、市場、商店、警察署、観光地などの1つ以上のタイプのPOIを予め設置することができる。特徴は、セルと最寄りの病院との距離、最寄りの診療所との距離、最寄りの学校との距離などを使用して特徴付けることができる。
第2:セル予め設定された距離範囲内の生活施設の完備の程度。本開示では、例えば、1キロメートル以内の生活施設の完備の程度をその中の1つの特徴として使用することができる。すなわち1キロメートル以内に病院、バス停留所、スーパーマーケット、ショッピングモール、市場などがある状況を使用して測定することができる。例えば、1で完備の程度が最も高くことを示し、0で完備の程度が最も低いことを示す。
人口統計学特徴:
疫病は、通常、人から人への方式で伝播するため、人口密度を考慮してリスク予測を行う必要がある。通常、人口密度が高いセルは、人口密度が低いセルより感染リスクが高い。従って、人口密度をその中の1つの人口統計学特徴とすることができる。
また、異なる通勤距離は、疫病のリスクにも一定の影響があるため、セルの通勤距離分布をその中の1つの人口統計学特徴とすることができる。その中の1つの実現方式として、セルの平均通勤距離を使用して特徴付けることができる。通勤距離は、通勤の距離を指すことができ、通学の距離などを指すこともできる。
異なる群体は、通常、疫病に直面する時に感染される確率も異なり、例えば、年齢の大きい人及び年齢が小さい人は、通常、抵抗力が弱いため感染しやすい。例えば、教育レベル高い人は、リスクに対する理解及び防犯の程度も高いため、従って、感染される確率が比較的低くなるなどである。この考えに基づいて、年齢分布、性別分布、収入分布、消費能力分布、教育レベル分布、結婚状況分布、生活段階分布、就業タイプ分布、業界タイプ分布などのうちの少なくとも1つを人口統計学特徴として選択することができる。
ユーザ出行特徴:
いくつかの関連研究によると、ユーザ出行行為は、通常、疫病伝播に密接な関係があることが証明されている。本開示に係るユーザ出行特徴は、以下のうちの少なくとも1つを含むことができるが、限定せず、
第1:出行方式。例えば、歩行、自転車、公共交通、自家用車など出行方式を予め定義することができる。
第2:出発地-目的地モード分布。目的地のタイプと、出発地から目的地までの距離などの情報を含むことができる。目的地を病院、レストラン、ホテル、学校などのタイプに予め分類することができ、距離バレルを予め定義することができ、例えば、3KM以内、3km~10km、10km~20kmなどの複数の距離バレルであり、出発地から目的地までの距離を対応する距離バレルにマッピングして、それを特徴とすることができる。
第3:出発地-出行方式-目的地モード分布。その中、出発地は本セルを指し、出行方式と目的地タイプは、予め定義することができ、次に、本セルの出行方式と目的地タイプで構成される組み合わせのうち、上位N個の組み合わせを特徴として統計する。Nは予め設定された正の整数であり、例えば、20を選択する。
分かるように、上記の特徴は、任意の場合でもすべて比較的に容易に取得され、セルのようない細かい粒度に1つの領域の社会経済状況と空間相互活動の特徴を反映し、細かい粒度の高リスク領域認識を実現し、社会コストを削減することができる。
以下は、実施例を組み合わせて上記のステップ102を詳細に説明する。まず、トレーニングプロセスで使用される初期モデルの構造を説明する。図2に示すように、当該初期モデルは、符号化ネットワーク(Encoder)、判別ネットワーク(Discriminator)、及び分類ネットワーク(Classifier)を含むことができ、復号ネットワーク(Decoder)をさらに含むことができる。
サンプルセルから抽出された領域特徴を符号化ネットワークの入力とし、実際のトレーニングプロセスでは異なるリスクレベル都市に属するサンプルセルを使用するため、本実施例では、高リスク都市のサンプルセルと低リスク都市のサンプルセルを例とする。n 、n 、及びn は、高リスク都市のサンプルセルの周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴をそれぞれ示し、n 、n 、及びn は、低リスク都市のサンプルセルの周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴をそれぞれ示す。n 、n 、及びn に対してスプライシングなどの融合方式を行った後、高リスク都市のサンプルセルの特徴nを取得する。n 、n 、及びn に対してスプライシングなどの融合方式を行った後、低リスク都市のサンプルセルの特徴nを取得する。
を符号化ネットワークの入力とし、符号化ネットワークを介して符号化した後に当該高リスク都市サンプルセルの特徴表現
Figure 2023510665000002
を取得する。同様に、nを符号化ネットワークの入力とし、符号化ネットワークを介して符号化した後に当該低リスク都市サンプルセルの特徴表現
Figure 2023510665000003
を取得する。符号化ネットワークは、入力の特徴ベクトルを変換した後、新しい確率分布を取得するのと見なすことができる。
一般的に、既に大規模に爆発した都市(すなわち高リスク都市)から経験を学習することを希望する場合、これらの経験は、都市独自の特徴ではなく、異なる都市間で一定の共通性を持つ必要がある。これらの共通性の特徴をどのように学習することは、モデルトレーニングプロセスにおいて1つの非常に重要な問題である。本開示では、判別モデルをトレーニングすることによって当該問題を解決する。
判別モデルの機能は、入力の
Figure 2023510665000004
に基づいて当該特徴表現が出所する都市リスクレベルを判別し、入力の
Figure 2023510665000005
に基づいて当該特徴表現が出所する都市リスクレベルを判別する。トレーニングプロセスにおいて1つの重要なトレーニングターゲットは、符号化ネットワークを介して符号化した後、取得された特徴表現によってできる限り判別モデルが出所する都市を区別できないようにすることができ、すなわち判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化する。このようにして、符号化ネットワークが都市間の共通性の特徴を学習することができる。当該トレーニングターゲットに基づいて損失関数を構築することができ、第2の損失関数Lと呼ばれ、例えば、以下の内容を使用することができ、
Figure 2023510665000006
その中、D()は、判別モデルの認識結果を示す。
さらに、学習都市間の共通性特徴以外に、判別モデルは、依然として、自体の機能、すなわち出所する都市リスクレベルを認識することを確保する必要がある。従って、対抗学習の方式を使用して、第1の損失関数Lと呼ばれる1つの損失関数を再構築することができ、当該損失関数は、判別モデルをトレーニングして、判別ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられる。例えば、以下の内容を使用することができ、
Figure 2023510665000007
対抗学習のプロセスにおいて、判別ネットワーク在Lの影響下で
Figure 2023510665000008
が出所する都市リスクレベルどのように区別することの学習を続けると、Lが上昇することになる。さらに、符号化ネットワークは、Lの影響下で共通性特徴をできるだけ学習してLを低減すると、符号化ネットワークと判別ネットワークが学習プロセス中で絶えず対抗し、最終的にバランスを達成する。この時、判別ネットワークは、高リスク都市と低リスク都市内のサンプルセルを区別できず、符号化ネットワークは、高リスク都市のサンプルセルと低リスク都市のサンプルセルとの間の共通性特徴を学習する。
上記の学習方式で高リスク都市のサンプルセルと低リスク都市のサンプルセルとの間の共通性特徴を学習できるが、サンプルセルの特徴を学習してセルリスクレベルの認識を指導することができない。従って、初期モデルでは、分類ネットワークを介してこれを認識する。
分類ネットワークは
Figure 2023510665000009
に基づいてサンプルセルに対応するリスクレベルを認識する。トレーニングターゲットは、分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化する。このようにして、損失関数を構築することができる、すなわち第3の損失関数Lである。例えば、以下の内容を使用することができ、
Figure 2023510665000010
その中、yは、ラベリング結果を示し、
Figure 2023510665000011
は、分類ネットワークが
Figure 2023510665000012
に対する認識結果を示す。
当該損失関数を使用して符号化ネットワークと分類ネットワークを最適化して、符号化ネットワークが都市間の共通性特徴を学習した上で、認識セルリスクレベルを指導できる特徴をさらに学習する。分類ネットワークがセルリスク認識レベルに対する認識能力を学習することを指導する。なお、上記の分類ネットワークは、二分類を例として説明するが、実際のモデルでは多分類の分類ネットワークを使用することもできる。
さらに、符号化ネットワークがセル特性の特徴を可能な限り学習するようにするために、本開示では、符号化ネットワーク-復号ネットワークのフレームワークを増加して特徴再構築を行う。
符号化ネットワークの役割は、入力したサンプルセルの特徴表現を使用して領域特徴を再構築する。すなわちnを再構築してベクトル表示
Figure 2023510665000013
を取得し、次元はnと一致する。nを再構築してベクトル表示
Figure 2023510665000014
を取得し、次元はnと一致する。符号化ネットワークの最適なターゲットは、元のベクトル表示を復元し、すなわち再構築して取得された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化する。これにより、第4の損失関数Lを構築することができる。例えば、以下の内容を使用することができ、
Figure 2023510665000015
を使用して符号化ネットワークと復号ネットワークを最適化して、符号化ネットワークが学習した特徴表現は、依然として1つのセル特性を説明する能力を有する。
要約すると、好ましい実施方式として、初期モデルをトレーニングするプロセスにおいて、上記の4つの損失関数を使用してモデルパラメータの最適化更新を行う。具体的には、各ラウンドの反復プロセスにおいて、Lを使用して判別ネットワークのパラメータを最適化して更新し、L、L、及びLを使用して符号化ネットワークのパラメータを最適化して更新し、L及びLを使用して分類ネットワークと復号ネットワークのパラメータをそれぞれ最適化して更新する。
初期モデルトレーニングが終了した後、例えば、モデルが収束したり、または予め設定された反復回数などの条件に達した後、トレーニングされた符号化ネットワークと分類ネットワークによってリスク予測モデルを取得する。つまり、図3に示すように、トレーニングプロセスにおいて判別ネットワークと、復号ネットワークを使用して補助トレーニングを行うが、実際の取得されたリスク予測モデルでは符号化ネットワークと分類ネットワークのみを使用する。
図4は本開示の実施例により提供される領域リスク予測方法である。当該方法は、上記の既に確立されたリスク予測モデルに基づいて実現する。図4に示すように、当該方法は、以下のようなステップを含み、
401では、ターゲットセルの領域特徴を取得する。
本ステップにおいて領域特徴を抽出する方式は、トレーニングリスク予測モデルプロセスで使用される領域特徴と一致する。同様に周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴のうちの少なくとも1つを含むことができる。具体的な領域特徴の内容は、図1に示す実施例の関連説明を参照し、ここで詳細に説明しない。
402では、領域特徴をリスク予測モデルに入力し、リスク予測モデルによって出力された結果に基づいてターゲット領域のリスクレベルを決定する。
図3に示すように、n 、n 、及びn を高リスク都市のサンプルセルの周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴としてそれぞれ示す。n 、n 、及びn に対してスプライシングなどの融合方式を行った後、ターゲットセルの特徴nを取得する。
を符号化ネットワークの入力とし、符号化ネットワークを介して符号化した後に当該ターゲットセルの特徴表現
Figure 2023510665000016
を取得する。分類ネットワークは、
Figure 2023510665000017
に基づいてサンプルセルに対応するリスクレベルを認識する。
上記のターゲット領域のリスクレベルの予測プロセスにおいて、当該ターゲット領域に属する地域情報が不要であるのは、地域に関係ないリスクレベル予測であるのを分かることができる。
本開示に適用される1つの典型的な応用シナリオとして、疫病伝播の領域リスクレベル予測を行うことに用いられることができる。本方案は、疫病が大規模に爆発していない地域においても潜在的な高リスク領域を認識することができ、疫病の予防と制御に対して重要な指導意義がある。
以上は、本開示により提供される方法を詳細に説明し、以下は実施例を組み合わせて本開示により提供される装置を詳細に説明する。
図5は本開示により提供されるリスク予測モデルの確立装置の構造図である。当該装置は、サーバ側のアプリケーションに位置するか、またはサーバ側のアプリケーション内のプラグインまたはソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットに位置することもできるか、または、強い計算能力を有するコンピュータ端末に位置することもでき、本発明の実施例はこれについて特に限定しない。図5に示すように、当該装置500は、データ取得ユニット501とモデルトレーニングユニット502を含むことができ、特徴抽出ユニット503をさらに含むことができる。各構成ユニットの主な機能は、以下のようである。
データ取得ユニット501は、トレーニングデータを取得するために用いられ、トレーニングデータは、サンプル領域セットと、サンプル領域セットにおける各サンプル領域のリスクレベルと各サンプル領域が属する地域のリスクレベルのラベリング結果を含む。
モデルトレーニングユニット502は、トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に初期モデル内の符号化ネットワークと分類ネットワークを使用してリスク予測モデルを取得するために用いられる。
符号化ネットワークは、サンプル領域の領域特徴を使用して、各サンプル領域の特徴表現を符号化して取得し、判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、初期モデルのトレーニングターゲットは、判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む。
特徴抽出ユニット503は、周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴のうちの少なくとも1つを含むサンプル領域の領域特徴を取得するために用いられる。
周辺の予め設定されたタイプのPOI特徴は、サンプル領域と最寄りの予め設定されたタイプPOIとの距離情報と、サンプル領域の予め設定された距離範囲内の生活施設の完備の程度のうちの少なくとも1つを含む。
人口統計学特徴は、人口密度状況、通勤距離分布、年齢分布、性別分布、収入分布、消費能力分布、教育レベル分布、結婚状況分布、生活段階分布、就業タイプ分布、及び業界タイプ分布のうちの少なくとも1つを含む。
ユーザ出行特徴は、出行方式、出発地-目的地モード分布、出発地-出行方式-目的地モード分布のうちの少なくとも1つを含む。
好ましい実施方式として、上記の初期モデルは、復号ネットワークをさらに含むことができる。復号ネットワークは、サンプル領域の特徴表現に基づいて領域特徴を再構築し、トレーニングターゲットは、復号ネットワークによって再構築された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化することをさらに含む。
好ましい実施方式として、モデルトレーニングユニット502が初期モデルをトレーニングするプロセスにおいて、第1の損失関数を使用して判別ネットワークのパラメータを最適化し、第2の損失関数、第3の損失関数、及び第4の損失関数を使用して符号化ネットワークのパラメータを最適化し、第3の損失関数を使用して分類ネットワークのパラメータを最適化し、第4の損失関数を使用して復号ネットワークのパラメータを最適化する。
第1の損失関数は、判別ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられる。
第2の損失関数は、判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化するために用いられる。
第3の損失関数は、分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられる。
第4の損失関数は、復号ネットワークによって再構築された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化するために用いられる。
図6は本開示により提供される領域リスク予測装置の構造図である。当該装置は、サーバ側のアプリケーションに位置するか、またはサーバ側のアプリケーション内のプラグインまたはソフトウェア開発キット(Software Development Kit、SDK)などの機能ユニットに位置することもできるか、または、強い計算能力を有するコンピュータ端末に位置することもでき、本発明の実施例はこれについて特に限定しない。図6に示すように、当該装置600は、特徴抽出ユニット601とリスク予測ユニット602を含むことができる。各構成ユニットの主な機能は、以下のようである。
特徴抽出ユニット601は、ターゲットセルの領域特徴を抽出するために用いられる。
リスク予測ユニット602は、領域特徴をリスク予測モデルに入力し、リスク予測モデルによって出力された結果に基づいてターゲット領域のリスクレベルを決定するために用いられる。
リスク予測モデルは、図5に示す装置によって予め確立される。
典型的な応用シナリオとして、上記の領域リスク予測装置によって予測された領域リスクレベルは疫病伝播のリスクレベルである。
本開示の各実施例は、すべて漸進的な方式を使用して説明し、各実施例間の同じと類似する部分は、互いに参照すればよく、各実施例で重点的説明するのは、他の実施例と異なるところである。特に、装置の実施例については、基本的に方法の実施例と類似するため、説明が比較的に簡単であり、関連点は、方法の実施例の部分の説明を参照すればよい。
なお、本開示は、疫病伝播のリスクレベル予測などの典型的な応用シナリオに適用することができるが、この応用シナリオ以外、本開示のアイデアの範囲内に他のシナリオに合理的に拡張して適用することもできる。他の応用シナリオに適用する場合、対応する抽出された領域特徴は、異なることになる。
本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラム製品をさらに提供する。
図7に示すように、本開示の実施例に係る電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータなどの様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス、他の同様の計算デバイスなどの様々な形式のモバイルデバイスを表すこともできる。本明細書で示されるコンポーネント、それらの接続と関係、及びそれらの機能は単なる例であり、本明細書の説明及び/又は要求される本開示の実現を制限することを意図したものではない。
図7に示すように、機器700は計算ユニット701を含み、計算ユニット701は、読み取り専用メモリ(ROM)702に記憶されているコンピュータプログラムまたは記憶ユニット708からランダムアクセスメモリ(RAM)703にロードされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行することができる。RAM703には、機器700が動作するに必要な様々なプログラムとデータも記憶することができる。計算ユニット701、ROM702、およびRAM703は、バス704を介してお互いに接続される。入出力(I/O)インターフェース705もバス704に接続される。
機器700内の複数のコンポーネントは、I/Oインターフェース705に接続されており、キーボード、マウスなどの入力ユニット706と、様々なタイプのディスプレイ、スピーカなどの出力ユニット707と、ディスク、光ディスクなどの記憶ユニット708と、およびネットワークカード、モデム、無線通信トランシーバなどの通信ユニット709と、を含む。通信ユニット709は、機器700が、インターネットなどのコンピュータネットワーク、および/または様々な電気通信ネットワークを介して他の機器と情報/データを交換することを可能にする。
計算ユニット701は、様々な処理と計算能力を備える汎用および/または専用の処理コンポーネントである。計算ユニット701のいくつかの例は、中央処理装置(CPU)、グラフィックス処理ユニット(GPU)、様々な専用の人工知能(AI)計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、デジタル信号プロセッサ(DSP)、および任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。計算ユニット701は、リスク予測モデルの確立方法または領域リスク予測方法などの上記の様々な方法と処理を実行する。例えば、いくつかの実施例では、リスク予測モデルの確立方法または領域リスク予測方法は、記憶ユニット708などの機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウェアプログラムとして実現することができる。
いくつかの実施例では、コンピュータプログラムの一部または全部は、ROM702および/または通信ユニット709を介して機器700にロードおよび/またはインストールされる。コンピュータプログラムがRAM703にロードされて計算ユニット701によって実行される場合、上記のリスク予測モデルの確立方法または領域リスク予測方法の一つまたは複数のステップを実行することができる。代替的に、他の実施例では、計算ユニット701は、他の任意の適切な方式(例えば、ファームウェアによって)を介してリスク予測モデルの確立方法または領域リスク予測方法を実行するように構成されることができる。
本明細書で説明されるシステムと技術の様々な実施方式は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、特定用途向け標準製品(ASSP)、システムオンチップシステム(SOC)、ロードプログラマブルロジックデバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせで実現することができる。これらの様々な実施方式は、一つ又は複数のコンピュータプログラムで実施されることを含むことができ、当該一つ又は複数のコンピュータプログラムは、少なくとも一つのプログラマブルプロセッサを含むプログラム可能なシステムで実行及び/又は解釈されることができ、当該プログラマブルプロセッサは、特定用途向け又は汎用プログラマブルプロセッサであってもよく、ストレージシステム、少なくとも一つの入力装置、及び少なくとも一つの出力装置からデータ及び命令を受信し、データ及び命令を当該ストレージシステム、当該少なくとも一つの入力装置、及び当該少なくとも一つの出力装置に伝送することができる。
本開示の方法を実施するためのプログラムコードは、一つまたは複数のプログラミング言語の任意の組み合わせを使用して作成することができる。これらのプログラムコードは、プログラムコードがプロセッサまたはコントローラ30によって実行される時にフローチャートおよび/またはブロック図に規定された機能/動作が実施されるように、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサまたはコントローラに提供することができる。プログラムコードは、完全に機械上で実行されたり、部分的に機械上で実行されたり、独立したソフトウェアパッケージとして部分的に機械上で実行され、部分的にリモート機械上実行されたり、または完全にリモート機械またはサーバ上で実行されたりすることができる。
本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置、または機器の使用、または命令実行システム、装置または機器と組み合わせて使用するプログラムを含むか、または記憶することができる有形の媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体または機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁気、赤外線、または半導体システム、装置または機器、または上記の内容の任意の適切な組み合わせを含むが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、一つまたは複数のワイヤに基づく電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM またはフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み取り専用メモリ(CD-ROM)、光学記憶装置、磁気記憶装置、または上記の内容の任意の適切な組み合わせを含む。
ユーザとのインタラクションを提供するために、コンピュータ上でここで説明されているシステム及び技術を実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウス又はトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置は、ユーザとのインタラクションを提供するために用いられることもでき、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバー)、又はフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータ、ユーザは、当該グラフィカルユーザインタフェース又は当該ウェブブラウザによってここで説明されるシステム及び技術の実施方式とインタラクションする)、又はこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを相互に接続されることができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)と、インターネットと、ブロックチェーンネットワークと、を含む。
コンピュータシステムは、クライアントとサーバとを含むことができる。クライアントとサーバは、一般に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータ上で実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。
上記に示される様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除することができることを理解されたい。例えば、本開示に記載されている各ステップは、並列に実行されてもよいし、順次的に実行されてもよいし、異なる順序で実行されてもよいが、本開示で開示されている技術案が所望の結果を実現することができれば、本明細書では限定されない。
上記の具体的な実施方式は、本開示に対する保護範囲の制限を構成するものではない。当業者は、設計要求と他の要因に基づいて、様々な修正、組み合わせ、サブコンビネーション、及び代替を行うことができる。任意の本開示の精神と原則内で行われる修正、同等の置換、及び改善などは、いずれも本開示の保護範囲内に含まれなければならない。

Claims (20)

  1. リスク予測モデルの確立方法であって、
    サンプル領域セットと、前記サンプル領域セットにおける各サンプル領域のリスクレベルと各サンプル領域が属する地域のリスクレベルのラベリング結果を含むトレーニングデータを取得するステップと、
    前記トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に前記初期モデル内の符号化ネットワークと分類ネットワークを使用して前記リスク予測モデルを取得するステップと、を含み、
    前記符号化ネットワークは、サンプル領域の領域特徴を使用して、符号化して各サンプル領域の特徴表現を取得し、前記判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、前記分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、前記初期モデルのトレーニングターゲットは、前記判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、前記分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む、
    リスク予測モデルの確立方法。
  2. 前記サンプル領域の領域特徴は、
    周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴のうちの少なくとも1つを含む、
    請求項1に記載のリスク予測モデルの確立方法。
  3. 前記周辺の予め設定されたタイプのPOI特徴は、サンプル領域と最寄りの予め設定されたタイプPOIとの距離情報と、サンプル領域の予め設定された距離範囲内の生活施設の完備の程度のうちの少なくとも1つを含み、
    前記人口統計学特徴は、人口密度状況、通勤距離分布、年齢分布、性別分布、収入分布、消費能力分布、教育レベル分布、結婚状況分布、生活段階分布、就業タイプ分布、及び業界タイプ分布のうちの少なくとも1つを含み、
    前記ユーザ出行特徴は、出行方式、出発地-目的地モード分布、出発地-出行方式-目的地モード分布のうちの少なくとも1つを含む、
    請求項2に記載のリスク予測モデルの確立方法。
  4. 前記初期モデルは、復号ネットワークをさらに含み、
    前記復号ネットワークは、サンプル領域の特徴表現に基づいて領域特徴を再構築し、
    前記トレーニングターゲットは、前記復号ネットワークによって再構築された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化することをさらに含む、
    請求項1に記載のリスク予測モデルの確立方法。
  5. 前記初期モデルをトレーニングするプロセスにおいて、第1の損失関数を使用して前記判別ネットワークのパラメータを最適化し、第2の損失関数、第3の損失関数、及び第4の損失関数を使用して前記符号化ネットワークのパラメータを最適化し、前記第3の損失関数を使用して前記分類ネットワークのパラメータを最適化し、前記第4の損失関数を使用して前記復号ネットワークのパラメータを最適化し、
    前記第1の損失関数は、前記判別ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられ、
    前記第2の損失関数は、前記判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化するために用いられ、
    前記第3の損失関数は、前記分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられ、
    前記第4の損失関数は、前記復号ネットワークによって再構築された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化するために用いられる、
    請求項4に記載のリスク予測モデルの確立方法。
  6. 領域リスク予測方法であって、
    ターゲット領域の領域特徴を抽出するステップと、
    前記領域特徴をリスク予測モデルに入力し、前記リスク予測モデルによって出力された結果に基づいて前記ターゲット領域のリスクレベルを決定するステップと、を含み、
    前記リスク予測モデルは、請求項1~5のいずれか一つに記載のリスク予測モデルの確立方法を使用して予め確立される、
    領域リスク予測方法。
  7. 前記リスクレベルは疫病伝播のリスクレベルである、
    請求項6に記載の領域リスク予測方法。
  8. リスク予測モデルの確立装置であって、
    サンプル領域セットと、前記サンプル領域セットにおける各サンプル領域のリスクレベルと各サンプル領域が属する地域のリスクレベルのラベリング結果を含むトレーニングデータを取得するためのデータ取得ユニットと、
    前記トレーニングデータを使用して符号化ネットワーク、判別ネットワーク、及び分類ネットワークを含む初期モデルをトレーニングし、トレーニングの完了後に前記初期モデル内の符号化ネットワークと分類ネットワークを使用して前記リスク予測モデルを取得するためのモデルトレーニングユニットと、を含み、
    前記符号化ネットワークは、サンプル領域の領域特徴を使用して、符号化して各サンプル領域の特徴表現を取得し、前記判別ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域が属する地域のリスクレベルを認識し、前記分類ネットワークは、サンプル領域の特徴表現に基づいてサンプル領域のリスクレベルを認識し、前記初期モデルのトレーニングターゲットは、前記判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化し、前記分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化することを含む、
    リスク予測モデルの確立装置。
  9. 周辺の予め設定されたタイプのPOI特徴、人口統計学特徴、及びユーザ出行特徴のうちの少なくとも1つを含む前記サンプル領域の領域特徴を取得するために用いられる特徴抽出ユニットをさらに含む、
    請求項8に記載のリスク予測モデルの確立装置。
  10. 前記周辺の予め設定されたタイプのPOI特徴は、サンプル領域と最寄りの予め設定されたタイプPOIとの距離情報と、サンプル領域の予め設定された距離範囲内の生活施設の完備の程度のうちの少なくとも1つを含み、
    前記人口統計学特徴は、人口密度状況、通勤距離分布、年齢分布、性別分布、収入分布、消費能力分布、教育レベル分布、結婚状況分布、生活段階分布、就業タイプ分布、及び業界タイプ分布のうちの少なくとも1つを含み、
    前記ユーザ出行特徴は、出行方式、出発地-目的地モード分布、出発地-出行方式-目的地モード分布のうちの少なくとも1つを含む、
    請求項9に記載のリスク予測モデルの確立装置。
  11. 前記初期モデルは、復号ネットワークをさらに含み、
    前記復号ネットワークは、サンプル領域の特徴表現に基づいて領域特徴を再構築し、
    前記トレーニングターゲットは、前記復号ネットワークによって再構築された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化することをさらに含む、
    請求項8に記載のリスク予測モデルの確立装置。
  12. 前記モデルトレーニングユニットが前記初期モデルをトレーニングするプロセスにおいて、第1の損失関数を使用して前記判別ネットワークのパラメータを最適化し、第2の損失関数、第3の損失関数、及び第4の損失関数を使用して前記符号化ネットワークのパラメータを最適化し、前記第3の損失関数を使用して前記分類ネットワークのパラメータを最適化し、前記第4の損失関数を使用して前記復号ネットワークのパラメータを最適化し、
    前記第1の損失関数は、前記判別ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられ、
    前記第2の損失関数は、前記判別ネットワークが異なるリスクレベル地域に属するサンプル領域に対する認識差異を最小化するために用いられ、
    前記第3の損失関数は、前記分類ネットワークがサンプル領域に対する認識結果とラベリング結果との差異を最小化するために用いられ、
    前記第4の損失関数は、前記復号ネットワークによって再構築された領域特徴とサンプル領域から抽出された領域特徴との差異を最小化するために用いられる、
    請求項11に記載のリスク予測モデルの確立装置。
  13. 領域リスク予測装置であって、
    ターゲット領域の領域特徴を抽出するための特徴抽出ユニットと、
    前記領域特徴をリスク予測モデルに入力し、前記リスク予測モデルによって出力された結果に基づいて前記ターゲット領域のリスクレベルを決定するためのリスク予測ユニットと、を含み、
    前記リスク予測モデルは、請求項8~12のいずれか一つに記載のリスク予測モデルの確立装置によって予め確立される、
    領域リスク予測装置。
  14. 前記リスクレベルは疫病伝播のリスクレベルである、
    請求項13に記載の領域リスク予測装置。
  15. 電子機器であって、
    少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
    前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項1~5のいずれか一つに記載のリスク予測モデルの確立方法を実行する、
    電子機器。
  16. 電子機器であって、
    少なくとも一つのプロセッサと、
    前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
    前記メモリに前記少なくとも一つのプロセッサにより実行可能な命令が記憶されており、前記命令が前記少なくとも一つのプロセッサにより実行されると、前記少なくとも一つのプロセッサが請求項6又は7に記載の領域リスク予測方法を実行する、
    電子機器。
  17. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、コンピュータに請求項1~5のいずれか一つに記載のリスク予測モデルの確立方法を実行させる、
    コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体。
  18. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、コンピュータに請求項6又は7に記載の領域リスク予測方法を実行させる、
    コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体。
  19. プロセッサによって実行される時に請求項1~5のいずれか一つに記載のリスク予測モデルの確立方法を実現する、
    コンピュータプログラム。
  20. プロセッサによって実行される時に請求項6又は7に記載の領域リスク予測方法を実現する、
    コンピュータプログラム。
JP2021576944A 2020-12-21 2021-06-02 リスク予測モデルの確立方法、領域リスク予測方法、及び対応装置 Pending JP2023510665A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202011515953.3 2020-12-21
CN202011515953.3A CN112508300B (zh) 2020-12-21 2020-12-21 建立风险预测模型的方法、区域风险预测方法及对应装置
PCT/CN2021/097958 WO2022134480A1 (zh) 2020-12-21 2021-06-02 建立风险预测模型的方法、区域风险预测方法及对应装置

Publications (2)

Publication Number Publication Date
JP2023510665A true JP2023510665A (ja) 2023-03-15
JPWO2022134480A5 JPWO2022134480A5 (ja) 2023-07-11

Family

ID=74921829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021576944A Pending JP2023510665A (ja) 2020-12-21 2021-06-02 リスク予測モデルの確立方法、領域リスク予測方法、及び対応装置

Country Status (6)

Country Link
US (1) US20220398465A1 (ja)
EP (1) EP4040353B1 (ja)
JP (1) JP2023510665A (ja)
KR (1) KR20220093046A (ja)
CN (1) CN112508300B (ja)
WO (1) WO2022134480A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508300B (zh) * 2020-12-21 2023-04-18 北京百度网讯科技有限公司 建立风险预测模型的方法、区域风险预测方法及对应装置
CN113744888B (zh) * 2021-09-02 2023-09-22 深圳万海思数字医疗有限公司 区域流行病趋势预测预警方法及系统
CN113837588B (zh) * 2021-09-17 2023-12-29 北京百度网讯科技有限公司 一种评估模型的训练方法、装置、电子设备及存储介质
CN114372642B (zh) * 2022-03-21 2022-05-20 创意信息技术股份有限公司 一种城市节假日旅游景区风险评估的方法
CN115935265B (zh) * 2023-03-03 2023-05-26 支付宝(杭州)信息技术有限公司 训练风险识别模型的方法、风险识别方法及对应装置
CN115983142B (zh) * 2023-03-21 2023-08-29 之江实验室 基于深度生成对抗式网络的区域人口演化模型构造方法
CN116028964B (zh) * 2023-03-28 2023-05-23 中国标准化研究院 一种信息安全风险管理系统
CN117421244B (zh) * 2023-11-17 2024-05-24 北京邮电大学 多源跨项目软件缺陷预测方法、装置及存储介质
CN117932487B (zh) * 2023-12-28 2024-08-20 中信建投证券股份有限公司 一种风险分类模型训练、风险分类方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902880A (zh) * 2019-03-13 2019-06-18 南京航空航天大学 一种基于Seq2Seq生成对抗网络的城市人流预测方法
CN111626490A (zh) * 2020-05-20 2020-09-04 南京航空航天大学 一种基于对抗学习的多任务城市时空预测方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10535424B2 (en) * 2016-02-19 2020-01-14 International Business Machines Corporation Method for proactive comprehensive geriatric risk screening
US11468262B2 (en) * 2017-10-30 2022-10-11 Nec Corporation Deep network embedding with adversarial regularization
CN110458572B (zh) * 2019-07-08 2023-11-24 创新先进技术有限公司 用户风险的确定方法和目标风险识别模型的建立方法
CN110674979B (zh) * 2019-09-11 2024-09-03 腾讯科技(深圳)有限公司 风险预测模型的训练方法、预测方法及装置、介质和设备
CN110689184A (zh) * 2019-09-21 2020-01-14 广东毓秀科技有限公司 一种通过深度学习进行轨交人流预测的方法
CN110993119B (zh) * 2020-03-04 2020-07-07 同盾控股有限公司 基于人口迁移的疫情预测方法、装置、电子设备及介质
CN111128399B (zh) * 2020-03-30 2020-07-14 广州地理研究所 一种基于人流密度的流行病疫情风险等级评估方法
CN111626119B (zh) * 2020-04-23 2023-09-01 北京百度网讯科技有限公司 目标识别模型训练方法、装置、设备以及存储介质
CN111523597B (zh) * 2020-04-23 2023-08-25 北京百度网讯科技有限公司 目标识别模型训练方法、装置、设备以及存储介质
CN111523596B (zh) * 2020-04-23 2023-07-04 北京百度网讯科技有限公司 目标识别模型训练方法、装置、设备以及存储介质
CN111768873A (zh) * 2020-06-03 2020-10-13 中国地质大学(武汉) 一种covid-19实时风险预测方法
CN112508300B (zh) * 2020-12-21 2023-04-18 北京百度网讯科技有限公司 建立风险预测模型的方法、区域风险预测方法及对应装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902880A (zh) * 2019-03-13 2019-06-18 南京航空航天大学 一种基于Seq2Seq生成对抗网络的城市人流预测方法
CN111626490A (zh) * 2020-05-20 2020-09-04 南京航空航天大学 一种基于对抗学习的多任务城市时空预测方法

Also Published As

Publication number Publication date
WO2022134480A1 (zh) 2022-06-30
US20220398465A1 (en) 2022-12-15
CN112508300B (zh) 2023-04-18
EP4040353A4 (en) 2022-08-10
EP4040353A1 (en) 2022-08-10
CN112508300A (zh) 2021-03-16
EP4040353B1 (en) 2023-07-26
KR20220093046A (ko) 2022-07-05

Similar Documents

Publication Publication Date Title
JP2023510665A (ja) リスク予測モデルの確立方法、領域リスク予測方法、及び対応装置
JP7331975B2 (ja) クロスモーダル検索モデルのトレーニング方法、装置、機器、および記憶媒体
KR20220132414A (ko) 음성 인식 모델의 트레이닝 방법, 장치, 기기 및 기록 매체
CN113792854A (zh) 一种模型训练及字库建立方法、装置、设备及存储介质
EP3913521A1 (en) Method and apparatus for creating dialogue, electronic device and storage medium
CN111432347B (zh) 信息处理方法、装置、存储介质及电子设备
US20230306081A1 (en) Method for training a point cloud processing model, method for performing instance segmentation on point cloud, and electronic device
US20230186607A1 (en) Multi-task identification method, training method, electronic device, and storage medium
CN113553412A (zh) 问答处理方法、装置、电子设备和存储介质
US20230162087A1 (en) Federated learning method, electronic device, and storage medium
KR20220156091A (ko) 강화 학습을 이용한 비지도 텍스트 요약
US20220284807A1 (en) Method of predicting traffic volume, electronic device, and medium
CN113641805A (zh) 结构化问答模型的获取方法、问答方法及对应装置
WO2022252843A1 (zh) 时空数据处理模型的训练方法、装置、设备及存储介质
CN114417192B (zh) 更新兴趣点poi状态的方法、装置、设备、介质及产品
JP2022095895A (ja) 交通データ予測方法、交通データ予測装置、電子機器、記憶媒体、コンピュータプログラム製品及びコンピュータプログラム
CN113468857B (zh) 风格转换模型的训练方法、装置、电子设备以及存储介质
US20180365354A1 (en) Employing natural language processing to facilitate geospatial analysis
CN112948584A (zh) 短文本分类方法、装置、设备以及存储介质
CN114416941B (zh) 融合知识图谱的对话知识点确定模型的生成方法及装置
CN114969577A (zh) 兴趣点推荐方法和兴趣点推荐模型的训练方法、装置
CN114638308A (zh) 一种获取对象关系的方法、装置、电子设备和存储介质
CN113806541A (zh) 情感分类的方法和情感分类模型的训练方法、装置
CN113010784B (zh) 用于生成预测信息的方法、装置、电子设备和介质
CN117056395A (zh) 兴趣点关系挖掘及模型训练方法、装置、设备和介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230404

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20230703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231017