WO2022209371A1 - 情報処理システム、情報処理方法および情報処理プログラム - Google Patents

情報処理システム、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
WO2022209371A1
WO2022209371A1 PCT/JP2022/005868 JP2022005868W WO2022209371A1 WO 2022209371 A1 WO2022209371 A1 WO 2022209371A1 JP 2022005868 W JP2022005868 W JP 2022005868W WO 2022209371 A1 WO2022209371 A1 WO 2022209371A1
Authority
WO
WIPO (PCT)
Prior art keywords
processing
analysis
information
processing result
database
Prior art date
Application number
PCT/JP2022/005868
Other languages
English (en)
French (fr)
Inventor
健太郎 鳥澤
清敬 大竹
Original Assignee
国立研究開発法人情報通信研究機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立研究開発法人情報通信研究機構 filed Critical 国立研究開発法人情報通信研究機構
Priority to US18/281,902 priority Critical patent/US20240152565A1/en
Publication of WO2022209371A1 publication Critical patent/WO2022209371A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/383Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Abstract

情報処理システムは、位置情報およびテキストを含む処理対象の処理結果を格納する処理結果データベースと、処理対象に含まれる位置情報に対応する単位エリアを決定するエリア決定手段と、第1解析処理と第1解析処理より精度が高い第2解析処理とを含む複数の解析処理のうち指定された解析処理によって、テキストを解析して処理結果を出力する解析手段と、第1解析処理によってテキストを解析して第1処理結果を取得した後に、決定された単位エリアについて別の処理対象の処理結果が既に格納されていれば、第1処理結果を処理結果データベースに追加し、決定された単位エリアについて別の処理対象の処理結果が格納されていなければ、第2解析処理によってテキストを解析して第2処理結果を取得し、処理結果データベースに格納する制御手段とを含む。

Description

情報処理システム、情報処理方法および情報処理プログラム
 本発明は、情報処理システム、情報処理方法および情報処理プログラムに関する。
 スマートフォンなどの携帯端末の急速な普及に伴って、誰もが容易に情報を発信できる手段として、様々な用途にSNS(Social Networking Service)が利用されるようになっている。SNSの用途の一つとして、災害時における情報収集が注目されている。
 災害時に収集すべき情報は、発生している事象の内容などに加えて、当該事象が発生している場所などを含む。一方で、発信者のプラバシーや個人情報を保護する観点から、当該発信者の携帯端末が有している位置情報は利用されず、もっぱら、ユーザが明示的に発信した位置を示す表現を解析することで、対象の場所を特定するという手法が採用される。
 メッセージに含まれるテキストを解析して、事象の内容を抽出するためには、自然言語処理が用いられる。例えば、非特許文献1に開示されるような深層学習に従う言語モデルを活用することで、より高い精度を実現できる。
Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova, "BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding," Proceedings of NAACL-HLT 2019, pages 4171-4186
 深層学習に従う言語解析処理を実現するためには、学習時および実行時のいずれにおいても、膨大な演算を実行する必要があり、例えば、GPU(Graphics Processing Unit)やニューロチップといった専用のハードウェアリソースが用いられることが多い。そのため、深層学習に従う言語解析処理を採用する場合には、CPU(Central Processing Unit)などの汎用的なハードウェアリソースを用いて実現する場合に比較して、コストが増加する。
 特に、災害時などには、多くの情報が発信されて、膨大なテキストを処理する必要がある一方で、処置や対策を急ぐ必要があるため、制限された処理時間内に解析処理を完了しなければならないという要求も存在する。
 本発明の一つ目的は、位置情報およびテキストを含む処理対象を効率的に処理するための技術を提供することである。
 ある実施の形態に従う情報処理システムは、位置情報およびテキストを含む処理対象の処理結果を格納する処理結果データベースと、処理対象に含まれる位置情報に対応する単位エリアを決定するエリア決定手段と、第1解析処理と第1解析処理より精度が高い第2解析処理とを含む複数の解析処理のうち指定された解析処理によって、テキストを解析して処理結果を出力する解析手段と、第1解析処理によってテキストを解析して第1処理結果を取得した後に、決定された単位エリアについて別の処理対象の処理結果が既に格納されていれば、第1処理結果を処理結果データベースに追加し、決定された単位エリアについて別の処理対象の処理結果が格納されていなければ、第2解析処理によってテキストを解析して第2処理結果を取得し、処理結果データベースに格納する制御手段とを含む。
 複数の解析処理は、第1解析処理より精度が高く、かつ、第2解析処理より精度が低い第3解析処理をさらに含んでいてもよい。制御手段は、第2解析処理を実行できない負荷状態であれば、第2解析処理に代えて、第3解析処理によってテキストを解析するようにしてもよい。
 処理結果は、抽出すべき情報を示す文字列であるフレーズと、当該フレーズの意味を示す意味情報とを含んでいてもよい。
 情報管理システムは、解析処理の処理状態を単位エリア毎に格納する処理状態データベースをさらに含んでいてもよい。処理状態は、解析処理が実行されて処理結果が取得された状態と、解析処理が実行されて処理結果が取得されていない状態と、解析処理が未だ実行されていない状態とのうちいずれかを設定可能になっていてもよい。
 処理状態は、実行された解析処理の種類を特定する情報を含んでいてもよい。制御手段は、任意の単位エリアについての処理結果の取得に用いられた解析処理より精度が高い解析処理を追加的に実行するようにしてもよい。
 制御手段は、決定された単位エリアについての処理状態が処理状態データベースに存在しなければ、決定された単位エリアから所定範囲内に存在する他の単位エリアについての処理状態を検索するようにしてもよい。
 制御手段は、第1解析処理によって第1処理結果を取得できないときも、第2解析処理によってテキストを解析して第2処理結果を取得するようにしてもよい。
 位置情報は、緯度経度で示される位置情報、および、UTM(Universal Transverse Mercator)座標系で示される位置の情報の少なくとも一方を含んでいてもよい。
 別の実施の形態に従う情報処理方法は、位置情報およびテキストを含む処理対象を受信するステップと、処理対象に含まれる位置情報に対応する単位エリアを決定するステップと、第1解析処理によってテキストを解析して第1処理結果を取得するステップと、決定された単位エリアについて別の処理対象の処理結果が既に処理結果データベースに格納されているか否かを判断するステップと、決定された単位エリアについて別の処理対象の処理結果が既に処理結果データベースに格納されていれば、第1処理結果を処理結果データベースに追加するステップと、決定された単位エリアについて別の処理対象の処理結果が処理結果データベースに格納されていなければ、第1解析処理より精度が高い第2解析処理によってテキストを解析して第2処理結果を取得し、処理結果データベースに格納するステップとを含む。
 さらに別の形態に従えば、コンピュータに上記の情報処理方法を実行させるための情報処理プログラムが提供される。
 本発明によれば、位置情報およびテキストを含む処理対象を効率的に処理できる。
本実施の形態に従う情報処理システムのシステム構成の一例を示す模式図である。 図1に示す携帯端末のユーザとチャットボットとの対話の一例を示す模式図である。 本実施の形態に従う情報処理システムを構成する解析装置のハードウェア構成の一例を示す模式図である。 本実施の形態に従う情報処理システムが提供する解析処理を示す概略図である。 本実施の形態に従う情報処理システムが生成する処理結果データベースの一例を示す模式図である。 本実施の形態に従う情報処理システムが生成する処理結果データベースの別の一例を示す模式図である。 本実施の形態に従う情報処理システムが生成する処理状態データベースの一例を示す模式図である。 本実施の形態に従う情報処理システムにおける解析処理プログラムの違いによる処理結果の相違例を示す図である。 本実施の形態に従う情報処理システムが提供する解析処理の処理手順の一例を示すフローチャートである。
 本発明の実施の形態について、図面を参照しながら詳細に説明する。なお、図中の同一または相当部分については、同一符号を付してその説明は繰り返さない。
 [A.システム構成]
 図1は、本実施の形態に従う情報処理システム1のシステム構成の一例を示す模式図である。図1を参照して、情報処理システム1は、解析装置100と、SNSサーバ200とを含む。なお、説明の便宜上、以下では、解析装置100とSNSサーバ200とを分離した構成を例示するが、両者を一体化してもよい。
 SNSサーバ200は、携帯端末300との間でやり取りされるメッセージを収集する。なお、メッセージには、テキストに加えて、静止画像や動画像などの任意のコンテンツが含まれてもよい。
 SNSサーバ200は、チャットボット250を有している。チャットボット250は、SNSの仮想的なユーザとして振る舞い、携帯端末300のユーザと対話して、ユーザからのメッセージを収集する。典型的には、チャットボット250は、災害が発生した場合の情報(以下、「報告内容」とも称す。)を収集するための対話を行う。
 解析装置100は、チャットボット250などによってSNSサーバ200に収集された1または複数のメッセージから生成される報告内容50を解析して処理結果(後述の処理結果71)を出力する。例えば、処理結果は、発生している事象および当該事象が発生している場所などの情報を含む。
 図2は、図1に示す携帯端末300のユーザとチャットボット250との対話の一例を示す模式図である。図2を参照して、チャットボット250は、携帯端末300のユーザからのメッセージに応答して、入力を促すメッセージを送信したり、追加の問合せを行うためのメッセージを送信したりする。
 携帯端末300のユーザは、災害により生じた状況や被害などを報告する。この報告の際に、状況や被害の内容を示す任意のテキスト、当該報告に関する位置情報(例えば、緯度経度情報)、状況や被害を示す静止画や動画などが送信される。なお、静止画や動画などが添付されなくてもよい。図2に示すようなやり取りによって、SNSサーバ200に報告内容50が収集される。
 本実施の形態に従う情報処理システム1は、位置情報およびテキストを含む報告内容50を処理対象とする。すなわち、情報処理システム1が実行する処理全体としては、位置情報およびテキストを処理した処理結果がデータベース等(後述の処理結果データベース70および処理状態データベース80)に格納される。より具体的には、図1および図2に示すように、情報処理システム1は、例えば、SNS上でチャットボット250が収集した報告内容50(典型的には、災害時における被害の報告)を解析して情報を抽出し、抽出により取得された情報をデータベースに格納する。
 テキストの処理結果としては、典型的には、必要とする情報を記述した文字列(後述のフレーズ74)が出力される。なお、出力される文字列は、テキストに含まれる情報のみではなく、辞書等を参照して決定された何らかの意味を表す情報や、予め定められた記号なども含み得る。
 出力される文字列に含まれる情報に基づいて、文字列間の意味的距離あるいは同義か否かといった判定手続きを定義できる。さらに、解析装置100は、文字列中の意味的距離等を求めるために用いる部分文字列を意味フラグ(後述のフレーズタイプ75および意味カテゴリ76に相当)として抽出する。意味フラグは、文字列(フレーズ74)の意味を示す意味情報に相当する。
 [B.ハードウェア構成例]
 図3は、本実施の形態に従う情報処理システムを構成する解析装置100のハードウェア構成の一例を示す模式図である。典型的には、解析装置100は、汎用コンピュータを用いて実現できる。
 図3を参照して、解析装置100は、主要なハードウェアコンポーネントとして、CPU102と、GPU104と、主メモリ106と、ディスプレイ108と、ネットワークインターフェイス(I/F:interface)110と、入力デバイス112と、光学ドライブ114と、二次記憶装置120とを含む。これらのコンポーネントは、内部バス118を介して互いに接続される。
 CPU102および/またはGPU104は、本実施の形態に従う情報処理方法を実行するプロセッサである。CPU102およびGPU104は、複数個配置されてもよいし、複数のコアを有していてもよい。
 主メモリ106は、プロセッサ(CPU102および/またはGPU104)が処理を実行するにあたって、プログラムコードやワークデータなどを一時的に格納(あるいは、キャッシュ)する記憶領域であり、例えば、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)などの揮発性メモリデバイスなどで構成される。
 ディスプレイ108は、処理に係るユーザインターフェイスや処理結果などを出力する表示部であり、例えば、LCD(liquid crystal display)や有機EL(electroluminescence)ディスプレイなどで構成される。
 ネットワークインターフェイス110は、インターネット上またはイントラネット上の任意の情報処理装置などとの間でデータをやり取りする。本実施の形態においては、ネットワークインターフェイス110は、SNSサーバ200から解析装置100への報告内容50の伝送を担当する。ネットワークインターフェイス110としては、例えば、イーサネット(登録商標)、無線LAN(local area network)、Bluetooth(登録商標)などの任意の通信方式を採用できる。
 入力デバイス112は、ユーザからの指示や操作などを受け付けるデバイスであり、例えば、キーボード、マウス、タッチパネル、ペンなどで構成される。
 光学ドライブ114は、CD-ROM(compact disc read only memory)、DVD(digital versatile disc)などの光学ディスク116に格納されている情報を読出して、内部バス118を介して他のコンポーネントへ出力する。光学ディスク116は、非一過的(non-transitory)な記録媒体の一例であり、任意のプログラムを不揮発的に格納した状態で流通する。光学ドライブ114が光学ディスク116からプログラムを読み出して、二次記憶装置120などにインストールすることで、コンピュータが解析装置100として機能するようになる。したがって、本発明の主題は、二次記憶装置120などにインストールされたプログラム自体、または、本実施の形態に従う機能や処理を実現するためのプログラムを格納した光学ディスク116などの記録媒体でもあり得る。
 図3には、非一過的な記録媒体の一例として、光学ディスク116などの光学記録媒体を示すが、これに限らず、フラッシュメモリなどの半導体記録媒体、ハードディスクまたはストレージテープなどの磁気記録媒体、MO(magneto-optical disk)などの光磁気記録媒体を用いてもよい。
 二次記憶装置120は、コンピュータを解析装置100として機能させるために必要なプログラムおよびデータを格納する。例えば、ハードディスク、SSD(solid state drive)などの不揮発性記憶装置で構成される。
 より具体的には、二次記憶装置120は、図示しないOS(operating system)の他、解析処理の実行を管理するための処理管理プログラム122と、ジオコードから対応する住所を決定するための逆ジオコードプログラム124と、解析処理を実現するための第1解析処理プログラム126、第2解析処理プログラム128、第3解析処理プログラム130とを格納している。また、二次記憶装置120には、処理結果データベース70および処理状態データベース80が形成されていてもよい。
 図3には、単一のコンピュータを用いて解析装置100を構成する例を示すが、これに限らず、コンピュータネットワークを介して接続された複数のコンピュータが明示的または黙示的に連携して、本実施の形態に従う情報処理方法を実現するようにしてもよい。
 プロセッサ(CPU102および/またはGPU104)がプログラムを実行することで実現される機能の全部または一部を、集積回路などのハードワイヤード回路(hard-wired circuit)を用いて実現してもよい。例えば、ASIC(application specific integrated circuit)やFPGA(field-programmable gate array)などを用いて実現してもよい。
 当業者であれば、本発明が実施される時代に応じた技術を適宜用いて、本実施の形態に従う解析装置100を実現できるであろう。
 [C.解析処理の概要]
 次に、本実施の形態に従う情報処理システム1が提供する解析処理を概略する。
 図4は、本実施の形態に従う情報処理システム1が提供する解析処理を示す概略図である。図4を参照して、解析装置100は、SNSサーバ200から取得した報告内容50を解析して、処理結果を処理結果データベース70および処理状態データベース80に格納する。解析装置100は、位置情報(例えば、緯度経度情報)およびテキストを含む報告内容50をより高速に解析処理する。
 SNSサーバ200は、例えば、JSON形式やXML形式で、報告内容50を解析装置100に提供してもよい。報告内容50は、解析装置100に実装されたAPI(Application Programming Interface)を介して、処理管理プログラム122に提供されてもよい。報告内容50は、例えば、識別情報51と、ユーザ情報52と、緯度経度情報53と、テキスト54と、写真添付属性55とを含む。
 処理管理プログラム122は、報告内容50の各々について、第1解析処理プログラム126、第2解析処理プログラム128、第3解析処理プログラム130を選択的に実行して、処理結果71を生成する。なお、同一の報告内容50に対して、第1解析処理プログラム126、第2解析処理プログラム128、第3解析処理プログラム130のうち1つが実行されることもあるし、複数が実行されることもある。
 第1解析処理プログラム126、第2解析処理プログラム128および第3解析処理プログラム130は、処理速度および精度が異なっている。例えば、第1解析処理プログラム126は、相対的に高速な処理が可能であるが、相対的に精度が低い。第3解析処理プログラム130は、処理速度が相対的に低いが、相対的に精度は高い。第2解析処理プログラム128の処理速度および精度は、いずれも第1解析処理プログラム126と第3解析処理プログラム130との間である。
 このように、情報処理システム1(解析装置100)は、第1解析処理プログラム126による解析処理と、第1解析処理プログラム126による解析処理より精度が高い第3解析処理プログラム130による解析処理とを含む複数の解析処理のうち、指定された解析処理によって、報告内容50に含まれるテキスト54を解析して処理結果71を出力する解析手段を有している。また、選択される複数の解析処理としては、第1解析処理プログラム126による解析処理より精度が高く、かつ、第3解析処理プログラム130による解析処理より精度が低い第2解析処理プログラム128による解析処理を含めてもよい。
 言語解析処理を想定すれば、第1解析処理プログラム126、第2解析処理プログラム128および第3解析処理プログラム130は、いずれもテキストの意味を解析し、処理結果71を出力する処理を実行する。各解析処理プログラムが実行する解析処理の内容は異なっているが、出力される処理結果71のフォーマットは互いに同一に構成されている。
 例えば、第1解析処理プログラム126は、ルールベースによる情報を抽出するものであり、第2解析処理プログラム128は、SVM(Support Vector Machine)により情報を抽出するものであり、第3解析処理プログラム130は、深層学習を利用して情報を抽出するものである。
 なお、図4に示すように3種類の解析処理を用意する必要は必ずしもなく、2種類の解析処理のみを用意してもよいし、より多くの種類の解析処理を用意してもよい。すなわち、処理速度および精度の異なる複数種類の解析処理を用意しておき、これらの解析処理を予め定められた基準で順序付けしておく。
 処理結果データベース70に格納される処理結果71の各々は、例えば、報告内容50に対応する単位エリア72と、報告内容50に対応する緯度経度情報73と、抽出されたフレーズ74と、抽出されたフレーズ74のフレーズタイプ75と、抽出されたフレーズ74の意味カテゴリ76と、対応する報告内容50の写真添付属性77と、対応する報告内容50の識別情報78とを含む。処理結果71は、すべての情報をまとめた文字列として出力されてもよい。
 ここで、「フレーズ」は、報告内容50に含まれるテキスト54から収集すべき情報(例えば、災害により生じた状況や被害などの表現)に相当する文字列を意味する。
 フレーズタイプ75の値としては、例えば、「要望・問題」、「矛盾」、「対応策」のいずれかが格納されるようにしてもよい。意味カテゴリ76の値としては、「被害」や「火災」といった、災害により生じた状況や被害の内容を特定するテキストが格納される。フレーズタイプ75および意味カテゴリ76は、報告内容50の意味フラグに相当する。
 このように、処理結果71は、抽出すべき情報を示す文字列(フレーズ74)と、フレーズ74の意味を示す意味情報である意味フラグ(フレーズタイプ75および意味カテゴリ76)とを含む。
 1つの報告内容50から複数のフレーズ74が抽出されると、抽出されたフレーズ74毎に、単位エリア72、フレーズタイプ75および意味カテゴリ76をまとめた文字列を出力するようにしてもよい。また、報告内容50に含まれるテキスト54からフレーズ74が抽出されなければ、抽出されなかったことを示す文字列が出力されるようにしてもよい。
 逆ジオコードプログラム124は、処理対象である報告内容50に含まれる位置情報に対応する単位エリアを決定するエリア決定手段に相当する。より具体的には、逆ジオコードプログラム124は、報告内容50に含まれる位置情報(緯度経度情報53)に対応する単位エリア72の住所表記を出力する。逆ジオコードプログラム124が出力する単位エリア72の粒度は、いずれであってもよい。例えば、街区単位の住所表記を単位エリアとすることもできるし、2分の1地域メッシュ(4次メッシュ)などの地域メッシュを単位エリアとすることもできる。なお、位置情報としては、緯度経度の表現形式に加えて、UTM(Universal Transverse Mercator)座標系を用いてもよい。すなわち、位置情報は、緯度経度で示される位置情報、および、UTM座標系で示される位置の情報の少なくとも一方を含んでいてもよい。このように、位置情報は、地表上の任意の位置を特定できる情報であれば、どのような表現形式であってもよい。
 処理状態データベース80は、解析処理の処理状態81を少なくとも単位エリア毎に格納する。処理状態データベース80に格納される処理状態81の各々は、報告内容50に対する解析処理の処理状況を示す。より具体的には、処理状態データベース80には、処理状態81として、単位エリア72、フレーズタイプ75および意味カテゴリ76の組合せ毎に実行状態値82が格納される。
 処理状態81には、実行状態値82として、「解析処理が実行されて処理結果が取得された状態」と、「解析処理が実行されて処理結果が取得されていない状態」と、「解析処理が未だ実行されていない状態」とのうちいずれかが設定可能になっている。
 より具体的には、実行状態値82には、「結果有で処理済(pn:id)」、「結果無で処理済(pn:id)」および「未処理」のいずれかが格納されるようにしてもよい。「結果有で処理済(pn:id)」および「結果無で処理済(pn:id)」は、1または複数の報告内容50に対する解析処理が実行済であることを意味する。一方、「未処理」は、報告内容50に対する解析処理が未だ実行されていないことを意味する。
 また、処理状態81は、実行された解析処理の種類を特定する情報を含む。より具体的には、処理状態81の実行状態値82に設定される「pn」には、「p1」,「p2」,「p3」といった実行された解析処理プログラムを特定するための情報が格納される。
 また、処理状態81は、解析処理の処理対象を特定するための情報をさらに含む。より具体的には、処理状態81の実行状態値82に設定される「id」には、対象の報告内容50を特定するための識別情報51が格納される。
 実行状態値82は、解析処理を優先すべき報告内容50を抽出する処理や、より精度が高い解析処理を実行すべき報告内容50を抽出する処理などに用いることができる。
 [D.処理結果データベース70および処理状態データベース80]
 次に、処理結果データベース70および処理状態データベース80の具体例について説明する。
 図5は、本実施の形態に従う情報処理システム1が生成する処理結果データベース70の一例を示す模式図である。図5には、リレーショナルデータベースを用いて処理結果データベース70を実装した例を示す。
 図5を参照して、処理結果データベース70は、処理結果71をエントリとして有しており、処理結果71の各々は、識別情報78(id)に関連付けられている。処理結果71は、単位エリア72と、緯度経度情報73と、フレーズ74と、フレーズタイプ75と、意味カテゴリ76と、写真添付属性77とを含む。
 このようなリレーショナルデータベースを用いた処理結果データベース70を採用することで、SQLを用いて柔軟な問合せを実現できる。
 図6は、本実施の形態に従う情報処理システム1が生成する処理結果データベース70の別の一例を示す模式図である。図6には、キーバリューストアー(KVS:Key-Value Store)のデータベースを用いて処理結果データベース70を実装した例を示す。キーバリューストアーのデータベースでは、検索に用いるキーに応じたインデックスが予め用意される。
 図6を参照して、処理結果データベース70は、例えば、メインデータベース70Aと、エリアインデスックスデータベース70Bと、カテゴリインデックスデータベース70Cとを含む。
 メインデータベース70Aは、処理結果71をエントリとして有している。処理結果71の各々は、識別情報78がキーとして設定されるとともに、対応するバリューとして、単位エリア72と、緯度経度情報73と、フレーズ74と、フレーズタイプ75と、意味カテゴリ76と、写真添付属性77とが格納される。
 エリアインデスックスデータベース70Bは、キーとして単位エリア72が設定されるとともに、識別情報78がバリューとして格納される。
 カテゴリインデックスデータベース70Cは、キーとして意味カテゴリ76が設定されるとともに、識別情報78がバリューとして格納される。
 例えば、メインデータベース70Aに対しては、識別情報78を指定することで、対応する単位エリア72と、緯度経度情報73と、フレーズ74と、フレーズタイプ75と、意味カテゴリ76と、写真添付属性77とを検索できる。エリアインデスックスデータベース70Bに対しては、単位エリア72を指定することで、対応する識別情報78を検索できる。カテゴリインデックスデータベース70Cに対しては、意味カテゴリ76を指定することで、対応する識別情報78を検索できる。
 複数のインデックスデータベースの検索結果を集合演算することで、論理和や論理積といった論理演算を含む検索を実現できる。図6に示す例では、エリアインデスックスデータベース70Bおよび/またはカテゴリインデックスデータベース70Cを用いて、インデックス検索を行って識別情報78(id)の集合を取得し、取得された識別情報78(id)の集合を用いて、メインデータベース70Aから目的の処理結果71を取得する。
 このようなキーバリューストアーのデータベースを用いることで、高速な検索を実現できる。
 図7は、本実施の形態に従う情報処理システム1が生成する処理状態データベース80の一例を示す模式図である。図7には、処理状態データベース80をキーバリューストアーのデータベースを用いて実装した例を示す。
 図7を参照して、処理状態データベース80は、処理状態81をエントリとして有している。処理状態81の各々は、単位エリア72、フレーズタイプ75および意味カテゴリ76の組合せがキーとして設定されるとともに、対応するバリューとして、実行状態値82が格納される。
 なお、図5~図7に示すデータベースの実装形態に限定されることなく、任意の実装形態を採用できる。
 [E.解析処理プログラムの精度差]
 次に、複数の解析処理プログラムによる精度の差について説明する。
 図8は、本実施の形態に従う情報処理システム1における解析処理プログラムの違いによる処理結果の相違例を示す図である。図8には、同一のテキスト54に対して、第2解析処理プログラム128(SVM)および第3解析処理プログラム130(深層学習)による解析処理をそれぞれ実行して取得された処理結果の一例を示す。
 なお、処理結果の一例として、フレーズ74、フレーズタイプ75および意味カテゴリ76が出力される例を示すが、これに限らず、より多くの情報を出力するようにしてもよい。
 図8に示される5つのテキスト54のうち、「火事があったようだ」とのテキスト54に対しては、第2解析処理プログラム128は、「火事がある」というフレーズ74を抽出するとともに、抽出したフレーズ74に対応するフレーズタイプ75および意味カテゴリ76を出力している。これに対して、第3解析処理プログラム130は、フレーズ74を抽出していない。これは、第3解析処理プログラム130が「火事があったようだ」という不確定な情報を収集すべき情報ではないと判断したためであり、情報処理システム1としては、第3解析処理プログラム130の処理結果が正しい処理となる。
 また、「火事が起きていると言うことはない」とのテキスト54に対しては、第2解析処理プログラム128は、「火事が起きる」というフレーズ74を抽出するとともに、抽出したフレーズ74に対応して、「要望・問題」というフレーズタイプ75、ならびに、「災害:火災」という意味カテゴリ76を出力している。これに対して、第3解析処理プログラム130は、同じ「火事が起きる」というフレーズ74を抽出しているが、抽出したフレーズ74に対応して、「矛盾」というフレーズタイプ75、ならびに、「災害:火災」という意味カテゴリ76を出力している。「火事が起きていると言うことはない」とのテキスト54からは、実際に火事が起きているというわけではないので、フレーズタイプ75の値としては、第3解析処理プログラム130が出力した「矛盾」が正しい処理結果となる。
 このように、第3解析処理プログラム130は、第2解析処理プログラム128(および、第1解析処理プログラム126)に比較して、より高い精度を実現できる。但し、より多くの処理時間およびリソースを必要とする。
 [F.解析処理の詳細]
 次に、本実施の形態に従う情報処理システム1が提供する解析処理のより詳細な処理手順について説明する。
 図9は、本実施の形態に従う情報処理システム1が提供する解析処理の処理手順の一例を示すフローチャートである。図9に示す各ステップは、典型的には、解析装置100のプロセッサ(CPU102および/またはGPU104)が処理管理プログラム122を含むプログラムを実行することで実現される。
 図9を参照して、解析装置100は、位置情報およびテキストを含む処理対象である報告内容50を受信する処理を実行する。より具体的には、解析装置100は、SNSサーバ200から報告内容50を受信したか否かを判断する(ステップS100)。SNSサーバ200から報告内容50を受信していなければ(ステップS100においてNO)、ステップS100の処理が繰り返される。
 SNSサーバ200から報告内容50を受信していれば(ステップS100においてYES)、解析装置100は、プログラムの内部変数として扱えるように、報告内容50をデコードする(ステップS102)。例えば、JSON形式の報告内容50を受信した場合には、以下のような変数($で始まる文字列)に値を格納する。
 $latlong=“(34.74529,135.76016)”
 $text=“火災が発生している”
 $pic=“none”
 続いて、解析装置100は、処理対象である報告内容50に含まれる位置情報に対応する単位エリアを決定する処理を実行する。より具体的には、解析装置100は、逆ジオコードプログラム124を実行して、報告内容50に含まれる緯度経度情報53($latlongの値)に対応する住所表記を取得する(ステップS104)。例えば、緯度経度情報53が(34.74529,135.76016)を示す場合には、「京都府相楽郡精華町光台3丁目」との住所表記が取得される。取得された住所表記が単位エリア72となる。
 続いて、解析装置100は、最も精度が低い(最も処理速度が早い)解析処理によってテキストを解析して処理結果を取得する処理を実行する。より具体的には、解析装置100は、第1解析処理プログラム126を実行して、報告内容50に含まれるテキスト54($textの値)を解析する(ステップS106)。
 例えば、「火災が発生している」というテキスト54に対して、以下のような処理結果が取得される。
 フレーズ74:“火災:が:発生する”
 フレーズタイプ75:”要望・問題”
 意味カテゴリ76:“災害:火災”
 続いて、解析装置100は、第1解析処理プログラム126の実行により処理結果が取得されたか否かを判断する(ステップS108)。処理結果が取得されていなければ(ステップS108においてNO)、ステップS116以下の処理が実行される。すなわち、解析装置100は、第1解析処理プログラム126による解析処理によって処理結果を取得できないときも、後述するように、第3解析処理プログラム130(あるいは、第2解析処理プログラム128)による解析処理によってテキスト54を解析して処理結果を取得する。
 処理結果が取得されていれば(ステップS108においてYES)、解析装置100は、処理状態データベース80を参照して、ステップS104において取得した単位エリア72と、取得された処理結果に含まれるフレーズタイプ75と、取得された処理結果に含まれる意味カテゴリ76との組合せに対応する実行状態値82を取得する(ステップS110)。すなわち、解析装置100は、単位エリア72および意味フラグ(フレーズタイプ75および意味カテゴリ76)をキーとして、処理状態データベース80から対応する処理状態81を検索する。
 上述の例で説明すると、単位エリア72が「京都府:相楽郡:精華町:光台」となり、フレーズタイプ75が「要望・問題」となり、意味カテゴリ76が「災害:火災」となる。これら3つの値の組合せをキーとして、対応するバリューである実行状態値82が検索される。
 なお、単位エリア72および意味フラグに完全一致するエントリが存在しない場合には、対象の単位エリア72から所定範囲内に存在する他の単位エリア、および/または、所定の意味的距離にある他の意味フラグといった同値とみなすことができる範囲に検索対象を拡張してもよい。このように、解析装置100は、決定された単位エリア72についての処理状態81が処理状態データベース80に存在しなければ、決定された単位エリア72から所定範囲内に存在する他の単位エリア72についての処理状態81を検索するようにしてもよい。
 続いて、解析装置100は、決定された単位エリアについて別の処理対象(報告内容50)の処理結果が既に処理結果データベース70に格納されているか否かを判断する。より具体的には、解析装置100は、取得した実行状態値82が第3解析処理プログラム130による解析処理が実行済であることを示しているか否かを判断する(ステップS112)。上述の例では、解析装置100は、対応する実行状態値82が「結果有で処理済(p3)」になっているか否かを判断する。
 取得した実行状態値82が第3解析処理プログラム130による解析処理が実行済であることを示していれば(ステップS112においてYES)、解析装置100は、ステップS104およびS106において取得された情報に基づいて、処理結果データベース70および処理状態データベース80を更新する(ステップS114)。そして、処理は終了する。
 すなわち、解析装置100は、第1解析処理プログラム126による解析処理によってテキスト54を解析して処理結果を取得した後に、決定された単位エリアについて別の処理対象(報告内容50)の処理結果が既に格納されていれば、第1解析処理プログラム126による当該処理結果を処理結果データベース70に追加する。
 この場合には、対象の単位エリア72、フレーズタイプ75および意味カテゴリ76の組合せについては、既に、最も精度が高い第3解析処理プログラム130によって、別の報告内容50が解析済であることが示されているため、今回受信した報告内容50をさらに別の解析処理プログラムを用いて解析処理する必要性は低いと判断できるため、より精度が高い解析処理プログラムの実行はスキップされる。
 一方、取得した実行状態値82が第3解析処理プログラム130による解析処理が実行済であることを示していなければ(ステップS112においてNO)、解析装置100は、第3解析処理プログラム130を実行できる負荷状態であるか否かを判断する(ステップS116)。
 第3解析処理プログラム130を実行できる負荷状態であれば(ステップS116においてYES)、解析装置100は、第3解析処理プログラム130を実行して、報告内容50に含まれるテキスト54($textの値)を解析する(ステップS118)。そして、解析装置100は、第3解析処理プログラム130の実行により処理結果が取得されたか否かを判断する(ステップS120)。
 処理結果が取得されていれば(ステップS120においてYES)、解析装置100は、ステップS104およびS118において取得された情報に基づいて、処理結果データベース70および処理状態データベース80を更新する(ステップS122)。そして、処理は終了する。
 すなわち、解析装置100は、第1解析処理プログラム126による解析処理によってテキスト54を解析して処理結果を取得した後に、決定された単位エリアについて別の処理対象(報告内容50)の処理結果が格納されていなければ、第3解析処理プログラム130による解析処理によってテキスト54を解析して処理結果を取得し、当該処理結果を処理結果データベース70に格納する。
 一方、処理結果が取得されていなければ(ステップS120においてNO)、解析装置100は、ステップS104において取得した単位エリア72と、ステップS106において取得された処理結果に含まれるフレーズタイプ75と、ステップS106において取得された処理結果に含まれる意味カテゴリ76との組合せに対応する実行状態値82を、第3解析処理プログラム130による解析処理を実行済であるが、処理結果が取得できなかったことを示す値に更新する(ステップS124)。すなわち、実行状態値82として、「結果無で処理済(p3:対象のid)」が格納される。そして、処理は終了する。
 なお、先のステップS106において処理結果が取得できていなければ、対応する実行状態値82を特定できないので、ステップS122における処理状態データベース80の更新処理はスキップされる。
 一方、第3解析処理プログラム130を実行できる負荷状態でなければ(ステップS116においてNO)、解析装置100は、第2解析処理プログラム128を実行できる負荷状態であるか否かを判断する(ステップS126)。
 第2解析処理プログラム128を実行できる負荷状態であれば(ステップS126においてYES)、解析装置100は、第2解析処理プログラム128を実行して、報告内容50に含まれるテキスト54($textの値)を解析する(ステップS128)。このように、解析装置100は、第3解析処理プログラム130による解析処理を実行できない負荷状態であれば、第3解析処理プログラム130に代えて、第2解析処理プログラム128による解析処理によってテキスト54を解析する。
 続いて、解析装置100は、第2解析処理プログラム128の実行により処理結果が取得されたか否かを判断する(ステップS130)。
 処理結果が取得されていれば(ステップS130においてYES)、解析装置100は、ステップS104およびS128において取得された情報に基づいて、処理結果データベース70および処理状態データベース80を更新する(ステップS132)。そして、処理は終了する。
 すなわち、解析装置100は、第1解析処理プログラム126による解析処理によってテキスト54を解析して処理結果を取得した後に、決定された単位エリアについて別の処理対象(報告内容50)の処理結果が格納されていなければ、第2解析処理プログラム128による解析処理によってテキスト54を解析して処理結果を取得し、当該処理結果を処理結果データベース70に格納する。
 一方、処理結果が取得されていなければ(ステップS130においてNO)、解析装置100は、ステップS104において取得した単位エリア72と、ステップS106において取得された処理結果に含まれるフレーズタイプ75と、ステップS106において取得された処理結果に含まれる意味カテゴリ76との組合せに対応する実行状態値82を、第2解析処理プログラム128による解析処理を実行済であるが、処理結果が取得できなかったことを示す値に更新する(ステップS134)。すなわち、実行状態値82として、「結果無で処理済(p2:対象のid)」が格納される。そして、処理は終了する。
 なお、先のステップS106において処理結果が取得できていなければ、対応する実行状態値82を特定できないので、ステップS134における処理状態データベース80の更新処理はスキップされる。
 一方、第2解析処理プログラム128を実行できる負荷状態でなければ(ステップS126においてNO)、解析装置100は、ステップS104およびS106において取得された情報に基づいて、処理結果データベース70および処理状態データベース80を更新する(ステップS136)。そして、処理は終了する。
 以上のような処理手順が報告内容50の受信毎に繰り返し実行される。なお、以上のような処理手順は、並列的に実行されることが想定される。
 [G.解析処理の運用例]
 実際の運用においては、時間の経過に伴って、処理状態データベース80に登録される単位エリア72の多くが「処理済」に更新される。その結果、第3解析処理プログラム130などの精度が高い解析処理が実行される頻度が低下し得るので、所定時間(例えば、24時間)毎、あるいは、所定条件(例えば、登録された単位エリア72の80%が「処理済」になっているなど)の成立毎に、処理状態データベース80に登録されている所定範囲の単位エリア72、フレーズタイプ75、意味カテゴリ76の組合せに対応する実行状態値82を「未処理」に初期化するようにしてもよい。
 また、特定の意味カテゴリ76および/または特定のフレーズタイプ75については、高い精度を要求せず、それ以外を対象とする解析処理に対して、精度が高い解析処理を実行したい場合も存在し得る。このような要望に対しては、処理状態データベース80に登録されたすべての単位エリアについて、当該特定の意味カテゴリ76および/または当該特定のフレーズタイプ75との組合せに対応する実行状態値82を「結果有で処理済」に初期化するようにしてもよい。実行状態値82が「結果有で処理済」に設定されることで、対応する組合せに該当する報告内容50は、常に、第1解析処理プログラム126で処理されることになるため、要望に沿った処理を実現できる。
 逆に、特定の意味カテゴリ76および/または特定のフレーズタイプ75について、常に精度が高い解析処理を実行したい場合も存在し得る。このような要望に対しては、処理状態データベース80に登録されたすべての単位エリアについて、対象とする意味カテゴリ76とフレーズタイプ75との組合せに対応する実行状態値82を、「処理済」に更新すべき場合であっても、「未処理」に維持するようにしてもよい。実行状態値82が「未処理」に維持されることで、対応する組合せに該当する報告内容50は、第2解析処理プログラム128または第3解析処理プログラム130により解析されることになる。
 また、図9に示す解析処理は、報告内容50の受信毎に繰り返し実行されるが、これに加えて、事後的に追加の解析処理を実行するようにしてもよい。例えば、報告内容50の単位時間当たりの受信数が減少し、解析装置100の負荷状態が軽減されると、処理状態データベース80のエントリ(処理状態81)を参照し、解析処理プログラムpkで処理されているものをより高精度な解析処理プログラムpl(l>k)で追加的に処理するようにしてもよい。すなわち、解析装置100は、任意の単位エリア72についての処理結果の取得に用いられた解析処理より精度が高い解析処理を追加的に実行するようにしてもよい。このような解析処理を追加的に実行することで、より高精度および高品質な処理結果を収集できる。
 [H.応用例]
 上述の説明においては、主として、災害時における情報収集について例示したが、これに限らず、位置情報およびテキストを含む処理対象を効率的に処理しなければならない任意の局面に適用可能である。
 例えば、オリンピックなどの広範囲に開催されるイベントに参加した多くの参加者からの情報を効率的に収集するような局面に応用可能である。
 [I.まとめ]
 本実施の形態に従う情報処理システム1は、位置情報およびテキストを含む報告内容50を効率的に処理する。すなわち、位置情報およびテキストを含む処理対象のすべてを高精度に解析処理したいというニーズがあるが、高精度な解析処理にはコストおよび処理時間を必要とする。そのため、処理対象が膨大になる場合には、すべての処理対象を高精度に処理することが困難になる。
 そこで、本実施の形態に従う情報処理システム1は、位置情報の特性に基づいて、処理対象および処理内容を選別することで、処理全体を最適化する。より具体的には、情報処理システム1は、位置情報(単位エリア72)および意味フラグ(フレーズタイプ75および意味カテゴリ76)の単位で、報告内容50が「処理済」であるか否か、および、処理内容を管理する。そして、情報処理システム1は、位置情報および意味フラグの組合せについて、既に抽出されている情報と類似の情報が取得されるにすぎない可能性の高い報告内容50(すなわち、新規性が低いと推測される報告内容50)については、コストの低い(すなわち、精度が低い)解析処理のみで処理を完了する。このような処理対象の選別を行うことで、各時点において、それまでに情報が取得されていない単位エリア72に関する報告内容50が優先的に処理される。特に、情報が取得されていない単位エリア72については、より多くのコストをかけて、精度が高い解析処理が優先的に実行される。一方、既に情報が取得されている単位エリア72については、解析処理に要するコストを低減させることができる。
 この結果、処理全体として、情報の有用性を大きく損なうことなく、コストを軽減できる。すなわち、膨大な報告内容50のすべてをリアルタイムで処理するのではなく、位置情報などに基づいて処理の優先順位を決定することで、精度および処理速度のバランスを保ちつつ、解析処理を実行できる。
 今回開示された実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施の形態の説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
 1 情報処理システム、50 報告内容、51,78 識別情報、52 ユーザ情報、53,73 緯度経度情報、54 テキスト、55,77 写真添付属性、70 処理結果データベース、70A メインデータベース、70B エリアインデスックスデータベース、70C カテゴリインデックスデータベース、71 処理結果、72 単位エリア、74 フレーズ、75 フレーズタイプ、76 意味カテゴリ、80 処理状態データベース、81 処理状態、82 実行状態値、100 解析装置、102 CPU、104 GPU、106 主メモリ、108 ディスプレイ、110 ネットワークインターフェイス、112 入力デバイス、114 光学ドライブ、116 光学ディスク、118 内部バス、120 二次記憶装置、122 処理管理プログラム、124 逆ジオコードプログラム、126 第1解析処理プログラム、128 第2解析処理プログラム、130 第3解析処理プログラム、200 SNSサーバ、250 チャットボット、300 携帯端末。

Claims (6)

  1.  位置情報およびテキストを含む処理対象の処理結果を格納する処理結果データベースと、
     前記処理対象に含まれる前記位置情報に対応する単位エリアを決定するエリア決定手段と、
     第1解析処理と前記第1解析処理より精度が高い第2解析処理とを含む複数の解析処理のうち指定された解析処理によって、前記テキストを解析して処理結果を出力する解析手段と、
     前記第1解析処理によって前記テキストを解析して第1処理結果を取得した後に、前記決定された単位エリアについて別の処理対象の処理結果が既に格納されていれば、前記第1処理結果を前記処理結果データベースに追加し、前記決定された単位エリアについて別の処理対象の処理結果が格納されていなければ、前記第2解析処理によって前記テキストを解析して第2処理結果を取得し、前記処理結果データベースに格納する制御手段とを備える、情報処理システム。
  2.  前記複数の解析処理は、前記第1解析処理より精度が高く、かつ、前記第2解析処理より精度が低い第3解析処理をさらに含み、
     前記制御手段は、前記第2解析処理を実行できない負荷状態であれば、前記第2解析処理に代えて、前記第3解析処理によって前記テキストを解析する、請求項1に記載の情報処理システム。
  3.  前記処理結果は、抽出すべき情報を示す文字列であるフレーズと、当該フレーズの意味を示す意味情報とを含む、請求項1または2に記載の情報処理システム。
  4.  解析処理の処理状態を単位エリア毎に格納する処理状態データベースをさらに備え、
     前記処理状態は、解析処理が実行されて処理結果が取得された状態と、解析処理が実行されて処理結果が取得されていない状態と、解析処理が未だ実行されていない状態とのうちいずれかを設定可能になっている、請求項1~3のいずれか1項に記載の情報処理システム。
  5.  位置情報およびテキストを含む処理対象を受信するステップと、
     前記処理対象に含まれる前記位置情報に対応する単位エリアを決定するステップと、
     第1解析処理によって前記テキストを解析して第1処理結果を取得するステップと、
     前記決定された単位エリアについて別の処理対象の処理結果が既に処理結果データベースに格納されているか否かを判断するステップと、
     前記決定された単位エリアについて別の処理対象の処理結果が既に前記処理結果データベースに格納されていれば、前記第1処理結果を前記処理結果データベースに追加するステップと、
     前記決定された単位エリアについて別の処理対象の処理結果が前記処理結果データベースに格納されていなければ、前記第1解析処理より精度が高い第2解析処理によって前記テキストを解析して第2処理結果を取得し、前記処理結果データベースに格納するステップとを備える、情報処理方法。
  6.  コンピュータに請求項5に記載の情報処理方法を実行させるための情報処理プログラム。
PCT/JP2022/005868 2021-03-31 2022-02-15 情報処理システム、情報処理方法および情報処理プログラム WO2022209371A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/281,902 US20240152565A1 (en) 2021-03-31 2022-02-15 Information processing system, information processing method and information processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-061285 2021-03-31
JP2021061285A JP2022157192A (ja) 2021-03-31 2021-03-31 情報処理システム、情報処理方法および情報処理プログラム

Publications (1)

Publication Number Publication Date
WO2022209371A1 true WO2022209371A1 (ja) 2022-10-06

Family

ID=83458761

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/005868 WO2022209371A1 (ja) 2021-03-31 2022-02-15 情報処理システム、情報処理方法および情報処理プログラム

Country Status (3)

Country Link
US (1) US20240152565A1 (ja)
JP (1) JP2022157192A (ja)
WO (1) WO2022209371A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269391A (ja) * 2007-04-23 2008-11-06 Yahoo Japan Corp 係り受けを解析する方法
WO2019208411A1 (ja) * 2018-04-26 2019-10-31 日本電気株式会社 データ解析装置、精度推定装置、データ解析方法および記憶媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008269391A (ja) * 2007-04-23 2008-11-06 Yahoo Japan Corp 係り受けを解析する方法
WO2019208411A1 (ja) * 2018-04-26 2019-10-31 日本電気株式会社 データ解析装置、精度推定装置、データ解析方法および記憶媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MIZUNO JUNTA, MASAHIRO TANAKA, KIYOTAKA OHTAKE, JONGHUN WU, JULIEN KLOETZER, RIKI HASHIMOTO, KENTARO TORIZAWA: "Large-scale information analysis system WISDOM X, DISAANA, D-SUMM", PROCEEDINGS OF THE 23RD ANNUAL CONFERENCE OF THE ASSOCIATION FOR NATURAL LANGUAGE PROCESSING; MARCH 13 (MON) - MARCH 17 (FRI), 2017, ASSOCIATION FOR NATURAL LANGUAGE PROCESSING, JP, 1 March 2017 (2017-03-01) - 17 March 2017 (2017-03-17), JP, pages 1077 - 1080, XP055972368 *

Also Published As

Publication number Publication date
US20240152565A1 (en) 2024-05-09
JP2022157192A (ja) 2022-10-14

Similar Documents

Publication Publication Date Title
US10725836B2 (en) Intent-based organisation of APIs
US9720944B2 (en) Method for facet searching and search suggestions
US10452661B2 (en) Automated database schema annotation
US20180225372A1 (en) User classification based on multimodal information
US20130124194A1 (en) Systems and methods for manipulating data using natural language commands
US11687794B2 (en) User-centric artificial intelligence knowledge base
US11727058B2 (en) Unsupervised automatic taxonomy graph construction using search queries
KR101965276B1 (ko) 그래프 기반의 데이터 분석 시스템 및 방법과, 이를 위한 컴퓨터 프로그램
US20230194302A1 (en) Method of updating map data, electronic device and storage medium
US20230334046A1 (en) Obtaining inferences to perform access requests at a non-relational database system
CN114254389A (zh) 报文脱敏方法、装置、电子设备及介质
US9465658B1 (en) Task distribution over a heterogeneous environment through task and consumer categories
WO2022209371A1 (ja) 情報処理システム、情報処理方法および情報処理プログラム
US10872085B2 (en) Recording lineage in query optimization
US20220179832A1 (en) File moving method, electronic device, and medium
JP2024507029A (ja) ウェブページ識別方法、装置、電子機器、媒体およびコンピュータプログラム
WO2018147150A1 (ja) 推論用知識生成装置、推論用知識生成方法、及びコンピュータ読み取り可能な記録媒体
CN114969819A (zh) 数据资产风险发现方法和装置
JP6333306B2 (ja) 検索データ管理装置、検索データ管理方法、および検索データ管理プログラム
US11748395B2 (en) Developing object ontologies and data usage models using machine learning
US11960541B2 (en) Name data matching apparatus, and name data matching method and program
US11797549B2 (en) Techniques for linking data to provide improved searching capabilities
US20240012909A1 (en) Correction of non-compliant files in a code repository
EP4064076A1 (en) System and method for knowledge retrieval using ontology-based context matching
US20220358126A1 (en) Lightweight graph database and searchable datastore

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22779598

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18281902

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22779598

Country of ref document: EP

Kind code of ref document: A1