JP6844143B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP6844143B2 JP6844143B2 JP2016152282A JP2016152282A JP6844143B2 JP 6844143 B2 JP6844143 B2 JP 6844143B2 JP 2016152282 A JP2016152282 A JP 2016152282A JP 2016152282 A JP2016152282 A JP 2016152282A JP 6844143 B2 JP6844143 B2 JP 6844143B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- posted
- missing
- format
- multimodal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
配信される構造化文書をカスタマイズする方法であって、消費者コンピュータにおいて構造化文書を受信し、構造化文書を、それぞれ複数の選択可能なコンテンツ代替を有する複数の可変コンテンツセクションにセグメント化し、各可変コンテンツセクション毎に、コンテンツ代替を消費者の消費者プロファイルに対して評価することで、セクションを増補するコンテンツ代替の1つを選択し、セクションを選択されたコンテンツ代替で増補し、増補した構造化文書を消費者に対して表示装置上に提示する技術が開示されている。
本発明は、複数形式の情報を用いて機械学習を行う場合に、欠けている情報を補間しない構成と比較して、訓練及び識別の少なくとも何れか一方の精度を向上させることを目的とする。
請求項2に記載の発明は、複数形式の情報のうち一部の形式の情報が欠けている場合に、当該複数形式の情報に関連し欠けている情報の形式を有する関連情報により、欠けている形式の情報を補間する補間手段と、前記欠けている形式の情報が補間された前記複数形式の情報を用いて、訓練及び識別の少なくとも何れか一方の処理を実行する処理実行手段とを備え、前記補間手段は、前記関連情報として、前記複数形式の情報のうち欠けていない情報が投稿された位置から予め定められた範囲内の位置にて投稿された情報を取得することを特徴とする情報処理装置である。
請求項3に記載の発明は、前記補間手段は、前記複数形式の情報のうち第1形式の情報が欠けており、第2形式の情報が欠けていない場合に、当該欠けていない第2形式の情報との類似度が予め定められた条件を満たす第2形式の他の情報と共に投稿された第1形式の情報を、前記関連情報として取得することを特徴とする請求項1又は2に記載の情報処理装置である。
請求項4に記載の発明は、前記補間手段は、前記欠けていない第2形式の情報がテキスト形式の情報である場合に、テキスト形式の情報から算出される文書ベクトルの類似度により、当該欠けていない第2形式の情報との類似度が予め定められた条件を満たすテキスト形式の他の情報と共に投稿された第1形式の情報を、前記関連情報として取得することを特徴とする請求項3に記載の情報処理装置である。
請求項2記載の発明によれば、複数形式の情報を用いて機械学習を行う場合に、欠けている情報を補間しない構成と比較して、訓練及び識別の少なくとも何れか一方の精度を向上させることができる。
請求項3記載の発明によれば、複数形式の情報のうち一部が欠けている場合に、欠けていない情報との類似度を基にして補間することができるようになる。
請求項4記載の発明によれば、複数形式の情報の多くにテキスト形式の情報が含まれる場合に、多くの複数形式の情報について補間することができるようになる。
<背景>
まず、本実施の形態の背景について説明する。
図1は、機械学習の一例を説明するための図である。図1に示す例は、ニューラルネットワークのモデルを用いた機械学習を示している。具体的には、入力されるデータ(入力データ)は入力層を通り、中間層、出力層を通過して処理され、出力結果(出力データ)が生成される。訓練の処理では、複数のデータを入力し、入力層、中間層、出力層を繋ぐ重み付けの調整が行われる。このような訓練を行って重み付けを調整することにより、何らかのデータを入力して識別する場合に希望する出力結果が得られるようになる。
このようなマルチモダル情報としては、例えば、Twitter(登録商標),Instagram(登録商標)などのソーシャル・ネットワーキング・サービス(SNS)にてユーザに投稿され、公開されている情報を例示することができる。
本実施の形態が適用されるコンピュータシステムについて説明する。図2は、本実施の形態が適用されるコンピュータシステムの全体構成例を示した図である。図示するように、このコンピュータシステムでは、クライアント端末100(図示の例では、クライアント端末100a〜100c)、情報記憶装置200、マルチモダル識別装置300がネットワーク400に接続されている。
より具体的には、マルチモダル識別装置300は、情報記憶装置200に記憶された投稿情報を取得し、取得した投稿情報を基に訓練を行う。詳しくは後述するが、この訓練において、マルチモダル識別装置300は、取得した投稿情報がマルチモダル情報ではなく、欠落している情報がある場合、欠落している情報を補間してから訓練を行う。
また、マルチモダル識別装置300は、訓練により訓練モデルを生成した後、生成した訓練モデルを用いて、情報記憶装置200から取得した投稿情報の識別を行う。詳しくは後述するが、この識別において、マルチモダル識別装置300は、取得した投稿情報がマルチモダル情報ではなく、欠落している情報がある場合、欠落している情報を補間してから識別を行う。
次に、本実施の形態に係るマルチモダル識別装置300のハードウェア構成について説明する。図3は、本実施の形態に係るマルチモダル識別装置300のハードウェア構成例を示す図である。図示するように、マルチモダル識別装置300は、演算手段であるCPU(Central Processing Unit)301と、記憶手段であるメインメモリ302及び磁気ディスク装置303とを備える。
さらに、マルチモダル識別装置300は、外部との通信を行うための通信インタフェース(通信I/F)304と、ビデオメモリやディスプレイ等からなる表示機構305と、キーボードやマウス等の入力デバイス306とを備える。
<マルチモダル識別装置の機能構成>
実施の形態1について説明を行う。
図4は、実施の形態1に係るマルチモダル識別装置300の機能構成例を示したブロック図である。マルチモダル識別装置300は、投稿情報における情報の欠落を検出する情報欠落検出部311と、欠落している情報を補間するための情報である関連情報を選択する関連情報選択部312と、欠落した情報を関連情報により補間する情報補間部313と、投稿情報を基に訓練及び識別を行うマルチモダル識別部314と、訓練により生成される訓練モデルを格納する訓練モデル格納部315とを備える。
本実施の形態において、関連情報選択部312は、候補情報抽出部312aと候補情報選択部312bとを有する。
また、本実施の形態では、補間手段の一例として、関連情報選択部312、情報補間部313が用いられる。処理実行手段の一例として、マルチモダル識別部314が用いられる。
次に、欠落している情報を補間するための情報である関連情報を選択する処理について、詳細に説明する。図5(a)、(b)は、実施の形態1に係る関連情報の選択処理の一例を説明するための図である。図5(a)、(b)に示す例では、あるユーザ(図示の例において、ユーザAとする)が投稿した投稿情報を示している。そして、それぞれの投稿情報について、テキスト情報、画像情報の有無を示している。
このようにして、「t=0」の投稿情報に対して、「t=−1」の画像情報が補間される。結果として、「t=0」のテキスト情報及び「t=−1」の画像情報がマルチモダル情報として、マルチモダル識別部314における訓練や識別に用いられる。
このようにして、「t=0」の投稿情報に対して、「t=−2」のテキスト情報が補間される。結果として、「t=0」の画像情報及び「t=−2」のテキスト情報がマルチモダル情報として、マルチモダル識別部314における訓練や識別に用いられる。
次に、本実施の形態に係るマルチモダル識別装置300による処理の手順について説明する。マルチモダル識別装置300による訓練時の処理と識別時の処理とに分けて説明する。図6(a)は、実施の形態1に係るマルチモダル識別装置300による訓練時の処理の手順を示したフローチャートである。図6(b)は、実施の形態1に係るマルチモダル識別装置300による識別時の処理の手順を示したフローチャートである。
情報欠落検出部311は、情報記憶装置200から訓練に用いる投稿情報を取得する(ステップ101)。ここで、投稿情報の取得条件を定めて、取得条件を満たす投稿情報を取得することとしても良い。取得条件としては、例えば、投稿情報が投稿された期間を指定したり、投稿情報が投稿された地域や投稿情報を投稿したユーザを指定したりすることが考えられる。
一方、ステップ102において、投稿情報に欠落している情報があると判定された場合(ステップ102でYes)、投稿情報は関連情報選択部312に出力される。次に、関連情報選択部312の候補情報抽出部312aは、投稿情報の抽出範囲を過去の投稿にまで拡大して、関連情報の候補となる過去の投稿情報を取得する(ステップ103)。次に、候補情報選択部312bは、候補情報抽出部312aが取得した過去の投稿情報の中から、関連情報を選択する(ステップ104)。
情報欠落検出部311は、情報記憶装置200から識別の対象とする投稿情報を取得する(ステップ201)。ここで、図6(a)のステップ101と同様に、投稿情報の取得条件を定めても良い。次のステップ202〜ステップ205の処理は、図6(a)のステップ102〜ステップ105の処理と同様であるため、ここでは説明を省略する。
例えば、図5(a)に示す例では、「t=0」の投稿情報に対して、「t=−1」の画像情報が補間された。ここで、関連情報選択部312が、「t=0」のテキスト情報と「t=−1」のテキスト情報との類似度、「t=0」のテキスト情報と「t=−3」のテキスト情報との類似度の計算を行ったとする。その結果、「t=−1」のテキスト情報よりも「t=−3」のテキスト情報の方が、「t=0」のテキスト情報に類似していると判断された場合、「t=−1」の画像情報ではなく、「t=−3」の画像情報を選択して補間することとしても良い。
次に、実施の形態1の変形例について説明する。図7は、実施の形態1の変形例におけるマルチモダル識別装置300の機能構成例を示したブロック図である。この変形例では、図4に示す実施の形態1の構成と比較して、関連情報選択部312がさらに候補範囲指定部312cを有している。情報欠落検出部311、情報補間部313、マルチモダル識別部314、訓練モデル格納部315の機能は、図4の場合と同様である。よって以下、図4に示す実施の形態1の構成と異なる点として、関連情報選択部312について説明を行う。
図8(a)に示すグラフでは、「t=−1」、「t=−2」、「t=−3」、「t=−4」のそれぞれのテキスト情報に関して、「t=0」のテキスト情報との類似度の値を示している。ここでは、類似度の値が小さいほど「t=0」のテキスト情報と類似していることを表している。上述したように、通常、投稿内容は、投稿された時刻が近いほど類似し(即ち、類似度の値が小さくなり)、投稿された時刻が離れるほど類似しない(即ち、類似度の値が大きくなる)傾向にある。そこで、候補範囲指定部312cは、類似度の値が予め定められた条件を満たす範囲、ここでは、類似度の値が予め定められた閾値THを下回る範囲を、関連情報の候補とする範囲として指定する。
<マルチモダル識別装置の機能構成>
次に、実施の形態2について説明を行う。
実施の形態1では、情報が欠落していると判定された投稿情報を投稿したユーザの過去の投稿を基に、欠落している情報を補間する。これに対して、本実施の形態では、情報が欠落していると判定された投稿情報を投稿したユーザの位置と地理的に近接する場所からの投稿を基に、欠落している情報を補間する。
付言すると、例えば、遊園地やイベント会場などの共通の場所から投稿された情報には、同一(又は類似)の内容が記述されている可能性が高いと考えられる。そこで、本実施の形態では、地理的に近接する場所から投稿された投稿情報を基に、欠落している情報を補間する。
候補位置情報抽出部312dは、投稿情報の抽出範囲を地理的に近接するところまで拡大して、関連情報の候補となる情報群を抽出する。より具体的には、候補位置情報抽出部312dは、情報が欠落していると判定された投稿情報を投稿したユーザ(以下、対象ユーザと称する)の位置情報を取得する。そして、対象ユーザの位置に近接する場所、言い換えると、対象ユーザの位置から予め定められた範囲内から投稿された他のユーザ(以下、近接ユーザと称する)の投稿情報を、情報記憶装置200から取得する。ここで取得される情報群(即ち、近接ユーザの投稿情報)は、関連情報の候補として扱われる。
次に、関連情報を選択する処理について、詳細に説明する。図10(a)、(b)は、実施の形態2に係る関連情報の選択処理の一例を説明するための図である。
また、例えば、実施の形態1の変形例において計算する類似度を基に、どの近隣ユーザの画像情報を選択するか決めても良い。この場合、候補位置情報抽出部312dは、例えば、対象ユーザのテキスト情報と各近隣ユーザのテキスト情報との類似度を計算する。そして、計算した類似度を基に、投稿内容が対象ユーザと最も類似している近隣ユーザの画像情報を選択する。
さらに、例えば、画像情報を投稿した複数の近隣ユーザの中で、対象ユーザの投稿時刻に最も近い時刻に投稿された画像情報を選択することとしても良い。
次に、本実施の形態に係るマルチモダル識別装置300による処理の手順について説明する。マルチモダル識別装置300による訓練時の処理と識別時の処理とに分けて説明する。図11(a)は、実施の形態2に係るマルチモダル識別装置300による訓練時の処理の手順を示したフローチャートである。図11(b)は、実施の形態2に係るマルチモダル識別装置300による識別時の処理の手順を示したフローチャートである。
情報欠落検出部311は、情報記憶装置200から訓練に用いる投稿情報を取得する(ステップ301)。ここで、図6のステップ101と同様に、投稿情報の取得条件を定めても良い。次に、情報欠落検出部311は、取得した投稿情報に欠落している情報があるか否かを判定する(ステップ302)。ここでは、図6のステップ102と同様に、取得した投稿情報が欠落検出条件を満たしているか否かの判定が行われる。
一方、ステップ302において、投稿情報に欠落している情報があると判定された場合(ステップ302でYes)、投稿情報は関連情報選択部312に出力される。次に、関連情報選択部312の候補位置情報抽出部312dは、投稿情報の抽出範囲を地理的に近接するところまで拡大して、関連情報の候補となる他ユーザの投稿情報を取得する(ステップ303)。次に、候補情報選択部312bは、候補位置情報抽出部312dが取得した他ユーザの投稿情報の中から、関連情報を選択する(ステップ304)。
情報欠落検出部311は、情報記憶装置200から識別の対象とする投稿情報を取得する(ステップ401)。ここで、図11(a)のステップ301と同様に、投稿情報の取得条件を定めても良い。次のステップ402〜ステップ405の処理は、図11(a)のステップ302〜ステップ305の処理と同様であるため、ここでは説明を省略する。
Claims (4)
- 複数形式の情報のうち一部の形式の情報が欠けている場合に、当該複数形式の情報に関連し欠けている情報の形式を有する関連情報により、欠けている形式の情報を補間する補間手段と、
前記欠けている形式の情報が補間された前記複数形式の情報を用いて、訓練及び識別の少なくとも何れか一方の処理を実行する処理実行手段と
を備え、
前記補間手段は、前記関連情報として、前記複数形式の情報のうち欠けていない情報が投稿された時刻から予め定められた時間内に投稿された情報を取得すること
を特徴とする情報処理装置。 - 複数形式の情報のうち一部の形式の情報が欠けている場合に、当該複数形式の情報に関連し欠けている情報の形式を有する関連情報により、欠けている形式の情報を補間する補間手段と、
前記欠けている形式の情報が補間された前記複数形式の情報を用いて、訓練及び識別の少なくとも何れか一方の処理を実行する処理実行手段と
を備え、
前記補間手段は、前記関連情報として、前記複数形式の情報のうち欠けていない情報が投稿された位置から予め定められた範囲内の位置にて投稿された情報を取得すること
を特徴とする情報処理装置。 - 前記補間手段は、前記複数形式の情報のうち第1形式の情報が欠けており、第2形式の情報が欠けていない場合に、当該欠けていない第2形式の情報との類似度が予め定められた条件を満たす第2形式の他の情報と共に投稿された第1形式の情報を、前記関連情報として取得すること
を特徴とする請求項1又は2に記載の情報処理装置。 - 前記補間手段は、前記欠けていない第2形式の情報がテキスト形式の情報である場合に、テキスト形式の情報から算出される文書ベクトルの類似度により、当該欠けていない第2形式の情報との類似度が予め定められた条件を満たすテキスト形式の他の情報と共に投稿された第1形式の情報を、前記関連情報として取得すること
を特徴とする請求項3に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016152282A JP6844143B2 (ja) | 2016-08-02 | 2016-08-02 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016152282A JP6844143B2 (ja) | 2016-08-02 | 2016-08-02 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018022290A JP2018022290A (ja) | 2018-02-08 |
JP6844143B2 true JP6844143B2 (ja) | 2021-03-17 |
Family
ID=61164494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016152282A Active JP6844143B2 (ja) | 2016-08-02 | 2016-08-02 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6844143B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113465734B (zh) * | 2021-09-02 | 2021-12-10 | 清华大学 | 一种结构振动的实时估计方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040205482A1 (en) * | 2002-01-24 | 2004-10-14 | International Business Machines Corporation | Method and apparatus for active annotation of multimedia content |
JP5737718B2 (ja) * | 2011-11-08 | 2015-06-17 | Kddi株式会社 | 携帯端末を所持したユーザの生活パターンを推定する装置、プログラム及び方法 |
JP5367112B2 (ja) * | 2012-03-22 | 2013-12-11 | 株式会社東芝 | データ分析支援装置およびデータ分析支援処理プログラム |
JP6446971B2 (ja) * | 2014-10-06 | 2019-01-09 | 日本電気株式会社 | データ処理装置、データ処理方法、及び、コンピュータ・プログラム |
-
2016
- 2016-08-02 JP JP2016152282A patent/JP6844143B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018022290A (ja) | 2018-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111061946B (zh) | 场景化内容推荐方法、装置、电子设备及存储介质 | |
US9996531B1 (en) | Conversational understanding | |
JP6759844B2 (ja) | 画像を施設に対して関連付けるシステム、方法、プログラム及び装置 | |
US10223727B2 (en) | E-commerce recommendation system and method | |
CN110431514B (zh) | 用于情境驱动智能的系统和方法 | |
JP6662119B2 (ja) | ソーシャルメディア投稿のキャプションを生成する方法、プログラム及びサーバ装置 | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
EP3244403A1 (en) | Dialogue processing program, dialogue processing method, and information processing device | |
US11397764B2 (en) | Machine learning for digital image selection across object variations | |
JP6911603B2 (ja) | ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置 | |
US11803872B2 (en) | Creating meta-descriptors of marketing messages to facilitate in delivery performance analysis, delivery performance prediction and offer selection | |
KR102167593B1 (ko) | 분산 퍼지 연관 규칙 마이닝에 기반한 영화 추천 장치 및 방법 | |
KR102502985B1 (ko) | 대상 추천 방법, 신경망 및 그 훈련 방법, 장치 및 매체 | |
US20200074175A1 (en) | Object cognitive identification solution | |
JP6844143B2 (ja) | 情報処理装置 | |
JP6822484B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Zhang et al. | Image tweet popularity prediction with convolutional neural network | |
CN108427730A (zh) | 一种基于随机游走和条件随机场的社会标签推荐方法 | |
US20210199457A1 (en) | System and Method Using Deep Learning Machine Vision to Analyze Localities | |
CN113962417A (zh) | 一种视频处理方法、装置、电子设备和存储介质 | |
KR20180003932A (ko) | 컨텐츠 포스팅 방법 및 포스팅 장치 | |
JP6433876B2 (ja) | パラメータ推定装置、予測装置、方法、及びプログラム | |
CN115186085A (zh) | 回复内容处理方法以及媒体内容互动内容的交互方法 | |
US11716350B2 (en) | Systems and methods of detecting anomalous websites | |
KR20230065339A (ko) | 모델 데이터 처리 방법, 장치, 전자 기기 및 컴퓨터 판독 가능 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200818 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210126 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6844143 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |