JP2018032304A - 情報解析装置、情報解析方法、および情報解析プログラム - Google Patents
情報解析装置、情報解析方法、および情報解析プログラム Download PDFInfo
- Publication number
- JP2018032304A JP2018032304A JP2016165503A JP2016165503A JP2018032304A JP 2018032304 A JP2018032304 A JP 2018032304A JP 2016165503 A JP2016165503 A JP 2016165503A JP 2016165503 A JP2016165503 A JP 2016165503A JP 2018032304 A JP2018032304 A JP 2018032304A
- Authority
- JP
- Japan
- Prior art keywords
- content
- vector
- query
- information
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 84
- 239000013598 vector Substances 0.000 claims abstract description 220
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 238000006243 chemical reaction Methods 0.000 claims description 46
- 238000000034 method Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 230000017105 transposition Effects 0.000 description 15
- 230000004044 response Effects 0.000 description 12
- 238000011156 evaluation Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 4
- 238000009795 derivation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
情報解析装置は、一以上のプロセッサによって実現される。情報解析装置は、コンテンツの検索時に入力された検索クエリが、ベクトルに変換されたクエリベクトルを取得または導出し、当該クエリベクトルに対してコンテンツの選択に寄与した程度に基づく重みを付与し、重みを付与したクエリベクトルに基づいて、メタ情報を生成してコンテンツに付与する装置である。コンテンツに付与されたメタ情報は、コンテンツ間の類似検索や、検索クエリ−コンテンツ間の類似検索など、種々の類似検索に利用することができる。
[全体構成]
図1は、第1実施形態における情報解析装置100を含む情報解析システム1の一例を示す図である。第1実施形態における情報解析システム1は、例えば、ログ取得装置10と、サービス提供装置20と、クエリ‐ベクトル変換装置30と、情報解析装置100とを備える。これらの装置は、ネットワークNWを介して接続される。なお、情報解析システム1に含まれる複数の装置の一部または全部は、一つの情報解析装置100内に集約されていてもよい。
以下、図を参照して情報解析装置100の構成について説明する。図2は、第1実施形態における情報解析装置100の一例を示す図である。図示のように、情報解析装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
以下、情報解析システム1による処理についてフローチャートを用いて説明する。図9は、第1実施形態における情報解析システム1による一連の処理の流れの一例を示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われる。
以下、第1実施形態において生成されたコンテンツベクトルの利用例について説明する。例えば、サービス提供装置20は、あるユーザが画像検索サイトに入力した検索クエリを、クエリ‐ベクトル変換装置30に依頼する等してベクトル(以下、ユーザベクトルと称する)に変換し、ユーザベクトルと、画像などのコンテンツをベクトル化したコンテンツベクトル(上述した画像ベクトルに相当するベクトル)との類似性について分析する。ユーザベクトルは、例えば、ユーザを識別することが可能な情報(例えば氏名や電話番号など)をベクトルに変換したものである。
以下、第2実施形態について説明する。第2実施形態における情報解析システム1Aでは、提供するコンテンツが互いに異なる複数のウェブサービスの各々において検索クエリが入力された場合に、各ウェブサービスで提供されるコンテンツのそれぞれについて、コンテンツベクトルを生成する点で上述した第1実施形態と相違する。第2実施形態では、一例として、画像およびアイテムの2つのコンテンツについてコンテンツベクトルを生成するものとして説明するが、種類の異なる3つ以上のコンテンツについてコンテンツベクトルが生成されてもよい。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
以下、第2実施形態において生成されたコンテンツベクトルの利用例について説明する。例えば、第2実施形態におけるサービス提供装置20は、クエリ‐ベクトル変換装置30によって、一つのコーパス132から作成された複数のクエリベクトルに基づいて生成された複数のコンテンツベクトルを、そのコンテンツベクトル同士の関連性に基づいてクラスタリング処理を行って分類する。第2実施形態におけるサービス提供装置20は、「分類部」の一例である。
以下、第3実施形態について説明する。第3実施形態における情報解析装置100Bは、クエリ‐ベクトル変換装置30の機能を有する点で上述した第1および第2実施形態と相違する。以下、第1および第2実施形態との相違点を中心に説明し、これらの実施形態と共通する点については説明を省略する。
上述した実施形態の情報解析システムに含まれる複数の装置のうち、少なくともサービス提供装置20および情報解析装置100、100A、100Bは、例えば、図17に示すようなハードウェア構成により実現される。図17は、実施形態のサービス提供装置20および情報解析装置100、100A、100Bのハードウェア構成の一例を示す図である。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
Claims (11)
- コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出する抽出部と、
前記抽出部により抽出された検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与する付与部と、
前記付与部により重みが付与されたクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成する生成部と、
を備える情報解析装置。 - 前記検索クエリと、前記検索クエリが変換されたクエリベクトルとが対応付けられた組み合わせを複数含むベクトル変換情報を取得する取得部を更に備え、
前記抽出部は、前記取得部により取得された前記ベクトル変換情報を検索することで、前記抽出した検索クエリに対応付けられている前記クエリベクトルを抽出する、
請求項1に記載の情報解析装置。 - 前記履歴情報に含まれる前記検索クエリを前記クエリベクトルに変換する変換部を更に備え、
前記付与部は、前記変換部により変換された前記クエリベクトルの中から、前記抽出部により抽出された検索クエリから変換されたクエリベクトルを検索し、前記検索して得られたクエリベクトルに対して前記重みを付与する、
請求項1に記載の情報解析装置。 - 前記抽出部は、前記履歴情報において、前記着目コンテンツに複数の検索クエリが対応付けられている場合、前記複数の検索クエリを抽出し、
前記付与部は、前記抽出部により抽出された前記複数の検索クエリの各々がベクトルに変換された複数のクエリベクトルに対して前記重みを付与し、
前記生成部は、前記付与部により前記重みが付与された前記複数のクエリベクトルを加算したベクトルを、前記メタ情報として生成する、
請求項1から3のうちいずか1項に記載の情報解析装置。 - 前記履歴情報は、提供するコンテンツが互いに異なる複数のウェブサービスの各々において前記検索クエリが入力される場合に、前記複数のウェブサービスの各々に基づいて生成され、
前記検索クエリが前記クエリベクトルに変換される際に、前記複数のウェブサービスの各々に基づいて生成された履歴情報のうち、他の履歴情報に含まれる内容を包含する履歴情報が用いられる、
請求項1から4のうちいずれか1項に記載の情報解析装置。 - 前記付与部は、前記抽出部により抽出された検索クエリがベクトルに変換されたクエリベクトルに対して、前記検索クエリが入力された対象のサービスにおいて前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与する、
請求項1から5のうちいずれか1項に記載の情報解析装置。 - 前記抽出部により抽出された前記検索クエリがベクトルに変換される際に用いられるコーパスが共通する複数のサービスにおける、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づいて生成したメタ情報を、互いに関連する情報として出力する、
請求項1から6のうちいずれか1項に記載の情報解析装置。 - 前記着目コンテンツに関連付けられた前記メタ情報に対してクラスタリング処理を行って、前記着目コンテンツを分類する分類部を更に備える、
請求項1から7のうちいずれか1項に記載の情報解析装置。 - コンテンツの検索時に入力された検索クエリの集合と、前記集合に含まれる検索クエリのそれぞれをベクトル化したクエリベクトルに基づいて、前記コンテンツにメタ情報を付与する情報解析装置。
- コンピュータが、
コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出し、
前記抽出した検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与し、
前記重みを付与したクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成する、
情報解析方法。 - コンピュータに、
コンテンツの検索時に入力された検索クエリと、前記検索クエリの入力に応じて選択されたコンテンツとが対応付けられた履歴情報に基づいて、前記履歴情報に含まれる着目コンテンツに関して、前記着目コンテンツに対応付けられた検索クエリを抽出させ、
前記抽出させた検索クエリがベクトルに変換されたクエリベクトルに対して、前記着目コンテンツが選択されたことへの寄与度を示す指標値に基づく重みを付与させ、
前記重みを付与させたクエリベクトルに基づいて、前記着目コンテンツに関連付けるメタ情報を生成させる、
情報解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016165503A JP6160018B1 (ja) | 2016-08-26 | 2016-08-26 | 情報解析装置、情報解析方法、および情報解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016165503A JP6160018B1 (ja) | 2016-08-26 | 2016-08-26 | 情報解析装置、情報解析方法、および情報解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6160018B1 JP6160018B1 (ja) | 2017-07-12 |
JP2018032304A true JP2018032304A (ja) | 2018-03-01 |
Family
ID=59308890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016165503A Active JP6160018B1 (ja) | 2016-08-26 | 2016-08-26 | 情報解析装置、情報解析方法、および情報解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6160018B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6560843B1 (ja) * | 2018-03-16 | 2019-08-14 | 楽天株式会社 | 検索システム、検索方法、及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009266096A (ja) * | 2008-04-28 | 2009-11-12 | Sony Corp | 情報処理装置、および関連アイテムの提供方法 |
JP2010033377A (ja) * | 2008-07-29 | 2010-02-12 | Yahoo Japan Corp | Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム |
JP2010123036A (ja) * | 2008-11-21 | 2010-06-03 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置、文書検索方法、および文書検索プログラム |
US20160085860A1 (en) * | 2013-05-14 | 2016-03-24 | Telefonaktiebolaget L M Ericsson (Publ) | Search engine for textual content and non-textual content |
-
2016
- 2016-08-26 JP JP2016165503A patent/JP6160018B1/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009266096A (ja) * | 2008-04-28 | 2009-11-12 | Sony Corp | 情報処理装置、および関連アイテムの提供方法 |
JP2010033377A (ja) * | 2008-07-29 | 2010-02-12 | Yahoo Japan Corp | Webクエリに対する検索要求属性を自動推定する検索装置、検索方法及びプログラム |
JP2010123036A (ja) * | 2008-11-21 | 2010-06-03 | Nippon Telegr & Teleph Corp <Ntt> | 文書検索装置、文書検索方法、および文書検索プログラム |
US20160085860A1 (en) * | 2013-05-14 | 2016-03-24 | Telefonaktiebolaget L M Ericsson (Publ) | Search engine for textual content and non-textual content |
Non-Patent Citations (1)
Title |
---|
村田 眞哉,他: ""クリックログ解析による情報要求ベースの検索結果ランキング"", 日本データベース学会論文誌, vol. 第7巻,第4号, JPN6016046781, 27 March 2009 (2009-03-27), pages 37 - 42, ISSN: 0003556443 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6560843B1 (ja) * | 2018-03-16 | 2019-08-14 | 楽天株式会社 | 検索システム、検索方法、及びプログラム |
WO2019176102A1 (ja) * | 2018-03-16 | 2019-09-19 | 楽天株式会社 | 検索システム、検索方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6160018B1 (ja) | 2017-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102056822B1 (ko) | 학습 서비스 제공 방법 및 그 장치 | |
JP7343568B2 (ja) | 機械学習のためのハイパーパラメータの識別および適用 | |
US10671812B2 (en) | Text classification using automatically generated seed data | |
US9818142B2 (en) | Ranking product search results | |
CN105247507B (zh) | 用于确定品牌的影响力得分的方法、系统和存储介质 | |
US20140222503A1 (en) | Dynamic prediction of online shopper's intent using a combination of prediction models | |
US20140095308A1 (en) | Advertisement distribution apparatus and advertisement distribution method | |
US20100079464A1 (en) | Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products | |
US9128988B2 (en) | Search result ranking by department | |
CN109564573A (zh) | 来自计算机应用元数据的平台支持集群 | |
CN108269122B (zh) | 广告的相似度处理方法和装置 | |
US10515378B2 (en) | Extracting relevant features from electronic marketing data for training analytical models | |
WO2018227930A1 (zh) | 智能提示答案的方法及装置 | |
JP2018005662A (ja) | 情報解析装置、情報解析方法、および情報解析プログラム | |
JP6434954B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
US10394804B1 (en) | Method and system for increasing internet traffic to a question and answer customer support system | |
US20130332440A1 (en) | Refinements in Document Analysis | |
US20180239790A1 (en) | Provision device, provision method and non-transitory computer readable storage medium | |
JP6160018B1 (ja) | 情報解析装置、情報解析方法、および情報解析プログラム | |
JP7227412B1 (ja) | 情報処理システム、コンピュータプログラム、及び情報処理方法 | |
JP6258246B2 (ja) | 解析装置、解析方法及びプログラム | |
JP6985181B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7297855B2 (ja) | キーワード抽出装置、キーワード抽出方法、およびプログラム | |
CN111597220B (zh) | 数据挖掘方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170526 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6160018 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |