JP6172332B2 - 情報処理方法及び情報処理装置 - Google Patents

情報処理方法及び情報処理装置 Download PDF

Info

Publication number
JP6172332B2
JP6172332B2 JP2016093751A JP2016093751A JP6172332B2 JP 6172332 B2 JP6172332 B2 JP 6172332B2 JP 2016093751 A JP2016093751 A JP 2016093751A JP 2016093751 A JP2016093751 A JP 2016093751A JP 6172332 B2 JP6172332 B2 JP 6172332B2
Authority
JP
Japan
Prior art keywords
target
candidate
information processing
data
instruction word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016093751A
Other languages
English (en)
Other versions
JP2016212879A (ja
Inventor
シャヌシャヌ ジアン
シャヌシャヌ ジアン
ジィチョアヌ ジォン
ジィチョアヌ ジォン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2016212879A publication Critical patent/JP2016212879A/ja
Application granted granted Critical
Publication of JP6172332B2 publication Critical patent/JP6172332B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、情報処理の分野に関し、さらに具体的には、情報処理方法及び情報処理装置に関する。
市場アナリストは市場内の競合製品に対する注目を保持し、自分のターゲット製品を正確に位置付け、価格調整や販促プロモーション活動を指導し、市場の変化に迅速に対応しなければならない。消費者の立場からすると、一旦あるターゲット製品に対して購買欲が生まれると、各種ルートから製品機能、性能及び口コミを収集、比較し、求める条件を満たす最大コストパフォーマンスを追求する。そのため、ターゲット製品の競合製品を手軽に素早く、また正確に認識することが、市場アナリストにとっても消費者にとっても重要である。
上述の状況に鑑み、本発明はターゲット製品の競合製品を正確に認識でき、ユーザー体験を大きく改善する情報処理方法及び情報処理装置を提供する。
本発明の実施例では、データソースから指定分野の対象データを取得するステップと、前記対象データ内から複数の対象を抽出するステップと、前記対象データに基づいて前記複数の対象間に競争関係があるか否かを決定するステップと、を含む情報処理方法を提供する。
本発明の別の実施例では、データソースから指定分野の対象データを取得する取得モジュールと、前記対象データ内から複数の対象を抽出する抽出モジュールと、前記対象データに基づいて前記複数の対象間に競争関係があるか否かを決定する決定モジュールと、を含む情報処理装置を提供する。
本発明の実施例の情報処理方法及び情報処理装置では、製品間の可能な競争関係、相補関係及び代替関係など様々な関係に基づいて、ターゲット製品の競合製品を正確に認識することで、ターゲット製品の相補製品を誤って競合製品と認識することはなく、ターゲット製品に代わる製品の対応するアップグレード版を誤って競合製品と認識することもなく、それによって競合製品を認識する正確性を大幅に向上し、ユーザー体験を改善する。
本発明の別の実施例の情報処理方法及び情報処理装置では、比較的客観的な製品特徴及び比較的主観的な製品評価項目の二つを組み合わせることで、ターゲット製品の競合製品をより正確に、より全面的に認識でき、それによって競合製品を認識する正確性を大幅に向上し、ユーザー体験を改善する。
本発明の実施例の情報処理方法を実現するのに用いることのできる電子機器のブロック図である。 本発明の実施例の情報処理方法の主要ステップのフローチャートである。 本発明の実施例の情報処理方法のさらに詳細な処理のフローチャートである。 本発明の実施例の情報処理方法の別のさらに詳細な処理のフローチャートである。 本発明の実施例の情報処理装置の主要配置のブロック図である。 本発明の実施例の情報処理装置の中の決定モジュールのさらに詳細な配置のブロック図である。 本発明の実施例の情報処理装置の中の決定モジュールの別のさらに詳細な配置のブロック図である。
以下、図面を参考に本発明の実施例を詳しく説明する。
まず、本発明の実施例の情報処理方法を説明する。
まず、図1を参考に本発明の実施例の情報処理方法を実現するのに用いることのできる電子機器を説明する。前記電子機器は例えばノートパソコン、パソコン、大型コンピュータなどである。例えば、前記電子機器はクラウドサーバなどでもよい。
図1に示すように、電子機器100は一つまたは複数の処理器102と記憶装置104を含み、これらのコンポーネントはバスシステム110及び/またはその他形式の連結機構(未表示)を通じて互いに連結する。なお、図1に示す電子機器100のコンポーネントと構造は例示的なものに過ぎず、限定するものではなく、必要に応じて電子機器100はその他のコンポーネントと構造を持つことができることである。
処理器102は中央処理装置(CPU)またはデータ処理能力及び/またはコマンド実行能力を有するその他形式の処理ユニットでよく、また電子機器100の中のその他コンポーネントを制御して望む機能を実行することもできる。
記憶装置104は一つまたは複数のコンピュータプログラム製品を含むことができ、前記コンピュータプログラム製品は例えば揮発性メモリ及びまたは非揮発性メモリといった各種形式のコンピュータ可読媒体を含むことができる。前記揮発性メモリは例えばランダムアクセスメモリ(RAM)及び/またはキャッシュメモリ(cache)などを含むことができる。非揮発性メモリは例えば読取り専用メモリ(ROM)、ハードディスク、フラッシュメモリなどを含むことができる。前記コンピュータ可読媒体には一つまたは複数のコンピュータプログラムコマンドを記憶でき、処理器102は前記プログラムコマンドを運用し、以下に記載する本発明の実施例の機能及び/またはその他の望む機能を実現できる。
以下、図2を参考に本発明の実施例の情報処理方法を詳しく説明する。
図2に示すように、まずステップS210では、本発明の実施例の情報処理方法はデータソースから指定分野の対象データを取得する。
具体的には、前記対象は例えば製品実体であり、例えば特定ブランドの特定型番のカメラ、携帯電話、スキンケア用品などである。前記指定分野は前記製品実体の属する分野であり、例えばカメラ、携帯電話、スキンケア用品などである。前記対象データは前記対象に関するデータであり、例えばWebドキュメントなどである。
さらに具体的には、第一例では、前記情報処理方法は例えばfeedデータソースの第一データソースからfeed(送り)方式で対象データを取得できる。第二例では、前記情報処理方法は例えば取り込み(fetching)データソースの第二データソースから取り込み方式で対象データを取得できる。第三例では、前記情報処理方法は例えば複数の異種データソースから前記対象データを取得できる。例えば、前記情報処理方法は前記製品情報ページ、Webログ、権威あるデータなどを取り込むことができる。前記製品情報ページは社説、ブロガーの文章、製品ニュース、メーカー発表の仕様説明、ユーザーコメント、BBS及び購入ガイドなどを含むがそれに限らない。前記Webログは検索ログ、ユーザークリックログ、ユーザー購入ログなどを含むがそれに限らない。前記権威あるデータは製品階層情報やfeed情報などを含むがそれに限らない。
続いて、ステップS220では、前記情報処理方法は前記対象データ内から複数の対象を抽出する。
具体的には、前記情報処理方法は例えばキーワードマッチング、語意認識などの多くの方式を採用して複数の対象を抽出できる。前記情報処理方法が前記対象を抽出する方式は当業者であれば知っていることであり、ここでは詳しく記述しない。
また、前記情報処理方法が複数の異種データソースから前記対象データを取得できることを考慮して、このステップでは、前記情報処理方法はまず異種対象を認識し、それから、前記異種対象を規範化し、例えば略字、別名、不完全、ブランド名の欠け、新旧バージョンの取り違いなどを認識できる。前記情報処理方法の異種対象を規範化する方法は当業者であれば知っていることであり、ここでは詳しく記述しない。
その後、ステップS230では、前記情報処理方法は前記対象データに基づいて前記複数の対象間に競争関係があるか否かを決定する。
以下、図3と図4を参考に、二つの具体例を例に、ステップS230の処理を詳しく説明する。
第一具体例では、前記情報処理方法は可能な競争関係、相補関係及び代替関係の認識に基づいて、複数の対象間に競争関係があるか否かを決定する。
図3は本発明の実施例の情報処理方法の中のステップS230のさらに詳細な処理の主要ステップのフローチャートである。
図3に示すように、まずステップS310で、前記情報処理方法は前記複数の対象内の各対象について、前記対象データ内に前記対象と所定距離内で共起する共起対象が存在するか否か、及び前記対象データ内に前記対象と前記共起対象に対応する第一指示語が存在するか否かを認識する。
具体的には、用語「共起」は二つの対象が文書内の所定の距離内に共に出現することを指し、これは二つの対象間にある種の関係が存在しうることを意味している。前記所定距離の値は開発者が必要な認識精度に基づいて予め設定でき、ここでは限定しない。二つの対象間の距離は近ければ近いほど(例えば同一センテンス内または同一段落内に出現する)、それらの間の関係を判別するのに役立つ。用語「指示語」は指示性を有するフレーズを指す。ここでは、前記第一指示語は前記対象と前記共起対象の間に競争関係が存在する可能性を表す。例えば、二つの対象(以下、適切な場合は製品実体と称する)がテキスト内で認識され、かつ両者の間の距離が非常に近いといったことである。また、製品実体の付近で指示語を認識する。仮にユーザーコメントが「製品Aと製品Bはほぼ同じだが、私は…のほうが好きだ」と言及していたとすると、指示性のフレーズ「ほぼ同じ」を通じて、製品Aと製品Bの間には可能な競争関係が存在すると推測できる。
前記情報処理方法が共起対象を認識する方法は当業者であれば知っていることであり、ここでは詳しく記述しない。また、前記情報処理方法は事前に可能な競争関係を表す辞書、即ち第一指示詞辞書を定義しておくことができる。前記第一指示語辞書には例えば「競合品」「競争」「相似」「ほぼ同じ」などの可能な競争関係を指し示す指示語を含むことができる。前記第一指示語辞書は動的更新し、維持できる。
これにより、このステップでは、ある対象の共起対象を認識するとき、前記情報処理方法は前記第一指示語辞書に基づいて、第一所定準則から前記対象と前記共起対象に対応する第一指示語が存在するか否かを判断できる。前記第一所定準則は距離に関する限定でもよい。例えば、前記第一指示語と前記対象、前記共起対象の間の距離が所定距離条件を満たしているなどである。また、前記第一所定準則は位置に関する限定とすることもできる。例えば、前記第一指示語が前記対象と前記共起対象の間に出現しなければならないなどである。当然のことながら、上述の第一所定準則は例に過ぎない。当業者であれば、認識した文書の言語及び対応する文法、及び必要な認識精度に基づいて、その他適切な第一所定準則を設定できる。また、各種第一所定準則は適度に組み合わせて使用することもできる。
前記情報処理方法がある対象に対して前記共起対象を認識できないか、または前記共起対象を認識したが対応する第一指示語を認識できなかった場合、前記情報処理方法は終了する。例えば、前記情報処理方法が前記対象データ内に前記対象と競争関係が存在する対象がないと判断する。
別の面においては、前記情報処理方法はある対象について共起対象を認識し、かつ対応する第一指示語を認識した場合、前記情報処理方法はステップS320に進む。ステップS320では、前記情報処理方法は前記共起対象を候補対象として決定する。
この後、ステップS330では、前記情報処理方法は前記対象データ内に前記対象と前記候補対象に対応する第二指示語と前記対象と前記候補対象に対応する第三指示語の中の少なくとも一つが存在するか否かを認識する。前記対象データ内に前記第二指示語と前記第三指示語の中の少なくとも一つが存在すると認識したとき、前記情報処理方法はステップS340に進み、前記第二指示語と前記第三指示語の中の前記少なくとも一つに基づいて、前記候補対象をフィルタリングし、前記対象との間に競争関係が存在する対象を取得する。
具体的には、前記第二指示語は前記対象と前記候補対象の間に相補関係が存在することを表す。デジタルカメラを例に、ユーザーがあるカメラをもとから所持している一眼レフカメラの予備機として新たに購入し、この二つの製品を評論、比較したとする。このとき、ユーザーコメント内には上述の可能な競争関係を表す第一指示語が含まれている可能性があるが、実際、ユーザーはこの二種類のカメラを互いの競合製品とは見なしておらず、互いの相補製品と見なしている。
そのため、同じように、前記情報処理方法は事前に前記相補関係を表す辞書、即ち第二指示語辞書を定義しておくことができる。前記第二指示語辞書には例えば「予備機」「新規」などの相補関係を示す指示語を含むことができる。同様に、前記第二指示語辞書も動的更新し、維持できる。
これにより、前記情報処理方法は前記第二指示語辞書に基づいて、第二所定準則から前記対象と前記共起対象に対応する第二指示語が存在するか否かを判断できる。前記第二所定準則は前述の第一所定準則と同じであってもよいし、異なってもよい。前記情報処理方法の前記第二指示語辞書に基づいて第二所定準則から第二指示語が存在するか否かを判断する具体的方式は前述の第一指示語が存在するか否かを判断する方式と類似しているため、ここでは詳しく記述しない。
前記対象データ内に前記第二指示語が存在すると認識したとき、前記第二指示語に基づいて、前記候補をフィルタリングし、前記対象との間に競争関係が存在する対象を取得する。具体的には、前記情報処理方法は前記第二指示語に対応する候補対象を削除し、最終的に前記対象との間に競争関係が存在する対象を取得できる。
別の面においては、前記第三指示語は前記対象と前記候補対象の間に代替関係が存在することを表す。例えば、ユーザーが製品Bをもとから所有している製品Aの代わりに新たに購入し、評論を行ったとする。このとき、ユーザーの評論の中には上述の可能な競争関係を表す第一指示語が含まれている可能性があるが、製品のモデルチェンジを考慮すると、実際は互いに競争関係にあるのは製品Bと製品Aではなく、製品Aのユーザーの評論時点での最新バージョンまたはアップグレードバージョンと製品Bが競争関係にある。
そのため、同じように、前記情報処理方法は事前に前記代替関係を表す辞書、即ち第三指示語辞書を定義しておくことができる。前記第三指示語辞書は、例えば「代替」「新たに試みる」などの代替関係を示す指示語を含むことができる。同様に、前記第三指示語辞書も動的更新し、維持できる。
これにより、前記情報処理方法は前記第三指示語辞書に基づいて、前記第三所定準則から前記対象と前記共起対象に対応する第三指示語が存在するか否かを判断できる。前記第三所定準則は前述の第一所定準則や第二所定準則と同じであってもよいし、異なってもよい。前記情報処理方法の前記第三指示語辞書に基づいて第三所定準則から第三指示語が存在するか否かを判断する具体的方式は前述の第一指示語が存在するか否かを判断する方式と類似しているため、ここでは詳しく記述しない。
前記対象データ内に前記第三指示語が存在すると認識したとき、前記第三指示語に基づいて、前記候補をフィルタリングし、前記対象との間に競争関係が存在する対象を取得する。具体的には、前記情報処理方法は前記第三指示語に対応する候補対象を削除し、前記対象データの生成時間に基づいて前記対象との間に競争関係が存在する対象を決定する。さらに具体的には、前記情報処理方法の一つの面においては前記第三指示語に対応する候補対象を削除し、別の面においては対象データの生成時間に基づいて、例えば製品発表などのデータソース内で前記生成時間に削除された候補対象の対応バージョンを検索し、前記対応バージョンの対象を真の競争関係を有する対象として決定する。
なお、前記情報処理方法の第二指示語に基づいて候補対象をフィルタリングする処理と第三指示語に基づいてフィルタリングし、かつ候補対象を再決定する処理は任意の順序(例えば並行)で実行できることである。
前記情報処理方法は前記対象内の各対象について図3に示す処理を繰り返すと、前記対象データ内の全ての対象間の競争関係を取得できる。なお、対象間の競争関係は対称関係であり、即ち製品Aと製品Bが競争関係にあるという事実は同様に製品Bと製品Aは競争関係にあるということを意味することである。この点を考慮して、事実、前記情報処理方法は各対象に対して上述の処理を繰り返し、全ての対象間の競争関係を取得する必要はない。
以上、図3を参考に前記情報処理方法の前記対象データに基づいて前記複数対象間に競争関係があるか否かを決定する第一具体例を説明した。この第一具体例では、製品間の可能な競争関係、相補関係及び代替関係など様々な関係に基づいて、ターゲット製品の競合製品を正確に認識することで、ターゲット製品の相補製品を誤って競合製品と認識することはなく、ターゲット製品に代わる製品の対応するアップグレード版を誤って競合製品と認識することもなく、それによって競合製品を認識する正確性を大幅に向上し、ユーザー体験を改善する。
以下、図4を参照に前記情報処理方法の前記対象データに基づいて前記複数対象間に競争関係があるか否かを決定する第二具体例を説明する。この第二具体例では、前記情報処理方法の比較的客観的な製品特徴及び比較的主観的な製品評価項目のこの二つを組み合わせて、競争関係を決定する。
具体的には、図4に示すように、一面においては、ステップS410で、前記情報処理方法は前記複数対象の特徴間の特徴相似度を計算する。前記特徴は対象の規格説明にて提供する前記対象に関する物理特徴と機能特徴を表す。さらに具体的には、前記特徴は特徴-特徴値ペアの形式(値は複数でもよい)にすることができ、二元特徴形式(あり、なし)などにもすることができる。以下に記述する評価項目と比べ、前記特徴はより製品の客観属性に偏っている。デジタルカメラを例にすると、前記特徴はカメラの価格、光学フォーカス、解像度、サイズなど比較可能な製品物理または機能属性とすることができる。前記特徴は前記情報処理方法によって前記対象データに基づいて予め抽出でき、その具体的な情報抽出方法は当業者であれば知っていることであり、ここでは詳しく記述しない。
さらに具体的には、一つの例では、前記情報処理方法は各対象の各特徴のウェイトを取得し、前記複数対象の各特徴間の重み付けされた特徴相似度を計算する。別の例では、前記情報処理方法は特徴を考慮するだけでなく、さらに特徴値を考慮する。カメラを例にすると、ある特徴「価格」に対して、その特徴値は「2000」とすることができる。これにより、前記情報処理方法は前記対象データ内から各対象の各特徴の特徴値を抽出し、特徴と特徴ペアのテキスト相似度、語意相似度及び値相似度の中の少なくとも一つから、前記複数対象の特徴間の特徴相似度を計算する。当然のことながら、前記情報処理方法は各特徴と特徴値のペアの間の相似度に加重し、加重後の対象間の特徴相似度を計算することもできる。
例えば、前記情報処理方法は統計に基づいて各特徴に0から1の間のウェイトWfeatureを付与し、対象データとしてのテキストまたは比較表内に特徴の出現が多ければ多いほど、それが重要であることを表し、そのためそのウェイトはより高くなる。全てのウェイトの和は1である。その後、前記情報処理方法は特徴の相似度の和
Figure 0006172332
を計算し、式中Sfeatureは特徴相似度を表し、Svalueは特徴値相似度を表し、SfeatureとSvalueはどちらも0〜1の間の実数である。Svalueはテキスト相似度メトリクスまたは値表現式相似度メトリクスを通じて計算でき、その具体的な計算方式は当業者であれば知っていることであり、ここでは詳しく記述しない。
別の面においては、ステップS420で、前記情報処理方法は前記複数対象の評価項目(aspect)間の評価項目相似度を計算する。前記評価項目はユーザーコメント内に出てきた対象に関する評価可能な製品特性を表す。具体的には、前記評価項目はユーザーコメント内に出現した製品の物理特徴と機能特徴、及びその他評価可能または比較可能な製品特徴を表すことができる。なお、ユーザーコメント内に出現した物理特徴及び機能特徴は製品規格の提供する物理特徴及び機能特徴と同じであってもよいし、異なってもよい。言い換えると、前記評価項目は一つまたは複数の特徴を含むことができる。特徴と比べ、前記評価項目はユーザーの主観的感想に偏っている。同様にデジタルカメラを例にすると、前記評価項目はデジタルカメラの機能性方面であり、例えば画質、美顔、コストパフォーマンスなどである。当然のことながら、前記評価項目は前記デジタルカメラの特徴を表すこともできる。
さらに具体的には、一つの例では、前記情報処理方法は各対象の各評価項目のウェイトを取得し、前記複数対象の各評価項目間の重み付された評価項目相似度を計算する。別の例では、前記情報処理方法は評価項目を考慮するだけでなく、さらに前記評価項目に対する観点を考慮する。評価項目の観点はユーザーが評価項目について表現した主観的判断である。例えば、観点「よい」は評価項目「画質」に対する判断である。前記観点は、例えば感情分析技術などの方式を通じて取得する。
これにより、前記情報処理方法は前記対象データ内から各対象の各評価項目の観点を抽出し、評価項目と観点のペアのテキスト相似度と語意相似度の中の少なくとも一つから、前記複数対象の評価項目間の評価項目相似度を計算できる。なお、前記情報処理方法は評価項目と観点のペアの間の相似度に加重し、加重後の対象間の評価項目相似度を計算することもできる。
例えば、前記情報処理方法は統計に基づいて各評価項目に0から1の間のウェイトWaspectを付与し、対象データとしてのテキスト内に評価項目の出現が多ければ多いほど、それが重要であることを表し、そのためそのウェイトはより高くなる。全てのウェイトの和は1である。その後、前記情報処理方法は評価項目の相似度の和
Figure 0006172332
を計算し、式中Saspectは評価項目相似度を表し、Sopinionは観点相似度を表し、SaspectとSopinionはどちらも0〜1の間の実数である。Saspectはテキスト相似度メトリクスまたは語意相似度メトリクスを通じて上述と類似の方式で計算できる。
なお、ステップS410とS420の処理は図4に示す順序と異なる任意の順序(例えば、並行または逆順)で行うこともできることである。
ステップS410の処理とステップS420の処理を通じてそれぞれ前記特徴相似度と前記評価項目相似度を計算した後、前記情報処理方法はステップS430に進み、前記特徴相似度と前記評価項目相似度に基づいて、前記複数対象間に競争関係があるか否かを決定する。
さらに具体的には、前記情報処理方法は前記特徴相似度の第一ウェイトと前記評価項目相似度の第二ウェイトを取得できる。前記第一ウェイトと前記第二ウェイトの和は1である。前記第一ウェイトと前記第二ウェイトの具体的な値はシステム設計者が必要に応じて予め設定できるため、ここでは限定しない。
続いて、前記情報処理方法は前記複数対象内の各二つの対象について、前記特徴相似度と前記評価項目相似度の重み付された総合相似度を計算できる。即ち、前記情報処理方法は
Figure 0006172332
を計算し、式中Scompetingは総合相似度を表し、Wは第一ウェイト、1−Wは第二ウェイトである。
その後、前記情報処理方法は前記総合相似度が所定しきい値より大きいか否かを判断する。前記総合相似度が所定しきい値より大きいとき、前記情報処理方法は前記二つの対象間に競争関係があることを決定する。即ち、前記情報処理方法は下記表現式(1)を通じて前記二つの対象間に競争関係があることを決定する。
Figure 0006172332
式中、θは前記所定しきい値を表し、その具体的な値はシステム設計者が必要に応じて予め設定できるため、ここでは限定しない。Scompetingの1は二つの対象間に競争関係があることを表し、Scompetingの0は二つの対象間に競争関係がないことを表す。
前記対象データ内の各対象に対して上述の処理を繰り返した後、前記情報処理方法は前記対象データ内の全ての対象間の競争関係を決定する。なお、同様に対象間の競争関係が対称関係であることを考慮する。事実、前記情報処理方法は各対象に上述の処理を繰り返す必要なく、すべての対象間の競争関係を取得できる。
以上、図4を参考に前記情報処理方法の前記対象データに基づいて前記複数対象間に競争関係があるか否かを決定する第二具体例を説明した。この第二具体例では、比較的客観的な製品特徴及び比較的主観的な製品評価項目のこの二つを組み合わせている。特徴相似度のみを計算する方式に比べ、この具体例の情報処理方法は製品のより多くの項目をカバーすることができる。同様にデジタルカメラを例にすると、二種類のカメラはどちらも有名な美顔カメラであるが、肌の細かな処理については製品の特徴に当たらず、製品の評価項目にあたる。そのため、本発明の例示する情報処理方法は、ターゲット製品の競合製品をより正確に、より全面的に認識でき、それによって競合製品を認識する正確性を大幅に向上し、ユーザー体験を改善する。
以上、図1〜4を参照に本発明の実施例の情報処理方法を説明した。
なお、本発明の実施例の情報処理方法は対象間の競争関係を決定後、前記競争関係が各種応用シーンに用いることができることである。例えば、あるターゲット製品実体を選定後、前記競争関係から相似度順序に基づく競合製品一覧を決定し、消費者または製品開発者に参考として提供できる。
以下、図5〜7を参考に本発明の実施例の情報処理装置を説明する。
図5に示すように、本発明の実施例の情報処理装置500は、取得モジュール510、抽出モジュール520及び決定モジュール530を含む。
前記取得モジュール510はデータソースから指定分野の対象データを取得する。前記抽出モジュール520は前記対象データ内から複数の対象を抽出する。前記決定モジュール530は前記対象データに基づいて、前記複数の対象間に競争関係があるか否かを決定する。
実施例では、前記取得モジュール510は、第一データソースからfeed方式で対象データを取得する、第二データソースから取り込み方式で対象データを取得という以上の少なくとも一つを実行するように配置されている。
別の実施例では、前記データソースは異種データソースであり、かつ前記抽出モジュール520は異種対象を認識する認識モジュール、前記異種対象を規範化する規範化モジュールを含む。
図6は本発明の実施例の情報処理装置500の中の決定モジュール530のさらに詳細な配置のブロック図である。
図6に示すように、前記決定モジュール530は第一認識モジュール610、候補決定モジュール620、第二認識モジュール630及びフィルタリングモジュール640を含む。
前記第一認識モジュール610は、前記複数対象内の各対象について、前記対象データ内に前記対象と所定距離内で共起する共起対象が存在するか否か、及び前記対象データ内に前記対象と前記共起対象に対応する前記対象と前記共起対象の間に競争関係が存在する可能性を表す第一指示語が存在するか否かを認識する。
前記候補決定モジュール620は、前記対象データ内に前記共起対象と前記第一指示語が存在すると認識したとき、前記共起対象を候補対象として決定する。
前記第二認識モジュール630は、前記対象データ内に前記対象と前記候補対象に対応する前記対象と前記候補対象の間に相補関係が存在することを表す第二指示語と前記対象と前記候補対象に対応する前記対象と前記候補対象の間に代替関係が存在することを表す第三指示語の中の少なくとも一つが存在するか否かを認識する。
フィルタリングモジュール640は前記対象データ内に前記第二指示語と前記第三指示語の中の少なくとも一つが存在すると認識したとき、前記第二指示語と前記第三指示語の中の前記少なくとも一つに基づいて、前記候補対象をフィルタリングし、前記対象との間に競争関係が存在する対象を取得する。
実施例では、前記フィルタリングモジュール640は、前記対象データ内に前記第二指示語が存在すると認識したとき、前記第二指示語に対応する候補対象を削除する、前記対象データ内に前記第三指示語が存在すると認識したとき、前記第三指示語に対応する候補対象を削除し、前記対象データの生成時間に基づいて前記対象との間に競争関係の存在する対象を決定するという以上の少なくとも一つを実行するように配置されている。
図7は本発明の実施例の情報処理装置500の中の決定モジュール530のさらに詳細な配置のブロック図である。
図7に示すように、前記決定モジュール530は第一計算モジュール710、第二計算モジュール720及び競争関係決定モジュール730を含む。
前記第一計算モジュール710は、前記複数対象の特徴間の特徴相似度を計算し、前記特徴は対象の規格説明にて提供される前記対象に関する物理特徴と機能特徴を表す。
前記第二計算モジュール720は、前記複数対象の評価項目間の評価項目相似度を計算し、前記評価項目はユーザーコメント内に出てきた対象に関する評価可能な製品特性を表す。
前記競争関係決定モジュール730は、前記特徴相似度と前記評価項目相似度に基づいて、前記複数対象間に競争関係があるか否かを決定する。
実施例では、前記競争関係決定モジュール730は、前記特徴相似度の第一ウェイト及び前記評価項目相似度の第二ウェイトを取得するウェイト取得モジュール、前記複数対象内の各二つの対象について前記特徴相似度と前記評価項目相似度の重み付された総合相似度を計算する総合相似度計算モジュール、前記総合相似度が所定しきい値よりも大きいか否かを判断する判断モジュール、前記総合相似度が所定しきい値よりも大きいとき前記二つの対象の間に競争関係があるか否かを決定する競争関係サブ決定ユニットを含む。
別の実施例では、前記第一計算モジュール710は、各対象の各特徴のウェイトを取得する第一ウェイト取得モジュール及び前記複数対象の各特徴間の重み付された特徴相似度を計算する第一加重計算モジュールを含む。前記第二計算モジュール720は各対象の各評価項目のウェイトを取得する第二ウェイト取得モジュール及び前記複数対象の各評価項目間の重み付された評価項目相似度を計算する第二加重計算モジュールを含む。
別の実施例では、前記第一計算モジュール710は、前記対象データ内から各対象の各特徴の特徴値を抽出する特徴値抽出モジュール及び特徴と特徴値のペアのテキスト相似度、語意相似度及び値相似度の中の少なくとも一つに基づいて、前記複数対象の特徴間の特徴相似度を計算する特徴相似度計算モジュールを含む。前記第二計算モジュール720は、前記対象データ内から各対象の各評価項目の観点を抽出し、前記観点がユーザーの対象の評価項目について表現した主観判断を表す観点抽出モジュール、及び評価項目と観点のペアのテキスト相似度及び語意相似度の中の少なくとも一つに基づいて、前記複数対象の評価項目間の評価項目相似度を計算する評価項目相似度計算モジュールを含む。
前記情報処理装置500の各モジュールの具体的配置及び操作は図1〜4を参考に記述した情報処理方法の中で詳細に説明しているため、ここでは繰り返さない。以上、図1〜7を参考に本発明の実施例の情報処理方法及び情報処理装置を説明した。
なお、本明細では、用語「含める」「含む」またはその他のいずれかの変異体は非排他的な包含をカバーする意図があり、それによって一連の要素を含む過程、方法、物品または機器がそれらの要素を含むだけでなく、明確に列記していないその他要素を含んだり、またはこのような過程、方法、物品または機器に固有の要素を含む。さらに多くの制限のない場合、語句「……を含む」が限定する要素は、前記要素を含む過程、方法、物品または設備内に別の同じ要素がさらに存在することを排除するものではない。
また、本明細書では、類似の「第一…ユニット」「第二…ユニット」の表現は説明時に区分しやすくするために用いたものであり、必ず物理的分離を実現しなければならない二つまたは複数のユニットを意味するものではないことである。実際に、前記ユニットは、必要に応じて全体を一つのユニットとして実現することも、複数のユニットとして実現することも可能である。
最後に、上記一連の処理はここで記述する順序で時系列に実行する処理を含むだけでなく、時系列ではなく、並行または別々に実行する処理を含む。
以上の実施方式の説明を通じて、当業者であれば本発明がソフトウェアに必要なハードウェアプラットフォームを加えた方式で実現でき、当然のことながら全てハードウェアを通じて実施できることがはっきりとわかる。このような理解に基づき、本発明の技術案の背景技術に貢献する全てまたは一部はソフトウェア製品の形式で表すことができ、該コンピュータソフトウェア製品は例えばROM/RAM、磁気ディスク、光ディスクなどの記憶媒体に記憶でき、コンピュータ機器(例えばパソコン、サーバ、またはネットワーク機器など)に本発明の各実施例または実施例のある部分の方法を実行させるのに用いる若干のコマンドを含む。
本発明の実施例では、各種タイプの処理器が実行できるように、ユニット/モジュールはソフトウェアで実現できる。例を挙げて説明すると、示された実行可能コードモジュールはコンピュータコマンドの一つまたは複数の物理または論理ブロックを含むことができ、例えば対象、過程または関数として構築されることができる。いずれにしても、示されたモジュールの実行可能コードは物理的に同じ場所にある必要はなく、異なる位置に記憶した異なるコマンドを含むことができ、これらのコマンドが論理的に一つに結び付いたとき、ユニット/モジュールを構成し、該ユニット/モジュールの規定目的を実現する。
ユニット/モジュールがソフトウェアを利用して実現するとき、従来のハードウェア技術の水準を考慮するため、ソフトウェアで実現できるユニット/モジュールはコストを考慮しない場合、当業者であればみな対応するハードウェア回路を構築して対応する機能を実現でき、前記ハードウェア回路は通常の超大規模集積回路(VLSI)またはゲートアレイ及び例えばロジックチップ、トランジスタといった従来の半導体またはその他分割したコンポーネントを含む。モジュールはさらに例えばフィールドプログラマブルゲートアレイ、プログラマブルゲートアレイロジック、プログラマブルロジック機器などのプログラマブルハードウェア機器で実現できる。
以上、本発明について詳細に紹介し、本文では具体例を応用し本発明の原理及び実施方法を論述した。以上実施例の説明は本発明の方法及びその核心思想の理解に供するのみに用いられる。同時に当業者にとって、本発明の考え方に基づき、具体的な実施方法及び応用範囲への変更が可能であり、以上述べたところを総合すれば、本明細書の内容は本発明に対する制限をなすものと理解すべきではない。

Claims (4)

  1. データソースから指定分野の対象データを取得するステップと、
    前記対象データ内から複数の対象を抽出するステップと、
    前記対象データに基づいて、前記複数の対象間に競争関係があるか否かを決定するステップと、を含み、
    前記複数の対象間に競争関係があるか否かを決定するステップは、
    前記複数の対象内の各対象について、前記対象データ内に前記対象と所定距離内で共起する共起対象が存在するか否か、及び前記対象データ内に、前記対象と前記共起対象に対応する、前記対象と前記共起対象の間に競争関係が存在する可能性があることを表す第一指示語が存在するか否かを認識するステップと、
    前記対象データ内に前記共起対象及び前記第一指示語が存在すると認識した場合に、前記共起対象を候補対象として決定するステップと、
    前記対象データ内に、前記対象と前記候補対象に対応する、前記対象と前記候補対象の間に相補関係が存在することを表す第二指示語、及び前記対象と前記候補対象に対応する、前記対象と前記候補対象の間に代替関係が存在することを表す第三指示語のうち少なくとも一つが存在するか否かを認識するステップと、
    前記対象データ内に前記第二指示語及び前記第三指示語のうち少なくとも一つが存在すると認識した場合に、前記第二指示語及び前記第三指示語のうち前記少なくとも一つに基づいて、前記候補対象をフィルタリングし、前記対象との間に競争関係が存在する対象を取得するステップと、を含む情報処理方法。
  2. 前記候補対象をフィルタリングするステップは、
    前記対象データ内に前記第二指示語が存在すると認識した場合に、前記第二指示語に対応する候補対象を削除するステップ、及び
    前記対象データ内に前記第三指示語が存在すると認識した場合に、前記第三指示語に対応する候補対象を削除し、前記対象データの生成時間に基づいて前記対象との間に競争関係の存在する対象を決定するステップのうち少なくとも一つを含む請求項に記載の情報処理方法。
  3. データソースから指定分野の対象データを取得する取得モジュールと、
    前記対象データ内から複数の対象を抽出する抽出モジュールと、
    前記対象データに基づいて、前記複数の対象間に競争関係があるか否かを決定する決定モジュールと、を含み、
    前記決定モジュールは、
    前記複数の対象内の各対象について、前記対象データ内に前記対象と所定距離内で共起する共起対象が存在するか否か、及び前記対象データ内に、前記対象と前記共起対象に対応する、前記対象と前記共起対象の間に競争関係が存在する可能性があることを表す第一指示語が存在するか否かを認識する第一認識モジュールと、
    前記対象データ内に前記共起対象及び前記第一指示語が存在すると認識した場合に、前記共起対象を候補対象として決定する候補決定モジュールと、
    前記対象データ内に、前記対象と前記候補対象に対応する、前記対象と前記候補対象の間に相補関係が存在することを表す第二指示語、及び前記対象と前記候補対象に対応する、前記対象と前記候補対象の間に代替関係が存在することを表す第三指示語のうち少なくとも一つが存在するか否かを認識する第二認識モジュールと、
    前記対象データ内に前記第二指示語及び前記第三指示語のうち少なくとも一つが存在すると認識した場合に、前記第二指示語及び前記第三指示語のうち前記少なくとも一つに基づいて、前記候補対象をフィルタリングし、前記対象との間に競争関係が存在する対象を取得するフィルタリングモジュールと、を含む情報処理装置。
  4. 前記フィルタリングモジュールは、
    前記対象データ内に前記第二指示語が存在すると認識した場合に、前記第二指示語に対応する候補対象を削除すること、及び
    前記対象データ内に前記第三指示語が存在すると認識した場合に、前記第三指示語に対応する候補対象を削除し、前記対象データの生成時間に基づいて前記対象との間に競争関係の存在する対象を決定することのうち少なくとも一つを実行する請求項に記載の情報処理装置。
JP2016093751A 2015-05-12 2016-05-09 情報処理方法及び情報処理装置 Active JP6172332B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510239164.4 2015-05-12
CN201510239164.4A CN106294338B (zh) 2015-05-12 2015-05-12 信息处理方法和信息处理装置

Publications (2)

Publication Number Publication Date
JP2016212879A JP2016212879A (ja) 2016-12-15
JP6172332B2 true JP6172332B2 (ja) 2017-08-02

Family

ID=57552365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016093751A Active JP6172332B2 (ja) 2015-05-12 2016-05-09 情報処理方法及び情報処理装置

Country Status (2)

Country Link
JP (1) JP6172332B2 (ja)
CN (1) CN106294338B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325167B (zh) * 2017-07-31 2022-02-18 株式会社理光 特征分析方法、装置、设备、计算机可读存储介质
CN110544140A (zh) * 2018-05-29 2019-12-06 北京京东尚科信息技术有限公司 一种处理浏览数据的方法和装置
CN109241225B (zh) 2018-08-27 2022-03-25 百度在线网络技术(北京)有限公司 兴趣点竞争关系挖掘方法、装置、计算机设备及存储介质
CN113449341A (zh) * 2021-07-13 2021-09-28 北京明朝万达科技股份有限公司 一种文件数据追溯方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003157271A (ja) * 2001-11-20 2003-05-30 Mitsubishi Electric Corp テキストマイニング装置および方法
JP2006004098A (ja) * 2004-06-16 2006-01-05 Internatl Business Mach Corp <Ibm> 評価情報生成装置、評価情報生成方法、及びプログラム
CN101436191A (zh) * 2007-11-13 2009-05-20 日电(中国)有限公司 用于计算对象之间竞争性度量的方法与系统
JP5341366B2 (ja) * 2008-02-28 2013-11-13 株式会社東芝 情報処理装置及び情報処理方法
CN101853292A (zh) * 2010-05-18 2010-10-06 深圳市北科瑞讯信息技术有限公司 商业社会网络构建方法及系统

Also Published As

Publication number Publication date
CN106294338B (zh) 2019-08-30
JP2016212879A (ja) 2016-12-15
CN106294338A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
KR102092691B1 (ko) 웹페이지 트레이닝 방법 및 기기, 그리고 검색 의도 식별 방법 및 기기
CN107463605B (zh) 低质新闻资源的识别方法及装置、计算机设备及可读介质
JP6144839B2 (ja) 画像を検索するための方法およびシステム
Mishra et al. FACTIFY: A Multi-Modal Fact Verification Dataset.
US20120290293A1 (en) Exploiting Query Click Logs for Domain Detection in Spoken Language Understanding
US20190188729A1 (en) System and method for detecting counterfeit product based on deep learning
JP6753115B2 (ja) コンテンツ管理装置、コンテンツ管理方法及びプログラム
JP6172332B2 (ja) 情報処理方法及び情報処理装置
CN110390044B (zh) 一种相似网络页面的搜索方法及设备
US9977995B2 (en) Image clustering method, image clustering system, and image clustering server
CN110309251B (zh) 文本数据的处理方法、装置和计算机可读存储介质
KR102070197B1 (ko) 영상 분석 기반 토픽 모델링 영상 검색 시스템 및 방법
CN107273546B (zh) 仿冒应用检测方法以及系统
WO2023108980A1 (zh) 基于文本对抗样例的信息推送方法及装置
EP2707808A2 (en) Exploiting query click logs for domain detection in spoken language understanding
US20170011068A1 (en) Extrapolative Search Techniques
CN113656660A (zh) 跨模态数据的匹配方法、装置、设备及介质
CN111767713A (zh) 关键词的提取方法、装置、电子设备及存储介质
KR20190128246A (ko) 검색 방법 및 장치 및 비-일시적 컴퓨터-판독가능 저장 매체
CN113963303A (zh) 图像处理方法、视频识别方法、装置、设备及存储介质
CN109271624B (zh) 一种目标词确定方法、装置及存储介质
JP6420268B2 (ja) 画像評価学習装置、画像評価装置、画像検索装置、画像評価学習方法、画像評価方法、画像検索方法、およびプログラム
US20150104065A1 (en) Apparatus and method for recognizing object in image
CN116034401A (zh) 用于使用自然语言描述检索视频的系统和方法
CN112199500A (zh) 针对评论的情感倾向识别方法、装置及电子设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R151 Written notification of patent or utility model registration

Ref document number: 6172332

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151