JP2017188025A - データ分析システム、その制御方法、プログラム、及び、記録媒体 - Google Patents
データ分析システム、その制御方法、プログラム、及び、記録媒体 Download PDFInfo
- Publication number
- JP2017188025A JP2017188025A JP2016078175A JP2016078175A JP2017188025A JP 2017188025 A JP2017188025 A JP 2017188025A JP 2016078175 A JP2016078175 A JP 2016078175A JP 2016078175 A JP2016078175 A JP 2016078175A JP 2017188025 A JP2017188025 A JP 2017188025A
- Authority
- JP
- Japan
- Prior art keywords
- data
- evaluation
- component
- learning
- morpheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明は、データの分析において、学習用データから複数の構成要素を抽出し、当該複数の構成要素の夫々は、当該学習用データの少なくとも一部を構成するものであり、複数の構成要素から所定の構成要素を選択し、当該所定の構成要素を含む第1のデータパターンを学習用データから抽出し、第1のデータパターンに関連する第2のデータパターンに基づいて複数の評価対象データの夫々を検索し、2のデータパターンを含む評価対象データを抽出し、そして、抽出された評価対象データと第1のデータパターンとの差分に基づいて、選択された構成要素と同義な構成要素を決定する。
【選択図】図5
Description
図1は、本実施の形態に係るデータ分析システム(以下、単に「システム」と略記することがある)のハードウェア構成の一例を示すブロック図である。当該システムは、例えば、データ(デジタルデータ、及び/又は、アナログデータを含む)を格納可能な任意の記録媒体(例えば、メモリ、ハードディスク等)と、当該記録媒体に格納された制御プログラムを実行可能なコントローラ(例えば、CPU;Central Processing Unit)とを備え、当該記録媒体に少なくとも一時的に格納されたデータを分析するコンピュータまたはコンピュータシステム(複数のコンピュータが統合的に動作することによってデータ分析を実現するシステム)として実現され得る。
上記システムは、データ評価機能を備えることができる。当該データ評価機能は、人手で分類された少数のデータ(学習用データ)に基づいて、多数の評価対象データ(ビッグデータ)を評価するものである。当該データ評価機能を備えることにより、上記システムは、例えば、評価対象データと所定事案との関連性の高低を示す指標(例えば、評価対象データを序列化可能にする数値(例えば、スコア)、文字(例えば、「高」、「中」、「低」など)、及び//又は、記号(例えば、「◎」、「○」、「△」、「×」など)、を導出することによって、上記評価を実現することができる。データ評価機能は、サーバ装置2のコントローラによって実現される。
サーバ装置2による評価対象データの評価動作を説明する。図2は、サーバ装置2(詳しくはサーバ装置2のコントローラ)のフローチャートである。サーバ装置2は、ストレージシステム5に記録された評価対象データの中から一つ又は複数のデータを参照データとして取得する(ステップS300:参照データ取得モジュール)。各ステップを、モジュール又は手段と言い換えることもできる。次に、サーバ装置2は、ユーザが参照データを実際にレビューして分類を決定し、ユーザによって参照データに対して入力された分類情報を、任意の入力装置から取得する(ステップS302:分類情報取得モジュール)。サーバ装置2は、参照データと分類情報とを組み合わせることによって学習用データを構成し、学習用データから構成要素を抽出する(ステップS304:構成要素抽出モジュール)。そして、コントローラは、当該構成要素を評価し(ステップS306:構成要素評価モジュール)、当該構成要素と評価値とを対応付け、両者をストレージシステム5に格納する(ステップS308:構成要素格納モジュール)。上記S300〜S308の処理は、「学習フェーズ」(人工知能がパターンを学習するフェーズ)に対応する。なお、学習用データを、参照データから作成する代わりに、予め用意しておいてもよい。例えば、ある特許権に係る特許を無効にするための公知文献を見つける場合、学習用データは、特許請求の範囲の記載と「Related」ラベルとの組み合わせになる。
評価対象データの評価に当たっては、サーバ装置2は、学習用データの構成要素と同じ構成要素であることは勿論のこと、学習用データの構成要素と関連がある構成要素、特に、学習用データの形態素の同義語が評価対象データに含まれているか否かを検討することは、評価対象データの評価を合理的なものにする上で、重要なことであるといえる。従来、データ分析システムは、評価者に依ることなく、学習用データの形態素の同義語を評価対象データから抽出することを試みてきたが、同義語としては不十分なものに留まり、その結果、評価対象データの評価の精度も十分なものではなかった。そこで、本実施形態のデータ分析システムは、学習用データの所定の構成要素について、当該所定の構成要素を含むデータパターンを学習用データから抽出し、当該データパターンに基づいて評価対象データから同義な構成要素の候補を複数決定し、これら複数の候補を評価し、そして、評価結果に応じて前記所定の構成要素と同義な構成要素を決定することとした。図5は、そのためのフローチャートであり、サーバ装置2は、同義構成要素の決定プログラムに従って、既述のステップS314において、このフローチャートを実行することができる。以下詳細に説明する。なお、本実施の形態において「同義語」とは、語形は異なるが意味は同じである(または類似する)語のことを意味するが、必ずしもこれに限られない。例えば、何らかの基準にしたがって関連する語(関連語)であってもよい。「同義語」の範囲を、ユーザが適宜定めるようにしてもよい。
学習用データから同義語が見付けられるべき形態素(注目形態素)は、分析対象システムの評価者、管理者、又は、ユーザによって適宜選択されてよい。好適には、評価値が最上位の形態素、又は、評価値が上位の形態素が注目形態素として選択されてよい。注目形態素は複数選択されてもよい。
サーバ装置2は、学習用データから、注目形態素を含むデータパターン(第1のデータパターン)を抽出するための一例として、注目形態素の学習用データにおける分布の態様を利用することができる(特願2015-238978)。特願2015-238978の明細書、図面に記載された事項を、本願に引用する。なお、第1のデータパターンの態様は、特定のものに限定されなくてもよい。後述のように、注目形態素に付帯する関連形態素を特定できるものであればよい。
サーバ装置2は、注目形態素を含む形態素グループを、注目形態素を含むデータパターンとして学習用データから抽出する。このデータパターン(第1のデータパターン)は、注目形態素と、注目形態素に付帯する複数の形態素との組合であることを示している。ここで、注目形態素に伴って同一のデータパターンに出現する形態素は注目形態素に関連した形態素であるため、複数の関連形態素の組合せのデータパターンを辿っていけば、評価対象データから、学習用データには含まれてはいない、又は、含まれていても低く評価されているため第1のデータパターンには表出されない、同義語を見つけ出すことができる。そこで、サーバ装置2は、関連形態素に基づいたデータパターン、即ち、複数の関連形態素の組合せを含む第2のデータパターン)キー(パラメータ)にして、複数の評価対象データから同義語を探すことを実行する。
かっこが、学習用データから抽出された第1のデータパターンであり、M0が注目形態素であり、M0以外のM1,M2,M3,M4,M5,M6・・・・が関連形態素である。
関連形態素のデータパターン(第2のデータパターン):(M1,M2)、(M3,M4)、(M5,M6)・・・
サーバ装置2は、複数の第2のデータパターン夫々について、複数の評価対象データと比較し、第2のデータパターンを含む評価対象データを特定する。ここで、特定される対象は評価対象データの全体であってもよいし、評価対象データの一部でもよい。例えば、評価対象データが文書ファイルであるとすると、特定される範囲は、文書ファイルの他、その一部、例えば、段落、文、又は、頁であってよい。なお、評価対象データは文書ファイルに限らず、段落、文、又は、頁等でもよい。
サーバ装置2は、関連形態素のデータパターンを(M1,M2)とすると、形態素としてM1とM2とを含む評価対象データを複数の評価対象データを含むデータ群(母集団)から抽出する。ここで、抽出された評価対象データは、関連形態素のデータパターン(M1,M2)を介して注目形態素(M0)に関連していると考えられるため、抽出された評価対象データには、注目形態素の同義語の候補が含まれていることが期待、或いは、想定される。したがって、サーバ装置2は、抽出された評価対象データに対して、後述のとおり差分処理を行うことによって、抽出された評価対象データに含まれる形態素から、注目形態素の同義語の候補を抽出、選択、検出、識別、特定、決定、又は、判定することができる。
サーバ装置2は、抽出された評価対象データに差分処理を行うことによって同義語の候補を抽出する。サーバ装置2は、次のようにして、同義語の候補を抽出する。
(1)サーバ装置2は、先ず、抽出された評価対象データから形態素を抽出する。
(2)サーバ装置2は、抽出された形態素に注目形態素が含まれていればこれを除く。なぜなら、同義語は注目形態素と語形が異なるものためである。例えば、注目形態素を「診察」とすると、同義語は「診断」、「診療」、「検診」である。
(3)サーバ装置2は、抽出された形態素から関連形態素を除く。なぜなら、関連形態素は注目形態素に付帯しているだけで、注目形態素の同義語としては、十分とはいえないためである。例えば、注目形態素を「診察」とすると、関連形態素は、「内科」、「病院」である。
B 注目形態素の用法とは異なる用法の形態素を同義語の候補から除く。例えば、注目形態素が学習用データにおいては主語として存在し、評価対象体データにおいては、形態素が目的語として存在する場合、後者を同義語の候補から除く。
C 装置、機械、計算機等一般用語を同義語の候補から除く。
D 注目形態素と共起関係にある形態素を同義語の候補から除く。こうする理由は、共起関係にある形態素は、注目形態素に伴って学習用データに出現するため、学習用データに含まれない同義語とは異なるからである。
E 同義語の候補を関連形態素との関連性が高いものに絞り込む。例えば、抽出された評価対象データから、関連形態素を含む形態素グループを抽出し、同義語の候補としての形態素を当該形態素グループに含まれる形態素とする。
次いで、サーバ装置2は、複数の同義語の候補を評価して、複数の同義語の候補の中から同義語とすべき形態素決定する。サーバ装置2は、同義語の候補を評価する一例として、同義語の候補の出現頻度に基づいて同義語の候補を評価する。即ち、サーバ装置は、図6に示すように、関連形態素のデータパターン毎に複数の評価対象データにおける同義語候補の出現数を計数し、夫々の同義語候補の計数値を複数の関連形態素データパターンに亘って累計した合算値(SUM)に基づいて、合算値が高いほど形態素ほど同義語として相応しいと判定する。
サーバ装置2は注目形態素の同義語としての対象形態素を決定すると、対象形態素の評価値を決定する。対象形態素の評価値は、例えば、注目形態素の評価値に基づくものであればよい。対象形態素の評価値は、注目形態素の評価値と同じでも、これを補正したものでもよい。したがって、サーバ装置2は、対象形態素の評価値にも基づいて複数の評価対象データを評価することができる。
本実施の形態において、「データ」は、コンピュータによって処理可能となる形式で表現された任意のデータであってよい。上記データは、例えば、少なくとも一部において構造定義が不完全な非構造化データであってよく、自然言語によって記述された文章を少なくとも一部に含む文書データ(例えば、電子メール(添付ファイル・ヘッダ情報を含む)、技術文書(例えば、学術論文、特許公報、製品仕様書、設計図など、技術的事項を説明する文書を広く含む)、プレゼンテーション資料、表計算資料、決算報告書、打ち合わせ資料、報告書、営業資料、契約書、組織図、事業計画書、企業分析情報、電子カルテ、ウェブページ、ブログ、ソーシャルネットワークサービスに投稿されたコメントなど)、音声データ(例えば、会話・音楽などを録音したデータ)、画像データ(例えば、複数の画素またはベクター情報から構成されるデータ)、映像データ(例えば、複数のフレーム画像から構成されるデータ)などを広く含む(これらの例に限定されない)。
上記システムの制御ブロックは、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPUを用いてソフトウェアによって実現してもよい。後者の場合、上記システムは、各機能を実現するソフトウェアであるプログラム(データ分析システムの制御プログラム)を実行するCPU、当該プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、当該プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、当該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。なお、上記プログラムは、任意のプログラミング言語によって実装可能である。また、上記プログラムを記録した任意の記録媒体も、本発明の範疇に入る。
上記システムは、例えば、ディスカバリー支援システム、フォレンジックシステム、電子メール監視システム、医療応用システム(例えば、ファーマコビジランス支援システム、治験効率化システム、医療リスクヘッジシステム、転倒予測(転倒防止)システム、予後予測システム、診断支援システムなど)、インターネット応用システム(例えば、スマートメールシステム、情報アグリゲーション(キュレーション)システム、ユーザ監視システム、ソーシャルメディア運営システムなど)、情報漏洩検知システム、プロジェクト評価システム、マーケティング支援システム、知財評価システム、不正取引監視システム、コールセンターエスカレーションシステム、信用調査システムなど、ビッグデータを分析する人工知能システム(データと所定事案との関連性を評価可能な任意のシステム)として実現され得る。なお、本発明のデータ分析システムが応用される分野によっては、当該分野に特有の事情を考慮して、例えば、データに前処理(例えば、当該データから重要箇所を抜き出し、当該重要箇所のみをデータ分析の対象とするなど)を施したり、データ分析の結果を表示する態様を変化させたりしてよい。こうした変形例が多様に存在し得ることは、当業者に理解されるところであり、すべての変形例が本発明の範疇に入る。
サーバ装置2は、注目形態素を含む形態素グループを、注目形態素を含むデータパターンとして学習用データから抽出する。このデータパターン(第1のデータパターン)は、注目形態素と、注目形態素に付帯する複数の形態素との組合であることを示している。ここで、注目形態素に伴って同一のデータパターンに出現する形態素は注目形態素に関連した形態素であるため、複数の関連形態素の組合せのデータパターンを辿っていけば、評価対象データから、学習用データには含まれてはいない、又は、含まれていても低く評価されているため第1のデータパターンには表出されない、同義語を見つけ出すことができる。そこで、サーバ装置2は、関連形態素に基づいたデータパターン、即ち、複数の関連形態素の組合せを含む第2のデータパターンをキー(パラメータ)にして、複数の評価対象データから同義語を探すことを実行する。
Claims (12)
- データを分析するデータ分析システムであって、
分析の対象となる複数の評価対象データを少なくとも一時的に記憶するメモリと、
前記複数の評価対象データを学習用データに基づいて評価するコントローラと、
を備え、
前記コントローラは、
前記学習用データから複数の構成要素を抽出し、当該複数の構成要素の夫々は、当該学習用データの少なくとも一部を構成するものであり、
前記複数の構成要素から所定の構成要素を選択し、
当該所定の構成要素を含む第1のデータパターンを前記学習用データから抽出し、
前記第1のデータパターンに関連する第2のデータパターンに基づいて複数の前記評価対象データの夫々を検索し、
前記第2のデータパターンを含む評価対象データを抽出し、そして、
前記抽出された評価対象データと前記第1のデータパターンとの差分に基づいて、前記選択された構成要素と同義な構成要素を決定する
データ分析システム。 - 前記コントローラは、
前記同義な構成要素を決定することを、
前記抽出された評価対象データと前記第1のデータパターンとの差分に基づいて、前記所定の構成要素と同義な構成要素の候補の複数を前記抽出された評価対象データから選択することと、
前記複数の同義な構成要素の候補を夫々評価することと、そして、
当該評価に基づいて前記所定の構成要素と同義な構成要素を前記複数の同義な構成要素の候補の中から決定することと、
によって行う
請求項1記載のデータ分析システム。 - 前記コントローラは、
ユーザに提示された参照データと、当該ユーザによって当該参照データに設定された分類情報の組み合わせとを前記学習用データとすることと、
前記複数の構成要素夫々の前記組み合わせに寄与する度合いに基づいて、当該複数の構成要素夫々の評価情報を生成することと、そして、
前記生成された評価情報に基づいて、前記複数の評価対象データを序列化するための指標を生成することにより、当該複数の評価対象データの夫々を評価することとを、
さらに、含む
請求項1又は2記載のデータ分析システム。 - 前記コントローラは、
前記第1のデータパターンを、前記複数の構成要素の前記学習用データにおける分布の態様に基づいて決定する
請求項1乃至3の何れか一項記載のデータ分析システム。 - 前記コントローラは、
前記複数の構成要素夫々の評価情報と、当該複数の構成要素夫々が前記学習用データにおいて出現する位置との関係から、前記分布を得る
請求項4記載のデータ分析システム。 - 前記コントローラは、
前記第1のデータパターンを、前記所定の構成要素と、前記分布に基づいて当該所定の構成要素に付帯する他の構成要素との組合せとし、
前記第2のデータパターンを、前記他の構成要素を含むものとする
請求項4又は5記載のデータ分析システム。 - 前記コントローラは、
前記所定の構成要素の前記分布に基づく位置関係に基づいて前記他の構成要素を設定する
請求項6記載のデータ分析システム。 - 前記コントローラは、
前記差分に基づくことを、前記抽出された評価対象データに含まれる構成要素から前記第1のデータパターンに含まれる構成要素を除くことによって実行し、
前記構成要素を除かれた後の前記抽出された評価対象データに含まれる構成要素の中から前記同義な構成要素の候補を選択する
請求項2記載のデータ分析システム。 - 前記コントローラは、
前記同義な構成要素の評価情報を前記所定の構成要素の評価情報に基づいて決定し、
当該同義な構成要素の評価情報に基づいて前記複数の評価対象データの夫々を評価する
請求項3記載のデータ分析システム。 - 複数の評価対象データを学習用データに基づいて評価するデータ分析システムの制御方法であって、
前記データ分析システムが、
前記学習用データから複数の構成要素を抽出し、当該複数の構成要素の夫々は、当該学習用データの少なくとも一部を構成するものであり、
前記複数の構成要素から所定の構成要素を選択し、
当該所定の構成要素を含む第1のデータパターンを前記学習用データから抽出し、
前記第1のデータパターンに関連する第2のデータパターンに基づいて複数の前記評価対象データの夫々を検索し、
前記2のデータパターンを含む評価対象データを抽出し、そして、
前記抽出された評価対象データと前記第1のデータパターンとの差分に基づいて、前記選択された構成要素と同義な構成要素を決定する
データ分析システムの制御方法。 - 複数の評価対象データを学習用データに基づいて評価するデータ分析をコンピュータに実行させるプログラムであって、
前記学習用データから複数の構成要素を抽出し、当該複数の構成要素の夫々は、当該学習用データの少なくとも一部を構成するものであり、
前記複数の構成要素から所定の構成要素を選択し、
当該所定の構成要素を含む第1のデータパターンを前記学習用データから抽出し、
前記第1のデータパターンに関連する第2のデータパターンに基づいて複数の前記評価対象データの夫々を検索し、
前記2のデータパターンを含む評価対象データを抽出し、そして、
前記抽出された評価対象データと前記第1のデータパターンとの差分に基づいて、前記選択された構成要素と同義な構成要素を決定する
ことをコンピュータに実現させるためのプログラム。 - 請求項11記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016078175A JP6026036B1 (ja) | 2016-04-08 | 2016-04-08 | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
US15/482,401 US20170293863A1 (en) | 2016-04-08 | 2017-04-07 | Data analysis system, and control method, program, and recording medium therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016078175A JP6026036B1 (ja) | 2016-04-08 | 2016-04-08 | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6026036B1 JP6026036B1 (ja) | 2016-11-16 |
JP2017188025A true JP2017188025A (ja) | 2017-10-12 |
Family
ID=57326631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016078175A Expired - Fee Related JP6026036B1 (ja) | 2016-04-08 | 2016-04-08 | データ分析システム、その制御方法、プログラム、及び、記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170293863A1 (ja) |
JP (1) | JP6026036B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019133478A (ja) * | 2018-01-31 | 2019-08-08 | 株式会社Fronteo | 計算機システム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11610151B2 (en) * | 2017-06-06 | 2023-03-21 | Nec Corporation | Distribution system, data management apparatus, data management method, and computer-readable recording medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2014106665A (ja) * | 2012-11-27 | 2014-06-09 | Hitachi Ltd | 文書検索装置、文書検索方法 |
JP2015014993A (ja) * | 2013-07-08 | 2015-01-22 | 日本電信電話株式会社 | 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム |
JP2015106361A (ja) * | 2013-12-02 | 2015-06-08 | 株式会社日立製作所 | データ検索システムおよびデータ検索方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6546383B1 (en) * | 1999-06-09 | 2003-04-08 | Ricoh Company, Ltd. | Method and device for document retrieval |
JP4346531B2 (ja) * | 2004-09-17 | 2009-10-21 | 株式会社東芝 | テキストデータ学習分析システム、テキストデータ学習装置、テキストデータ分析装置、方法及びプログラム |
US7873640B2 (en) * | 2007-03-27 | 2011-01-18 | Adobe Systems Incorporated | Semantic analysis documents to rank terms |
US8166045B1 (en) * | 2007-03-30 | 2012-04-24 | Google Inc. | Phrase extraction using subphrase scoring |
US8676730B2 (en) * | 2011-07-11 | 2014-03-18 | Accenture Global Services Limited | Sentiment classifiers based on feature extraction |
US20130305149A1 (en) * | 2012-05-10 | 2013-11-14 | SEC Live, LLC | Document reader and system for extraction of structural and semantic information from documents |
US9679050B2 (en) * | 2014-04-30 | 2017-06-13 | Adobe Systems Incorporated | Method and apparatus for generating thumbnails |
-
2016
- 2016-04-08 JP JP2016078175A patent/JP6026036B1/ja not_active Expired - Fee Related
-
2017
- 2017-04-07 US US15/482,401 patent/US20170293863A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287020A (ja) * | 2009-06-11 | 2010-12-24 | Hitachi Ltd | 同義語展開システム及び同義語展開方法 |
JP2014106665A (ja) * | 2012-11-27 | 2014-06-09 | Hitachi Ltd | 文書検索装置、文書検索方法 |
JP2015014993A (ja) * | 2013-07-08 | 2015-01-22 | 日本電信電話株式会社 | 検索意図辞書作成装置、検索意図辞書作成方法及び検索意図辞書作成プログラム |
JP2015106361A (ja) * | 2013-12-02 | 2015-06-08 | 株式会社日立製作所 | データ検索システムおよびデータ検索方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019133478A (ja) * | 2018-01-31 | 2019-08-08 | 株式会社Fronteo | 計算機システム |
Also Published As
Publication number | Publication date |
---|---|
US20170293863A1 (en) | 2017-10-12 |
JP6026036B1 (ja) | 2016-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6182279B2 (ja) | データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体 | |
Stein et al. | Intrinsic plagiarism analysis | |
US20190318407A1 (en) | Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof | |
WO2018184518A1 (zh) | 微博数据处理方法、装置、计算机设备及存储介质 | |
US11689507B2 (en) | Privacy preserving document analysis | |
Bitto et al. | Sentiment analysis from Bangladeshi food delivery startup based on user reviews using machine learning and deep learning | |
Addepalli et al. | A proposed framework for measuring customer satisfaction and product recommendation for ecommerce | |
JP6026036B1 (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
JP5933863B1 (ja) | データ分析システム、制御方法、制御プログラム、および記録媒体 | |
JP2017201543A (ja) | データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体 | |
JP6178480B1 (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
WO2016189605A1 (ja) | データ分析に係るシステム、制御方法、制御プログラム、および、その記録媒体 | |
Heidari et al. | Financial footnote analysis: developing a text mining approach | |
JP6509391B1 (ja) | 計算機システム | |
JP5946949B1 (ja) | データ分析システム、その制御方法、プログラム、および、記録媒体 | |
Jayawickrama et al. | Seeking sinhala sentiment: Predicting facebook reactions of sinhala posts | |
US11514311B2 (en) | Automated data slicing based on an artificial neural network | |
CN111316370B (zh) | 基于附录的报告质量分数卡生成 | |
Tu et al. | A domain-independent text segmentation method for educational course content | |
Hirota et al. | Weakly-Supervised Multimodal Learning for Predicting the Gender of Twitter Users | |
Congleton et al. | Tracing Political Positioning of Dutch Newspapers | |
Chaudhary et al. | Fake News Detection During 2016 US Elections Using Bootstrapped Metadata-Based Naïve Bayesian Classifier | |
KR20200088164A (ko) | 소셜 네트워크 서비스 메시지의 감정 분석을 위한 POS(part of speech) 특징기반의 감정 분석 방법 및 이를 수행하는 감정 분석 장치 | |
CN112115705B (zh) | 一种电子简历的筛选方法及装置 | |
JP2020071523A (ja) | 見積方法、課金方法、コンピュータ、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161011 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6026036 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |