JP2023113268A - テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置 - Google Patents

テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置 Download PDF

Info

Publication number
JP2023113268A
JP2023113268A JP2022015493A JP2022015493A JP2023113268A JP 2023113268 A JP2023113268 A JP 2023113268A JP 2022015493 A JP2022015493 A JP 2022015493A JP 2022015493 A JP2022015493 A JP 2022015493A JP 2023113268 A JP2023113268 A JP 2023113268A
Authority
JP
Japan
Prior art keywords
emotion
documents
quotient
feature
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022015493A
Other languages
English (en)
Inventor
景龍 周
Keiryu Shu
康則 中村
Yasunori Nakamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2022015493A priority Critical patent/JP2023113268A/ja
Priority to TW112100950A priority patent/TW202341003A/zh
Priority to KR1020230012981A priority patent/KR20230118030A/ko
Priority to CN202310119160.7A priority patent/CN116541518A/zh
Publication of JP2023113268A publication Critical patent/JP2023113268A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

【課題】少ない計算量で文書における感情語の適切な評価に基づき複数の文書間で感情的傾向を比較できるようにする。【解決手段】本願で開示されるテキストマイニング方法では、感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示と共に、対象文書から抽出すべき特徴語の範囲を指定する指示および感情極性の強さを示す感情指数の範囲を指定する指示を受け付け、これらの指示に基づき、指定範囲内で当該複数の文書から特徴語を抽出し、抽出した特徴語のうち、指定範囲内の感情指数を与えられた感情語として所定の感情語辞書に登録されている特徴語に対し当該感情指数を付与する。その後、抽出された特徴語と付与された感情指数とを当該複数の文書間で比較可能に表示する。この表示では、例えば、感情指数を付与された特徴語にはその感情指数に応じた背景色が付される。【選択図】図8

Description

本発明は、テキストマイニングに関し、特に、複数の文書の感情極性の傾向を比較するためのテキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置に関する。
近年、自由記述されたテキストデータを解析し、解析結果から有用な情報を求めるテキストマイニングが注目されている。このテキストマイニングの分野において、文書のテキストデータから、当該文書に関連する物や、人、コンテンツ等に対し肯定的か否定的かという感情極性の傾向(以下「感情的傾向」という)を判定する技術が知られている。
例えば、単語とその単語が表す感情(肯定的か否定的かを示す感情極性等)との対応関係が予め登録された感情語辞書を用いて、文書に含まれている単語のうち感情極性が肯定的な単語の数と否定的な単語の数とを比較し、その比較結果に応じて当該文書の感情極性(当該文書が肯定的か否定的か中立的か)を判定する方法が知られている(特許文献1の段落[0009]参照)。
特開2011-204226号公報 特開2013-246636号公報 特表2016-530651号公報
上記従来の方法では、文書に含まれる単語が感情語辞書に登録されているか否かを調べ、登録されている場合にその単語を感情語辞書にしたがって肯定的か否定的かという2種類に分類している。このため、感情強度(感情極性)が弱い単語すなわち中性に近い単語についてはその適切な取り扱い方が確立していなかった。また、このような単語の感情極性については、対象とする文書の内容によって調整する必要があったが、そのための簡便な手法が知られていなかった。
また上記従来の方法では、複数の文書間で感情的傾向を比較する場合、それぞれの文書に含まれる単語のうち感情語辞書に登録されている単語である感情語を全て集計してその集計結果を比較していた。このため、その比較のための計算量が多くなり、また、或る文書において他の文書に比べ多く出現している感情語が過小評価されることもある。
そこで、少ない計算量で文書における感情語の適切な評価に基づき複数の文書間で感情的傾向を比較できるデータマイニング方法やテキストマイニング装置等を提供することが求められている。
本発明の第1の局面は、複数の文書間で感情極性の傾向を比較するためのテキストマイニング方法であって、
感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示を受け付ける指示入力ステップと、
前記対象文書として指定された前記複数の文書のテキストデータに基づき、前記複数の文書のそれぞれから特徴語を抽出する特徴語抽出ステップと、
前記特徴語抽出ステップにより抽出された特徴語のうち所定の感情語辞書に登録されている特徴語に対し、当該感情語辞書において感情極性の強さを示す数値として当該特徴語に与えられている感情指数を付与する感情指数取得ステップと、
前記対象文書として指定された前記複数の文書につき、前記特徴語抽出ステップにより抽出された特徴語を前記感情指数取得ステップにより付与された感情指数とともに表示する表示ステップとを備える。
本発明の第2の局面は、本発明の第1の局面において、
前記指示入力ステップは、前記対象文書から抽出すべき特徴語の範囲を指定する指示を受け付けるステップを更に含み、
前記特徴語抽出ステップでは、前記指示入力ステップで指定される範囲内の特徴語が抽出される。
本発明の第3の局面は、本発明の第1または第2の局面において、
前記指示入力ステップは、感情極性の強さを示す指数である感情指数の範囲を指定する指示を受け付けるステップを更に含み、
前記感情指数取得ステップでは、前記特徴語抽出ステップにより抽出された特徴語のうち前記指示入力ステップで指定された範囲内の感情指数を与えられた単語として前記感情語辞書に登録されている特徴語に対し当該感情指数が付与される。
本発明の第4の局面は、本発明の第3の局面において、
前記指示入力ステップは、前記抽出された特徴語が前記付与された感情指数とともに前記表示ステップにより表示されているときに、前記感情指数の範囲の変更を指定する指示を受け付けるステップを更に含む。
本発明の第5の局面は、本発明の第1から第4の局面のいずれかにおいて、
前記対象文書として指定された前記複数の文書のそれぞれにつき、前記特徴語抽出ステップにより当該文書から抽出された特徴語のうち前記感情指数取得ステップにより感情指数を付与された特徴語に基づき当該文書の感情指数を文書感情指数として算出する文書感情指数算出ステップを更に備え、
前記表示ステップでは、前記文書感情指数算出ステップにより算出された前記文書感情指数を示す表示が行われる。
本発明の第6の局面は、複数の文書間で感情極性の傾向を比較するためのテキストマイニングプログラムであって、
感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示を受け付ける指示入力ステップと、
前記対象文書として指定された前記複数の文書のテキストデータに基づき、前記複数の文書のそれぞれから特徴語を抽出する特徴語抽出ステップと、
前記特徴語抽出ステップにより抽出された特徴語のうち所定の感情語辞書に登録されている特徴語に対し、当該感情語辞書において感情極性の強さを示す数値として当該特徴語に与えられている感情指数を付与する感情指数取得ステップと、
前記対象文書として指定された前記複数の文書につき、前記特徴語抽出ステップにより抽出された特徴語を前記感情指数取得ステップにより付与された感情指数とともに表示する表示ステップとをコンピュータにCPUがメモリを利用して実行させる。
本発明の第7の局面は、複数の文書間で感情極性の傾向を比較するためのテキストマイニング装置であって、
感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示を受け付ける指示入力部と、
前記対象文書として指定された前記複数の文書のテキストデータに基づき、前記複数の文書のそれぞれから特徴語を抽出する特徴語抽出部と、
前記特徴語抽出部により抽出された特徴語のうち所定の感情語辞書に登録されている特徴語に対し、当該感情語辞書において感情極性の強さを示す数値として当該特徴語に与えられている感情指数を付与する感情指数取得部と、
前記対象文書として指定された前記複数の文書につき、前記特徴語抽出部により抽出された特徴語を前記感情指数取得部により付与された感情指数とともに表示する表示部と
を備える。
本発明の他の局面は、本発明の上記局面ならびに後述の実施形態およびその変形例に関する説明から明らかであるので、その説明を省略する。
上記第1、第6または第7の局面によれば、対象文書として指定された複数の文書のそれぞれにつき特徴語が抽出され、抽出された特徴語である対象特徴語のうち、感情語辞書に感情語として登録されている特徴語に対し、その感情語辞書でその特徴語に与えられている感情指数が付与される。このようにして当該複数の文書につき、対象特徴語とそれらに含まれる感情語に付与された感情指数とが、当該複数の文書に対する感情的傾向分析の結果として表示される。このような表示により、感情的傾向を比較すべき複数の文書において感情極性が弱い特徴語が含まれている場合であっても、抽出された特徴語とともにそれらに付与されている感情指数を見ることにより、当該複数の文書間でそれらの感情的傾向を的確に把握することができる。
上記第2の局面によれば、対象文書としての複数の文書のそれぞれから抽出すべき特徴語の範囲を指定できるので、より特徴的な単語のみを対象特徴語として抽出することで、従来に比べ、少ない計算量で上記複数の文書のそれぞれの特徴を反映した感情的傾向を上記複数の文書間で比較できる。また、上記複数の文書のうち或る文書において他の文書に比べより多く出現している特徴的な感情語が過小評価されるという問題も回避できる。
上記第3の局面によれば、対象文書としての複数の文書のそれぞれから抽出される特徴語である対象特徴語に付与される感情指数の範囲を指定することで、感情極性の弱い特徴語を含む複数の文書間でそれらの感情的傾向を的確に比較することができる。
上記第4の局面によれば、上記のように抽出された特徴語が上記のように付与された感情指数とともに対象文書としての複数の文書に対する感情的傾向分析の結果として表示されているときに、感情指数の範囲の変更を指定する指示を受け付けると、変更後の感情指数の範囲に基づき、上記複数の文書のそれぞれにつき特徴語が対象特徴語として抽出され、当該対象特徴語のうち感情語辞書に感情語として登録されている特徴語に対し感情指数が付与され、その後、上記複数の文書につき、対象特徴語とそれらに含まれる感情語に付与された感情指数とが上記複数の文書に対する感情的傾向分析の結果として表示される。これにより利用者は、上記複数の文書に対する感情的傾向分析の結果を一旦表示させた後に、その表示を見ながら感情指数の指定範囲を調整することで、上記複数の文書の感情的傾向をさらに的確に比較することができる。
上記第5の局面によれば、対象文書としての複数の文書のそれぞれにつき、感情指数を付与された対象特徴語に基づき文書感情指数が算出されるので、上記複数の文書間でそれらの特徴語に付与された感情指数を比較することに加えて、上記複数の文書間で文書感情指数を比較することができる。これにより、上記複数の文書の感情的傾向をより的確かつ容易に比較することができる。
本発明の他の局面の効果については、本発明の上記局面の効果ならびに下記実施形態およびその変形例の効果についての説明から明らかであるので、説明を省略する。
本発明の一実施形態に係るテキストマイニング装置の構成を示すブロック図である。 上記一実施形態に係るテキストマイニング装置として動作するコンピュータの構成を示すブロック図である。 感情指数付き感情語辞書を説明するための図である。 上記一実施形態に係るテキストマイニング装置としてコンピュータが動作するために実行される感情的傾向分析処理の手順を示すフローチャートである。 上記一実施形態に係るテキストマイニング装置における操作画面を示す図である。 上記一実施形態における特徴語の抽出を説明するための図である。 上記一実施形態において対象文書のそれぞれにつき抽出された特徴語の感情的傾向を示す表示例の図である。 上記一実施形態に係るテキストマイニング装置における感情的傾向分析の結果を表す表示例を示す図である。
以下、図面を参照して、本発明の一実施形態に係るテキストマイニング装置について説明する。このテキストマイニング装置は、複数の文書間で感情的傾向(感情極性の傾向)を比較するためのテキストマイニング方法を実施するための装置であり、後述のテキストマイニングプログラムをコンピュータが実行することにより実現される。なお以下において、「感情極性」とは、文書において肯定的な意見が述べられているか否定的な意見が述べられているかを示す情報をいう。
<1.テキストマイニング装置の機能的構成>
図1は、本実施形態に係るテキストマイニング装置10の機能的構成を示すブロック図である。このテキストマイニング装置10は、指示入力部および表示部として機能するGUI部11と、テキストデータ記憶部12と、特徴語抽出部13と、感情指数付き感情語辞書を記憶している辞書記憶部14と、特徴語感情指数取得部15と、文書感情指数算出部16と、表示データ処理部17とを備えている。なお、このテキストマイニング装置10は、テキストデータ記憶部12および辞書記憶部14の一方または双方を備えず、外部の記憶部に記憶されたテキストデータおよび感情指数付き感情語辞書の一方または双方ををネットワークを介して利用するように構成されていてもよい。
本実施形態では、感情的傾向を比較すべき複数の文書からなる対象文書を含む多数の文書のテキストデータがテキストデータ記憶部12に予め記憶されているものとする。対象文書の指定等、感情的傾向分析処理を行うときには、そのための利用者の指示(対象文書の指定等)がGUI部11により受け付けられる。この指示に基づき、特徴語抽出部13は、まず、対象文書として指定された複数の文書のテキストデータをテキストデータ記憶部12から読み出し、当該複数の文書のそれぞれに含まれる特徴語を抽出する。特徴語感情指数取得部15は、抽出された特徴語である対象特徴語のうち、辞書記憶部14における感情指数付き感情語辞書に感情語として登録されている特徴語に対し、当該感情語辞書において当該特徴語に与えられている感情指数を付与する。なお、この感情指数は、感情極性の強度を示す数値であり、後述の文書感情指数と区別すべき場合には「単語感情指数」と呼ぶものとする。文書感情指数算出部16は、このようにして感情指数の付与された特徴語を用いて後述の式により当該複数の文書のそれぞれにつき感情指数(文書感情指数)を算出する。このようにして、対象文書として指定された複数の文書のそれぞれにつき、対象特徴語とそれらに含まれる感情語に付与された感情指数(単語感情指数)と文書感情指数とが得られる。表示データ処理部17は、これらの対象特徴語、単語感情指数、および、文書感情指数を当該複数の文書間で比較可能に表示するための表示データを生成する。GUI部11は、表示部として、この表示データに基づき当該複数の文書の感情的傾向を比較するための表示を行う。これは、対象文書に対する感情的傾向分析の結果を示すものである。利用者は、この表示を見て、対象文書としての複数の文書間での感情的傾向の相違を把握することができ、また、必要に応じて、指示入力部としてのGUI部11に対して特徴語に付与すべき感情指数の範囲を絞り、再度、上記のような感情的傾向分析を行うことができる。
<2.テキストマイニング装置のハードウェア構成>
図2は、本実施形態において後述のテキストマイニングプログラムによりテキストマイニング装置10として動作するコンピュータ20の構成、すなわわち、本実施形態に係るテキストマイニング装置10のハードウェア構成を示すブロック図である。図2に示すコンピュータ20は、CPU21、メインメモリ22、補助記憶装置23、入力操作部24、表示装置25、通信インターフェース装置26、および、記録媒体読取装置27を備えている。メインメモリ22には、例えばDRAMが使用される。補助記憶装置23には、例えばハードディスクやソリッドステートドライブが使用される。入力操作部24には、例えばキーボード28やマウス29が含まれる。表示装置25には、例えば液晶ディスプレイが使用される。通信インターフェース装置26は、有線通信または無線通信のインターフェース回路である。記録媒体読取装置27は、プログラムなどを記憶した記録媒体30のインターフェース回路である。記録媒体30には、例えば、CD-ROM、DVD-ROM、USBメモリなどの非一過性の記録媒体が使用される。
上記のように構成されたコンピュータ20において、補助記憶装置23は、本実施形態に係るテキストマイニングプログラム31に加えて、対象文書のテキストデータ32と感情指数付き感情語辞書である感情語辞書34とを記憶し、これによりテキストデータ記憶部12および辞書記憶部14が実現される。テキストマイニングプログラム31とテキストデータ32は、例えば、サーバや他のコンピュータから通信インターフェース装置26を用いて受信したものでもよく、記録媒体30から記録媒体読取装置27を用いて読み出したものでもよい。また、感情語辞書34は、サーバや他のコンピュータに格納されていてもよく、この場合、テキストマイニング装置10として動作するコンピュータ20は、ネットワークおよび通信インターフェース装置26を介して感情語辞書34を利用することになる。
コンピュータ20においてテキストマイニングプログラム31を実行するときには、テキストマイニングプログラム31とテキストデータ32がメインメモリ22にロードされる。CPU21は、メインメモリ22を作業用メモリとして利用して、メインメモリ22に記憶されたテキストマイニングプログラム31を実行することにより、対象文書に対して感情的傾向分析処理を行う。この感情的傾向分析処理では、対象文書として指定された複数の文書のそれぞれにつき、特徴語の抽出や、特徴語の感情指数の取得、文書感情指数の算出等が行われる(詳細は後述)。CPU21が感情的傾向分析処理を行うとき、コンピュータ20はテキストマイニング装置10として機能する。なお、以上に述べたコンピュータ20の構成は一例に過ぎず、種々のコンピュータを用いてテキストマイニング装置10を実現することができる。
<3.感情指数付き感情語辞書>
上記の感情的傾向分析処理では、補助記憶装置23に格納されている感情指数付き感情語辞書である感情語辞書34が使用される。図3は、本実施形態において使用される感情指数付き感情語辞書を説明するための図である。この感情語辞書では、肯定的か否定的かという感情極性を示す単語が感情語として収集されて登録されており、さらに、登録されている各感情語に対し、その感情極性の強度を示す数値が感情指数として示されている。この感情指数は、-1.00から+1.00の範囲内の数値であり、肯定的な感情語には正の数値が、否定的な感情語には負の数値がそれぞれ与えられる。例えば図3に示すように、強い肯定的な意味を持つ「優良」という単語(感情語)には感情指数として+1.00が与えられ、強い否定的な意味を持つ「凶悪」という単語(感情語)には感情指数として-1.00が与えられる。感情指数付き感情語辞書の作成方法としては、単語をベクトル化(数値化)したうえで既知の感情語との類似度を計算する等、幾つかの方法が知られている。本実施形態では、既知のいずれかの方法により作成された情指数付き感情語辞書のデータが感情語辞書34として補助記憶装置23に予め記憶されている。
<4.感情的傾向分析処理>
上記のように、コンピュータ20においてCPU21がテキストマイニングプログラム31を実行することにより対象文書に対して感情的傾向分析処理が行われる。図4は、この感情的傾向分析処理の手順を示すフローチャートである。本実施形態では、CPU21がテキストマイニングプログラム31を実行することにより、コンピュータ20は図4に示すように動作する。
まず、対象文書、特徴語の範囲、および、感情指数(単語感情指数)の範囲を指定するための指示を受け付ける(ステップS10)。具体的には、表示装置25に例えば図5に示すような操作画面を表示し、利用者がこの操作画面に対し、入力操作部24におけるキーボード28やマウス29を使用して、対象文書、特徴語の範囲、および、感情指数の範囲を指定する操作を行い、操作画面における“OK”のボタン260をクリックする。これにより、テキストマイニング装置10としてのコンピュータ20は、指定された対象文書、特徴語の範囲、および、感情指数の範囲を示す入力情報を受け取る。図5に示す例では、第1摘まみ251と第2摘まみ252とを有するスライダー250を操作することにより、感情指数の範囲を指定することができる。すなわち、スライダー250における第1摘まみ251および第2摘まみ252の位置を設定することにより、“-1.00”から第1摘まみ251の位置が示す負値までの否定的感情指数の範囲(負の感情指数の範囲)と第2摘まみ252の位置が示す正値から“+1.00”までの肯定的感情指数の範囲(正の感情指数の範囲)とからなる2つの範囲を感情指数の指定範囲とすることができる。なお、対象文書としては、感情的傾向を比較すべき複数の文書が指定される。ここでは、或る製品の機種A、機種B、および機種Cのレビュー文書(当該製品の各機種につき利用者の感想や批評、意見などを記載した文書)が対象文書として指定されたものとして以下の説明を行う。
上記ステップS10において、特徴語の範囲の指定は、対象文書として指定された各文書から特徴語を抽出する際に各単語の特徴度を示す数値が使用されることを前提としている(詳細は後述)。特徴語の範囲の指定は、対象文書として指定された各文書において特徴度の大きい単語から順に幾つの単語を特徴語として抽出するかを指定することにより行われる。
このようにして、対象文書、特徴語の範囲、および、感情指数の範囲を指定する指示を受け付けた後、まず、対象文書として指定された複数の文書のテキストデータ32を補助記憶装置23からメインメモリ22に読み込む(ステップS12)。次に、このテキストデータ32を用いて、指定された範囲内の特徴語を対象文書としての複数の文書のそれぞれから対象特徴語として抽出する(ステップS14)。
図6は、或る製品の機種A、機種B、および機種Cのレビュー文書が対象文書として指定され、特徴度の大きい順から上位10個が特徴語の範囲として指定された場合における特徴語の抽出例を示している。図6では、機種A、機種B、および機種Cのレビュー文書のそれぞれにつき、特徴度の大きい順から10個の特徴語がそれらの特徴度を示す数値とともに示されている。
図6に示す例では、単語の特徴度を示す数値としてジャッカード係数(Jaccard係数)が使用されている。対象文書としての機種A、機種B、および機種Cのレビュー文書をそれぞれ符号Da,Db,Dcで示すものとすると、文書Dxにおける単語wのジャッカード係数Jxwは、下記(p1)~(p4)の手順により算出される(x=a,b,c)。
(p1)文書Da,Db,Dcに含まれる全ての文(sentence)のうち単語wを含む文の数Nwを求める。
(p2)文書Dxに含まれる文の数Nxを求める。
(p3)文書Dxに含まれる文のうち単語wを含む文の数Nxwを求める。
(p4)文書Dxにおける単語wのジャッカード係数Jxwを下記式により求める。
Jxw=Nxw/(Nw+Nx-Nxw) …(1)
一般的には、対象文書として複数の文書D1,D2,…,Dnが指定された場合、これらのうち文書Dk(1≦k≦n)における単語wのジャッカード係数Jkwは下記式により表される。
Jkw=|Sw∩Sk|/|Sw∪Sk| …(2)
ここで、Swは、文書D1,D2,…,Dnに含まれる全ての文のうち単語wを含む文を要素とする集合を示し、Skは、文書Dkに含まれる全ての文を要素とする集合を示す。
対象文書としての複数の文書D1,D2,…,Dnのうち文書Dk(1≦k≦n)における単語の特徴度を示す数値として、このようなジャッカード係数の代わりに、文書Dkにおいて当該単語を含む文の数(以下「文書内出現数」という)を使用することが考えられる。この文書内出現数を使用すると下記のような不都合が生じる。すなわち、文書D1,D2,…,Dnのいずれにおいても多く出現する単語wpは、いずれの文書Dk(1≦k≦n)においても特徴度が高いとは言えないが、文書内出現数は大きい。また、或る文書Dk(1≦k≦n)に含まれるが他の文書Dj(j≠kかつ1≦j≦n)ではほぼ皆無である単語wqは、文書Dkにおいて当該単語wqを含む文の数(文書内出現数)が大きいものでなくても特徴度が高いとされる場合があるが、この文書内出現数が或る程度以上小さければ文書Dkにおける特徴語とは言えない。これに対し、ジャッカード係数を使用する場合には、文書Dkにおいてこれら2つの単語wp,wqにつき上記式(2)により算出されるジャッカード係数は十分に小さくなり、これら2つの単語wp,wqはいずれも特徴語として抽出されない。
上記のようにして対象文書としての複数の文書のそれぞれから対象特徴語が抽出されると、次に、対象文書のうち未着目のいずれか1つの文書に着目する(ステップS15)。なお、感情的傾向分析処理の開始後、最初にステップS15が実行されるときには、対象文書として指定された複数の文書はいずれも未着目状態である。上記のように、或る製品の機種A、機種B、および機種Cのレビュー文書が対象文書として指定された場合、機種A、機種B、および機種Cのレビュー文書のうちいずれか1つが着目文書となる。
次に、着目文書において抽出された特徴語である対象特徴語のそれぞれを感情指数付き感情語辞書34で検索し、当該対象特徴語のうち、感情語辞書34において指定範囲内の感情指数を有する単語(感情語)として登録されている特徴語に対し、その感情指数を付与する(ステップS16)。図7は、対象文書として指定された機種A、機種B、および機種Cのレビュー文書のそれぞれから抽出された特徴語の感情的傾向の表示例を示している。これは説明の便宜のための表示例であり、後述の図8に示す実際の表示例の主要部を構成する。この表示例では、感情指数を付与された特徴語には、当該特徴語が肯定的か否定的か(付与された感情指数が正か負か)によって色が異なり当該特徴語に付与された感情指数に応じた濃度を有する背景色が付されている。例えば、肯定的な特徴語には、その感情指数に応じた濃度の青の背景色が付され、否定的な特徴語には、その感情指数に応じた濃度の赤の背景色が付される。上記のように機種Aのレビュー文書が着目文書であるときには、図7において“機種A”について示される特徴語の背景色が、感情語辞書34に基づき付与された感情指数を示している。対象特徴語のうち感情語辞書34に登録されていない特徴語には背景色は付されない。
次に、注目文書から抽出された対象特徴語のうち感情指数を付与された特徴語に基づき着目文書の感情指数を求める(ステップS18)。すなわち、着目文書の感情指数である文書感情指数Ctxを下記式により算出する。
Ctx=(Naf-Nng)/(Naf+Nng) …(3)
ここで、Nafは、着目文書から抽出された特徴語のうち正の感情指数を付与された特徴語の個数、すなわち着目文書における肯定的な特徴語の出現数である。Nngは、着目文書から抽出された特徴語のうち負の感情指数を付与された特徴語の個数、すなわち着目文書における否定的な特徴語の出現数である。上記式(3)からわかるように、文書感情指数Ctxは-1から+1までの範囲の値をとる。
その後、対象文書に未着目の文書が含まれているか否かを判定し(ステップS20)、未着目の文書が含まれている場合にはステップS15へ戻る。以降、対象文書に未着目の文書が含まれなくなるまでステップS15~S20を繰り返し実行し、ステップS20において対象文書に未着目の文書が含まれていないと判定されると、ステップS22へ進む。既述のように、或る製品の機種A、機種B、および機種Cのレビュー文書が対象文書として指定されたとすると、機種A、機種B、および機種Cのレビュー文書のそれぞれにつきステップS15~S20が実行され、その後、ステップS22へ進む。
ステップS22へ進んだ時点では、対象文書として指定された機種A、機種B、および機種Cのレビュー文書のそれぞれにつき、指定範囲内の特徴語が対象特徴語として抽出され(図6参照)、対象特徴語のうち感情語辞書34において指定範囲内の感情指数を有する感情語として登録されている特徴語に対しその感情指数が付与され(図7参照)、感情指数を付与された対象特徴語に基づき文書感情指数Ctxが算出されている。ステップS22では、このようにして対象文書としての複数の文書につき得られた対象特徴語とそれらに含まれる感情語に付与された感情指数と文書感情指数Ctxとを当該複数の文書間で比較可能に表示するための表示用データを生成する(ステップS22)。すなわち、対象文書としての機種A、機種B、および機種Cのレビュー文書のそれぞれにつき得られた対象特徴語とそれらに含まれる感情語に付与された感情指数と文書感情指数Ctxとに基づき、それらのレビュー文書の感情的傾向を比較するための表示用データを生成する。
次に、このようにして生成された表示用データを用いて、対象文書として指定された複数の文書の感情的傾向を比較可能に表示装置25に表示する(ステップS24)。これは、対象文書に対する感情的傾向分析の結果を示すものである。例えば、機種A、機種B、および機種Cのレビュー文書から構成される対象文書に対する感情的傾向分析の結果として図8に示すような表示を行う。図8の表示例では、感情指数(単語感情指数)を付与された対象特徴語には、その感情指数に応じた色および濃度の背景色が付されており、これに加えて、対象文書として指定された文書の名称を示す「機種A」、「機種B」、および「機種C」のそれぞれにも、その文書感情指数Ctxに対応する色および濃度の背景色が付されている。さらに当該表示例では、ステップS10において感情指数の範囲を指定するために表示されるスライダー250(図5参照)と同じスライダー250が対象文書に対する感情的傾向分析の結果とともに表示されている。
図8に示すスライダー250も利用者によってマウス29を用いて操作可能に構成されている。利用者は、図8に示すような対象文書に対する感情的傾向分析の結果の表示を見て、このスライダー250を操作することにより、対象文書から抽出すべき特徴語の感情指数の範囲を変更することができる。すなわち、コンピュータ20は、対象文書に対する感情的傾向分析の結果の表示中において、このスライダー250が操作されるまで待機しており(ステップS26)、このスライダー250が利用者によって操作されると、対象文書として指定された全ての文書(機種A、機種B、および機種Cのレビュー文書の全て)を未着目状態に戻し(ステップS28)、ステップS12へ戻る。
以降、感情指数の指定範囲が変更された状態で、上記と同様にして、対象文書として指定された複数の文書(ここでは機種A、機種B、および機種Cのレビュー文書)のそれぞれにつきステップS15~S20が実行され、その後、ステップS22へ進む。この後、ステップS22およびS24が実行された時点では、感情指数の変更後の指定範囲についての対象文書に対する感情的傾向分析の結果が図8に示す形態と同様の形態で表示される。コンピュータ20は、上記と同様、この表示状態においてスライダー250が操作されるまで待機する。この待機中において、スライダー250の操作により感情指数の範囲が更に変更されると、ステップS12へ戻り、上記と同様の処理が行われる。なお、この待機中において、割り込み処理により終了指示が受け取ると、図4に示す感情的傾向分析処理を終了する。
以上の説明からわかるように、本実施形態では、入力操作部24および表示装置25に関する処理を行うステップS10,S24,S26により指示入力部および表示部としてのGUI部11が実現され、ステップS14により特徴語抽出部13が実現され、ステップS16により特徴語感情指数取得部15が実現され、ステップS18により文書感情指数算出部16が実現される。
<5.効果>
上記のような本実施形態によれば、感情的傾向を比較すべき複数の文書(対象文書)のそれぞれにつき特徴語が抽出され、抽出された特徴語である対象特徴語のうち、感情語辞書34に感情語として登録されている特徴語に対し、その感情語辞書34でその特徴語に与えられている感情指数が付与される。このようにして当該複数の文書のそれぞれにつき、対象特徴語とそれらに含まれる感情語に付与された感情指数とが、対象文書として指定された当該複数の文書に対する感情的傾向分析の結果として表示される。このような表示により(図4のステップS22,S24、図7、図8参照)、感情的傾向を比較すべき複数の文書において感情極性が弱い特徴語が含まれている場合であっても、抽出された特徴語とともにそれらに付与されている感情指数である-1から+1までの範囲の数値を見ることにより、当該複数の文書間でそれらの感情的傾向を的確に把握することができる。
また、本実施形態によれば、上記複数の文書のそれぞれから抽出される特徴語である対象特徴語に付与される感情指数の範囲を指定できる(図4のステップS10、図5参照)。すなわち、図5に示すスライダー250を操作することにより、既述のように否定的感情指数の範囲と肯定的感情指数の範囲とからなる2つの範囲を感情指数の指定範囲とし、対象特徴語のうち感情極性の弱い中立的な特徴語には感情指数を付与しないようにすることができる。これにより、感情極性の弱い特徴語を含む複数の文書間でそれらの感情的傾向を的確に比較することができる。本実施形態では、上記複数の文書のそれぞれにつき、指定された範囲内の感情指数を付与された対象特徴語に基づき既述の式(3)により文書感情指数Ctxが算出されるので(図4のステップS16参照)、上記複数の文書間でそれらの特徴語に付与された感情指数を比較することに加えて、上記複数の文書間で文書感情指数Ctxを比較することができる(図8参照)。これにより、複数の文書の感情的傾向をより的確かつ容易に比較することができる。
さらに、本実施形態によれば、対象文書としての複数の文書のそれぞれから抽出すべき特徴語の範囲を指定できるので(図4のステップS10,S14、図5参照)、より特徴的な単語のみ(例えば特徴度の大きい順から上位10個の単語)を対象特徴語として抽出することで、従来に比べ、少ない計算量で上記複数の文書のそれぞれの特徴を反映した感情的傾向を上記複数の文書間で比較できる。また、上記複数の文書のうち或る文書において他の文書に比べより多く出現している特徴的な感情語が過小評価されるという問題も回避できる。
さらにまた、本実施形態によれば、上記複数の文書に対する感情的傾向分析の結果を示す表示装置25には感情指数の範囲を指定するためのスライダー250も表示されるので(図8)、利用者は当該感情的傾向の分析結果を見て感情指数の範囲を変更し、変更後の感情指数の範囲に基づき上記複数の文書に対する感情的傾向分析の結果を表示させることができる(図4のステップS26→S28→S15→…→S24)。これにより、利用者は、上記複数の文書に対する感情的傾向分析の結果を一旦表示させた後に、その表示を見ながら感情指数の指定範囲を調整することで、上記複数の文書の感情的傾向をさらに的確に比較することができる。
<6.変形例>
本発明は上記実施形態に限定されるものではなく、本発明の範囲を逸脱しない限りにおいて種々の変形を施すことができる。
例えば上記実施形態では、感情的傾向を比較すべき対象文書として指定された複数の文書のそれぞれから特徴語を抽出する際に、対象文書から抽出すべき特徴語の範囲が特徴度を示す数値としてのジャッカード係数の範囲(最小値および最大値)によって指定されるが、ジャッカード係数(Jaccard係数)に限定されず、特徴語の特徴度を示す他の数値を用いて特徴語の範囲を指定してもよい。例えば、ジャッカード係数に代えてダイス係数(Dice係数)またはシンプソン係数(Simpson係数)を使用してもよく、また、TF-IDF(Term Frequency - Inverse Document Frequency)手法に基づく特徴度を示す数値によって、抽出すべき特徴語の範囲を指定してもよい。
また上記実施形態では、対象文書として指定された複数の文書に対する感情的傾向分析の結果の表示では、図8に示すように、当該複数の文書のそれぞれにつき抽出された特徴語とそれらの特徴度を示す数値を示すとともに、特徴語の感情指数(単語感情指数)および文書の感情指数(文書感情指数)Ctxがその感情指数に対応する色および濃度の背景色によって示される。しかし、当該感情的傾向分析の結果の表示形態は、これに限定されるものではなく、特徴語の感情指数や文書の感情指数を数値または棒グラフ等の他の形態で表示してもよい。
10…テキストマイニング装置
11…GUI部
12…テキストデータ記憶部
13…特徴語抽出部
14…辞書記憶部
15…特徴語感情指数取得部
16…文書感情指数算出部
17…表示データ処理部
20…コンピュータ
21…CPU
22…メインメモリ
23…補助記憶装置
24…入力操作部
25…表示装置
30…記録媒体
31…テキストマイニングプログラム
32…テキストデータ
34…感情語辞書
250…スライダー

Claims (18)

  1. 複数の文書間で感情極性の傾向を比較するためのテキストマイニング方法であって、
    感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示を受け付ける指示入力ステップと、
    前記対象文書として指定された前記複数の文書のテキストデータに基づき、前記複数の文書のそれぞれから特徴語を抽出する特徴語抽出ステップと、
    前記特徴語抽出ステップにより抽出された特徴語のうち所定の感情語辞書に登録されている特徴語に対し、当該感情語辞書において感情極性の強さを示す数値として当該特徴語に与えられている感情指数を付与する感情指数取得ステップと、
    前記対象文書として指定された前記複数の文書につき、前記特徴語抽出ステップにより抽出された特徴語を前記感情指数取得ステップにより付与された感情指数とともに表示する表示ステップと
    を備える、テキストマイニング方法。
  2. 前記指示入力ステップは、前記対象文書から抽出すべき特徴語の範囲を指定する指示を受け付けるステップを更に含み、
    前記特徴語抽出ステップでは、前記指示入力ステップで指定される範囲内の特徴語が抽出される、請求項1に記載のテキストマイニング方法。
  3. 前記指示入力ステップは、感情極性の強さを示す指数である感情指数の範囲を指定する指示を受け付けるステップを更に含み、
    前記感情指数取得ステップでは、前記特徴語抽出ステップにより抽出された特徴語のうち前記指示入力ステップで指定された範囲内の感情指数を与えられた単語として前記感情語辞書に登録されている特徴語に対し当該感情指数が付与される、請求項1または2に記載のテキストマイニング方法。
  4. 前記指示入力ステップは、前記抽出された特徴語が前記付与された感情指数とともに前記表示ステップにより表示されているときに、前記感情指数の範囲の変更を指定する指示を受け付けるステップを更に含む、請求項3に記載のテキストマイニング方法。
  5. 前記対象文書として指定された前記複数の文書のそれぞれにつき、前記特徴語抽出ステップにより当該文書から抽出された特徴語のうち前記感情指数取得ステップにより感情指数を付与された特徴語に基づき当該文書の感情指数を文書感情指数として算出する文書感情指数算出ステップを更に備え、
    前記表示ステップでは、前記文書感情指数算出ステップにより算出された前記文書感情指数を示す表示が行われる、請求項1から4までのいずれか1項に記載のテキストマイニング方法。
  6. 前記文書感情指数算出ステップでは、前記対象文書として指定された前記複数の文書のそれぞれにつき前記文書感情指数Ctxが下記式により算出される、請求項5に記載のテキストマイニング方法:
    Ctx=(Naf-Nng)/(Naf+Nng)
    ここで、Nafは当該文書における肯定的な特徴語の出現数であり、Nngは当該文書における否定的な特徴語の出現数である。
  7. 前記表示ステップでは、前記対象文書として指定された前記複数の文書のそれぞれの名称は、当該文書の前記感情指数が肯定的か否定的かによって色が異なる背景色であって当該文書の前記感情指数に応じた濃度を有する背景色を付して表示される、請求項5または6に記載のテキストマイニング方法。
  8. 前記表示ステップでは、前記感情指数取得ステップにより感情指数を付与された特徴語は、当該特徴語の感情指数が肯定的か否定的かによって色が異なる背景色であって当該特徴語の感情指数に応じた濃度を有する背景色を付されて表示される、請求項1から7のいずれか1項に記載のテキストマイニング方法。
  9. 複数の文書間で感情極性の傾向を比較するためのテキストマイニングプログラムであって、
    感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示を受け付ける指示入力ステップと、
    前記対象文書として指定された前記複数の文書のテキストデータに基づき、前記複数の文書のそれぞれから特徴語を抽出する特徴語抽出ステップと、
    前記特徴語抽出ステップにより抽出された特徴語のうち所定の感情語辞書に登録されている特徴語に対し、当該感情語辞書において感情極性の強さを示す数値として当該特徴語に与えられている感情指数を付与する感情指数取得ステップと、
    前記対象文書として指定された前記複数の文書につき、前記特徴語抽出ステップにより抽出された特徴語を前記感情指数取得ステップにより付与された感情指数とともに表示する表示ステップと
    をコンピュータにCPUがメモリを利用して実行させる、テキストマイニングプログラム。
  10. 前記指示入力ステップは、前記対象文書から抽出すべき特徴語の範囲を指定する指示を受け付けるステップを更に含み、
    前記特徴語抽出ステップでは、前記指示入力ステップで指定される範囲内の特徴語が抽出される、請求項9に記載のテキストマイニングプログラム。
  11. 前記指示入力ステップは、感情極性の強さを示す指数である感情指数の範囲を指定する指示を受け付けるステップを更に含み、
    前記感情指数取得ステップでは、前記特徴語抽出ステップにより抽出された特徴語のうち前記指示入力ステップで指定された範囲内の感情指数を与えられた単語として前記感情語辞書に登録されている特徴語に対し当該感情指数が付与される、請求項9または10に記載のテキストマイニングプログラム。
  12. 前記指示入力ステップは、前記抽出された特徴語が前記付与された感情指数とともに前記表示ステップにより表示されているときに、前記感情指数の範囲の変更を指定する指示を受け付けるステップを更に含む、請求項11に記載のテキストマイニングプログラム。
  13. 前記対象文書として指定された前記複数の文書のそれぞれにつき、前記特徴語抽出ステップにより当該文書から抽出された特徴語のうち前記感情指数取得ステップにより感情指数を付与された特徴語に基づき当該文書の感情指数を文書感情指数として算出する文書感情指数算出ステップを更に備え、
    前記表示ステップでは、前記文書感情指数算出ステップにより算出された前記文書感情指数を示す表示が行われる、請求項9から12までのいずれか1項に記載のテキストマイニングプログラム
  14. 複数の文書間で感情極性の傾向を比較するためのテキストマイニング装置であって、
    感情極性の傾向を比較すべき複数の文書を対象文書として指定する指示を受け付ける指示入力部と、
    前記対象文書として指定された前記複数の文書のテキストデータに基づき、前記複数の文書のそれぞれから特徴語を抽出する特徴語抽出部と、
    前記特徴語抽出部により抽出された特徴語のうち所定の感情語辞書に登録されている特徴語に対し、当該感情語辞書において感情極性の強さを示す数値として当該特徴語に与えられている感情指数を付与する感情指数取得部と、
    前記対象文書として指定された前記複数の文書につき、前記特徴語抽出部により抽出された特徴語を前記感情指数取得部により付与された感情指数とともに表示する表示部と
    を備える、テキストマイニング装置。
  15. 前記指示入力部は、前記対象文書から抽出すべき特徴語の範囲を指定する指示を更に受け付け、
    前記特徴語抽出部は、前記指示入力部により指定される範囲内の特徴語を抽出する、請求項14に記載のテキストマイニング装置。
  16. 前記指示入力部は、感情極性の強さを示す指数である感情指数の範囲を指定する指示を更に受け付け、
    前記感情指数取得部は、前記特徴語抽出部により抽出された特徴語のうち前記指示入力部により指定された範囲内の感情指数を与えられた単語として前記感情語辞書に登録されている特徴語に対し当該感情指数を付与する、請求項14または15に記載のテキストマイニング装置。
  17. 前記指示入力部は、前記抽出された特徴語が前記付与された感情指数とともに前記表示部により表示されているときに、前記感情指数の範囲の変更を指定する指示を更に受け付ける、請求項16に記載のテキストマイニング装置。
  18. 前記対象文書として指定された前記複数の文書のそれぞれにつき、前記特徴語抽出部により当該文書から抽出された特徴語のうち前記感情指数取得部により感情指数を付与された特徴語に基づき当該文書の感情指数を文書感情指数として算出する文書感情指数算出部を更に備え、
    前記表示部は、前記文書感情指数算出部により算出された前記文書感情指数を示す表示を行う、請求項14から17までのいずれか1項に記載のテキストマイニング装置。
JP2022015493A 2022-02-03 2022-02-03 テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置 Pending JP2023113268A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2022015493A JP2023113268A (ja) 2022-02-03 2022-02-03 テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置
TW112100950A TW202341003A (zh) 2022-02-03 2023-01-10 文本探勘方法、文本探勘程式及文本探勘裝置
KR1020230012981A KR20230118030A (ko) 2022-02-03 2023-01-31 텍스트 마이닝 방법, 텍스트 마이닝 프로그램, 및 텍스트 마이닝 장치
CN202310119160.7A CN116541518A (zh) 2022-02-03 2023-02-01 文本挖掘方法、存储介质以及文本挖掘装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022015493A JP2023113268A (ja) 2022-02-03 2022-02-03 テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置

Publications (1)

Publication Number Publication Date
JP2023113268A true JP2023113268A (ja) 2023-08-16

Family

ID=87456661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022015493A Pending JP2023113268A (ja) 2022-02-03 2022-02-03 テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置

Country Status (4)

Country Link
JP (1) JP2023113268A (ja)
KR (1) KR20230118030A (ja)
CN (1) CN116541518A (ja)
TW (1) TW202341003A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117669566A (zh) * 2024-01-30 2024-03-08 北京点聚信息技术有限公司 一种版式文件的实时数据在线智能处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117669566A (zh) * 2024-01-30 2024-03-08 北京点聚信息技术有限公司 一种版式文件的实时数据在线智能处理方法
CN117669566B (zh) * 2024-01-30 2024-04-09 北京点聚信息技术有限公司 一种版式文件的实时数据在线智能处理方法

Also Published As

Publication number Publication date
CN116541518A (zh) 2023-08-04
KR20230118030A (ko) 2023-08-10
TW202341003A (zh) 2023-10-16

Similar Documents

Publication Publication Date Title
US10089296B2 (en) System and method for sentiment lexicon expansion
US20130268475A1 (en) Information processing apparatus, a method and a non-transitory computer readable medium thereof, and an information communication terminal, a control method and a non-transitory computer readable medium thereof
JP5023176B2 (ja) 特徴語抽出装置及びプログラム
WO2005038672A1 (ja) 調査対象文書の文書特徴分析装置
CN113032673B (zh) 资源的获取方法、装置、计算机设备及存储介质
KR20140067697A (ko) 협업 파트너 검색 서비스를 제공하는 시스템 및 방법
JP2023113268A (ja) テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置
JP2011215679A (ja) 文書推薦システム、文書推薦装置、文書推薦方法、及びプログラム
Wilson et al. A new and intuitive test for zero modification
JP2007183796A (ja) 企業評価値算出システム
JP2006004098A (ja) 評価情報生成装置、評価情報生成方法、及びプログラム
Singh et al. Exploring the relationship between journals indexed from a country and its research output: an empirical investigation
WO2020255307A1 (ja) 情報処理装置、情報処理方法、および記録媒体
JP6026036B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
CN112241453B (zh) 情感属性确定方法、装置及电子设备
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
Zhou et al. SurvMetrics: An R package for Predictive Evaluation Metrics in Survival Analysis.
US11301636B2 (en) Analyzing resumes and highlighting non-traditional resumes
JP2018067215A (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
CN114175082A (zh) 信息处理设备、信息处理方法和信息处理程序
JP5703958B2 (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP7387329B2 (ja) 情報処理装置、情報処理方法、及びプログラム
WO2024103649A1 (zh) 图像颜色识别方法、图像推荐方法及装置
WO2021079493A1 (ja) 業務フロー作成支援装置、業務フロー作成支援方法、および、業務フロー作成支援プログラム
WO2007052460A1 (ja) 情報処理装置、及び情報処理方法