JP7117168B2 - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JP7117168B2 JP7117168B2 JP2018113899A JP2018113899A JP7117168B2 JP 7117168 B2 JP7117168 B2 JP 7117168B2 JP 2018113899 A JP2018113899 A JP 2018113899A JP 2018113899 A JP2018113899 A JP 2018113899A JP 7117168 B2 JP7117168 B2 JP 7117168B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- information processing
- polarity
- value
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図1は、対象語句の追加登録例を示す説明図である。価値体系辞書DB(Database)100は、上述した人間のもつ価値観をそれぞれの価値(観点)ごとに分けて具体的な表現とともに整理した価値体系辞書をデータベース化した構造化データである。具体的には、たとえば、価値体系辞書DB100は、フィールドとして、価値カテゴリ101と、価値102と、極性103と、価値表現104と、を有する。価値カテゴリ101は、価値102の大分類である。1つの価値カテゴリ101は、1または関連する2以上の価値102を含む。
図2は、情報処理装置の構成例を示す説明図である。情報処理装置200は、プロセッサ201と、記憶デバイス202と、入力デバイス203と、出力デバイス204と、通信インターフェース(通信IF)205と、を有する。プロセッサ201、記憶デバイス202、入力デバイス203、出力デバイス204、および通信IF205は、バス206により接続される。プロセッサ201は、情報処理装置200を制御する。記憶デバイス202は、プロセッサ201の作業エリアとなる。また、記憶デバイス202は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス202としては、たとえば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス203は、データを入力する。入力デバイス203としては、たとえば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス204は、データを出力する。出力デバイス204としては、たとえば、ディスプレイ、プリンタがある。通信IF205は、ネットワークと接続し、データを送受信する。
図3は、文集合DB210の記憶内容例を示す説明図である。文集合DB210は、文書を本文ごとに分けて記憶するデータベースである。文集合DB210は、フィールドとして、文書ID301と、文ID302と、本文303と、を有する。文書ID301は、文書を一意に特定する識別情報である。文ID302は、本文303を一意に特定する識別情報であり、たとえば、文書内で本文303が登場する順番となる整数値である。本文303は、文書内の1つの文を示す文字列である。情報処理装置200は、文集合DB210を全文検索可能である。
図6は、情報処理装置200の機能的構成例1を示すブロック図である。情報処理装置200は、取得部601と、検索部602と、第1判定部603と、抽出部604と、第2判定部605と、出力部606と、第3判定部607と、登録部608と、検出部609と、削除部610と、を有する。取得部601~削除部610は、具体的には、たとえば、図2に示した記憶デバイス202に記憶されたプログラムをプロセッサ201に実行させることで実現される機能である。
図7は、編集条件の一例を示す説明図である。編集条件700とは、価値体系辞書DB100を編集するため、すなわち、対象語句110を追加登録するための入力情報である。編集条件700は、取得部601により取得される。編集条件700には、分析対象キーワード701と、特定の価値カテゴリ702と、特定の価値703と、特定の価値703の極性103と、価値表現104の追加候補705と、が設定可能である。特定の価値カテゴリ702は、特定の価値703が属する価値カテゴリ101である。価値表現104の追加候補705は、上述した対象語句110である。編集条件700は、ユーザにより作成される。
図8は、取得部601による価値表現104の追加候補705の取得例を示す説明図である。編集条件700に価値表現104の追加候補705が未設定であれば、取得部601は、価値表現104の追加候補705を取得することになる。ここでは、図7の(A)の編集条件700を用いて説明する。
図9は、文極性判定モデル630の生成例を示す説明図である。文極性判定モデル630の生成は、第1判定部603が実行してもよく、情報処理装置200外の他の装置が実行してもよい。第1判定部603が実行する場合、訓練DB900は、たとえば、記憶デバイス202に記憶される。訓練DB900は、訓練データ901と文極性902とを格納するデータベースである。訓練データ901は、文極性判定モデル630の生成に用いられる例文T1~Tn(nは1以上の整数)である。例文T1~Tnの任意の例文を例文Tとする。例文T1~Tnの各々には、その文極性902が設定されている。
図10は、促進抑制関係抽出および対象語句110の極性判定の例1を示す説明図である。例1では、図7(A)の編集条件700が取得されたものとする。例1では、検索本文ST1、ST2の文極性がNegativeである。図10において、(A)は、促進抑制関係抽出例を示し、(B)は、対象語句110である価値表現104の追加候補705の極性判定例を示す。
図12は、情報処理装置200による対象語句110の追加登録処理手順例を示すフローチャートである。情報処理装置200は、取得部601により編集条件700を取得し(ステップS1201)、編集条件700内の特定の価値703が新規の価値102、すなわち、価値体系辞書DB100に未登録の価値102であるか否かを判断する(ステップS1202)。新規な価値102である場合(ステップS1203:Yes)、取得部601は、編集条件700の特定の価値カテゴリ702、特定の価値703、および極性704を価値体系辞書DB100に新規追加する(ステップS1203)。そして、ステップS1204に移行する。たとえば、図7の(C)や(D)の編集条件700がステップS1203の処理対象となる。
以下に実験結果を示す。
・実験設定
内閣府の景気ウォッチャー調査2012年から2016年の60,368文を経済に関する文集合とする。文集合の各文について、景気の主観評価(5段階:悪い,やや悪い,変化なし,やや良い,良い)という回答者のコメントが関連付けられる。なお、前処理で、主観評価の「変化なし」に該当する文を除去し、さらに、「悪い」と「やや悪い」をまとめて「悪い」とし、「良い」と「やや良い」をまとめて「良い」とし、5段階の主観評価を2段階に変換した。この2段階の主観評価を文極性とする。
「失業」→Negative
「雇用」→Positive
「利益」→Positive
「売上」→Positive
「損失」→Negative
つぎに、価値体系辞書DB100を利用したサービスの運用中に、極性103が反転した価値表現104を削除する例について説明する。価値体系辞書DB100を利用したサービスの運用中に、文集合DB210や文極性判定モデル630の更新により、価値表現104の極性103が反転するにもかかわらず、現状の極性103のまま、登録され続ける場合がある。
図15は、情報処理装置200による確認候補1405の削除処理手順例を示すフローチャートである。情報処理装置200は、検出部609により、確認要求の検出を待ち受ける(ステップS1501:No)。確認要求が検出された場合(ステップS1501:Yes)、情報処理装置200は、取得部601により編集条件1400を取得し(ステップS1502)、検索部602により、確認候補1405を含む本文303(検索本文303)を文集合から検索する(ステップS1503)。このあと、情報処理装置200は、第1判定部603により、ステップS1207と同様、検索本文303の文極性を判定し(ステップS1504)、抽出部604により、ステップS1208と同様、検索本文303に含まれる促進抑制関係を抽出する(ステップS1505)。
図16は、検索結果画面例を示す説明図である。検索結果画面1600は、第1表示領域1601~第4表示領域1604を有する。第1表示領域1601は、追加候補705の追加登録の際に用いられた分析対象キーワード701を表示する領域である。第2表示領域1602は、価値カテゴリ101別の追加候補705の追加前後に関する検索本文303の件数を示す。
図17は、情報処理装置200の機能的構成例2を示すブロック図である。図6との相違は、あらたに、特定部1700が追加された点である。特定部1700は、具体的には、たとえば、図2に示した記憶デバイス202に記憶されたプログラムをプロセッサ201に実行させることで実現される機能である。
図18は、検索結果画面1600の処理手順例1を示すフローチャートである。情報処理装置200は、取得部601により、分析対象キーワード701を取得する(ステップS1801)。つぎに、情報処理装置200は、検索部602により、分析対象キーワード701を含む本文303を文集合DB210から検索する(ステップS1802)。
601 取得部
602 検索部
603 第1判定部
604 抽出部
605 第2判定部
606 出力部
607 第3判定部
608 登録部
609 検出部
610 削除部
Claims (15)
- プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有し、文集合を記憶する文集合データベースにアクセス可能な情報処理装置であって、
前記プロセッサは、
対象語句を取得する取得処理と、
前記取得処理によって取得された対象語句を含む文を前記文集合から検索する検索処理と、
前記検索処理によって検索された文の極性を判定する第1判定処理と、
前記検索処理によって検索された文に基づいて、当該文から前記対象語句と述語との組である促進抑制関係を抽出する抽出処理と、
前記第1判定処理の第1判定結果と、前記抽出処理の抽出結果と、に基づいて、前記対象語句の極性を判定する第2判定処理と、
前記第2判定処理の第2判定結果を出力する出力処理と、
を実行することを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記第1判定処理では、前記プロセッサは、入力文が与えられると前記入力文の極性を出力する文極性判定モデルに、前記検索処理によって検索された文を与えることにより、前記検索処理によって検索された文の極性を判定する、
ことを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置であって、
前記取得処理では、前記プロセッサは、分析対象キーワードを取得し、
前記検索処理では、前記プロセッサは、前記取得処理によって取得された分析対象キーワードおよび前記対象語句を含む文を前記文集合から検索する、
ことを特徴とする情報処理装置。 - 請求項3に記載の情報処理装置であって、
極性を持つ観点を示す語句である価値、前記価値を表現する語句である価値表現、および前記価値表現の極性を関連付けて記憶する価値体系辞書データベースと、見出し語および当該見出し語に関連する関連表現を記憶する関連表現辞書データベースと、にアクセス可能であり、
前記取得処理では、前記プロセッサは、特定の価値を取得し、前記特定の価値に関連付けられている特定の価値表現を、前記価値体系辞書データベースから取得し、当該特定の価値表現に一致する見出し語に関連する関連表現を、前記関連表現辞書データベースから前記対象語句として取得し、
前記検索処理では、前記プロセッサは、前記分析対象キーワードおよび前記関連表現を含む文を前記文集合から検索する、
ことを特徴とする情報処理装置。 - 請求項4に記載の情報処理装置であって、
前記プロセッサは、
前記価値体系辞書データベースにおける前記特定の価値の極性と、前記第2判定処理の第2判定結果である前記対象語句の極性とが、一致するか否かを判定する第3判定処理と、
前記第3判定処理によって一致すると判定された場合、前記価値体系辞書データベースにおける前記特定の価値に関連づけて前記対象語句を前記価値表現として登録する登録処理と、
を実行することを特徴とする情報処理装置。 - 請求項5に記載の情報処理装置であって、
前記プロセッサは、
前記第3判定処理によって一致しないと判定された場合、前記価値体系辞書データベースにおける前記特定の価値表現を削除する削除処理と、
を実行することを特徴とする情報処理装置。 - 請求項6に記載の情報処理装置であって、
前記プロセッサは、
前記価値表現の確認要求の有無を検出する検出処理を実行し、
前記削除処理では、前記プロセッサは、前記検出処理によって前記確認要求が検出され、かつ、前記第3判定処理によって一致しないと判定された場合、前記価値体系辞書データベースにおける前記特定の価値表現を削除する、
ことを特徴とする情報処理装置。 - 請求項5に記載の情報処理装置であって、
前記検索処理では、前記プロセッサは、前記分析対象キーワードを含む文を前記文集合から検索し、
前記プロセッサは、
前記検索処理によって検索された前記分析対象キーワードを含む文から、前記特定の価値に対応する価値表現を含む文を特定する特定処理を実行し、
前記出力処理では、前記プロセッサは、前記特定処理の第1特定結果を出力する、
ことを特徴とする情報処理装置。 - 請求項8に記載の情報処理装置であって、
前記特定処理では、前記プロセッサは、前記第1特定結果と、前記登録処理による登録前に実行された前記特定処理の第2特定結果と、に基づいて、前記第2特定結果には含まれていないが、前記第1特定結果には含まれている新規な文を特定し、
前記出力処理では、前記プロセッサは、前記新規な文を出力する、
ことを特徴とする情報処理装置。 - 請求項8に記載の情報処理装置であって、
前記特定処理では、前記プロセッサは、前記第1特定結果と、前記登録処理による登録前に実行された前記特定処理の第2特定結果と、に基づいて、前記第2特定結果には含まれているが、前記第1特定結果には含まれていない削除文を特定し、
前記出力処理では、前記プロセッサは、前記削除文を出力する、
ことを特徴とする情報処理装置。 - 請求項5に記載の情報処理装置であって、
前記検索処理では、前記プロセッサは、前記分析対象キーワードを含む文を前記文集合から検索し、
前記プロセッサは、
前記検索処理によって検索された前記分析対象キーワードを含む文から、前記特定の価値に対応する価値表現を含む文の数を特定する特定処理を実行し、
前記出力処理では、前記プロセッサは、前記特定処理の第1特定結果を出力する、
ことを特徴とする情報処理装置。 - 請求項11に記載の情報処理装置であって、
前記特定処理では、前記プロセッサは、前記第1特定結果と、前記登録処理による登録前に実行された前記特定処理の第2特定結果と、に基づいて、前記第2特定結果には含まれていないが、前記第1特定結果には含まれている新規な文の数を特定し、
前記出力処理では、前記プロセッサは、前記新規な文の数を出力する、
ことを特徴とする情報処理装置。 - 請求項12に記載の情報処理装置であって、
前記特定処理では、前記プロセッサは、前記第1特定結果と、前記登録処理による登録前に実行された前記特定処理の第2特定結果と、に基づいて、前記第2特定結果には含まれているが、前記第1特定結果には含まれていない削除文の数を特定し、
前記出力処理では、前記プロセッサは、前記削除文の数を出力する、
ことを特徴とする情報処理装置。 - 請求項9、10、12、および13のうちいずれか1つに記載の情報処理装置であって、
前記特定処理では、前記プロセッサは、前記第2特定結果を、前記取得処理によって前記分析対象キーワードが取得されてから前記登録処理によって前記対象語句が登録されるまでの間に実行することにより出力する、
ことを特徴とする情報処理装置。 - プログラムを実行するプロセッサと、前記プログラムを記憶する記憶デバイスと、を有し、文集合を記憶する文集合データベースにアクセス可能な情報処理装置による情報処理方法であって、
前記プロセッサは、
対象語句を取得する取得処理と、
前記取得処理によって取得された対象語句を含む文を前記文集合から検索する検索処理と、
前記検索処理によって検索された文の極性を判定する第1判定処理と、
前記検索処理によって検索された文に基づいて、当該文から前記対象語句と述語の組である促進抑制関係を抽出する抽出処理と、
前記第1判定処理の第1判定結果と、前記抽出処理の抽出結果と、に基づいて、前記対象語句の極性を判定する第2判定処理と、
前記第2判定処理の第2判定結果を出力する出力処理と、
を実行することを特徴とする情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018113899A JP7117168B2 (ja) | 2018-06-14 | 2018-06-14 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018113899A JP7117168B2 (ja) | 2018-06-14 | 2018-06-14 | 情報処理装置および情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019215825A JP2019215825A (ja) | 2019-12-19 |
JP7117168B2 true JP7117168B2 (ja) | 2022-08-12 |
Family
ID=68919116
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018113899A Active JP7117168B2 (ja) | 2018-06-14 | 2018-06-14 | 情報処理装置および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7117168B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101428946B1 (ko) * | 2013-11-04 | 2014-08-08 | 최상진 | 콘밸브 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016051551A1 (ja) | 2014-10-01 | 2016-04-07 | 株式会社日立製作所 | 文章生成システム |
WO2016056043A1 (ja) | 2014-10-06 | 2016-04-14 | 株式会社日立製作所 | 文章検索方法および文章検索システム |
WO2016067396A1 (ja) | 2014-10-29 | 2016-05-06 | 株式会社日立製作所 | 文の並び替え方法および計算機 |
-
2018
- 2018-06-14 JP JP2018113899A patent/JP7117168B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016051551A1 (ja) | 2014-10-01 | 2016-04-07 | 株式会社日立製作所 | 文章生成システム |
WO2016056043A1 (ja) | 2014-10-06 | 2016-04-14 | 株式会社日立製作所 | 文章検索方法および文章検索システム |
WO2016067396A1 (ja) | 2014-10-29 | 2016-05-06 | 株式会社日立製作所 | 文の並び替え方法および計算機 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101428946B1 (ko) * | 2013-11-04 | 2014-08-08 | 최상진 | 콘밸브 |
Also Published As
Publication number | Publication date |
---|---|
JP2019215825A (ja) | 2019-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101201037B1 (ko) | 키워드와 웹 사이트 콘텐츠 사이의 관련성 검증 | |
US9483460B2 (en) | Automated formation of specialized dictionaries | |
US9244908B2 (en) | Generation of a semantic model from textual listings | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
JP4347226B2 (ja) | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 | |
JP2005302042A (ja) | マルチセンスクエリについての関連語提案 | |
Ng | Semantic class induction and coreference resolution | |
Wang et al. | Neural related work summarization with a joint context-driven attention mechanism | |
KR102059743B1 (ko) | 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템 | |
King et al. | High-precision extraction of emerging concepts from scientific literature | |
JP7117168B2 (ja) | 情報処理装置および情報処理方法 | |
Nanba et al. | Bilingual PRESRI-Integration of Multiple Research Paper Databases. | |
JP4143085B2 (ja) | 同義語獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP5269399B2 (ja) | 構造化文書検索装置、方法およびプログラム | |
Patrick et al. | Developing SNOMED CT subsets from clinical notes for intensive care service | |
WO2021136009A1 (zh) | 搜索信息的处理方法、装置及电子设备 | |
US20090249197A1 (en) | Document proofreading support method and document proofreading support apparatus | |
Mei et al. | Post-processing OCR text using web-scale corpora | |
JP4213900B2 (ja) | 文書分類装置と記録媒体 | |
KR20220041336A (ko) | 중요 키워드 추천 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법 | |
JP4953459B2 (ja) | 文字ベクトルを用いた略語生成装置、方法及びプログラム | |
JP5094096B2 (ja) | 有名人の別表現の自動抽出装置、方法 | |
JP2008276561A (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
JP2015022406A (ja) | テキストによる視覚表現を含む文書を分析する装置、方法およびプログラム | |
Nitu et al. | Reconstructing scanned documents for full-text indexing to empower digital library services |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220801 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7117168 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |