JP2009128950A - 文書解析支援装置およびプログラム - Google Patents
文書解析支援装置およびプログラム Download PDFInfo
- Publication number
- JP2009128950A JP2009128950A JP2007299855A JP2007299855A JP2009128950A JP 2009128950 A JP2009128950 A JP 2009128950A JP 2007299855 A JP2007299855 A JP 2007299855A JP 2007299855 A JP2007299855 A JP 2007299855A JP 2009128950 A JP2009128950 A JP 2009128950A
- Authority
- JP
- Japan
- Prior art keywords
- ratio
- sentence
- differences
- message
- sets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】語出現データ記憶部150は、メッセージ番号、語ID、メッセージに付与された複数の属性の値等を含む語出現データを保持する。頻度計算部16は、対象語の各々が出現するメッセージが、対象メッセージ集合内にいくつあるかを計算する。比率計算部17は、メッセージ集合全体およびメッセージ部分集合の各々の頻度分布から語の比率の分布を計算する。比率差分計算部18は、メッセージ集合全体およびメッセージ部分集合の各々の比率の分布の間の差分を計算する。グラフ表示部19は、比率分布および比率差分分布からグラフを生成し、適宜、比率差分をソートキーとしてソートを行って表示する。
【選択図】図1
Description
語出現データの具体的な例は、これに限定されないが、例えば図5に示すようなものであり、メッセージ番号、述部を受け部とする係り受け関係、メッセージ(文)、メッセージの属性値(「fact」欄)を含んでなる。例えば、最上行のデータは、メッセージ番号が10419で、述部(受け部)が「合う」で名詞部(係り部)が「肌」である。係り部を助詞の「は」、「が」、「を」、「に」、「で」等で区分して表示できるので、係り受け関係を参照するだけで全体としての意味内容の把握が容易になる。
[ステップS11]:語の頻度を計算する。
[ステップS12]:比率を計算して所定の記憶手段に記憶する。記憶手段は語出現データ記憶部15がかねても良い。
[ステップS13]:処理対象の部分集合が残っているかどうか判別する。残っていればステップ14へ進む。残っていなければステップS15へ進む。
[ステップS14]:残っているメッセージの部分集合のうちの1つを対象にセットし、ステップS11へ戻り、処理を繰り返す。
[ステップS15]:比率差分を計算して所定の記憶手段に記憶する。記憶手段は語出現データ記憶部15がかねても良い。
[ステップS16]:全体集合の比率をソートキーとして語をソートする。
[ステップS17]:全体集合の比率、部分集合との比率差分をグラフ表示する。
[ステップS21]:ソートキーとして指定された比率データ/比率差分データを用いてソートを行なう。
[ステップS22]:全体集合の比率、部分集合との比率差分をグラフ表示する。
15 語出現データ記憶部
16 頻度計算部
17 比率計算部
18 比率差分計算部
19 グラフ表示部
Claims (11)
- 文構成要素の各々に対して、複数の文単位を含んでなる文単位集合に含まれる文単位の総数に対する当該文単位集合に含まれ当該文構成要素を含む文単位の数の比率を計算する比率計算手段と、
上記比率計算手段が分析対象のすべての文単位を含む全体集合に対して計算した全体集合用の1組の比率と、上記比率計算手段が当該全体集合の複数の部分集合のそれぞれに対して計算した部分集合用の複数組の比率との間の複数組の比率差分を計算する差分計算手段と、
上記複数組の比率差分の中の1組の差分の大きさに応じて、または上記複数組の比率差分の中の2組の比率差分の間の差分の大きさに応じて、少なくとも上記全体集合用の1組の比率をソートして表示する表示手段とを有することを特徴とする文書解析支援装置。 - 上記表示手段は、上記全体集合用の1組の比率に加えて、上記複数組の比率差分の中の少なくとも1組を表示する請求項1記載の文書解析支援装置。
- 文構成要素の各々に対して、複数の文単位を含んでなる文単位集合に含まれる文単位の総数に対する当該文単位集合に含まれ当該文構成要素を含む文単位の数の比率を計算する比率計算手段と、
上記比率計算手段が分析対象のすべての文単位を含む全体集合に対して計算した全体集合用の1組の比率と、上記比率計算手段が当該全体集合の1の部分集合に対して計算した部分集合用の1組の比率との間の1組の比率差分を計算する差分計算手段と、
上記1組の比率差分の大きさに応じて、少なくとも上記全体集合用の1組の比率をソートして表示する表示手段とを有することを特徴とする文書解析支援装置。 - 上記表示手段は、上記全体集合用の1組の比率に加えて、上記1組の比率差分を表示する請求項3記載の文書解析支援装置。
- 上記部分集合は文単位の属性に基づいて決定される請求項1〜4のいずれかに記載の文書解析支援装置。
- 上記部分集合は文単位に含まれる語によって決定される請求項1〜5のいずれかに記載の文書解析支援装置。
- 上記文構成要素は語である請求項1〜6のいずれかに記載の文書解析支援装置。
- 上記文構成要素は名詞である請求項7に記載の文書解析支援装置。
- 上記文構成要素は係り受け関係である請求項1〜8のいずれかに記載の文書解析支援装置。
- 上記表示手段は棒グラフを用いて表示を行う請求項1〜9のいずれかに記載の文書解析支援装置。
- 文構成要素の各々に対して、複数の文単位を含んでなる文単位集合に含まれる文単位の総数に対する当該文単位集合に含まれ当該文構成要素を含む文単位の数の比率を計算する比率計算手段、
上記比率計算手段が分析対象のすべての文単位を含む全体集合に対して計算した全体集合用の1組の比率と、上記比率計算手段が当該全体集合の複数の部分集合のそれぞれに対して計算した部分集合用の複数組の比率との間の複数組の比率差分を計算する差分計算手段、
上記複数組の比率差分の中の1組の差分の大きさに応じて、または上記複数組の比率差分の中の2組の比率差分の間の差分の大きさに応じて、少なくとも上記全体集合用の1組の比率をソートして表示する表示手段として、
コンピュータを機能させることを特徴とする文書解析用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007299855A JP5109615B2 (ja) | 2007-11-19 | 2007-11-19 | 文書解析支援装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007299855A JP5109615B2 (ja) | 2007-11-19 | 2007-11-19 | 文書解析支援装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009128950A true JP2009128950A (ja) | 2009-06-11 |
JP5109615B2 JP5109615B2 (ja) | 2012-12-26 |
Family
ID=40819854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007299855A Expired - Fee Related JP5109615B2 (ja) | 2007-11-19 | 2007-11-19 | 文書解析支援装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5109615B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011170615A (ja) * | 2010-02-18 | 2011-09-01 | Fuji Xerox Co Ltd | グラフ生成装置及びグラフ生成プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000357171A (ja) * | 1999-06-16 | 2000-12-26 | Oki Electric Ind Co Ltd | データベース分析システム |
JP2001167203A (ja) * | 1999-09-30 | 2001-06-22 | Fuji Electric Co Ltd | マーケティング分析支援システム、及び記録媒体 |
-
2007
- 2007-11-19 JP JP2007299855A patent/JP5109615B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000357171A (ja) * | 1999-06-16 | 2000-12-26 | Oki Electric Ind Co Ltd | データベース分析システム |
JP2001167203A (ja) * | 1999-09-30 | 2001-06-22 | Fuji Electric Co Ltd | マーケティング分析支援システム、及び記録媒体 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011170615A (ja) * | 2010-02-18 | 2011-09-01 | Fuji Xerox Co Ltd | グラフ生成装置及びグラフ生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5109615B2 (ja) | 2012-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11481388B2 (en) | Methods and apparatus for using machine learning to securely and efficiently retrieve and present search results | |
US11675977B2 (en) | Intelligent system that dynamically improves its knowledge and code-base for natural language understanding | |
US10878035B2 (en) | Interactive method and apparatus based on deep question and answer | |
CN112417846B (zh) | 文本自动化生成方法、装置、电子设备及存储介质 | |
CN110297880B (zh) | 语料产品的推荐方法、装置、设备及存储介质 | |
JP2001075966A (ja) | データ分析システム | |
WO2017198031A1 (zh) | 解析语义的方法和装置 | |
Mustafa et al. | Kurdish stemmer pre-processing steps for improving information retrieval | |
US11487837B2 (en) | Method for summarizing multimodal content from webpages | |
JP5309537B2 (ja) | グラフ表示装置およびプログラム | |
CN113782123A (zh) | 一种基于网络数据的在线医疗患者满意度测量方法 | |
CN117828042A (zh) | 用于金融服务的问答处理方法、装置、设备及介质 | |
EP3901875A1 (en) | Topic modelling of short medical inquiries | |
Makrynioti et al. | PaloPro: a platform for knowledge extraction from big social data and the news | |
Sutino et al. | Feature extraction from app reviews in google play store by considering infrequent feature and app description | |
JP5109615B2 (ja) | 文書解析支援装置およびプログラム | |
US7921126B2 (en) | Patent summarization systems and methods | |
Tayal et al. | DARNN: Discourse Analysis for Natural languages using RNN and LSTM. | |
CN112148838B (zh) | 一种业务源对象提取方法与装置 | |
CN112182228B (zh) | 一种短文本热点主题挖掘与概括方法及装置 | |
CN113590768B (zh) | 一种文本关联度模型的训练方法及装置、问答方法及装置 | |
Jebbor et al. | Overview of knowledge extraction techniques in five question-answering systems | |
DE102012221927A1 (de) | Verfahren zum Verwalten von E-Mail | |
CN109284364B (zh) | 一种用于语音连麦互动的互动词汇更新方法及装置 | |
JP2002183175A (ja) | テキストマイニング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101021 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120911 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120924 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151019 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5109615 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |