JP2011170535A - 文書品質評価システムおよび文書品質評価プログラム - Google Patents
文書品質評価システムおよび文書品質評価プログラム Download PDFInfo
- Publication number
- JP2011170535A JP2011170535A JP2010032634A JP2010032634A JP2011170535A JP 2011170535 A JP2011170535 A JP 2011170535A JP 2010032634 A JP2010032634 A JP 2010032634A JP 2010032634 A JP2010032634 A JP 2010032634A JP 2011170535 A JP2011170535 A JP 2011170535A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- evaluation
- user
- group
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims abstract description 124
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 230000006872 improvement Effects 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 7
- 230000002776 aggregation Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 4
- 238000000034 method Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】テキスト文書群の品質を評価し、評価結果をユーザに提示する文書品質評価システム1であって、テキスト文書群内の各文章について構文解析を行う構文解析部10と、テキスト文書群についての品質を複数の評価項目についてスコアリングし、評価結果を第1のユーザに提示する品質評価部20と、第1のユーザについての最低評価項目において低評価となる条件に該当する第1の文章群と、最低評価項目において第1のユーザよりも評価が高い第2のユーザについての高評価となる条件に該当する第2の文章群とを抽出し、第1と第2の文章群からそれぞれ類似度の高い第1と第2の文章を抽出し、第1の文章を改善対象の例文、第2の文章を見本の例文として提示する例文抽出部30とを有する。
【選択図】図1
Description
図1は、本発明の一実施の形態である文書品質評価システムの構成例の概要を示した図である。文書品質評価システム1は、例えば、サーバやPC(Personal Computer)等によって構成され、ソフトウェアプログラムによって実装された構文解析部10、品質評価部20、例文抽出部30およびインタフェース部40の各部と、データベースやファイルテーブル等からなるテキスト文書管理51、単語管理52および文章管理53の各テーブルを有する。また、ファイルテーブル等からなる冗長要素11を有する。
図2は、テキスト文書管理51のデータ構成および具体的なデータの例について示した図である。テキスト文書管理51は、ユーザが入力した文章からなるテキスト文書を管理するテーブルであり、例えば、テキスト文書ID、入力者属性などの各項目を有する。テキスト文書IDの項目は、文書品質評価システム1によって割り振られた、各テキスト文書を一意に識別するIDの情報を保持する。入力者属性の項目は、対象のテキスト文書を入力したユーザ(入力者)の属性の情報を保持し、少なくともユーザを一意に識別することが可能なIDやユーザ名などの情報を保持する。
構文解析部10によって、取り込まれたテキスト文書群について解析処理が行われ、テキスト文書管理51、単語管理52、文章管理53の各テーブルに解析結果に基づく情報が保持されると、次に品質評価部20では、ユーザ毎やグループ毎に、入力されたテキスト文書群についての品質を構文解析の観点から評価する。本実施の形態では、コールセンターにおけるコールログにおける文章の注目点であり、構文解析の結果から容易に評価可能なものとして、例えば、(1)「文の成立」、(2)「主述関係」、(3)「説明要素」、(4)「状況描写」、(5)「排冗長性」の5つの評価項目についてスコアリングして評価する。これらの評価項目は、評価する対象とするテキスト文書の特性に応じて他の評価項目とすることも可能である。
品質評価部20によって、ユーザ毎やグループ毎にテキスト文書群についての各評価項目でのスコア(ランク)を算出した後、例文抽出部30では、対象のユーザに提示するための改善対象の例文および見本の例文(テキスト文書中の重要箇所)を抽出する。図5は、改善対象および見本の例文を抽出する処理の例を示したフローチャートである。
「文の成立」:文章管理53の単語数の項目が1以下である
「主述関係」:文章管理53の主語フラグの項目がFALSEである
「説明要素」:文章管理53の単語数の項目が3未満である
「状況描写」:文章管理53の状況描写数の項目が0である
「排冗長性」:文章管理53の冗長要素フラグの項目がTRUEである
の各条件に該当する文章群を抽出することになる。
「文の成立」:文章管理53の単語数の項目が2以上である
「主述関係」:文章管理53の主語フラグの項目がTRUEである
「説明要素」:文章管理53の単語数の項目が3以上である
「状況描写」:文章管理53の状況描写数の項目が1以上である
「排冗長性」:文章管理53の冗長要素フラグの項目がFALSEである
の各条件に該当する文章群を抽出することになる。
10…構文解析部、11…冗長要素、20…品質評価部、30…例文抽出部、40…インタフェース部、
51…テキスト文書管理、52…単語管理、53…文章管理。
Claims (10)
- ユーザにより入力されたテキスト文書群を取り込み、前記ユーザもしくは前記ユーザが属するグループ毎に、対象となる前記テキスト文書群の品質を構文解析の観点からスコアリングして評価し、評価結果を前記ユーザに提示することで、前記ユーザに対して前記テキスト文書の入力の品質を向上させるための支援を行う文書品質評価システムであって、
取り込んだ前記テキスト文書群内の各文章について形態素解析および構文解析を行い、解析結果に基づいて集計処理を行って、前記解析結果および集計結果をテーブルに格納する構文解析部と、
前記テーブルに保持された情報に基づいて、第1のユーザもしくは前記第1のユーザが属するグループ毎に、対象となる前記テキスト文書群についての品質を構文解析の観点から複数の評価項目についてスコアリングして評価し、評価結果を出力して前記第1のユーザに提示する品質評価部と、
前記第1のユーザについての前記評価結果における評価の最も低い前記評価項目である最低評価項目において低評価となる条件に該当する前記第1のユーザの第1の文章群と、前記最低評価項目において前記第1のユーザよりも評価が高い第2のユーザについての、前記最低評価項目において高評価となる条件に該当する第2の文章群とを抽出し、前記第1の文章群と前記第2の文章群から、それぞれ類似度の高い第1の文章と第2の文章を抽出し、前記第1の文章を改善対象の例文とし、前記第2の文章を見本の例文として出力して前記第1のユーザに提示する例文抽出部とを有することを特徴とする文書品質評価システム。 - 請求項1に記載の文書品質評価システムにおいて、
前記例文抽出部は、前記最低評価項目において前記第1のユーザよりも評価が高い前記第2のユーザが存在しない場合、前記最低評価項目において高評価となる条件に該当する前記第1のユーザの文章群を抽出して前記第2の文章群とすることを特徴とする文書品質評価システム。 - 請求項2に記載の文書品質評価システムにおいて、
前記例文抽出部は、前記最低評価項目において高評価となる条件に該当する前記第1のユーザの文章が存在しない場合、前記第1の文章群から選択した文章を前記第1の文章とし、前記第1の文章を前記改善対象の例文とするとともに該当する前記見本の例文がない旨を出力して前記第1のユーザに提示することを特徴とする文書品質評価システム。 - 請求項1〜3のいずれか1項に記載の文書品質評価システムにおいて、
前記例文抽出部は、前記第1のユーザについての前記各評価項目の前記評価結果が全て所定以上の評価である場合に、改善点がない旨を出力して前記第1のユーザに提示することを特徴とする文書品質評価システム。 - 請求項1〜4のいずれか1項に記載の文書品質評価システムにおいて、
前記例文抽出部は、前記類似度として、対象の各文章に含まれる各単語の出現頻度を要素とする頻度ベクトルに基づくコサイン類似度を用いることを特徴とする文書品質評価システム。 - ユーザにより入力されたテキスト文書群を取り込み、前記ユーザもしくは前記ユーザが属するグループ毎に、対象となる前記テキスト文書群の品質を構文解析の観点からスコアリングして評価し、評価結果を前記ユーザに提示することで、前記ユーザに対して前記テキスト文書の入力の品質を向上させるための支援を行うシステムとしてコンピュータを機能させる文書品質評価プログラムであって、
取り込んだ前記テキスト文書群内の各文章について形態素解析および構文解析を行い、解析結果に基づいて集計処理を行って、前記解析結果および集計結果をテーブルに格納する構文解析部と、
前記テーブルに保持された情報に基づいて、第1のユーザもしくは前記第1のユーザが属するグループ毎に、対象となる前記テキスト文書群についての品質を構文解析の観点から複数の評価項目についてスコアリングして評価し、評価結果を出力して前記第1のユーザに提示する品質評価部と、
前記第1のユーザについての前記評価結果における評価の最も低い前記評価項目である最低評価項目において低評価となる条件に該当する前記第1のユーザの第1の文章群と、前記最低評価項目において前記第1のユーザよりも評価が高い第2のユーザについての、前記最低評価項目において高評価となる条件に該当する第2の文章群とを抽出し、前記第1の文章群と前記第2の文章群から、それぞれ類似度の高い第1の文章と第2の文章を抽出し、前記第1の文章を改善対象の例文とし、前記第2の文章を見本の例文として出力して前記第1のユーザに提示する例文抽出部とを有することを特徴とする文書品質評価プログラム。 - 請求項6に記載の文書品質評価プログラムにおいて、
前記例文抽出部は、前記最低評価項目において前記第1のユーザよりも評価が高い前記第2のユーザが存在しない場合、前記最低評価項目において高評価となる条件に該当する前記第1のユーザの文章群を抽出して前記第2の文章群とすることを特徴とする文書品質評価プログラム。 - 請求項7に記載の文書品質評価プログラムにおいて、
前記例文抽出部は、前記最低評価項目において高評価となる条件に該当する前記第1のユーザの文章が存在しない場合、前記第1の文章群から選択した文章を前記第1の文章とし、前記第1の文章を前記改善対象の例文とするとともに該当する前記見本の例文がない旨を出力して前記第1のユーザに提示することを特徴とする文書品質評価プログラム。 - 請求項6〜8のいずれか1項に記載の文書品質評価プログラムにおいて、
前記例文抽出部は、前記第1のユーザについての前記各評価項目の前記評価結果が全て所定以上の評価である場合に、改善点がない旨を出力して前記第1のユーザに提示することを特徴とする文書品質評価プログラム。 - 請求項6〜9のいずれか1項に記載の文書品質評価プログラムにおいて、
前記例文抽出部は、前記類似度として、対象の各文章に含まれる各単語の出現頻度を要素とする頻度ベクトルに基づくコサイン類似度を用いることを特徴とする文書品質評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010032634A JP5265597B2 (ja) | 2010-02-17 | 2010-02-17 | 文書品質評価システムおよび文書品質評価プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010032634A JP5265597B2 (ja) | 2010-02-17 | 2010-02-17 | 文書品質評価システムおよび文書品質評価プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170535A true JP2011170535A (ja) | 2011-09-01 |
JP5265597B2 JP5265597B2 (ja) | 2013-08-14 |
Family
ID=44684614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010032634A Active JP5265597B2 (ja) | 2010-02-17 | 2010-02-17 | 文書品質評価システムおよび文書品質評価プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5265597B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205950A (ja) * | 2012-03-27 | 2013-10-07 | Document House Co Ltd | 製品マニュアル評価システム、その評価方法および品質評価サーバ |
KR101663681B1 (ko) * | 2015-06-11 | 2016-10-14 | 주식회사 인포리언스 | 데이터 활용성 및 품질 평가장치, 기록매체 및 컴퓨터 프로그램 |
CN110612524A (zh) * | 2017-06-16 | 2019-12-24 | 日铁系统集成株式会社 | 信息处理装置、信息处理方法以及程序 |
JP2022057493A (ja) * | 2020-09-30 | 2022-04-11 | 日鉄ソリューションズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0554028A (ja) * | 1991-08-28 | 1993-03-05 | Nec Corp | 文章検査装置 |
JPH0554027A (ja) * | 1991-08-28 | 1993-03-05 | Matsushita Electric Ind Co Ltd | 文章の推敲方法およびその装置 |
JPH09231222A (ja) * | 1996-02-28 | 1997-09-05 | Toshiba Corp | 日本語処理装置及び日本語処理方法 |
-
2010
- 2010-02-17 JP JP2010032634A patent/JP5265597B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0554028A (ja) * | 1991-08-28 | 1993-03-05 | Nec Corp | 文章検査装置 |
JPH0554027A (ja) * | 1991-08-28 | 1993-03-05 | Matsushita Electric Ind Co Ltd | 文章の推敲方法およびその装置 |
JPH09231222A (ja) * | 1996-02-28 | 1997-09-05 | Toshiba Corp | 日本語処理装置及び日本語処理方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013205950A (ja) * | 2012-03-27 | 2013-10-07 | Document House Co Ltd | 製品マニュアル評価システム、その評価方法および品質評価サーバ |
KR101663681B1 (ko) * | 2015-06-11 | 2016-10-14 | 주식회사 인포리언스 | 데이터 활용성 및 품질 평가장치, 기록매체 및 컴퓨터 프로그램 |
CN110612524A (zh) * | 2017-06-16 | 2019-12-24 | 日铁系统集成株式会社 | 信息处理装置、信息处理方法以及程序 |
US11386354B2 (en) | 2017-06-16 | 2022-07-12 | Ns Solutions Corporation | Information processing apparatus, information processing method, and program |
CN110612524B (zh) * | 2017-06-16 | 2023-11-10 | 日铁系统集成株式会社 | 信息处理装置、信息处理方法以及记录介质 |
JP2022057493A (ja) * | 2020-09-30 | 2022-04-11 | 日鉄ソリューションズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP7453116B2 (ja) | 2020-09-30 | 2024-03-19 | 日鉄ソリューションズ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5265597B2 (ja) | 2013-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8935197B2 (en) | Systems and methods for facilitating open source intelligence gathering | |
JP6007088B2 (ja) | 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法 | |
US9535911B2 (en) | Processing a content item with regard to an event | |
US9218568B2 (en) | Disambiguating data using contextual and historical information | |
US9201928B2 (en) | Assessing quality of reviews based on online reviewer generated content | |
US9075870B2 (en) | System, method and apparatus for detecting related topics and competition topics based on topic templates and association words | |
US20100079464A1 (en) | Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products | |
JP5711674B2 (ja) | 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法 | |
KR20140045452A (ko) | 대화 스레드의 요약 기법 | |
US20180246880A1 (en) | System for generating synthetic sentiment using multiple points of reference within a hierarchical head noun structure | |
JP2012073966A (ja) | データ生成装置、データの生成方法及びデータ生成プログラム | |
JP6392042B2 (ja) | 情報提供装置、情報を提供する方法およびプログラム | |
CN105096023A (zh) | 工作标准相关数据的推送系统和方法 | |
JP5265597B2 (ja) | 文書品質評価システムおよび文書品質評価プログラム | |
JP6289989B2 (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
JP2004021445A (ja) | テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム | |
JP5353523B2 (ja) | グラフ解析装置、グラフ解析方法及びグラフ解析プログラム | |
JP2016153998A (ja) | サービスの評価装置及びサービスの評価方法 | |
US20220327445A1 (en) | Workshop assistance system and workshop assistance method | |
KR20140026796A (ko) | 맞춤형 특허분석 서비스 시스템 및 그 방법 | |
JP2016162357A (ja) | 商品に対するユーザの感情分析装置及びプログラム | |
JP5368900B2 (ja) | 情報提示装置、情報提示方法およびプログラム | |
Yin et al. | Research of integrated algorithm establishment of a spam detection system | |
JP2004227037A (ja) | フィールドマッチング装置とそのプログラム、コンピュータ読み取り可能な記録媒体、及び同一フィールド判定方法 | |
JP2012038064A (ja) | 会議キーワード抽出装置、会議キーワード抽出方法、及び会議キーワード抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5265597 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |