JP5586531B2 - 修飾語評価方法、修飾語評価装置及びそのプログラム - Google Patents
修飾語評価方法、修飾語評価装置及びそのプログラム Download PDFInfo
- Publication number
- JP5586531B2 JP5586531B2 JP2011136880A JP2011136880A JP5586531B2 JP 5586531 B2 JP5586531 B2 JP 5586531B2 JP 2011136880 A JP2011136880 A JP 2011136880A JP 2011136880 A JP2011136880 A JP 2011136880A JP 5586531 B2 JP5586531 B2 JP 5586531B2
- Authority
- JP
- Japan
- Prior art keywords
- modifier
- evaluation
- database
- history information
- action history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、非特許文献2には、比喩表現を扱うシステムの実装についての技術が開示されている。同システムは、被験者によりなされた過去の回答の適切さを指標とし、人の感覚に合った比喩理解モデルを構築するものである。
本発明の第1の態様は、コンピュータによって文章データに含まれる修飾語を評価する方法、装置及びプログラムであって、修飾語毎に当該修飾語を評価するために用いる評価パラメータを対応付けて第1データベースに格納し、事物毎に当該事物に関する前記文章データの書き手の行動履歴情報を第2データベースに格納し、前記文章データから修飾語と当該修飾語が修飾する事物との組み合わせを抽出し、前記抽出された修飾語に対応する前記評価パラメータを前記第1データベースから読み込み、前記第2データベースから前記抽出された事物に関する前記書き手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記修飾語の評価値を算出することを特徴とする。
第1の態様によれば、文章の書き手の行動履歴情報を反映して修飾語の定量的な評価値を算出することで、利用者に対する修飾語の理解を向上させることができる。
第3の態様によれば、「久々に」や「しばしば」のように、明確な数量化が難しい修飾語について、定量的な評価値を算出することが可能となり、利用者に対する修飾語の理解を向上させることができる。
(第1実施形態)
第1実施形態は、文章に含まれる修飾語について、その文章の書き手の行動履歴情報(ライフログデータ)を用いて定量的な評価値を求める手法について説明する。
ステップS1aにおいて、入力文章分析部11は、書き手の文章から修飾語及び修飾語が係る被修飾名詞(滞留地)を抽出する。例えば、図5のような入力文章から「久しぶり」という修飾語を抽出した場合、当該修飾語がどのような文脈で使われているかを分析し、当該修飾語が修飾している事象、「横須賀」という事象を抽出する。入力文章分析部11で抽出された修飾語と事象との組み合わせは、評価パラメータ読込部12に出力される。
さらに、第1実施形態において、書き手の評価値算出部13により、同じ修飾語の同じ修飾語使用文脈の別の使用例に対し、このような評価を1回または複数回、繰り返し実行し、抽出した修飾対象事象ごとの評価値を収集する。このような評価対象修飾語が修飾している個別事象の評価結果について、修飾語ごとに平均値をとる等の手段で統合した評価値を当該修飾語の特定の使用文脈における評価値とすることにより、評価の精度を高めることが可能となる。
第2実施形態は、文章に含まれる修飾語について、その文章の書き手と読み手のそれぞれの行動履歴情報(ライフログデータ)を用いて各人の評価値を算出し、読み手にとって適切な事象によって当該修飾語に対する「たとえ」を提示する手法について説明する。
読み手の評価値算出部14は、読み手のライフログDB4から全事象に関する読み手のライフログデータの一覧を読み出し、評価パラメータ読込部12から入力される評価パラメータに基づいて全事象に関する読み手のライフログデータから全事象の読み手の評価値の一覧を算出する。
ステップS6bにおいて、事象選択部15は、読み手の評価値のそれぞれについて書き手の評価値との一致度を算出し、書き手の評価値と最も一致度の高い評価値をもつ読み手の滞留地を選択する。
(実施例2−1)
実施例2−1では、図9に示すように、第一の利用者が記載したブログ等の文章を、第二の利用者が読む場合を想定する。文章中には、文章を記載した日時と、第一の利用者による修飾語と、その修飾語が係る地名等の名詞を含む行動内容(事象)が記載されているものとする。当該文章に対し、第二の利用者が経験したことのある同様の評価値を持つ事象を「たとえ」として例示する。
実施例2−2では、「平均訪問間隔」及び「訪問間隔の分散」を評価パラメータとして、「しょっちゅう」に対する評価値を算出する。実施例2−2においては、書き手の評価値算出部13は、書き手のライフログDB3から「居酒屋A」への過去n回(例では、n=3とする)の滞留日時一覧を参照し、その平均訪問間隔と訪問間隔の分散とを算出し、書き手の評価値(平均訪問間隔:5.5日、訪問間隔の分散:0.25)とする。
Claims (7)
- コンピュータによって文章データに含まれる修飾語を評価する方法であって、
修飾語毎に当該修飾語を評価するために用いる評価パラメータを対応付けて第1データベースに格納するステップと、
事物毎に当該事物に関する前記文章データの書き手の行動履歴情報を第2データベースに格納するステップと、
前記文章データから修飾語と当該修飾語が修飾する事物との組み合わせを抽出するステップと、
前記抽出された修飾語に対応する前記評価パラメータを前記第1データベースから読み込むステップと、
前記第2データベースから前記抽出された事物に関する前記書き手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記修飾語の評価値を算出するステップとを有し、
前記評価パラメータは、直近の滞留日時、平均訪問間隔、および訪問間隔の分散のうち少なくとも1つを有することを特徴とする修飾語評価方法。 - コンピュータによって文章データに含まれる修飾語を評価する方法であって、
修飾語毎に当該修飾語を評価するために用いる評価パラメータを対応付けて第1データベースに格納するステップと、
事物毎に当該事物に関する前記文章データの書き手の行動履歴情報を第2データベースに格納するステップと、
事物毎に当該事物に関する前記文章データの読み手の行動履歴情報を第3データベースに格納するステップと、
前記文章データから修飾語と当該修飾語が修飾する事物との組み合わせを抽出するステップと、
前記抽出された修飾語に対応する前記評価パラメータを前記第1データベースから読み込むステップと、
前記第2データベースから前記抽出された事物に関する前記書き手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記修飾語の評価値を算出するステップと、
前記第3データベースから全ての事物に関する前記読み手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記事物毎の第2評価値を算出するステップと、
前記事物毎の第2評価値のうち前記第1評価値との一致度に基づいて前記事物を選択するステップと、
前記選択された事物により前記修飾語のたとえを提示するステップとを有することを特徴とする修飾語評価方法。 - 前記評価パラメータは、直近の滞留日時、平均訪問間隔、および訪問間隔の分散のうち少なくとも1つを有することを特徴とする請求項2に記載の修飾語評価方法。
- 文章データに含まれる修飾語を評価する装置であって、
修飾語毎に当該修飾語を評価するために用いる評価パラメータを対応付けて第1データベースに格納する手段と、
事物毎に当該事物に関する前記文章データの書き手の行動履歴情報を第2データベースに格納する手段と、
前記文章データから修飾語と当該修飾語が修飾する事物との組み合わせを抽出する手段と、
前記抽出された修飾語に対応する前記評価パラメータを前記第1データベースから読み込む手段と、
前記第2データベースから前記抽出された事物に関する前記書き手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記修飾語の評価値を算出する手段とを具備し、
前記評価パラメータは、直近の滞留日時、平均訪問間隔、および訪問間隔の分散のうち少なくとも1つを有することを特徴とする修飾語評価装置。 - 文章データに含まれる修飾語を評価する装置であって、
修飾語毎に当該修飾語を評価するために用いる評価パラメータを対応付けて第1データベースに格納する手段と、
事物毎に当該事物に関する前記文章データの書き手の行動履歴情報を第2データベースに格納する手段と、
事物毎に当該事物に関する前記文章データの読み手の行動履歴情報を第3データベースに格納する手段と、
前記文章データから修飾語と当該修飾語が修飾する事物との組み合わせを抽出する手段と、
前記抽出された修飾語に対応する前記評価パラメータを前記第1データベースから読み込む手段と、
前記第2データベースから前記抽出された事物に関する前記書き手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記修飾語の評価値を算出する手段と、
前記第3データベースから全ての事物に関する前記読み手の行動履歴情報を読み出し、当該行動履歴情報から前記評価パラメータに基づいて前記事物毎の第2評価値を算出する手段と、
前記事物毎の第2評価値のうち前記第1評価値との一致度に基づいて前記事物を選択する手段と、
前記選択された事物により前記修飾語のたとえを提示する手段とを具備することを特徴とする修飾語評価装置。 - 前記評価パラメータは、直近の滞留日時、平均訪問間隔、および訪問間隔の分散のうち少なくとも1つを有することを特徴とする請求項5に記載の修飾語評価装置。
- 請求項4乃至6のいずれか1項に記載の修飾語評価装置を構成する各手段をコンピュータに実行させる修飾語評価プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011136880A JP5586531B2 (ja) | 2011-06-21 | 2011-06-21 | 修飾語評価方法、修飾語評価装置及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011136880A JP5586531B2 (ja) | 2011-06-21 | 2011-06-21 | 修飾語評価方法、修飾語評価装置及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013003992A JP2013003992A (ja) | 2013-01-07 |
JP5586531B2 true JP5586531B2 (ja) | 2014-09-10 |
Family
ID=47672473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011136880A Expired - Fee Related JP5586531B2 (ja) | 2011-06-21 | 2011-06-21 | 修飾語評価方法、修飾語評価装置及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5586531B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6246658B2 (ja) * | 2014-05-15 | 2017-12-13 | Kddi株式会社 | 時間表現学習方法、装置およびプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008083753A (ja) * | 2006-09-25 | 2008-04-10 | Toshiba Corp | 対話支援装置及びその方法 |
JP5834468B2 (ja) * | 2011-04-27 | 2015-12-24 | ソニー株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
-
2011
- 2011-06-21 JP JP2011136880A patent/JP5586531B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013003992A (ja) | 2013-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tang et al. | Small sample evidence on the tourism-led growth hypothesis in Lebanon | |
Fincher et al. | Pathogen prevalence predicts human cross-cultural variability in individualism/collectivism | |
JP5283288B2 (ja) | 文の配列に基づく文書感情分類システムおよび方法 | |
Tilaki et al. | Vendors’ attitudes and perceptions towards international tourists in the Malaysia night market: Does the COVID-19 outbreak matter? | |
Rupp et al. | Dealing with heterogeneous big data when geoparsing historical corpora | |
Llorente-Alonso et al. | Can psychological empowerment prevent emotional disorders in presence of fear of COVID-19 in health workers? A cross-sectional validation study | |
Gong et al. | Partly conditional estimation of the effect of a time‐dependent factor in the presence of dependent censoring | |
Stubbs et al. | Challenges in synthesizing surrogate PHI in narrative EMRs | |
Kim et al. | Asset effects on the life satisfaction of workers with disabilities in Korea: The mediating effects of self-esteem and job satisfaction | |
JP5586531B2 (ja) | 修飾語評価方法、修飾語評価装置及びそのプログラム | |
CN112699669B (zh) | 流行病学调查报告的自然语言处理方法、装置及存储介质 | |
JP5151412B2 (ja) | 表記ゆれ解析装置 | |
Shaghaghi et al. | Expanding evision’s scope of influenza forecasting | |
Villavicencio et al. | Reconstructing lifespans through historical marriage records of Barcelona from the sixteenth and seventeenth centuries | |
Gökçay et al. | Nanotechnology, nanomedicine; ethical aspects | |
JP5977199B2 (ja) | 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム | |
JP6862969B2 (ja) | データ種別を推定するための情報処理方法、情報処理装置および情報処理プログラム | |
JP5404575B2 (ja) | 経験要因関係分析装置及び方法及びプログラム | |
Aksoy et al. | Comparison of the data matching performances of string similarity algorithms in big data | |
Lee | Mapping local participatory assessment of ecosystem services of natural resources | |
Byrne et al. | The Two Types of Ulster Unionism: Testing an Ethnic Explanation for the Unionist/Loyalist Divide | |
KR101825025B1 (ko) | 사회적 약자의 라이프 로그 빅데이터를 이용한 생애주기별 복지서비스 제공 방법 및 그 시스템 | |
Nordin et al. | Tourist police service quality and service culture influence on tourists’ confidence | |
JP5503591B2 (ja) | 地名表現判定装置、方法、及びプログラム | |
Hansen et al. | Evidence of internal construct validity of SOC-13 total score, for use in hand therapy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130515 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140715 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5586531 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |