JP2009265736A - 電子機器、その制御方法およびコンピュータプログラム - Google Patents

電子機器、その制御方法およびコンピュータプログラム Download PDF

Info

Publication number
JP2009265736A
JP2009265736A JP2008111180A JP2008111180A JP2009265736A JP 2009265736 A JP2009265736 A JP 2009265736A JP 2008111180 A JP2008111180 A JP 2008111180A JP 2008111180 A JP2008111180 A JP 2008111180A JP 2009265736 A JP2009265736 A JP 2009265736A
Authority
JP
Japan
Prior art keywords
keyword
headword
input
phrase
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008111180A
Other languages
English (en)
Inventor
Naoto Hanatani
直人 花谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008111180A priority Critical patent/JP2009265736A/ja
Publication of JP2009265736A publication Critical patent/JP2009265736A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】入力語句に対する適切な関連語句を入力語句との関連の程度が分かるように表示する電子機器を提供する。
【解決手段】本発明に係る電子機器1に含まれるCPU10は、入力部20が受け付けた入力語句のキーワードを取得し、ROM50に格納された見出し語・キーワード対応テーブル53に登録されている各見出し語のキーワードおよび入力語句のキーワードに共通して含まれるキーワードの個数に基づいて、入力語句と各見出し語との関連度を算出し、関連度に基づいて見出し語の中から抽出した関連語句を、関連度に応じた表示形態で表示部30に表示させる。
【選択図】図1

Description

本発明は、入力された語句に関連する語句を抽出する技術に関する。
従来、テキストデータに含まれる単語間の関連を調べる技術がいくつか提案されている。このような技術においては、単語のテキストデータ中の出現頻度や、テキストデータにおける単語間の距離、すなわち、その2つの単語の間に現れる単語の個数に基づいて、単語間の関連の度合いを決定していた。
例えば、特許文献1には、電子文書中の2つの単語間の距離が一定値以下となる組数を、その2つの単語の出現回数の積で割ったものを、その2つの単語の関連率とし、関連率を基に電子文書の中の話題単語間の関連を図示する電子文書の話題単語関連図作成方法が開示されている。
特開2005−250916号公報
しかしながら、特許文献1に記載の方法では、文章構成によっては、単語の関連を正しく把握できない。例えば、単語Aが文章の前半に多く出現する一方、文章の帰結では単語Aを置き換えた単語Bが用いられているような場合を考えると、単語Bは出現回数が少ない上、単語Aとの距離が離れているため、単語Aとの関係が深いと判断されることはない。
このように、特許文献1に記載の方法では、関連率を単語の出現回数や単語間の距離に基づいて算出しているため、作成される単語関連図が適切なものになるかどうかは、文章構成に影響される。
本発明は、上記のような問題を解決するためになされたものであって、入力語句に対する適切な関連語句を入力語句との関連の程度が分かるように表示する電子機器を提供することを課題とする。
1つの局面に係る本願発明は、電子機器であって、複数の見出し語の各々に、各見出し語のキーワードを対応付けた第1のテーブルを記憶するための記憶手段と、外部からの指示を受け付けるための入力手段と、電子機器が出力する画像情報を表示するための表示手段と、電子機器の動作を制御するための制御手段とを備え、制御手段は、入力手段が受け付けた入力語句のキーワードを取得するキーワード取得手段と、入力語句のキーワードおよび見出し語のキーワードに共通して含まれるキーワードの個数に基づいて、入力語句と見出し語の間の関連度を算出する関連度算出手段と、関連度に基づいて、見出し語の中から入力語句の関連語句を抽出する関連語句抽出手段と、関連語句を、関連度に応じた表示形態で表示手段に表示させる表示制御手段とを含む。
好ましくは、表示制御手段は、関連度に基づいた大きさの関連語句を囲む枠をさらに表示手段に表示させる。
好ましくは、表示制御手段は、各入力語句および関連語句を、入力語句と語句との間の距離が関連度に応じた長さになるように表示手段に表示させる。
好ましくは、表示制御手段は、関連語句を、関連度に応じた文字形態で、表示手段に表示させる。
好ましくは、記憶手段は、複数の見出し語および各見出し語の説明文を含む辞書データをさらに記憶し、制御手段は、各説明文から各見出し語のキーワードを抽出して、第1のテーブルを作成する第1の作成手段をさらに含む。
制御手段は、各説明文からキーワードを抽出し、抽出回数が所定の回数を超えるキーワードを並べた全キーワードテーブルを作成する第2の作成手段をさらに含み、第1の作成手段は、第2の作成手段により作成された全キーワードテーブルに含まれるキーワードを各説明文から抽出する。
第1の作成手段は、各見出し語のキーワードに対し説明文中に現れる順番の情報をさらに付加した第1のテーブルを作成し、関連度算出手段は、入力語句のキーワードおよび見出し語のキーワードに共通して含まれるキーワードの個数に、第1のテーブルに付加された該キーワードの順番に応じた重みを付けて関連度を算出する。
他の局面に係る本願発明は、複数の見出し語の各々に各見出し語のキーワードを対応付けた第1のテーブルを記憶するための記憶手段を備える電子機器と外部からの指示を受け付けるための入力手段と、電子機器が出力する画像情報を表示するための表示手段とを備える電子機器の制御方法であって、入力手段が受け付けた入力語句のキーワードを取得するステップと、第1のテーブルに基づいて、入力語句のキーワードおよび見出し語のキーワードに共通して含まれるキーワードを抽出するステップと、共通して含まれるキーワードの個数に基づいて、入力語句と見出し語の間の関連度を算出するステップと、入力語句のキーワードおよび見出し語のキーワードに共通して含まれるキーワードを抽出するステップと、共通して含まれるキーワードの個数に基づいて、入力語句と見出し語の間の関連度を算出するステップと、関連度に基づいて、見出し語の中から入力語句の関連語句を抽出するステップと、関連語句を、関連度に応じた表示形態で表示手段に表示させるステップとを備える。
さらに他の局面に係る本願発明は、コンピュータに、上述の制御方法を実行させるためのコンピュータプログラムである。
本発明によれば、複数の見出し語について、そのキーワードを予め記憶しておき、記憶されている見出し語のキーワードおよび入力語句のキーワードに共通するキーワードの個数に基づいて入力語句と見出し語との関連度を求め、関連度に基づいて、見出し語の中から入力語句に関係する関連語句を抽出する。そして、関連語句を、関連度に応じた表示形態で表示する。その結果、入力語句に対する適切な関連語句を、入力語句との関連の程度が分かるように表示することができる。
以下、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部分には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰り返さない。
(1.ハードウェア構成)
図1は、本発明に係る電子機器1の構成をブロック図形式で示す図である。以下、図1を参照して、電子機器1の構成について説明する。
電子機器1は、CPU(Central Processing Unit)10と、入力部20と、表示部30と、音声出力部35と、RAM(Random−Access Memory)40と、ROM(Read−Only Memory)50と、これらを互いに接続するバス60とを備える。
CPU10は、入力部20が受け付けた指示に基づいて、ROM50に含まれる各プログラムをRAM40を処理領域として実行する。
入力部20は、外部からの指示を受け付ける。入力部20は、文字入力指示を受け付ける文字入力キー21と、決定指示を受け付ける決定キー22と、カーソルの移動指示を受け付けるカーソルキー23とを含む。
表示部30は、外部に情報を表示する。表示部30としては、液晶ディスプレイ等の既存のものを用いることができる。
音声出力部35は、外部に音声情報を出力する。音声出力部35としては、一般的なスピーカを用いることができる。
RAM40は、選択見出し語41と、入力テキスト42と、候補キーワード43と、見出し語・重みテーブル44と、図作成用パラメータ45とを格納する。
選択見出し語41あるいは入力テキスト42は、利用者が調べたい事柄として入力したものである。選択見出し語41は、カーソルキー23および決定キー22の操作に基づいて、後述する辞書DB54の見出し語の中から選択された見出し語である。入力テキスト42は、キーボード21および決定キー22の操作に基づいて、入力されたテキストである。ここでの「テキスト」とは、文字データのことを指し、単一の単語、複数の単語、複数の単語を含む文のいずれも含むものとする。
候補見出し語43は、選択見出し語41あるいは入力テキスト42(以下、これらをまとめて入力語句とよぶことがある)と関連がある見出し語(以下、関連語句とよぶことがある)の候補である。
関連度テーブル44は、各見出し語と、各見出し語の入力語句との関連度とを対応付けたテーブルである。
図作成用パラメータ45は、関連語句の表示部30における表示態様を決定するために用いられるパラメータである。
ROM50は、辞書DB51と、全キーワードテーブル52と、見出し語・キーワード対応テーブル53と、キーワード・見出し語テーブル54と、辞書検索プログラム55と、画像表示プログラム56とを格納する。
辞書DB54は、複数の見出し語およびその説明データからなる。辞書DB54について、図2を用いて具体的に説明する。図2は、辞書DB54について説明するための図である。
図2(a)は、辞書DB54に含まれるデータの一部を示す図である。図2(a)に示すように、本実施の形態では、辞書DB54の各データは、連番ID、見出し語、見出し語の分類、見出し語の説明文、画像ID、画像ポジション、音声IDの項目を含むものとする。
連番IDは、各見出し語固有の番号であり、各データを管理するために用いられる。見出し語は、辞書の項目を示す語句である。分類は、見出し語の属性を表わす情報である。なお、ここでは、各見出し語に1つの分類が割り当てられている例を示したが、1つの見出し語に複数の分類が割り当てられていても構わない。説明文は、見出し語の意味を説明する文章である。例えば、利用者が見出し語「ベートーベン」を選択すると、図2(b)に示すような見出し語および説明文を含む画面が表示部30に表示されるものとする。
画像IDおよび画像ポジションは、見出し語に画像情報が付随する場合に設けられる項目である。画像IDは、各画像固有の番号である。画像ポジションは、画像を表示する位置を表わす。
音声IDは、見出し語に音声情報が付随する場合に設けられる項目である。音声IDを有する見出し語が選択されると、表示部30に見出し語とその説明文が表示されるとともに、音声出力部35から音声IDに対応した音声データが出力される。
本実施の形態においては、辞書DB51は、日本語辞書、和英・英和辞書、百科事典、パソコン用語辞典などの複数種類の辞書データからなるものとする。ただし、辞書DB51が1種類の辞書データからなるとしても、本発明の実施を妨げるものではない。
全キーワードテーブル52は、辞書DB51に含まれる全説明文中から所定の方法で抽出したキーワードを並べたものである。
見出し語・キーワード対応テーブル53は、各見出し語に、各見出し語のキーワードを対応付けたテーブルである。
キーワード・見出し語テーブル54は、各キーワードに、当該キーワードをキーワードとする見出し語を対応付けたテーブルである。
辞書検索プログラム55は、選択見出し語41あるいは入力テキスト42から、候補見出し語43を抽出し、関連度テーブル44を作成するためのプログラムである。
画像表示プログラム56は、関連度テーブル44から、図作成用パラメータ45を作成し、図作成用パラメータ45に基づいた表示を表示部30に行なわせるためのプログラムである。
(2.各テーブルについて)
ここで、ROM50が記憶する全キーワードテーブル52、見出し語・キーワード対応テーブル53、キーワード・見出し語対応テーブル54について説明する。
全キーワードテーブル52は、辞書DB51に含まれる全説明文中から所定の方法で抽出したキーワードを並べたものである。全キーワードテーブル52の一例を図3に示す。図3は、全キーワードテーブル52の一例を示す図である。
全キーワードテーブル52の作成方法について、図4を参照しつつ説明する。図4は、全キーワードテーブル52作成のフローチャートである。
ステップS401において、CPU10は、見出し語の説明文を形態素解析し、説明文から固有名詞を抜き出す。このとき、見出し語に含まれる固有名詞のみを抽出してもよい。見出し語に含まれない固有名詞は、キーワードとして用いるのに不適切である場合があるため、このような抽出方法にすることにより、関連語句抽出に適切な固有名詞からなる全キーワードテーブルを作成することができる。なお、固有名詞ではなく、キーワードとして用いるのに適切な名詞、例えば、名詞のうち代名詞等を抽出してもよい。
本実施の形態においては、このように辞書DB51に基づいて抽出したキーワードを関連語句の抽出に用いるため、語句抽出の信頼性が高い。辞書における見出し語とその説明文の関係性は、例えば、インターネット上の情報などに比べ、非常に信用性が高いためである。
そして、ステップS403において、CPU10は、各固有名詞の登場回数を数える。つまり、抽出した固有名詞が、すでに抽出されたものである場合には、その登場回数に1を加える。抽出した固有名詞が、まだ抽出されていないものである場合、その登場回数を初期値“1”とする。
ステップS405において、CPU10は、全ての見出し語に対してステップS401およびステップS403の処理が行なわれたか判断する。全ての見出し語に対し処理が行なわれていない場合(ステップS405においてNo)、ステップS401からの処理を繰り返す。全ての見出し語に対し処理が行なわれた場合(ステップS405においてYes)、CPU10は、ステップS407からの処理を実行する。
ステップS407において、CPU10は、登場した固有名詞を、その登場回数が多い順に並べる。
ステップS409において、CPU10は、登場回数が設定された回数(ここではN回とする)を超えているものを、全キーワードテーブル52として、ROM50に格納する。なお、全キーワードテーブルに登録する固有名詞の抽出方法は、これに限られるものではなく、登場回数の多いものを抽出できる方法であればよい。例えば、登場回数の上位K個までを、全キーワードテーブルに登録してもよい。
このように登場回数が多いものを全キーワードテーブルに登録することで、全キーワードテーブルの記憶領域を節約できる。また、以降の関連語句の抽出時の演算負荷を減らすことができる。特に、辞書の説明文に含まれる固有名詞の多くは、全説明文を通しても数回しか現われないため、このようにキーワードを絞っておくことで、大幅に記憶領域あるいは演算負荷を削減することができる。
ただし、逆に、関連語句の抽出の精度を高めるのであれば、キーワードをあまり、もしくは、全く絞らないほうがよい。
見出し語・キーワード対応テーブル53は、各見出し語に、各見出し語のキーワードを対応付けたテーブルである。
図5に、見出し語・キーワード対応テーブル53の一例を示す。本実施の形態においては、見出し語・キーワード対応テーブルは、見出し語名欄と、その見出し語を含むデータベースの種別に関する情報を表わす種別欄と、各見出し語のキーワード欄とを含む。
図5の種別欄の情報は、「ベートーベン」、「ブルックナー」、…「オーストリア」との見出し語は、百科事典に含まれる情報であることを示している。また、「ウィーンの町並み」は、画像の見出し語であることが分かる。また、「音楽配信」は、パソコン用語辞典の見出し語であることが分かる。
また、1つの見出し語は、複数のキーワードを持つため、キーワード欄は、複数の欄からなる。
見出し語・キーワード対応テーブル53の作成方法について、図6を参照して説明する。図6は、見出し語・キーワード対応テーブル53作成のフローチャートである。
ステップS601において、CPU10は、見出し語自身を、見出し語・キーワード対応テーブル53のキーワード欄の先頭に登録する。見出し語自身が、その見出し語の特徴をもっともよくあらわす語句だからである。
ステップS603において、CPU10は、見出し語の説明文を形態素解析し、見出し語に含まれる名詞を取り出す。ここでの処理は、ステップS401の処理と同様である。
ステップS605において、CPU10は、ステップS603において抽出された単語のうち、全キーワードテーブル52に含まれるものを、見出し語のキーワードに加える。なお、ここでは、抽出された単語を、説明文に現れる順に、見出し語のキーワードに追加するものとする。
ステップS607において、CPU10は、種別欄に、見出し語の種別を登録する。種別は、テーブル作成の対象となっているデータの種類に応じて定められる。
ステップS609において、CPU10は、すべての見出し語についてステップS603、ステップS605の処理を終えたかを判断する。全ての見出し語に対し処理が終わっていない場合(ステップS609においてNo)、ステップS603に戻る。
全ての見出し語に対し処理が終わった場合(ステップS609においてYes)、CPU10は、ステップS611において、以上の手順で完成したものを、見出し語・キーワードテーブル53として、ROM53に格納する。
キーワード・見出し語テーブル54は、各キーワードに、当該キーワードをキーワードとする見出し語を対応付けたテーブルである。図7に、キーワード・見出し語テーブル54の一例を示す。キーワード・見出し語テーブル54は、キーワードリスト欄と、キー和ドリスとの各キーワードをキーワードにもつ見出し語を並べた見出し語欄からなる。
キーワード・見出し語テーブル54の作成方法を、図8を参照しつつ、説明する。図8は、キーワード・見出し語テーブル54作成のフローチャートである。
ステップS801において、CPU10は、全キーワードテーブル52に含まれるキーワードを、キーワード・見出し語テーブル54のキーワードリスト欄に登録する。
ステップS803において、CPU10は、キーワードリスト欄のキーワードの1つについて、当該キーワードと同じキーワードを持つ見出し語を、見出し語・キーワード対応テーブル53から抽出する。
ステップS805において、CPU10は、ステップS803において抽出された見出し語を、キーワード・見出し語対応テーブル54の見出し語欄のうちステップS803の処理の対象となったキーワードに対応する欄に追加する。
ステップS807において、全てのキーワードに対し、ステップS803およびステップS805の処理を行なったか判断する。全てのキーワードに対し処理が行なわれていない場合(ステップS807においてNo)、ステップS803に戻る。
全てのキーワードに対し処理が行なわれた場合(ステップS807においてYes)、ステップS809において、CPU10は、上記の手順で完成したものを、キーワード・見出し語テーブル54として、ROM54に格納する。
ところで、見出し語やキーワードの総数は非常に多く、全キーワードテーブル52、見出し語・キーワード対応テーブル53、キーワード・見出し語対応テーブル54の作成処理には、時間がかかるので、これらのテーブルは、予め作成あるいは格納されているのが好ましい。したがって、機器の出荷段階で、これらのテーブルを予めROM50に格納しておくことが好ましい。あるいは、辞書検索プログラム55を後から機器にインストールする場合、インストール時に、図4、図6、図8に示すような処理をCPU20に実行させるのが好ましい。
(3.関連度の算出について)
CPU10は、上述の見出し語・キーワード対応テーブル53やキーワード・見出し語対応テーブル54に基づいて、入力語句に対応する関連語句を抽出し、関連度に基づいた表示を表示部30に行なわせる。ここからは、その方法について説明する。
ここでは、入力語句が見出し語の中から選択された場合について説明する。この場合、入力語句として選択された見出し語に対し、図9のような候補見出し語テーブル43が作成される。図9は、見出し語である入力語句に対して作成される候補見出し語テーブル43の一例である。図9(a)は、見出し語「ベートーベン」に対する候補見出し語テーブル43、図9(b)は、見出し語「シューベルト」に対する候補見出し語テーブル43である。
候補見出し語テーブル43は、入力語句のキーワードを並べたキーワードリスト欄と、キーワードリストに含まれる各キーワードと同じキーワードをもつ見出し語を並べた見出し語欄とを含む。見出し語欄に含まれるキーワードは、関連語句の候補になる。
CPU10は、以下のように、候補見出し語テーブル43を作成する。まず、CPU10は、見出し語・キーワード対応テーブル53を参照して、入力語句に対応するキーワードを、キーワードリスト欄に登録する。なお、各キーワードは、見出し語・キーワード対応テーブル53と同じ順番で登録されるものとする。そして、キーワード・見出し語対応テーブル54を参照して、キーワードリスト欄の各キーワードについて、各キーワードをキーワードにもつ見出し語を見出し語欄に登録する。
候補見出し語テーブル43の作成後、CPU10は、候補見出し語テーブル43の見出し語欄に含まれる各見出し語と入力語句との間の関連度を、候補見出し語テーブル43の中に含まれる各見出し語の個数に応じて算出する。つまり、入力語句のキーワードおよび各語句のキーワードに共通に含まれるキーワードの個数に基づいて、見出し語と入力語句との関連度を算出する。CPU10は、各見出し語との関連度を表わす入力語句の関連度テーブル44を作成し、作成した関連度テーブルをRAM40に保持する。
ここで、CPU10は、共通するキーワードの個数を、共通するキーワードの入力語句における重要度を考慮した重みを付けて数えるものとする。例えば、入力語句と見出し語とで共通するキーワードが、見出し語・キーワードテーブル53の入力語句に対応するキーワードの上位いくつかに入っている場合、そのキーワードの個数に重みを付ける。このような重み付けを与えることにより、入力語句と見出し語との関係をより正確に反映した関連度を算出することができる。
なお、関連度を算出するためには、入力語句のキーワードおよび各語句のキーワードに共通に含まれるキーワードの個数が分かればよい。よって、必ずしもこのような候補見出し語テーブル43を作成し、候補見出し語テーブル43中のキーワード数から関連度を求めるという手順を踏む必要はない。
例えば、次のような手順でも、入力語句のキーワードおよび各語句のキーワードに共通に含まれるキーワードの個数を算出できる。まず、CPU10は、見出し語・キーワード対応テーブル53に基づいて入力語句のキーワードを取得する。次に、入力語句のキーワードの各々について、見出し語・キーワード対応テーブル53から、入力語句のキーワードをキーワードに含む見出し語を抽出する。すると、共通に含まれるキーワードの個数は、見出し語の抽出回数に一致する。この場合、キーワード・見出し語対応テーブル54は不要である。
これに対し、本実施の形態の方法には、関連度の抽出にあたり、見出し語・キーワード対応テーブル53の中からキーワードを検索することが不要であり、処理の負荷を低減できるという利点がある。
より具体的に、図9、図10を参照して、関連度テーブル44について説明する。図10は、図9に示される候補見出し語テーブル43に基づいて作成される関連度テーブル44を示す図である。
図10(a)は、図9(a)の候補見出し語テーブル43に基づいて作成される、入力語句「ベートーベン」の関連度テーブル44である。
この関連度テーブル44は、入力語句のキーワードのうち上位3つまでのキーワードに対応する見出し語については、重み「2」をかけるという規則にしたがって作成されたものである。例えば、図9(a)に示される候補見出し語テーブル43において、見出し語「シューベルト」は、キーワードリストの「作曲家」「キリスト教音楽」「ロマン主義」「ドイツ」に対応する見出し語欄に現れる。ここで、「作曲家」「キリスト教音楽」は、入力語句の上位3つまでのキーワードに該当する。したがって、「シューベルト」と「ベートーベン」との関係度は、2(回)×(重み)2+2(回)=6と算出される。その他の各見出し語の「ベートーベン」との関連度についても、同様の方法により算出されている。
図10(b)は、図9(b)の候補見出し語テーブル43に基づいて作成される、入力語句「シューベルト」の関連度テーブル44である。ここでの関連度の値も、先と同様の方法により算出されたものである。
関連度テーブル44作成にあたってCPU10が実行する処理の流れについて、図11を参照して説明しておく。図11は、関連度テーブル44作成のフローチャートである。
ステップS1101において、CPU10は、選択された見出し語のキーワードを、見出し語・キーワード対応テーブル53から抜き出し、候補見出し語テーブル43のキーワードリスト欄に並べる。この際、CPU10は、キーワードを、見出し語・キーワード対応テーブル53におけるキーワードの順番順に、並べるものとする。
ステップS1103において、CPU10は、キーワードリスト欄に含まれるキーワードが、キーワードリスト欄の先頭からM個以内に含まれるか判断する。
キーワードがM個以内に含まれる場合(ステップS1103においてYes)、CPU10は、ステップS1105において、ステップキーワード・見出し語対応テーブル54を参照し、当該キーワードに対応する見出し語を抜き出し、当該キーワードに対応する見出し語欄に登録する。そして、ステップS1107において、各見出し語の登場回数に重み(ここでは「2」とする)をかけたものを関連度に加える。
キーワードがM個以内に含まれない場合(ステップS1103においてNo)、CPU10は、ステップS1109において、ステップキーワード・見出し語対応テーブル54を参照し、当該キーワードに対応する見出し語を抜き出し、当該キーワードに対応する見出し語欄に登録する。そして、ステップS1111において、各見出し語の登場回数を関連度に加える。
ステップS1113において、CPU10は、全てのキーワードに対して、ステップS1103からステップS1111までの処理が実行されたかを判断する。全てのキーワードに対して処理が実行されていない場合(ステップS1113においてNo)、CPU10は、ステップS1103からの処理を繰り返す。全てのキーワードに対して処理が実行されている場合(ステップS1113においてYes)、ステップS1115に進む。
ステップS1115において、CPU10は、上記の手順で作成されたテーブルを、関連度テーブル44として、RAM40に保持する。
以上では、上位M個までのキーワードに対し、一律の重み付けを与えて、関連度を算出する例について示したが、重み付けの与え方は、上述のものに限られるわけではない。例えば、先頭のキーワードに重みw1、2番目のキーワードに重みw2、…、n番目のキーワードに重みwn(ここで、w1≧w2≧…≧wn)を与えるなど、キーワードの重要度を、より細かく重みに反映してもよい。また、逆に、下位のキーワードに低い重み付けを与えてもよい。特別な場合として、上位N個に入らないキーワードについては、関連度の抽出に考慮しないようにもできる。
また、辞書の種別に応じて重みを変えてもよい。例えば、ある見出し語が、入力語句を含む辞書とは種別の異なる辞書に含まれる場合、種別の同じ辞書に含まれる場合に比べて大きな重みを与えるようにしてもよい。このような重み付けにより、関連語句として抽出される見出し語は、利用者にとって意外なものとなり、検索の幅が広がる。逆に、同じ種別の辞書に含まれる見出し語に対して高い重み付けを与えることで、関連語句を範囲を限定して抽出できる。
また、以前に入力語句として用いたことのある見出し語の重みを大きくしてもよい。このような重み付けにより、利用者の検索履歴を反映して、関連語句を抽出できる。
また、辞書DB51に、人名、都市名、曲名、国名、遺産等の分類情報が付加されている場合、分類情報に応じて重みを変えてもよい。辞書の種別に応じて重みを設定する場合と同様、入力語句とは種別の異なる見出し語に対し、種別の同じ見出し語に比べ大きな重みを与えることで、利用者にとって意外な関連語句を抽出することができる。逆に、同じ分類の見出し語に高い重み付けを与えることで、関連語句を制限された範囲から抽出するようにしてもよい。特に、同じ分類の見出し語のみから関連語句を抽出するようにすれば、同一分類内での関連情報を示すことができる。
(4.関連図の作成について)
CPU20は、上述の関連度テーブル44に基づいて、入力語句に関連する見出し語を、入力語句との関連度に応じた表示形態で表示部30に表示させる。
ここでは、図12のように中心に配置された入力語句と、周囲に配置された関連語句と、それらを結ぶ線分とを含む画面が表示されるものとする。図12は、関連図の一例を示す図である。図12(a)(b)は、それぞれ、図10(a)(b)の関連度テーブル44に対応する表示である。
本実施の形態の関連図では、入力語句との関連度の高い見出し語は、関連度の低い見出し語に比べ、入力語句との距離が短くなるように表示されるものとする。また、関連度の高い見出し語の表示枠は、関連度の低い見出し語の表示枠に比べ、大きくなるように表示されるものとする。
また、見出し語「ウィーン」のように、見出し語に対応する画像データがある場合には、見出し語の表示枠の上にカメラマークが表示されるものとする。また、見出し語「運命」のように、見出し語に対応する音声データがある場合には、見出し語の表示枠の上に音符マークが表示されるものとする。なお、カメラマークや音符マークは、見出し語が、対応する画像データあるいは音声データを持つことが分かるものであればよく、図12に示された形態のものに限られるわけではない。
本実施の形態においては、図12のような画面上で、利用者が入力部20を介して、各語句を選択することで、次々に、関係する語句の検索を行なうことが可能である。このことを図13を参照して説明する。図13は、本発明に係る電子機器の使用にあたって、表示される画面の遷移の一例である。
通常の辞書の使用モードにおいて、見出し語(ここでは「ベートーベン」)を選択すると、図13(a)のように、見出し語とその説明文を示した画面が表示される。
利用者が、図13(a)に示す画面において関連語句を表示させるための入力を行なうと、あるいは、関連語句を表示するモードを選択して、見出し語「ベートーベン」を選択すると、図13(b)のような関連図を示す画面に切り替わる。
図13(b)のような画面が表示されているときに、利用者は、カーソルキー23等を操作して、周囲の見出し語のなかから、1つの語句を選択することができる。このとき、図13(c)のように、入力語句と選択された関連語句とを結ぶ線分がアクティブになるなど、選択された語句が分かるような表示がなされる。
周囲の見出し語を選択した状態で、利用者が決定キー22等を操作すると、アクティブな線の先にある関連語句を入力語句とした、図13(d)のような新たな関連図が作成および表示される。
また、関連図を表示する画面で中心にある語句を選択すると、その語句の説明データが表示される。例えば、図13(d)の画面表示時に、中心にある語句「ウィーン」を選択し、決定キー22を操作すると、図13(e)のように、「ウィーン」の説明データが表示される。なお、「ウィーン」は、画像データをもつので、説明データには、説明文に加え、画像が含まれる。
さて、CPU10は、図12あるいは、図13(b)(d)のような関連図を作成する手順を、図14、図15を参照して、説明する。図14は、関連図作成のフローチャートである。図15は、関連図作成にあたって用いられる値のテーブルである。
ステップS1401において、CPU10は、関連度テーブル44から、見出し語を、関連度の高いものから順にN個取り出す。ここでは、図15に示すように、N=12と、予め設定されているものとする。
ステップS1403において、CPU10は、取り出した見出し語の関連度のうち、もっとも高いものをmax、最も低いものをminとする。ここでは、図15に示すように、max=15、min=6であるとする。
ステップS1405において、CPU10は、maxとminの差のM分割値を計算し、maxとminの間にある関連度をM個の範囲に分割する。ここでは、図15に示すように、M=4とする。差は9であるので、関連度6〜8は範囲1に、関連度9〜11は範囲2に、関連度12〜13は範囲3に、関連度14〜15は範囲4に分類される。
ステップS1407において、CPU10は、各範囲に割り当てる円の面積を、s1、s2、…、sMとする。ここで、sm(m=1、2、…、M)は、予め与えられた値であるとする。
ステップS1409において、CPU10は、円の合計面積が、設定値Sを超えていないか判断する。
円の合計面積がSを超えている場合(ステップS1409においてYes)、CPU10は、ステップS1411において、Nの値や、大きな円を表示している範囲の変更を行ない、ステップS1401からの処理を繰り返す。
円の合計面積がSを超えない場合(ステップS1409においてNo)、CPU10は、ステップS1413において、関連度を基に、入力語句と各見出し語との間の距離を設定する。関連度の高い見出し語に設定する距離は、関連度の低い見出し語に設定する距離に比べて短くなるようにする。なお、範囲ごとに、段階をつけて、距離を設定してもよい。
以上の処理の結果、図16に示すような図作成用パラメータ45が作成される。図16は、図作成用パラメータ45の一例を示す図である。
ステップS1415において、CPU10は、図16に示すテーブルに基づく関連図を、表示部30に表示させる。この処理の際、図17(a)のような準備画面を表示しておき、面積や距離の決定後、図17(b)のように完成した関連図を表示するようにしてもよい。また、関連語句として抽出された見出し語に音声データや画像データが付随する場合、それを示すアイコンを関連語句につけるようにする。
利用者は、電子辞書を用いる際に、このような関連図を参照して、より深く項目を調べることができる。また、あいまいに覚えていた事象に関しても、検索して調べることができる。
従来の辞書を利用した検索では、利用者は、興味の中心となる見出し語を調べ、見出し語の説明文に含まれる単語から、関連のある見出し語を予想し、別の見出し語を調べることで、ある見出し語に関連する事柄を調べる必要があった。しかし、本発明によれば、語句を入力すると、入力語句に関係する語句を表示することができるため、見出し語の説明文を調べる必要がない。
また、従来の検索方法では、説明文から予測できる関連語は、ユーザの知識量により制限されるが、本発明により表示される関連語句は、ユーザの知識量に制限されない。したがって、本発明は、利用者にとっては思いもよらない事柄間の関連についての知識を利用者に与えることもできる。
(5.入力語句の変形例)
上述の実施の形態では、選択した見出し語を入力語句とする場合を示したが、利用者が入力した単語あるいは文章を入力語句とすることもできる。この場合、電子機器は、カーソルキー23、決定キー22の操作等により、ユーザ入力を受け付けるモードになるものとする。
利用者が、ユーザ入力を受け付けるモードにおいて、文字入力キー21を操作し、「ドイツの作曲家でロマン主義の人」と入力したとする。このとき、表示部30には、図18のような画面が表示される。図18は、ユーザ入力を受け付けた状態の画面の一例を示す図である。
決定キー22の操作等により、入力された文字列が確定されると、CPU10は、入力された文字列の形態素解析を行ない、文字列中のキーワードを抽出する。そして、抽出したキーワードおよびキーワード・見出し語対応テーブル54に基づいて、図19に示すようなユーザ入力に対応した候補見出し語テーブル43を作成する。図19は、ユーザ入力に対応した候補見出し語テーブル43の一例を示す図である。つまり、候補見出し語テーブル43のキーワードリストに、見出し語・キーワードテーブル53に基づいて定まる見出し語のキーワードではなく、文字列中のキーワードが登録されている点が、すでに説明した実施の形態と異なる。
CPU10は、さらに、候補見出し語テーブル43に基づいて、図20に示すような関連度テーブル44を作成する。図20は、ユーザ入力に対応した関連度テーブル44の一例を示す図である。さらに、関連度テーブル44に基づいて、図21に示すような関連図を表示部30に表示させる。図21は、ユーザによる入力テキストに対応する関連図の一例を示す図である。これらの処理は、すでに説明した実施の形態で行なわれるものと同様である。なお、図21では、入力語句が、ユーザが入力した語句であうことを表わすため、中央の枠内に「?」と表示しているが、「?」以外の表示であっても構わない。例えば、ユーザが入力した語句そのもの、あるいは、ユーザが入力した語句の冒頭の数文字を表示してもよい。
ユーザ入力に基づいて関連図を作成するにあたって、CPU10が行なう処理の流れを図22を参照して説明する。図22は、ユーザ入力から関連図を作成するにあたってCPU10が行なう処理の流れを示すフローチャートである。
ステップS2201において、CPU10は、ユーザが入力した文章を形態素解析して単語を抽出する。そして、抽出した単語のうち、全キーワードテーブル52に含まれるものを候補見出し語テーブル43のキーワードリストに登録する。なお、本実施の形態では、文章を先頭から順に形態素解析し、キーワードを、文章に表れる順番に、キーワードリストに登録するものとする。
ステップS2203において、CPU10は、キーワードリストから順番にキーワードを抜き出す。
ステップS2205において、CPU10は、ステップS2203において抜き出したキーワードがキーワードリストの先頭からM個以内に含まれるかどうかを判断する。
抜き出したキーワードが先頭からM個以内にある場合(ステップS2205においてYes)、CPU10は、ステップS2207において、キーワード・見出し語対応テーブル54から、抜き出したキーワードに対応する見出し語を抜き出す。そして、ステップS2209において、見出し語の登場回数に重み「2」をかけたものを、その見出し語の関連度に加える。
抜き出したキーワードが先頭からM個以内にない場合(ステップS2205においてNo)、CPU10は、ステップS2211において、キーワード・見出し語対応テーブル54から、抜き出したキーワードに対応する見出し語を抜き出す。そして、ステップS2213において、見出し語の登場回数を、その見出し語の関連度に加える。
なお、重みの与え方は、上述のものに限られるわけではない。上述の実施の形態と同様、様々な重みの設定方法をかわりに用いてもよい。
ステップS2215において、CPU10は、全てのキーワードに対し、ステップS2205からステップS2213までの処理を実行したかを判断する。全てのキーワードに対し処理を実行していない場合(ステップS2215においてNo)、ステップS2203に戻る。
全てのキーワードに対し処理が完了している場合(ステップS2215においてYes)、CPU10は、ステップS2217において、作成されたテーブルを関連度テーブル44とする。
ステップS2219において、CPU10は、上述の実施の形態と同様の描写方法により、入力語句および関連語句を関連度に応じた表示形態で、表示部30に表示させる。
通常の辞書では、ある語からその意味を調べることしかできないが、この方法によれば、意味からその意味に関連する語を調べることができる。
(6.関連図の変形例)
これまでの実施の形態においては、関連語句の入力語句との関連度を表わすため、入力語句と関連語句との間の距離および関連語句を囲む枠の大きさに関連度を反映させた関連図を表示することとしていた。しかし、関連語句を、入力語句との関連度に基づいて表示する方法は、これに限られるものではない。
例えば、図23のように、見出し語に付随する画像データを見出し語のかわりに表示してもよい。他にも、図24のように、関連語句を、関連度に基づく文字形態で表示してもよい。図24では、入力語句との関連度の高い関連語句を、関連度の低い関連語句よりも、大きくかつ太く表示している例を示している。もちろん、文字の大きさのみ、あるいは、文字の太さのみで、関連度を表わすようにしてもよい。
(7.その他の変形例)
さらに、本発明を応用すると、文書ファイル、電子メール、電子ブック等の文字データを含むデータ間の類似関係を示す機器を実現できる。文書ファイルのファイル名など文字データを含むデータを特定する情報を「見出し語」とみなし、文字データを「説明文」とみなすことで、このような応用が可能となる。例えば、本のレビュー集作成にあたって、本発明の手法により、指定した本と近い本の樹形図を作成するといった利用法がある。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明に係る電子機器1の構成をブロック図形式で示す図である。 辞書DB54について説明するための図である。 全キーワードテーブル52の一例を示す図である。 全キーワードテーブル52作成のフローチャートである。 見出し語・キーワード対応テーブル53の一例を示す図である。 見出し語・キーワード対応テーブル53作成のフローチャートである。 キーワード・見出し語テーブル54の一例を示す図である。 キーワード・見出し語テーブル54作成のフローチャートである。 見出し語である入力語句に対して作成される候補見出し語テーブル43の一例である。 図9に示される候補見出し語テーブル43に基づいて作成される関連度テーブル44を示す図である。 関連度テーブル44作成のフローチャートである。 関連図の一例を示す図である。 本発明に係る電子機器の使用にあたって、表示される画面の遷移の一例である。 関連図作成のフローチャートである。 関連図作成にあたって用いられる値のテーブルである。 図作成用パラメータ45の一例を示す図である。 準備画面および完成した関連図を示した図である。 ユーザ入力を受け付けた状態の画面の一例を示す図である。 ユーザ入力に対応した候補見出し語テーブル43の一例を示す図である。 ユーザ入力に対応した関連度テーブル44の一例を示す図である。 ユーザによる入力テキストに対応する関連図の一例を示す図である。 ユーザ入力から関連図を作成するにあたってCPU10が行なう処理の流れを示すフローチャートである。 関連語句の表示形態の第1の変形例を示す図である。 関連語句の表示形態の第2の変形例を示す図である。
符号の説明
1 電子機器、10 CPU、20 入力部、21 文字入力キー、22 決定キー、23 カーソルキー、30 表示部、35 音声出力部、40 RAM、41 選択見出し語、42 入力テキスト、43 候補見出し語、44 関連度テーブル、45 図作成用パラメータ、50 ROM、51 辞書DB、52 全キーワードテーブル、53 見出し語・キーワード対応テーブル、54 キーワード・見出し語対応テーブル、55 辞書検索プログラム、56 画像表示プログラム。

Claims (9)

  1. 電子機器であって、
    複数の見出し語の各々に、各前記見出し語のキーワードを対応付けた第1のテーブルを記憶するための記憶手段と、
    外部からの指示を受け付けるための入力手段と、
    前記電子機器が出力する画像情報を表示するための表示手段と、
    前記電子機器の動作を制御するための制御手段とを備え、
    前記制御手段は、
    前記入力手段が受け付けた入力語句のキーワードを取得するキーワード取得手段と、
    前記入力語句のキーワードおよび前記見出し語のキーワードに共通して含まれるキーワードの個数に基づいて、前記入力語句と前記見出し語の間の関連度を算出する関連度算出手段と、
    前記関連度に基づいて、前記見出し語の中から前記入力語句の関連語句を抽出する関連語句抽出手段と、
    前記関連語句を、前記関連度に応じた表示形態で前記表示手段に表示させる表示制御手段とを含む、電子機器。
  2. 前記表示制御手段は、前記関連度に基づいた大きさの前記関連語句を囲む枠をさらに前記表示手段に表示させる、請求項1に記載の電子機器。
  3. 前記表示制御手段は、各前記入力語句および前記関連語句を、前記入力語句と前記語句との間の距離が前記関連度に応じた長さになるように前記表示手段に表示させる、請求項1または2に記載の電子機器。
  4. 前記表示制御手段は、前記関連語句を、前記関連度に応じた文字形態で、前記表示手段に表示させる、請求項1から3のいずれか1項に記載の電子機器。
  5. 前記記憶手段は、前記複数の見出し語および各前記見出し語の説明文を含む辞書データをさらに記憶し、
    前記制御手段は、各前記説明文から各前記見出し語のキーワードを抽出して、前記第1のテーブルを作成する第1の作成手段をさらに含む、請求項1から4のいずれか1項に記載の電子機器。
  6. 前記制御手段は、各前記説明文からキーワードを抽出し、抽出回数が所定の回数を超えるキーワードを並べた全キーワードテーブルを作成する第2の作成手段をさらに含み、
    前記第1の作成手段は、前記第2の作成手段により作成された前記全キーワードテーブルに含まれるキーワードを各前記説明文から抽出する、請求項5に記載の電子機器。
  7. 前記第1の作成手段は、各前記見出し語のキーワードに対し前記説明文中に現れる順番の情報をさらに付加した前記第1のテーブルを作成し、
    前記関連度算出手段は、前記入力語句のキーワードおよび前記見出し語のキーワードに共通して含まれるキーワードの個数に、前記第1のテーブルに付加された該キーワードの前記順番に応じた重みを付けて前記関連度を算出する、請求項5または6に記載の電子機器。
  8. 複数の見出し語の各々に各前記見出し語のキーワードを対応付けた第1のテーブルを記憶するための記憶手段を備える電子機器と外部からの指示を受け付けるための入力手段と、前記電子機器が出力する画像情報を表示するための表示手段とを備える電子機器の制御方法であって、
    前記入力手段が受け付けた入力語句のキーワードを取得するステップと、
    前記第1のテーブルに基づいて、前記入力語句のキーワードおよび前記見出し語のキーワードに共通して含まれるキーワードを抽出するステップと、
    前記共通して含まれるキーワードの個数に基づいて、前記入力語句と前記見出し語の間の関連度を算出するステップと、
    前記入力語句のキーワードおよび前記見出し語のキーワードに共通して含まれるキーワードを抽出するステップと、
    前記共通して含まれるキーワードの個数に基づいて、前記入力語句と前記見出し語の間の関連度を算出するステップと、
    前記関連度に基づいて、前記見出し語の中から前記入力語句の関連語句を抽出するステップと、
    前記関連語句を、前記関連度に応じた表示形態で前記表示手段に表示させるステップとを備える、電子機器の制御方法。
  9. コンピュータに、請求項8に記載の制御方法を実行させるためのコンピュータプログラム。
JP2008111180A 2008-04-22 2008-04-22 電子機器、その制御方法およびコンピュータプログラム Pending JP2009265736A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008111180A JP2009265736A (ja) 2008-04-22 2008-04-22 電子機器、その制御方法およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008111180A JP2009265736A (ja) 2008-04-22 2008-04-22 電子機器、その制御方法およびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2009265736A true JP2009265736A (ja) 2009-11-12

Family

ID=41391549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008111180A Pending JP2009265736A (ja) 2008-04-22 2008-04-22 電子機器、その制御方法およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP2009265736A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027729A (ja) * 2010-07-23 2012-02-09 Ryusys Inc 検索装置、検索方法及びプログラム
JP2017041112A (ja) * 2015-08-20 2017-02-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム
JP2017091414A (ja) * 2015-11-16 2017-05-25 日本電信電話株式会社 情報抽出装置、情報提示装置、情報抽出方法、及びプログラム
JP2017097432A (ja) * 2015-11-18 2017-06-01 シャープ株式会社 電子機器、およびその制御方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944525A (ja) * 1995-07-31 1997-02-14 Fujitsu Ltd データ検索装置
JPH11203311A (ja) * 1998-01-13 1999-07-30 Fujitsu Ltd 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体
JP2004005337A (ja) * 2002-03-28 2004-01-08 Nippon Telegr & Teleph Corp <Ntt> 単語関係データベース構築方法および装置、単語関係データベースを用いた単語/文書処理方法および装置、説明表現妥当性検証方法、それらプログラム、それらプログラムを記録した記録媒体、単語の類似度計算方法、単語のグループ化方法、代表語の抽出方法、および単語概念の階層化方法
JP2004234138A (ja) * 2003-01-28 2004-08-19 National Institute Of Information & Communication Technology 辞書評価支援装置、辞書評価支援プログラム
JP2006228042A (ja) * 2005-02-18 2006-08-31 Toshiba Information Systems (Japan) Corp 単語階層関係解析装置及びそれに用いる方法、単語階層関係解析プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944525A (ja) * 1995-07-31 1997-02-14 Fujitsu Ltd データ検索装置
JPH11203311A (ja) * 1998-01-13 1999-07-30 Fujitsu Ltd 関連語抽出装置および関連語抽出方法および関連語抽出プログラムが記録されたコンピュータ読取可能な記録媒体
JP2004005337A (ja) * 2002-03-28 2004-01-08 Nippon Telegr & Teleph Corp <Ntt> 単語関係データベース構築方法および装置、単語関係データベースを用いた単語/文書処理方法および装置、説明表現妥当性検証方法、それらプログラム、それらプログラムを記録した記録媒体、単語の類似度計算方法、単語のグループ化方法、代表語の抽出方法、および単語概念の階層化方法
JP2004234138A (ja) * 2003-01-28 2004-08-19 National Institute Of Information & Communication Technology 辞書評価支援装置、辞書評価支援プログラム
JP2006228042A (ja) * 2005-02-18 2006-08-31 Toshiba Information Systems (Japan) Corp 単語階層関係解析装置及びそれに用いる方法、単語階層関係解析プログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG200100895021; 高野 敦子 他: '自然言語を用いた対話形式による文書検索における事典情報の利用' 情報処理学会研究報告 第2000巻 第107号, 20001122, pp.151-158, 社団法人情報処理学会 *
CSNG200500461019; 松平 智史 他: '電子化辞書と遺伝的プログラミングを用いたキャッチコピー作成支援システム' 電気学会論文誌C 第124巻 第1号, 20040101, p.p.164-169, (社)電気学会 *
JPN6012058748; 松平 智史 他: '電子化辞書と遺伝的プログラミングを用いたキャッチコピー作成支援システム' 電気学会論文誌C 第124巻 第1号, 20040101, p.p.164-169, (社)電気学会 *
JPN6013036020; 高野 敦子 他: '自然言語を用いた対話形式による文書検索における事典情報の利用' 情報処理学会研究報告 第2000巻 第107号, 20001122, pp.151-158, 社団法人情報処理学会 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027729A (ja) * 2010-07-23 2012-02-09 Ryusys Inc 検索装置、検索方法及びプログラム
JP2017041112A (ja) * 2015-08-20 2017-02-23 ヤフー株式会社 情報提供装置、情報提供方法および情報提供プログラム
JP2017091414A (ja) * 2015-11-16 2017-05-25 日本電信電話株式会社 情報抽出装置、情報提示装置、情報抽出方法、及びプログラム
JP2017097432A (ja) * 2015-11-18 2017-06-01 シャープ株式会社 電子機器、およびその制御方法

Similar Documents

Publication Publication Date Title
JP5106636B2 (ja) テキストセグメントを有する文書から用語を抽出するためのシステム
JP3691844B2 (ja) 文書処理方法
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
JP3983265B1 (ja) 辞書作成支援システム、方法及びプログラム
US20040029085A1 (en) Summarisation representation apparatus
JP5513898B2 (ja) 共有された言語モデル
CN109508441B (zh) 通过自然语言实现数据统计分析的方法、装置及电子设备
JP2009265736A (ja) 電子機器、その制御方法およびコンピュータプログラム
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
WO2014064777A1 (ja) 文書評価支援システム、及び文書評価支援方法
CN116644756A (zh) 基于知识图谱的语义分析方法
JP2010266971A (ja) 端末装置
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2008204133A (ja) 回答検索装置及びコンピュータプログラム
KR101355284B1 (ko) 터치스크린 환경에서 단어 추천 및 문장 완성 방법
JP5289261B2 (ja) 文章変換装置、方法及びプログラム
JP5169602B2 (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JP3629905B2 (ja) 文書処理装置及び文書処理方法
JP2010122823A (ja) テキスト処理システム、情報処理装置、テキストおよび情報の処理方法ならびに処理プログラム
JP5262190B2 (ja) 入力補完装置、及び入力補完プログラム
JP2009015394A (ja) 辞書構築支援装置
JP2009059290A (ja) 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム
JP2005234732A (ja) 文書管理装置および方法
Gharaibeh Development of Arabic Noun Phrase Extractor (ANPE)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20131119