JP4257407B2 - 辞書評価支援装置、辞書評価支援プログラム - Google Patents

辞書評価支援装置、辞書評価支援プログラム Download PDF

Info

Publication number
JP4257407B2
JP4257407B2 JP2003019549A JP2003019549A JP4257407B2 JP 4257407 B2 JP4257407 B2 JP 4257407B2 JP 2003019549 A JP2003019549 A JP 2003019549A JP 2003019549 A JP2003019549 A JP 2003019549A JP 4257407 B2 JP4257407 B2 JP 4257407B2
Authority
JP
Japan
Prior art keywords
phrase
information
output
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003019549A
Other languages
English (en)
Other versions
JP2004234138A (ja
Inventor
淳 善木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2003019549A priority Critical patent/JP4257407B2/ja
Publication of JP2004234138A publication Critical patent/JP2004234138A/ja
Application granted granted Critical
Publication of JP4257407B2 publication Critical patent/JP4257407B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、辞書を選ぶ際の好適な指標となる情報を提示することができる辞書評価支援装置及びそのプログラムに関するものである。
【0002】
【従来の技術】
辞書には、言語間辞書、国語辞書、百科事典等、様々な種類があり、各種類の辞書についても多くの出版社から多様な辞書が販売されている。ここで、言語間辞書とは、ある言語の語句説明を他の言語の語句を用いて記述したものであり、例えば英和辞書、和英辞書等がこの範疇に含まれる。日本語の古典で用いられる語句を現代語で説明した古語辞書も言語間辞書に含まれる。また、国語辞書は、ある言語の語句説明をその言語の別の語句で記述したものであり、日本語の国語辞書や英語の英英辞書等がこの範疇に含まれる。百科事典も一般的には国語辞書と同様のものであるが、理解を容易にするために図版や写真を多用したものがある。さらに最近では、パーソナルコンピュータで読み込んで利用できるようにしたCD−ROM版の辞書や、インターネット等のオンラインで利用可能又はダウンロード可能な辞書、出版物である辞書をスキャナ等で読み込んでパーソナルコンピュータで利用できるように独自に編集したもの等(以上を「電子辞書」と総称する)も、出版物である上述のような辞書に対応して或いはそれとは別に単独で、他種類提供されてきている。
【0003】
このような辞書をユーザである消費者が購入する場合、価格、大きさ、見出し語量、例文量、字の大きさ、図版の多さ、書評等を参考にするのが一般的であると考えられる。また電子辞書が書物としての辞書に対応して提供されることが多い現在では、例えばインターネット等で電子辞書のサンプル版や評価版を試してみて、気に入った辞書を選択のうえ、該当する電子辞書又はそれに対応する辞書の購入をするような場合もあると考えられる。すなわち、これまでユーザは、辞書そのものの内容を客観的に評価する方法が存在しないため、表層的な情報を手掛かりにあくまで主観に基づいて辞書を評価することで購入の参考にしている。
【0004】
また、ある語句の意味は、他の語句との関連で定義できるとする知見が得られている(例えば、非特許文献1参照。)。この知見に従って、辞書に掲載されている内容にまで踏み込んで検討しようとすると、その辞書である語句を引き、その語句についての説明文に挙がっている語句で辞書を引く、という作業を繰り返して行わなければならない。
【0005】
【非特許文献1】
フィデルナン・ド・ソシュール著、小林英夫訳、「一般言語学講座」、岩波書店、1972年
【0006】
【発明が解決しようとする課題】
ところが、このように辞書を選択するためにある辞書における語句の関連性を調べようとして逐一辞書を引く作業を繰り返すには多大な手間を要し、たとえその結果が得られたとしても、語句の関連性を一目瞭然に把握するのは極めて困難である。このことは、紙媒体の辞書のようにページを捲って辞書を引くことができない電子辞書においてはなおさら困難を伴うことである。したがって、これらの辞書購入の際に利用する情報として、肝心の辞書の内容にまで踏み込んだ評価に基づく情報を得ることが困難であるために内容にまで踏み込まない表層的な情報に従わざるを得ないこと、また辞書は一般に頁数が極めて多いことから、書店等で一瞥した限りで、或いは上述のような情報を入手してその辞書が当該消費者のニーズを満たすものであるか否かを判断することは困難である。特に、電子辞書の場合には、書物のようにページを開いて中の記載を読むということができないので、客観的な情報に基づく辞書選択の困難さはさらに高いものである。つまり、消費者は、上述のような辞書の内容にまでは至らない表面的な情報を元にして電子辞書を含む辞書の購入を決定している状況にあるといえる。また、このような状況は、言語を研究対象として日常的に多様な辞書を利用する機会が多い言語研究者に対して、大変な不自由を強いるものであるともいえる。すなわち、上述のような問題は、結局のところ、辞書の内容に基づく特徴を評価する方法が現時点では発達しておらず、上述したように客観的な評価方法が全く存在しないために、放置されているのが現状であることに起因している。
【0007】
そこで本発明は、以上のような問題に鑑みて、電子辞書を解析し、その辞書の内容的な特徴を客観的な情報に基づいて提示できるようにすることによって、辞書選択に役立つ方法を新しく提供しようとするものである。
【0008】
【課題を解決するための手段】
すなわち、本発明は、見出し語群と各見出し語に対応する説明文章とを少なくとも格納した電子辞書EDを利用して、当該電子辞書EDの内容を評価する指標となる情報を出力するために用いられるものであって、その基本態様は、図1に示すように、語句の入力を受け付ける語句入力受付手段1と、この受け付けた語句を電子辞書EDに格納された見出し語群から検索する見出し語検索手段2と、この検索結果に基づいて当該語句を見出し語とする説明文章を電子辞書EDから抽出する説明文章抽出手段3と、抽出した説明文章に対して形態素解析を実行し当該説明文章に含まれる語句のうち少なくとも一部の語句を前記見出し語に関連する関連語句として出力する関連語句出力手段4と、出力した各関連語句について見出し語を基準とする関連性を示し前記指標となる情報である関連情報を生成する関連情報生成手段5と、生成した関連情報を出力する関連情報出力手段6とを具備し、前記語句入力受付手段1が、初期値として評価対象である評価対象語句の入力を受け付けるとともに、関連語句出力手段4で出力される関連語句の入力を受け付けるものであり、関連情報生成手段5が、各関連語句に関して、評価対象語句の入力を基準として当該関連語句が出力されるまでに語句入力受付手段1で語句の入力を受け付けた回数に基づく階層情報を含む関連情報を生成することを特徴とする辞書評価支援装置A1である。
【0009】
ここで、本発明において用いる電子辞書EDは、テキストデータである見出し語と、その見出し語についての説明文章をテキストデータで表したものとを関連づけて格納するものであり、一般的にはコンピュータ読み取り可能なCD−ROM等の記録メディアに記録された形態や、インターネット等の通信ネットワークを介してコンピュータにダウンロード可能な形態のデータベースを指す。また、電子辞書EDには、書物である辞書をスキャナ等で読み取って見出し語と説明文章とをテキストデータとしたユーザ独自が編集した形態のものや、見出し語や説明文章の内容に対応する挿絵等の画像データが含まれているもの、自然言語を多数収録したコーパス等も含まれる。
【0010】
このような辞書評価支援装置A1を利用すれば、始めに初期値として評価対象としたい語句を入力すると、その評価対象語句を見出し語とする説明文章に出現する語句、すなわち評価対象語句と関係のある関連語句が出力され、さらにその関連語句に関係のある語句、さらにその関連語句に関係のある語句、と連鎖的に関連語句が出力されるとともに、各関連語句の評価対象語句との階層的な関係を示す階層情報を含む関連情報が生成、出力されるので、この出力された関連情報を見ることで、利用者は、当該電子辞書ED内に格納されている語句の内容的な繋がりを知ることができるようになる。すなわち、従来であれば、辞書を購入しようとするユーザは、見出し語数等の表層的な情報しか判断の基準を得ることができなかったが、本発明を利用することで、当該電子辞書EDの実質的な内容である関連情報を辞書購入の際の指標として活用することができるようになる。このことは、言語研究者にとっても、いかなる辞書を利用すべきかの判断基準にもなり、日々の研究開発に大いに役立つものである。したがって、本発明は、辞書評価の基準となる情報を全く新規に提供することを可能とするものである。
【0011】
なお、関連語句出力手段4において出力する関連語句は、説明文章からランダムに選択することもできるが、評価対象語句との関係の深い関連語句を適切に選択して出力する方が、辞書評価に利用する関連情報がより好適なものとなる。したがって、関連語句出力手段4においては、説明文章を一以上の説明文に分割し、その分割した各説明文に対して実行した形態素解析の結果に基づいて、各説明文に出現する語句に対して当該説明文における文頭からの出現順位を示す語句出現順位を付与し、所定の語句出現順位に係る語句を関連語句として出力するようにすることが望ましい。具体的には、ある見出し語の説明文章は、複数の説明文から構成されていることが多いので、関連語句出力手段4において、語句出現順位が1位の語句を関連語句として出力するように構成すると、各説明文に出現する代表的な語句を一通り網羅することができるとともに、装置及びプログラムの簡素化のためには好適である。
【0012】
関連語句を連鎖的に出力していくと、何れかの関連語句が当該電子辞書EDにおいて見出し語に挙げられていない場合があり、このような場合には、その関連語句についてのさらなる関連語句の出力を続行することができない。したがってこの場合には、見出し語検索手段2において検索対象である語句が電子辞書の見出し語群に存在しない場合に、関連情報生成手段5が関連情報として、関連情報の生成を終了する旨の終了情報を生成し、図2に示すように、関連情報出力手段6がこの終了情報を含む関連情報を出力し、この終了情報に基づいて語句入力受付手段1が語句の入力受付を終了するようにしておくとよい。
【0013】
さらに、出力された関連語句が、その関連語句を含む説明文章の見出し語である場合や、既に入力を受け付けた語句と同一である場合、すなわち、関連語句同士又は関連語句と評価対象語句との「ループ」が形成されることが考えられる。このような場合には、延々と同一の関連語句を出力し続ける無駄を省く必要があるので、語句入力受付手段1が、関連語句出力手段4において出力された関連語句が既に入力を受け付けた語句であると判断した場合、関連情報生成手段5が、当該出力すべき関連語句とその関連語句を含む説明文章に対応する見出し語との双方向の関連性を示す関連情報を生成すると共に終了情報を生成し、図2に示すように、関連情報出力手段6がこの終了情報を含む関連情報を出力するものであって、この終了情報に基づいて語句入力受付手段1が語句の入力受付を終了するようにすることが好ましい。
【0014】
また、本発明は、上述した辞書評価支援装置A1の基本構成に加えて、図3に示すように、関連語句の階層情報について所定階層までの関連情報の生成を指定する旨の階層指定情報の入力を受け付ける階層指定情報受付手段7を更に具備する態様の辞書評価支援装置A2とすることもできる。この場合、関連情報生成手段5が、階層指定情報受付手段7で受け付けた階層指定情報に対応する階層情報を有する関連情報を生成した場合、関連情報の生成を終了する旨の終了情報を生成し、関連情報出力手段6がこの終了情報を含む関連情報を出力し、この終了情報に基づいて語句入力受付手段1が語句の入力受付を終了する。このようなものであれば、予めデフォルトで階層を指定して入力しておくか、ユーザが好みの階層を指定して入力することで、関連語句の連鎖がその指定された階層で停止することになり、関連情報が冗長になるのを防止し適切な情報を得ることができる。
【0015】
さらに、上述した各辞書評価支援装置A1、A2において、関連語句出力手段4が、出力する関連語句に対して前記語句出現順位と共に、説明文章において当該関連語句を含む説明文が出現した順位を示す説明文出現順位を付与するものとして、関連情報生成手段5において生成する関連情報を、直前に関連語句出力手段4で出力した関連語句について、当該関連語句の語句出現順位を定数とし、且つ、当該関連語句が出現した説明文により構成される説明文章に対応する見出し語と、前記説明文出現順位とを変数とする関数によって表される情報から構成されるものとすることもできる。この場合、関連情報は上述した所定の関数データとして得られるため、関連情報の簡易化と利用の便宜を向上することができる。この場合、関連語句出力手段4を、評価対象語句についてのみ説明文出現順位が1位から所定順位までの関連語句を出力し、評価対象語句以外の関連語句については説明文出現順位が1位の関連語句のみを出力するものとして構成すれば、評価対象語句についてはある程度の広がりを持った関連語句及びそれらの関連情報が得られ、それ以上の下位階層の関連語句については説明文章の最初に出現する語句のみが関連語句として処理されるため、評価対象語句を起点としたまとまりのよい関連語句群及びそれらの関連情報を得ることが可能となる。
【0016】
さらにまた、辞書評価支援装置A1又はA2の構成に加えて、図4に示すように、評価対象語句に基づいて直接出力される関連語句の説明文出現順位を指定する説明文出現順位指定情報の入力を受け付ける説明文出現順位指定情報受付手段8を更に備えた辞書評価支援装置A3を構成する場合、語句入力受付手段1が、説明文出現順位指定情報受付手段8で受け付けた説明文出現順位指定情報に係る説明文出現順位を越える説明文出現順位を有する関連語句の入力を受け付けないようにすることでも、評価対象語句については指定された出現順位の説明文に含まれる関連語句及びそれらの関連情報が得られるので、評価対象語句を起点とした好ましい関連語句群及びそれらの関連情報を得ることが可能となる。なお、同図において、破線で示した部分は、辞書評価支援装置A3におけるオプション的な構成であり、当該部分の機能を辞書評価支援装置A3の機能として含めるか否かを適宜選択することができる。
【0017】
ところで、出力される関連情報は、ビジュアル的に表現した方が、評価対象語句を起点とする関連語句群の関係が把握しやすいと考えられる。したがって、以上に説明した辞書評価支援装置A1、A2又はA3の構成に加えて、図5に示すような、関連情報出力手段6で出力した関連情報に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段9と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段10とを更に備えた辞書評価支援装置A4を構成することが適当である。すなわち、ユーザは、辞書の評価に際して、関連情報に基づいて作成された評価対象語句及び関連語句の樹系図として視認することが可能となるため、電子辞書の内容を効率よく知ることが可能である。なお、同図においても、破線で示した部分は、辞書評価支援装置A4におけるオプション的な構成であり、当該部分の機能を辞書評価支援装置A4の機能として含めるか否かを適宜選択することができる。
【0018】
このような効果を有効に得ることができる具体的なものとしては、図6に示すように、前述した辞書評価支援装置A3の構成に加えて、関連情報出力手段6で出力した関連情報に含まれる前記階層情報、語句出現順位及び説明文出現順位に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段9と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段10とを更に具備した辞書評価支援装置A5を挙げることができる。なお、同図においても、破線で示した部分は、辞書評価支援装置A5におけるオプション的な構成であり、当該部分の機能を辞書評価支援装置A5の機能として含めるか否かを適宜選択することができる。この場合、樹系図生成手段9が、階層情報ごと、語句出現順位ごと、及び説明文出現順位ごとに異なる太さの直線で、評価対象語句と関連語句、及び関連語句と他の関連語句とを接続した樹系図を作成するものであれば、ユーザが評価対象語句と関連語句との関係をより把握しやすい樹系図を生成することが可能である。
【0019】
また、本発明は、図7に示すように、評価対象語句及び関連語句の品詞を指定する品詞指定情報を受け付ける品詞指定受付手段11を更に有する辞書評価支援装置A6とすることもできる。なお、この辞書評価支援装置A6の最小構成は、同図に実線で示すような辞書評価支援装置A1に品詞指定受付手段11を加えたものであるが、同図に破線で示すように、辞書評価支援装置A2、A3、A4又はA5に品詞指定受付手段11を加えたものとすることができる。この場合、語句入力受付手段1は、品詞指定受付手段で受け付けた品詞のみの入力を受け付けるものであり、関連語句出力手段4が、形態素解析に基づいて品詞指定受付手段で受け付けた品詞に対応する語句のみを関連語句として出力するようにするとよい。すなわち、名詞、動詞、形容詞等の品詞から一又は二以上の品詞を予め指定しておくことで、関連語句の特定及び出力に関する効率の向上が図られる。
【0020】
なお、以上に説明した辞書評価支援装置A1〜A6は、ディスプレイやスピーカ等の出力デバイス、キーボードやマウス等の入力デバイスなどの周辺機器を接続したパーソナルコンピュータにより実現することができる。また、辞書評価支援装置A1〜A6は、インターネット等の通信ネットワークに接続されたサーバコンピュータとしても実現することができ、この場合は、インターネット等に接続したユーザのクライアントコンピュータから評価対象語句等の入力を受け付けて所定の処理を行い、関連情報や樹系図の画像データ等をクライアントコンピュータに送信してそれをクライアントコンピュータのディスプレイ等に表示させるような態様で実施される。また、辞書評価支援プログラムは、CD−ROM等の記録メディアに記録した態様や、インターネット等の通信ネットワークからのダウンロード等の態様で提供され、さらに当該プログラムを読み込んだコンピュータ上で起動されることにより、コンピュータを辞書評価支援装置A1〜A6として機能させるものである。
【0021】
【発明の実施の形態】
以下、本発明の一実施形態を、図面を参照して説明する。
【0022】
この実施形態は、通常のパーソナルコンピュータPCに辞書評価支援プログラムをインストールすることによって、当該パーソナルコンピュータPCを上述した辞書評価支援装置A6として機能させるものである。また、電子辞書EDとしては、パーソナルコンピュータPCで読み取り可能なCD−ROM版の国語辞典を用いるものとする。
【0023】
まず、パーソナルコンピュータPCの機器構成を簡単に説明すると、図8に示すように、バス線等で電気的に接続されたCPU101、メインメモリ(RAM)やビデオメモリ(VRAM)等のメモリ102、ハードディスク等のストレージデバイス103、キーボードやマウス等の入力デバイス104、ディスプレイやスピーカ等の出力デバイス105、CD−ROMドライブ106等を基本的に備えた一般的な構成を有するものである。
【0024】
そして、ストレージデバイス103に格納した辞書評価支援プログラムをCPU101の制御により内部メモリ102に記憶させて当該プログラムを起動し、そのプログラムに従ったCPU101からの指令に基づいて他の各部を動作させることによって、このパーソナルコンピュータPCを、図7に示すように、語句入力受付手段1、見出し語検索手段2、説明文章抽出手段3、関連語句出力手段4、関連情報生成手段5、関連情報出力手段6、階層指定情報受付手段7、説明文出現順位指定情報受付手段8、樹系図生成手段9、樹系図出力手段10、品詞指定受付手段11の各手段を備えた辞書評価支援装置A6として機能させている。なお、見出し語検索手段2において電子辞書EDに格納された見出し語を検索する場合、及び説明文章抽出手段6において電子辞書EDから説明文章を抽出する場合には、CPU101からの指令に基づきCD−ROMドライブ106に挿入されたCD−ROMにアクセスして、必要な情報を内部メモリ102に記憶させる。なお、電子辞書EDを予めストレージデバイス103に格納している場合には、CPU101の指示に基づきストレージデバイス103から必要な情報を読み出し、電子辞書EDがインターネット上のデータベースサーバ等に格納されている場合には、CPU101の指示に基づきモデム等の通信インターフェースを通じて必要な情報をアップロード又はダウンロードする。その他の各手段としての機能は、CPU101による所定の演算処理や他の各部の駆動等により実現される。
【0025】
また、電子辞書EDに記録されている情報は、例えば図9に示すように、少なくとも見出し語HWとそれに対応する説明文章EWである。見出し語HW及び説明文章EWは、いずれも同一国語である日本語のテキストデータである。また、見出し語HWには、その語句の品詞の種類を表す情報が、各品詞に固有の識別子psID等として付与されている。説明文章EWは、一又は二以上の説明文ESから構成される。すなわち、説明文章EWは、単一の説明文ES又は複数の説明文ESの集合から構成されているといえる。なお、同図に一例として示した電子辞書EDに記録されている情報は、「広辞苑CD−ROM版 第4版(株式会社岩波書店)」における、「薔薇」という見出し語HWについての一部である。他の電子辞書EDを適用することができるのはいうまでもない。さらに電子辞書EDには、当該電子辞書EDに固有の記号、漢字の読み、動詞の変化、用語の範疇、図表や挿絵、例文等の情報が記録されている場合があるが、それらは本実施形態では使用しない。
【0026】
次に、本実施形態における辞書評価支援装置A6の動作手順について、図10〜図13に示すフローチャートを参照して説明する。
【0027】
まず、ユーザが辞書評価支援プログラムを起動すると、辞書評価支援装置A6は初期画面を出力し、それに対応した初期画面をディスプレイに表示する(図10、ステップS1)。この初期画面では、図示しないが、品詞指定情報の入力、階層指定情報の入力、説明文出現順位指定情報の入力、語句出現順位指定情報の入力、及び、評価対象語句の入力が可能となっている。
【0028】
品詞指定情報は、評価対象となっている電子辞書EDにおいて、評価の対象としたい語句の品詞の種類を表すものであり、例えば、普通名詞、固有名詞、動詞、形容詞等を示す情報であって、それらの情報は、電子辞書EDにおいて各見出し語HWに対応して付与されている品詞に関する識別子psIDに対応している。何れかの品詞を指定する品詞指定情報の入力があった場合(ステップS2;Yes)、その品詞指定情報を受け付けてメモリ102に格納する(ステップS3)。品詞指定情報の入力がなかった場合には(ステップS2;No)、品詞指定情報としてデフォルト値を自動的に入力し(ステップS2a)、これをメモリ102に格納する(ステップS3)。ここでデフォルト値としては、上述したように、普通名詞、固有名詞、動詞、形容詞の何れかを予め選択して設定しておくことができる。
【0029】
また、階層(Ln)は、評価対象語句を第0階層(Ln=0)とし、評価対象語句を見出し語HWとする説明文章EWに出現する語句の階層を第1階層(Ln=1)としている。以下、各階層は、Ln(nは1以上の整数)で表されるものとする。初期画面の所定の欄では、関連語句の階層について最大限度を指定できるものとし、その情報すなわち階層指定情報(LnMax)の入力があった場合(ステップS4;Yes)、その入力された階層指定情報(LnMax)を受け付けてメモリ102に格納する(ステップS5)。一方、階層指定情報の入力がなかった場合には(ステップS4;No)、階層指定情報(LnMax)としてデフォルト値を自動的に入力し(ステップS4a)、これをメモリ102に格納する(ステップS5)。ここでデフォルト値としては、1以上の任意の整数を予め設定しておくことができる。
【0030】
さらに、説明文出現順位(ESn)は、ある見出し語に対応する説明文章EWについて単文の説明文ESに分割する結果、先頭の説明文ESから順に付与される各説明文ESの出現順位を表すものである。ここで、nは1以上の整数である。本実施形態では、初期画面において、説明文出現順位指定情報の入力欄は、第1階層の説明文章EWを単文の説明文ESに分割する結果、先頭の説明文ESに出現する語句から何番目の説明文ESに出現する語句まで出力するかをユーザに指定させるものであり、説明文出現順位指定情報(ESnMax)は具体的には1以上の任意の整数をユーザが選択できるものとしている。ユーザが説明文出現順位指定情報(ESnMax)の入力をした場合(ステップS6;Yes)、この入力された説明文出現順位指定情報(ESnMax)を受け付けてメモリ102に格納する(ステップS7)。一方、説明文出現順位指定情報の入力がなかった場合には(ステップS6;No)、説明文出現順位指定情報(ESnMax)としてデフォルト値を自動入力し(ステップS6;No)、これをメモリ102に格納する。ここで、デフォルト値としては、1以上の整数を予め設定しておくことができる。なお、本実施形態では、第2階層以下の見出し語HWに係る説明文章については、ESnMax=1を既定値とすることによって、出現順位が第1位の説明文に出現する語句のみを関連語句として出力し、第2位以下の説明文については取り扱わないこととしているが、第2階層以下についても第1階層の場合と同様にユーザによって任意に指定できるようにすることも可能である。
【0031】
さらにまた、語句出現順位(Wn)は、説明文章EWを単文に分割された結果得られる各説明文ESにおいて、品詞指定情報受付手段11で指定された品詞に対応する語句が先頭から数えて何番目に出現するかを表すものであり、nは1以上の整数である。本実施形態では、初期画面において、第1階層については語句出現順位指定情報(WnFix)をユーザが指定して入力できるようにしているが、第2階層以下については、WnFix=1を既定値としている。ユーザによる語句出現順位指定情報(WnFix)の入力があった場合(ステップS8;Yes)、入力された語句出現順位指定情報(WnFix)を受け付けてメモリ102に格納する(ステップS9)。一方、ユーザによる語句出現順位指定情報の入力がなかった場合には(ステップS8;No)、語句出現順位指定情報としてデフォルト値を自動入力し(ステップS8a)、これを語句出現順位指定情報としてメモリ102に格納する(ステップS9)。ここで、デフォルト値としては、1以上の整数を予め設定しておくことができる。
【0032】
以上の各ステップの処理の後、初期画面の評価対象語句入力欄に、ユーザが評価を希望する語句の入力を行うと、それに対応して入力された評価対象語句の入力を受け付けて、メモリ102に格納する(ステップS10)。なお、初期画面における評価対象語句入力欄は、フリーワード入力可能なウィンドウとしておくとよい。次に、ステップS5で格納した階層指定情報(LnMax)を読み出して、その値を判断する。すなわち、階層指定情報(LnMax)が1であれば、図11に示すサブルートAの処理へ進み(ステップS11;LnMax=1)、階層指定情報(LnMax)が1よりも大きい値であれば、次のステップS13へ進む(ステップS11;LnMax>1)。
【0033】
ここで、サブルートAにおける処理工程について説明する。まず、メモリ102に格納された評価対象語句を取り出して電子辞書EDにアクセスし、当該電子辞書EDの見出し語HWを検索する(図11、ステップS101)。電子辞書EDに評価対象語句に対応する見出し語HWがなければ(ステップS102;No)、終了情報を生成して(ステップS115)サブルートAの処理を終了する。電子辞書EDに、評価対象語句に対応する見出し語HWがあった場合には(ステップS102;Yes)、その見出し語HWに対応する説明文章EWを電子辞書EDから抽出する(ステップS103)。さらに、抽出した説明文章を句点で区切られた一以上の説明文ESからなる単文に分割し、各説明文ESに説明文出現順位ESnを付与する(ステップS104)。続いて各説明文ESについて形態素解析を実行し(ステップS105)、ステップS3でメモリ102に格納した品詞指定情報を参照して、指定された品詞以外の品詞を削除する(ステップS106)。
【0034】
そしてまず、説明文出現順位ESnに対して、説明文が第1位であることを自動入力(ESn=ES1)する(ステップS107)。ここで、入力した説明文出現順位ESnについて、ステップS7でメモリ102に格納した説明文出現順位指定情報ESnMaxと比較し、説明文出現順位ESnが説明文出現順位指定情報ESnMaxと同一又は小さい場合(ステップS108;No)、当該説明文ESにステップS3でメモリ102に格納した品詞指定情報と同一の品詞があるか否かを判断する。指定された品詞と同一の品詞がない場合は(ステップS109;No)、終了情報を生成して(ステップS115)、このサブルートAの処理を終了する。同一の品詞が一以上ある場合には(ステップS109;Yes)、各語句に先頭から順に語句出現順位Wnを付与する(ステップS110)。さらに、ステップS9でメモリ102に格納した語句出現順位指定情報WnFixに基づいて、それと同一の語句を関連語句として出力するとともに、メモリ102に格納する(ステップS111)。この出力した関連語句が、評価対象語句と同一であれば(ステップS112;Yes)、終了情報を生成して(ステップS115)、サブルートAの処理を終了するが、関連語句が、評価対象語句と同一でなければ(ステップS112;No)、関連情報fを生成するとともにそれをメモリ102に格納する(ステップS113)。次に、次の説明文出現順位の処理に移行するために、これまでの説明文出現順位ESnに1を加える処理を行い(ステップS114)、ステップS108へ戻る。そして、その説明文出現順位ESnが、ステップS7でメモリ102に格納した説明文出現順位指定情報ESnMaxと同一又は小さい場合には(ステップS108;No)、ステップS109へ移行して、以降のステップを繰り返す。なお、2巡目以降は、ステップS112において、関連語句が評価対象語句又は既に出力した関連語句と同一か否かを判断する点で、1巡目とは異なる。一方、説明文出現順位ESnが、ステップS7でメモリ102に格納した説明文出現順位指定情報ESnMaxを越えた場合に(ステップS108;Yes)、終了情報を生成して(ステップS115)、サブルートAの処理を終了する。
【0035】
ここで、関連情報fは、関数f(a,ESn,WnFix)で表される。詳述すると、関連情報fは、aという見出し語を説明する説明文章のうち説明文出現順位がESnの説明文ESに出てくる語句であって、当該説明文ESの指定された語句出現順位WnFixである語句を示す関数である。なお、語句出現順位Wnは、語句出現順位指定情報WnFixに固定されるのでこれを省略するとともに、ESnを単に「n」と省略して、関連情報をf(a,n)と表すものとする。例えば、上述したスキームに従うと、入力された評価対象語句(Wa)を見出し語HWとする説明文章EWのうち、説明文出現順位ESnが1位(ES1)であり、且つ当該説明文ESにおいて語句出現順位Wnが1位(W1)の語句を関連語句とする場合には、その関連情報は、f(Wa,ES1)で表され、それが図13に示すように、メモリ102に格納されることになる。これ以降の説明文出現順位ESnについても同様に、f(Wa,ES2)、f(Wa,ES3)…となる。
【0036】
図10のフローチャートに戻って、ステップS11において階層指定情報(LnMax)が1よりも大きい値である場合(ステップS11;LnMax>1)、まず、階層Lnに対して、階層が第1位であることを自動入力(Ln=L1)し(ステップS13)、上述したのと同様にサブルートAの一連の処理を行う(ステップS14)。次に、階層Lnに対して、階層が第2位であることを自動入力(Ln=L2)し(ステップS15)、その入力した階層LnとステップS5でメモリ102に格納した階層指定情報LnMaxと比較(ステップS16)した後、階層Lnが階層指定情報LnMaxと同一又は小さい場合に(ステップS16;No)、図12に示すサブルートBの処理へ進む(ステップS17)。このサブルートBの処理の後、次の階層へ移行するために、これまでの階層Lnに1を加える処理を行い(ステップS18)、ステップS16へ戻る。
【0037】
ここで、サブルートBの処理について説明する。まず、ステップS14の処理、すなわち、第1階層Lについて行ったサブルートAの処理におけるステップS113で関連情報fが生成され且つステップS111でメモリ102に格納した関連語句を取り出し、この電子辞書EDの見出し語HWを検索する(図12、ステップS201)。ここで、該当する見出し語HWが電子辞書EDに存在しなければ(ステップS202;No)、終了情報を生成して(ステップS213)サブルートBの処理を終了する。関連語句に対応する見出し語HWが電子辞書EDにあった場合には(ステップS202;Yes)、その見出し語HWに対応する説明文章EWを電子辞書EDから抽出する(ステップS203)。さらに、抽出した説明文章を句点で区切られた一以上の説明文ESからなる単文に分割し、各説明文ESに説明文出現順位ESnを付与する(ステップS204)。上述したように、本実施形態では、第2階層以下については説明文出現順位ESnが1位の説明文ESについてのみ、関連語句を設定する処理を行うものとしているので、説明文出現順位がESの説明文ESを抽出したうえで(ステップS205)、その説明文ESについて形態素解析を実行し(ステップS206)、ステップS3でメモリ102に格納した品詞指定情報を参照して、指定された品詞以外の品詞を削除する(ステップS207)。次に、当該説明文ESにステップS3でメモリ102に格納した品詞指定情報と同一の品詞があるか否かを判断する。指定された品詞と同一の品詞がない場合は(ステップS208;No)、終了情報を生成して(ステップS213)、このサブルートBの処理を終了する。同一の品詞が一以上ある場合には(ステップS208;Yes)、各語句に先頭から順に語句出現順位Wnを付与する(ステップS209)。さらに、本実施形態では、第2階層以下については語句出現順位Wnが1位の語句のみ関連語句と認定することとしているので、語句出現順位Wの語句を関連語句として出力するとともに、メモリ102に格納する(ステップS210)。この出力した関連語句が、評価対象語句又は既に出力した関連語句と同一であれば(ステップS211;Yes)、終了情報を生成して(ステップS213)、サブルートBの処理を終了するが、関連語句が、評価対象語句と同一でなければ(ステップS211;No)、関連情報fを生成するとともにそれを図13に示すようにメモリ102に格納したうえで(ステップS212)、サブルートBの処理を終了する。例えば、第1階層L1の説明文出現順位ES1の関連語句を見出し語HWとして出力された関連語句の関連情報は図14に示すように、f(f(Wa,1),1)と表される。
【0038】
以上の処理の後、図10のフローチャートに戻って、関連情報fの有無を確認し、評価対象語句に対応する見出し語HWが電子辞書EDにないため検索できなかった場合など、関連情報fがなく、終了情報のみがある場合(ステップS19;No)には、全ての処理が終了する。一方、関連情報fが1以上ある場合(ステップS19;Yes)、この関連情報fをメモリ102から取り出して、関連情報f及び関連語句に基づいて樹系図を生成する(ステップS20)。そして、生成した樹系図を画像データとして出力することによって、樹系図をディスプレイに表示して(ステップS21)、全ての処理を終了することになる。
【0039】
ここで、上述したステップS20の樹系図の生成手順ついて、図13のフローチャートを参照してさらに詳細に説明する。なお、樹系図は、複数の節と、関連のある節同士を接続する線とから構成されるが、本実施形態では「節クラス」に語句が当てはめられ、「線クラスに」終端に矢印が設定された矢印線が当てはめられるものとする。まず、メモリ102に格納された評価対象語句、関連語句、各関連語句の関連情報fを取り出し、節クラス及び線クラスにそれぞれパラメータを自動入力する初期化処理を実行する(ステップS301)。ここで、節クラスには、評価対象語句及び関連語句の通し番号、評価対象語句及び関連語句の文字データからなる標識、評価対象語句及び関連語句の座標、各節クラスの速度、ロックの有無、の5種類のパラメータが含まれる。なお、樹系図を3次元画像で表す場合には、各節の座標のパラメータは(x,y,z)、速度のパラメータは(vx,vy,vz)というように設定されるが、樹系図を2次元画像で表す場合には各節の座標のパラメータは(x,y)、速度のパラメータは(vx,vy)というように設定される。一方、線クラスには、各線の通し番号、線の始端側における節の通し番号(通し番号・from)、線の終端側における節の通し番号(通し番号・to)、基本線長(適宜、0以上)、基本線太(適宜)、基本線色(適宜)、の6種類のパラメータが含まれる。なお、基本線太は、評価対象語句からの距離が近い線ほど太く、遠い線ほど細くなるように設定してある。また、基本線色は、評価対象語句からの距離が近い線ほど濃く、遠い線ほど薄くなるように設定することができるが、本実施形態では全て同一の濃さの線となるように設定することとしている。すなわち、階層Lnが高い関連語句の節へ延びる線ほど太く、説明文出現順位ESnが小さい順位である関連語句へ延びる線ほど太く、語句出現順位Wnが小さい順位である関連語句へ延びる線ほど太くなる。そして、この初期化処理のステップでは、節クラスの標識には評価対象語句又は関連語句の文字データが代入される。また、線クラスの各パラメータには、関連情報fに基づいて、適切な値が代入される。さらに、節クラスの座標と速度には、適当な値がランダムに割り振られる。
【0040】
次に、初期化処理のステップ(ステップS301)が終了すると、バネ演算が実行される(ステップS302)。このステップを、仮にi番目[番号i]の各線クラスに関するバネ演算処理について例示して簡単に説明すると、次のようになる。すなわち、まず、線[番号i]が接続している節の通し番号・fromが指し示す節[通し番号・from]と、線[番号i]が接続している節の通し番号・toが指し示す節[通し番号・to]のそれぞれの座標から、節間距離を算出する。次に、線[番号i]の基本線長と節間距離が近づくように、節[接続している節の通し番号・from]の速度と、節[接続している節の通し番号・to]の速度とに、加算・減算等の調整を加える。その際、「線[番号i]の基本線長と節間距離の差」と、「速度」の調整は比例させるものとする。ここで、節間距離が0であり、なおかつ速度が0の場合は、適宜極めて小さいランダムな速度を与える。
【0041】
次に、バネ演算処理のステップ(ステップS302)が終了すると、斥力演算の処理を行う(ステップS303)。すなわち、生成される樹系図の見やすさを生み出すために、各節間で僅かに斥力が存在しているかのような演算を行う。具体的には、ある節は、他の全ての節との距離を考慮し、他の節とのそれぞれの距離に反比例した斥力を受け、他の節から離れるように速度の調整を受ける。ここで、節間距離が0で斥力の働く方向が不定の場合、斥力として適宜極めて小さいランダムな方向を与える。ただし、このステップでの斥力演算がもたらす節の速度への影響は、前のバネ演算(ステップS302)と比較して大きなものではない。
【0042】
次に、全ての節を移動させる処理を行う(ステップS304)。すなわち、全ての節の座標に対して、その節の速度に従って調整を行う。但し、樹系図の見やすさを考慮してリミッタを設定している場合は、設定した速度以上では調整されない。また、静止摩擦が存在するかのように、速度が小さすぎても座標は調整されないようにしている。また、ロックされている節は、座標の調整を受けず、設定した画面の境界外へと飛び出るような節の調整は受けない。
【0043】
次に、全ての節及び線の描画を行う(ステップS304)。3次元画像の場合は、一番奥に設定した節から延びている線を描画し、次いでその節を矩形等で描画し、その上に標識として評価対象語句の文字データを印字する。そして順に、手前の節と線の描画を行う。一方、2次元画像の場合は、始めに全ての線を描画し、各線の始端と終端に節を矩形等で描画し、その上に標識として対応する評価対象語句又は関連語句の文字データを印字する。なお、ある関連語句の節を始端とする線の終端が、他の関連語句又は評価対象語句を指し示している場合には、線は双方向の矢印として表される。
【0044】
最後に、後処理を行う(ステップS306)。この処理では、全ての節の速度を減衰させ、僅かずつ0に近づくように調整することによって、節及び線の移動の安定化を行う。
【0045】
このように描画することによって生成した樹系図を、図10に示したステップS21のように、画像データとして出力し、ディスプレイに視認可能な樹系図として表示するのである。なお、上述したステップS304とステップS305の間又はステップS21で樹系図の画像データをディスプレイに表示させた後に、ユーザの入力により樹系図の画像の調整を行うことができる。すなわち、ユーザは、画像の安定化中又は安定化の後に、任意の節を移動させたり、任意の節の位置を固定することや、視点の移動、回転、ズームイン、ズームアウト等の調整を行うことができるようにすることが可能である。例えば、線と節の絡み具合が複雑であり安定化の途中で「もつれてしまった」場合、各節の速度にランダムな値を加算したり、各節の位置を微妙にランダムに調整することにより、「もつれ」をほどくことができ、これを「外乱」と定義すると、ユーザは、この外乱の発生の有無や頻度、大きさを任意に設定することができる。
【0046】
以上が、ユーザにより評価対象語句が入力されてからその評価対象語句を基準とする樹系図をディスプレイに表示するまでの、この辞書評価支援装置A6の動作工程であるが、最後に、具体例を以下に示す。
【0047】
例えば、評価対象語句として、「薔薇」という語句がユーザにより入力されたとする。また、品詞指定情報は「普通名詞」、階層指定情報LnMaxは「5」、説明文出現順位指定情報ESnMaxは「3」、語句順位指定情報Wnは「1」であると、ユーザの入力またはデフォルト値の設定があったものとする。電子辞書EDにおいて、評価対象語句「薔薇」を見出し語HWとする説明文章EWは図9に示したようなものである。したがって、説明文出現順位が3位(ES3)までの説明文ESにおいて、それぞれ語句順位Wnが1位(W1)の普通名詞は、順に、「茨」、「属」、「原種」であり、これらが第1階層L1の関連語句となる。以下、「茨」、「属」、「原種」をそれぞれ第1階層として、順次第5階層まで電子辞書EDから抽出した説明文章EWから関連語句を特定していくと、「茨」「とげ」「先」「部分」「着目」、「属」、「原種」「種」「物事」「物」が得られる。なお、「属」を見出し語HWとする説明文章EWにおいて、この電子辞書EDでは、第1の説明文ESには普通名詞が出現しないので、第2階層以下の関連語句は出力されないことになる。図15に、この評価対象語句「薔薇」を基準として得られた各関連語句、及びそれらの関連情報fについての一覧を示す。そして、この関連情報fに基づいて生成され、ディスプレイに表示される樹系図を図16に示す。同図では、各節に評価対象語句及び関連語句が印字されている。また、各節を繋ぐ線(矢印)は、評価対象語句と関連が深く近いものほど太い線で表され、評価対象語句と関連が浅く遠くものほど細い線で表示される。但し、線色を濃淡で区別するように設定している場合には、それが樹系図の画像に反映される。このような樹系図を見ることによってユーザは、この電子辞書EDの内容的な情報を、辞書を評価するための情報として得ることができるので、辞書を購入する際の目安として利用することができるのである。
【0048】
なお、本発明は、上述した実施形態に限られるものではなく、前述した辞書評価支援装置A1〜A6の何れかの態様とすることができるものである。また、ユーザがインターネット等に接続したクライアントコンピュータを利用している場合には、本発明は、そのクライアントコンピュータから評価対象語句等の入力を受け付けて、関連情報や樹系図の画像データを生成してクライアントコンピュータへ返信するサーバコンピュータとしても実現できるものである。さらに各部の具体的構成についても上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で種々変形が可能である。
【0049】
【発明の効果】
本発明は、以上に詳述したように、辞書の内容を評価するに当たって、見出し語数や例文数等の表層的な情報ではなく、電子辞書に格納された見出し語とその説明とに基づいて当該辞書内の記述の内容的な繋がりを、当初に入力された評価対象語句に関する関連語句及び関連情報として得ることができるものである。したがって、その辞書の本質的な内容に基づいて当該辞書を評価できることになるため、従来では得られなかった情報を、辞書を購入又は利用する前に得ることができる意味で、極めて画期的であり且つ有用なものである。
【図面の簡単な説明】
【図1】本発明の請求項1、2、3に対応する辞書評価支援装置の機能構成図。
【図2】本発明の請求項4、5に対応する辞書評価支援装置の機能構成図。
【図3】本発明の請求項6、7、8に対応する辞書評価支援装置の機能構成図。
【図4】本発明の請求項9に対応する辞書評価支援装置の機能構成図。
【図5】本発明の請求項10に対応する辞書評価支援装置の機能構成図。
【図6】本発明の請求項11、12に対応する辞書評価支援装置の機能構成図。
【図7】本発明の請求項13に対応する辞書評価支援装置の機能構成図。
【図8】本発明の一実施形態が適用されるコンピュータの概略的な機器構成図。
【図9】同実施形態で適用される電子辞書の内部データの一例を示す図。
【図10】同実施形態の処理工程を示すフローチャート。
【図11】図10におけるサブルートAの処理工程を示すフローチャート。
【図12】図10におけるサブルートBの処理工程を示すフローチャート。
【図13】図10におけるサブルートCの処理工程を示すフローチャート。
【図14】同実施形態で生成される関連情報の一例を示す図。
【図15】同実施形態で生成される関連情報の一具体例を示す図。
【図16】図15の関連情報に基づいて生成・表示される樹系図の一例を示す図。
【符号の説明】
1…語句入力受付手段
2…見出し語検索手段
3…説明文章抽出手段
4…関連語句出力手段
5…関連情報生成手段
6…関連情報出力手段
7…階層指定情報受付手段
8…説明文出現順位指定情報受付手段
9…樹系図生成手段
10…樹系図出力手段
11…品詞指定受付手段
A1,A2,A3,A4,A5,A6…辞書評価支援装置

Claims (26)

  1. 見出し語群と各見出し語に対応する説明文章とを少なくとも格納した電子辞書を利用して、当該電子辞書の内容を評価する指標となる情報を出力するために用いられるものであって、
    語句の入力を受け付ける語句入力受付手段と、この受け付けた語句を電子辞書に格納された見出し語群から検索する見出し語検索手段と、この検索結果に基づいて当該語句を見出し語とする説明文章を電子辞書から抽出する説明文章抽出手段と、抽出した説明文章に対して形態素解析を実行し当該説明文章に含まれる語句のうち少なくとも一部の語句を前記見出し語に関連する関連語句として出力する関連語句出力手段と、出力した各関連語句について見出し語を基準とする関連性を示し前記指標となる情報である関連情報を生成する関連情報生成手段と、生成した関連情報を出力する関連情報出力手段とを具備し、前記語句入力受付手段が、初期値として評価対象である評価対象語句の入力を受け付けるとともに、関連語句出力手段で出力される関連語句の入力を受け付けるものであり、関連情報生成手段が、各関連語句に関して、評価対象語句の入力を基準として当該関連語句が出力されるまでに語句入力受付手段で語句の入力を受け付けた回数に基づく階層情報を含む関連情報を生成することを特徴とする辞書評価支援装置。
  2. 関連語句出力手段が、説明文章を一以上の説明文に分割し、その分割した各説明文に対して実行した形態素解析の結果に基づいて、各説明文に出現する語句に対して当該説明文における文頭からの出現順位を示す語句出現順位を付与し、所定の語句出現順位に係る語句を関連語句として出力するものである請求項1記載の辞書評価支援装置。
  3. 関連語句出力手段が、語句出現順位が1位の語句を関連語句として出力するものである請求項2記載の辞書評価支援装置。
  4. 見出し語検索手段において検索対象である語句が電子辞書の見出し語群に存在しない場合に、関連情報生成手段が関連情報として、関連情報の生成を終了する旨の終了情報を生成するものであり、関連情報出力手段がこの終了情報を含む関連情報を出力するものであって、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するものである請求項1、2又は3記載の辞書評価支援装置。
  5. 語句入力受付手段が、関連語句出力手段において出力された関連語句が既に入力を受け付けた語句であると判断した場合、関連情報生成手段が、当該出力すべき関連語句とその関連語句を含む説明文章に対応する見出し語との双方向の関連性を示す関連情報を生成すると共に終了情報を生成するものであり、関連情報出力手段がこの終了情報を含む関連情報を出力するものであって、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するものである請求項1、2、3又は4記載の辞書評価支援装置。
  6. 関連語句の階層情報について所定階層までの関連情報の生成を指定する旨の階層指定情報の入力を受け付ける階層指定情報受付手段を更に具備し、関連情報生成手段が、階層指定情報受付手段で受け付けた階層指定情報に対応する階層情報を有する関連情報を生成した場合、関連情報の生成を終了する旨の終了情報を生成するものであり、関連情報出力手段がこの終了情報を含む関連情報を出力するものであって、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するものである請求項1、2、3、4又は5記載の辞書評価支援装置。
  7. 関連語句出力手段が、出力する関連語句に対して前記語句出現順位と共に、説明文章において当該関連語句を含む説明文が出現した順位を示す説明文出現順位を付与するものであり、関連情報生成手段において生成する関連情報が、直前に関連語句出力手段で出力した関連語句について、当該関連語句の語句出現順位を定数とし、且つ、当該関連語句が出現した説明文により構成される説明文章に対応する見出し語と、前記説明文出現順位とを変数とする関数によって表される情報から構成されるものである請求項2、3、4、5又は6記載の辞書評価支援装置。
  8. 関連語句出力手段が、評価対象語句についてのみ説明文出現順位が1位から所定順位までの関連語句を出力し、評価対象語句以外の関連語句については説明文出現順位が1位の関連語句のみを出力するものである請求項7記載の辞書評価支援装置。
  9. 評価対象語句に基づいて直接出力される関連語句の説明文出現順位を指定する説明文出現順位指定情報の入力を受け付ける説明文出現順位指定情報受付手段を更に具備し、語句入力受付手段が、説明文出現順位指定情報受付手段で受け付けた説明文出現順位指定情報に係る説明文出現順位を越える説明文出現順位を有する関連語句の入力を受け付けないものである請求項1、2、3、4、5、6、7又は8記載の辞書評価支援装置。
  10. 関連情報出力手段で出力した関連情報に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備している請求項1、2、3、4、5、6、7、8又は9記載の辞書評価支援装置。
  11. 関連情報出力手段で出力した関連情報に含まれる前記階層情報、語句出現順位及び説明文出現順位に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備している請求項9記載の辞書評価支援装置。
  12. 樹系図生成手段が、階層情報ごと、語句出現順位ごと、及び説明文出現順位ごとに異なる太さの直線で、評価対象語句と関連語句、及び関連語句と他の関連語句とを接続した樹系図を作成するものである請求項11記載の辞書評価支援装置。
  13. 評価対象語句及び関連語句の品詞を指定する品詞指定情報を受け付ける品詞指定受付手段を更に具備し、語句入力受付手段が、品詞指定受付手段で受け付けた品詞のみの入力を受け付けるものであり、関連語句出力手段が、形態素解析に基づいて品詞指定受付手段で受け付けた品詞に対応する語句のみを関連語句として出力する請求項1、2、3、4、5、6、7、8、9、10、11又は12記載の辞書評価支援装置。
  14. コンピュータに見出し語群と各見出し語に対応する説明文章とを少なくとも格納した電子辞書を読み込ませ、当該電子辞書の内容を評価する指標となる情報を出力するために、当該コンピュータを、
    語句の入力を受け付ける語句入力受付手段と、この受け付けた語句を電子辞書に格納された見出し語群から検索する見出し語検索手段と、この検索結果に基づいて当該語句を見出し語とする説明文章を電子辞書から抽出する説明文章抽出手段と、抽出した説明文章に対して形態素解析を実行し当該説明文章に含まれる語句のうち少なくとも一部の語句を前記見出し語に関連する関連語句として出力する関連語句出力手段と、出力した各関連語句について見出し語を基準とする関連性を示し前記指標となる情報である関連情報を生成する関連情報生成手段と、生成した関連情報を出力する関連情報出力手段とを具備し、前記語句入力受付手段が、初期値として評価対象である評価対象語句の入力を受け付けるとともに、関連語句出力手段で出力される関連語句の入力を受け付けるものであり、関連情報生成手段が、各関連語句に関して、評価対象語句の入力を基準として当該関連語句が出力されるまでに語句入力受付手段で語句の入力を受け付けた回数に基づく階層情報を含む関連情報を生成する辞書評価支援装置として機能させることを特徴とする辞書評価支援プログラム。
  15. 関連語句出力手段が、説明文章を一以上の説明文に分割し、その分割した各説明文に対して実行した形態素解析の結果に基づいて、各説明文に出現する語句に対して当該説明文における文頭からの出現順位を示す語句出現順位を付与し、所定の語句出現順位に係る語句を関連語句として出力するようにコンピュータを機能させる請求項14記載の辞書評価支援プログラム。
  16. 関連語句出力手段が、語句出現順位が1位の語句を関連語句として出力するようにコンピュータを機能させる請求項15記載の辞書評価支援プログラム。
  17. 見出し語検索手段において検索対象である語句が電子辞書の見出し語群に存在しない場合に、関連情報生成手段が関連情報として、関連情報の生成を終了する旨の終了情報を生成し、関連情報出力手段がこの終了情報を含む関連情報を出力し、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するようにコンピュータを機能させる請求項14、15又は16記載の辞書評価支援プログラム。
  18. 語句入力受付手段が、関連語句出力手段において出力された関連語句が既に入力を受け付けた語句であると判断した場合、関連情報生成手段が、当該出力すべき関連語句とその関連語句を含む説明文章に対応する見出し語との双方向の関連性を示す関連情報を生成すると共に終了情報を生成し、関連情報出力手段がこの終了情報を含む関連情報を出力し、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するようにコンピュータを機能させる請求項14、15、16又は17記載の辞書評価支援プログラム。
  19. コンピュータに、関連語句の階層情報について所定階層までの関連情報の生成を指定する旨の階層指定情報の入力を受け付ける階層指定情報受付手段を更に具備させ、関連情報生成手段が、階層指定情報受付手段で受け付けた階層指定情報に対応する階層情報を有する関連情報を生成した場合、関連情報の生成を終了する旨の終了情報を生成し、関連情報出力手段がこの終了情報を含む関連情報を出力し、この終了情報に基づいて語句入力受付手段が語句の入力受付を終了するように当該コンピュータを機能させる請求項14、15、16、17又は18記載の辞書評価支援プログラム。
  20. 関連語句出力手段が、出力する関連語句に対して前記語句出現順位と共に、説明文章において当該関連語句を含む説明文が出現した順位を示す説明文出現順位を付与し、関連情報生成手段において生成する関連情報を、直前に関連語句出力手段で出力した関連語句について、当該関連語句の語句出現順位を定数とし、且つ、当該関連語句が出現した説明文により構成される説明文章に対応する見出し語と、前記説明文出現順位とを変数とする関数によって表される情報から構成するようにコンピュータを機能させる請求項15、16、17、18又は19記載の辞書評価支援プログラム。
  21. 関連語句出力手段が、評価対象語句についてのみ説明文出現順位が1位から所定順位までの関連語句を出力し、評価対象語句以外の関連語句については説明文出現順位が1位の関連語句のみを出力するようにコンピュータを機能させる請求項20記載の辞書評価支援プログラム。
  22. コンピュータに、評価対象語句に基づいて直接出力される関連語句の説明文出現順位を指定する説明文出現順位指定情報の入力を受け付ける説明文出現順位指定情報受付手段を更に具備させ、語句入力受付手段が、説明文出現順位指定情報受付手段で受け付けた説明文出現順位指定情報に係る説明文出現順位を越える説明文出現順位を有する関連語句の入力を受け付けないように当該コンピュータを機能させる請求項14、15、16、17、18、19、20又は21記載の辞書評価支援プログラム。
  23. コンピュータに、関連情報出力手段で出力した関連情報に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備させる請求項14、15、16、17、18、19、20、21又は22記載の辞書評価支援プログラム。
  24. コンピュータに、関連情報出力手段で出力した関連情報に含まれる前記階層情報、語句出現順位及び説明文出現順位に基づいて、評価対象語句を起点とし各関連語句の評価対象語句に対する位置付けを表した樹系図を生成する樹系図生成手段と、生成した樹系図をディスプレイに表示可能な画像データとして出力する樹系図出力手段とを更に具備させる請求項22記載の辞書評価支援プログラム。
  25. 樹系図生成手段が、階層情報ごと、語句出現順位ごと、及び説明文出現順位ごとに異なる太さの直線で、評価対象語句と関連語句、及び関連語句と他の関連語句とを接続した樹系図を作成するようにコンピュータを機能させる請求項24記載の辞書評価支援プログラム。
  26. コンピュータに、評価対象語句及び関連語句の品詞を指定する品詞指定情報を受け付ける品詞指定受付手段を更に具備させ、語句入力受付手段が、品詞指定受付手段で受け付けた品詞のみの入力を受け付け、関連語句出力手段が、形態素解析に基づいて品詞指定受付手段で受け付けた品詞に対応する語句のみを関連語句として出力するようにコンピュータを機能させる請求項14、15、16、17、18、19、20、21、22又は23記載の辞書評価支援プログラム。
JP2003019549A 2003-01-28 2003-01-28 辞書評価支援装置、辞書評価支援プログラム Expired - Lifetime JP4257407B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003019549A JP4257407B2 (ja) 2003-01-28 2003-01-28 辞書評価支援装置、辞書評価支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003019549A JP4257407B2 (ja) 2003-01-28 2003-01-28 辞書評価支援装置、辞書評価支援プログラム

Publications (2)

Publication Number Publication Date
JP2004234138A JP2004234138A (ja) 2004-08-19
JP4257407B2 true JP4257407B2 (ja) 2009-04-22

Family

ID=32949387

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003019549A Expired - Lifetime JP4257407B2 (ja) 2003-01-28 2003-01-28 辞書評価支援装置、辞書評価支援プログラム

Country Status (1)

Country Link
JP (1) JP4257407B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009265736A (ja) * 2008-04-22 2009-11-12 Sharp Corp 電子機器、その制御方法およびコンピュータプログラム
JP6379742B2 (ja) * 2014-06-30 2018-08-29 カシオ計算機株式会社 情報表示制御装置およびプログラム

Also Published As

Publication number Publication date
JP2004234138A (ja) 2004-08-19

Similar Documents

Publication Publication Date Title
US7234942B2 (en) Summarisation representation apparatus
JP4966546B2 (ja) 電子テキストに概念的強調を自動的に施す方法
US9418654B1 (en) Presentation of written works based on character identities and attributes
US8566350B2 (en) Method and apparatus for facilitating document sanitization
US5200893A (en) Computer aided text generation method and system
US20130218914A1 (en) System and method for providing recommendations based on information extracted from reviewers' comments
JP4347226B2 (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
US9081765B2 (en) Displaying examples from texts in dictionaries
JP2003114906A (ja) ユーザ定義可能なパーソナリティを備えたメタ文書管理システム
JP2008287517A (ja) 強調表示装置及びプログラム
Wynne Searching and concordancing
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
US6035338A (en) Document browse support system and document processing system
Frankenberg-Garcia Can a corpus-driven lexical analysis of human and machine translation unveil discourse features that set them apart?
JP2004157931A (ja) 意図文型種別抽出方式
Harper et al. Middleware to expand context and preview in hypertext
US10960312B2 (en) System and method for creating dynamic games making use of a search engine
JP4257407B2 (ja) 辞書評価支援装置、辞書評価支援プログラム
JP4499179B1 (ja) 端末装置
JP6144133B2 (ja) 検索システム
JP2008204133A (ja) 回答検索装置及びコンピュータプログラム
JP4213900B2 (ja) 文書分類装置と記録媒体
JP2006139484A (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
JP2009169761A (ja) 電子辞書システム、電子辞書の表示制御方法、コンピュータプログラムおよびデータ記憶媒体
JP2000105769A (ja) 文書表示方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060526

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060620

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

R150 Certificate of patent or registration of utility model

Ref document number: 4257407

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term