JP2005084754A - 辞書引きリンクタグ付与システム - Google Patents

辞書引きリンクタグ付与システム Download PDF

Info

Publication number
JP2005084754A
JP2005084754A JP2003313161A JP2003313161A JP2005084754A JP 2005084754 A JP2005084754 A JP 2005084754A JP 2003313161 A JP2003313161 A JP 2003313161A JP 2003313161 A JP2003313161 A JP 2003313161A JP 2005084754 A JP2005084754 A JP 2005084754A
Authority
JP
Japan
Prior art keywords
dictionary
link
phrase
document
setting information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003313161A
Other languages
English (en)
Inventor
Kazunobu Maruyama
和宣 丸山
Keita Omori
敬太 大森
Masahiro Tatezawa
正博 立澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2003313161A priority Critical patent/JP2005084754A/ja
Publication of JP2005084754A publication Critical patent/JP2005084754A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】 文書中からユーザが必要とする語句を選択して、辞書引きのためのリンクタグを語句に付与する装置を提供することにある。
【解決手段】 辞書引きリンクタグ付与システムは、ユーザ設定情報をユーザ毎に登録し管理するユーザ設定情報管理手段と、語句難易度情報を専門分野毎に格納し管理する語句難易度情報管理手段と、辞書参照頻度情報を専門分野毎に格納し管理する辞書参照頻度情報管理手段と、語句及び語句の説明記述を格納し管理する電子辞書装置と、辞書引きリンクタグを付与するための辞書リンク付文書生成手段と、辞書引き結果を表す文書を生成するための辞書引き結果文書生成手段と、ユーザが画面表示入力手段を介して入力した情報及び要求に基づいて上記ユーザ設定情報管理手段、上記辞書リンク付文書生成手段、及び上記辞書引き結果文書生成手段を制御する制御手段と、を有する。
【選択図】 図1

Description

本発明は、文書に含まれる単語に対して辞書引きのためのリンクタグを自動的に挿入する辞書引きリンクタグ付与システムに関する。
特開平9−305581号公報には、文書中の辞書引き単位の全て又は一部の文字列にリンク情報を付与する文書表示システムが記載されている。リンク情報は、電子辞書の格納情報を与える。この例では、辞書参照頻度情報管理手段によってリンク情報の参照頻度を管理し、該参照頻度によってリンク情報を付与した文字列の表示方法を変更する。更に、参照頻度の少ない辞書引き単位に対してはリンク情報を付与しない等の判断を行う。
特開平9−305581号公報
特開平9−305581号公報に記載された例では、辞書引きリンクタグが付与された語句の実際に辞書引き参照された頻度を管理する。それによって、ユーザが実際に必要としている対象語句群を絞り込むことができるが、対象語句群の絞り込みに時間が掛かる。また、参照頻度が多い語句の中には、その文書の属する専門分野において、通常のユーザが意味内容を理解しており、辞書引きリンクタグの付与を必要としない場合がある。しかしながら、上記の例では、辞書引きリンクタグの付与の必要性をユーザ毎に判断することができず、ユーザが望まない語句に対しても辞書引きリンクタグが付与される。
本発明の目的は、辞書引きリンクタグ付与の対象語句を、語句の属する専門分野、語句の難易度、及び語句の参照頻度によって絞り込むことができるリンクタグ付与システムを提供することにある。
本発明の目的は、ユーザが参照する特定の専門分野に属する難解な語句、又は、専門用語に対してリンクタグを付与することができる辞書引きリンクタグ付与システムを提供することにある。
本発明によると、辞書引きリンクタグ付与システムは、辞書引きリンクタグ付与の対象とする語句の絞り込み条件情報であるユーザ設定情報をユーザ毎に登録し管理するユーザ設定情報管理手段と、語句及び語句の難易度を含む語句難易度情報を専門分野毎に格納し管理する語句難易度情報管理手段と、語句及び語句の参照頻度を含む辞書参照頻度情報を専門分野毎に格納し管理する辞書参照頻度情報管理手段と、語句及び語句の説明記述を格納し管理する電子辞書装置と、文書中の語句に対して辞書引きの要求を表す辞書引きリンクタグを付与するための辞書リンク付文書生成手段と、上記電子辞書装置から提供された語句の説明記述を使用して辞書引き結果を表す文書を生成するための辞書引き結果文書生成手段と、ユーザが画面表示入力手段を介して入力した情報及び要求に基づいて上記ユーザ設定情報管理手段、上記辞書リンク付文書生成手段、及び上記辞書引き結果文書生成手段を制御する制御手段と、を有し、上記制御手段は、画面表示入力手段から入力されたユーザ設定情報を上記ユーザ設定情報管理手段に登録させ、上記画面表示入力手段から入力されたユーザの要求に基づいて、上記辞書リンク付文書生成手段に対して辞書引きリンクタグが付与された文書を作成させ、上記辞書引き結果文書生成手段に対して辞書引き結果を表す文書を作成させる。
本発明によると、辞書引きリンクタグ付与システムにおいて、上記ユーザ設定情報管理手段が登録するユーザ設定情報は、対象とする語句が属する一つ又は複数の専門分野、対象とする語句の難易度、及び、対象とする語句の参照頻度、を含む。
本発明によると、辞書引きリンクタグ付与システムにおいて、上記ユーザ設定情報管理手段は、上記辞書リンク付文書生成手段からの要求に応じてユーザ設定情報を提供する。
本発明によると、辞書引きリンクタグ付与システムにおいて、上記辞書リンク付文書生成手段は、上記制御手段から与えられた一般文書を語句に分割し、上記ユーザ設定情報管理手段から与えられたユーザ設定情報と、上記語句難易度情報管理手段から与えられた語句の難易度情報と、上記辞書参照頻度情報管理手段から与えられた語句の参照頻度情報と、を入力し、必要な語句に辞書引きリンクタグを付与し、辞書リンク付文書を作成する。
本発明によると、辞書引きリンクタグ付与システムにおいて、上記辞書リンク付文書生成手段は、属する専門分野がユーザ設定情報と一致しており、かつ、難易度がユーザ設定情報以上であり、かつ、参照頻度がユーザ設定情報以上である語句を、辞書引きリンク付与の対象語句とする。
本発明によると、辞書引きリンクタグ付与システムにおいて、上記辞書リンク付文書生成手段は、参照頻度が高くとも難易度が閾値に満たない語句、または、難易度が高くとも参照頻度が閾値に満たない語句は辞書引きリンク付与の対象語句から除外する。
本発明によると、上記辞書引き結果文書生成手段は、上記制御手段から与えられた語句と上記電子辞書装置から与えられたその語句に対する説明記述と、を入力し、辞書引き結果を表す文書を生成する。
本発明によれば、ユーザが文書を参照する際に意味内容の理解を必要としている特定の専門分野に属する語句のみに辞書引きリンクタグを付与することができる効果がある。
本発明によれば、参照頻度は高いがユーザの知識レベルでは意味内容が十分に理解可能な語句に対する辞書引きリンクタグの付与を抑止し、文書への冗長なリンクタグの付与を防ぐことができる効果がある。
本発明によれば、難易度は高いが参照頻度が一定以下である語句に対する辞書引きリンクタグの付与を抑止し、文書への冗長なリンクタグの付与を防ぐことができる効果がある。
図1を参照して本例の辞書引きリンクタグ付与システムを説明する。本例の辞書引きリンクタグ付与システムは、辞書引きリンクタグ付与装置10、ユーザ設定情報管理手段21、語句難易度情報管理手段22、辞書参照頻度情報管理手段23、及び電子辞書装置24、を有する。辞書引きリンクタグ付与装置10は、制御手段11、辞書リンク付文書生成手段12、及び辞書引き結果文書生成手段13を有し、通信ネットワーク2を介してユーザの画面表示入力手段1に接続されている。ここでは、ユーザ設定情報管理手段21、語句難易度情報管理手段22、辞書参照頻度情報管理手段23、及び電子辞書装置24は辞書引きリンクタグ付与装置10とは別個の手段として図示されているが、これらは、辞書引きリンクタグ付与装置10に含まれるように構成してもよい。
画面表示入力手段1は文書の画面表示を行い、ユーザは、画面表示された文書に対してコマンドを入力することができる。文書中のリンクタグが付与された語句は、それがリンクタグが付与された語句であることが判別できるように表示される。
画面表示入力手段1は、HTML文書を表示し、表示したHTML文書に対してユーザの入力を受け取ることができるWebブラウザであってよい。本明細書では、以下に、画面表示入力手段1を、Webブラウザとして説明する。
制御手段11は、画面表示入力手段1から入力されたユーザ設定情報をユーザ設定情報管理手段21に出力し、ユーザ設定情報管理手段21に対してそれを登録させる。制御手段11は、画面表示入力手段1から入力されたユーザが選択した一般文書を辞書リンク付文書生成手段12に出力し、辞書リンク付文書生成手段12に対して、辞書引きリンクタグが付与された文書を作成させる。さらに、制御手段11は、画面表示入力手段1から入力されたユーザが指定した辞書引きリンクタグが付与された語句を辞書引き結果文書生成手段13に出力し、辞書引き結果文書生成手段13に対して辞書引き結果を表す文書を作成させる。さらにまた、制御手段11は、画面表示入力手段1から入力されたユーザの指示に従って、画面表示入力手段1に対して次頁の文書の画面を表示させる。
辞書リンク付文書生成手段12は、制御手段11から与えられた一般文書を語句に分割し、ユーザ設定情報管理手段21から与えられたユーザ設定情報と、語句難易度情報管理手段22から与えられた語句の難易度情報と、辞書参照頻度情報管理手段23から与えられた語句の参照頻度情報と、を入力し、必要な語句に辞書引きリンクタグを付与する。辞書リンク付文書生成手段12によって生成された辞書引きリンクタグ付文書は、画面表示入力手段1によって表示される。
辞書引き結果文書生成手段13は、制御手段11から与えられた語句と電子辞書装置24から与えられたその語句に対する説明記述と、を入力し、辞書引き結果を表す文書を生成する。辞書引き結果文書生成手段13によって生成された辞書引き結果文書は、画面表示入力手段1によって表示される。
ユーザ設定情報管理手段21は、制御手段11の指示により、画面表示入力手段1から入力されたユーザ設定情報を登録する。また、辞書リンク付文書生成手段12からの要求に応じてユーザ設定情報を提供する。ここで、ユーザ設定情報は、辞書引きリンクタグ付与の対象とする語句の絞り込み条件情報として少なくとも、対象とする語句が属する専門分野と、対象とする語句の難易度と、対象とする語句の参照頻度と、を含む。
語句難易度情報管理手段22は、語句難易度情報テーブルを有し、辞書リンク付文書生成手段12からの要求に応じて、語句の難易度情報を提供する。語句難易度情報テーブルは、少なくとも語句と語句が属する専門分野と語句の難易度情報とを含む。語句難易度情報テーブルの例は後に図9を参照して説明する。
辞書参照頻度情報管理手段23は、辞書参照頻度情報テーブルを有し、辞書リンク付文書生成手段12からの要求に応じて、語句の参照頻度情報を提供する。また、電子辞書装置24から与えられる辞書アクセス情報を受け取って参照頻度情報を更新する。辞書参照頻度情報テーブルの例は後に図10を参照して説明する。
ここで、辞書参照頻度情報管理手段23は特開平9−305581等によって既に公知の技術であるため、本例では特に詳細な説明は行わない。
電子辞書装置24は、辞書リンク付文書生成手段12からの要求に応じて語句が辞書に含まれるか否かを表す情報を提供し、辞書引き結果文書生成手段13からの要求に応じて語句に対する説明記述を提供する。また、辞書参照頻度情報管理手段23に対して辞書アクセス情報を提供する。
図2を参照して、制御手段11による処理を説明する。ステップ100にて、制御手段11は画面表示入力手段1から与えられたユーザの入力を取得する。ステップ101にて、ユーザの入力が、ユーザ設定情報管理コマンド、辞書リンク付文書生成コマンド、及び辞書引き結果文書生成コマンドのうちのいずれかのコマンドであるか否かを判定する。
ユーザの入力がコマンドではないと判定すると、言い換えると、ユーザの入力が一般文書の参照要求である場合には、ステップ102に進む。ステップ102にて、制御手段11は、文書を取り出す。ステップ103にて、辞書リンク付文書生成コマンドを起動する。制御手段11は、辞書リンク付文書生成生成手段12から辞書リンク付文書を得る。ステップ103の詳細は後に図4を参照して説明する。
ユーザの入力がコマンドであると判定された場合には、ステップ104に進み、更に、ユーザの入力がユーザ設定情報管理コマンドであるか否かを判定する。
ユーザの入力がユーザ設定情報管理コマンドではないと判定すると、言い換えると、ユーザの入力が辞書引き結果文書生成コマンドの要求である場合には、ステップ105に進む。ステップ105にて、辞書引き結果文書生成コマンドを起動する。制御手段11は、辞書引き結果文書生成手段13から辞書引き結果を表す文書を得る。ステップ105の詳細は後に図6を参照して説明する。
ユーザの入力がユーザ設定情報管理コマンドであると判定すると、ステップ106にて、ユーザ設定情報管理コマンドを起動する。制御手段11は、ユーザ設定情報管理手段21に、ユーザが要求した設定内容を含む入力情報を提供し、ユーザ設定情報を表す文書を得る。ステップ106の詳細は後に図3を参照して説明する。
ステップ107にて、辞書リンク付文書(ステップ103)、辞書引き結果を表す文書(ステップ105)、ユーザ設定情報を表す文書(ステップ106)を画面表示入力手段1へ送信し、処理を終了する。
図3を参照して、ユーザ設定情報管理手段21における処理を説明する。これは、図2のステップ106に相当する。先ず、ステップ200にて、与えられた要求が辞書リンク付文書生成手段12からのユーザ設定情報の取得要求かそれとも制御手段11からのユーザ設定情報の登録要求かを判定する。与えられた要求が辞書リンク付文書生成手段12からのユーザ設定情報の取得要求である場合には、ステップ201に進み、与えられた要求が制御手段11からのユーザ設定情報の登録要求である場合には、ステップ204に進む。
ステップ201にて、ユーザ設定情報管理手段21は、該要求の対象であるユーザ設定情報が記録装置に登録されているか否かを判定する。ユーザ設定情報を登録されていると判断した場合には、ステップ202にて、ユーザ設定情報を呼び出し、それを辞書リンク付文書生成手段12に送信し、処理を終了する。
ユーザ設定情報が登録されていないと判断した場合には、ステップ203にて、最も一般的と考えられる標準のユーザ設定情報を呼び出し、それを辞書リンク付文書生成手段12に送信し、処理を終了する。標準のユーザ設定情報はユーザ設定情報管理手段21が登録しているユーザ設定情報から動的に導き出しても、予め定まった値を用意しておいてもよい。
ステップ204にて、ユーザ設定情報管理手段21は、制御手段11から与えられたユーザ設定情報の内容を記憶装置に登録する。登録するユーザ設定情報には、専門分野、難易度情報及び参照頻度が含まれる。ステップ205にて、登録したユーザ設定情報の内容の画面表示を表す設定結果文書を生成し、それを画面表示入力手段1に出力し、処理を終了する。設定結果文書の例は図11(B)に示す。
図4を参照して辞書リンク付文書生成手段12における処理を説明する。これは図2のステップ103に相当する。ステップ300にて、ユーザ設定情報管理コマンドを起動する。辞書リンク付文書生成手段12は、ユーザ設定情報管理手段21より、ユーザ設定情報の中の専門分野C0、ユーザ設定情報中の難易度情報D0、及びユーザ設定情報中の参照頻度F0を取得する。
本例では、専門分野C0は、辞書引きリンクタグを付与する対象語句が属する専門分野を表し、難易度情報D0は、難易度が少なくともD0以上の語句を辞書引きリンクタグ付与の対象とすることを意味し、参照頻度情報F0は、参照頻度が少なくともF0以上の語句を辞書引きリンクタグ付与の対象とすることを意味する。
次に、ステップ301にて、辞書リンク付文書生成手段12は、与えられた一般文書を語句に分割する。
次に、ステップ302にて、辞書リンク付文書生成手段12は、未処理の語句が存在するか否かを判断する。未処理の語句が存在すると判断した場合には、ステップ303にて、辞書参照頻度情報管理手段23から語句の辞書参照頻度Fを取得する。ステップ304にて、語句難易度情報コマンドを起動して語句の難易度Dを取得する。ステップ304の詳細は後に、図5を参照して説明する。
次に、ステップ305にて、辞書リンク付文書生成手段12は、参照頻度Fが閾値より高いが難易度Dが閾値に満たない、又は、難易度Dが閾値より高いが参照頻度Fが閾値に満たない、場合(以下「閾値不達」と記述する。)であるか否かを判断する。閾値不達と判断した場合には、ステップ308に進み、その語句を辞書引きリンクタグ付与の対象から外し、次の語句に移動する。
本例では、難易度の閾値を、ステップ300で取得したユーザの難易度D0に0より大きく1以下である値Rdを乗じた値とし、参照頻度の閾値を、ステップ300で取得したユーザの参照頻度F0に0より大きく1以下である値Rfを乗じた値としているが、もちろんこれらの閾値は他に自由に設定してよい。
次に、ステップ306にて、辞書リンク付文書生成手段12は、難易度Dがユーザの難易度D0以上である、又は/かつ、参照頻度Fがユーザの参照頻度F0以上である、場合(以下「付与条件を満たす」と記述する。)であるか否かを判断する。付与条件を満たすと判断した場合には、ステップ307に進み、その語句に辞書引きリンクタグを付与し、ステップ308に進む。ステップ306にて、付与条件を満たすと判断しなかった場合には、ステップ308に進む。ステップ308にて、対象を次の語句に移動し、ステップ302に戻る。
ステップ302で、未処理の語句が存在しないと判断した場合には、言い換えると、一般文書中の全ての語句に対して処理を行っていた場合には、辞書リンク付文書生成手段12の処理は終了する。
図5を参照して語句難易度情報管理手段22における処理を説明する。これは、図4のステップ304に相当する。先ず、ステップ400にて、語句難易度情報管理手段22は、辞書リンク付文書生成手段12から与えられた語句が語句難易度情報テーブルに存在するか否かを判断する。語句難易度情報テーブルの例は後に図9を参照して説明する。語句が語句難易度情報テーブルに存在すると判断した場合には、ステップ401に進み、語句が語句難易度情報テーブルに存在しないと判断した場合には、ステップ402に進む。
ステップ401にて、語句難易度情報管理手段22は、その語句の難易度を語句難易度情報テーブルから読み出し、それを辞書リンク付文書生成手段12に出力し、処理を終了する。ステップ402にて、語句難易度情報管理手段22は、難易度の値0を辞書リンク付文書生成手段12に出力し、処理を終了する。
図6を参照して辞書引き結果文書生成手段13における処理を説明する。これは、図2のステップ105に相当する。先ず、ステップ500にて、電子辞書装置24に対して語句有無チェックコマンドを起動し、制御手段11から与えられた語句を電子辞書装置24より検索する。語句有無チェックコマンドの詳細は、後に、図8を参照して説明する。ステップ501にて、語句が電子辞書装置24に存在する場合には、ステップ502に進み、語句が電子辞書装置24に存在しない場合には、ステップ504に進む。ステップ502にて、電子辞書引きコマンドを起動し、語句の記述部分を取得する。ステップ502の詳細は、後に、図7を参照して説明する。ステップ503にて、辞書引き結果を表す文書を生成し、それを画面表示入力手段1に出力し、処理を終了する。
ステップ504にて、エラー画面を表す文書を生成し、それを画面表示入力手段1に出力し、処理を終了する。
図7を参照して電子辞書装置24における語句の記述部分の取得の処理を説明する。ステップ700にて、電子辞書装置24は、辞書引き結果文書生成手段13から与えられた専門分野C0に基づいて電子辞書を取り出し、その電子辞書から語句の記述部分を抽出する。ステップ701にて、電子辞書装置24は、辞書参照頻度情報管理手段23に対して語句の参照頻度カウンタを1増やすよう要求する。ステップ702にて、抽出した語句の記述部分を辞書引き結果文書生成手段13に出力し、処理を終了する。
図8を参照して電子辞書装置24における語句の有無の検索の処理を説明する。ステップ800にて、電子辞書装置24は、辞書引き結果文書生成手段13から与えられた専門分野C0に基づいて電子辞書を取り出し、その電子辞書内に、辞書引き結果文書生成手段13から与えられた語句が存在するか否かを判定する。
語句が存在すると判定した場合には、ステップ801にて、検索成功を辞書引き結果文書生成手段13に出力し、処理を終了する。語句が存在すると判定しなかった場合には、ステップ802にて、検索失敗を辞書引き結果文書生成手段13に出力し、処理を終了する。
図9を参照して語句難易度情報管理手段22が参照する語句難易度情報テーブルの内容を説明する。図9に示す語句はすべて専門分野「医学」に属しており、語句「diagnosis」の難易度情報には「3」が設定されており、語句「influenza」の難易度情報には「2」が設定されており、語句「pneumonia」の難易度情報には「4」が設定されており、語句「cold」の難易度情報に「1」が設定されており、語句「benign tumor」、及び、語句「malignant tumor」の難易度情報には「5」が設定されている。
ここで、本例の語句難易度情報テーブルにおける語句の難易度情報は、最も易しいことを表す難易度を「1」とし、最も難しいことを表す難易度「5」としているが、もちろんこれらの難易度の表し方は自由に設定してよい。
図10を参照して辞書参照頻度情報管理手段23が参照する辞書参照頻度情報テーブルの内容を説明する。図10に示す語句はすべて専門分野「医学」に属しており、語句「diagnosis」の参照頻度には「6」が設定されており、語句「influenza」の参照頻度には「8」が設定されており、語句「pneumonia」の参照頻度には「5」が設定されており、語句「cold」の参照頻度には「10」が設定されており、語句「benign tumor」、及び、語句「malignant tumor」の参照頻度には「2」が設定されている。
ここで、本例の辞書参照頻度情報テーブルにおける語句の参照頻度は、最も高いことを表す参照頻度を「10」とし、最も低いことを表す参照頻度を「1」としているが、もちろんこれらの参照頻度の表し方は自由に設定してよい。
図11及び図12を参照して、画面表示入力手段1に表示されたWebブラウザの画面の例を説明する。図11(A)は、ユーザに対してユーザ設定情報の登録を要求する画面の例である。ユーザは、図2のステップ100にて、この画面からユーザ設定情報管理コマンドを入力する。画面内の「専門分野=「医学」、難易度=4以上、頻度=3以上を対象とする」の部分は、制御手段11へのリンクタグが付されている。このリンクタグには、図2のステップ106のユーザ設定情報コマンドの起動を促すパラメータ、及び、図3のステップ204にて、ユーザ設定情報管理手段21に登録されるユーザ設定情報の内容、即ち、専門分野、難易度情報及び参照頻度が含まれる。ユーザがこのリンクタグ部分を参照することによって、画面表示入力手段1へ入力を与えることができる。
図11(B)は、図3のステップ205にて、ユーザ設定情報管理手段21が生成した設定結果文書を示す画面の例である。
図12(A)は、図2のステップ103及び図4の辞書リンク付文書生成手段12における処理によって生成された辞書引きリンクタグが付与された文書を示す画面の例である。この例では、図9の例と図11の例に対応しており、ユーザが、専門分野を「医学」に、難易度情報を「4」に、設定した場合を示す。図9に示したように、語句の専門分野が「医学」であり、かつ、難易度情報が「4」以上の語句である「pneumonia」と、「benign tumor」と、「malignant tumor」には下線が表示され辞書引きリンクタグが付与されていることを表している。一方で、語句の専門分野が「医学」ではない、または、難易度情報が「4」に満たない語句である「cold」と、「influenza」には下線が表示されず辞書引きリンクタグが付与されていないことを表している。
図12(B)は、図2のステップ105及び図6の辞書引き結果文書生成手段13における処理によって生成された辞書引き結果文書を示す画面の例である。ここでは、図12(A)の辞書引き結果の表示画面にて、ユーザが語句「pneumonia」に対して辞書引き結果の表示要求を入力した場合の表示例である。
以上、本発明の例を説明したが、本発明は上述の例に限定されるものではなく、特許請求の範囲に記載された発明の範囲にて、様々な変形が可能であることは実装者に理解されよう。
本発明による辞書引きリンクタグ付与システムの一実施の形態の構成を示すブロック図である。 本発明による制御手段における処理の流れの例を示す流れ図である。 本発明によるユーザ設定情報管理手段における処理の流れの例を示す流れ図である。 本発明による辞書リンク付文書生成手段における処理の流れの例を示す流れ図である。 本発明による語句難易度情報管理手段における処理の流れの例を示す流れ図である。 本発明による辞書引き結果文書生成手段における処理の流れの例を示す流れ図である。 本発明による電子辞書装置における語句の記述部分を抽出する処理の流れの例を示す流れ図である。 本発明による電子辞書装置における語句の有無を検索する処理の流れの例を示す流れ図である。 本発明による語句難易度情報管理手段にて使用する語句難易度情報テーブルの内容例を示す図である。 本発明による辞書参照頻度情報管理手段にて使用する辞書参照頻度情報テーブルの内容例を示す図である。 本発明による画面表示入力手段の画面表示例を示す図である。 本発明による画面表示入力手段の画面表示例を示す図である。
符号の説明
1…画面表示入力手段、2…通信ネットワーク、10…辞書引きリンクタグ付与装置、11…制御手段、12…辞書リンク付文書生成手段、13…辞書引き結果文書生成手段、21…ユーザ設定情報管理手段、22…語句難易度情報管理手段、23…辞書参照頻度情報管理手段、24…電子辞書装置

Claims (7)

  1. 辞書引きリンクタグ付与の対象とする語句の絞り込み条件情報であるユーザ設定情報をユーザ毎に登録し管理するユーザ設定情報管理手段と、語句及び語句の難易度を含む語句難易度情報を専門分野毎に格納し管理する語句難易度情報管理手段と、語句及び語句の参照頻度を含む辞書参照頻度情報を専門分野毎に格納し管理する辞書参照頻度情報管理手段と、語句及び語句の説明記述を格納し管理する電子辞書装置と、文書中の語句に対して辞書引きの要求を表す辞書引きリンクタグを付与するための辞書リンク付文書生成手段と、上記電子辞書装置から提供された語句の説明記述を使用して辞書引き結果を表す文書を生成するための辞書引き結果文書生成手段と、ユーザが画面表示入力手段を介して入力した情報及び要求に基づいて上記ユーザ設定情報管理手段、上記辞書リンク付文書生成手段、及び上記辞書引き結果文書生成手段を制御する制御手段と、を有し、上記制御手段は、画面表示入力手段から入力されたユーザ設定情報を上記ユーザ設定情報管理手段に登録させ、上記画面表示入力手段から入力されたユーザの要求に基づいて、上記辞書リンク付文書生成手段に対して辞書引きリンクタグが付与された文書を作成させ、上記辞書引き結果文書生成手段に対して辞書引き結果を表す文書を作成させることを特徴とする辞書引きリンクタグ付与システム。
  2. 請求項1記載の辞書引きリンクタグ付与システムにおいて、上記ユーザ設定情報管理手段が登録するユーザ設定情報は、対象とする語句が属する一つ又は複数の専門分野、対象とする語句の難易度、及び、対象とする語句の参照頻度、を含むことを特徴とする辞書引きリンクタグ付与システム。
  3. 請求項1記載の辞書引きリンクタグ付与システムにおいて、上記ユーザ設定情報管理手段は、上記辞書リンク付文書生成手段からの要求に応じてユーザ設定情報を提供することを特徴とする辞書引きリンクタグ付与システム。
  4. 請求項1記載の辞書引きリンクタグ付与システムにおいて、上記辞書リンク付文書生成手段は、上記制御手段から与えられた一般文書を語句に分割し、上記ユーザ設定情報管理手段から与えられたユーザ設定情報と、上記語句難易度情報管理手段から与えられた語句の難易度情報と、上記辞書参照頻度情報管理手段から与えられた語句の参照頻度情報と、を入力し、必要な語句に辞書引きリンクタグを付与し、辞書リンク付文書を作成することを特徴とする辞書引きリンクタグ付与システム。
  5. 請求項4記載の辞書引きリンクタグ付与システムにおいて、上記辞書リンク付文書生成手段は、属する専門分野がユーザ設定情報と一致しており、かつ、難易度がユーザ設定情報以上であり、かつ、参照頻度がユーザ設定情報以上である語句を、辞書引きリンク付与の対象語句とすることを特徴とする辞書引きリンクタグ付与システム。
  6. 請求項4記載の辞書引きリンクタグ付与システムにおいて、上記辞書リンク付文書生成手段は、参照頻度が高くとも難易度が閾値に満たない語句、または、難易度が高くとも参照頻度が閾値に満たない語句は辞書引きリンク付与の対象語句から除外することを特徴とする辞書引きリンクタグ付与システム。
  7. 請求項1記載の辞書引きリンクタグ付与システムにおいて、上記辞書引き結果文書生成手段は、上記制御手段から与えられた語句と上記電子辞書装置から与えられたその語句に対する説明記述と、を入力し、辞書引き結果を表す文書を生成することを特徴とする辞書引きリンクタグ付与システム。

JP2003313161A 2003-09-04 2003-09-04 辞書引きリンクタグ付与システム Pending JP2005084754A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003313161A JP2005084754A (ja) 2003-09-04 2003-09-04 辞書引きリンクタグ付与システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003313161A JP2005084754A (ja) 2003-09-04 2003-09-04 辞書引きリンクタグ付与システム

Publications (1)

Publication Number Publication Date
JP2005084754A true JP2005084754A (ja) 2005-03-31

Family

ID=34414203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003313161A Pending JP2005084754A (ja) 2003-09-04 2003-09-04 辞書引きリンクタグ付与システム

Country Status (1)

Country Link
JP (1) JP2005084754A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016134124A (ja) * 2015-01-22 2016-07-25 パナソニックIpマネジメント株式会社 タグ付与方法、タグ付与装置、プログラム及び質問回答検索方法
WO2020241534A1 (ja) * 2019-05-26 2020-12-03 株式会社医療情報技術研究所 知識管理システム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016134124A (ja) * 2015-01-22 2016-07-25 パナソニックIpマネジメント株式会社 タグ付与方法、タグ付与装置、プログラム及び質問回答検索方法
WO2020241534A1 (ja) * 2019-05-26 2020-12-03 株式会社医療情報技術研究所 知識管理システム
JP2020194520A (ja) * 2019-05-26 2020-12-03 株式会社医療情報技術研究所 知識管理システム
JP2021077382A (ja) * 2019-05-26 2021-05-20 株式会社医療情報技術研究所 知識管理システム
JP7083977B2 (ja) 2019-05-26 2022-06-14 株式会社医療情報技術研究所 知識管理システム

Similar Documents

Publication Publication Date Title
KR102033395B1 (ko) 심층 자연어 질문 분석 기반 구조화된 지식베이스 질의응답 시스템 및 그 방법
US8201086B2 (en) Spellchecking electronic documents
JP6849723B2 (ja) 情報を生成するための方法及び装置
US9122674B1 (en) Use of annotations in statistical machine translation
US20080104579A1 (en) Systems and methods of transforming XML schemas
US11010360B2 (en) Extending tags for information resources
Faria et al. OAEI 2016 results of AML
JP2018097846A (ja) Api学習
US8275779B2 (en) Data tranformations for applications supporting different data formats
US8521739B1 (en) Creation of inferred queries for use as query suggestions
JP2013191046A (ja) 構造化文書管理装置、構造化文書検索方法
US20080077564A1 (en) Document-search supporting apparatus and computer program product therefor
US20190188647A1 (en) Multiple element job classification
US20170235464A1 (en) Computerized Search System Providing Nested Application Card Results
CN111656453A (zh) 用于信息提取的层次实体识别和语义建模框架
US8301647B2 (en) Data tranformations for a source application and multiple target applications supporting different data formats
CN115631261A (zh) 图像生成模型的训练方法、图像生成方法和装置
US20070255697A1 (en) System and method for enhancing source content
JP2005084754A (ja) 辞書引きリンクタグ付与システム
US9275035B2 (en) Method and system to determine part-of-speech
KR102540564B1 (ko) 자연어 처리를 위한 데이터 증강을 위한 방법
JP2024507029A (ja) ウェブページ識別方法、装置、電子機器、媒体およびコンピュータプログラム
JP4435144B2 (ja) データ検索システム及びプログラム
JP6868062B2 (ja) 情報を更新するための方法と装置
US20120159378A1 (en) Methods and systems for suggesting potential inputs in a text-based report generation application