JPH02115974A - 言語検索装置 - Google Patents

言語検索装置

Info

Publication number
JPH02115974A
JPH02115974A JP63268053A JP26805388A JPH02115974A JP H02115974 A JPH02115974 A JP H02115974A JP 63268053 A JP63268053 A JP 63268053A JP 26805388 A JP26805388 A JP 26805388A JP H02115974 A JPH02115974 A JP H02115974A
Authority
JP
Japan
Prior art keywords
japanese
meaning
dictionary
language
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63268053A
Other languages
English (en)
Inventor
Shigeyoshi Takahashi
成佳 高橋
Hiroyuki Kinukawa
博之 絹川
Hideaki Shinohara
篠原 英彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Keiyo Engineering Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Keiyo Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Keiyo Engineering Co Ltd filed Critical Hitachi Ltd
Priority to JP63268053A priority Critical patent/JPH02115974A/ja
Publication of JPH02115974A publication Critical patent/JPH02115974A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は言語検索装置に係り、特に文章作成の際、その
文章に適切な日本語を調べるのに好適な意味指定による
言語検索装置に関する。
〔従来の技術〕
従来、特開昭61−163464号記載のように、画数
の指定で、漢字の読みや意味等を調べる装置が知られて
いる。このような従来の装置は、表記に関する情報から
、日本語を検索するものであり、意味情報から日本語を
検索することはできなかった。
〔発明が解決しようとする課題〕
上記従来技術は、人が文章内容を理解するために利用す
るという立場で考えられており、文章を作成するという
立場での配慮がなされていなかった。このためr〜を意
味する日本語Jを知りたい場合でも、それを調べられな
かった。このため、作成している文章に適する日本語を
知られなければ、他の表現で代用せざるを得なかった。
本発明の目的は、何を意味する日本語かを指定すれば、
該指定の意味をもつ日本語を検索する意味指定日本語検
索装置を提供することにある。
〔課題を解決するための手段〕
上記目的は、検索に用いる日本語意味情報を取得する手
段、該日本語意味情報から検索キーを抽出する手段、該
検索キーで日本語辞書を検索する手段を検索装置に設け
ることで達成される。
〔作用〕
日本語意味情報を取得する手段は、日本語の意味を表現
する情報を単語列の形式で取得する。検索キーを抽出す
る手段では取得した単語列を構成する単語1つ1つに対
し、単語中に非平仮名文字列が存在すれば、該非平仮名
文字列を抽出し検索キーの1つとし、存在しなければ単
語全体を検索キーの1つとする0日本語辞書を検索する
手段は、抽出された検索キーと日本語辞書中の意味格納
フィールドのデータを照合し、検索キーが意味格納フィ
ールドのデータ中に含まれれば、該意味格納フィールド
のデータ、該データに対応する日本語表記、用例を抽出
する。
これにより、意味を入力することで、該意味を持つ日本
語を取出すことができる。
〔実施例〕
以下本発明の実施例を第1図から第18図により説明す
る。
第1図は1本発明を構成する機能ブロックを示すもので
あり、1はキーワード列入力部、2は、検索キー抽出部
、3は日本語辞書、4は日本語辞書検索部、5は日本語
表示順序決定部、6は日本語表示部である。キーワード
列入力部1が起動すると、利用者から、どのような意味
を持つ日本語を検索するかの指定を取得する。該指定は
、日本語の意味をキーワードの列で指定したものである
検索キー抽出部2では、該キーワード列から非平仮名文
字列を抽出し1日本語辞書検索部4で、該文字列を検索
キーとして1日本語辞書5を検索する。検索された日本
語情報には、検索キーと一致した割合の情報も含まれて
おり、この情報を基に、日本語表示順序決定部5で、表
示のための優先順位を決定する0日本語表示部6では、
優先順位の高い日本語から順に表示する。
ここで1本願明細書において、以下の説明で使用する用
語を予め次のとおり定義する。
(1)key  1ine:利用者が入力したキーワー
ド列を格納するエリアの名称、また本キーワード列から
、非平仮名文字列のみを抽出し、格納するエリアの名称
(2)rec:日本語辞書中のルコードを取り出し、格
納するエリアの名称、ここでレコードとは、日本語辞書
において、見出し、読み、意味。
用例を1まとまりとしたデータ。
(3)imi : recに格納したデータから意味を
示すデータを取り出し格納するエリアの名称。
(4)k  rate:key  1ine内に存在す
るキーワード全体数にたいして、その内いつくのキーワ
ードが、imi内のデータに含まれたかを示す値を記憶
するエリアの名称。
(5)i  rats:imi内に存在するキーワード
全体数と、key  1ine内キーワードの中でim
i内に含まれるものの数との割合を示す値を記憶するエ
リア。
(6)dispar:辞書中から取得したレコードで、
条件(実施例に記載)を満足するものにkrate、i
  rateが示す値を付加して、格納するエリアの名
称。
(7)max:最大値記憶エリアの名称。
(8)n:key  1ine内に存在するキーワード
で、文中に存在する個数を記憶するエリアの名称。
(9)rate:割合(実施例に記載)を記憶するエリ
アの名称。
(10)m a x :最大値記憶エリアの名称。
(11)nb:文中の非平仮名文字列の個数を記憶する
エリアの名称。
(12)n:key  1ine内に存在するキーワー
ドで、文中に存在する個数を記憶するエリアの名称。
(13)i:数値記憶エリアの名称。
(14)f l a g :フラグ状態値記憶エリアの
名称。
第2図は、本発明実施例のハードウェア構成であり、7
はプロセッサ、8はキーワード入力装置。
9は表示装置、10は記憶装置であり、プログラム格納
部119日本語辞書格納部3.ワークエリア12で構成
される。
第3図は、キーワード列入力部1の処理内容をPAD(
プログラム アナリシス ダイヤグラム)に示したもの
であり、101は、キーワード列をキーボードから取り
込みキーライン(k e y−1ine)に格納する処
理である。
第4図は、key  1ineの内容であり、T人J、
r住む」、「世界」の3つのキーワードからなるキーワ
ード列である。第4図は第3図に示す処理の出力例であ
る。
第5図は、検索キー抽出部2の処理内容をPADに示し
たものである。検索キー抽出部が起動すると、21で1
(ay  1ineを調べ次のキーワードが存在すれば
22へ分岐し、存在しなければ処理を終了する。22で
は次のキーワードを処理対象にし、23で処理対象とな
ったキーワードに非平板基が含まれているか調べ、含ま
れているならば24へ含まれていなければ21へ分岐す
る。
24ではキーワード中の平仮名を削除し、21へ分岐す
る。
第6図は、第5図の処理において、第4図に示すデータ
が入力された場合の出力を示す。
第7図は日本語辞書3であり、見出し、読み。
意味、用例のフィールドで構成されている6図中では、
[快適」、[下界」等の日本語の格納例を示す。
第8図は、日本語辞書検索部4の処理内容をPADに示
したものである0日本語辞書検索部4が起動すると、4
1でiがOに初期化される。
42では日本語辞書から次のレコードが取り出せるか調
べ、取り出せるならば43へ分岐し取り出せなければ処
理を終了する。ここでレコードとは、日本語辞書中で、
見出し、読み、意味、用例を1まとまりとしたデータで
ある。43では、次のレコードを取り出し、rscに格
納し、44でrecの意味フィールドから意味を取り出
し、imiに格納する。45ではimiとkey  1
ineを入力として、この2つの内容を照合し、k  
rateに照合結果をセットする。k  rateには
keyline内に存在するキーワード全体数にたいし
て、その内いくつのキーワードが、imi内のデータに
含まれたかを示す値がセットされる。
46では再び、imiとkey  1ineの照合が行
なわれる。ここではimi内のキーワード(意味格納フ
ィールドのデータ中の漢字文字列)全体数と、key 
 1ine内キーワードの中で、imi内に含まれるも
のの数との割合を示す値が、i  ratsにセットさ
れる。47では、k−rateとi  rateの値を
調べ1両者共に0でなければ48に分岐し、どちらかが
Oならば、42へ分岐する。48では、dispar[
ilにrecの内容と、k  rate、i  rat
eの内容を格納し、49でiを1つカウントアツプし、
42へ分岐する。
第9図は、disparの内容であり、第8図の処理に
おいて、第6図のデータが入力された場合の出力をしめ
す。
第10図は第8図における44のimiの内容例であり
、第11図の入力例である。
第11図は、第8図における45のimiとkey  
1ineの照合1の処理内容をPADに示したものであ
る1本処理が起動すると、451でmaxが0に初期化
される。452では、 imi内に次の文があれば45
3へ分岐し、なければ458へ分岐する。ここでimi
内の文とは1゜までの文字列のことである。第10図を
例にすれば、「仏教で人が死んでから生まれ変わり住む
世界」、「未来の世界」が文である。453では、im
i内の次の文を参照し、454でkey−1ins内い
くつのキーワードが文中に存在するか調べ、この数をn
に記憶する。455ではkaylina内の全キーワー
ド数とnとの割合を求め、rataに記憶する。456
ではm a xとrateの値を比較し、rateの方
が大きければ457へ分岐し、大きくなければ452へ
分岐する。457ではrateの値をmaxに代入し、
452へ分岐する。458ではk  rateにm a
 xの値を代入し処理を終了する。
第12図はlc  rateの値を示し、第11図の処
理において、第6図と第10図に示すデータが入力され
た場合の出力を示す。
第13図は、第8図における46のimiとkey  
1ineの照合2の処理内容をPADに示したものであ
る1本処理が起動すると、461でmaXの値が0に初
期化される。462では。
imi内に次の文があれば、463へ分岐し、な番)れ
ば469へ分岐する。463ではimi内の次の文を参
照する。464では、文中の非平仮名文字列の個数をn
bに記憶する。例えば、「仏教で人が死んでから生まれ
変わり住む世界」という場合は、nb=6となる。46
5ではkey−1ine内のキーワードのうち文中に存
在するものが何個あるか調べ、この個数をnに記憶する
466では、nとnbの割合を求めrateに記憶する
。467でrateがm a xよりも大きければ46
8へ分岐し、大きくなければ462へ分岐する。468
ではmaxにrateを代入し462へ分岐する。46
9ではi  rateにmaxを代入し処理を終了する
6 第14図はi  rataの種を示し、第13図の処理
において、第6図と第10図に示すデータが入力された
場合の出力を示す。
第15図は、第1図の日本語表示順序決定部5の処理内
容をPADに示したものである。51ではdispar
内の各レコードをk  rateとi  rateのエ
リアに着眼してソートする。この時、先ずk  rat
aに着眼してソートし、krateの値が同じ場合は、
i  rateに着眼してソートする。
第16図はソート済みのdisparの内容であり、第
15図の出力例である。これは第9図の入力例に対応し
たものである。
第17図は第1図の日本語表示部6の処理内容をPAD
に示したものである。日本語表示部6が起動すると、6
1でiの値が0に初期化され。
62でフラグ(f l a g)がOFFに初期化され
る。63ではdispar[ilに情報があり、fla
gがOFFならば64へ分岐し、そうでなければ処理を
終了する。64ではdispar[ilに記憶された情
報を1つ表示し、65でiをカウントアツプし、66で
キーボードから指示を取得し、キー人力が終了か判定し
く67)、終了ならば68へ分岐し、終了でなければ6
3へ分岐する。68では、flagをONにし63へ分
岐する。
第18図は、第17図において、第16図に示すデータ
が入力された場合の出方であり1表示装置に表示された
例である。
以上実施例について詳述した。
本実施例によれば1日本語辞書は、本意味指定日本語検
索装置から独立して記憶できるので1日本語表記と意味
のみの表示であれば、既存の計算機処理用の辞書を用い
ることができ、新規に作成する必要がないという効果が
ある。
本発明は上記実施例以外に次のような利用方法も可能で
ある。
例えば自然言語処理システムを本発明のフロントエンド
として組み込むことで、入力形式をキーワード列としな
いで、自然語により意味指定できる。これは、自然言語
処理システムにより入力自然語文からキーワード列を得
ることで可能となる。
また本発明は、日本語のみではなく他の言語についても
利用できる。即ち辞書のデータを外国語のデータに変更
し、人力キーワード列も外国語で入力することで可能と
なる。
〔発明の効果〕
本発明によれば5文章作成の際、r〜を意味する日本語
」を知りたい場合は、その意味を入力することで、該意
味を持つ日本語を簡単に検索できるので、文章作成が容
易になるという効果がある。
【図面の簡単な説明】
第1図は、本発明の一実施例の装置の機能ブロック図、
第2図は本発明の一実施例のハードウェア構成を示すブ
ロック図、第3図は、キーワード列入力部のPAD、第
4図は、入カキーワード列例、第5図は、検索キー抽出
部のPAD、第6図は、検索キー列、第7図は日本語辞
書格納形式の説明図、第8図は日本語辞書検索部のPA
D、第9図は、第8図の出力例でありdisparの内
容を示す図、第10図は、imiの内容例、第11図は
、imiとkey  1ineの照合1の処理内容のP
AD、第12図は、第11図の出力例であり、k  r
ateの内容を示した図、第13図は、imiとkey
  1ineの照合2の処理内容のPAD、第14図は
、第13図の出力例であり、i  rateの内容を示
した図、第15図は、日本語表示順序決定部のPAD、
第16図は、第15図の出力例であり、disparの
内容を示す図、第17図は、日本語表示部のPAD。 第18図は1日本語の表示例を示す図である。 1・・・キーワード列入力部、2・・・検索キー抽出部
。 3・・・日本語辞書、4・・・日本語辞書検索部、5・
・・8第1図 第2図 第3図 第4図 key 1ine: [BIEロー1 第6図 key 1ine: m 第9図 第7図 第12図 k rate :巨万] i rate :口万]

Claims (1)

  1. 【特許請求の範囲】 1、日本語表記にたいして定義されている意味を基に、
    日本語辞書に格納された日本語表記を検索する手段を有
    することを特徴とする言語検索装置。 2、文字表記と該文字表記に対応した付帯情報を格納し
    た記憶媒体中から、付帯情報を基に文字表記を検索する
    手段を有することを特徴とする言語検索装置。 3、特許請求範囲第1項記載の手段は、日本語表記の意
    味情報を単語列(キーワード列)の形式で表現し入力す
    るステップ、入力された単語列中に非平仮名文字列が存
    在すれば該単語列から非平仮名文字列を抽出し、存在し
    なければ該単語列から平仮名文字列を抽出するステップ
    、抽出された文字列を検索キーとして、該検索キーと日
    本語辞書の意味格納フィールドのデータとを照合するス
    テップを有することを特徴とする言語検索装置。 4、特許請求範囲第3項記載の日本語辞書は、日本語表
    記に対応して、該日本語表記の持つ意味、該日本語表記
    の用例を付加して格納してあることを特徴とする言語検
    索装置。 5、特許請求範囲第3項記載の検索キーと日本語辞書中
    の意味格納フィールドのデータとの照合において、意味
    格納フィールドのデータ中の非平仮名文字列の総数を計
    算し、該総数と、検索キーの中で意味格納フィールド中
    に含まれるものの数との割合を求め、この割合により日
    本語表記の表示順序を決定することを特徴とする言語検
    索装置。 6、特許請求範囲第3項記載の検索キーと日本語辞書中
    の意味格納フィールドのデータとの照合において、検索
    キー全体数と、意味格納フィールド中のデータに含まれ
    る検索キーの数との割合を求め、この割合により日本語
    表記の表示順序を決定することを特徴とする言語検索装
    置。 7、外国語表記と、該外国語表記に定義された意味を対
    応させて記憶した電子辞書中から、外国語表記を、該外
    国語表記にたいして定義されている意味を基に、検索す
    る手段を有する装置。 8、日本語表記にたいして用例情報を対応付けて記憶し
    た電子化された日本語辞書。 9、日本語辞書は、日本語表記入力欄、日本語の意味入
    力欄、日本語の用例入力欄を持つエディタで生成するこ
    とを特徴とする辞書作成法。
JP63268053A 1988-10-26 1988-10-26 言語検索装置 Pending JPH02115974A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63268053A JPH02115974A (ja) 1988-10-26 1988-10-26 言語検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63268053A JPH02115974A (ja) 1988-10-26 1988-10-26 言語検索装置

Publications (1)

Publication Number Publication Date
JPH02115974A true JPH02115974A (ja) 1990-04-27

Family

ID=17453228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63268053A Pending JPH02115974A (ja) 1988-10-26 1988-10-26 言語検索装置

Country Status (1)

Country Link
JP (1) JPH02115974A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152781A (ja) * 1993-11-30 1995-06-16 Canon Inc 文書処理方法とその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152781A (ja) * 1993-11-30 1995-06-16 Canon Inc 文書処理方法とその装置

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3691844B2 (ja) 文書処理方法
JP3408291B2 (ja) 辞書作成支援装置
JPH09259140A (ja) 情報検索方法、情報検索装置及び情報検索プログラムを格納する媒体
JPH03172966A (ja) 類似文書検索装置
JP2669601B2 (ja) 情報検索方法及びシステム
US20040267737A1 (en) Database search system
JPH0484271A (ja) 文書内情報検索装置
JPH09198395A (ja) 文書検索装置
JPH0778183A (ja) デ−タベ−ス検索システム
JPH02115974A (ja) 言語検索装置
JPS61248160A (ja) 文書情報登録方式
JP3758241B2 (ja) 音声情報検索装置
JP2005158044A (ja) 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置
JPH09101969A (ja) 適合フィードバックを用いた全文検索方法および装置
JP3187671B2 (ja) 電子辞書表示装置
JPH0944521A (ja) インデックス作成装置および文書検索装置
JPH09101951A (ja) 文書検索装置
JPH04290158A (ja) 文書作成装置
JPS61184676A (ja) 仮名漢字変換方式
JPH0954781A (ja) 文書検索システム
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JPS61184674A (ja) 仮名漢字変換方式
JPH03130873A (ja) テキストベースの検索方式
JPH0721212A (ja) 文書処理装置