JPH0969109A - 文書検索方法及び文書検索装置 - Google Patents

文書検索方法及び文書検索装置

Info

Publication number
JPH0969109A
JPH0969109A JP7223064A JP22306495A JPH0969109A JP H0969109 A JPH0969109 A JP H0969109A JP 7223064 A JP7223064 A JP 7223064A JP 22306495 A JP22306495 A JP 22306495A JP H0969109 A JPH0969109 A JP H0969109A
Authority
JP
Japan
Prior art keywords
phonetic character
keyword
character string
phonetic
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7223064A
Other languages
English (en)
Inventor
Naohide Kubota
直秀 久保田
Isamu Iwai
勇 岩井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP7223064A priority Critical patent/JPH0969109A/ja
Publication of JPH0969109A publication Critical patent/JPH0969109A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は、一方の言語の表音文字から他言語の
表音文字を生成し、これから得られる表音文字列を検索
キーワードとして、より高度な検索を容易に行うことの
できる文書検索方法、及び文書検索装置を提供すること
を目的とする。 【構成】入力装置1と、テーブル2、制御装置3、外部
記憶装置4、及び表示装置5とを備え、制御装置3は入
力装置1からの入力キーワード情報から置換対象となる
表音文字列を抽出し、例えば内部表音コード表を用いて
音節等の単位に分割し、表音文字対応表を用いて分割さ
れた単位で他言語の表音文字列に置換し、新たな検索キ
ーワードを作成する。これにより、例えばカタカナ表記
のキーワード情報からアルファベット表記のキーワード
情報を自動生成することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、検索キーワードに基づ
いて文書検索を行うものに於いて、一方の言語の表音文
字から他言語の表音文字を生成し、これを検索対象とし
た場合での文書検索方法と、その方法を用いた文書検索
装置に関する。
【0002】
【従来の技術】従来より、任意のキーワードを用いて文
書検索を行うフルテキストサーチ方式の文書検索装置が
提供されている。このような文書検索装置に於いては、
外来語を検索対象とした際には、人手によりカタカナか
ら当該外国語の綴を調べてキーワードを指定することが
あるものであった。
【0003】例えば、外来語「コンパチブル」を検索す
る際、検索キーワードとして、カタカナ「コンパチブ
ル」とアルファベット「compatible」を指定
するものである。この場合、ユーザ自身が外国語辞書を
引くなりして「compatible」の綴を調べる
か、又は「コンパチブル」と「compatible」
いう単語を1対1で対応させたような辞書ファイルを、
予め文書検索装置中に用意しておくものである。
【0004】前者の方式は、綴を調べる為の時間もかか
るし、入力誤りも発生し易い。一方、後者の方式では、
文書検索装置中に上記辞書ファイルを格納しておく必要
があるものであった。
【0005】
【発明が解決しようとする課題】上述したように、従
来、外来語を検索対象とした際には、ユーザ自身が一方
の言語の文字列から、他言語の綴を調べて文字列を毎回
入力するか、或いは夫々の単語について、一方と他方の
言語の文字列を対応させた辞書を、予め文書検索装置中
に用意する方法がとられていた。この為、外国語の綴を
調べる方式では、綴を調べる為の時間がかかる他、入力
誤りから文書検索が正しく行われないという危険もあっ
た。
【0006】一方、辞書を文書検索装置中に用意する方
式では、文書検索装置のファイル資源をより多く必要と
する問題があった。本発明は上記事情を考慮して成され
たもので、上記不具合を解消し、近年、より多くのカタ
カナ或いはアルファベットによる外来語が日常語として
使われている現状を踏まえ、一方の言語の表音文字(例
えばカタカナ)から、他言語の表音文字(例えばアルフ
ァベット)を生成し、これから得られる表音文字列を検
索キーワードとして、より高度な検索を容易に行うこと
のできる文書検索方法、及び文書検索装置を提供するこ
とを目的とする。
【0007】
【課題を解決するための手段】本発明は、上記目的を達
成する為、一方の言語の表音文字列に対して、他言語の
表音文字列を対応づけた表音文字対応表を用いて、入力
したキーワード情報に含まれる表音文字列を、表音文字
対応表に記載されている音節や接頭辞等の単位にて、一
方の言語から他言語の表音文字列へ置換し、新たに自動
生成した表音文字列を有するキーワード情報に基づいて
文書検索処理を行うようにしたことを特徴とする文書検
索方法にある。
【0008】又、本発明は上記目的を達成する為、上記
文書検索方法にあって、音節等の単位での表音文字列置
換に於いて、日本語のひらがなやカタカナ或いは韓国語
のハングル等の母音と子音を分けない表音文字を用いる
言語から、欧州言語等の母音と子音を分ける表音文字を
用いる言語の表音文字へ置換する場合、前記母音と子音
を分けない表音文字を、一度、母音と子音へ分けた内部
表音コードによる表記へ変換してから他言語の表音文字
列へ置換することにある。
【0009】更に、本発明は上記目的を達成する為、上
記文書検索方法にあって、一方の言語の表音文字列から
他言語の表音文字列への置換を行う際、通常の音節単位
の置換では正しい置換が行われないことが既に分かって
いる場合、一方の表音文字列の単語に対して、他言語の
表音文字列の単語を対応付けた構造を持つ例外情報表を
用い、音節単位の置換では得られない表音文字列を一括
置換することにある。
【0010】更に、本発明は上記目的を達成する為、上
記文書検索方法にあって、一方の言語の表音文字列か
ら、他言語の表音文字列が複数生成された場合、自動生
成した表音文字列を表示し、当該表示中から選択した新
たなキーワード情報を作成することにある。
【0011】更に、本発明は上記目的を達成する為、上
記文書検索方法にあって、他言語の表音文字列が複数生
成された場合、自動生成された表音文字列の綴が正しい
かどうかを調べる為に用意した表音文字列を格納したス
ペリングチェックテーブルを用いて、スペリングチェッ
クテーブルに存在する表音文字列を新たなキーワード情
報として用い、選択を省略可能としたことにある。
【0012】更に、本発明は上記目的を達成する為、キ
ーワード情報を入力する為の入力手段と、この入力手段
によって入力されたキーワード情報から置換対象となる
表音文字列を抽出するキーワード分割手段と、このキー
ワード分割手段によって得られた表音文字列を他方の言
語の表音文字列へ置換するキーワード置換手段と、この
キーワード置換手段によって生成された他言語の表音文
字列を有する新たな検索条件式を生成する検索条件生成
手段と、この検索条件生成手段によって作成された検索
条件式に基づき、文書検索を行う検索手段と、この文書
検索手段によって得られた検索結果を表示する表示手段
とを具備したことを特徴とする文書検索装置にある。
【0013】更に、本発明は上記目的を達成する為、上
記文書検索装置にあって、キーワード情報から置換対象
となる表音文字列を抽出した際カタカナ等の母音と子音
を分けない表音文字を用いる言語から欧州言語等の母音
と子音を分けている表音文字を用いる言語の表音文字へ
の置換を行う場合、キーワード分割手段は母音と子音を
分ける表音文字列を一度母音と子音へ分けた内部表音コ
ード表記に変換し、キーワード置換手段は上記キーワー
ド分割手段によって得られた内部表音コード表記の表音
文字列に対して表音文字列の置換を行うことにある。
【0014】更に、本発明は上記目的を達成する為、上
記文書検索装置にあって、キーワード置換手段は表音文
字列の置換を行う際に通常の音節単位の置換では正しい
置換が行われないことが既に分かっている場合、一方の
表音文字列の単語に対して、他言語の表音文字列の単語
を対応付けた構造を持つ例外情報表を用いて、音節単位
の置換では得られない表音文字列を一括置換することに
ある。
【0015】更に、本発明は上記目的を達成する為、上
記文書検索装置にあって、キーワード置換手段によって
一方の言語の表音文字列から自動生成した他言語表音文
字列を表示する場合の表示手段と、必要な表音文字列を
選択させる為のキーワード選択手段とを有し、検索条件
生成手段は上記キーワード選択手段により選択された表
音文字列を有する検索条件式を作成することにある。
【0016】更に、本発明は上記目的を達成する為、上
記文書検索装置にあって、キーワード選択手段は他言語
の表音文字列が複数生成された場合自動生成された表音
文字列の綴が正しいかどうかを調べる為に用意したスペ
リングチェックテーブルを用いてスぺリングチェックテ
ーブルに存在する表音文字列を新たなキーワード情報と
して用い、選択を省略することも可能としたことにあ
る。
【0017】
【作用】上記構成によれば、入力されたキーワード情報
から置換対象となる表音文字列を抽出し、例えば内部表
音コード表を用いて音節等の単位に分割し、表音文字対
応表を用いて分割された単位で他言語の表音文字列に置
換し、新たな検索キーワードを作成する。これにより、
例えばカタカナ表記のキーワード情報から、アルファベ
ット表記のキーワード情報を自動生成することができ
る。又、カタカナ表記の検索キーワードを入力していた
時と比べて、特に指定していなければ検索漏れとなって
いたアルファベット表記の検索キーワードの検索が行え
るので、検索効率が向上を図られる。
【0018】又、通常の音節単位の置換では正しい置換
が行われない単語が既にわかっているとき、例外情報表
を用いて表音文字列を一括置換することができる。例え
ば、発音と綴のことなるような単語「ブーケ」と「bo
uquet」や、和製英語「ナイター」と「night
game」の置換を行うことができる。
【0019】更に、表音文字列が(同音異義語として)
複数個自動生成されても、ユーザが任意の表音文字列を
選択することで、不要な表音文字列を検索キーワードか
ら除くことができる。例えば、「シー」という検索キー
ワードから、「she」、「see」、「sea」が自
動生成された場合でも、ユーザがいづれか任意の表音文
字列を選択することができる。
【0020】又、更に、実際には存在しない綴の表音文
字列が自動生成されても、スペリングチェックテーブル
を用いることで、正しい表音文字列のみを検索キーワー
ドとすることができる。例えば、「サスピション」とい
う検索キーワードから、「suspicion」と「s
uspition」が自動生成されたとき、スペリング
チェック表に「suspicion」が存在すればこれ
を正しい綴の単語として、キーワード情報として用い、
ユーザ選択を省略することができる。
【0021】
【実施例】本発明の概要は、次の通りである。本発明
は、入力されたキーワード情報を音節などの単位に分割
し、この分割した単位に他言語の表音文字列に置換して
得られた新たなキーワード情報に基いて文書検索処理を
行うものである。
【0022】又、上記表音文字列は、母音と子音を分け
ない表音文字を用いる言語から、母音と子音を分ける表
音文字を用いる言語の表音文字へ置換する場合、母音と
子音を分けない表音文字を、一度、母音と子音へ分けた
表記等に置換してから、他言語の表音文字列を生成し文
書検索処理で用いるようにしたものである。
【0023】又、上記表音文字列は、一方の言語の表音
文字列から他言語の表音文字列への置換を行う際、通常
の音節単位の置換では正しい置換が行われないことが既
にわかっているとき、例外情報を用いて表音文字列を置
換し文書検索処理で用いるようにしたものである。
【0024】又、上記表音文字列は、一方の言語の表音
文字列から、他言語の表音文字列が複数生成された場
合、これを表示し、その中からユーザが選択して新たな
キーワード情報として、文書検索処理で用いるようにし
たものである。
【0025】又、上記表音文字列は、他言語の表音文字
列が複数生成された場合、スペリングチェック表を用い
て、スぺリングチェック表に存在する表音文字列を新た
なキーワード情報として用い、ユーザ選択を省略し、文
書検索処理で用いるようにしたものである。
【0026】上記構成によれば、入力されたキーワード
情報から置換対象となる表音文字列を抽出し、例えば内
部表音コード表を用いて音節等の単位に分割し、表音文
字対応表を用いて分割された単位で他言語の表音文字列
に置換し、新たな検索キーワードを作成する。これによ
り、例えばカタカナ表記のキーワード情報から、アルフ
ァベット表記のキーワード情報を自動生成することがで
きる。又、カタカナ表記の検索キーワードを入力してい
た時と比べて、特に指定していなければ検索漏れとなっ
ていたアルファベット表記の検索キーワードの検索が行
えるので、検索効率が向上を図れる。又、通常の音節単
位の置換では正しい置換が行われない単語が既にわかっ
ているとき、例外情報表を用いて表音文字列を一括置換
することができる。例えば、発音と綴のことなるような
単語「ブーケ」と「bouquet」や、和製英語「ナ
イター」と「night game」の置換を行うこと
ができる。更に、表音文字列が(同音異義語として)複
数個自動生成されても、ユーザが任意の表音文字列を選
択することで、不要な表音文字列を検索キーワードから
除くことができる。例えば、「シー」という検索キーワ
ードから、「she」、「see」、「sea」が自動
生成された場合でも、ユーザがいづれか任意の表音文字
列を選択することができる。又、更に、実際には存在し
ない綴の表音文字列が自動生成されても、スペリングチ
ェックテーブルを用いることで、正しい表音文字列のみ
を検索キーワードとすることができる。例えば、「サス
ピション」という検索キーワードから、「suspic
ion」と「suspition」が自動生成されたと
き、スペリングチェック表に「suspicion」が
存在すればこれを正しい綴の単語として、キーワード情
報として用い、ユーザ選択を省略することができる。
【0027】以下、図面を参照して本発明の一実施例を
説明する。図1は、本発明の一実施例に係わる文書検索
装置の構成を示すブロック図である。
【0028】本装置は、ユーザがキーボードやマウス等
によって検索キーワードを入力したり検索操作を行う為
の入力装置1、図2に示す内部表音コード表21、例外
情報表22、表音文字対応表23、スペリングチェック
表24(対応する言語毎に21A、21Bのように複数
用意することも可)を格納したテーブル2、CPU及び
メモリから構成されている制御装置3、検索対象文書の
データを格納する外部記憶装置4、検索結果及び検索に
よって文書の内容を表示する表示装置5とから構成され
る。
【0029】制御装置3は、制御部300と、2つの処
理ブロック、文書検索処理ブロック310と、キーワー
ド生成ブロック320及びバッファ部330とから構成
されている。
【0030】制御部300は、本装置全体の制御を司る
ものであり、例えば各処理部の動作制御や、これらの間
でのデータ転送等を行うものである。全体の文書検索処
理ブロック310は、外部記憶装置4に格納されている
文書の検索を行うもので、図2に示すように、システム
初期部311、キーワード入力部312、検索条件生成
部313、検索部314、及び表示部315から成るも
のである。
【0031】システム初期部311は、文書検索に関し
て、検索の実施に必要なシステムの初期化を行う。キー
ワード入力部312は、検索キーワードとなる文字列を
キーワード入力バッファ331に格納するものである。
【0032】検索条件生成部313は、ユーザの選択に
よって、キーワード選択バッファ334に格納された表
音文字列を用いて検索条件式を作成し、検索条件生成バ
ッファ335へ格納する。
【0033】検索部314は、検索条件格納バッファ3
35に格納された検索条件式に従って、外部記憶装置4
に格納されている検索対象文書から該当する文書の検索
を行うものである。
【0034】表示部315は、検索キーワードを入力す
るための画面(キーワード入力画面)や検索結果等を表
示装置5に表示する。又、キーワード生成ブロック32
0は、テーブル2を参照して、入力した検索キーワード
から表音文字列を生成するものであり、ここでは図2に
示すように、キーワード分割部321、キーワード置換
部322、キーワード選択部323を有するものであ
る。
【0035】キーワード分割部321は、キーワード入
力バッファ331に格納された検索キーワードから、置
換対象となる表音文字列(例えばカタカナのみ)を抽出
し、分割付加情報(図11参照)等を付与して、キーワ
ード分割バッファ332に格納する。
【0036】キーワード置換部322は、キーワード分
割バッファ332に格納された、分割付加情報等を付与
された検索キーワード中の表音文字列を、表音文字対応
表23を参照して、可能性のある他言語の表音文字列へ
置換し、キーワード置換バッファ333に格納する。
【0037】キーワード選択部323は、キーワード置
換バッファ333に格納されている自動生成された任意
の検索キーワードを表示装置3に表示し、ユーザに選択
させ、キーワード選択バッファ334へ格納するもので
ある。
【0038】又、バッファ部330は、本装置の検索処
理に必要な各種情報を記憶する為のものであり、ここで
は、図2に示すようにキーワード入力バッファ331、
キーワード分割バッファ332、キーワード置換バッフ
ァ333、キーワード選択バッファ334、検索条件生
成バッファ335、生成方式指定バッファ336を有す
る。
【0039】又、テーブル2は、図2に示すように内部
表音コード表21、例外情報表22、表音文字対応表2
3、スペリングチェック表24から成るものである。内
部表音コード表21は、図6に示すように、置換対象と
なる一方の言語の表音文字(この例ではJ語、カタカ
ナ)に対して、内部表音コード表記(この例ではカタカ
ナのローマ字に似た表記)を対応付けた構造を持つ。内
部表音コード表21は、表音文字対応表23の情報量を
軽減する為に用意されるもので、必ずしも必要なもので
はない。内部表音コード表21に「ラ:la」「マ:l
a」といった情報を記載しておくことで、スペリングチ
ェック表24へは「able」のみの情報だけで、「l
able:ラブル」「mable:マブル」のような類
似した情報を省くことができる。
【0040】例外情報表22は、図7に示すように、音
節単位の置換では得られない単語について、一方の表音
文字列(この例ではJ語)の単語に対して、他言語の表
音文字列(この例ではA語)の単語で対応付けた構造を
持つ。例外情報表22には、例えば「ブーケ」と「bo
uquet」といった情報が記載されている。
【0041】表音文字対応表23は、図8(a)に示す
ように、表音文字列を音節や接頭辞等の単位で、一方の
言語から他言語の表音文字列へ置換する為に用いる表
で、一方の言語の表音文字列(この例ではJ語)の文字
列に対して、他言語の表音文字列(この例ではA語)の
文字列を対応付けた構造を持つ。
【0042】スペリングチェック表24は、図9に示す
ように、置換後の生成された表音文字列の綴が正しいか
どうかを調べる為に用意した表音文字列(この例ではA
語の単語)が登録されている。
【0043】尚、表音文字は表意文字に対する意の言葉
の定義で、夫々の文字は音を表しているものである。日
本語では表音文字はひらがな・カタカナを指し、表意文
字は漢字を指す。アルファベットは表音文字と言える。
【0044】次に、本実施例の動作を説明する。先ず、
本装置の全体の処理動作を説明する。図3は、同実施例
に於ける検索処理の動作を示すフローチャートである。
【0045】先ず、システムが起動されると、システム
初期部311は、バッファ部330内の各バッファをク
リアする等、検索に必要な各種の初期化処理を行う(ス
テップS1)。又、ユーザが任意の言語を指定する場合
は、生成方式指定フラグ336(図15参照)に置換方
法を格納しておく(この例では、J語からA語へ置換す
ることを示している)。
【0046】ここでは、図16(a)に示すような文書
検索の為のキーワード画面を、表示部315を介して表
示装置5に表示する。この検索キーワード入力画面は、
ユーザが検索キーワードを入力する為の入力行と、自動
生成された検索条件式が表示される検索条件式表示行
と、この検索によって得られた文書の回答件数を表示す
る行を有している。
【0047】検索キーワード入力画面が表示されると、
検索キーワードが入力可能となる。この状態で、ユーザ
は入力装置1により検索キーワード(この例では、「コ
ンパチブル」)を入力する。この時、入力された検索キ
ーワードはキーワード入力部312を介して図16
(b)に示すように入力され、キーワード入力バッファ
331(図10)に格納される(ステップS2)。
【0048】次に、制御部300によりキーワード分割
部321が起動される。キーワード分割部321は、キ
ーワード入力バッファ331に格納された検索キーワー
ドから、置換対象となる表音文字列(例えばカタカナの
み)を抽出し、分割付加情報等を付与して、キーワード
分割バッファ332(図11参照)に格納する(ステッ
プS3)。
【0049】検索キーワード中の置換対象の表音文字が
分割付加情報等で分割され、キーワード分割バッファ3
32に格納されると、キーワード置換部322が起動す
る。キーワード置換部322は、キーワード分割バッフ
ァ332に格納された分割付加情報等を付与された検索
キーワード中の表音文字列を、表音文字対応表23を参
照して、可能性のある他言語の表音文字列へ置換し、キ
ーワード置換バッファ333に格納する(ステップS
4)。
【0050】ステップS4の処理が終了すると、キーワ
ード選択部323が起動される。キーワード選択部32
3は、キーワード置換バッファ333に格納されている
自動生成された表音文字列を表示装置5に図17(a)
に示すように表示し、ユーザに選択させ、キーワード選
択バッファ334へ格納する(ステップS5)。
【0051】ステップS5の処理が終了すると、検索条
件生成部313が起動される。検索条件生成部313
は、キーワード選択バッファ334に格納されたユーザ
によって選択された表音文字列を含んだ検索条件式を作
成し、検索条件生成バッファ335へ格納する。この
時、作成された検索条件式は図18(a)に示すように
表示される(ステップS6)。
【0052】ステップS6の処理が終了すると、検索部
314が起動される。検索部314は、検索条件格納バ
ッファ335に格納された検索条件式に従って、外部記
憶装置4に格納されている検索対象文書から該当する文
書の検索を行う(ステップS7)。
【0053】ステップS7の処理が終了すると、表示部
315が起動される。表示部315は、検索部314に
よって得られた文書検索結果(図18)を表示装置5に
出力する(ステップS8)。
【0054】ここで、更に検索を継続する場合には(ス
テップS9のYes)、ステップS2へ制御を戻し、新
たな検索キーワード入力を受けて文書の検索を行う。次
に、上記ステップS3のキーワード分割処理、ステップ
S4のキーワード置換処理、ステップS5のキーワード
選択処理について具体的に説明する。
【0055】図4(a)はステップS3のキーワード分
割処理を示すフロチャートである。入力装置1からキー
ワード入力部312を介して、例えば「コンパチブル」
といった検索キーワードが入力されると、その検索キー
ワードはキーワード入力バッファ331(図10)に格
納される。
【0056】制御部300によりキーワード分割部32
1が起動される。キーワード分割部321は、キーワー
ド入力バッファ331に格納された検索キーワードか
ら、生成方式指定フラグ336で指定された置換対象と
なる表音文字列(例えばカタカナ文字列)を抽出する
(ステップS31)。
【0057】ここで、置換対象となる表音文字列が抽出
されれば(ステップS31のある)、キーワード分割部
321は、又、その表音文字列が例外情報表22に含ま
れているか否かを調べる(ステップS32)。
【0058】又、置換対象となる表音文字列が抽出され
なかった(ステップS31のない)場合、キーワード入
力バッファ331の内容をキーワード選択バッファ33
4へ内容を移し、ステップS61へ制御を移す(ステッ
プS34)。
【0059】次に、キーワード分割部321は、抽出し
た表音文字列が例外情報表22に含まれている場合(ス
テップS32のYes)、例外情報表22を参照して抽
出した表音文字列を他国語の表音文字列に置換した上、
例外付加情報を付与し、キーワード分割バッファ332
へ格納する。図10の「ばらのブーケ」といった例で
は、ステップS35によって、図11にある「ばらの
《bouquet》」といった結果が得られる(ステッ
プS35)。
【0060】又、置換対象となる表音文字列が例外情報
表22に含まれない(ステップS32のNo)とき、内
部表音コード表21を参照して、抽出した表音文字列を
内部表音コード表記(ローマ字に似た表記)に置換した
上、分割付加情報を付与し、キーワード分割バッファ3
32へ格納する。図10にある「コンパチブル」といっ
た例では、ステップS35によって、図11にある「<
konpatiburu>」といった結果が得られる
(ステップS33)。
【0061】次に、上記ステップS4のキーワード置換
処理が実行される(図4(b))。キーワード分割バッ
ファ332に表音文字列が格納されると、キーワード置
換部が322が起動される。キーワード置換部322
は、キーワード分割バッファ332から分割付加情報が
付与された表音文字列を取り出すものである(ステップ
S41)。
【0062】次に、キーワード置換部322は表音文字
対応表23を参照し、分割付加情報が付与された表音文
字列を、音節や接頭辞等の単位で、可能性のある幾通り
かの他言語の表音文字列へ置換し、キーワード置換バッ
ファ333へ格納する。図11にある「<konpat
iburu>」といった例では、ステップS42によっ
て、図12にある「compatible」と「con
patible」のような結果が得られる(ステップS
42)。
【0063】更に、キーワード置換部322は、キーワ
ード置換バッファ333に新たに生成された表音文字列
について、スペリングチェック表24を参照し、スペリ
ングチェック表と一致する表音文字列に置換付与情報
(図12)を付与し、キーワード置換バッファ333へ
追記する。この置換付与情報は、自動生成された表音文
字列の綴が正しいか否かの判断に利用できる(ステップ
S43)。
【0064】次に、上記ステップS5のキーワード選択
処理が実行される(図5(a))。キーワード置換バッ
ファ333へ任意の表音文字列が格納されると、キーワ
ード選択部323が起動される。キーワード選択部32
3は、キーワード置換バッファ333に格納された表音
文字列を抽出する(ステップS51)。
【0065】キーワード選択部323は、又、抽出され
た表音文字列に付与された置換付加情報が1個以上付与
されているか否かを調べる(ステップS52)。ここ
で、置換付加情報が1個以上付与されている場合(ステ
ップS52のYes)、キーワード選択部323は、表
示部315を介して表示装置5に表音文字選択画面(図
17参照)を表示し、キーワード置換バッファ333に
格納された置換付加情報を付与された表音文字列を表示
する(ステップS56)。
【0066】又、置換付加情報が付与されていない場合
(ステップS52のNo)、キーワード選択部323
は、表示部315を介して表示装置5に表音文字選択画
面(図17参照)を表示し、キーワード置換バッファ3
33に格納された全ての表音文字列を表示する(ステッ
プS53)。
【0067】ユーザは、この活用語選択画面から検索条
件式生成に必要な単語を選択できる。画面が表示された
初期段階では、当該各ボックスには、いずれも選択状態
をあらわすたとえば「レ点」が表示されている。このボ
ックスの表示状態では、例えばマウス操作により当該ボ
ックスを位置指定してクリックする毎にオン/オフされ
る。図17(b)の例では、「sea」が選択されたも
のとする。又、ステップS43で付与された置換付加情
報を付与された表音文字列が1個のみのとき、ユーザに
よる選択を省略することもできる(ステップS54)。
【0068】キーワード選択部323は、又、ユーザに
より選択された表音文字列をキーワード選択バッファ3
34(図13)に格納する(ステップS55)。検索条
件生成部313は、ステップS55で選択された表音文
字列に基いて検索条件式を作成し(ステップS61)、
これを検索条件生成バッファ335へ格納する(図1
4)(ステップS62)。
【0069】このようにして、例えば検索キーワードと
して「コンパチブル」を入力すると、その検索キーワー
ドから表音文字列「compatible」が生成され
る。これにより、図18(c)に示すように、今迄は検
索キーワードとして「コンパチブル」のみ指定していた
場合、アルファベット「compatible」といっ
たキーワードは別途指定する必要があったが、「コンパ
チブル」というキーワードだけで任意の言語による表記
の検索が可能となる。その結果、より高度な検索が容易
に行える。
【0070】
【発明の効果】以上詳述したように本発明によれば、入
力された検索キーワードから表音文字列を取り出し、音
節等の単位に分割して、音節等の単位毎に他言語の表音
文字に置換し、新たな表音文字を自動生成することによ
り、辞書を用意してシステム資源を消費することなく、
又、検索キーワードを入力する上でユーザに負担をかけ
ることなく、より高度な検索を容易に行えるという優れ
た効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる文書検索装置の構成
を示すブロック図。
【図2】同実施例に係わり図1に示す制御装置の内部構
成を示すブロック図。
【図3】同実施例に於ける検索処理の動作を示すフロー
チャート。
【図4】上記図3に示すステップS3及びステップS4
の具体的な処理を示すフローチャート。
【図5】上記図3に示すステップS5及びステップS6
の具体的な処理を示すフローチャート。
【図6】同実施例に於ける内部表音コード表の構成を示
す図。
【図7】同実施例に於ける例外情報表の構成を示す図。
【図8】同実施例に於ける表音文字対応表の構成を示す
図。
【図9】同実施例に於けるスペリングチェック表の構成
を示す図。
【図10】同実施例に於けるキーワード入力バッファの
内容を示す図。
【図11】同実施例に於けるキーワード分割バッファの
内容を示す図。
【図12】同実施例に於けるキーワード置換バッファの
内容を示す図。
【図13】同実施例に於けるキーワード選択バッファの
内容を示す図。
【図14】同実施例に於ける検索条件生成バッファの内
容を示す図。
【図15】同実施例に於ける生成方式指定フラグの内容
を示す図。
【図16】同実施例に於けるキーワード入力画面を示す
図。
【図17】同実施例に於ける表音文字選択画面を示す
図。
【図18】同実施例に於ける検索画面を示す図。

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 一方の言語の表音文字列に対して、他言
    語の表音文字列を対応づけた表音文字対応表を用いて、
    入力したキーワード情報に含まれる表音文字列を、表音
    文字対応表に記載されている音節や接頭辞等の単位に
    て、一方の言語から他言語の表音文字列へ置換し、 新たに自動生成した表音文字列を有するキーワード情報
    に基づいて文書検索処理を行うようにしたことを特徴と
    する文書検索方法。
  2. 【請求項2】 音節等の単位での表音文字列置換に於い
    て、 日本語のひらがなやカタカナ或いは韓国語のハングル等
    の母音と子音を分けない表音文字を用いる言語から、欧
    州言語等の母音と子音を分ける表音文字を用いる言語の
    表音文字へ置換する場合、 前記母音と子音を分けない表音文字を、一度、母音と子
    音へ分けた内部表音コードによる表記へ変換してから他
    言語の表音文字列へ置換することを特徴とする請求項1
    記載の文書検索方法。
  3. 【請求項3】 一方の言語の表音文字列から他言語の表
    音文字列への置換を行う際、通常の音節単位の置換では
    正しい置換が行われないことが既に分かっている場合、 一方の表音文字列の単語に対して、他言語の表音文字列
    の単語を対応付けた構造を持つ例外情報表を用いて、音
    節単位の置換では得られない表音文字列を一括置換する
    ことを特徴とする請求項1記載の文書検索方法。
  4. 【請求項4】 一方の言語の表音文字列から、他言語の
    表音文字列が複数生成された場合、自動生成した表音文
    字列を表示し、 当該表示中から選択した新たなキーワード情報を作成す
    ることを特徴とする請求項1記載の文書検索方法。
  5. 【請求項5】 他言語の表音文字列が複数生成された場
    合、自動生成された表音文字列の綴が正しいかどうかを
    調べる為に用意した表音文字列を格納したスペリングチ
    ェックテーブルを用いて、スペリングチェックテーブル
    に存在する表音文字列を新たなキーワード情報として用
    い、 選択を省略可能としたことを特徴とする請求項1記載の
    文書検索方法。
  6. 【請求項6】 キーワード情報を入力する為の入力手段
    と、 この入力手段によって入力されたキーワード情報から、
    置換対象となる表音文字列を抽出するキーワード分割手
    段と、 このキーワード分割手段によって得られた表音文字列
    を、他方の言語の表音文字列へ置換するキーワード置換
    手段と、 このキーワード置換手段によって生成された他言語の表
    音文字列を有する新たな検索条件式を生成する検索条件
    生成手段と、 この検索条件生成手段によって作成された検索条件式に
    基づき、文書検索を行う検索手段と、 この文書検索手段によって得られた検索結果を表示する
    表示手段とを具備したことを特徴とする文書検索装置。
  7. 【請求項7】 キーワード情報から、置換対象となる表
    音文字列を抽出した際、カタカナ等の母音と子音を分け
    ない表音文字を用いる言語から、欧州言語等の母音と子
    音を分けている表音文字を用いる言語の表音文字への置
    換を行う場合、 キーワード分割手段は、母音と子音を分ける表音文字列
    を、一度母音と子音へ分けた内部表音コード表記に変換
    し、 キーワード置換手段は、上記キーワード分割手段によっ
    て得られた内部表音コード表記の表音文字列に対して、
    表音文字列の置換を行うことを特徴とする請求項6記載
    の文書検索装置。
  8. 【請求項8】 キーワード置換手段は、表音文字列の置
    換を行う際に、通常の音節単位の置換では正しい置換が
    行われないことが既に分かっている場合、 一方の表音文字列の単語に対して、他言語の表音文字列
    の単語を対応付けた構造を持つ例外情報表を用いて、音
    節単位の置換では得られない表音文字列を一括置換する
    ことを特徴とする請求項6記載の文書検索装置。
  9. 【請求項9】 キーワード置換手段によって、一方の言
    語の表音文字列から自動生成した他言語表音文字列を表
    示する場合の表示手段と、 必要な表音文字列を選択させる為のキーワード選択手段
    とを有し、 検索条件生成手段は、上記キーワード選択手段により選
    択された表音文字列を有する検索条件式を作成すること
    を特徴とする請求項6記載の文書検索装置。
  10. 【請求項10】 キーワード選択手段は、他言語の表音
    文字列が複数生成された場合、自動生成された表音文字
    列の綴が正しいかどうかを調べる為に用意したスペリン
    グチェックテーブルを用いて、スぺリングチェックテー
    ブルに存在する表音文字列を新たなキーワード情報とし
    て用い、 選択を省略することも可能としたことを特徴とする請求
    項6記載の文書検索装置。
JP7223064A 1995-08-31 1995-08-31 文書検索方法及び文書検索装置 Pending JPH0969109A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7223064A JPH0969109A (ja) 1995-08-31 1995-08-31 文書検索方法及び文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7223064A JPH0969109A (ja) 1995-08-31 1995-08-31 文書検索方法及び文書検索装置

Publications (1)

Publication Number Publication Date
JPH0969109A true JPH0969109A (ja) 1997-03-11

Family

ID=16792269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7223064A Pending JPH0969109A (ja) 1995-08-31 1995-08-31 文書検索方法及び文書検索装置

Country Status (1)

Country Link
JP (1) JPH0969109A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331519A (ja) * 2000-05-19 2001-11-30 Matsushita Electric Ind Co Ltd ローマ字表記による書誌情報検索装置及び方法並びに書誌情報検索プログラムを記録した記録媒体
JP2007193166A (ja) * 2006-01-20 2007-08-02 Kenwood Corp 対話装置、対話方法及びプログラム
US7339104B2 (en) 2001-04-17 2008-03-04 Kabushiki Kaisha Kenwood System for transferring information on attribute of, for example, CD
JP2009223895A (ja) * 2008-03-14 2009-10-01 Nhn Corp 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2011129159A (ja) * 2008-03-14 2011-06-30 Nhn Corp 日本語の単字入力を支援する機能を提供する方法及びシステム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001331519A (ja) * 2000-05-19 2001-11-30 Matsushita Electric Ind Co Ltd ローマ字表記による書誌情報検索装置及び方法並びに書誌情報検索プログラムを記録した記録媒体
US7339104B2 (en) 2001-04-17 2008-03-04 Kabushiki Kaisha Kenwood System for transferring information on attribute of, for example, CD
JP2007193166A (ja) * 2006-01-20 2007-08-02 Kenwood Corp 対話装置、対話方法及びプログラム
JP2009223895A (ja) * 2008-03-14 2009-10-01 Nhn Corp 日本語辞書サービスにおいて2単語以上のクエリー、ハングルクエリーまたは一般的なクエリーの入力の際の検索結果を提供するための方法及びシステム
JP2011129159A (ja) * 2008-03-14 2011-06-30 Nhn Corp 日本語の単字入力を支援する機能を提供する方法及びシステム

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
WO2005116863A1 (en) A character display system
JPH0969109A (ja) 文書検索方法及び文書検索装置
JP2007317163A (ja) 電子辞書及び検索方法
JP7102710B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
JP3364976B2 (ja) 中国語学習装置
JP2005011078A (ja) 類似単語検索装置、この方法、このプログラム、このプログラムを記録した記録媒体、および情報検索システム
JP3758241B2 (ja) 音声情報検索装置
KR101777141B1 (ko) 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
KR102016805B1 (ko) 평면 배열 기반 중국어 사전 제공 방법 및 그 장치
JP2010009294A (ja) 電子機器および電子機器の表示方法
JP7095264B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
CN104615269A (zh) 一种藏文拉丁全简双拼编码方案及其智能输入系统
JP2004206659A (ja) 読み情報決定方法及び装置及びプログラム
JP3048793B2 (ja) 文字変換装置
JP2009098328A (ja) 音声合成装置及び方法
Schafer Novel probabilistic finite-state transducers for cognate and transliteration modeling
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
Selfridge-Field The" Maeftro di Mufica", or Quality Control in the Virtual Library1
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JP2005258637A (ja) 対訳語抽出装置、及び対訳語抽出プログラム
JP2000330998A (ja) 発音電子辞書
Snae et al. A Framework for an Ontology-Driven Multi-Lingual Transcription System with IPA Representation