JP3013388B2 - Linguistic information retrieval device - Google Patents

Linguistic information retrieval device

Info

Publication number
JP3013388B2
JP3013388B2 JP2110322A JP11032290A JP3013388B2 JP 3013388 B2 JP3013388 B2 JP 3013388B2 JP 2110322 A JP2110322 A JP 2110322A JP 11032290 A JP11032290 A JP 11032290A JP 3013388 B2 JP3013388 B2 JP 3013388B2
Authority
JP
Japan
Prior art keywords
search
partial
display
whole
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2110322A
Other languages
Japanese (ja)
Other versions
JPH0410058A (en
Inventor
忠信 宮内
義文 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2110322A priority Critical patent/JP3013388B2/en
Publication of JPH0410058A publication Critical patent/JPH0410058A/en
Application granted granted Critical
Publication of JP3013388B2 publication Critical patent/JP3013388B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

〔産業上の利用分野〕 本発明は言語情報の検索装置に係り、特に言語情報が
持つ固有の特性,すなわち言語情報の種々の属性を検索
の指示キー(検索キー)として言語情報の部分および全
体を任意に検索するように構成した言語情報検索装置に
関する。 〔従来の技術〕 文書を構成する言語情報を電子化,すなわち情報処理
装置の記憶手段に電子的な言語情報として置き換えて入
力しておき、これを新たな文書の生成に利用したり、公
衆通信ネツトワークやLAN等の情報処理ネツトワークを
介して送受信する電子文書処理技術が実用化されるよう
になった。 この種の電子文書処理装置としての卑近な例が一般家
庭にも高い普及率を上げているワードプロセッサ(ワー
プロ)やパーソナルコンピユータ(パソコン)であり、
企業等におけるオフィスオートメーションの1手段とし
てのワークステーションである。 従来のこの種の文書処理装置においては、文書を単に
電子化しただけであり、電子化した文書を利用して新た
な文書をつくるなど、電子文書の再利用性に乏しいもの
であった。 そこで、上記のような再利用性等の電子化の利点を活
かすためのアプローチとして、言語情報を詳細な属性に
分解して構造化することが考えられた。 電子化した言語情報を、その固有の特性である種々の
毒性に分解したレコードとしたデータベースを構築し、
上記種々の属性を検索キーとして言語情報の検索を行う
場合、従来では、例えば特公昭59−865号公報に開示さ
れている電子式翻訳装置のように、第1言語の属性とし
てのその単語の読みまたは例文となる文書と、これに対
応する意味をもつ第2言語を属性としてその単語または
例文となる文章との組をレコードとしたデータベースを
記憶しておき、第1言語または第2言語の一方の単語を
翻訳の検索キーとして入力して、対応する第2言語また
第1言語の単語あるいは例文を表示手段に表示するよう
にしたものが一般的である。 〔発明が解決しようとする課題〕 上記のような構造化された電子文書を扱うためには、
従来と異なるユーザインターフエースが必要になる。例
えば、オブジェクト指向プラグラミング環境として知ら
れている「Smalltalk−80」(商標名)(Adele Goldber
g,“Smalltalk−80,The interactive programming envi
ronment",Addison Wesley,1984)におけるインスペクタ
は、インスタンス変数の名前のリストが示されるリスト
メニューと選択された変数の値を表示するテキストビュ
ーの2つの部分からなるインターフエースで、言語情報
に限られるものではないが、オブジェクトの構造の参
照,変更などに不可欠のユーザインターフエースであ
る。 しかし、1つのインスペクタでは1つの変数またはオ
ブジェクト自体の情報しか得られず、言語情報全体の関
係を参照した上で1つの変数を変更するというような、
上記言語情報等のテキストとしての「全体」の情報とそ
れを構成している「部分」の情報という観点から同時に
利用することまでは想定されていない。 本発明は、言語情報を、構造化された「部分」の情報
およびテキストとしての「全体」の情報との両観点から
捉えることにより、両者の利点を組み合わせて同時に提
供するユーザインターフエースを実現し、電子化された
言語情報を効果的に利用できるようにすることを目的と
する。 〔課題を解決するための手段〕 上記目的は、言語情報をその属性毎に分解したレコー
ドとして記憶する記憶手段と、記憶手段に記憶されたレ
コードのうち、指示された属性に関する詳細を表示する
部分表示手段と、記憶手段に記憶されたレコードに関す
る複数の属性をフラットなテキストとしてその全体を表
示する全体表示手段と、記憶手段に記憶されたレコード
を、その属性単位に検索する部分検索手段と、記憶手段
に記憶されたレコード全体の関連を基に検索する全体検
索手段と、および上記部分検索手段および全体検索手段
に検索の指示を行う部分検索指示手段と全体検索指示手
段とを備え、上記全体検索指示手段、全体表示手段、部
分検索指示手段および部分表示手段は、同時に表示され
るユーザインタフェースを構成していることによって達
成される。 [作用] 検索指示手段から入力した検索キーにより検索された
結果を通常の辞書と同様のフラットなテキストとしての
全体表示と、当該検索キーに関連した項目の階層的構造
を示す部分表示とを同時に表示することで、両表示に基
づく以降の検索を効率よく実行することができる。 [実施例] 以下、本発明の実施例を図面を参照して説明する。 第1図は本発明による言語情報検索装置の1実施例の
構成を示すブロツク図であって、1は記憶手段、2は文
字入力手段、3は全体検索指示手段、4は全体表示手
段、5は部分検索指示手段、6は部分表示手段である。 同図において、文字入力手段2は後述する検索キーの
指示入力機能と共に、データベース構築時のレコード作
成/登録機能を有する。 まず、データベース構築時に、入力された言語情報
を、たとえば読み,発音,表記,意味,品詞,例文など
の各種の属性に分解し、これらを木構造などの階層構造
からなるレコードとして記憶手段1に登録する。このよ
うに、言語情報をその属性に分解したレコードとして記
憶手段1に登録することでデータベースを構築する。 また、全体検索指示手段3と全体表示手段4、および
部分検索指示手段5と部分表示手段6はユーザインター
フエースを構成し、共通の表示手段(ビュー)に提示さ
れる。 ユーザはこのユーザインターフエースを用い、その全
体検索指示手段3または部分検索指示手段5から所望の
検査キーを入力する。この検索キーの入力に応じて検索
された結果を、表示手段上の全体表示手段4と部分表示
手段6に同時に表示し、ユーザに提示する。 ユーザはこの提示に基づいて、以降の検索作業を実行
する。 第2図は英和電子辞書検索システムを例とした言語の
構造化レコードの説明図であって、見出し語に対応する
辞書の項目(言語の属性)を構造化したレコードを示
す。 同図において、21は単語、22は見出し語、23は見出し
表記、24と25は見出し表記23として登録する2つの異な
る表記(ColorとColour)、26は単語の重要度のランク
で、これは重要度が「2」27であることを示している。 28は発音、29は発音記号、30は発音記号29として登録
するの発音表記、31は発音記号のカタカナ表記、32はそ
のカタカナの発音表記(カラー)、33は当該単語21が持
つ品詞で、34は第1品詞、35は品詞名で、第1品詞が名
詞36であることを示す。また、37は第1品詞34の語義
で、語義37には第1義38と第2義45があることを示して
おり、第1義38についてはその対訳39として「色」40と
「色彩」41があることを示し、また第1義38の例文42と
して英文42とその対訳44が示されている。これらの例文
42と対訳44には実際の例文となる文章、およびその実際
の対訳が以降に構造化されている。そして、第2義45に
は対訳46があり、その実際の語として「絵の具」47が設
けられている。 第2品詞48には品詞名49として「他」(他動詞)50
が、また語義51として第1義52、その対訳53、対訳53の
実際の例文として「色をぬる」54が構造化されている。
なお、第3品詞,第4品詞,....が有る場合は、上記と
同様に構造化するが、図示および説明は省略する。 このように構造化したレコードを第1図の記憶手段1
に順次格納してデータベースを構築する。 一般に、電子化外国語辞書の各項目は単純なルールに
従って簡潔に記述されているので、その項目の構造化は
容易である。 なお、記憶手段1には、この外にシソーラスを登録し
てある。このシソーラスは本来はキーワードを限定する
ために作られた辞書であるが、検索システムにおいては
検索効率を上げるため限定したキーワードの外にその上
位概念や下位概念,関連語,あるいは同義語,反義語な
どを記述したものであり、上記の構造化データベースを
用いて作成することもできる。 第3図は上記した電子辞書のデータベース登録手順の
一例の説明図であり、(a)はその処理動作のフローチ
ヤート、(b)は1単語形式の説明図である。1単語形
式は、図示のように、見出し語,空白,発音記号,空
白,品詞,空白,....のような配列からなる。以下この
フローチヤートを参照しながらデータベース登録処理動
作を説明する。 まず、第1図の文字入力手段2はデータベース構築の
基となる原辞書ファイルから1単語毎に読み込みを行
い、(b)に示した形式の1単語毎のデータストリーム
(以下、単にストリーム:STという)を生成し(S1)、
これを記憶手段1の単語レコード領域にSTの先頭からそ
の空白(NULL)までを見出し語として格納する(S2)。 そして、STの次の文字が発音記号の表記である‘[’
であるか否かを判断し(S3)、YESなら(b)に示
す‘]’までを発音記号として格納し(S7)S4に行く。 S3においてNOであれば、STの次の文字が品詞記号
(‘
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a linguistic information search apparatus, and more particularly, to a part and a whole of linguistic information using a characteristic characteristic of the linguistic information, that is, various attributes of the linguistic information as a search instruction key (search key). The present invention relates to a language information search device configured to arbitrarily search for. [Prior Art] The linguistic information constituting a document is digitized, that is, replaced as electronic linguistic information in a storage means of an information processing apparatus and input, and the linguistic information is used for generating a new document, or is used for public communication. 2. Description of the Related Art Electronic document processing technology for transmitting and receiving data via an information processing network such as a network or a LAN has come into practical use. Word processors (word processors) and personal computers (personal computers), which have become very popular in ordinary households, are common examples of this type of electronic document processing device.
This is a workstation as one means of office automation in a company or the like. In a conventional document processing apparatus of this type, the document is simply digitized, and the reusability of the electronic document is poor, such as creating a new document using the digitized document. Therefore, as an approach for taking advantage of the digitization such as reusability as described above, it has been considered that linguistic information is decomposed into detailed attributes and structured. Construct a database that converts the digitized linguistic information into records that are decomposed into various toxicities that are unique characteristics,
When linguistic information is searched using the above various attributes as search keys, conventionally, for example, as in an electronic translation device disclosed in Japanese Patent Publication No. 59-865, the word of the word as an attribute of the first language is used. A database in which a set of a document to be read or an example sentence and a word or an example sentence having a second language having a corresponding meaning as an attribute is stored is stored, and a database of a first language or a second language is stored. Generally, one of the words is input as a search key for translation, and the corresponding second language or first language word or example sentence is displayed on the display means. [Problems to be solved by the invention] In order to handle a structured electronic document as described above,
A different user interface is required. For example, "Smalltalk-80" (trade name) known as an object-oriented programming environment (Adele Goldber
g, “Smalltalk-80, The interactive programming envi
The inspector in ronment ", Addison Wesley, 1984) is a two-part interface, limited to linguistic information, a list menu showing a list of instance variable names and a text view showing the value of the selected variable. This is not a user interface, but it is an indispensable user interface for referencing and changing the structure of an object, etc. However, one inspector can only obtain information on one variable or the object itself, and refers to the relationship between all language information. Like changing one variable with
It is not envisaged to use the “whole” information as a text such as the language information and the “parts” constituting the text at the same time. The present invention realizes a user interface that simultaneously provides linguistic information by combining the advantages of both, by capturing linguistic information from structured “part” information and “whole” information as text. Another object of the present invention is to make it possible to use digitized language information effectively. [Means for Solving the Problems] The object is to provide a storage unit that stores linguistic information as a record decomposed for each attribute, and a part of the record stored in the storage unit that displays details about the specified attribute. Display means, an entire display means for displaying a plurality of attributes relating to the records stored in the storage means as flat text as a whole, and a partial search means for searching the records stored in the storage means for each attribute unit; An overall search means for performing a search based on the relation of the entire record stored in the storage means; a partial search instruction means for instructing the partial search means and the overall search means to perform a search; The search instruction means, the whole display means, the partial search instruction means and the partial display means constitute a simultaneously displayed user interface. Achieved by [Operation] At the same time, the entire display of the search result obtained by the search key input from the search instruction means as flat text similar to a normal dictionary and the partial display showing the hierarchical structure of items related to the search key are simultaneously performed. By displaying, the subsequent search based on both displays can be executed efficiently. [Example] Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of an embodiment of a linguistic information search apparatus according to the present invention, wherein 1 is a storage means, 2 is a character input means, 3 is a whole search instruction means, 4 is a whole display means, 5 Is a partial search instructing means, and 6 is a partial display means. In FIG. 1, a character input means 2 has a record creation / registration function when constructing a database, in addition to a search key instruction input function described later. First, when constructing a database, the input linguistic information is decomposed into various attributes such as reading, pronunciation, notation, meaning, part of speech, and example sentences, and these are stored in the storage means 1 as records having a hierarchical structure such as a tree structure. register. In this way, a database is constructed by registering the language information in the storage unit 1 as a record decomposed into its attributes. The whole search instruction means 3 and the whole display means 4 and the partial search instruction means 5 and the partial display means 6 constitute a user interface, and are presented on a common display means (view). Using this user interface, the user inputs a desired inspection key from the entire search instruction means 3 or the partial search instruction means 5. The result searched according to the input of the search key is simultaneously displayed on the whole display means 4 and the partial display means 6 on the display means and presented to the user. The user performs subsequent search work based on this presentation. FIG. 2 is an explanatory diagram of a structured record of a language using an English-Japanese electronic dictionary search system as an example, and shows a record in which dictionary items (language attributes) corresponding to headwords are structured. In the figure, 21 is a word, 22 is a headword, 23 is a heading notation, 24 and 25 are two different notations (Color and Color) registered as heading notation 23, 26 is a word importance rank, and This indicates that the importance is “2” 27. 28 is pronunciation, 29 is phonetic symbol, 30 is phonetic notation registered as phonetic symbol 29, 31 is phonetic symbol katakana notation, 32 is katakana phonetic notation (color), 33 is the part of speech of the word 21, 34 is a first part of speech, 35 is a part of speech name, and indicates that the first part of speech is a noun 36. 37 indicates the meaning of the first part of speech 34, and indicates that the meaning 37 has a first meaning 38 and a second meaning 45, and the first meaning 38 has a translation 39 as “color” 40 and “color”. 41, and an English sentence 42 and its translation 44 are shown as an example sentence 42 of the first definition 38. These example sentences
In the text 42 and the translation 44, the actual example sentences and the actual translation are structured in the following. In the second definition 45, there is a translation 46, and "paint" 47 is provided as an actual word. "Other" (transitive verb) 50 as the part of speech name 49 in the second part of speech 48
However, a first meaning 52 as a meaning 51, a translation 53 thereof, and a "coloring" 54 as an actual example sentence of the translation 53 are structured.
If there is a third part-of-speech, a fourth part-of-speech,..., It is structured in the same manner as above, but illustration and description are omitted. The record structured as described above is stored in the storage unit 1 shown in FIG.
Is stored sequentially to build a database. Generally, since each item of the electronic foreign language dictionary is described simply according to simple rules, the structure of the item is easy. In addition, a thesaurus is registered in the storage means 1 in addition to the above. This thesaurus is originally a dictionary created to limit keywords, but in a search system, in order to improve search efficiency, in addition to the limited keywords, its superordinate concepts and subordinate concepts, related words, or synonyms, antonyms, etc. And can be created using the above structured database. FIG. 3 is an explanatory view of an example of the above-mentioned electronic dictionary database registration procedure. FIG. 3 (a) is a flowchart of the processing operation, and FIG. 3 (b) is an explanatory view of a one-word format. The one-word format is composed of an array such as a headword, a blank, a phonetic symbol, a blank, a part of speech, a blank,... Hereinafter, the database registration processing operation will be described with reference to this flowchart. First, the character input means 2 shown in FIG. 1 reads word by word from an original dictionary file on which a database is built, and outputs a word-by-word data stream of the format shown in FIG. Is generated (S1),
This is stored in the word record area of the storage means 1 from the head of ST to its blank (NULL) as a headword (S2). Then, the next character after ST is the phonetic symbol notation '['
Is determined (S3). If YES, up to "]" shown in (b) is stored as phonetic symbols (S7), and the procedure goes to S4. If NO in S3, the next character after ST is the part-of-speech symbol ('

【’,‘】’)であるかどうかを判断し(S4)、YE
SであればSTの次の品詞記号または改行記号までを品詞
項目として格納し(S8)、S4に戻る。またNOのときは改
行記号がくるから当該単語のSTは終了であるので、上記
の見出しをキーとして分解した属性をもつレコードとし
て記憶手段に登録する(S5)。 これを繰り返して(S6のYes→S1→・・)原辞書から
生成したすべてのSTを基にしたレコードからなるデータ
ベースを構築する。 上記のようにして生成されたデータベースを用いて辞
書引き(辞書検索)を行う場合、利用者は文字入力手段
2から検索キーを与え、順次求める単語を検索する。 第4図と第5図は本発明のユーザインターフエースの
具体例の説明図であって、このユーザインターフエース
としてのビューにおいて、33は全体検索指示部、34は全
体表示部、35は部分検索指示部、36は部分表示部、37は
入力表示部、38は前後サーチボタン、39はカーソルであ
る。これら全体検索指示部33,全体表示部34,部分検索指
示部35,部分表示部36は、前記第1図の全体検索指示手
段3,全体表示手段4,部分検索指示手段5,部分表示手段6
の動作に関連する表示である。 このように、本実施例では、“表示部/指示部”とい
うユーザに見える部分は全て同一表示(同一ビュー)内
に統合されており、検索結果が通常の辞書のようなフラ
ットなテキストと、階層的な構造を反映した部分表示と
が同時に提示される。 同図において、部分表示部36に提示されている部分表
示は、入力表示部37に表示されている見出し語(choos
e)に関して、部分表示部36にハッチングを施して示さ
れている第2番目の品詞(品詞2)に関する例文,その
英文の表示例である。すなわち、部分表示部36に提示さ
れた表示内容は、全体表示部34に提示された第2番目の
品詞である他動詞(他)について検索された結果が提示
されているものである。 このように、ある見出し語に関する言語情報がテキス
ト全体と項目別の部分の両方を同時に提示すべく表示さ
れるため、ユーザは検索結果の全体と部分とを辞書利用
の状況に応じて使い分けでき、この電子英和辞書を効率
よく利用できる。 まず、全体的な表記レベルで視覚的に見たい場合は、
提示された表示内容についてその全体表示をざっと見た
うえで全体検索を行う。 ここでいう全体検索とは、利用者が着目する属性を意
識することなく関連する単語を検索する機能であり、
「概念検索」と「表記検索」とがある。「概念検索」は
類義語や対義語あるいは同語源の単語を次々と検索する
機能であり、記憶手段に格納されたシソーラスを参照し
ておこなわれる。このシソーラスは本来はキーワードを
限定するために作られた辞書であるが、検索システムに
おいては検索効率を上げるため限定したキーワードの外
にその上位概念や下位概念,関連語,あるいは同義語,
反義語などを記述したものである。 例えば、“choose"の場合、類語として“select"“el
ect"“desire"が、品詞形として“choice"が検索され
る。 表記検索は、類似つづり,疑似発音,熟語などを表記
レベルで似通ったものを検索する機能であり、“choos
e"の場合は類似つづりとして“cheese"が、類似発音と
して“Tuesday"などが検索される。実際の検索は、検索
システム側で自動的に発音や意味の属性を組み合わせて
検索することにより行われるが、ユーザには意識されな
い。また、全ての情報を表示すると煩雑になることがあ
るので、そのような場合は「表示レベル」を指定するこ
とにより、品詞と対訳表示のみ、などの簡易表示に切り
換えるようにすることもできる。 検索結果に対するユーザの意図が明確で、どの属性を
利用したいかが分かっている場合は部分検索を行う。例
えば第4図に示されたように、特定の品詞に関する例文
を検索したい場合や、成句のみをまとめて見たい場合な
どに適する。 さらに、求めた属性から孫引きを行うこともできる。
第4図において、例文中の“carefully"の意味が分から
ない場合、同図の部分表示部36の例文中の“carefully"
をカーソル39で選択して部分検索指示部35で検索を指示
すれば、第5図に示したように“carefully"が検索さ
れ、全体表示部34に検索結果が提示される。全体検索の
場合でも同様であるが、表示部(表示手段の全体ビュ
ー)中の表示単語に関する検索を行っても、以前に入力
表示部37に入力した元の単語は常時記憶されているた
め、複数項目の候補を含めて、入力した検索キーとして
の単語を、前後サーチボタン38により瞬時にサーチでき
るため、同じ単語を何度も検索するといった無駄な操作
を要しない。 さらに、全体表示により大意を掴んでから部分検索を
行うという検索手順の組み合わせにより、電子辞書の利
用効率を効果的に実行できると共に、単語に関する概念
の把握が容易であるため、外国語の学習効果も向上す
る。 第6図は本発明における辞書検索の処理の流れを説明
するフローチヤートである。 以下、上記で説明した辞書検索の手順を第6図を参照
して説明する。 検索は、まずユーザが求める検索の種類が全体検索で
あるか部分検索であるかの判断(S11)をすることから
行われる。これは第4図に示したユーザインターフエー
スにおける全体検索指示部33/部分検索指示部35のいづ
れから入力がなされたかを判断することで実行される。 検索指示が全体検索である場合は、さらにその指示入
力が概念検索であるか、表記検索であるかを判断し(S1
2),概念検索が指示されたと判断したときは記憶手段
に格納されているシソーラスを参照して類似概念を検索
し(S13)、表記レベルによるフィルタリングを行う(S
16)。このフィルタリングはS13で検索された類似概念
の項目をその表記のレベルで抽出する処理である。 フィルタリングされた検索結果はユーザインターフエ
ースの全体表示部34に表示することによってユーザに提
示される。 S12において、検索指示が表記であると判断される
と、入力された検索キーをスペリングチェッカでその類
似表記を検索する(S14)。このスペリングチェッカは
入力された英つづりの検証を行う機能であり、本来はス
ペルミスの検出のためのアルゴリズムであるが、ここで
はつづりが類似した表記(color/colourなど)を抽出す
る機能として用いている。 スペリングチェッカにより検索された類似表記は、次
に発音辞書(発音属性に分類された項目)により類似の
発音の項目が検索され(S15)、この類似発音の検索結
果に対して表記レベルによるフィルタリングを施す(S1
6)。検索結果を全体表示部34に表示してユーザに提示
する(S17)。 一方、S11において入力指示が部分検索であると判断
された場合は、その指示属性をチェックして指示された
属性を特定した後(S18)、当該属性についての検索を
実行する(S19)。検索された結果を部分表示部36に表
示することにより(S20)、ユーザに提示する。 なお、本発明は上記実施例で説明した英和電子辞書等
の外国語電子辞書検索システムに限られるものではな
く、例えば辞書編集システムとして本発明を適用するこ
とにより、テキストとしての全体を目視することにより
誤りを把握し、その後部分検索により属性単位で編集す
るという辞書編集環境を提供できるため、高品質の電子
辞書を作成することが可能となる。 また、ユーザインターフエースのビュー上において、
その全体表示部と部分表示の組み合わせることにより、
概念の単位で単語を捉えることができるため、既存のシ
ソーラスを電子化することに代えて、作成した電子辞書
をベースとしたシソーラスの構築に利用できることは前
述したとおりである。 [発明の効果] 以上説明したように、本発明によれば、電子辞書等の
言語データベースの利用において、単語をその属性全体
としての観点と個々の属性に分解した部分としての観点
から捉えることにより、概念の整理や属性が共通する単
語間の空間的な意味の把握が容易となり、状況に応じた
最適な利用ができる。
[','] ') Is determined (S4), and YE
If it is S, the part-of-speech symbol or line feed symbol following ST is stored as a part-of-speech item (S8), and the process returns to S4. If the answer is NO, a line feed symbol comes and the ST of the word ends, so that it is registered in the storage means as a record having an attribute decomposed using the above-mentioned heading as a key (S5). By repeating this (Yes in S6 → S1 →...), A database consisting of all ST-based records generated from the original dictionary is constructed. When performing dictionary lookup (dictionary search) using the database generated as described above, the user gives a search key from the character input means 2 and sequentially searches for a desired word. 4 and 5 are explanatory views of a specific example of the user interface according to the present invention. In the view as the user interface, reference numeral 33 denotes an entire search instruction unit, reference numeral 34 denotes an entire display unit, and reference numeral 35 denotes a partial search. An instruction unit, 36 is a partial display unit, 37 is an input display unit, 38 is a front and rear search button, and 39 is a cursor. The whole search instructing unit 33, the whole display unit 34, the partial search instructing unit 35, and the partial display unit 36 are the whole search instructing unit 3, the whole display unit 4, the partial search instructing unit 5, and the partial displaying unit 6 in FIG.
This is a display related to the operation of. As described above, in the present embodiment, all the parts that are visible to the user, that is, the “display unit / instruction unit” are integrated in the same display (the same view), and the search result is a flat text like an ordinary dictionary, and The partial display reflecting the hierarchical structure is presented at the same time. In the figure, the partial display presented on the partial display unit 36 is a headword (choos) displayed on the input display unit 37.
Regarding e), this is an example of a second part of speech (part of speech 2) indicated by hatching on the partial display section 36, and a display example of the English sentence. That is, the display content presented on the partial display unit 36 is the result of a search for the second part of speech, that is, the transitive verb (other) presented on the overall display unit 34. In this way, since the linguistic information about a headword is displayed so as to present both the entire text and the item-by-item portion at the same time, the user can use the entire search result and the portion in accordance with the dictionary use situation, This electronic English-Japanese dictionary can be used efficiently. First, if you want to see visually at the overall notation level,
A general search is performed after a quick look at the entire display of the presented display content. The overall search here is a function that searches for related words without being aware of the attribute that the user focuses on.
There are “concept search” and “notation search”. The “concept search” is a function of searching for a synonym, a synonym, or a word having the same synonym one after another, and is performed with reference to a thesaurus stored in the storage unit. This thesaurus is originally a dictionary created to limit keywords, but in a search system, in order to improve search efficiency, in addition to the limited keywords, the superordinate concept, subordinate concept, related words, or synonyms,
It describes antonyms. For example, in the case of “choose”, synonyms “select” “el
ect "" desire "and part-of-speech form" choice "Notation search is a function that searches for similar spellings, pseudophonic words, idioms, etc. at the notation level.
In the case of "e", similar spelling is searched for "cheese" and similar pronunciation is "Tuesday" etc. The actual search is performed by the search system by automatically combining pronunciation and meaning attributes. In addition, since displaying all information can be complicated, specifying the "display level" in such a case allows simple display such as only part of speech and bilingual display. It is also possible to switch to. If the user's intention to the search result is clear and it is known which attribute is desired to be used, a partial search is performed. For example, as shown in FIG. 4, it is suitable for searching for an example sentence related to a specific part of speech, or for viewing only a phrase as a whole. Further, a grandchild can be subtracted from the obtained attribute.
In FIG. 4, if the meaning of “carefully” in the example sentence is not understood, “carefully” in the example sentence of the partial display unit 36 in FIG.
Is selected by the cursor 39 and the search is instructed by the partial search instructing section 35, "carefully" is searched as shown in FIG. 5, and the search result is presented on the entire display section 34. The same applies to the case of the whole search. However, even if the search for the display word in the display unit (the whole view of the display means) is performed, the original word previously input to the input display unit 37 is always stored. A word as a search key that has been input, including candidates for a plurality of items, can be searched instantaneously by using the front and rear search buttons 38, so that there is no need to uselessly search for the same word many times. Furthermore, the combination of the search procedure of performing a partial search after grasping the meaning of the whole display can effectively execute the use efficiency of the electronic dictionary, and the concept of words can be easily grasped. Also improve. FIG. 6 is a flowchart illustrating the flow of a dictionary search process according to the present invention. Hereinafter, the dictionary search procedure described above will be described with reference to FIG. The search is performed by first determining whether the type of search desired by the user is a full search or a partial search (S11). This is executed by judging which of the whole search instructing unit 33 and the partial search instructing unit 35 has been input in the user interface shown in FIG. If the search instruction is a general search, it is further determined whether the instruction input is a concept search or a notation search (S1).
2) If it is determined that a concept search has been instructed, a similar concept is searched for by referring to a thesaurus stored in the storage means (S13), and filtering based on the notation level is performed (S13).
16). This filtering is a process of extracting the items of the similar concept searched in S13 at the level of the notation. The filtered search results are presented to the user by displaying them on the entire display section 34 of the user interface. If it is determined in S12 that the search instruction is a notation, the spelling checker searches the input search key for a similar notation (S14). This spelling checker is a function that verifies the input spelling and is originally an algorithm for detecting spelling mistakes, but here it is used as a function to extract notations with similar spelling (color / colour, etc.) I have. The similar notation searched by the spelling checker is then searched for a similar pronunciation item using a pronunciation dictionary (items classified into pronunciation attributes) (S15), and the similar pronunciation search result is filtered by the notation level. Apply (S1
6). The search result is displayed on the entire display unit 34 and presented to the user (S17). On the other hand, if it is determined in S11 that the input instruction is a partial search, the instruction attribute is checked to identify the instructed attribute (S18), and then a search for the attribute is executed (S19). The search result is displayed on the partial display unit 36 (S20) to present it to the user. Note that the present invention is not limited to the foreign-language electronic dictionary search system such as the English-Japanese electronic dictionary described in the above-described embodiment. For example, by applying the present invention as a dictionary editing system, the entire text can be visually observed. Therefore, it is possible to provide a dictionary editing environment in which an error can be grasped and then edited in attribute units by partial search, so that a high-quality electronic dictionary can be created. Also, on the view of the user interface,
By combining the whole display part and the partial display,
As described above, it is possible to use words for constructing a thesaurus based on a created electronic dictionary instead of digitizing an existing thesaurus because words can be captured in units of concepts. [Effects of the Invention] As described above, according to the present invention, in using a language database such as an electronic dictionary, a word is grasped from the viewpoint of the whole attribute and the viewpoint of a part decomposed into individual attributes. In addition, it is easy to arrange concepts and to grasp the spatial meaning between words having common attributes, and it is possible to make optimal use according to the situation.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明による言語情報検索装置の1実施例の構
成を示すブロツク図、第2図は英和電子辞書検索システ
ムを例とした言語の構造化レコードの説明図、第3図は
上記した電子辞書のデータベース登録手順の一例の説明
図、第4図と第5図は本発明のユーザインターフエース
の具体例の説明図、第6図は本発明における辞書検索の
処理の流れを説明するフローチヤートである。 1……記憶手段、2……文字入力手段、3……全体検索
指示手段、4……全体表示手段、5……部分検索指示手
段、6……部分表示手段。
FIG. 1 is a block diagram showing the configuration of an embodiment of a language information search apparatus according to the present invention, FIG. 2 is an explanatory view of a structured record of a language using an English-Japanese electronic dictionary search system as an example, and FIG. FIGS. 4 and 5 are explanatory diagrams of a specific example of a user interface according to the present invention, and FIG. 6 is a flowchart illustrating the flow of a dictionary search process according to the present invention. It is a chart. 1 ... storage means, 2 ... character input means, 3 ... overall search instruction means, 4 ... overall display means, 5 ... partial search instruction means, 6 ... partial display means.

フロントページの続き (56)参考文献 特開 昭63−101967(JP,A) 特開 昭62−287336(JP,A) 特開 昭63−101968(JP,A) 特開 昭62−229467(JP,A) 小川,佐原,金子「音声、動画を含む ハイパーメディア作成支援システム」 1989情報学シンポジウム講演論文集, p.43−52(平1−1−17) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/30 JICST科学技術文献ファイルContinuation of front page (56) References JP-A-63-101967 (JP, A) JP-A-62-287336 (JP, A) JP-A-63-101968 (JP, A) JP-A-62-229467 (JP) , A) Ogawa, Sahara, Kaneko, "Hypermedia Creation Support System Including Audio and Video," Proc. Of the 1989 Informatics Symposium, p. 43-52 (Heisei 1-1-17) (58) Fields investigated (Int. Cl. 7 , DB name) G06F 17/21-17/30 JICST Scientific and Technical Reference File

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】言語情報を、その属性ごとに分解したレコ
ードとして記憶する記憶手段と、 記憶手段に記憶された上記レコードのうち、指示された
属性に関する詳細を表示する部分表示手段と、 記憶手段に記憶された上記レコードに関する複数の属性
をフラットなテキストとしてその全体を表示する全体表
示手段と、 記憶手段に記憶された上記レコードを、その属性単位に
検索する部分検索手段と、 記憶手段に記憶された上記レコードをその全体の関連を
基に検索する全体検索手段と、 上記部分検索手段および全体検索手段に検索の指示を行
う部分検索指示手段および全体検索指示手段とを備え、 上記全体検索指示手段、全体表示手段、部分検索指示手
段および部分表示手段は、同時に表示されるユーザイン
タフェースを構成していることを特徴とする言語情報検
索装置。
1. A storage means for storing linguistic information as a record decomposed for each attribute, a partial display means for displaying details of a specified attribute among the records stored in the storage means, a storage means Whole display means for displaying a plurality of attributes relating to the record stored in the memory as flat text as a whole, partial search means for searching the record stored in the storage means for each attribute, and storage in the storage means An entire search means for searching the obtained record on the basis of the entire association, a partial search instruction means for instructing the partial search means and the entire search means to perform a search, and an overall search instruction means, Means, the whole display means, the partial search instruction means and the partial display means constitute a simultaneously displayed user interface Language information retrieval apparatus according to claim.
JP2110322A 1990-04-27 1990-04-27 Linguistic information retrieval device Expired - Fee Related JP3013388B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2110322A JP3013388B2 (en) 1990-04-27 1990-04-27 Linguistic information retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2110322A JP3013388B2 (en) 1990-04-27 1990-04-27 Linguistic information retrieval device

Publications (2)

Publication Number Publication Date
JPH0410058A JPH0410058A (en) 1992-01-14
JP3013388B2 true JP3013388B2 (en) 2000-02-28

Family

ID=14532791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2110322A Expired - Fee Related JP3013388B2 (en) 1990-04-27 1990-04-27 Linguistic information retrieval device

Country Status (1)

Country Link
JP (1) JP3013388B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4492499B2 (en) * 2005-09-07 2010-06-30 カシオ計算機株式会社 Information display control device and information display control program
JP5024335B2 (en) * 2009-07-24 2012-09-12 カシオ計算機株式会社 Information display control device and information display control program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小川,佐原,金子「音声、動画を含むハイパーメディア作成支援システム」1989情報学シンポジウム講演論文集,p.43−52(平1−1−17)

Also Published As

Publication number Publication date
JPH0410058A (en) 1992-01-14

Similar Documents

Publication Publication Date Title
Himmelmann Language documentation: What is it and what is it good for
Fillmore et al. Building a large lexical databank which provides deep semantics
US7587389B2 (en) Question answering system, data search method, and computer program
US6662152B2 (en) Information retrieval apparatus and information retrieval method
JPH05151260A (en) Method and system for learning translation templet
JPH10232883A (en) Document retrieval system coping with many languages
JP3013388B2 (en) Linguistic information retrieval device
JPH1078969A (en) Information retrieving device
JPH10105555A (en) Translation-with-original example sentence retrieving device
JP2001060194A (en) Device and method for supporting planning and computer readable recording medium storing planning support program
JP2785692B2 (en) Dictionary search and display device
JPH07114565A (en) Electronic dictionary
Irizarry Literary analysis and the microcomputer
JPH03127266A (en) Inter-word relation editing/learning device for mechanical translating device
JP2819766B2 (en) Foreign language electronic dictionary search method
Patton Review of Am Faclair Beag online Gaelic-English Dictionary
Moukdad A comparison of root and stemming techniques for the retrieval of Arabic documents
JP2737662B2 (en) Foreign language keyword document search processing device
JP2871300B2 (en) Machine translation equipment
JPH05101094A (en) Dictionary retrieval control method
JPH09185629A (en) Machine translation method
Patton Bauer, Michael and Robertson, William. Am Faclair Beag online Gae-lic-English dictionary. http://www. faclair. info
Fawcett et al. 6 How a systemic functional grammar works: the
JP2786211B2 (en) Post-editing device in machine translation equipment
JPH06195377A (en) Machine translation system of syntax priority learning system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071217

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081217

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees