JP2020161110A - Search device, search method, and search program - Google Patents

Search device, search method, and search program Download PDF

Info

Publication number
JP2020161110A
JP2020161110A JP2019168456A JP2019168456A JP2020161110A JP 2020161110 A JP2020161110 A JP 2020161110A JP 2019168456 A JP2019168456 A JP 2019168456A JP 2019168456 A JP2019168456 A JP 2019168456A JP 2020161110 A JP2020161110 A JP 2020161110A
Authority
JP
Japan
Prior art keywords
word
dependency
syntax
tag
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019168456A
Other languages
Japanese (ja)
Other versions
JP7047825B2 (en
Inventor
山口 倫治
Tomoharu Yamaguchi
倫治 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Publication of JP2020161110A publication Critical patent/JP2020161110A/en
Application granted granted Critical
Publication of JP7047825B2 publication Critical patent/JP7047825B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

To allow for easily identifying specific necessary semantic information from multiple pieces of semantic information corresponding to one headword.SOLUTION: An electronic dictionary 10 comprises a controller configured to respond to a user specifying a word and sentence data including the word by identifying multiple usage examples including the word using dictionary data, comparing syntax of each of the identified multiple usage examples with syntax of the sentence data, and controlling output of information pertaining to the multiple usage examples based on a result of the syntax comparison.SELECTED DRAWING: Figure 1

Description

本発明は、検索装置、検索方法、検索プログラムに関する。 The present invention relates to a search device, a search method, and a search program.

一般に、電子辞書には複数の見出し語が登録され、各見出し語のそれぞれについて単語の意味などを含む語義情報が対応づけて記憶されている。通常、1つの見出し語には、少なくとも1つ語義情報が記憶されている。また、見出し語によっては、複数の語義情報が記憶されている場合がある。例えば、一般的な英和辞典において、見出し語「run」に対して100以上の語義に対応する語義情報が対応づけて記憶されている。 In general, a plurality of headwords are registered in an electronic dictionary, and word meaning information including the meaning of a word is stored in association with each headword. Usually, at least one semantic information is stored in one heading word. Further, depending on the headword, a plurality of semantic information may be stored. For example, in a general English-Japanese dictionary, word meaning information corresponding to more than 100 word meanings is stored in association with the heading word "run".

見出し語に対応する語義が複数ある場合には、ユーザは、語義情報に含まれる意味の説明文あるいは見出し語の単語を含む用例(例文)を参照することにより、検索結果として表示される複数の語義から知りたい意味の語義を判別する必要がある。しかしながら、前述したように、多くの語義情報がある場合には、知りたい意味の語義を特定することが困難となる。特に、用例をもとに語義を判別するためには、複数の語義にそれぞれ対応する用例を読まなくてはならず、簡単に知りたい意味の語義を特定することができない。 When there are multiple word meanings corresponding to the headword, the user can refer to the explanation of the meaning included in the word meaning information or the example (example sentence) including the word of the headword, and the plurality of word meanings are displayed as the search result. It is necessary to determine the meaning of the meaning you want to know from the meaning. However, as described above, when there is a lot of semantic information, it becomes difficult to specify the meaning of the meaning to be known. In particular, in order to determine the meaning of a word based on an example, it is necessary to read the example corresponding to each of the plurality of meanings, and it is not possible to easily specify the meaning of the meaning to be known.

従来では、文章で使用される単語の語義を特定することができる自然言語処理装置が知られている(例えば、特許文献1参照)。自然言語処理装置は、文章に含まれる単語の意味を、複数の語義の中から特定する場合に、単語が有する複数の語義を表す複数の単語あるいは語義を表示し、ユーザとの対話的処理によって文章に最もふさわしい語義を指定させる。自然言語処理装置では、表示される複数の単語あるいは語義を参考にして語義を指定できるが、複数の単語あるいは語義を確認した上で最もふさわしい語義を指定しなければならない。 Conventionally, a natural language processing device capable of specifying the meaning of a word used in a sentence has been known (see, for example, Patent Document 1). When the meaning of a word contained in a sentence is specified from a plurality of meanings, the natural language processing device displays a plurality of words or meanings representing the multiple meanings of the words, and interactively processes with the user. Ask them to specify the most appropriate meaning for the sentence. In a natural language processor, a word meaning can be specified by referring to a plurality of displayed words or meanings, but the most appropriate word meaning must be specified after confirming the plurality of words or meanings.

特開平4−130577号公報Japanese Unexamined Patent Publication No. 4-130557

このように従来では、見出し語に対応する複数の語義から知りたい意味の語義を簡単に特定することができなかった。 In this way, conventionally, it has not been possible to easily identify the meaning of the meaning to be known from a plurality of meanings corresponding to the headword.

本発明は、前記のような課題に考慮してなされたもので、1つの見出し語に対応する複数の語義情報から必要とする特定の語義情報を簡単に特定することができる検索装置、検索方法、検索プログラムを提供することを目的とする。 The present invention has been made in consideration of the above-mentioned problems, and is a search device and a search method capable of easily specifying a required specific meaning information from a plurality of meaning information corresponding to one headword. , The purpose is to provide a search program.

上記の課題を解決するために、本実施形態における検索装置は、単語と、前記単語を含む文章データとが指定された場合に、前記単語を含む複数の用例を辞書データに基づいて特定し、前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する制御部を有する。 In order to solve the above problem, the search device in the present embodiment identifies a plurality of examples including the word based on the dictionary data when the word and the sentence data including the word are specified. It has a control unit that compares the syntax of each of the specified plurality of examples with the syntax of the sentence data, and controls the output of information relating to the plurality of examples based on the comparison result of the syntax.

本発明によれば、1つの見出し語に対応する複数の語義情報から必要とする特定の語義情報を簡単に特定することができる。 According to the present invention, it is possible to easily specify the required specific semantic information from a plurality of semantic information corresponding to one heading word.

本発明の実施形態に係る検索装置の電子回路の構成を示す機能ブロック図。The functional block diagram which shows the structure of the electronic circuit of the search apparatus which concerns on embodiment of this invention. 本実施形態における電子辞書の外観構成を示す正面図。The front view which shows the appearance structure of the electronic dictionary in this embodiment. 本実施形態における辞書データに登録される情報の一例を示す図。The figure which shows an example of the information registered in the dictionary data in this embodiment. 本実施形態における電子辞書による辞書制御処理を示すフローチャート。The flowchart which shows the dictionary control processing by the electronic dictionary in this embodiment. 本実施形態における電子辞書による辞書制御処理を示すフローチャート。The flowchart which shows the dictionary control processing by the electronic dictionary in this embodiment. 検索ワード入力画面の一例を示す図。The figure which shows an example of the search word input screen. 文章表示画面の一例を示す図。The figure which shows an example of a sentence display screen. 構文解析により検出される係り受け関係の一例を示す図。The figure which shows an example of the dependency relation detected by the parsing. 構文解析処理により生成される構文木の一例を示す図。The figure which shows an example of the syntax tree generated by the parsing process. 係り受け関係タグ距離セットの一例を示す図。The figure which shows an example of the dependency relation tag distance set. 共通関係タグの一例を示す図。The figure which shows an example of a common relation tag. 共通関係タグの合計の一例を示す図。The figure which shows an example of the total of common relation tags. 入力文章に対応する係り受け先関係タグと係り受け元関係タグに対応する距離を示す図。The figure which shows the distance corresponding to the dependency-recipient relation tag corresponding to the input sentence, and the dependency-source relation tag. 用例に対応する係り受け先関係タグと係り受け元関係タグに対応する距離を示す図。The figure which shows the distance corresponding to the dependency-recipient relation tag corresponding to an example, and the dependency-source relation tag. 共通関係タグに対応する距離の合計の一例を示す図。The figure which shows an example of the total distance corresponding to a common relation tag. 本実施形態における電子辞書による辞書制御処理の変形例を示すフローチャート。The flowchart which shows the modification of the dictionary control processing by the electronic dictionary in this embodiment. 係り受けタグテーブルの一例を示す図。The figure which shows an example of the dependency tag table. 共通関係タグの一例を示す図。The figure which shows an example of a common relation tag.

以下、図面により本発明の実施の形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の実施形態に係る検索装置の電子回路の構成を示す機能ブロック図である。 FIG. 1 is a functional block diagram showing a configuration of an electronic circuit of a search device according to an embodiment of the present invention.

本実施形態では、検索装置を例えば電子辞書10として構成した例について示す。なお、検索装置は、電子辞書10の他、パーソナルコンピュータ、スマートフォン、タブレットPCなどの各種の電子機器により実現することが可能である。 In this embodiment, an example in which the search device is configured as, for example, an electronic dictionary 10 will be shown. In addition to the electronic dictionary 10, the search device can be realized by various electronic devices such as a personal computer, a smartphone, and a tablet PC.

電子辞書10は、複数の見出し語とする単語にそれぞれ対応する少なくとも1つの語義に関する情報が辞書データとして記録されている。辞書データには、語義に対応する見出し語の単語を含む用例(例文)を含む。電子辞書10は、見出し語を指定する文字列(単語)を入力することで、見出し語に対応する語義などを含む情報を検索する検索機能を有する。電子辞書10が有する検索機能では、見出し語を指定する検索ワードとする文字列(単語)だけでなく、文字列(単語)を含む文章を入力することで検索を実行することができる。電子辞書10は、検索対象として入力された単語を含む文章に対する構文解析結果(第1構文解析情報)と、予め登録されている複数の語義のそれぞれに対応する用例に対する構文解析結果(第2構文解析情報)との類似度に基づいて、検索ワード(単語)に対応する語義を特定する。 In the electronic dictionary 10, information on at least one word meaning corresponding to each of a plurality of headwords is recorded as dictionary data. The dictionary data includes an example (example sentence) including a heading word corresponding to the meaning of the word. The electronic dictionary 10 has a search function for searching information including a word meaning corresponding to the headword by inputting a character string (word) for designating the headword. In the search function of the electronic dictionary 10, a search can be executed by inputting not only a character string (word) as a search word for designating a headword but also a sentence including the character string (word). The electronic dictionary 10 has a syntax analysis result (first syntax analysis information) for a sentence including a word input as a search target and a syntax analysis result (second syntax) for an example corresponding to each of a plurality of pre-registered word meanings. Based on the degree of similarity with the analysis information), the meaning corresponding to the search word (word) is specified.

電子辞書10は、各種の記録媒体に記録されたプログラム、又は、伝送されたプログラムを読み込んで、その読み込んだプログラムによって動作が制御されるコンピュータの構成を有し、その電子回路には、CPU(central processing unit)11が備えられる。 The electronic dictionary 10 has a computer configuration in which a program recorded on various recording media or a transmitted program is read and the operation is controlled by the read program, and the electronic circuit thereof includes a CPU ( A central processing unit) 11 is provided.

CPU11は、電子辞書10の全体を制御する制御部として機能する。CPU11は、メモリ12内に予め記憶された制御プログラム、あるいはROMカードなどの記録媒体13から記録媒体読取部14を介してメモリ12に読み込まれた制御プログラム、あるいはインターネット等を含むネットワークNを通じて、サーバ20から通信部15を介しダウンロードされてメモリ12に読み込まれた制御プログラムに応じて、回路各部の動作を制御する。 The CPU 11 functions as a control unit that controls the entire electronic dictionary 10. The CPU 11 is a server through a control program stored in advance in the memory 12, a control program read from a recording medium 13 such as a ROM card into the memory 12 via the recording medium reading unit 14, or a network N including the Internet or the like. The operation of each part of the circuit is controlled according to the control program downloaded from 20 via the communication unit 15 and read into the memory 12.

メモリ12に記憶された制御プログラムは、キー入力部16からのユーザ操作に応じた入力信号、タッチパネル式表示部17からのユーザ操作に応じた入力信号、あるいは外部接続されるネットワークN上のサーバ20との通信信号、あるいは記録媒体読取部14を介して接続されるEEPROM(登録商標),RAM,ROMなどの外部記録媒体13との接続通信信号に応じて起動される。 The control program stored in the memory 12 is an input signal according to a user operation from the key input unit 16, an input signal according to a user operation from the touch panel display unit 17, or a server 20 on the network N connected externally. It is activated in response to a communication signal with the external recording medium 13 such as EEPROM (registered trademark), RAM, or ROM connected via the recording medium reading unit 14.

CPU11には、メモリ12、記録媒体読取部14、通信部15、キー入力部16、タッチパネル式表示部17などが接続される。 A memory 12, a recording medium reading unit 14, a communication unit 15, a key input unit 16, a touch panel type display unit 17, and the like are connected to the CPU 11.

メモリ12に記憶される制御プログラムとしては、電子辞書10の全体の動作を司るシステムプログラム、外部接続されるネットワークN上のサーバ20、パーソナルコンピュータなどの他の電子機器とデータ通信するための通信プログラムが記憶される。さらに、メモリ12には、入力された文字列をもとに見出し語に対応する情報を検索して出力する検索機能を実行する辞書制御プログラム12aが記憶される。辞書制御プログラム12aは、文章データに対して構文解析を実行する構文解析プログラム12bが含まれる。 The control program stored in the memory 12 includes a system program that controls the overall operation of the electronic dictionary 10, a server 20 on the externally connected network N, and a communication program for data communication with other electronic devices such as a personal computer. Is remembered. Further, the memory 12 stores a dictionary control program 12a that executes a search function that searches for and outputs information corresponding to the headword based on the input character string. The dictionary control program 12a includes a parsing program 12b that executes parsing on sentence data.

また、メモリ12には、辞書データ12c、係り受け関係タグ距離テーブル12dなどが記憶される。 Further, the memory 12 stores dictionary data 12c, dependency tag distance table 12d, and the like.

辞書データ12cには、例えば、英和辞書、和英辞書、英英辞書、国語辞書などの複数の辞書を集録したデータベースが含まれる。辞書データ12cには、辞書毎に、各見出し語のそれぞれに対応する意味(語義)を説明する語義情報が含まれる。1つの見出し語に対して複数の語義情報が記憶される場合ある。また、語義情報には、見出し語(単語)の語義に応じた文章内での使用例を示す用例が設定される(図3参照)。なお、辞書データ12cは、電子辞書10の本体に内蔵せずに、ネットワークNを通じてアクセス可能な辞書データベース(例えば、サーバ20)から取得するようにしても良い。 The dictionary data 12c includes, for example, a database in which a plurality of dictionaries such as an English-Japanese dictionary, a Japanese-English dictionary, an English-English dictionary, and a Japanese dictionary are collected. The dictionary data 12c includes word meaning information for explaining the meaning (word meaning) corresponding to each headword for each dictionary. A plurality of semantic information may be stored for one headword. Further, in the semantic information, an example showing an example of use in a sentence according to the meaning of the heading word (word) is set (see FIG. 3). The dictionary data 12c may be acquired from a dictionary database (for example, a server 20) accessible through the network N without being built in the main body of the electronic dictionary 10.

係り受け関係タグ距離テーブル12dは、辞書データ12cに登録された各見出し語について、1つの見出し語に対する複数の語義それぞれに対応する用例に対する構文解析の結果を示す構文解析情報(第2構文解析情報)が記憶される。係り受け関係タグ距離テーブル12dの構文解析情報は、検索対象として検索ワードと共に入力された文章に対する構文解析結果(第1構文解析情報)との類似度の判別に用いられる。 The dependency tag distance table 12d is a parsing information (second parsing information) indicating the result of parsing for each example corresponding to each of a plurality of meanings for one headword for each headword registered in the dictionary data 12c. ) Is memorized. The syntax analysis information of the dependency-related tag distance table 12d is used to determine the degree of similarity with the syntax analysis result (first syntax analysis information) for the sentence input together with the search word as the search target.

構文解析の結果としては、例えば、語義に対応する用例で使用される見出し語の単語と用例中の他の単語との係り受け関係を示す係り受け種類(係り受け関係タグ)と、用例中の見出し語の単語と係り受け関係にある他の単語との距離を含む。係り受け関係を示す係り受け種類(係り受け関係タグ)と単語間の距離の詳細については後述する(図8〜10参照)。 As a result of the parsing, for example, a dependency type (dependency relationship tag) indicating the dependency relationship between the headword word used in the example corresponding to the meaning and another word in the example, and the dependency type in the example. Includes the distance between the headword word and other words that are dependent on it. Details of the dependency type (dependency tag) indicating the dependency relationship and the distance between words will be described later (see FIGS. 8 to 10).

本実施形態における構文解析情報の類似度は、例えば文章に対する構文解析により抽出される係り受け種類(係り受け関係タグ)の一致数に基づくものとする。すなわち、同じ係り受け種類(係り受け関係タグ)を多く有するほど類似度が高いものとする。さらに、係り受け種類(係り受け関係タグ)の一致数が同じ複数の構文解析情報(用例)がある場合には、係り受け種類(係り受け関係タグ)が一致した係り受け関係にある見出し語と他の単語との距離が小さい方を類似度が高いものと判別する(なお、係り受け種類(係り受け関係タグ)が一致した係り受け関係にある他の単語が複数ある場合には、複数の他の単語のそれぞれに対応する距離の合計を元に判別する)。 The similarity of the parsing information in the present embodiment is based on, for example, the number of matches of the dependency types (dependency-related tags) extracted by the parsing on the sentence. That is, the more the same dependency type (dependency-related tag) is, the higher the similarity is assumed. Furthermore, if there are multiple parsing information (examples) with the same number of matches of the dependency type (dependency relationship tag), the headwords in the dependency relationship with the same dependency type (dependency relationship tag) The one with a smaller distance from other words is determined to have a higher degree of similarity (note that if there are multiple other words in a dependency relationship with the same dependency type (dependency relationship tag), multiple words Determine based on the total distance corresponding to each of the other words).

係り受け関係タグ距離テーブル12dには、例えば全ての見出し語にそれぞれ対応する各語義の用例に対して、係り受け種類(係り受け関係タグ)、及び係り受け関係にある単語間の距離を示す係り受け関係データを、「係り受け関係タグ距離セット」として作成して登録しておく。「係り受け関係タグ距離セット」は、語義に対応する1つの用例に対して1セット作成される。さらに、辞書データ12cに登録された用例だけではなく、他の文章からも係り受け関係タグ距離セットを作成して、係り受け関係タグ距離テーブル12dに登録することもできる。 In the dependency tag distance table 12d, for example, for each example of the meaning corresponding to all the headwords, the dependency type (dependency tag) and the distance between the words in the dependency relationship are shown. Receive-relationship data is created and registered as a "dependency-relationship tag distance set". One set of "dependency-related tag distance set" is created for one example corresponding to the meaning of the word. Further, it is also possible to create a dependency-related tag distance set from not only the examples registered in the dictionary data 12c but also other sentences and register it in the dependency-related tag distance table 12d.

なお、係り受け関係タグ距離テーブル12dは、辞書データ12cとは別に生成するのではなく、辞書データ12cの一部として登録されていても良い。また、「係り受け関係タグ距離セット」は、辞書データ12cに予め登録される他に、辞書データ12cに登録された用例とは別の文章に対して構造解析処理を実行することで生成され、係り受け関係タグ距離テーブル12dに追加登録されても良い。この場合、辞書データ12cに登録された「係り受け関係タグ距離セット」と、係り受け関係タグ距離テーブル12dに登録された「係り受け関係タグ距離セット」とを合わせて用いて、後述する辞書制御処理を実行するようにしても良い。 The dependency-related tag distance table 12d may not be generated separately from the dictionary data 12c, but may be registered as a part of the dictionary data 12c. In addition to being registered in the dictionary data 12c in advance, the "dependency-related tag distance set" is generated by executing a structural analysis process on a sentence different from the example registered in the dictionary data 12c. Dependency-related tags may be additionally registered in the distance table 12d. In this case, the dictionary control described later is performed by using the "dependency-related tag distance set" registered in the dictionary data 12c and the "dependency-related tag distance set" registered in the dependency-related tag distance table 12d together. The process may be executed.

さらに、係り受け関係タグ距離テーブル12dは、電子辞書10の本体に内蔵せずに、ネットワークNを通じてアクセス可能な辞書データベース(例えば、サーバ20)から取得するようにしても良い。 Further, the dependency-related tag distance table 12d may be acquired from a dictionary database (for example, a server 20) accessible through the network N without being built in the main body of the electronic dictionary 10.

図2は、電子辞書10の外観構成を示す正面図である。 FIG. 2 is a front view showing the external configuration of the electronic dictionary 10.

図2における電子辞書10の場合、開閉される装置本体の下段側にCPU11、メモリ12、記録媒体読取部14、通信部15が内蔵されると共に、キー入力部16が設けられ、上段側にタッチパネル式表示部17が設けられる。 In the case of the electronic dictionary 10 in FIG. 2, the CPU 11, the memory 12, the recording medium reading unit 14, and the communication unit 15 are built in the lower side of the apparatus main body to be opened and closed, and the key input unit 16 is provided, and the touch panel is provided on the upper side. The expression display unit 17 is provided.

キー入力部16には、文字入力キー16a、各種の辞書や各種機能を選択することができる辞書選択キー16b、[訳/決定]キー16c、[戻る]キー16d、カーソルキー(上下左右キー)16e、電源ボタン、その他の各種機能キーなどが備えられる。タッチパネル式表示部17には、各種機能の実行に応じて、各種メニューやボタン17aなどが表示される。 The key input unit 16 includes a character input key 16a, a dictionary selection key 16b capable of selecting various dictionaries and various functions, a [translation / decision] key 16c, a [back] key 16d, and a cursor key (up / down / left / right keys). It is equipped with 16e, a power button, and various other function keys. On the touch panel type display unit 17, various menus, buttons 17a, and the like are displayed according to the execution of various functions.

電子辞書10は、ユーザによるキー入力部16に対する操作、あるいは表示部17に表示されたメニューやボタンに対するタッチ操作(ペン先、あるいは指先による)に応じて、ユーザによる指示を入力することができる。 The electronic dictionary 10 can input an instruction by the user according to an operation on the key input unit 16 by the user or a touch operation (with a pen tip or a fingertip) on a menu or a button displayed on the display unit 17.

このように構成された電子辞書10は、CPU11が辞書制御プログラム12aに記述された命令に従い回路各部の動作を制御し、ソフトウエアとハードウエアとが協働して動作することにより、以下の動作説明で述べる機能を実現する。 In the electronic dictionary 10 configured in this way, the CPU 11 controls the operation of each part of the circuit according to the instructions described in the dictionary control program 12a, and the software and the hardware operate in cooperation with each other to perform the following operations. Realize the functions described in the description.

図3は、辞書データ12cに登録される情報の一例を示す図である。 FIG. 3 is a diagram showing an example of information registered in the dictionary data 12c.

図3は、見出し語とする単語「catch」に対応する語義情報を示している。見出し語とする単語「catch」には、複数の語義1,2,…に対応する語義情報が登録されている。例えば、図3では、単語「catch」を動詞として使用した場合の語義1と、名詞として使用した場合の語義2がある場合の例を示している。さらに、図3では、語義1,2のそれぞれに対応づけて、見出し語とする単語「catch」を語義の意味で使用した用例1,2が、辞書データ12cに登録されていることを示している。 FIG. 3 shows the semantic information corresponding to the word “catch” as the heading word. In the word "catch" used as a heading word, semantic information corresponding to a plurality of meanings 1, 2, ... Is registered. For example, FIG. 3 shows an example in which there is a meaning 1 when the word “catch” is used as a verb and a meaning 2 when the word “catch” is used as a noun. Further, FIG. 3 shows that Examples 1 and 2 in which the word “catch” used as the heading word is used in the meaning of the word meaning are registered in the dictionary data 12c in association with each of the word meanings 1 and 2. There is.

例えば、単語「catch」を動詞として使用した場合の語義1の用例としては、例えば「He caught it all on video tape」が登録され、単語「catch」を名詞として使用した場合の語義2の用例としては、例えば「There must be a catch somewhere」が登録されていることを示している。 For example, as an example of the meaning 1 when the word "catch" is used as a verb, for example, "He caught it all on video tape" is registered, and as an example of the meaning 2 when the word "catch" is used as a noun. Indicates that, for example, "There must be a catch somewhere" is registered.

次に、本実施形態における電子辞書10の動作について説明する。 Next, the operation of the electronic dictionary 10 in this embodiment will be described.

図4及び図5は、本実施形態における電子辞書10による辞書制御処理を示すフローチャートである。 4 and 5 are flowcharts showing dictionary control processing by the electronic dictionary 10 in the present embodiment.

CPU11は、電源オンされると、辞書制御プログラム12aを起動して辞書制御処理を開始する。CPU11は、タッチパネル式表示部17に初期画面であるホーム画面を表示させる(ステップS1)。ホーム画面には、検索対象とする辞書を選択するためのメニューが含まれる。メニューでは、検索対象とする辞書を選択することができる。例えば、検索対象とする辞書として、全ての辞書を検索対象とする、特定の範囲の辞書(例えば、英語系辞書など)、あるいは特定の辞書(例えば、○○英和辞書など)を選択することができる。 When the power is turned on, the CPU 11 activates the dictionary control program 12a to start the dictionary control process. The CPU 11 causes the touch panel type display unit 17 to display the home screen, which is the initial screen (step S1). The home screen includes a menu for selecting the dictionary to be searched. In the menu, you can select the dictionary to be searched. For example, as a dictionary to be searched, a specific range of dictionaries (for example, English-based dictionaries) or a specific dictionary (for example, XX English-Japanese dictionary) that targets all dictionaries can be selected. it can.

CPU11は、メニューにおいて検索対象とする辞書が選択されると(ステップS2、YES)、検索ワード(単語)を入力するための入力エリアが設けられた検索ワード入力画面をタッチパネル式表示部17に表示させる(ステップS3)。 When the dictionary to be searched is selected in the menu (step S2, YES), the CPU 11 displays a search word input screen provided with an input area for inputting the search word (word) on the touch panel display unit 17. (Step S3).

図6は、検索ワード入力画面D1の一例を示す図である。図6に示すように、検索ワード入力画面D1には、検索ワードとする文字列を入力するための入力エリアAR11、文章を入力するための文章入力エリアAR12、検索処理の実行を指示するための検索開始ボタンB1が設けられている。本実施形態における電子辞書10では、辞書に登録された見出し語(語義情報)を検索するために、検索ワード(単語)を入力するだけでなく、検索ワードが用いられた文章を入力することができる。 FIG. 6 is a diagram showing an example of the search word input screen D1. As shown in FIG. 6, the search word input screen D1 has an input area AR11 for inputting a character string to be a search word, a sentence input area AR12 for inputting a sentence, and an instruction for executing a search process. A search start button B1 is provided. In the electronic dictionary 10 of the present embodiment, in order to search for the headword (semantic information) registered in the dictionary, not only the search word (word) but also the sentence in which the search word is used can be input. it can.

本実施形態の電子辞書10では、検索ワードだけでなく文章を入力することで、入力した文章と同じように検索ワード(単語)が用いられた用例に対応する語義を検索することができる。従って、1つの見出し語に多くの語義が設定されている場合であっても、用例をもとにユーザが必要とする語義の抽出し易くしている。なお、多くの語義を有しない検索ワードに対して辞書検索する場合には、一般的な辞書検索と同様にして、検索ワードのみを入力して検索を実行することもできる。 In the electronic dictionary 10 of the present embodiment, by inputting not only the search word but also a sentence, it is possible to search for the meaning corresponding to the example in which the search word (word) is used in the same manner as the input sentence. Therefore, even when many meanings are set for one heading word, it is easy to extract the meanings required by the user based on the example. When a dictionary search is performed for a search word that does not have many meanings, the search can be executed by inputting only the search word in the same manner as a general dictionary search.

CPU11は、文字入力キー16aの操作により検索ワードとする文字列(単語)が入力され、[訳/決定]キー16cあるいは検索開始ボタンB1の操作により検索の実行が指示されると(ステップS4、YES)、文章入力エリアAR12への文章入力があるか判別する。ここで、検索ワードと共に文章が入力されていない場合(ステップS5、NO)、CPU11は、検索ワードをもとに、検索対象とする辞書の辞書データに対して検索処理を実行する(ステップS6)。すなわち、CPU11は、検索ワードに該当する見出し語を辞書データ12cから検索し、検索された見出し語に対応する語義情報を辞書データ12cから読み出して、タッチパネル式表示部17において表示させる。 When the character string (word) to be the search word is input by the operation of the character input key 16a and the CPU 11 is instructed to execute the search by the operation of the [translation / decision] key 16c or the search start button B1 (step S4, YES), determine if there is text input in the text input area AR12. Here, when a sentence is not input together with the search word (step S5, NO), the CPU 11 executes a search process for the dictionary data of the dictionary to be searched based on the search word (step S6). .. That is, the CPU 11 searches the dictionary data 12c for the headword corresponding to the search word, reads out the meaning information corresponding to the searched headword from the dictionary data 12c, and displays it on the touch panel type display unit 17.

一方、検索ワードと共に文章が入力されている場合(ステップS5、YES)、CPU11は、入力された文章が既に構文解析が実行済みであるかを判別する。例えば、電子辞書10では、文章入力エリアAR12に入力された文章について、後述する係り受け関係解析処理(構文解析)を実行した場合に、処理済みの文章と構文解析結果をメモリ12に記憶させておく。CPU11は、入力された文章が処理済みの文章に存在するかを判別し、存在しないと判別された場合には(ステップS16、NO)、入力された文章に対する係り受け関係解析処理(構文解析)を実行する(ステップS17)。一方、入力された文章について構文解析が実行済みである場合、CPU11は、実行済みの構文解析により記憶された構文解析結果を用いた辞書検索を実行する(ステップS18〜)。 On the other hand, when a sentence is input together with the search word (step S5, YES), the CPU 11 determines whether the input sentence has already been parsed. For example, in the electronic dictionary 10, when the dependency relationship analysis process (syntax analysis) described later is executed for the sentence input in the sentence input area AR12, the processed sentence and the syntax analysis result are stored in the memory 12. deep. The CPU 11 determines whether or not the input sentence exists in the processed sentence, and if it is determined that the input sentence does not exist (step S16, NO), the dependency relationship analysis process (syntax analysis) for the input sentence. Is executed (step S17). On the other hand, when the syntactic analysis has been executed for the input sentence, the CPU 11 executes a dictionary search using the syntactic analysis result stored by the executed syntactic analysis (steps S18 to).

なお、前述した説明では、検索ワード入力画面D1において、検索ワードと文章を入力しているが、他の方法で辞書検索の対象とする検索ワードと文章を入力することができる。例えば、CPU11は、ホーム画面において文章表示が指示された場合(ステップS11、YES)、例えばメモリ12に記憶されたテキストデータに応じた文章を含む文章表示画面をタッチパネル式表示部17に表示させる。 In the above description, the search word and the sentence are input on the search word input screen D1, but the search word and the sentence to be the target of the dictionary search can be input by another method. For example, when the text display is instructed on the home screen (step S11, YES), the CPU 11 causes the touch panel display unit 17 to display a text display screen including a text corresponding to the text data stored in the memory 12, for example.

図7は、文章表示画面D2の一例を示す図である。図7に示すように、文章表示画面D2には、文章が表示される文章表示エリアの他、検索処理の実行を指示するための検索開始ボタンB2が設けられている。 FIG. 7 is a diagram showing an example of the text display screen D2. As shown in FIG. 7, the text display screen D2 is provided with a text display area in which text is displayed and a search start button B2 for instructing execution of search processing.

例えば、文章表示エリアの文章が表示された位置に対するタッチ操作(ペン先、あるいは指先による)を検出した場合、CPU11は、タッチ位置に表示された単語を特定し(ステップS13)、この単語を含む1文章のテキストデータを判別する(ステップS14)。例えば、図7において、単語「caught」W1に相当する位置がタッチされたものとする。CPU11は、タッチ位置に応じて単語「caught」を検出し、「caught」を含む1文章のテキストデータ「I caught the boy stealing fruit from our orchard.」を抽出する。CPU11は、タッチ操作により指定された単語「caught」を検索ワードとし、単語「caught」を含むテキストデータ「I caught the boy stealing fruit from our orchard.」を入力文章とする。これにより、表示された文章に対するタッチ操作のみにより、検索ワードと文章を簡単に入力して辞書検索を実行させることができる。 For example, when a touch operation (by the pen tip or fingertip) with respect to the position where the text in the text display area is displayed is detected, the CPU 11 identifies the word displayed at the touch position (step S13) and includes this word. The text data of one sentence is determined (step S14). For example, in FIG. 7, it is assumed that the position corresponding to the word "caught" W1 is touched. The CPU 11 detects the word "caught" according to the touch position, and extracts the text data "I caught the boy stealing fruit from our orchard." Of one sentence including "caught". The CPU 11 uses the word "caught" designated by the touch operation as the search word, and uses the text data "I caught the boy stealing fruit from our orchard." Containing the word "caught" as the input sentence. As a result, the search word and the sentence can be easily input and the dictionary search can be executed only by the touch operation on the displayed sentence.

ここで、CPU11は、[訳/決定]キー16cあるいは検索開始ボタンB2の操作により検索の実行が指示されると(ステップS15、YES)、前述と同様にして、入力された文章が処理済みの文章に存在するかを判別し、存在しないと判別された場合には(ステップS16、NO)、入力された文章に対する係り受け関係解析処理(構文解析)を実行する(ステップS17)。一方、入力された文章について構文解析が実行済みである場合、CPU11は、実行済みの構文解析により記憶された構文解析結果を用いた辞書検索を実行する(ステップS18〜)。 Here, when the CPU 11 is instructed to execute the search by operating the [Translate / Enter] key 16c or the search start button B2 (step S15, YES), the input sentence has been processed in the same manner as described above. It is determined whether or not it exists in the sentence, and if it is determined that it does not exist (step S16, NO), the dependency relationship analysis process (syntax analysis) for the input sentence is executed (step S17). On the other hand, when the syntactic analysis has been executed for the input sentence, the CPU 11 executes a dictionary search using the syntactic analysis result stored by the executed syntactic analysis (steps S18 to).

次に、図4に示すステップS17における係り受け関係解析処理(構文解析)について説明する。 Next, the dependency relationship analysis process (syntax analysis) in step S17 shown in FIG. 4 will be described.

図8(A)は、入力文章に対する構文解析により検出される係り受け関係(係り受け関係タグ)の一例を示す図である。図8(B)(C)は、用例(図3に示す)に対する構文解析により検出される係り受け関係(係り受け関係タグ)の一例を示す図である。なお、構文解析処理には、既存の方法が用いられるものとして詳細な説明を省略する。 FIG. 8A is a diagram showing an example of a dependency relationship (dependency relationship tag) detected by parsing the input sentence. 8 (B) and 8 (C) are diagrams showing an example of a dependency relationship (dependency relationship tag) detected by parsing the example (shown in FIG. 3). It should be noted that detailed description will be omitted assuming that the existing method is used for the parsing process.

構文解析処理では、文章中の検索ワードに対応する単語(入力単語)と、他の複数の単語の係り受け関係を検出する。係り受け関係は、文書中の入力単語より前にある他の単語(係り受け先単語)との関係と後にある他の単語(係り受け元単語)との関係があり、それぞれの関係を示す関係タグを求める。 In the parsing process, the dependency relationship between the word (input word) corresponding to the search word in the sentence and a plurality of other words is detected. The dependency relationship has a relationship with other words (dependent word) before the input word in the document and a relationship with other words (dependency source word) after it, and shows the relationship between them. Ask for a tag.

例えば、図8(A)に示す文章では、入力単語「caught」に対して他の単語「I」が係り受け先単語となり関係タグ「nsubj」(主語名詞を示す)が求められる。また、入力単語「caught」に対して他の単語「stealing」が係り受け元単語となり関係タグ「xcomp」(補体を示す)が求められる。 For example, in the sentence shown in FIG. 8A, another word “I” is associated with the input word “caught” and becomes a receiving word, and a relation tag “nsubj” (indicating a subject noun) is required. In addition, another word "stealing" is associated with the input word "caught" and becomes the receiving source word, and the relation tag "xcomp" (indicating complement) is required.

また、係り受け関係解析処理では、入力単語から他の単語までの文章中における距離を特定する。1つの文章において、単語間の距離が短い場合には、単語間の関連度が高いと見なすことができる。例えば、図8(A)に示す入力単語「caught」から単語「I」までの距離は「−1」、単語「stealing」までの距離は「3」となる。 In the dependency relationship analysis process, the distance from the input word to another word in the sentence is specified. When the distance between words is short in one sentence, it can be considered that the degree of relevance between words is high. For example, the distance from the input word "caught" shown in FIG. 8A to the word "I" is "-1", and the distance to the word "stealing" is "3".

なお、前述したように、入力単語から他の単語までの単語数を単純にカウントして距離としても良いが、構文解析結果を利用して距離を特定することも可能である。例えば、構文解析処理を実行して、文章の句構造を表す構文木を作成し、構文木の枝の数を単語間の距離とする。これにより、単語間の係り受け関係に関係しない、例えば冠詞等の単語の有無により、単純な単語数のカウントでは距離の変動が生じるが、構文木の枝の数を距離とすることで、単語間の係り受け関係に対応する距離を特定することができる。 As described above, the number of words from the input word to another word may be simply counted to obtain the distance, but it is also possible to specify the distance by using the result of parsing. For example, a parsing process is performed to create a syntax tree that represents the phrase structure of a sentence, and the number of branches in the syntax tree is the distance between words. As a result, the distance fluctuates with a simple count of the number of words, depending on the presence or absence of words such as articles, which are not related to the dependency relationship between words, but by using the number of branches of the syntax tree as the distance, the words The distance corresponding to the dependency relationship between them can be specified.

例えば、文章「I have a pen.」において、入力単語「have」と他の単語「pen」までの単語数は「2」となる。一方、テキスト「I have pens.」において、入力単語「have」から他の単語「pens」までの単語数は「1」となる。すなわち、単語の使われ方が同じ文章であるにもかかわらず、関連語候補が単数形「pen」か複数形「pens」かの違いにより冠詞の有無の違いが生じてしまう。従って、単純に単語までの単語数を距離とした場合、単語間の係り受け関係が同じであっても距離が変わってしまう。 For example, in the sentence "I have a pen.", The number of words up to the input word "have" and the other word "pen" is "2". On the other hand, in the text "I have pens.", The number of words from the input word "have" to the other word "pens" is "1". That is, even though the words are used in the same sentence, the presence or absence of an article differs depending on whether the related word candidate is the singular form "pen" or the plural form "pens". Therefore, if the number of words to a word is simply taken as the distance, the distance will change even if the dependency relationship between the words is the same.

図9は、構文解析処理により生成される構文木の一例を示す図である。図9(A)は、前述した文章「I have a pen.」に対応する構文木を示し、図9(B)は、前述した文章「I have pens.」の構文木を示す。 FIG. 9 is a diagram showing an example of a syntax tree generated by the parsing process. FIG. 9 (A) shows a syntax tree corresponding to the above-mentioned sentence "I have a pen.", And FIG. 9 (B) shows a syntax tree corresponding to the above-mentioned sentence "I have a pen.".

図9(A)に示すように、文章「I have a pen.」の入力単語「have」K2と他の単語「pen」T2の間の枝数は「5」となる。また、図9(B)に示すように、文章「I have pens.」の入力単語「have」K3と他の単語「pens」T3の間の枝数は「5」となる。すなわち、文章中の冠詞の有無に関係なく、同じ構造の文章では、入力単語と他の単語の係り受け関係が同じ入力単語と他の単語については同じ距離として特定できる。 As shown in FIG. 9A, the number of branches between the input word "have" K2 of the sentence "I have a pen." And the other word "pen" T2 is "5". Further, as shown in FIG. 9B, the number of branches between the input word "have" K3 of the sentence "I have pens." And the other word "pens" T3 is "5". That is, regardless of the presence or absence of articles in a sentence, in a sentence having the same structure, an input word and another word having the same dependency relationship between the input word and another word can be specified as the same distance.

こうして、入力単語を含む文章に対する構文解析を実行して、構文木の枝の数を単語間の距離とすることで、冠詞等の有無の違いによる文章の変動があったとしても単語間の位置関係(距離)を正しく特定することが可能となる。 In this way, by performing parsing on sentences containing input words and using the number of branches of the syntax tree as the distance between words, the position between words even if the sentence changes due to the presence or absence of articles, etc. It is possible to correctly identify the relationship (distance).

次に、構文解析結果を用いた辞書検索について説明する。 Next, a dictionary search using the parsing result will be described.

CPU11は、検索ワードをもとに、検索対象とする辞書の辞書データに対して検索処理を実行する(ステップS18)。すなわち、CPU11は、検索ワードの単語の原形に該当する見出し語を辞書データ12cから検索し、検索された見出し語に対応する全ての語義情報の用例を抽出する(ステップS19)。 The CPU 11 executes a search process on the dictionary data of the dictionary to be searched based on the search word (step S18). That is, the CPU 11 searches the dictionary data 12c for the headword corresponding to the original form of the word of the search word, and extracts examples of all the meaning information corresponding to the searched headword (step S19).

CPU11は、入力文章との類似度を判別する処理の対象とする、見出し語に対応する1用例を選択する(ステップS20)。ここで、処理対象とする用例がある場合(ステップS21、YES)、CPU11は、全ての用例についての処理が完了していないため、選択した用例についての処理に移行する。CPU11は、選択した用例に対して構文解析処理済みであるか判別する。すなわち、用例に対する「係り受け関係タグ距離セット」が係り受け関係タグ距離テーブル12dに登録されているかを判別する。 The CPU 11 selects one example corresponding to the headword, which is the target of the process of determining the similarity with the input sentence (step S20). Here, when there is an example to be processed (step S21, YES), the CPU 11 shifts to the process for the selected example because the process for all the examples is not completed. The CPU 11 determines whether the selected example has been parsed. That is, it is determined whether or not the "dependency-related tag distance set" for the example is registered in the dependency-related tag distance table 12d.

CPU11は、用例に対して構文解析処理済みでない場合(ステップS22、NO)、用例のテキストデータ(文章)を辞書データ12cから抽出して、係り受け関係解析処理(構文解析)を実行する(ステップS24)。 When the example has not been parsed (step S22, NO), the CPU 11 extracts the text data (sentence) of the example from the dictionary data 12c and executes the dependency analysis process (syntax analysis) (step). S24).

係り受け関係解析処理(構文解析)は、前述した入力された文章に対する係り受け関係解析処理(構文解析)(ステップS17)と同様にして実行される。例えば、図3に示す用例1「He caught it all on video tape」の場合には、図8(B)に示すように、見出し語「catch」に相当する単語と他の単語との係り受け関係と距離が判別される。同様にして、図3に示す用例2「There must be a catch somewhere」の場合には、図8(C)に示すように、係り受け関係と距離が判別される。 The dependency relationship analysis process (syntax analysis) is executed in the same manner as the dependency relationship analysis process (syntax analysis) (step S17) for the input sentence described above. For example, in the case of Example 1 “He caught it all on video tape” shown in FIG. 3, as shown in FIG. 8 (B), the dependency relationship between the word corresponding to the heading word “catch” and another word. And the distance is determined. Similarly, in the case of Example 2 “There must be a catch somewhere” shown in FIG. 3, the dependency relationship and the distance are determined as shown in FIG. 8C.

ここで、実行された構文解析の結果(「係り受け関係タグ距離セット」)については、見出し語の語義情報(用例)と対応づけて、係り受け関係タグ距離テーブル12dに追加記憶させておく。これにより、同じ用例が処理対象となった場合に、処理済みの「係り受け関係タグ距離セット」を利用して、構文解析処理を省くことができる。 Here, the result of the executed parsing (“dependency-related tag distance set”) is additionally stored in the dependency-related tag distance table 12d in association with the semantic information (example) of the heading word. As a result, when the same example is processed, the processed "dependency-related tag distance set" can be used to omit the parsing process.

このように、用例に対して構文解析処理済みでない場合には、その時点で係り受け関係解析処理を実行可能なので、例えば辞書データ12cに対して語義に対応する用例を追加可能な構成とした場合に、新たに追加された用例についても処理対象とすることができる。 In this way, if the example has not been parsed, the dependency analysis process can be executed at that point. Therefore, for example, when the dictionary data 12c is configured to be able to add an example corresponding to the meaning of the word. In addition, newly added examples can also be processed.

一方、用例に対して構文解析処理済みである場合(ステップS22、YES)、CPU11は、用例に対応する構文解析結果(第2構文解析情報)を示す係り受け関係データ(「係り受け関係タグ距離セット」)を係り受け関係タグ距離テーブル12dから読み出し、入力された文章の構文解析結果(第1構文解析情報)との類似度の判別を行う。 On the other hand, when the parsing process has been completed for the example (step S22, YES), the CPU 11 indicates the dependency data (“Dependency tag distance”) indicating the parsing result (second parsing information) corresponding to the example. "Set") is read from the dependency tag distance table 12d, and the degree of similarity with the syntactic analysis result (first parsing information) of the input sentence is determined.

図10は、係り受け関係タグ距離テーブル12dに登録される「係り受け関係タグ距離セット」の一例を示す図である。図10では、辞書データ12cに登録された1つの見出し語に対応する複数の語義,12,3…のそれぞれに対応する用例に「係り受け関係タグ距離セット」を示している。図10では、語義1,3については、1つの語義に対して複数の用例が設定され、語義2については、1つの用例が設定されている場合をそれぞれ示している。従って、語義1,3については、複数の用例のそれぞれに対する複数の「係り受け関係タグ距離セット」が登録される。 FIG. 10 is a diagram showing an example of a “dependency-related tag distance set” registered in the dependency-related tag distance table 12d. In FIG. 10, a “dependency-related tag distance set” is shown as an example corresponding to each of a plurality of word meanings, 12, 3 ... Corresponding to one headword registered in the dictionary data 12c. In FIG. 10, a plurality of examples are set for one meaning of the meanings 1 and 3, and one example is set for the meaning 2. Therefore, for the meanings 1 and 3, a plurality of "dependency-related tag distance sets" for each of the plurality of examples are registered.

例えば、語義1には複数の用例1,2,3…があり、複数の用例1,2,3…と対応づけてそれぞれ「係り受け関係タグ距離セット」が記憶される。 For example, the meaning 1 has a plurality of examples 1, 2, 3 ..., And the "dependency relationship tag distance set" is stored in association with the plurality of examples 1, 2, 3 ....

語義1の用例1に対応する「係り受け関係タグ距離セット」には、用例1中の見出し語の単語と係り受け先単語との係り受け関係を示す関係タグ「advmod」「aux」「nsubj」「dobj」とそれぞれに対応する距離「−3」「−2」「−1」「1」、及び係り受け元単語との係り受け関係を示す関係タグ「root」と対応する距離「0」が含まれる。 The "dependency relationship tag distance set" corresponding to Example 1 of the meaning 1 includes the relationship tags "advmod", "aux", and "nsubj" indicating the dependency relationship between the headword word in Example 1 and the dependency word. The distances "-3", "-2", "-1", and "1" corresponding to "dobj", and the distance "0" corresponding to the relationship tag "root" indicating the dependency relationship with the dependency source word are included.

このように、用例に対する構文解析結果(「係り受け関係タグ距離セット」)が予め係り受け関係タグ距離テーブル12dに登録されていれば、用例に対する係り受け関係解析処理を、検索ワードと文章データが入力される毎に実行する必要がないので、検索時間の短縮と精度向上を図ることができる。 In this way, if the syntax analysis result for the example (“Dependency-related tag distance set”) is registered in the dependency-relationship tag distance table 12d in advance, the search word and the sentence data can perform the dependency-relationship analysis process for the example. Since it is not necessary to execute each time it is input, the search time can be shortened and the accuracy can be improved.

CPU11は、処理対象とする用例についての「係り受け関係タグ距離セット」を取得すると、入力文章と用例の係り受け先関係タグと係り受け元関係タグのそれぞれについて、共通する関係タグ(共通関係タグ)を判別し、共通関係タグの合計を求める(ステップS25)。 When the CPU 11 acquires the "dependency relationship tag distance set" for the example to be processed, the CPU 11 has a common relationship tag (common relationship tag) for each of the input sentence, the dependency relationship tag of the example, and the dependency source relationship tag. ) Is determined, and the total of the common relationship tags is obtained (step S25).

図11には、共通関係タグの一例を示している。図11(A)は、入力文章に対応する係り受け先関係タグと係り受け元関係タグを示し、図11(B1)は図3に示す用例1、図11(C1)は図3に示す用例2のそれぞれに対応する係り受け先関係タグと係り受け元関係タグを示している。 FIG. 11 shows an example of a common relationship tag. 11 (A) shows the dependency-recipient relation tag and the dependency-source relation tag corresponding to the input sentence, FIG. 11 (B1) is the example 1 shown in FIG. 3, and FIG. 11 (C1) is the example shown in FIG. The dependency relationship tag and the dependency source relationship tag corresponding to each of 2 are shown.

図11(B2)に示すように、入力文章と用例1との係り受け先関係タグについては2個の関係タグ「nsubj」「dobj」が共通し、入力文章と用例1との係り受け元関係タグについては1個の「root」が共通し、それぞれ共通関係タグとして判別される。従って、用例1については、図12に示すように、共通関係タグの合計が「3」として求められる。 As shown in FIG. 11 (B2), the two relation tags "nsubj" and "dobj" are common to the dependency relationship tag between the input sentence and the example 1, and the dependency relationship between the input sentence and the example 1. As for the tags, one "root" is common, and each is determined as a common relationship tag. Therefore, for Example 1, as shown in FIG. 12, the total number of common relationship tags is calculated as “3”.

一方、図11(C2)に示すように、入力文章と用例2との係り受け先関係タグと係り受け元関係タグには共通関係タグが存在しない。すなわち、見出し語の単語が動詞として用いられた入力文章に対して、動詞の語義に対応する用例1では共通関係タグが存在するが、名詞の語義に対応する用例2では共通関係タグが存在しない。こうして、見出し語の語義に応じて用例の構文構造が異なることを利用し、共通関係タグに基づいて、類似度が高い用例1の優先度を高くし、用例2の優先度を低く(あるいは検索対象から除外)することができる。 On the other hand, as shown in FIG. 11 (C2), there is no common relationship tag in the dependency relationship tag and the dependency source relationship tag between the input sentence and Example 2. That is, for an input sentence in which the headword word is used as a verb, there is a common relationship tag in Example 1 corresponding to the meaning of the verb, but there is no common relationship tag in Example 2 corresponding to the meaning of the noun. .. In this way, taking advantage of the fact that the syntactic structure of the example differs depending on the meaning of the headword, the priority of the example 1 having a high degree of similarity is increased and the priority of the example 2 is lowered (or a search) based on the common relationship tag. Can be excluded from the target).

次に、CPU11は、係り受け先関係タグの共通関係タグに対応する距離と、係り受け元関係タグの共通関係タグに対応する距離の差の合計をそれぞれ求め、係り受け先関係タグと係り受け元関係タグにそれぞれ対応する合計値を合計する(ステップS26)。 Next, the CPU 11 obtains the total difference between the distance corresponding to the common relationship tag of the dependency relationship tag and the distance corresponding to the common relationship tag of the dependency source relationship tag, and obtains the sum of the difference between the dependency tag and the dependency tag. The total values corresponding to the original relation tags are summed (step S26).

図13には、入力文章に対応する係り受け先関係タグと係り受け元関係タグのそれぞれに対応する距離を示し、図14は、図3に示す用例1に対応する係り受け先関係タグと係り受け元関係タグのそれぞれに対応する距離を示している。入力文章と用例1との共通関係タグは、前述したように、係り受け先関係タグについては関係タグ「nsubj」「dobj」が共通し、係り受け元関係タグについては「root」が共通する。 FIG. 13 shows the distances corresponding to each of the dependency / receiver relationship tag corresponding to the input sentence and the dependency / receiver relationship tag, and FIG. 14 shows the dependency / receiver relationship tag corresponding to Example 1 shown in FIG. The distance corresponding to each of the recipient relationship tags is shown. As described above, the common relation tags between the input sentence and Example 1 are the relation tags "nsubj" and "dobj" for the dependency relation tag, and "root" for the dependency source relation tag.

入力文章の共通関係タグ「nsubj」に対応する距離が「−1」、用例1の共通関係タグ「nsubj」に対応する距離が「−1」であるので、共通関係タグ「nsubj」についての距離の差は、「−1−(−1)=0」となる。同じく、共通関係タグ「dobj」ついての距離の差は、「2−1=1」となる。同じく、共通関係タグ「root」に対応する距離が「2−2=0」である。従って、図15に示すように、用例1についての係り受け先関係タグと係り受け元関係タグにそれぞれ対応する合計値は「1」となる。 Since the distance corresponding to the common relationship tag "nsubj" in the input text is "-1" and the distance corresponding to the common relationship tag "nsubj" in Example 1 is "-1", the distance for the common relationship tag "nsubj" The difference between is "-1- (-1) = 0". Similarly, the difference in distance for the common relationship tag "dobj" is "2-1 = 1". Similarly, the distance corresponding to the common relationship tag "root" is "2-2 = 0". Therefore, as shown in FIG. 15, the total value corresponding to the dependency-recipient relationship tag and the dependency-source relationship tag for Example 1 is "1".

CPU11は、共通関係タグの個数の合計と距離の合計とを、処理対象とする用例と対応づけてメモリ12に記憶させる(ステップS27)。 The CPU 11 stores the total number of common relationship tags and the total distance in the memory 12 in association with the example to be processed (step S27).

以下、同様にして、CPU11は、見出し語に対応する次に処理対象とする1用例を選択し(ステップS20)、前述した処理を実行して、共通関係タグの個数の合計と距離の合計を求め、用例と対応づけてメモリ12に記憶させる(ステップS21〜S27)。 Hereinafter, in the same manner, the CPU 11 selects one example to be processed next corresponding to the headword (step S20), executes the above-described processing, and totals the total number of common relationship tags and the total distance. It is obtained and stored in the memory 12 in association with the example (steps S21 to S27).

CPU11は、全ての用例についての処理が完了すると(ステップS21、NO)、入力文章に対する構文解析の結果(第1構文解析情報)と、各用例に対する構文解析により記憶された共通関係タグの個数の合計と距離の合計とを含む構文解析の結果(第2構文解析情報)との類似度を判別する処理を実行する(ステップS40)。 When the processing for all the examples is completed (step S21, NO), the CPU 11 determines the result of the syntactic analysis for the input sentence (first parsing information) and the number of common relation tags stored by the parsing for each example. A process for determining the degree of similarity with the result of the syntactic analysis (second parsing information) including the sum and the sum of the distances is executed (step S40).

まず、CPU11は、共通関係タグの個数の合計が最も多い用例(語義)を選択する(ステップS28)。すなわち、構文解析情報の類似度が最も高い、入力文章と最も構文構造が一致する用例を特定する。 First, the CPU 11 selects an example (meaning) having the largest total number of common relationship tags (step S28). That is, the example in which the syntactic structure has the highest degree of similarity with the input sentence is specified.

なお、共通関係タグの個数の合計が同じ用例が複数ある場合(ステップS29、YES)、CPU11は、共通関係タグの距離の合計が最も小さい用例を、類似が高いものと判別して選択する(ステップS30)。共通関係タグの距離の合計は、共通関係タグに該当する係り受け関係にある他の単語と見出し語に対応する単語との関連度がより高いほど小さくなる。よって、共通関係タグの距離の合計が最も小さい用例を選択することで、係り受け関係にある見出し語の単語と他の単語の使用形態が、入力文章とより近い用例を特定し易くなる。 When there are a plurality of examples having the same total number of common relationship tags (step S29, YES), the CPU 11 determines that the example having the smallest total distance of the common relationship tags has high similarity and selects it (step S29, YES). Step S30). The total distance of the common relationship tags becomes smaller as the degree of association between the other words in the dependency relationship corresponding to the common relationship tags and the words corresponding to the headwords is higher. Therefore, by selecting the example having the smallest total distance of the common relation tags, it becomes easy to identify the example in which the usage pattern of the headword word and the other words in the dependency relationship is closer to the input sentence.

入力文章と各用例との類似度が判別されると、CPU11は、類似の判別結果に基づいて、各用例または各用例に対応する語義に対して優先順位を決定して出力を制御する。すなわち、CPU11は、類似度が最も高い用例を最優先(上位)とし、その他の用例について、共通関係タグの個数の合計をもとに用例(語義)を降順にソートする(ステップS31)。すなわち、入力文章との類似度が高い順番に複数の用例を並べ替えて、優先順位を決定する。 When the degree of similarity between the input sentence and each example is determined, the CPU 11 determines the priority order for each example or the meaning corresponding to each example and controls the output based on the determination result of the similarity. That is, the CPU 11 gives the highest priority (higher rank) to the example having the highest degree of similarity, and sorts the examples (meaning) in descending order based on the total number of common relationship tags for the other examples (step S31). That is, a plurality of examples are rearranged in descending order of similarity with the input sentence, and the priority is determined.

また、共通関係タグの個数の合計が同じ用例が複数ある場合には、CPU11は、前述と同様にして、各用例の共通関係タグに対応する距離の合計をそれぞれ求め、距離の合計をもとに昇順にソートする(ステップS32)。これにより、用例中の見出し語の単語と他の単語との関連度(距離)に基づいて、優先順位を決定することができる。 Further, when there are a plurality of examples having the same total number of common relationship tags, the CPU 11 obtains the total distance corresponding to the common relationship tags of each example in the same manner as described above, and based on the total distance. Sort in ascending order (step S32). As a result, the priority can be determined based on the degree of relevance (distance) between the headword word in the example and another word.

CPU11は、共通関係タグに基づいて優先順位を決定した複数の用例に対応する語義情報(用例、または用例に対応する語義)を、優先順位に応じて配列し、タッチパネル式表示部17に表示させる(ステップS33)。なお、共通関係タグがない用例に対応する語義については、表示対象から外すようにしても良い。 The CPU 11 arranges the semantic information (the example or the meaning corresponding to the example) corresponding to a plurality of examples whose priority is determined based on the common relationship tag according to the priority, and displays it on the touch panel display unit 17. (Step S33). Note that the meanings corresponding to the examples without the common relationship tag may be excluded from the display target.

このようにして、本実施形態における電子辞書10では、見出し語を指定する検索ワードとする文字列(単語)だけでなく、文字列(単語)を含む文章を入力することで、入力文章に近い用例が設定された語義情報を優先して検索結果として表示させることができる。すなわち、1つの見出し語に対して多数の語義が存在したとしても、入力文章と語義に対応する用例との構文解析結果の類似度をもとに優先順位が決定されているため、簡単にユーザが知りたい語義に効率的にたどり着くことが可能になる。 In this way, the electronic dictionary 10 in the present embodiment is close to the input sentence by inputting not only the character string (word) as the search word for designating the heading word but also the sentence including the character string (word). It is possible to give priority to the word meaning information for which an example is set and display it as a search result. That is, even if there are many meanings for one headword, the priority is determined based on the similarity between the input sentence and the example corresponding to the meaning, so that the user can easily use it. It becomes possible to efficiently reach the meaning of the word that you want to know.

なお、前述した説明では、ユーザにより入力された文章及び用例について、電子辞書10において構文解析(係り受け関係解析処理)を実行するとしているが、ネットワークNを介して接続されたサーバ20(クラウド)に対して処理対象とするデータを送信して実行させるようにしても良い。 In the above description, it is assumed that the electronic dictionary 10 executes parsing (dependency relationship analysis processing) for sentences and examples input by the user, but the server 20 (cloud) connected via the network N The data to be processed may be transmitted to the server and executed.

(変形例)
次に、入力文章に対する構文解析の結果(第1構文解析情報)と、各用例に対する構文解析の結果(第2構文解析情報)との類似度を判別する処理の変形例について説明する。前述した説明では、共通関係タグの個数の合計と距離の合計とをもとに類似度を判別しているが、変形例では、共通関係タグ(係り受け関係タグ)毎に重み値を求め、共通関係タグの重み値の合計をもとに類似度を判別する。
(Modification example)
Next, a modified example of the process for determining the degree of similarity between the result of the syntactic analysis for the input sentence (first parsing information) and the result of the parsing for each example (second parsing information) will be described. In the above description, the similarity is determined based on the total number of common relationship tags and the total distance, but in the modified example, the weight value is obtained for each common relationship tag (dependency relationship tag). The similarity is determined based on the total weight value of the common relationship tags.

前述した、共通関係タグの個数の合計を用いる方法では、全ての種類の係り受け関係タグを等価に扱い、単純に1つの係り受け関係タグの個数を1にして合計している。しかし、見出し語、見出し語に含まれる語義によって、用例で使用される係り受け関係タグの出現頻度の傾向が異なる。すなわち、見出し語を用いた文章には、見出し語に応じて、発生しやすい係り受け関係タグと発生しにくい係り受け関係タグが存在する。そこで、見出し語毎に係り受け関係タグの出現頻度をもとにして、発生しやすい係り受け関係タグほど値が大きくなる重み値を用いることで、入力文章で発生しやすい係り受け関係タグと発生しにくい係り受け関係タグが同数であっても、発生しやすい係り受け関係タグの方を使用している語義を優先して表示できるようにして精度向上を図る。 In the method using the total number of common relationship tags described above, all types of dependency relationship tags are treated equivalently, and the number of one dependency relationship tag is simply set to 1 for totaling. However, the tendency of the appearance frequency of the dependency-related tags used in the examples differs depending on the headword and the meaning of the headword. That is, in a sentence using a headword, there are a dependency-related tag that is likely to occur and a dependency-related tag that is unlikely to occur, depending on the headword. Therefore, based on the frequency of occurrence of the dependency-related tags for each heading word, by using a weight value whose value becomes larger as the dependency-related tags are more likely to occur, the dependency-related tags and the occurrences are more likely to occur in the input sentence. Even if the number of dependency-related tags that are difficult to generate is the same, the meanings of the dependency-related tags that are more likely to occur can be displayed with priority to improve accuracy.

以下、重み値の合計をもとに類似度を判別する処理を用いた辞書制御処理について説明する。なお、この辞書制御処理では、図4に示すステップS1〜S19の処理と、図5に示すステップS20〜S33に対応する図16に示すフローチャートの処理を実行するものとする。図16に示すフローチャートにおいて、図5に示すフローチャート同様の処理を実行する部分には同一の符号を付している。図4及び図5を用いた説明と共通する部分については説明を省略する。 Hereinafter, the dictionary control process using the process of determining the similarity based on the total weight value will be described. In this dictionary control process, the processes of steps S1 to S19 shown in FIG. 4 and the process of the flowchart shown in FIG. 16 corresponding to steps S20 to S33 shown in FIG. 5 are executed. In the flowchart shown in FIG. 16, the same reference numerals are given to the portions that execute the same processing as the flowchart shown in FIG. The description of the parts common to the description using FIGS. 4 and 5 will be omitted.

共通関係タグの重み値の合計をもとに類似度を判別する場合には、係り受け関係タグ距離テーブル12dの全ての見出し語のそれぞれについて、見出し語に対応する各語義の用例で用いられる係り受け関係タグについて重み値を設定する。係り受け関係タグの重み値は、次のように計算される。 When determining the similarity based on the sum of the weight values of the common relationship tags, for each of all the headwords in the dependency relationship tag distance table 12d, the dependency used in the example of each meaning corresponding to the headword. Set the weight value for the receiving relationship tag. The weight value of the dependency tag is calculated as follows.

図17は、例えば見出し語「catch」に対応する各語義の用例で用いられる係り受け関係タグが登録された係り受けタグテーブルの一例を示している。 FIG. 17 shows an example of a dependency tag table in which dependency-related tags used in examples of each meaning corresponding to the heading word “cat” are registered.

係り受けタグテーブルには、見出し語「catch」に対応する全ての用例で用いられる全ての係り受け関係タグが設定され、各係り受け関係タグの頻度が算出される。本実施形態では、同一見出し語内の全ての用例で用いられている係り受け関係タグの中で、最も高い頻度をfmaxとする。図17に示す例では、係り受け関係タグ「dobj」の頻度「17」が最も高いため、係り受け関係タグ「dobj」の頻度「17」をfmaxとする。そして、各係り受け関係タグの重み値は、それぞれの頻度をfmax(「17」)で割ったものとする。 In the dependency tag table, all the dependency-related tags used in all the examples corresponding to the heading word "catch" are set, and the frequency of each dependency-related tag is calculated. In the present embodiment, fmax is the highest frequency among the dependency tags used in all the examples in the same headword. In the example shown in FIG. 17, since the frequency “17” of the dependency tag “dobj” is the highest, the frequency “17” of the dependency tag “dobj” is set to fmax. Then, it is assumed that the weight value of each dependency-related tag is the frequency of each divided by fmax (“17”).

図16に示すステップS20において、CPU11は、入力文章との類似度を判別する処理の対象とする、見出し語に対応する1用例を選択する。ここで、処理対象とする用例がある場合(ステップS21、YES)、CPU11は、全ての用例についての処理が完了していないため、選択した用例についての処理に移行する。 In step S20 shown in FIG. 16, the CPU 11 selects one example corresponding to the headword, which is the target of the process of determining the similarity with the input sentence. Here, when there is an example to be processed (step S21, YES), the CPU 11 shifts to the process for the selected example because the process for all the examples is not completed.

図5を用いた説明では、選択した用例に対して構文解析処理済みでない場合には、個々に係り受け関係解析処理(構文解析)を実行しているが、ここでは構文解析処理済みでない全ての用例について係り受け関係解析処理を実行して、その処理結果を係り受けタグテーブルに反映して、全ての係り受け関係タグの頻度、重み値を計算して設定するものとする。 In the explanation using FIG. 5, if the selected example has not been parsed, the dependency relationship analysis process (syntax analysis) is executed individually, but here, all the cases that have not been parsed are executed. It is assumed that the dependency relationship analysis process is executed for the example, the processing result is reflected in the dependency tag table, and the frequency and weight value of all the dependency relationship tags are calculated and set.

CPU11は、処理対象とする用例についての「係り受け関係タグ距離セット」を取得すると、入力文章と用例の係り受け先関係タグと係り受け元関係タグのそれぞれについて、共通する関係タグ(共通関係タグ)を判別し、共通関係タグの重み値の合計を求める(ステップS45)。 When the CPU 11 acquires the "dependency relationship tag distance set" for the example to be processed, the CPU 11 has a common relationship tag (common relationship tag) for each of the input sentence, the dependency relationship tag of the example, and the dependency source relationship tag. ) Is determined, and the sum of the weight values of the common relationship tags is obtained (step S45).

図18には、前述した図11に示す例における共通関係タグと、各共通関係タグの重み値と、合計値を示している。すなわち、入力文章と用例1には2つの共通関係タグ「nsubj」「dobj」があり、共通関係タグ「nsubj」の重み値が「0.941176」、共通関係タグ「dobj」の重み値が「1」であることを示している。従って、用例1については、共通関係タグの重み値の合計が「1.941176」として求められる。 FIG. 18 shows the common relationship tag in the example shown in FIG. 11 described above, the weight value of each common relationship tag, and the total value. That is, there are two common relationship tags "nsubj" and "dobj" in the input sentence and Example 1, the weight value of the common relationship tag "nsubj" is "0.941176", and the weight value of the common relationship tag "dobj" is ". It shows that it is "1". Therefore, for Example 1, the total weight value of the common relationship tags is obtained as "1.941176".

次に、CPU11は、係り受け先関係タグの共通関係タグに対応する距離と、係り受け元関係タグの共通関係タグに対応する距離の差の合計をそれぞれ求め、係り受け先関係タグと係り受け元関係タグにそれぞれ対応する合計値を合計する(ステップS26)。 Next, the CPU 11 obtains the total difference between the distance corresponding to the common relationship tag of the dependency relationship tag and the distance corresponding to the common relationship tag of the dependency source relationship tag, and obtains the sum of the difference between the dependency tag and the dependency tag. The total values corresponding to the original relation tags are summed (step S26).

CPU11は、共通関係タグの重み値の合計と距離の合計とを、処理対象とする用例と対応づけてメモリ12に記憶させる(ステップS47)。 The CPU 11 stores the total weight value of the common relationship tag and the total distance in the memory 12 in association with the example to be processed (step S47).

以下、同様にして、CPU11は、見出し語に対応する次に処理対象とする1用例を選択し(ステップS20)、前述した処理を実行して、共通関係タグの重み値の合計と距離の合計を求め、用例と対応づけてメモリ12に記憶させる(ステップS21〜S47)。 Hereinafter, in the same manner, the CPU 11 selects one example to be processed next corresponding to the headword (step S20), executes the above-described processing, and totals the weight values of the common relationship tags and the total distance. Is stored in the memory 12 in association with the example (steps S21 to S47).

CPU11は、全ての用例についての処理が完了すると(ステップS21、NO)、入力文章に対する構文解析の結果(第1構文解析情報)と、各用例に対する構文解析により記憶された共通関係タグの重み値の合計と距離の合計とを含む構文解析の結果(第2構文解析情報)との類似度を判別する処理を実行する(ステップS40)。 When the processing for all the examples is completed (step S21, NO), the CPU 11 sets the result of the syntactic analysis for the input sentence (first parsing information) and the weight value of the common relationship tag stored by the parsing for each example. A process of determining the degree of similarity with the result of the syntactic analysis (second parsing information) including the total of the above and the total of the distances is executed (step S40).

まず、CPU11は、共通関係タグの重み値の合計が最も大きい用例(語義)を選択する(ステップS48)。すなわち、構文解析情報の類似度が最も高い、入力文章と最も構文構造が一致する用例を特定する。 First, the CPU 11 selects an example (meaning) having the largest total weight value of the common relationship tags (step S48). That is, the example in which the syntactic structure has the highest degree of similarity with the input sentence is specified.

なお、共通関係タグの重み値の合計が同じ用例が複数ある場合(ステップS29、YES)、CPU11は、共通関係タグの距離の合計が最も小さい用例を、類似が高いものと判別して選択する(ステップS30)。 When there are a plurality of examples having the same total weight value of the common relationship tags (step S29, YES), the CPU 11 determines that the example having the smallest total distance of the common relationship tags has high similarity and selects it. (Step S30).

入力文章と各用例との類似度が判別されると、CPU11は、類似の判別結果に基づいて、各用例または各用例に対応する語義に対して優先順位を決定して出力を制御する。すなわち、CPU11は、類似度が最も高い用例を最優先(上位)とし、その他の用例について、共通関係タグの重み値の合計をもとに用例(語義)を降順にソートする(ステップS51)。すなわち、入力文章との類似度が高い順番に複数の用例を並べ替えて、優先順位を決定する。 When the degree of similarity between the input sentence and each example is determined, the CPU 11 determines the priority order for each example or the meaning corresponding to each example and controls the output based on the determination result of the similarity. That is, the CPU 11 gives the highest priority (higher rank) to the example having the highest degree of similarity, and sorts the examples (meaning) in descending order based on the total weight values of the common relationship tags for the other examples (step S51). That is, a plurality of examples are rearranged in descending order of similarity with the input sentence, and the priority is determined.

また、共通関係タグの重み値の合計が同じ用例が複数ある場合には、CPU11は、前述と同様にして、各用例の共通関係タグに対応する距離の合計をそれぞれ求め、距離の合計をもとに昇順にソートする(ステップS52)。これにより、用例中の見出し語の単語と他の単語との関連度(距離)に基づいて、優先順位を決定することができる。 Further, when there are a plurality of examples having the same total weight value of the common relationship tags, the CPU 11 obtains the total distance corresponding to the common relationship tag of each example in the same manner as described above, and also calculates the total distance. Sort in ascending order to and (step S52). As a result, the priority can be determined based on the degree of relevance (distance) between the headword word in the example and another word.

CPU11は、共通関係タグに基づいて優先順位を決定した複数の用例に対応する語義情報(用例、または用例に対応する語義)を、優先順位に応じて配列し、タッチパネル式表示部17に表示させる(ステップS33)。なお、共通関係タグがない用例に対応する語義については、表示対象から外すようにしても良い。 The CPU 11 arranges the semantic information (the example or the meaning corresponding to the example) corresponding to a plurality of examples whose priority is determined based on the common relationship tag according to the priority, and displays it on the touch panel display unit 17. (Step S33). Note that the meanings corresponding to the examples without the common relationship tag may be excluded from the display target.

このようにして、見出し語毎に係り受け関係タグの出現頻度をもとにして計算した、係り受け関係タグの重み値を用いることで、発生しやすい係り受け関係タグを使用している語義を優先して表示することができる。 In this way, by using the weight value of the dependency-related tag calculated based on the frequency of occurrence of the dependency-related tag for each heading word, the meaning of the word that uses the dependency-related tag that is likely to occur can be obtained. It can be displayed with priority.

なお、前述した説明では、各係り受け関係タグの重み値を、同一見出し語内の全ての用例で用いられている係り受け関係タグの中で最も高い頻度fmaxによって、各係り受け関係タグの頻度を割った値としているが、発生しやすい係り受け関係タグほど大きくなる値であれば他の方法で重み値を計算するようにしても良い。 In the above description, the weight value of each dependency-related tag is set by the frequency of each dependency-related tag according to the highest frequency fmax among the dependency-related tags used in all the examples in the same headword. Is divided by, but if the value becomes larger as the dependency-related tag is more likely to occur, the weight value may be calculated by another method.

また、図16を用いた説明では、共通関係タグの重み値の合計が同じ用例(語義)が複数ある場合に、共通関係タグの距離をもとに優先度を決定しているが、前述した共通関係タグの個数、距離、重み値を用いた判別を任意に組み合わせて実施することも可能である。 Further, in the explanation using FIG. 16, when there are a plurality of examples (semantics) having the same total weight value of the common relationship tags, the priority is determined based on the distance of the common relationship tags. It is also possible to perform discrimination using the number of common relationship tags, the distance, and the weight value in any combination.

また、例えば共通関係タグの個数の合計が同じ場合に、さらに距離あるいは重み値の何れに基づいて優先度を判別するかを、ユーザが選択できるようにしても良い。 Further, for example, when the total number of common relationship tags is the same, the user may be able to select whether to determine the priority based on the distance or the weight value.

なお、前述した実施形態では、英語系の辞書を例にして説明しているが、他の言語系の辞書を対象として実施することが可能である。 In the above-described embodiment, an English-based dictionary is used as an example, but it is possible to implement it for a dictionary of another language system.

また、実施形態において記載した手法、すなわちフローチャートに示す処理等の各手法は、コンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)、磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記録媒体に格納して配布することができる。そして、コンピュータは、外部記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されることにより、実施形態において説明した機能と同様の処理を実現することができる。 Further, the method described in the embodiment, that is, each method such as the processing shown in the flowchart, is a memory card (ROM card, RAM card, etc.), magnetic disk (flexible disk, hard disk, etc.) as a program that can be executed by a computer. , It can be stored and distributed in a recording medium such as an optical disk (CD-ROM, DVD, etc.) or a semiconductor memory. Then, the computer reads the program recorded on the external recording medium, and the operation is controlled by this program, so that the same processing as the function described in the embodiment can be realized.

また、各手法を実現するためのプログラムのデータは、プログラムコードの形態としてネットワーク(インターネット)上を伝送させることができ、このネットワーク(インターネット)に接続されたコンピュータ(サーバ装置等)からプログラムデータを取り込み、前述した実施形態と同様の機能を実現することもできる。 In addition, the program data for realizing each method can be transmitted on the network (Internet) in the form of program code, and the program data can be transmitted from a computer (server device, etc.) connected to this network (Internet). It is also possible to take in and realize the same function as the above-described embodiment.

なお、本願発明は、実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。 The invention of the present application is not limited to the embodiment, and can be variously modified at the implementation stage without departing from the gist thereof. Further, the embodiments include inventions at various stages, and various inventions can be extracted by an appropriate combination of the plurality of disclosed constituent requirements. For example, even if some constituent requirements are deleted from all the constituent requirements shown in the embodiment or some constituent requirements are combined, the problem described in the column of the problem to be solved by the invention can be solved, and the invention If the effect described in the column of effect of is obtained, the configuration in which this constituent requirement is deleted or combined can be extracted as an invention.

以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。 Hereinafter, the inventions described in the claims of the original application of the present application will be added.

[1]単語と、前記単語を含む文章データとが指定された場合に、
前記単語を含む複数の用例を辞書データに基づいて特定し、
前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、
前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する制御部を有する検索装置。
[1] When a word and sentence data including the word are specified,
Identify multiple examples containing the word based on dictionary data
Comparing the syntax of each of the specified plurality of examples with the syntax of the sentence data,
A search device having a control unit that controls the output of information related to the plurality of examples based on the comparison result of the syntax.

[2]前記制御部は、
前記文章データに対する構文解析の結果を示す第1構文解析情報を取得し、
前記特定された各用例に対する構文解析の結果を示す第2構文解析情報を取得し、
前記第1構文解析情報と各用例に対応する前記第2構文解析情報との類似度を判別し、
前記類似度の判別結果に基づいて、前記複数の用例に係る情報の出力を制御する請求項1記載の検索装置。
[2] The control unit
Obtain the first parsing information indicating the result of parsing the sentence data,
Obtain second parsing information indicating the results of parsing for each of the identified examples.
The degree of similarity between the first parsing information and the second parsing information corresponding to each example is determined.
The search device according to claim 1, wherein the output of information relating to the plurality of examples is controlled based on the determination result of the similarity.

[3]前記辞書データには、1つの単語に対応する複数の語義と、前記複数の語義それぞれに対応する、前記1つの単語を含む用例が記憶されており、
前記制御部は、前記構文の比較結果に基づいて、前記特定された各用例、または前記特定された各用例に対応する語義の出力を制御する請求項1記載の検索装置。
[3] In the dictionary data, a plurality of word meanings corresponding to one word and an example including the one word corresponding to each of the plurality of word meanings are stored.
The search device according to claim 1, wherein the control unit controls the output of each of the specified examples or the meaning of the word corresponding to each of the specified examples based on the comparison result of the syntax.

[4]前記構文の比較は、前記用例および前記文章データそれぞれの文における、前記単語に対する他の複数の単語の係り受け関係を示す係り受け種類の比較である請求項1記載の検索装置。 [4] The search device according to claim 1, wherein the comparison of the syntax is a comparison of the dependency types indicating the dependency relationship of a plurality of other words with respect to the word in each sentence of the example and the sentence data.

[5]前記構文の比較結果は、前記単語に対する他の複数の単語の係り受け関係を示す複数の係り受け種類の一致度である請求項4記載の検索装置。 [5] The search device according to claim 4, wherein the comparison result of the syntax is the degree of matching of a plurality of dependency types indicating the dependency relationship of the other plurality of words with respect to the word.

[6]前記構文の比較結果は、複数の係り受け種類のうちの共通する係り受け種類の数である請求項5記載の検索装置。 [6] The search device according to claim 5, wherein the comparison result of the syntax is the number of common dependency types among a plurality of dependency types.

[7]前記構文の比較結果は、複数の係り受け種類のうちの共通する係り受け種類における単語間の距離である請求項6記載の検索装置。 [7] The search device according to claim 6, wherein the comparison result of the syntax is the distance between words in a common dependency type among a plurality of dependency types.

[8]前記構文の比較結果は、共通する係り受け種類の数の計算において、係り受け種類の数に応じた重みを加味した計算を行う請求項6記載の検索装置。 [8] The search device according to claim 6, wherein the comparison result of the syntax is calculated by adding a weight according to the number of dependency types in the calculation of the number of common dependency types.

[9]複数の係り受け種類のうちの最も高い頻度に対する各係り受け種類の頻度の割合を重みとする請求項8記載の検索装置。 [9] The search device according to claim 8, wherein the ratio of the frequency of each dependency type to the highest frequency among the plurality of dependency types is weighted.

[10]コンピュータを、
単語と、前記単語を含む文章データとが指定された場合に、
前記単語を含む複数の用例を辞書データに基づいて特定し、
前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、
前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する制御部として機能させるための検索プログラム。
[10] Computer
When a word and sentence data including the word are specified,
Identify multiple examples containing the word based on dictionary data
Comparing the syntax of each of the specified plurality of examples with the syntax of the sentence data,
A search program for functioning as a control unit that controls the output of information relating to the plurality of examples based on the comparison result of the syntax.

[11]検索装置が、
単語と、前記単語を含む文章データとが指定された場合に、
前記単語を含む複数の用例を辞書データに基づいて特定し、
前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、
前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する検索方法。
[11] The search device
When a word and sentence data including the word are specified,
Identify multiple examples containing the word based on dictionary data
Comparing the syntax of each of the specified plurality of examples with the syntax of the sentence data,
A search method that controls the output of information relating to the plurality of examples based on the comparison result of the syntax.

10 …電子辞書
11 …CPU
12 …メモリ
12a…辞書制御処理プログラム
12b…構文解析プログラム
12c…辞書データ
12d…係り受け関係タグ距離テーブル
13 …外部記録媒体
14 …記録媒体読取部
15 …通信部
16 …キー入力部
17 …タッチパネル式表示部
20 …サーバ
10 ... Electronic dictionary 11 ... CPU
12 ... Memory 12a ... Dictionary control processing program 12b ... Parsing program 12c ... Dictionary data 12d ... Dependency tag distance table 13 ... External recording medium 14 ... Recording medium reading unit 15 ... Communication unit 16 ... Key input unit 17 ... Touch panel type Display 20 ... Server

Claims (11)

単語と、前記単語を含む文章データとが指定された場合に、
前記単語を含む複数の用例を辞書データに基づいて特定し、
前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、
前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する制御部を有する検索装置。
When a word and sentence data including the word are specified,
Identify multiple examples containing the word based on dictionary data
Comparing the syntax of each of the specified plurality of examples with the syntax of the sentence data,
A search device having a control unit that controls the output of information related to the plurality of examples based on the comparison result of the syntax.
前記制御部は、
前記文章データに対する構文解析の結果を示す第1構文解析情報を取得し、
前記特定された各用例に対する構文解析の結果を示す第2構文解析情報を取得し、
前記第1構文解析情報と各用例に対応する前記第2構文解析情報との類似度を判別し、
前記類似度の判別結果に基づいて、前記複数の用例に係る情報の出力を制御する
請求項1記載の検索装置。
The control unit
Obtain the first parsing information indicating the result of parsing the sentence data,
Obtain second parsing information indicating the results of parsing for each of the identified examples.
The degree of similarity between the first parsing information and the second parsing information corresponding to each example is determined.
The search device according to claim 1, wherein the output of information relating to the plurality of examples is controlled based on the determination result of the similarity.
前記辞書データには、1つの単語に対応する複数の語義と、前記複数の語義それぞれに対応する、前記1つの単語を含む用例が記憶されており、
前記制御部は、前記構文の比較結果に基づいて、前記特定された各用例、または前記特定された各用例に対応する語義の出力を制御する
請求項1記載の検索装置。
In the dictionary data, a plurality of word meanings corresponding to one word and an example including the one word corresponding to each of the plurality of word meanings are stored.
The search device according to claim 1, wherein the control unit controls the output of each of the specified examples or the meaning of the word corresponding to each of the specified examples based on the comparison result of the syntax.
前記構文の比較は、前記用例および前記文章データそれぞれの文における、前記単語に対する他の複数の単語の係り受け関係を示す係り受け種類の比較である
請求項1記載の検索装置。
The search device according to claim 1, wherein the comparison of the syntax is a comparison of the dependency types indicating the dependency relationship of a plurality of other words with respect to the word in each sentence of the example and the sentence data.
前記構文の比較結果は、前記単語に対する他の複数の単語の係り受け関係を示す複数の係り受け種類の一致度である
請求項4記載の検索装置。
The search device according to claim 4, wherein the comparison result of the syntax is the degree of matching of a plurality of dependency types indicating the dependency relationship of the other plurality of words with respect to the word.
前記構文の比較結果は、複数の係り受け種類のうちの共通する係り受け種類の数である
請求項5記載の検索装置。
The search device according to claim 5, wherein the comparison result of the syntax is the number of common dependency types among a plurality of dependency types.
前記構文の比較結果は、複数の係り受け種類のうちの共通する係り受け種類における単語間の距離である
請求項6記載の検索装置。
The search device according to claim 6, wherein the comparison result of the syntax is the distance between words in a common dependency type among a plurality of dependency types.
前記構文の比較結果は、共通する係り受け種類の数の計算において、係り受け種類の数に応じた重みを加味した計算を行う
請求項6記載の検索装置。
The search device according to claim 6, wherein the comparison result of the syntax is calculated by adding a weight according to the number of dependency types in the calculation of the number of common dependency types.
複数の係り受け種類のうちの最も高い頻度に対する各係り受け種類の頻度の割合を重みとする
請求項8記載の検索装置。
The search device according to claim 8, wherein the ratio of the frequency of each dependency type to the highest frequency among the plurality of dependency types is weighted.
コンピュータを、
単語と、前記単語を含む文章データとが指定された場合に、
前記単語を含む複数の用例を辞書データに基づいて特定し、
前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、
前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する制御部として機能させるための検索プログラム。
Computer,
When a word and sentence data including the word are specified,
Identify multiple examples containing the word based on dictionary data
Comparing the syntax of each of the specified plurality of examples with the syntax of the sentence data,
A search program for functioning as a control unit that controls the output of information relating to the plurality of examples based on the comparison result of the syntax.
検索装置が、
単語と、前記単語を含む文章データとが指定された場合に、
前記単語を含む複数の用例を辞書データに基づいて特定し、
前記特定された複数の用例それぞれの構文と、前記文章データの構文とを比較し、
前記構文の比較結果に基づいて、前記複数の用例に係る情報の出力を制御する検索方法。
The search device
When a word and sentence data including the word are specified,
Identify multiple examples containing the word based on dictionary data
Comparing the syntax of each of the specified plurality of examples with the syntax of the sentence data,
A search method that controls the output of information relating to the plurality of examples based on the comparison result of the syntax.
JP2019168456A 2019-03-25 2019-09-17 Search device, search method, search program Active JP7047825B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019056043 2019-03-25
JP2019056043 2019-03-25

Publications (2)

Publication Number Publication Date
JP2020161110A true JP2020161110A (en) 2020-10-01
JP7047825B2 JP7047825B2 (en) 2022-04-05

Family

ID=72639565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019168456A Active JP7047825B2 (en) 2019-03-25 2019-09-17 Search device, search method, search program

Country Status (1)

Country Link
JP (1) JP7047825B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235181A (en) * 1995-02-28 1996-09-13 Hitachi Ltd On-line dictionary and read understanding support system utilizing same
JPH09212509A (en) * 1996-02-05 1997-08-15 Oki Electric Ind Co Ltd Simple sentence similarity computer
JP2005025293A (en) * 2003-06-30 2005-01-27 Casio Comput Co Ltd Information display controller, server, and program
JP2006139708A (en) * 2004-11-15 2006-06-01 Ricoh Co Ltd Text data similarity calculation method, text data similarity calculation apparatus, and text data similarity calculation program
US20190065507A1 (en) * 2017-08-22 2019-02-28 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for information processing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235181A (en) * 1995-02-28 1996-09-13 Hitachi Ltd On-line dictionary and read understanding support system utilizing same
JPH09212509A (en) * 1996-02-05 1997-08-15 Oki Electric Ind Co Ltd Simple sentence similarity computer
JP2005025293A (en) * 2003-06-30 2005-01-27 Casio Comput Co Ltd Information display controller, server, and program
JP2006139708A (en) * 2004-11-15 2006-06-01 Ricoh Co Ltd Text data similarity calculation method, text data similarity calculation apparatus, and text data similarity calculation program
US20190065507A1 (en) * 2017-08-22 2019-02-28 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for information processing

Also Published As

Publication number Publication date
JP7047825B2 (en) 2022-04-05

Similar Documents

Publication Publication Date Title
KR100650427B1 (en) Integrated development tool for building a natural language understanding application
CN1618064B (en) Translating method and computer device
US10496756B2 (en) Sentence creation system
Pasupat et al. Mapping natural language commands to web elements
JP2003223437A (en) Method of displaying candidate for correct word, method of checking spelling, computer device, and program
CN103927330A (en) Method and device for determining characters with similar forms in search engine
JP2014106665A (en) Document retrieval device and document retrieval method
JP2005043977A (en) Method and device for calculating degree of similarity between documents
JP2022069790A (en) Information processor, information processing method, and program
JP5204203B2 (en) Example translation system, example translation method, and example translation program
US20140358522A1 (en) Information search apparatus and information search method
JP7047825B2 (en) Search device, search method, search program
JP5269399B2 (en) Structured document retrieval apparatus, method and program
JP5447368B2 (en) NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM
JP2007257369A (en) Information retrieval device
JP7443667B2 (en) Search device, dictionary search program, dictionary search method
KR102519955B1 (en) Apparatus and method for extracting of topic keyword
CN112528635A (en) Search device, search method, and recording medium
JP7439429B2 (en) Search device, search method, search program
JP2004220226A (en) Document classification method and device for retrieved document
JP6549173B2 (en) Computer system and text data search method
JP2838984B2 (en) General-purpose reference device
JPH0668137A (en) Operation command object information generating system and operation command object recognition system
JP2010256960A (en) System, method and program for determining degree of similarity
JP2014130431A (en) Dictionary search device, dictionary search method, dictionary search program, dictionary search system, and server device and terminal device thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200923

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220307

R150 Certificate of patent or registration of utility model

Ref document number: 7047825

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150