JP4922252B2 - Effect expression presentation apparatus and method - Google Patents
Effect expression presentation apparatus and method Download PDFInfo
- Publication number
- JP4922252B2 JP4922252B2 JP2008168277A JP2008168277A JP4922252B2 JP 4922252 B2 JP4922252 B2 JP 4922252B2 JP 2008168277 A JP2008168277 A JP 2008168277A JP 2008168277 A JP2008168277 A JP 2008168277A JP 4922252 B2 JP4922252 B2 JP 4922252B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- synonym
- effect expression
- character string
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims description 67
- 230000000694 effects Effects 0.000 title claims description 66
- 238000000034 method Methods 0.000 title claims description 10
- 238000000605 extraction Methods 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000003796 beauty Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、効果表現提示装置及びその方法に関する。特に、ユーザが入力した語句についての効果的な表現を提示する仕組みに関する。 The present invention relates to an effect expression presentation device and a method thereof. In particular, the present invention relates to a mechanism for presenting effective expressions for words input by a user.
販売・提供される商品やサービス、またイベントなどの事物にはそれを特定するために何らかの名前が付されているところ、これらの名前(商品ネーミング)はテレビやインターネットといった情報伝達手段の発達した現代において大いなる広告宣伝機能を発揮している。その結果、商品ネーミングが、商品やサービスの売れ行き、又はイベントの成功について多大な影響を与えるに至っている。ここで、影響力の高い商品ネーミングは、当該商品と読み(音)が似ていることが多いのが現状である。そのため、ある事物について社会に親しまれやすい、すなわち、当該商品と読みが似ている、効果的な表現を容易に考え付くことのできる仕組みが求められている。 Products and services that are sold and offered, and things such as events are given names to identify them. These names (product naming) are the modern times when information transmission means such as television and the Internet have developed. Has a great advertising function. As a result, commodity naming, has led to a significant impact on the success of the products and services of sales, or event. Here, in the current situation, product naming with high influence often has similar readings (sounds) to the product. For this reason, there is a need for a mechanism that allows a person to easily come up with an effective expression that is easily familiar to society, that is, similar in reading to the product.
ところで、従来よりユーザから情報が入力されると、この入力情報に対応する情報を提示する情報提示装置が知られている。このような情報提示装置では、提示する情報として、漫才などに見られるいわゆる「ボケ」や「ツッコミ」を用いることで、ユーザに飽きを感じにくくするものもある(特許文献1参照)。このような情報提示装置によれば、ユーザからの入力情報に対して、従来にはないバリエーションに富んだ情報を提示することができる。
しかしながら、上記のような情報提示装置では、バリエーションに富んだ情報といってもあるシナリオに沿った情報を提示できるに過ぎず、ある事物について効果的な表現を提示するようなことはできない。 However, the information presentation apparatus as described above can only present information according to a scenario even though it is rich in information, and cannot present an effective expression for a certain thing.
そこで、本発明は、ユーザの入力に対する効果的な表現を提供することのできる仕組みを提供する。 Therefore, the present invention provides a mechanism that can provide an effective expression for user input.
本発明では、以下のような解決手段を提供する。 The present invention provides the following solutions.
(1) ユーザにより入力されたキーワードについての効果的な表現を提示する効果表現提示装置であって、前記キーワードの読みを示す文字列を抽出する読み抽出部と、前記キーワードについての類義語を該類義語の読みを示す文字列とともに抽出する類義語抽出部と、前記キーワードの文字列と抽出した前記類義語の文字列との近似する程度を示す編集距離を算出する編集距離算出部と、算出した前記編集距離及び前記キーワードの品詞と前記類義語の品詞とが一致するか否かに基づいて、前記類義語の前記キーワードに対するスコアを算出する効果表現スコア算出部と、前記類義語を算出した前記スコアに関連付けて提示する効果表現提示部と、を備えることを特徴とする効果表現提示装置。 (1) An effect expression presentation device that presents an effective expression for a keyword input by a user, a reading extraction unit that extracts a character string indicating the reading of the keyword, and a synonym for the keyword A synonym extraction unit that extracts a character string indicating the reading of the keyword, an edit distance calculation unit that calculates an edit distance indicating a degree of approximation between the character string of the keyword and the extracted character string of the synonym, and the calculated edit distance and based on whether the part of speech of the part of speech and the synonyms of the keywords match, and effectively represent the score calculation unit for calculating a score for the keyword of the synonyms, presented in association with the score calculated the synonyms An effect expression presentation device comprising: an effect expression presentation unit.
(1)の構成によれば、編集距離算出部は、キーワードの文字列と抽出した類義語の文字列との近似する程度を示す編集距離を算出する。そして、効果表現スコア算出部は、この算出した編集距離及びキーワードの品詞と類義語の品詞とが一致するか否かに基づいて、類義語のキーワードに対するスコアを算出し、効果表現提示部は類義語を算出したスコアに関連付けて提示する。 According to the configuration of (1), the edit distance calculation unit calculates an edit distance indicating the degree of approximation between the keyword character string and the extracted synonym character string. Then, the effect expression score calculation unit calculates a score for the synonym keyword based on the calculated edit distance and whether or not the keyword part of speech and the part of speech of the synonym match, and the effect expression presentation unit calculates the synonym Present in association with the score.
このように、スコアは文字列同士の近似する度合い(編集距離)及び品詞が一致するか否かによって算出されることになる。ここで、品詞が異なる場合には効果表現として価値が高いものである。そのため、提示された類義語についてのスコアから、入力したキーワードについての効果度合いを判断することが可能になる。ユーザにとってみれば、提示された類義語とそのスコアとを確認することで、キーワードについての効果的な表現を容易に見つけることができるため、ユーザの入力に対する効果的な表現を提供することができる。 Thus, the score is calculated based on the degree of approximation (edit distance) between character strings and whether or not the parts of speech match. Here, when the parts of speech are different, it is highly valuable as an effect expression. Therefore, it is possible to determine the degree of effect for the input keyword from the score for the presented synonym. From the user's point of view, by confirming the presented synonyms and their scores, an effective expression for the keyword can be easily found, so that an effective expression for the user's input can be provided.
(2) (1)に記載の効果表現提示装置であって、前記類義語抽出部は、前記キーワードと意味が類似する意味類義語と、前記キーワードと称呼が類似する称呼類義語と、を抽出することを特徴とする効果表現提示装置。 (2) The effect expression presentation device according to (1), wherein the synonym extraction unit extracts a semantic synonym having a similar meaning to the keyword and a nominal synonym having a similar designation to the keyword. A feature effect presentation device.
(2)の構成によれば、類義語として意味類義語だけでなく称呼類義語を用いるため、キーワードについて思いもよらない類義語を抽出する可能性がある。その結果、ユーザの入力に対する効果的な表現を提供することができる。 According to the configuration of (2), not only a semantic synonym but also a synonym synonym is used as a synonym, so that an unexpected synonym may be extracted for a keyword. As a result, an effective expression for the user input can be provided.
(3) (1)又は(2)に記載の効果表現提示装置であって、前記効果表現提示部は、前記スコアが所定の範囲内にある類義語のみ提示することを特徴とする効果表現提示装置。 (3) The effect expression presenting device according to (1) or (2), wherein the effect expression presenting unit presents only synonyms whose scores are within a predetermined range. .
(3)の構成によれば、スコアによっては提示されない類義語もあるため、ユーザには効果度合いの高い類義語のみが提示されることになる。その結果、ユーザは無駄な類義語までチェックする必要がなくなるため、効果的な表現を容易に見つけることが可能になる。 According to the configuration of (3), since there are synonyms that are not presented depending on the score, only synonyms that are highly effective are presented to the user. As a result, it is not necessary for the user to check even useless synonyms, and an effective expression can be easily found.
(4) (3)に記載の効果表現提示装置であって、前記所定の範囲を設定する閾値設定部をさらに備えることを特徴とする効果表現提示装置。 (4) The effect expression presentation device according to (3), further comprising a threshold setting unit configured to set the predetermined range.
(4)の構成によれば、所定の範囲をユーザが設定することができるため、様々な場合に応じた効果的な表現を提示することができる。 According to the configuration of (4), since the user can set the predetermined range, it is possible to present effective expressions according to various cases.
(5) ユーザにより入力されたキーワードについての効果的な表現を提示する方法であって、前記キーワードの読みを示す文字列を抽出するステップと、前記キーワードについての類義語を該類義語の読みを示す文字列とともに抽出するステップと、前記キーワードの文字列と抽出した前記類義語の文字列との近似する程度を示す編集距離を算出するステップと、算出した前記編集距離及び前記キーワードの品詞と前記類義語の品詞とが一致するか否かに基づいて、前記類義語の前記キーワードに対するスコアを算出するステップと、前記類義語を算出した前記スコアに関連付けて提示するステップと、を含む方法。 (5) A method of presenting an effective expression for a keyword input by a user, the step of extracting a character string indicating the reading of the keyword, and a character indicating the reading of the synonym for the synonym for the keyword Extracting with a sequence; calculating an edit distance indicating a degree of approximation between the character string of the keyword and the extracted character string of the synonym; the calculated edit distance, the part of speech of the keyword, and the part of speech of the synonym Doo is based on whether the match, the method comprising the steps of calculating a score for the keyword of the synonyms, and presenting in association with the score calculated the synonyms, a.
(5)の構成によれば、(1)の構成と同様にユーザの入力に対する効果的な表現を提供することができる。 According to the configuration of (5), it is possible to provide an effective expression for the user input as in the configuration of (1).
本発明によれば、ユーザの入力に対する効果的な表現を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the effective expression with respect to a user's input can be provided.
以下、本発明の実施形態について図を参照しながら説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の効果表現提示装置10の構成の例を示すブロック図である。
FIG. 1 is a block diagram showing an example of the configuration of an effect
効果表現提示装置10は、制御部100とハードディスク200とを備える。制御部100は、ユーザ入力受付部11と、読み抽出部12と、意味類義語抽出部13と、称呼類義語抽出部14と、編集距離算出部15と、効果表現スコア算出部16と、効果表現提示部17と、から構成される。ハードディスク200は、意味類義語辞書21と、称呼類義語辞書23と、を記憶する
The effect
ユーザ入力受付部11は、ユーザからのキーワードの入力を受け付ける。読み抽出部12は、入力されたキーワードの読みを抽出する。ここで、本発明においては、読みとしてローマ字表記の文字列を用いている。意味類義語抽出部13及び称呼類義語抽出部14は、入力されたキーワードの類義語を意味類義語辞書21及び称呼類義語辞書23から夫々抽出する。
The user
ここで、図3及び図4に示すように、意味類義語辞書21及び称呼類義語辞書23は予め定められた種別毎に複数の単語が規定されている。意味類義語抽出部13及び称呼類義語抽出部14は、入力されたキーワードが属する種別の単語を類義語として抽出する。なお、入力されたキーワードは、1の種別にのみ属する場合もあれば、複数の種別に属する場合もある。
Here, as shown in FIGS. 3 and 4, the semantic synonym dictionary 21 and the nominal synonym dictionary 23 define a plurality of words for each predetermined type. The semantic
編集距離算出部15は、入力されたキーワードと抽出された類義語との編集距離を算出する。ここで、編集距離とは、入力されたキーワードの文字列と類義語の文字列との近似する度合いをいい、入力されたキーワードの文字列を類義語の文字列にするための、文字の置換・挿入・削除の最小の回数をいう。そのため、入力されたキーワードの文字列と類義語の文字列とが完全に一致する場合は、編集距離が0となる。なお、編集距離の算出方法については、図6〜図8を参照して説明する。
The edit
効果表現スコア算出部16は、編集距離算出部15が算出した編集距離や、キーワードの品詞と類義語の品詞との一致/不一致などに基づいて、類義語のキーワードに対する効果度合いを示すスコアを算出する。効果表現提示部17は、算出したスコアを類義語に関連付けてユーザに提示する。なお、算出したスコアが所定の範囲である類義語のみをユーザに提示することとしても良い。
The effect expression
なお、本発明において、入力されるキーワードは、単語であってもよく、また、文章であってもよい。ここで、入力されたキーワードが文章である場合には、この文章を形態素解析を行った上でスコアを算出することができる。そのため、本発明では、入力されたキーワードが文章である場合のオプションとして形態素解析部18を設けることとしてもよい。
In the present invention, the input keyword may be a word or a sentence. Here, when the input keyword is a sentence, a score can be calculated after performing a morphological analysis on the sentence. Therefore, in the present invention, the
図2は、本発明のハードウェア構成の一例を示す図である。効果表現提示装置10は、制御部100を構成するCPU(Central Processing Unit)1010(マルチプロセッサ構成ではCPU_A1012など複数のCPUが追加されてもよい)、バスライン1005、通信I/F1040、メインメモリ1050、BIOS(Basic Input Output System)1060、ハードディスク200、並びにキーボード及びマウス1100などの入力手段や表示装置1022を備える。
FIG. 2 is a diagram illustrating an example of a hardware configuration of the present invention. The effect
BIOS1060は、効果表現提示装置10の起動時にCPU1010が実行するブートプログラムや、ハードウェアに依存するプログラムなどを格納する。
The
ハードディスク200は、効果表現提示装置10が機能するための各種プログラム及び本発明の機能を実行するプログラムを記憶しており、さらに必要に応じて各種データベースを構成可能である。
The
表示装置1022は、ユーザにデータの入力を受付ける画面を表示したり、算出された効果表現語句を表示したりするものであり、ブラウン管表示装置(CRT)、液晶表示装置(LCD)などのディスプレイ装置を含む。
The
ここで、入力手段は、ユーザによる入力の受付けを行うものであり、キーボード及びマウス1100などにより構成する。
Here, the input means accepts input by the user, and is configured by a keyboard, a
また、通信I/F1040は、効果表現提示装置10を専用ネットワーク又は公共ネットワークを介して他の装置と接続できるようにするためのネットワーク・アダプタである。
The communication I /
次に、図3及び図4を参照して、ハードディスク200に記憶される意味類義語辞書21と称呼類義語辞書23とについて説明する。
Next, the semantic synonym dictionary 21 and the nominal synonym dictionary 23 stored in the
意味類義語辞書21は、予め定められた概念に属する意味を持つ複数の単語、すなわち、予め定められた種別毎に複数の単語が規定されている。単語には、その読み仮名、品詞及びローマ字表記の文字列からなる読みデータが規定されている。 The semantic synonym dictionary 21 defines a plurality of words having meanings belonging to a predetermined concept, that is, a plurality of words for each predetermined type. The word, the reading pseudonym, to read consists of a string of goods Shi及 beauty romanization data are defined.
称呼類義語辞書22は、一定の似通った称呼を有する複数の単語、すなわち、予め定められた種別毎に複数の単語が規定されている。単語には、その読み仮名、品詞及びローマ字表記の文字列からなる読みデータが規定されている。 The nominal synonym dictionary 22 defines a plurality of words having a certain similar designation, that is, a plurality of words for each predetermined type. The word, the reading pseudonym, to read consists of a string of goods Shi及 beauty romanization data are defined.
次に、図5を参照して、本発明の処理内容を示すフローチャートについて説明する。 Next, referring to FIG. 5, a flowchart showing the processing contents of the present invention will be described.
まず、ステップS101において、制御部100は、ユーザからのキーワードの入力を受け付ける。具体的には、キーボード1100からのキーワード入力を受け付け、メインメモリ1050に記憶する。
First, in step S101, the
次に、ステップS102において、制御部100は、入力されたキーワードを形態素解析し、名詞を抽出する。なお、入力されたキーワードが単語である場合には、この処理を省略することができる。
Next, in step S102, the
次に、ステップS103では、制御部100は、キーワードの読みデータ、すなわち、ローマ字表記の文字列を抽出する。
Next, in step S103, the
次に、ステップS104では、制御部100は、入力されたキーワードが属する意味種別を特定し、この種別に属する単語を抽出する。また、ステップS105では、入力されたキーワードが属する称呼種別を特定し、この種別に属する単語を抽出する。
Next, in step S104, the
次に、ステップS106では、制御部100は、入力されたキーワードと抽出した単語との編集距離を算出する。このように、本発明では、入力されたキーワードに意味又は称呼において類似する単語のみを効果表現語句の対象としている。そのため、全ての単語を対象とする場合に比べて制御負荷を軽減することができるとともに、より効果の高い単語を抽出することができる。
Next, in step S106, the
ここで、図6〜図8を参照して、入力されたキーワードが「布団(huton)」であり、抽出された単語が「吹っ飛ぶ(huttobu)」である場合を例に編集距離の計算方法について説明する。 Here, referring to FIG. 6 to FIG. 8, an editing distance calculation method using an example in which the input keyword is “futon” and the extracted word is “hutbubu”. explain.
編集距離の算出には、入力されたキーワードの文字列と抽出した単語の文字列とからなるマトリックスが用いられる。このマトリックスでは文字列の最初の文字から最後の文字まで1ずつ加算された値が予め割り振られている(初期状態)。図6は、編集距離の算出における初期状態を示した図である。その後、初期状態における空欄部分を所定のルールに従って埋めていくことにより、編集距離が算出される。 For the calculation of the edit distance, a matrix composed of the character string of the input keyword and the character string of the extracted word is used. In this matrix , a value obtained by adding one by one from the first character to the last character of the character string is assigned in advance (initial state). FIG. 6 is a diagram showing an initial state in calculation of the edit distance. Thereafter, the edit distance is calculated by filling the blank portion in the initial state according to a predetermined rule.
具体的には、図7に示すように、最も左上の空欄部分に、(1)この空欄の左上の値+置換コスト、(2)この空欄の左の値+1、(3)この空欄の上の値+1、のうち最も小さい値を埋めていく。なお、置換コストは、この欄に対応するキーワードの文字と抽出した単語の文字とが一致する場合は「0」となり、一致しない場合は「1」となる。
Specifically, as shown in FIG. 7, the upper left blank part includes (1) the upper left value of this blank + replacement cost, (2) the left value of this
このようなルールのもと空欄部分を埋めていき、最終的に最も下の列の一番小さい値が入力されたキーワードと抽出した単語との編集距離となる。ここで、キーワード「布団」と抽出された単語「吹っ飛ぶ」とでは、編集距離は2となる(図8参照)。 The blank part is filled under such a rule, and finally, the smallest value in the lowest column is the edit distance between the input keyword and the extracted word. Here, the editing distance is 2 between the keyword “futon” and the extracted word “blow away” (see FIG. 8).
再び、図5を参照して、ステップS107では、制御部100は、算出した編集距離や品詞などから効果スコアを算出する。この処理は、先ず算出した編集距離に基づく効果スコアを算出して、その後、品詞の一致/不一致などによりこの効果スコアを補正することにより行われる。
Referring to FIG. 5 again, in step S107,
編集距離に基づく効果スコアの算出は、例えば、編集距離がキーワードのローマ字表記の文字列の長さの1/2以上である場合に「1」とする。すなわち、キーワードが「布団」である場合には、そのローマ字表記の文字列「huton」の長さは「5」である。この場合において、編集距離が「3」である場合には、編集距離はキーワードのローマ字表記の文字列の長さの1/2以上となる。 The calculation of the effect score based on the edit distance is, for example, “1” when the edit distance is equal to or greater than ½ of the length of the character string in the Roman alphabet of the keyword. That is, when the keyword is “futon”, the length of the character string “huton” written in Roman letters is “5”. In this case, when the edit distance is “3” , the edit distance is ½ or more of the length of the character string in the Roman alphabet of the keyword.
同様に、編集距離がキーワードのローマ字表記の文字列の長さの1/4以上1/2未満である場合には「3」となる。そのため、上述の「吹っ飛ぶ」の編集距離に基づく効果スコアは「3」となる。また、編集距離が、0より大きく1/4未満である場合には「5」となり、編集距離が0である場合には「7」となる。 Similarly, when the editing distance is ¼ or more and less than ½ of the length of the character string in the Roman alphabet of the keyword, “3” is set. For this reason, the effect score based on the above-mentioned “blow away” editing distance is “3”. When the edit distance is greater than 0 and less than ¼, “5” is set, and when the edit distance is 0, “7” is set.
なお、キーワードと抽出された単語とが同一のものである場合には、編集距離が0となる。しかしながら、キーワードと同一の単語は、キーワードについて何ら効果的な表現になりえない。そのため、キーワードと同一の単語については、効果スコアを「0」としてもよい。さらには、キーワードと同一の単語については、類義語として抽出されないようにすることが好適である。なお、同一の単語であっても異なる表記がなされる場合がある。例えば、「布団」は「蒲団」とも「ふとん」とも「フトン」とも表記される。このような場合にも、夫々の単語は類義語として抽出されないほうが好適である。そのため、意味類義語辞書21、称呼類義語辞書23において、「読み仮名」、「品詞」、「読みデータ」のほかに、「意味識別子」を設け、「意味識別子」が同一である単語については抽出しないようにすることができる。 When the keyword and the extracted word are the same, the edit distance is zero. However, the same word as the keyword cannot be an effective expression for the keyword. Therefore, the effect score may be set to “0” for the same word as the keyword. Furthermore, it is preferable that the same word as the keyword is not extracted as a synonym. Note that different notation may be made even for the same word. For example, “Futon” is written as “Futan”, “Futon”, and “Futon”. Even in such a case, it is preferable that each word is not extracted as a synonym. Therefore, in the semantic synonym dictionary 21 and the nominal synonym dictionary 23, in addition to “reading kana”, “part of speech”, “reading data”, a “semantic identifier” is provided, and words having the same “semantic identifier” are not extracted. Can be.
このようにすることにより、例えば、キーワードが「布団」である場合に「蒲団」などを抽出しないようにすることができる一方で、キーワードが「滋賀」である場合に「歯牙」などの効果的な表現になり得る単語を抽出することができる。 By doing so, for example, when the keyword is “futon”, it is possible not to extract “Kashidan” etc., but when the keyword is “Shiga”, it is effective such as “tooth” etc. It is possible to extract words that can be expressed easily.
このようにして、編集距離に基づく効果スコアが算出されると、次に品詞の一致/不一致などによりこの効果スコアが補正される。例えば、品詞が異なる場合に効果スコアが「1」加算されるなどとすることができる。なお、品詞が異なる場合に一律に「1」加算するのではなく、編集距離の大きさによって加算する値を変えることも可能であり、また、品詞によって加算する値を変えることも可能である。例えば、編集距離がローマ字表記の文字列の長さの1/4以上1/2未満である場合には「2」加算するが、編集距離が「0」である場合には加算しないこととしてもよい。また、キーワードが名詞で抽出された単語が動詞である場合には「2」加算し、キーワードが名詞で抽出された単語が形容詞である場合には「1」加算することとしてもよい。 When the effect score based on the edit distance is calculated in this way, the effect score is corrected next by the coincidence / mismatch of the parts of speech. For example, “1” can be added to the effect score when the parts of speech are different. If the parts of speech are different, the value to be added can be changed depending on the size of the edit distance, and the value to be added can be changed depending on the part of speech, instead of adding “1” uniformly. For example, “2” is added when the edit distance is ¼ or more and less than ½ of the length of the character string written in Romaji, but not added when the edit distance is “0”. Good. Further, “2” may be added when a word whose keyword is extracted as a noun is a verb, and “1” may be added when a word whose keyword is extracted as a noun is an adjective.
このように品詞においてスコアを補正するのは、一般に品詞が異なる場合には効果表現として価値が高くなるためである。なお、後述するように、編集距離に基づくスコアの算出、品詞情報に基づくスコアの補正については、ユーザの用途によって異なるものとしてもよい。 The reason for correcting the score in the part of speech is that, in general, when the part of speech is different, the value becomes high as an effect expression. As will be described later, the calculation of the score based on the edit distance and the correction of the score based on the part-of-speech information may differ depending on the user's application.
再び、図5を参照して、ステップS108では、制御部100は、算出したスコアが所定の範囲内にある類義語のみを選択する閾値判定を行う。次に、ステップS109では、制御部100は、ステップS108で選択した単語を表示装置1022に提示し、処理を終了する。
Referring to FIG. 5 again, in step S108,
このように、本発明では、抽出した全ての単語ではなく、スコアが所定の範囲内にある単語のみをユーザに提示することとしているため、ユーザは無駄な単語までチェックする必要がなく、より効果的な単語を容易に見つけることができる。 As described above, in the present invention, not all the extracted words but only words having a score within a predetermined range are presented to the user, so that the user does not need to check even useless words and is more effective. Words can be easily found.
なお、この所定の範囲は経験的に予め定めることとしてもよく、ユーザがキーボード及びマウス1100などの入力手段により任意に設定できることとしてもよい。特に、ユーザが任意に設定できることとした場合には、ユーザに応じた効果的な単語のみを提示することができ、よりユーザのニーズに対応することになる。
This predetermined range may be determined in advance by experience, or may be arbitrarily set by the user using input means such as a keyboard and
次に、図9及び図10を参照して、本発明の表示装置1022における表示例について説明する。
Next, display examples in the
初めに、図9を参照して、キーワード入力受付画面について説明する。表示装置1022の表示画面には、キーワード入力受付欄2010及び用途受付欄2050が表示される。キーワード入力受付欄2010は、ユーザからのキーワードの入力を受け付ける。用途受付欄2050は、ユーザが本発明における効果表現提示装置10を用いる目的を受け付ける。なお、表示装置1022には効果表現を提示するための契機となる開始受付部なども表示されるが、図9においては図示を省略している。
First, the keyword input acceptance screen will be described with reference to FIG. On the display screen of the
用途受付欄2050には、予め定められた複数の用途が選択可能に表示される。これらの用途は、夫々提示される際のスコアの範囲が異なるように設けられている。ユーザは表示された用途を選択することにより、異なる範囲のスコアを提示させることができる。なお、選択され得る用途は、スコアの範囲が異なるだけでなく、スコアの算出方法が異なることとしてもよい。すなわち、用途によっては、品詞の相違が重要になる場合もあり、このような用途である場合には、品詞の相違によるスコアの補正を大きくしてもよい。また、用途によっては、編集距離が小さすぎても大きすぎても適切でない場合があり、このような場合に、編集距離についてのスコアを用途によって異なるようにすると好適な場合がある。
In the
次に、図10を参照して、効果表現提示画面について説明する。表示装置1022の表示画面には、キーワード入力受付欄2010及び効果表現提示欄2070が表示される。キーワード入力受付欄2010には、ユーザにより入力されたキーワードが表示され、効果表現提示欄2070には、一連の処理によって選択された効果的な単語が表示される。ここで、効果表現提示欄2070の表示は、用途2071と単語2073とスコア2075とからなる。用途2071は、ユーザにより選択された用途を表示する。単語2073及びスコア2075は、選択された単語及びそのスコアを表示する。
Next, the effect expression presentation screen will be described with reference to FIG. On the display screen of the
このように、効果的な単語を、算出したスコアに関連付けて表示するため、ユーザはキーワードについての客観的な効果度合いを認識することができ、結果として、キーワードについての効果的な単語を容易に見つけることができる。 In this way, since effective words are displayed in association with the calculated score, the user can recognize the objective effect level for the keyword, and as a result, the effective word for the keyword can be easily obtained. Can be found.
ここで、効果表現提示欄2070には、用途2071とスコア2075とが表示されることとしている。そのため、選択され得る用途によりスコアの算出方法が異なることとした場合には、ユーザは表示された単語2073におけるスコア2075を把握することで、自らが選択した用途(すなわち、スコアの算出方法)が妥当であったのか否かを認識することができる。その結果、操作に慣れないユーザであっても、繰り返し試すことで、用途に応じてどの様な単語が選択されやすいかを把握できるようになり、ユーザが所望する効果的な単語を容易に見つけることが可能になる。
Here, the
また、効果的な単語を選択するために、意味類義語だけでなく、称呼類義語をも用いている。そのため、キーワードについて思いもよらない、すなわち、意味がかけ離れているが称呼が似ているような単語を選択できる可能性があり、ユーザにとってより効果的な単語を選択することができる。なお、この場合において、入力されたキーワードの類義語のみを対象としているため、全ての単語を対象にする場合に比べて制御負荷を軽減することができるとともに、より効果の高い単語を抽出することができる。 Also, in order to select effective words, not only semantic synonyms but also nominal synonyms are used. Therefore, there is a possibility that a word that does not come to mind about the keyword, that is, a word that has a different meaning but has a similar name, can be selected, and a word that is more effective for the user can be selected. In this case, since only the synonyms of the input keyword are targeted, the control load can be reduced as compared to the case of targeting all words, and more effective words can be extracted. it can.
また、用途に応じた単語のみを選択することとしているため、ユーザにとって意味のない無駄な単語まで表示されず、ユーザに無駄なチェックをさせることがなく、効果的な単語を容易に見つけることが可能になる。この場合において、用途をユーザが設定することができることとしているため、様々な場合に応じた効果的な単語を表示することができる。 In addition, since only words according to usage are selected, unnecessary words that are meaningless to the user are not displayed, and the user can easily find effective words without making unnecessary checks. It becomes possible . In the case of this, since you are able to be the application user to set, it is possible to display the effective words corresponding to various cases.
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施例に記載されたものに限定されるものではない。 As mentioned above, although embodiment of this invention was described, this invention is not restricted to embodiment mentioned above. The effects described in the embodiments of the present invention are only the most preferable effects resulting from the present invention, and the effects of the present invention are limited to those described in the embodiments of the present invention. is not.
例えば、意味類義語辞書21及び称呼類義語辞書23は、ユーザの入力により逐次更新することができるようにしてもよい。すなわち、意味類義語辞書21及び称呼類義語辞書23には、品詞が動詞である単語も登録されているところ、この動詞の活用形などをユーザが後から追加することができることとしてもよい。 For example, the semantic synonym dictionary 21 and the nominal synonym dictionary 23 may be sequentially updated by user input. That is, in the semantic synonym dictionary 21 and the nominal synonym dictionary 23, a word whose part of speech is a verb is also registered. The user can add a utilization form of the verb later.
10 効果表現提示装置
11 ユーザ入力受付部
12 読み抽出部
13 意味類義語抽出部
14 称呼類義語抽出部
15 編集距離算出部
16 効果表現スコア算出部
17 効果表現提示部
100 制御部
200 ハードディスク
DESCRIPTION OF
Claims (5)
前記キーワードの読みを示す文字列を抽出する読み抽出部と、
前記キーワードについての類義語を該類義語の読みを示す文字列とともに抽出する類義語抽出部と、
前記キーワードの文字列と抽出した前記類義語の文字列との近似する程度を示す編集距離を算出する編集距離算出部と、
算出した前記編集距離及び前記キーワードの品詞と前記類義語の品詞とが一致するか否かに基づいて、前記類義語の前記キーワードに対するスコアを算出する効果表現スコア算出部と、
前記類義語を算出した前記スコアに関連付けて提示する効果表現提示部と、
を備えることを特徴とする効果表現提示装置。 An effect expression presentation device for presenting an effective expression for a keyword input by a user,
A reading extractor for extracting a character string indicating the reading of the keyword;
A synonym extraction unit for extracting a synonym for the keyword together with a character string indicating a reading of the synonym;
An edit distance calculating unit for calculating an edit distance indicating a degree of approximation between the character string of the keyword and the extracted character string of the synonym;
An effect expression score calculating unit that calculates a score for the keyword of the synonym based on whether the calculated edit distance and the part of speech of the keyword and the part of speech of the synonym match;
An effect expression presentation unit that presents the synonym in association with the calculated score;
An effect expression presentation device comprising:
前記類義語抽出部は、前記キーワードと意味が類似する意味類義語と、前記キーワードと称呼が類似する称呼類義語と、を抽出することを特徴とする効果表現提示装置。 The effect expression presentation device according to claim 1,
The synonym extraction unit extracts a semantic synonym having a similar meaning to the keyword and a nominal synonym having a similar name to the keyword.
前記効果表現提示部は、前記スコアが所定の範囲内にある類義語のみ提示することを特徴とする効果表現提示装置。 The effect expression presentation device according to claim 1 or 2,
The effect expression presentation unit presents only synonyms whose scores are within a predetermined range.
前記所定の範囲を設定する閾値設定部をさらに備えることを特徴とする効果表現提示装置。 The effect expression presentation device according to claim 3,
An effect expression presenting device, further comprising a threshold setting unit for setting the predetermined range.
前記記憶部に記憶されたプログラムに従い前記制御部が実行する、
前記キーワードの読みを示す文字列を抽出するステップと、
前記キーワードについての類義語を該類義語の読みを示す文字列とともに抽出するステップと、
前記キーワードの文字列と抽出した前記類義語の文字列との近似する程度を示す編集距離を算出するステップと、
算出した前記編集距離及び前記キーワードの品詞と前記類義語の品詞とが一致するか否かに基づいて、前記類義語の前記キーワードに対するスコアを算出するステップと、
前記類義語を算出した前記スコアに関連付けて提示するステップと、
を含む方法。 A computer comprising a control unit and a storage unit is a method for presenting an effective expression for a keyword input by a user,
The control unit executes according to a program stored in the storage unit,
Extracting a character string indicating the reading of the keyword;
Extracting a synonym for the keyword along with a character string indicating a reading of the synonym;
Calculating an edit distance indicating a degree of approximation between the keyword character string and the extracted synonym character string;
Calculating a score for the keyword of the synonym based on the calculated edit distance and whether the part of speech of the keyword and the part of speech of the synonym match;
Presenting the synonym in association with the calculated score;
Including methods.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008168277A JP4922252B2 (en) | 2008-06-27 | 2008-06-27 | Effect expression presentation apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008168277A JP4922252B2 (en) | 2008-06-27 | 2008-06-27 | Effect expression presentation apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010009338A JP2010009338A (en) | 2010-01-14 |
JP4922252B2 true JP4922252B2 (en) | 2012-04-25 |
Family
ID=41589752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008168277A Active JP4922252B2 (en) | 2008-06-27 | 2008-06-27 | Effect expression presentation apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4922252B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3996125B2 (en) * | 2001-09-14 | 2007-10-24 | ソニー株式会社 | Sentence generation apparatus and generation method |
JP4619915B2 (en) * | 2005-10-04 | 2011-01-26 | シャープ株式会社 | PROGRAM DATA PROCESSING DEVICE, PROGRAM DATA PROCESSING METHOD, CONTROL PROGRAM, RECORDING MEDIUM, RECORDING DEVICE, REPRODUCTION DEVICE, AND INFORMATION DISPLAY DEVICE EQUIPPED WITH PROGRAM DATA PROCESSING DEVICE |
-
2008
- 2008-06-27 JP JP2008168277A patent/JP4922252B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010009338A (en) | 2010-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
US10762293B2 (en) | Using parts-of-speech tagging and named entity recognition for spelling correction | |
US8612206B2 (en) | Transliterating semitic languages including diacritics | |
US8726148B1 (en) | Method and apparatus for processing text and character data | |
US7630880B2 (en) | Japanese virtual dictionary | |
US20110055209A1 (en) | System and method for delivering content and advertisments | |
US9875232B2 (en) | Method and system for generating a definition of a word from multiple sources | |
US20120265520A1 (en) | Text processor and method of text processing | |
JP2020067987A (en) | Summary creation device, summary creation method, and program | |
JP4922252B2 (en) | Effect expression presentation apparatus and method | |
JP2009265770A (en) | Significant sentence presentation system | |
JP4783563B2 (en) | Index generation program, search program, index generation method, search method, index generation device, and search device | |
JP5289261B2 (en) | Text conversion device, method and program | |
JP7216241B1 (en) | CHUNKING EXECUTION SYSTEM, CHUNKING EXECUTION METHOD, AND PROGRAM | |
JP7139271B2 (en) | Information processing device, information processing method, and program | |
JP5348699B2 (en) | Data classification system, data classification method and program | |
JP4934102B2 (en) | Apparatus, method, and program for determining grades to be viewed by filtering programs by grade | |
JP5412137B2 (en) | Machine learning apparatus and method | |
JP2011138346A (en) | Device, method and program for estimation of semantic attribute | |
JP5245062B2 (en) | Text information group attribution discrimination support device | |
JP6934621B2 (en) | Methods, equipment, and programs | |
JP4139805B2 (en) | Apparatus, method and program for converting lexical data to data | |
JP5764052B2 (en) | LINK GENERATION DEVICE, LINK GENERATION METHOD, AND LINK GENERATION PROGRAM | |
KR20220045797A (en) | Apparatus and method for providing summarized translation text | |
JP2020123197A (en) | Contract document check device, contract document check method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4922252 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |