JP2008033503A - Highlight device and program - Google Patents

Highlight device and program Download PDF

Info

Publication number
JP2008033503A
JP2008033503A JP2006204466A JP2006204466A JP2008033503A JP 2008033503 A JP2008033503 A JP 2008033503A JP 2006204466 A JP2006204466 A JP 2006204466A JP 2006204466 A JP2006204466 A JP 2006204466A JP 2008033503 A JP2008033503 A JP 2008033503A
Authority
JP
Japan
Prior art keywords
dictionary
highlighting
adverbs
adverb
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006204466A
Other languages
Japanese (ja)
Inventor
Maki Murata
真樹 村田
Toshiyuki Kanamaru
敏幸 金丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Information and Communications Technology
Original Assignee
National Institute of Information and Communications Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Information and Communications Technology filed Critical National Institute of Information and Communications Technology
Priority to JP2006204466A priority Critical patent/JP2008033503A/en
Publication of JP2008033503A publication Critical patent/JP2008033503A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To easily decide whether an inputted sentence is a sentence of a positive image or a sentence of a negative image. <P>SOLUTION: This highlight device has: a storage means 3 storing a dictionary of words of the positive image and the negative image; a retrieval means 21 retrieving a word of the dictionary from the inputted sentence; and a highlight means 22 performing different highlight of the retrieved word by the image. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、著者又は話者の書いた又は話した文章において、プラスのイメージ、又は、マイナスのイメージを持って、書いたのか話したかを、副詞(又は形容詞)を使って判定し、当該副詞(又は形容詞)を強調表示する強調表示装置及びプログラムに関する。例えば、プラスのイメージの副詞(又は形容詞)を青色にマイナスのイメージの副詞(又は形容詞)を赤色に強調表示する。さらに、異なるイメージの副詞(又は形容詞)が同時に使われるような矛盾した状況を利用して、ユーザの副詞(又は形容詞)の誤用を指摘する機能もある。   The present invention uses an adverb (or adjective) to determine whether a sentence written or spoken by an author or speaker has a positive image or a negative image, and whether it was written or not. The present invention relates to a highlighting device and a program for highlighting (or adjective). For example, a positive image adverb (or adjective) is highlighted in blue and a negative image adverb (or adjective) is highlighted in red. In addition, there is also a function that points out misuse of a user's adverb (or adjective) by using an inconsistent situation where adverbs (or adjectives) of different images are used simultaneously.

また、本発明では、WEBブラウザなどの文書閲覧システムにおいて利用可能であり、インターネットエクスプローラーのツールバーとして組み込んで利用できる。   Moreover, in this invention, it can utilize in document browsing systems, such as a WEB browser, and can be integrated and utilized as a toolbar of Internet Explorer.

従来、強調表示装置として、タイトルにあった単語を重要語と判断し、本文中で強調表示する強調表示装置があった(特許文献1参照)。
特開2004−280176号公報
Conventionally, as a highlighting device, there has been a highlighting device that judges a word in a title as an important word and highlights it in the text (see Patent Document 1).
JP 2004-280176 A

従来のタイトルにあった単語を本文中で強調表示するものは、著者または話者のプラス又はマイナスのイメージに基づいて、副詞を本文中で強調表示する技術はなかった。   There is no technique for highlighting an adverb in a text based on a positive or negative image of an author or a speaker, which highlights a word in a conventional title in the text.

本発明は上記問題点の解決を図り、著者又は話者の書いた又は話した文章において、プラスのイメージ、または、マイナスのイメージを持って、書いたのか話したかを、副詞(又は形容詞)を使って判定し、当該副詞(又は形容詞)をイメージにより異なる強調表示をすることを目的とする。   The present invention is intended to solve the above-mentioned problems, and in the sentence written or spoken by the author or speaker, the adverb (or adjective) is used to indicate whether it was written with a positive image or a negative image. The purpose is to highlight the adverbs (or adjectives) differently depending on the image.

図1は本発明の強調表示装置の説明図である。図1中、1は入力部(入力手段)、2は処理部(処理手段)、3は格納部(格納手段)、4は出力部(出力手段)、21は検索部(検索手段)、22は強調表示部(強調表示手段)である。   FIG. 1 is an explanatory diagram of a highlight display device of the present invention. In FIG. 1, 1 is an input unit (input unit), 2 is a processing unit (processing unit), 3 is a storage unit (storage unit), 4 is an output unit (output unit), 21 is a search unit (search unit), 22 Is an emphasis display section (emphasis display means).

本発明は、前記従来の課題を解決するため次のような手段を有する。   The present invention has the following means in order to solve the conventional problems.

(1):プラスのイメージとマイナスのイメージの単語の辞書を格納する格納手段3と、入力された文から前記辞書の単語を検索する検索手段21と、前記検索した単語を前記イメージにより異なる強調表示をする強調表示手段22とを備える。このため、単語の強調表示により、入力された文がプラスのイメージの文かマイナスのイメージの文かを容易に判断することができる。   (1): storage means 3 for storing a dictionary of positive image and negative image words, search means 21 for searching words in the dictionary from inputted sentences, and emphasizing the searched words differently depending on the images. And highlighting means 22 for displaying. Therefore, it is possible to easily determine whether the input sentence is a positive image sentence or a negative image sentence by highlighting the word.

(2):前記(1)の強調表示装置において、前記辞書は、副詞又は形容詞の辞書とする。このため、副詞又は形容詞により文のイメージを容易に判断することができる。   (2): In the highlighting device of (1), the dictionary is an adverb or adjective dictionary. For this reason, the image of a sentence can be easily judged by an adverb or an adjective.

(3):前記(1)又は(2)の強調表示装置において、前記強調表示手段22は、前記入力された文を前記イメージにより異なる強調表示をする。このため、入力された文が、プラスのイメージの文かマイナスのイメージの文かを容易に判断することができる。   (3): In the highlighting device of (1) or (2), the highlighting means 22 highlights the inputted sentence differently depending on the image. Therefore, it is possible to easily determine whether the input sentence is a positive image sentence or a negative image sentence.

(4):前記(2)又は(3)の強調表示装置において、前記副詞又は形容詞の辞書は、出現頻度が多い単語から順に登録して作成する。このため、必要の副詞又は形容詞を容易に辞書に登録することができる。   (4) In the highlighting device of (2) or (3), the adverb or adjective dictionary is created by registering words in descending order of appearance frequency. Therefore, the necessary adverbs or adjectives can be easily registered in the dictionary.

(5):前記(2)〜(4)のいずれかの強調表示装置において、前記副詞又は形容詞の辞書の作成は、単語を意味の近い順に並べ替え、該並べ替えた単語をそのイメージと共に表示して行う。このため、分からない単語のイメージを前後の単語のイメージから容易に類推することができる。   (5): In the highlighting device according to any one of (2) to (4), the creation of the adverb or adjective dictionary is performed by rearranging words in the order of meaning and displaying the rearranged words together with their images. And do it. For this reason, it is possible to easily infer an image of an unknown word from the images of previous and subsequent words.

(6);前記(1)〜(5)のいずれかの強調表示装置において、プラスのイメージとマイナスのイメージの単語が同時に現れる前記入力された文を検出する矛盾検出手段を備える。このため、ユーザに対し副詞又は形容詞等の単語の誤用を指摘することができる。   (6); The highlighting device according to any one of (1) to (5) further includes a contradiction detecting unit that detects the input sentence in which words of a positive image and a negative image appear simultaneously. For this reason, misuse of words, such as an adverb or an adjective, can be pointed out to a user.

(7):前記(1)〜(6)のいずれかの強調表示装置において、前記入力された文を画面表示する出力手段4を備え、前記出力手段4の画面のツールバーに前記強調表示を選択する選択部を備える。このため、この選択部をクリック等で指示して、画面に表示された文を強調表示することができる。   (7): The highlighting device according to any one of (1) to (6), comprising output means 4 for displaying the inputted sentence on the screen, and selecting the highlighting on a toolbar of the screen of the output means 4 The selection part to perform is provided. For this reason, it is possible to highlight the sentence displayed on the screen by instructing the selection unit by clicking or the like.

(8):前記(7)の強調表示装置において、前記強調表示手段22は、前記入力された文のファイルの大きさが所定値より大きい場合、前記強調表示を行わない。このため、ファイルが大きくて時間がかかり過ぎる処理を行うことを防止することができる。   (8): In the highlighting device of (7), the highlighting means 22 does not perform the highlighting when the file size of the input sentence is larger than a predetermined value. For this reason, it is possible to prevent a process in which the file is too large and takes too much time.

(9):前記(7)又は(8)の強調表示装置において、前記入力された文のテキスト処理を正規表現を含む文字列処理が可能なインタプリターなプログラミング言語で行なう。このため、強調表示装置のシステム構築及びメインテナスが容易で、正規表現を含む文字列処理に便利なものである。   (9): In the highlighting device of (7) or (8), text processing of the input sentence is performed in an interpreted programming language capable of character string processing including a regular expression. For this reason, the system construction and maintenance of the highlighting apparatus are easy, and it is convenient for character string processing including regular expressions.

(10):前記(1)〜(9)のいずれかの強調表示装置において、前記辞書である辞書ファイルを交換可能な格納手段3に設け、前記辞書ファイルで各単語をどのように強調表示するかを定義する。このため、副詞、形容詞以外にも同様にファイルを作れば同様に強調表示でき便利となる。   (10): In the highlighting device according to any one of the above (1) to (9), the dictionary file as the dictionary is provided in the exchangeable storage means 3, and how each word is highlighted in the dictionary file Define what. For this reason, if a file is created in the same way other than adverbs and adjectives, it can be highlighted in the same manner, which is convenient.

(11):前記(1)〜(10)のいずれかの強調表示装置において、前記強調表示手段22を交換可能に設け、前記強調表示手段22は、インタプリターなプログラミング言語で作成する。このため、ツールバー本体の外にも、perl等のインタプリターなプログラム言語で、テキストファイルとしてプログラムを持つことができる。   (11): In the highlighting device according to any one of (1) to (10), the highlighting means 22 is provided in a replaceable manner, and the highlighting means 22 is created in an interpreted programming language. For this reason, it is possible to have a program as a text file in an interpreted program language such as perl in addition to the toolbar main body.

(12):プラスのイメージとマイナスのイメージの単語の辞書を格納する格納手段3と、入力された文から前記辞書の単語を検索する検索手段21と、前記検索した単語を前記イメージにより異なる強調表示をする強調表示手段22として、コンピュータを機能させるためのプログラムとする。このため、このプログラムをコンピュータにインストールすることで、入力された文がプラスのイメージの文かマイナスのイメージの文かを容易に判断することができる強調表示装置を容易に提供することができる。   (12): storage means 3 for storing a dictionary of positive image and negative image words, search means 21 for searching words in the dictionary from input sentences, and emphasizing the searched words differently depending on the images. The highlighting means 22 for displaying is a program for causing a computer to function. Therefore, by installing this program in a computer, it is possible to easily provide a highlighting device that can easily determine whether an input sentence is a positive image sentence or a negative image sentence.

本発明によれば次のような効果がある。   The present invention has the following effects.

(1):強調表示手段で、入力された文から検索した単語をイメージにより異なる強調表示をするため、単語の強調表示により、入力された文がプラスのイメージの文かマイナスのイメージの文かを容易に判断することができる。   (1): In order to highlight the word searched from the input sentence differently depending on the image by the highlighting means, whether the input sentence is a positive image sentence or a negative image sentence by word emphasis display. Can be easily determined.

(2):辞書は、副詞又は形容詞の辞書とするため、副詞又は形容詞により文のイメージを容易に判断することができる。   (2): Since the dictionary is a dictionary of adverbs or adjectives, the image of a sentence can be easily determined by adverbs or adjectives.

(3):強調表示手段で、入力された文をイメージにより異なる強調表示をするため、入力された文が、プラスのイメージの文かマイナスのイメージの文かを容易に判断することができる。   (3): Since the input sentence is highlighted differently depending on the image by the highlighting means, it is possible to easily determine whether the input sentence is a positive image sentence or a negative image sentence.

(4):副詞又は形容詞の辞書は、出現頻度が多い単語から順に登録して作成するため、必要の副詞又は形容詞を容易に辞書に登録することができる。   (4): Since a dictionary of adverbs or adjectives is created by registering words in descending order of appearance frequency, necessary adverbs or adjectives can be easily registered in the dictionary.

(5):副詞又は形容詞の辞書の作成は、単語を意味の近い順に並べ替え、該並べ替えた単語をそのイメージと共に表示して行うため、分からない単語のイメージを前後の単語のイメージから容易に類推することができる。   (5): Since the dictionary of adverbs or adjectives is created by rearranging words in order of significance and displaying the rearranged words together with their images, it is easy to create an image of unknown words from the images of previous and subsequent words. It can be analogized to.

(6);矛盾検出手段で、プラスのイメージとマイナスのイメージの単語が同時に現れる前記入力された文を検出するため、ユーザに対し副詞又は形容詞等の単語の誤用を指摘することができる。   (6) Since the contradiction detection means detects the inputted sentence in which the words of the positive image and the negative image appear at the same time, the misuse of words such as adverbs or adjectives can be pointed out to the user.

(7):出力手段の画面のツールバーに強調表示を選択する選択部を備えるため、この選択部をクリック等で指示して、画面に表示された文を強調表示することができる。   (7): Since the selection unit for selecting highlighting is provided on the toolbar of the screen of the output means, it is possible to highlight the sentence displayed on the screen by instructing the selection unit by clicking or the like.

(8):強調表示手段で、入力された文のファイルの大きさが所定値より大きい場合、強調表示を行わないため、ファイルが大きくて時間がかかり過ぎる処理を行うことを防止することができる。   (8): When the file size of the input sentence is larger than the predetermined value by the highlighting means, highlighting is not performed, so that it is possible to prevent the file from being too large and time-consuming. .

(9):入力された文のテキスト処理を正規表現を含む文字列処理が可能なインタプリターなプログラミング言語で行なうため、強調表示装置のシステム構築及びメインテナスが容易で、正規表現を含む文字列処理に便利なものである。   (9): Since the text processing of the input sentence is performed in an interpreted programming language capable of character string processing including regular expressions, the system construction and maintenance of the highlighting device is easy, and the character string processing including regular expressions It is convenient to use.

(10):辞書である辞書ファイルを交換可能な格納手段に設け、前記辞書ファイルで各単語をどのように強調表示するかを定義するため、副詞、形容詞以外にも同様にファイルを作れば同様に強調表示でき便利となる。   (10): A dictionary file, which is a dictionary, is provided in the exchangeable storage means, and in order to define how each word is highlighted in the dictionary file, if a file is similarly created in addition to adverbs and adjectives, It can be highlighted and convenient.

(11):強調表示手段を交換可能に設け、前記強調表示手段はインタプリターなプログラミング言語で作成するため、ツールバー本体の外にも、perl等のインタプリターなプログラム言語で、テキストファイルとしてプログラムを持つことができる。   (11): The highlighting means is provided in a replaceable manner, and the highlighting means is created in an interpreted programming language, so that the program as a text file can be written in an interpreted programming language such as perl in addition to the toolbar body. Can have.

著者又は話者の書いた又は話した文章において、プラスのイメージ、又は、マイナスのイメージを持って、書いたのか話したかを、副詞を使って判定できる。そして、当該副詞を強調表示する。例えば、プラスのイメージの副詞を青色にマイナスのイメージの副詞を赤色に強調表示する。また、一つの文において、異なるイメージの副詞が同時に使われるような矛盾した状況を利用して、ユーザの副詞の誤用を指摘することもできる。   In sentences written or spoken by the author or speaker, it is possible to determine whether an article was written with a positive image or a negative image using an adverb. Then, the adverb is highlighted. For example, a positive image adverb is highlighted in blue and a negative image adverb is highlighted in red. It is also possible to point out the misuse of the user's adverbs by using the contradictory situation where adverbs of different images are used simultaneously in one sentence.

例えば、マイナスのイメージの副詞を利用した場合、そのようなマイナスイメージの単語は使わない方がいいですよと、注意を与えることも可能である。副詞は直接文章の主たる表現の動詞にかかるもので、著者または話者のイメージを直接表すもので、著者または話者のイメージを抽出表示するのに役立つものである。   For example, if you use a negative image adverb, you can be careful not to use such a negative image word. The adverb is directly related to the verb of the main expression of the sentence, and directly expresses the image of the author or the speaker, and is useful for extracting and displaying the image of the author or the speaker.

各副詞がプラス、マイナスのどちらのイメージを持つかの特定には、各副詞がプラス、マイナスのどちらのイメージを持つかを示した辞書を作成し、これに基づいて特定を行っている。この辞書の構築は、まず一般的な文章での副詞の出現率を調べ、出現率の大きい副詞から辞書に登録することで、効率よく網羅性の高い辞書を作成した。   In order to identify whether each adverb has a positive or negative image, a dictionary showing whether each adverb has a positive or negative image is created and specified based on this dictionary. This dictionary was constructed by first checking the adverb appearance rate in general sentences and registering it in the dictionary from adverbs with a high appearance rate, thereby efficiently creating a highly comprehensive dictionary.

この辞書の作成には、文章中において各副詞がプラス、マイナスのどちらのイメージを持つかを意味するタグを付与した教師データを作成し、そのデータから学習などによって特定してもよい。また、内部のテキスト処理には perl プログラム(プログラム言語)を利用し、ツールバーには、visual c(プログラム言語)を利用している。また、プログラムとしては汎用的にしており、強調表示する単語のリストと、そのリストの表記法の定義の二つのファイルをプログラムの外部に持つ形式で作成しており、この二つのファイルを変更することで、様々な処理をするツールバーを作成できるようにもなっている。   In creating this dictionary, teacher data to which a tag indicating whether each adverb has a positive or negative image in a sentence may be created and specified by learning from the data. Also, the perl program (program language) is used for internal text processing, and visual c (program language) is used for the toolbar. In addition, the program is general-purpose, and two files, a list of words to be highlighted and a definition of the notation of the list, are created outside the program, and these two files are changed. This makes it possible to create a toolbar that performs various processes.

(1):強調表示装置の説明
図1は強調表示装置の説明図である。図1において、強調表示装置には、入力部1、処理手段2、格納部3、出力部4が設けてある。処理手段2には、検索部21、強調表示部22が設けてある。
(1): Description of Highlight Display Device FIG. 1 is an explanatory diagram of a highlight display device. In FIG. 1, the highlighting device includes an input unit 1, a processing unit 2, a storage unit 3, and an output unit 4. The processing means 2 is provided with a search unit 21 and an emphasis display unit 22.

入力部1は、キーボード、マウス、読み取り装置等の情報の入力を行う入力手段である。処理手段2は、検索、検出(抽出)、単語の並べ替え、副詞(又は形容詞)の辞書の作成、表示処理等を行う処理手段(装置)である。格納部3は、プラスのイメージ(p)、マイナスのイメージ(n)、中立のイメージ(0)等の評価を付けた副詞(又は形容詞)を格納する辞書(格納手段)である。出力部4は、表示装置、プリンタ等の情報の出力を行う出力手段である。検索部21は、入力された文の中で辞書にある副詞(又は形容詞)を検索する検索手段である。強調表示部22は、検索した副詞(又は形容詞)をイメージにより異なる強調表示を行う強調表示手段である。   The input unit 1 is input means for inputting information such as a keyboard, a mouse, and a reading device. The processing means 2 is processing means (apparatus) that performs search, detection (extraction), word rearrangement, adverb (or adjective) dictionary creation, display processing, and the like. The storage unit 3 is a dictionary (storage means) that stores adverbs (or adjectives) with an evaluation such as a positive image (p), a negative image (n), and a neutral image (0). The output unit 4 is output means for outputting information such as a display device and a printer. The search unit 21 is search means for searching for adverbs (or adjectives) in the dictionary in the input sentence. The emphasis display unit 22 is emphasis display means for emphasizing the searched adverbs (or adjectives) differently depending on the image.

図2は矛盾を指摘する強調表示装置の説明図である。図2において、矛盾を指摘する強調表示装置には、入力部1、処理手段2、格納部3、出力部4が設けてある。処理手段2には、検索部21、強調表示部22、矛盾検出部23が設けてある。   FIG. 2 is an explanatory diagram of a highlighting device that points out contradiction. In FIG. 2, the highlighting device that points out the contradiction is provided with an input unit 1, a processing means 2, a storage unit 3, and an output unit 4. The processing means 2 includes a search unit 21, an emphasis display unit 22, and a contradiction detection unit 23.

矛盾検出部23は、異なるイメージの副詞(又は形容詞)が一つの文(文章)において同時に使われているのを検出して指摘する矛盾検出手段である。この図2の矛盾を指摘する強調表示装置は、図1の構成に矛盾検出部23が追加されたもので、他の構成は図1と同じものである。   The contradiction detection unit 23 is a contradiction detection unit that detects and points out that adverbs (or adjectives) of different images are simultaneously used in one sentence (sentence). The highlighting device for pointing out the contradiction in FIG. 2 is obtained by adding a contradiction detection unit 23 to the configuration in FIG. 1, and the other configuration is the same as that in FIG.

(2):強調表示処理の説明
図3は強調表示処理フローチャートである。以下、図3の処理S1〜S3に従って説明する。
(2): Explanation of Highlight Display Processing FIG. 3 is a flowchart of highlight display processing. Hereinafter, a description will be given according to the processes S1 to S3 in FIG.

S1:入力部1により、文を入力する。   S1: A sentence is input by the input unit 1.

S2:検索部21は、入力された文の中で格納部3の辞書にある副詞(又は形容詞)を検索する。
このとき、検索部21の検索方法は次の2つがある。
S2: The search unit 21 searches for an adverb (or adjective) in the dictionary of the storage unit 3 in the input sentence.
At this time, the search unit 21 has the following two search methods.

(1) 辞書中の副詞(又は形容詞)を、入力された文中の文字列として探す。   (1) Search for adverbs (or adjectives) in the dictionary as character strings in the input sentence.

(2) 入力された文中の形態素解析(単語分割)を行い、単語の品詞を求め、求めた副詞(又は形容詞)を辞書中から検索する(形態素解析を行うと単語分割ができるため抽出エラーが少なくなる)。   (2) Perform morphological analysis (word segmentation) in the input sentence, find the part of speech of the word, and search for the obtained adverb (or adjective) from the dictionary. Less).

S3:強調表示部22は、検索した副詞(又は形容詞)を、イメージにより異なる強調表示をして、出力部4に出力する。   S3: The emphasis display unit 22 displays the retrieved adverbs (or adjectives) in different emphasis depending on the image and outputs them to the output unit 4.

図4は矛盾を指摘する強調表示処理フローチャートである。以下、図4の処理S11〜S15に従って説明する。   FIG. 4 is a flowchart of highlighting processing for indicating a contradiction. Hereinafter, a description will be given according to the processes S11 to S15 of FIG.

S11:入力部1により、文を入力する。   S11: A sentence is input by the input unit 1.

S12:検索部21は、入力された文の中で格納部3の辞書にある副詞(又は形容詞)を検索する。
このとき、検索部21の検索方法は次の2つがある。
S12: The search unit 21 searches for an adverb (or adjective) in the dictionary of the storage unit 3 in the input sentence.
At this time, the search unit 21 has the following two search methods.

(1) 辞書中の副詞(又は形容詞)を、入力された文中の文字列として探す。   (1) Search for adverbs (or adjectives) in the dictionary as character strings in the input sentence.

(2) 入力された文中を形態素解析(単語分割)を行い、単語の品詞を求め、求めた副詞(又は形容詞)を辞書中から検索する(形態素解析を行うと抽出エラーが少なくなる)。   (2) Perform morphological analysis (word division) in the input sentence, find the part of speech of the word, and search the obtained adverb (or adjective) from the dictionary (the morphological analysis reduces the extraction error).

S13:矛盾検出部23は、入力された文にプラスのイメージとマイナスのイメージの副詞(又は形容詞)が同時に使われていないか検出する。この検出でプラスのイメージとマイナスのイメージの副詞(又は形容詞)が同時に使われている(矛盾がある)場合は処理S14に移り、同時に使われていない(矛盾がない)場合は処理S15に移る。   S13: The contradiction detection unit 23 detects whether a positive image and a negative image adverb (or adjective) are used at the same time in the input sentence. In this detection, if the positive image and the negative image adverb (or adjective) are used at the same time (there is a contradiction), the process proceeds to step S14. If they are not used simultaneously (there is no contradiction), the process proceeds to the process S15. .

S14:強調表示部22は、副詞(又は形容詞)の誤用(矛盾)がある表示(文の始めに表示する等)を行う。   S14: The emphasis display unit 22 performs display (such as displaying at the beginning of a sentence) where there is misuse (inconsistency) of an adverb (or adjective).

S15:強調表示部22は、検索した副詞(又は形容詞)を、イメージにより異なる強調表示をして、出力部4に出力する。   S <b> 15: The highlighting unit 22 displays the searched adverbs (or adjectives) differently depending on the image and outputs them to the output unit 4.

(3):強調表示の説明
強調表示とは、文字の色を変えて表示する、文字の背景の色を変える又は網かけを行う、文字の字体を変える(太文字、斜体文字等)、下線付けや括弧で囲む、文字の上に記号等を設ける等で行うことができる。
(3): Explanation of highlighting Highlighting is to change the color of the character, to change the background color of the character or to shade, to change the font of the character (bold, italic, etc.), to underline This can be done by adding a symbol or the like on the character, enclosed in parentheses or enclosed in parentheses.

例えば、文中の副詞を色で強調表示する場合、プラス(肯定性)のイメージ(p)の副詞を青色、マイナス(否定性)のイメージ(n)の副詞を赤色、中立のイメージ(0)の副詞を灰色等とすることができる。   For example, if an adverb in a sentence is highlighted in color, the adverb of the positive (positive) image (p) is blue, the adverb of the negative (negative) image (n) is red, and the neutral image (0) Adverbs can be gray or the like.

強調表示は、文や記事全体をイメージにより強調表示することもでき、また、文書や記事のタイトル自体をイメージにより強調表示することもできる。また、文の前又は後ろにp、n、0等の記号を付けることで表示することもできる。   In highlighting, the entire sentence or article can be highlighted with an image, and the title of the document or article itself can be highlighted with an image. It can also be displayed by adding symbols such as p, n, 0, etc. before or after the sentence.

(4):形態素解析システムの説明
日本語を単語に分割するために、単語抽出部22が行う形態素解析システムが必要になる。ここではChaSenについて説明する(奈良先端大で開発されている形態素解析システム茶筌http://chasen.aist-nara.ac.jp/index.html.jp で公開されている)。
(4): Description of the morpheme analysis system In order to divide Japanese into words, a morpheme analysis system performed by the word extraction unit 22 is required. Here, ChaSen will be explained (published on the morphological analysis system Chasen http://chasen.aist-nara.ac.jp/index.html.jp developed at Nara Institute of Technology).

これは、日本語文を分割し、さらに、各単語の品詞も推定してくれる。例えば、「学校へ行く」を入力すると以下の結果を得ることができる。   This splits the Japanese sentence and also estimates the part of speech of each word. For example, if “go to school” is entered, the following results can be obtained.

学校 ガッコウ 学校 名詞−一般
へ ヘ へ 助詞−格助詞−一般
行く イク 行く 動詞−自立 五段・カ行促音便 基本型
EOS
このように各行に一個の単語が入るように分割され、各単語に読みや品詞の情報が付与される。ここで、分割された単語を抽出の単位に用い、付与された品詞が抽出表現の指定に用いられる。
School Gakkou School Noun-General To He To particle-Case particle-General Go Iku Go Verb-Independence
In this way, each line is divided so that one word is included, and reading and part-of-speech information are given to each word. Here, the divided words are used as extraction units, and the assigned parts of speech are used to specify the extracted expressions.

(5):副詞辞書の構築の説明
日本語の副詞には、程度や動作の様態などを表すもののほかに、ある命題や事柄に対する話し手の感情や判断といった、心理的な態度を表すものも存在することが知られている。しかし、言語処理における評価表現抽出や評判分析など、感性情報を扱う研究では、処理対象から副詞を除外して行われることが多かった。従って、これまで言語処理における副詞の重要性について調査した研究は少ない。これは、情報検索において、副詞が文の命題内容に直接関わらないため、検索に必要なインデックス化の際に、ストップワードとして除外されることが多く、評判分析や意見抽出などの処理でも同様の処理が行われてきたことが原因にあると思われる。また、副詞はその形態が定まっておらず、各副詞個別の出現率もあまり高くないため、評判分析における重要語抽出でも、評価を決定するための重要語として抽出されることは少ない。そのため、副詞の場合は他の評価表現と違い、自動獲得や自動分類ではなく、あらかじめ人手により作成した辞書の形で定義しておくことが望ましい。そこで、我々は話者の態度を記述した副詞辞書を構築した。ここでは、我々が構築した辞書が評判分析のためのデータとして有効であることを示す。我々は、構築した辞書の有効性を確かめるため、以下の調査を行った。まず、辞書のカバー率をWEBテキストを用いて調査した。次に、ランダムに選択したWEBデータに対し、辞書データを用いた評価分類を行い、その精度を確認した。最後にこの副詞辞書の有効性について検討を行った。
(5): Explanation of adverb dictionary construction In addition to the degree and behavioral aspects of Japanese adverbs, there are things that express psychological attitudes such as the speaker's feelings and judgments about certain propositions and matters. It is known to do. However, in research on sensitivity information such as evaluation expression extraction and reputation analysis in linguistic processing, adverbs are often excluded from the processing target. Thus, few studies have so far investigated the importance of adverbs in language processing. This is because adverbs are not directly related to the propositional content of sentences in information retrieval, and are often excluded as stop words when indexing is necessary for retrieval, and the same applies to processes such as reputation analysis and opinion extraction. The cause seems to be that the processing has been performed. In addition, since the form of adverbs is not fixed and the appearance rate of each adverb is not so high, even the extraction of important words in reputation analysis is rarely extracted as an important word for determining evaluation. Therefore, in the case of adverbs, unlike other evaluation expressions, it is desirable to define them in the form of a dictionary created by hand in advance, instead of automatic acquisition or automatic classification. Therefore, we built an adverb dictionary describing the speaker's attitude. Here, we show that the dictionary we built is valid as data for reputation analysis. We conducted the following investigations to confirm the effectiveness of the constructed dictionary. First, dictionary coverage was investigated using WEB text. Next, evaluation classification using dictionary data was performed on randomly selected WEB data, and the accuracy was confirmed. Finally, we examined the effectiveness of this adverb dictionary.

以下、我々は、話者の態度を記述した副詞辞書を構築した。この副詞辞書の構築方法について説明する。   Below, we built an adverb dictionary describing the speaker's attitude. A method for constructing this adverb dictionary will be described.

(1) 対象とした副詞
副詞辞書を構築するにあたり、我々は次の二つの既存辞書を参考にした。一つは、EDRの日本語単語辞書である。
(1) Target adverbs In building an adverb dictionary, we referred to the following two existing dictionaries. One is an EDR Japanese word dictionary.

(EDRの日本語単語辞書の文献)
荻野孝野, 仲尾由雄, 長澤陽子, 小笠原あゆみ (1995). “EDR 電子化辞書における概念体系. ”言語処理学会第1回年次大会発表論文集, pp. 197 −200.
もう一つは、ChaSenで使用されるipadicである。
(Reference for EDR Japanese Word Dictionary)
Takano Kanno, Yoshio Nakao, Yoko Nagasawa, Ayumi Ogasawara (1995). “Conceptual System in EDR Electronic Dictionary.” Proceedings of the 1st Annual Conference of the Language Processing Society, pp. 197 −200.
The other is ipadic used in ChaSen.

(ChaSenで使用されるipadicの文献)
松本裕治, 北内啓, 山下達雄, 平野善隆, 松田寛, 高岡一馬, 浅原正幸 (2000). “日本語形態素解析システム『茶筌』version 2.2.1 使用説明書. ”.
これら2種類の辞書において、副詞と定義されている語を全て抽出した。その結果、表現形で2592副詞を得ることができた。今後、この副詞の集合を便宜上、全副詞と呼ぶ。
(Literature of ipadic used in ChaSen)
Yuji Matsumoto, Kei Kitauchi, Tatsuo Yamashita, Yoshitaka Hirano, Hiroshi Matsuda, Kazuma Takaoka, Masayuki Asahara (2000). “Instruction Manual for Japanese Morphological Analysis“ Chaya ”version 2.2.1.”.
In these two types of dictionaries, all words defined as adverbs were extracted. As a result, 2592 adverbs were obtained in expression form. In the future, this set of adverbs will be called all adverbs for convenience.

(2) 副詞のタグ付けの説明
次に我々は、抽出した副詞に対し、話者の態度の情報を人手で加えることにした。一口に話者の態度といっても、ある事柄に対して好ましいと思っているか、好ましくないと思っているかといった、肯定否定性に関わる態度や、ある事柄が確かであるか、そうでないかといった確信度に関わる態度など、さまざまな話者の態度が存在する。今回我々がタグ付けの対象とした情報は、肯定否定性に関わる態度に関するものである。話者がある出来事を望ましいとか、好ましいと思っているときに使用される副詞を肯定性評価を持つ副詞とし、“p”のタグを付けた。逆に、話者がある出来事を望ましくないとか、好ましくないと思っているときに使用される副詞を否定性評価を持つ副詞とし、“n”のタグを付けた。プラスでもマイナスでもないもの、また文脈によって、プラスにもマイナスにもなるものは中立の副詞とし、“0”のタグを付けた。以下、この評価タグを付けた副詞を評価付き副詞と呼ぶ。
(2) Explanation of adverb tagging Next, we decided to manually add information about the speaker's attitude to the extracted adverb. Speaking of the attitude of a speaker, whether you think it ’s good or bad for something, whether it ’s a positive or negative attitude, whether you ’re certain or not, There are various speaker attitudes, such as attitudes related to confidence. The information we tagged this time is about attitudes related to affirmative negativity. The adverb used when a speaker thinks that an event is desirable or desirable is an adverb with an affirmative rating and is tagged with “p”. Conversely, the adverb used when a speaker thinks that an event is undesirable or undesirable is an adverb with a negative evaluation and is tagged with “n”. Those that are neither plus nor minus, and those that become plus or minus depending on the context, are neutral adverbs and are tagged with “0”. Hereinafter, an adverb with this evaluation tag is called an adverb with evaluation.

今回のタグ付けには、『現代副詞用法辞典』(飛田良文,浅田秀子 (1994). 東京堂出版. ) を参考にした。この辞書は、文脈から独立した副詞の感情的なイメージを7段階のイメージ値によって評価している。評価が中立な語と使われる状況によって評価がどちらにもなりうる語はイメージ値を0とし、プラスでもマイナスでもないとしている。この辞書では、副詞の評価は7段階であったが、我々の評価は、p、0、nの三段階とした。この辞書の評価をそのまま採用すると評価分類が細かくなりすぎ、評価の正確さが分からない状況では、かえって分類精度の確認の負担が増えるだろうと判断したためである。   For this tagging, I referred to the “Modern Adverbic Dictionary” (Ryofumi Tobita, Hideko Asada (1994). Tokyodo Publishing). This dictionary evaluates the emotional image of an adverb independent of context based on seven levels of image values. Words that can be evaluated either neutrally or depending on the situation in which the evaluation is used have an image value of 0 and are neither positive nor negative. In this dictionary, the adverb was evaluated in seven levels, but our evaluation was in three levels: p, 0, and n. This is because if the evaluation of this dictionary is adopted as it is, the evaluation classification becomes too fine, and it is determined that the burden of checking the classification accuracy will increase in the situation where the accuracy of the evaluation is not known.

最初にタグ付けの対象としたのは、全副詞のうち、副詞用法辞典に記載のあった883副詞である。多義性を持つ副詞については、その語の意味の数やその語の各意味が用いられる状況を考慮して判断した。例えば、複数の意味のうち、ほとんどが中立評価として用いられる場合、この副詞には中立評価を与えた。また、複数の意味のうち、肯定性評価と否定性評価の両方が存在する場合、この副詞には同じく中立評価を与えることにした。   The target of tagging first is 883 adverbs described in the adverb usage dictionary among all adverbs. For adverbs with ambiguity, the number of meanings of the word and the circumstances in which each meaning of the word was used were judged. For example, when most of the meanings are used as neutral evaluation, this adverb was given a neutral evaluation. In addition, when both positive and negative evaluations exist among multiple meanings, this adverb is also given a neutral evaluation.

(3)カバー率の調査の説明
最初に評価付き副詞が全副詞に対して、どのくらいのカバー率を持つか調査を行った。ここでカバー率とは、全文集合に対する副詞を含む文の割合ではなく、全副詞に含まれる副詞が含まれる文の集合に対する、今回作成した辞書にある副詞が含まれる文の集合の割合をいう。
(3) Explanation of survey of coverage rate First, we investigated the coverage rate of adverbs with evaluations for all adverbs. Here, the coverage is not the ratio of sentences containing adverbs to the full sentence set, but the ratio of sentences containing adverbs in the newly created dictionary to the set of sentences containing adverbs contained in all adverbs. .

作成した辞書のカバー率が高ければ、まだタグの付いていない副詞へタグ付けを行ったとしても、労力に見合うだけの効果は期待できない。一方、カバー率が低い場合は、辞書に記載された副詞以外にも副詞を追加してタグ付けを行う必要がある。   If the coverage of the created dictionary is high, even if you tag an adverb that has not been tagged yet, you can not expect an effect that is worth the effort. On the other hand, when the coverage is low, it is necessary to add an adverb in addition to the adverb described in the dictionary for tagging.

カバー率の調査には、WEBテキストから抽出した5,635,346文を用意した。これをまず半分に分割し、カバー率の調査におけるクローズドデータとオープンデータとした。まず、クローズドデータに対し、全副詞の文字列一致検索を行った。次に、評価付き副詞も同様に、文字列一致検索を行った。文字列一致検索を行った理由は、副詞が含まれる可能性のある文を調べるため、なるべく多くの文が該当するようにしたためである。通常、品詞ごとの出現割合を調査する場合、形態素解析を行ったものに対して行うが、今回対象とした副詞には、形態素解析で副詞として認定されないものもある。そのため、形態素解析後の調査では副詞のカバー率は下がることが予想される。   For the investigation of the coverage rate, 5,635,346 sentences extracted from the WEB text were prepared. This was first divided in half and used as closed data and open data in the coverage survey. First, string search for all adverbs was performed on closed data. Next, the character string matching search was similarly performed for the adverbs with evaluation. The reason for performing the character string match search is that as many sentences as possible correspond to the sentences that may contain adverbs. Usually, when investigating the appearance ratio for each part of speech, it is performed on the morphological analysis, but some adverbs targeted this time are not recognized as adverbs by the morphological analysis. Therefore, it is expected that the coverage of adverbs will decrease in the survey after morphological analysis.

クローズドデータに対し、全副詞と評価付き副詞の文字列一致検索を行った場合の出現率を表1に示す。




Table 1 shows the appearance rate when a string match search is performed on all adverbs and evaluated adverbs for closed data.




表1:WEBデータ(半数): 2817672文での副詞出現割合
┌───────────┬───┬──────────┐
│全副詞 │74.10%│ (2087938 / 2817672)│
│評価付き副詞 │47.76%│ (1345796 / 2817672)│
├───────────┼───┼──────────┤
│全副詞に対するカバー率│64.45%│ (1345736 / 2087938)│
└───────────┴───┴──────────┘ 全副詞に対する評価付き副詞の割合は64.45%であった。
Table 1: WEB data (half): Adverb appearance rate in 2817672 sentences ┌──────────┬───┬──────────┐
│All adverbs │74.10% │ (2087938/2817672) │
│Evaluated adverb │47.76% │ (1345796/2817672) │
├───────────┼───┼──────────┤
│ Coverage rate for all adverbs │ 64.45% │ (1345736/2087938) │
└───────────┴───┴──────────┘ The ratio of adverbs with evaluations to all adverbs was 64.45%.

この時点では、カバー率が低く、新たにタグ付けをする語を追加して、なるべく多くの副詞に対応する必要があった。評価を新たに付けるべき副詞を選ぶため、全副詞の副詞のうち、出現割合が0.01%以上ある副詞を抽出し、その中から評価付き副詞に含まれていない副詞のリストを作成した。   At this point, the coverage was low and it was necessary to add as many new tags as possible to accommodate as many adverbs as possible. In order to select adverbs that should be newly evaluated, adverbs with an appearance ratio of 0.01% or more are extracted from adverbs of all adverbs, and a list of adverbs that are not included in the adverbs with evaluations is created.

表2:全副詞に含まれ評価付き副詞に含まれない副詞(上位30)
┌───┬───┬─────┬────┬──┬─────┐
│副詞 │ 頻度│ 出現割合│副詞 │頻度│出現割合 │
├───┼───┼─────┼────┼──┼─────┤
│よう │153717│ 5.455461 │一度 │9019│ 0.320087 │
│いと │ 59405│ 2.108301 │略 │6421│ 0.227883 │
│えて │ 55248│ 1.960768 │将 │6369│ 0.226038 │
│いか │ 37263│ 1.322475 │これまで│6287│ 0.223127 │
│ちら │ 33609│ 1.192793 │一切 │6124│ 0.217343 │
│然 │ 26095│ 0.926119 │たた │5716│ 0.202863 │
│転 │ 21767│ 0.772517 │共に │5423│ 0.192464 │
│早 │ 17294│ 0.613769 │確か │5160│ 0.183130 │
│万 │ 17231│ 0.611533 │しっかり│4603│ 0.163362 │
│もち │ 16504│ 0.585732 │以来 │4117│ 0.146114 │
│後に │ 10132│ 0.359588 │どうして│4105│ 0.145688 │
│いや │ 9848│ 0.349508 │本に │3964│ 0.140684 │
│みんな│ 9797│ 0.347698 │はた │3854│ 0.136780 │
│かく │ 9543│ 0.338684 │主に │3819│ 0.135537 │
│ポイ │ 9216│ 0.327079 │うまく │3803│ 0.134970 │
└───┴───┴─────┴────┴──┴─────┘
Table 2: Adverbs that are included in all adverbs and not included in adverbs with evaluation (top 30)
┌───┬───┬─────┬────┬──┬─────┐
│ adverb │ frequency │ appearance rate │ adverb │ frequency │ appearance rate │
├───┼───┼─────┼────┼──┼─────┤
│Yo │153717│ 5.455461 │Once │9019│ 0.320087 │
│ Ito │ 59405 │ 2.108301 │ Abbreviated │6421│ 0.227883 │
│Eye │ 55248│ 1.960768 │General │6369│ 0.226038 │
│Ika │ 37263 │ 1.322475 │So far │6287│ 0.223127 │
│Chira │ 33609 │ 1.192793 │ All │6124│ 0.217343 │
│ │ 26095 │ 0.926119 │ tat │5716│ 0.202863 │
│ Roll │ 21767 │ 0.772517 │ Both │5423 │ 0.192464 │
│ Early │ 17294 │ 0.613769 │ Certainly │5160 │ 0.183130 │
│10,000 │ 17231 │ 0.611533 │ Firmly │4603 │ 0.163362 │
│ Mochi │ 16504 │ 0.585732 │ Since │4117 │ 0.146114 │
│After │ 10132│ 0.359588 │Why│4105│ 0.145688 │
│ No │ 9848 │ 0.349508 │ Book │ 3964 │ 0.140684 │
│ Everyone │ 9797 │ 0.347698 │ Hata │3854│ 0.136780 │
│Kaku │ 9543│ 0.338684 │Mainly │3819│ 0.135537 │
│Poi │ 9216│ 0.327079 │Good │3803│ 0.134970 │
└───┴───┴─────┴────┴──┴─────┘

表3:全副詞から取り除く副詞の条件
┌──────────┐
│形容(動)詞の連用形│
│形容(動)詞の語幹 │
│ひらがな2文字以下 │
│カタカナ2文字以下 │
│漢字1文字 │
│名詞+助詞 │
│他の品詞と共通 │
│他の語の一部 │
└──────────┘


Table 3: Adverb conditions to be removed from all adverbs ┌──────────┐
│Consecutive form of adjectives |
│The stem of adjective │
│Two or less hiragana characters │
│Less than 2 katakana characters │
│ 1 Kanji character │
│Noun + particle │
│Common with other parts of speech │
│Some other words │
└───────────┘


表4:WEBデータ(半数): 2817672文での副詞出現割合(修正後)
┌───────────┬───┬──────────┐
│全副詞(修正前) │74.10%│ (2087938 / 2817672)│
│全副詞(修正後) │53.64%│ (1511389 / 2817672)│
│評価付き副詞 │47.76%│ (1345796 / 2817672)│
├───────────┼───┼──────────┤
│全副詞に対するカバー率│89.04%│ (1345736 / 1511389)│
└───────────┴───┴──────────┘
Table 4: Web data (half): Adverb appearance rate in 2817672 sentences (after correction)
┌───────────┬───┬──────────┐
│All adverbs (before revision) │74.10% │ (2087938/2817672) │
│All adverbs (after correction) │53.64% │ (1511389/2817672) │
│Evaluated adverb │47.76% │ (1345796/2817672) │
├───────────┼───┼──────────┤
│Coverage rate for all adverbs│89.04% │ (1345736/1511389) │
└───────────┴───┴──────────┘

表2より以下に示すような副詞が多く含まれていることが分かる。
・形容( 動) 詞の語幹
・ひらがな2文字以下
・カタカナ2文字以下
・漢字1文字
・名詞+助詞
これらの副詞は、文字列一致検索を行った場合、単語の一部に一致する可能性が高い。その結果、非常に多くの文に含まれているという誤った結果がでてしまう可能性がある。従って、全副詞のみに存在する表3の条件に該当した副詞を人手で取り除いた。
It can be seen from Table 2 that many adverbs as shown below are included.
・ Adjective (dynamic) verb stems ・ Two or less hiragana characters ・ Two or less katakana characters ・ One kanji character ・ Nouns + particles These adverbs may match part of a word when performing a string match search high. As a result, there is a possibility that an erroneous result that it is included in a very large number of sentences may appear. Therefore, the adverbs corresponding to the conditions in Table 3 existing only in all adverbs were manually removed.

表4に全副詞から条件に合致した副詞を取り除く修正を行う前と修正を行った後の副詞の出現割合を示す。なお、修正は全副詞にのみ出現している副詞を対象に行っているので、評価付き副詞の数に変化はない。   Table 4 shows the appearance ratio of adverb before and after the correction to remove the adverb that matches the condition from all adverbs. Since the correction is performed on adverbs that appear only in all adverbs, the number of adverbs with evaluation does not change.

これらの条件に合致した副詞を全副詞から取り除いたところ、全副詞のカバー率は20.46%減少し、53.64%となった。この値で全副詞に対する評価付き副詞の割合を再計算するとカバー率は89.04%となった。   When adverbs that met these conditions were removed from all adverbs, the coverage of all adverbs decreased by 20.46% to 53.64%. When the ratio of adverbs with evaluation to all adverbs was recalculated with this value, the coverage was 89.04%.

全副詞のみに含まれる、出現割合が0.01%以上ある副詞を抽出し、そこから、表3の条件に合致した副詞を取り除いたところ、残った副詞は105語となった。表5に残った副詞の例を示す。   When adverbs with an appearance ratio of 0.01% or more included in all adverbs were extracted, and adverbs that met the conditions in Table 3 were removed from them, the remaining adverbs were 105 words. Table 5 shows examples of remaining adverbs.

表6に、副詞を追加した後の全副詞に対するカバー率を示す。副詞の追加により、評価付き副詞の全副詞に対するカバー率は97.48%になった。これは十分実用レベルとなる数値である。














Table 6 shows the coverage for all adverbs after adding adverbs. With the addition of adverbs, the coverage of all adverbs with evaluated adverbs is 97.48%. This is a numerical value that is sufficiently practical.














表5:新たに追加した副詞(上位30)
┌─────┬──┬─────┬────┬──┬─────┐
│副詞 │頻度│ 出現割合│副詞 │頻度│ 出現割合│
├─────┼──┼─────┼────┼──┼─────┤
│一度 │9019│ 0.320087 │再度 │2117│ 0.075133 │
│これまで │6287│ 0.223127 │たった │1989│ 0.070590 │
│一切 │6124│ 0.217343 │沢山 │1969│ 0.069880 │
│共に │5423│ 0.192464 │きちんと│1876│ 0.066580 │
│しっかり │4603│ 0.163362 │すなわち│1785│ 0.063350 │
│以来 │4117│ 0.146114 │比較的 │1734│ 0.061540 │
│どうして │4105│ 0.145688 │そろそろ│1631│ 0.057885 │
│主に │3819│ 0.135537 │唯一 │1592│ 0.056501 │
│ちゃんと │3640│ 0.129185 │予め │1577│ 0.055968 │
│わりに │2558│ 0.090784 │おかげで│1509│ 0.053555 │
│数多 │2549│ 0.090465 │じっくり│1311│ 0.046528 │
│本来 │2469│ 0.087626 │同じく │1310│ 0.046492 │
│このように│2421│ 0.085922 │こうして│1277│ 0.045321 │
│正しく │2299│ 0.081592 │すっかり│1258│ 0.044647 │
│一層 │2176│ 0.077227 │ゆったり│1235│ 0.043831 │
└─────┴──┴─────┴────┴──┴─────┘
Table 5: New adverbs (top 30)
┌─────┬──┬─────┬┬────┬──┬─────┐
│ adverb │ frequency │ appearance rate │ adverb │ frequency │ appearance rate │
├─────┼──┼─────┼┼────┼──┼─────┤
│ Once │9019 │ 0.320087 │ Again │2117 │ 0.075133 │
│Previous │6287│ 0.223127 │Only │1989│ 0.070590 │
│All │6124│ 0.217343 │Many │1969│ 0.069880 │
│Both │5423│ 0.192464 │Night│1876│ 0.066580 │
│Secure │4603│ 0.163362 │That is │1785│ 0.063350 │
Since │4117│ 0.146114 │Relatively │1734│ 0.061540 │
│Why │4105│ 0.145688 │Soon │1631│ 0.057885 │
│Mainly │3819│ 0.135537 │Only │1592│ 0.056501 │
│Properly │3640│ 0.129185 │Preliminary │1577│ 0.055968 │
│Instead │2558│ 0.090784 │Thanks │1509│ 0.053555 │
│ Many │ 2549 │ 0.090465 │ Carefully │ 1311 │ 0.046528 │
│Original │2469│ 0.087626 │Also │1310│ 0.046492 │
│Like this │2421 │ 0.085922 │ thus │1277 │ 0.045321 │
│ Correctly │ 2299 │ 0.081592 │ Complete │ 1258 │ 0.044647 │
│ One layer │ 2176 │ 0.077227 │ Loose │ 1235 │ 0.043831 │
└─────┴──┴─────┴┴────┴──┴─────┘

表6:WEBデータ(半数):2817672 文での副詞出現割合(副詞追加後)
┌───────────┬────┬──────────┐
│全副詞(修正前) │ 74.10% │(2087938 / 2817672) │
│全副詞(修正後) │ 53.64% │(1511389 / 2817672) │
│評価付き副詞(追加前)│ 47.76% │(1345796 / 2817672) │
│評価付き副詞(追加後)│ 52.29% │(1473297 / 2817672) │
├───────────┼────┼──────────┤
│全副詞に対するカバー率│ 97.48% │(1473297 / 1511389) │
└───────────┴────┴──────────┘
Table 6: WEB data (half): 2817772 Adverb appearance rate in sentence (after adverb addition)
┌───────────┬────┬──────────┐
│All adverbs (before revision) │ 74.10% │ (2087938/2817672) │
│All adverbs (after correction) │ 53.64% │ (1511389/2817672) │
│ adverb with evaluation (before addition) │ 47.76% │ (1345796/2817672) │
│ adverb with evaluation (after addition) │ 52.29% │ (1473297/2817672) │
├───────────┼────┼──────────┤
│ Coverage rate for all adverbs │ 97.48% │ (1473297/1511389) │
└───────────┴────┴──────────┘

(4) 評価付き副詞の追加の説明
前節で、全副詞から抽出した出現率が0.01%を超える副詞から、文字列一致検索時に、誤って文字列の一部に該当しそうな副詞を取り除いた残り105副詞に対し、新たにタグ付けを行った。
(4) Additional explanation of adverbs with evaluation In the previous section, adverbs that appeared to be part of the string by mistake were removed from adverbs with an appearance rate exceeding 0.01% extracted from all adverbs. The remaining 105 adverbs were newly tagged.

新しく追加した副詞に、肯定、否定、中立の基準によるタグを付与する際には、分類語彙表(国立国語研究所(編) (2004).大日本図書) を利用した。分類語彙表に存在する副詞については、分類語彙表の番号を付与し、その番号順に副詞を並び替えた。これにより、あらかじめ評価タグがついている副詞と新たに追加された副詞とが、意味の近い順に並び替えられることになる。   When adding tags based on positive, negative, and neutral criteria to newly added adverbs, the classification vocabulary table (National Institute for Japanese Language (Ed.) (2004). Dai Nippon Library) was used. For adverbs existing in the classification vocabulary table, numbers in the classification vocabulary table are assigned, and the adverbs are rearranged in the order of the numbers. Thereby, the adverb with the evaluation tag in advance and the newly added adverb are rearranged in the order of the meaning.

意味ソートを利用した辞書構築の例として、次の論文がある。
村田真樹, 神崎享子, 内元清貴, 馬青, 井佐原均(2000). “意味ソートmsort * 意味的並べかえ手法による辞書の構築例とタグツキコーパスの作成例と情報提示システム例. ”自然言語処理, pp. 51−66.
この論文では、意味ソートを利用した辞書構築の例があげられているが、上記分類語彙表の番号を付与し、その番号順に副詞を並び替えの方法は、上記論文で提案された「意味ソート」の手法を利用した方法と見ることができる。実際の例を表7に挙げる。
The following paper is an example of dictionary construction using semantic sorting.
Masaki Murata, Kyoko Kanzaki, Kiyotaka Uchimoto, Mao Ai, Hitoshi Isahara (2000). “Semantic sort msort * Example of dictionary construction and semantic tagging corpus creation and information presentation system.” Natural language processing , pp. 51-66.
In this paper, an example of dictionary construction using semantic sorting is given. The method of assigning numbers in the above categorized vocabulary table and rearranging adverbs in the order of those numbers is the “Semantic Sorting” proposed in the above paper. Can be seen as a method using the method of "." Actual examples are listed in Table 7.

分類語彙表を利用することで、あらかじめ評価タグが付けられた副詞を参考にすることが可能になり、比較的短時間で効率的にタグ付けを行うことができた。表7中の*がついた副詞が、新たに追加すべき副詞である。表から分かるようにその上下(周囲)に既にタグを振った副詞が存在するので、それらのタグを参考にしながら、タグ付けを行う(上下が同じなら同じタグ付けを行う)ことができた。この場合、それぞれの副詞に対し、“0”のタグを付与した。   By using the classification vocabulary table, it became possible to refer to adverbs with pre-evaluated tags, and tagging could be done efficiently in a relatively short time. Adverbs with * in Table 7 are adverbs to be newly added. As can be seen from the table, there are already adverbs with tags attached above and below (around), so we were able to tag them with reference to those tags (if the top and bottom were the same, we could do the same tagging). In this case, a tag of “0” was assigned to each adverb.

なお、分類語彙表に収録されていない副詞については、全て人手で判断し、タグを付与することにした。   All adverbs that are not included in the categorized vocabulary table are judged manually and given a tag.

表7:分類語彙表を用いたタグ付けの例
┌───────┬─────────┐
│分類語彙表番号│副詞 評価 │
├───────┼─────────┤
│3100030201 │けっして 0 │
│3100030201 │決して 0 │
│3100040102 │たしかに* “0 ”│
│3100050101 │どうやら p │
│3100050102 │多分 0 │
│3100050103 │恐らく n │
│3100050104 │おおかた 0 │
│3100050105 │たしか* “0 ”│
│3100050106 │大概 0 │
│3100050201 │まず 0 │
│3100050302 │まあまあ 0 │
│3100050502 │正に n │
│3100050504 │なんでも 0 │
└───────┴─────────┘
Table 7: Example of tagging using a classification vocabulary table ┌───────┬─────────┐
│Classified vocabulary table number│Adverb evaluation │
├───────┼─────────┤
│3100030201 │Never 0 │
│3100030201 │Never 0 │
│3100040102 │ Certainly * “0” |
│3100050101 │ Apparently p │
│3100050102 │Maybe 0 │
│3100050103 │Probably n │
│3100050104 │Okata 0 │
│3100050105 │ Certainly * “0” |
│3100050106 │Generally 0 │
│3100050201 │First 0 │
│3100050302 │Okay 0 │
│3100050502 │Exactly n │
│3100050504 │Anything 0 │
└───────┴─────────┘

(5) 副詞辞書の評価の説明
a)副詞辞書の評価実験
作成した評価付き副詞の精度を調査する評価実験を行った。評価実験は、WEBテキストから1000文をランダムに抽出し、副詞辞書に該当する副詞を含んでいる場合に、評価タグを出力し、肯定的な文、否定的な文、中立の文に分類するものである。
(5) Explanation of Adverb Dictionary Evaluation a) Adverbic Dictionary Evaluation Experiment An evaluation experiment was conducted to investigate the accuracy of the created adverb dictionary with evaluation. In the evaluation experiment, 1000 sentences are randomly extracted from the WEB text, and when an adverb corresponding to the adverb dictionary is included, an evaluation tag is output and classified into a positive sentence, a negative sentence, and a neutral sentence. Is.

ここで、肯定的な文、否定的な文とは、次のような定義とする。
その文の書き手が文で表されている内容を好ましい又は良いこととして捉えている場合、これを肯定的な文と呼ぶことにする。それとは逆に、その文の書き手が文で表されている内容を好ましくない又は、悪いこととして捉えている場合、これを否定的な文と呼ぶことにする。そのどちらでもない場合は中立な文とする。この評価基準に基づいて、抽出した文を人手で判断し、正解を作成した。
Here, the positive sentence and the negative sentence are defined as follows.
If the writer of the sentence sees the content expressed in the sentence as favorable or good, it will be called a positive sentence. On the other hand, if the writer of the sentence regards the content expressed in the sentence as being unfavorable or bad, it will be called a negative sentence. If it is neither, make a neutral sentence. Based on this evaluation standard, the extracted sentence was judged manually and the correct answer was created.

次に、各文に対し、作成した辞書を用いて、対象とする文に辞書に含まれる副詞がある場合に、辞書に基づいた、肯定“p”、否定“n”、中立“0”の分類を行った。その後、辞書による分類p、n、0、のそれぞれについて、正否を判断した。   Next, using the created dictionary for each sentence, if there is an adverb included in the dictionary in the target sentence, positive “p”, negative “n”, neutral “0” based on the dictionary Classification was performed. Thereafter, whether each of the classifications p, n, 0 by the dictionary is correct or not was determined.

評価実験は、辞書へのデータ追加前の副詞883語と追加後の988語を用いた以下の2種類を行った。
1. 1,000文−追加前883 語
2. 1,000文−追加後988 語
In the evaluation experiment, the following two types were used, using 883 words of adverb before adding data to the dictionary and 988 words after adding data.
1. 1,000 sentences-883 words before addition
2. 1,000 sentences-988 words after addition

表8:副詞追加前辞書での結果
┌───────┬────────┬────────┬──┐
│ │ 再現率 │ 精度 │F値│
├───────┼────────┼────────┼──┤
│全正解率 │85% (175 / 205) │85% (175 / 205) │85% │
│中立のみ │89% (151 / 170) │94% (151 / 160) │91% │
│肯定のみ │78% (18 / 23) │55% (18 / 33) │64% │
│否定のみ │50% (6 / 12) │50% (6 / 12) │50% │
│肯定,否定のみ│69% (24 / 35) │53% (24 / 45) │60% │
└───────┴────────┴────────┴──┘
Table 8: Results in the pre-adverb dictionary ┌───────┬────────┬────────┬──┐
│ │ Reproducibility │ Accuracy │ F value │
├───────┼────────┼────────┼──┤
│ Total accuracy rate │85% (175/205) │85% (175/205) │85% │
│ Neutral only │89% (151/170) │94% (151/160) │91% │
│Affirmation only │78% (18/23) │55% (18/33) │64% │
│Negation only │50% (6/12) │50% (6/12) │50% │
│Affirmation, Denial only│69% (24/35) │53% (24/45) │60% │
└───────┴────────┴────────┴──┘

表9:副詞追加後辞書での結果
┌───────┬────────┬────────┬──┐
│ │ 再現率 │ 精度 │F値│
├───────┼────────┼────────┼──┤
│全正解率 │86% (200 / 233) │86% (200 / 233) │86% │
│中立のみ │89% (166 / 187) │95% (166 / 175) │92% │
│肯定のみ │84% (27 / 32) │60% (27 / 45) │70% │
│否定のみ │50% (7 / 14) │54% (7 / 13) │52% │
│肯定,否定のみ│74% (34 / 46) │59% (34 / 58) │65% │
└───────┴────────┴────────┴──┘
Table 9: Results in dictionary after adverb ┌───────┬────────┬────────┬──┐
│ │ Reproducibility │ Accuracy │ F value │
├───────┼────────┼────────┼──┤
│ Total accuracy rate │86% (200/233) │86% (200/233) │86% │
│ Neutral only │89% (166/187) │95% (166/175) │92% │
│Affirmation only │84% (27/32) │60% (27/45) │70% │
│Negation only │50% (7/14) │54% (7/13) │52% │
│Affirmation, Denial only│74% (34/46) │59% (34/58) │65% │
└───────┴────────┴────────┴──┘

b)評価実験の結果と考察
実験の結果を表8、表9に示す。
表8は、副詞辞書に新たな副詞を追加する前での結果を示しており、表9は、副詞を追加した後の辞書を用いたときの分類結果を示している。
b) Results and discussion of evaluation experiment Tables 8 and 9 show the results of the experiment.
Table 8 shows the result before adding a new adverb to the adverb dictionary, and Table 9 shows the classification result when using the dictionary after adding the adverb.

表8、表9において、全正解率とは、辞書に含まれる副詞が存在する文が肯定的か否定的か中立的かの3分類でどの分類に該当するかを、出力によらず判断したものである。肯定、否定のみは、辞書を用いた肯定、否定、中立の判断のうち、出力が肯定か否定だったもののみの精度と再現率を計算したものである。中立のみ、肯定のみ、否定のみはそれぞれ、辞書による分類毎に精度と再現率を出したものである。例えば、肯定のみは、該当文が肯定的な評価と辞書により判断されたものを対象に、精度と再現率を求めている。   In Tables 8 and 9, the total correct answer rate was determined regardless of the output in which of the three categories of positive, negative or neutral sentences with adverbs included in the dictionary. Is. Only affirmation and negation are calculated from the accuracy and recall of only affirmation, denial, and neutral judgments using a dictionary whose output was affirmative or negative. Neutral only, positive only, and negative only indicate accuracy and recall for each classification by dictionary. For example, only for affirmation, accuracy and recall are obtained for a sentence in which the corresponding sentence is determined by a positive evaluation and a dictionary.

精度は、正解に対する辞書により分類された項目の内、正解したものの割合である。再現率は、分類された項目の内部における、正解の割合である。また、性能評価の基準として、F値を計算した。ここでF値は、精度と再現率の調和平均とする。   The accuracy is a ratio of correct answers among items classified by the dictionary for correct answers. The recall is the percentage of correct answers within the classified item. Further, the F value was calculated as a standard for performance evaluation. Here, the F value is a harmonic average of accuracy and recall.

辞書に含まれる副詞を含んだ文は、追加前の辞書で205文、副詞追加後の辞書で233文であった。   Sentences containing adverbs included in the dictionary were 205 sentences in the dictionary before addition and 233 sentences in the dictionary after addition of the adverb.

副詞辞書による話者の態度の分類結果は、肯定的か否定的か中立的かの3分類で追加前が85%の正解率、追加後が86%の正解率であった。   The results of classification of speaker attitudes by adverb dictionary were positive, negative or neutral, with an accuracy rate of 85% before addition and an accuracy rate of 86% after addition.

辞書により肯定的、もしくは否定的と分類されたもののF値は、追加前の辞書で60%副詞追加後の辞書では65%であった。3分類のベースラインが33%であることを考慮すると、比較的高い精度といえる。   The F value of those classified as positive or negative by the dictionary was 60% in the dictionary before addition and 65% in the dictionary after addition of the adverb. Considering that the baseline of the three categories is 33%, it can be said that the accuracy is relatively high.

肯定性の判断は、追加前のF値が64%、追加後では70%であった。一方、否定性の分類におけるF値は、追加前が50%、追加後が52%と肯定的な態度の分類に比べると低い。   The determination of affirmation was 64% before the addition and 70% after the addition. On the other hand, the F value in the negative classification is 50% before the addition and 52% after the addition, which is lower than the positive attitude classification.

辞書による出力が誤っていた例について検討する。以下の例は、1000文に対し、副詞を追加した後の辞書を使用した場合の結果による。   Consider an example of incorrect dictionary output. The following example is based on the result of using a dictionary after adding adverbs to 1000 sentences.

まず、肯定、否定どちらでもない文に対し、どちらかに分類してしまった誤りについて検討する。この種の誤りの例を以下に示す。各項目の辞書の項目の後に書いてあるのが,辞書により出力された肯定、否定、中立の判断である。正解は、人手により判断された回答を示している。   First, we will consider errors that have been classified as either positive or negative. An example of this type of error is shown below. What is written after the dictionary item of each item is affirmative, negative, or neutral judgment output by the dictionary. The correct answer indicates an answer determined manually.

・肯定否定無し
− Dear 登志夫先生、[どうも]お世話になりました。
・ No affirmation-Dear Toshio Dear, thank you very much.

(辞書:否定,正解:中立)
−ケン・ウィルバーという、[おそらく]時代を画するよう
な若い思想家がいて、『進化の構造』(松永太郎訳、春秋
社)という本を書いています。
(Dictionary: negative, correct: neutral)
-Ken Wilber, a young thinker who has [probably] marked the times, wrote the book "Structure of Evolution" (translated by Taro Matsunaga, Shunjusha).

(辞書:否定,正解:中立)
−内容によっては返信いたしかねる場合もございますので、
[あしからず]ご了承ください。
(Dictionary: negative, correct: neutral)
-Depending on the content, we may not be able to reply.
[Ashikazu] Please note.

(辞書:否定,正解:中立)
−いつものように[一応]やりながら、意識は丹田に集中
させトク、トクと発電機が動き出し、赤い火の玉ができ
るとそれを上昇させ、脳幹からエネルギーを送り出した。
(Dictionary: negative, correct: neutral)
-As usual, while concentrating, the consciousness was concentrated in Tanda, and the Toku, Toku and the generator started to move, and when a red fireball was formed, it was raised and energy was sent from the brainstem.

(辞書:肯定,正解:中立)
−統計は、全国平均や地域的なもの、また業種別なもの等
がとれますので、[当然]、畑幹事長がおっしゃったよう
に全国的統計、関東地域、東京会のなかの統計、という
いくつかのデータの中で、選択して作るようになる。
(Dictionary: positive, correct: neutral)
-Since statistics can be national averages, regional ones, and industry-specific ones, [Naturally], as Mr. Hata said, national statistics, statistics in the Kanto region, and the Tokyo Association. Select some of the data to make.

(辞書:肯定,正解:中立)
これらの文では、副詞が話者の態度のうち、事態に対する確信度の表出として使われていたり、特定の言い回しの一部として使用されている。
(Dictionary: positive, correct: neutral)
In these sentences, adverbs are used as an expression of confidence in the situation of the speaker or as part of a specific phrase.

前者の場合、これら副詞には話者の肯定や否定といった態度を示す働きはあまりなく、「当然」や「おそらく」などは、話し手が事態の起こりやすさをどう考えているかを示す機能の方が強いものと思われる。   In the former case, these adverbs do not have much work to show the attitude of speaker affirmation or denial, and “natural” and “probably” are functions that indicate how the speaker thinks about the likelihood of a situation. Seems to be strong.

副詞は、このような事態の確信度についても示すことがあり、これについては今後、辞書に追加する予定である。このような確信度に関わる副詞は、肯定や否定といった態度の側面があまり感じられない場合が存在することが分かった。   Adverbs may also indicate the certainty of such a situation, which will be added to the dictionary in the future. It has been found that there are cases where adverbs related to such a certainty do not feel the aspect of attitude such as affirmation or denial.

一方、「あしからず」や「どうも」などは、挨拶表現に典型的に見られる副詞である。これらの副詞は、あまり意味はなく、定型表現の一つとして用いられている。このような表現についても、話者の事態に対する態度を読み取ることが難しい。   On the other hand, “Ashikazu” and “Komo” are adverbs typically found in greeting expressions. These adverbs have little meaning and are used as one of the standard expressions. Even for such expressions, it is difficult to read the attitude of the speaker to the situation.

次に、肯定否定が逆であった例を示す。
−あー、[ついに]やっちまった。
Next, an example in which affirmative negation is reversed is shown.
-Oh, [Finally] I'm done.

(辞書:肯定,正解:否定)
−しかも予約の申込数は予定数をはるかに上まわり、地方
でこんな出版は、[おそらく]近来なかったのではない
かと消息通も言い出す状況である。
(Dictionary: positive, correct: negative)
-Moreover, the number of applications for reservations is far higher than planned, and in the region, such publications [probably] have come to the news that they may not have come.

(辞書:否定,正解:肯定)
−技術を超えた感性あふれるそのパフォーマンスに、来賓、
学校関係者、在校生、卒業生、父母ら会場を埋め尽くし
た約七百人の聴衆は[すっかり]魅了された。
(Dictionary: negative, correct answer: positive)
-To the performance full of sensibility beyond technology,
The audience of about 700 people who filled the venue, including school officials, current students, graduates, and parents, was fascinated.

(辞書:否定,正解:肯定)
否定的な文にもかかわらず、辞書により肯定的と判断されたものには、あまり適切でないと思われる副詞の使用をしているものが見られた。例えば、「ついに」についてであるが、「ついに」は、達成など継続した動作、行動の結果を表す場合に用いる方がよい。そのため、「ついに」からは肯定的な態度を読み取ることができる。この場合には「とうとう」などの副詞を使用する方が妥当と思われる。
(Dictionary: negative, correct answer: positive)
In spite of the negative sentences, the ones that were judged positive by the dictionary were those that used adverbs that seemed less appropriate. For example, regarding “Finally”, “Finally” is better used to indicate the result of continuous action or action such as achievement. Therefore, a positive attitude can be read from “Finally”. In this case, it seems more appropriate to use an adverb such as “Totou”.

また「おそらく」は、肯定否定なしのところで述べたように、事態に対する確信度について示しており、ここでは、肯定否定とは異なる話者の態度を示すために用いられている。そのため、ここでの「おそらく」からは、否定性をあまり読み取ることができない。   Also, “probably” indicates the degree of confidence in the situation as described in the absence of affirmation and denial, and is used here to indicate a speaker's attitude different from affirmation and negation. Therefore, from this “probably”, negation cannot be read much.

辞書のタグ付けの際に参照した『現代副詞用法辞典』では、「おそらく」は以下のように説明されている。   “Possibly” is explained as follows in the “Modern Adverbial Dictionary”, which was referred to when tagging a dictionary.

実現があまり好ましくない事柄について、危惧や疑問の暗示を伴って推量する様子を あらわすことが多い。
好ましい事柄の可能性を推量する場合には、ふつう「たぶん」「きっと」などを用い る。
It often shows how to make a guess about the things that are less desirable to realize, with the suggestion of fears and questions.
When guessing the possibility of a favorable matter, “probably” or “probably” is usually used.

従って、この場合も「たぶん」を使用した方がふさわしかったものと思われる。   Therefore, it seems that it was more appropriate to use “Maybe” in this case as well.

今後は、事態の確信度に関する情報を付与し、事態への肯定、否定を問題にしているのか、それとも、事態の確信度を問題としているのかを区別し、その優先度について検討していく必要があると思われる。   In the future, it will be necessary to give information on the certainty of the situation, distinguish whether it is a matter of affirmation or denial of the situation, or whether it is a matter of confidence in the situation, and consider its priority There seems to be.

c)副詞辞書の有効性の検討
次に、この辞書の有効性について検討した。その結果について述べる。
c) Examination of effectiveness of adverb dictionary Next, the effectiveness of this dictionary was examined. The results will be described.

この辞書が有効に用いられるのは、以下のような時が考えられる。
1.文書作成時に、否定的に書いていないかチェックを行う。
2.文書作成時に、文脈にふさわしくない副詞を使用していないかチェックを行う。
3.文書読解時に、文の肯定性、否定性を自動的に判断、表示する。
4.肯定的な文、否定性な文を自動的に収集、分類する。
This dictionary can be used effectively at the following times.
1. When writing a document, check whether it is written negatively.
2. Check that adverbs that are not appropriate for the context are used when creating the document.
3. Automatically determine and display the affirmative / negative of sentences when reading a document.
4. Automatically collect and classify positive and negative sentences.

まず、文書作成時には、この辞書を使うことで、否定的な態度を表出していないかどうかチェックすることができる。レビューなどの個人的な感想を述べる場合を除き、一般に、文書に否定的な態度を表出することは、コミュニケーションの円滑さを阻害する可能性があるため、あまり望ましくない。この辞書を利用することで、特に副詞について、無意識的に、否定的な態度を表出していた場合でもそのことに気がつくことが可能となっている。   First, when creating a document, it is possible to check whether a negative attitude is expressed by using this dictionary. In general, expressing negative attitudes to documents is less desirable because it can hinder the smoothness of communication, except when stating personal feedback such as reviews. By using this dictionary, it is possible to notice this even when the negative attitude is expressed unconsciously, especially for adverbs.

次に、文脈にふさわしくない副詞の指摘については、別の手法を使って、文の肯定性、否定性を判断した際、その肯定性、否定性がこの辞書による判断と逆だった場合に副詞の使用法が誤っていたり、誤解を招きやすいものである確率が高いことを利用する。   Next, regarding the indication of adverbs that are not suitable for the context, when using a different method to determine the affirmation and negativity of the sentence, the adverb Take advantage of the high probability that the usage is incorrect or misleading.

例えば、前節で「ついに」や「おそらく」などを間違いの例として取り上げたが、それらの例のように文脈から判断される肯定性や否定性と副詞が持つ肯定性や否定性とが矛盾する場合は、使用法が間違っており、他にふさわしい副詞が存在していることが多い。そこで、使用者に他の副詞を検討するように示唆することが可能になる。   For example, “Finally” and “Probably” were taken up as examples of mistakes in the previous section. However, as in these examples, the affirmation and negativity judged from the context and the affirmation and negativity of adverbs are contradictory. In many cases, the usage is wrong and there are other suitable adverbs. It is then possible to suggest the user to consider other adverbs.

このような副詞の用法の誤り判断に使えそうなものは、1000文中19文、副詞を含む文では46文中の19文にそのような例が存在していた。従って、副詞を含んだ文のみを対象にした場合、41.30%の確率で文を指摘することが可能である。   There are 19 examples out of 1000 sentences that are likely to be used to judge errors in the usage of adverbs, and 19 sentences out of 46 sentences that contain adverbs. Therefore, when only sentences containing adverbs are targeted, it is possible to point out sentences with a probability of 41.30%.

文書読解時には、この辞書を利用して、否定的な副詞が含まれる文と肯定的な文が含まれる場合で色を変えて出力するなどのシステムが考えられる。これにより否定的な表現があった場合に、文書全体を通して否定的な態度を取っているのか、それとも、一次的に過ぎないのかを判断することが可能になる。   When reading a document, a system that uses this dictionary and outputs a sentence that contains a negative adverb and a sentence that contains a positive sentence can be considered. As a result, when there is a negative expression, it is possible to determine whether a negative attitude is taken throughout the document or whether it is only primary.

一方、肯定性、否定性をWEBから収集していく場合には,辞書により、肯定、もしくは否定と表現された文や文書を収集すればよい。この場合、1000文あたり34文が得られているため、3.4%の確率で収集できることになる。この数値は一見かなり低いが、副詞辞書の利点として、文脈や分野によらず、肯定性、否定性を判断することが可能なため、評判表現抽出の初期において、使用することができる。   On the other hand, when affirmative and negative are collected from WEB, sentences and documents expressed as affirmative or negative may be collected using a dictionary. In this case, since 34 sentences are obtained per 1000 sentences, it can be collected with a probability of 3.4%. Although this number is quite low at first glance, it can be used at the initial stage of reputation expression extraction because it is possible to judge affirmation and negativity regardless of the context and field as an advantage of the adverb dictionary.

これにより、例えば評価表現抽出のためのシードを作成するなどの利用法が考えられる。まず、この辞書で文を肯定的なものと否定的なものにわけ、それぞれのグループから評価表現を抽出する。従来では、評価表現抽出のシードとして、人手で集めることがあったが、この辞書を使うことで、初期の作業を自動化することも可能になるのではないかと思われる。   Thereby, for example, a use method such as creating a seed for extracting an evaluation expression is conceivable. First, in this dictionary, sentences are divided into positive ones and negative ones, and evaluation expressions are extracted from each group. In the past, there was manual collection as a seed for evaluation expression extraction, but it seems that it will be possible to automate the initial work by using this dictionary.

(6) おわりに
我々は、話者の態度を記述した副詞辞書を構築し、副詞が評判分析のための基本データとして有効であることを調査した。構築した副詞辞書は全副詞の出現率に対して、105語を追加した998語の辞書はEDRとChaSenのipadicから抽出した全副詞に対し、出現割合で97.77%のカバー率であった。
(6) Conclusion We constructed an adverb dictionary describing the speaker's attitudes and investigated that adverbs are useful as basic data for reputation analysis. The constructed adverb dictionary has a coverage rate of 97.77% in terms of the appearance rate of all adverbs extracted from EDR and ChaSen's ipadic in the 998 word dictionary with 105 words added to the adverb rate of all adverbs. .

我々は辞書の副詞998語に対して、話者がある出来事を望ましいとか、好ましいと思っているときに使用される副詞を肯定性評価を持つ副詞として、逆に、話者がある出来事を望ましくないとか、好ましくないと思っているときに使用される副詞を否定性評価を持つ副詞として、それぞれタグを付与した。プラスでもマイナスでもないもの、また文脈によって、プラスにもマイナスにもなるものは中立の副詞とした。辞書の精度を確認するため、辞書を用いた文の評価分類を行った。人手により分類の正解を作成し、辞書による分類精度を求めたところ、1000文を対象に実験した結果、分類の正解率で86%、肯定性、否定性の分類ではF値で65%であった。   For 998 adverbs in the dictionary, the adverb used when the speaker wants or prefers an event is considered an adverb with an affirmative rating. Each adverb used when it was thought that it was not desirable or not was an adverb with a negative evaluation, and a tag was assigned to each adverb. Those that are neither positive nor negative, and those that are positive or negative depending on the context, are neutral adverbs. In order to confirm the accuracy of the dictionary, sentence classification using a dictionary was performed. The correct answer of classification was created manually and the accuracy of classification was calculated using a dictionary. As a result of experiments on 1000 sentences, the correct answer rate for classification was 86%, and the positive and negative classifications were 65% for F value. It was.

なお、上記では副詞辞書について説明したが、形容詞辞書も同様にして作成することができる。   Although the adverb dictionary has been described above, an adjective dictionary can be created in the same manner.

(6):ツールバー表示の説明
ツールバーの本体の部分(インタフェース部分、WEB情報の取得表示など)は visual c のプログラミング言語で作成し、ツールバーの外側の部分であるテキスト処理(文の文字列処理)は、Perlのプログラミング言語で作成する。
(6): Explanation of toolbar display The main part of the toolbar (interface part, acquisition and display of WEB information, etc.) is created in the visual c programming language, and text processing (sentence character string processing) that is the part outside the toolbar Create with Perl programming language.

Perlは、インタプリターな言語(事前にコンパイルせずに、実行時にコンパイルして動作する。速度は遅いがメインテナス、システム構築が容易)であり、また、正規表現を含む文字列処理に便利なものである。   Perl is an interpreted language (it compiles and runs at run time without compiling in advance. It is slow, but maintenance and system construction is easy), and is useful for string processing including regular expressions. It is.

ツールバー本体(インタフェース部分、WEB情報の取得表示など) では、html(hypertext markup language )の表示を行う。テキスト処理を正規表現を含む文字列処理が可能なインタプリターなプログラミング言語では、元のhtmlを変換して新しいhtmlを作る。ツールバー本体(インタフェース部分、WEB情報の取得表示など) で新しいhtmlの表示を行うようにする。html内部に、強調表示したい単語にはhtmlのタグで色付けなど行う。   In the tool bar body (interface part, WEB information acquisition display, etc.), html (hypertext markup language) is displayed. In an interpreted programming language capable of processing a character string including a regular expression, a new html is created by converting the original html. A new html is displayed on the main body of the toolbar (interface portion, WEB information acquisition display, etc.). Inside the html, a word to be highlighted is colored with an html tag.

また、辞書ファイルを外部(交換可能)に持って、ファイルで単語と、各単語の色を定義して、それに基づいて強調表示することもできる。副詞以外(形容詞等)も同様にファイルを作れば同様に強調表示でき便利なものである。例えば、副詞辞書を入れれば副詞が強調表示され、形容詞辞書を入れれば形容詞が強調表示され、両方の辞書を入れれば両方が強調表示されることになる。なお、人名辞書を入れて人名の強調表示を行うこともできる。   It is also possible to bring the dictionary file to the outside (replaceable), define the word in the file and the color of each word, and highlight the word based on it. Other than adverbs (adjectives, etc.) can be highlighted in the same way if a file is created. For example, an adverb dictionary is highlighted when an adverb dictionary is inserted, an adjective is highlighted when an adjective dictionary is inserted, and both are highlighted when both dictionaries are inserted. It is also possible to highlight a person name by putting a person name dictionary.

さらに、別のperlプログラムを外部(交換可能)に持って、そのプログラムにより、強調表示することもできる。perlは、インタプリターな言語なので、ツールバー本体の外にもテキストファイルとしてプログラムを持つことができる。そのプログラムを交換すると、ほとんどあらゆる他の種類のhtmlの変更が可能となる。これは、強調表示にとどまらないものである。このような変更が外のプログラムを修正するだけでできるようになる。   Furthermore, another perl program can be brought outside (replaceable) and highlighted by that program. Since perl is an interpreted language, you can have a program as a text file outside the toolbar itself. Replacing the program allows almost any other kind of html change. This is more than just highlighting. Such changes can be made simply by modifying the outside program.

また、強調表示手段22で、強調表示する入力された文のファイルの大きさが所定値より大きい(この所定値は入力する部分を設けてユーザが自由に設定できるようになっている)場合、強調表示を行わないようにする。これは、強調表示する入力された文であるhtmlファイルが大きくて時間がかかり過ぎる処理を行うことを防止するものである。   Further, when the size of the file of the input sentence to be highlighted is larger than a predetermined value by the highlighting means 22 (this predetermined value can be set freely by the user by providing an input portion), Avoid highlighting. This prevents the html file, which is the input sentence to be highlighted, from being large and taking too much time.

本発明は、インターネットエクスプローラーのツールバーとして組み込んで利用できる。   The present invention can be used by being incorporated as a toolbar of Internet Explorer.

図5はツールバー表示の説明図である。図5において、出力装置4の表示画面30には、最上段にはデータのタイトル31、2段目には処理を指定するコマンド列32、3段目には閲覧している場所を示している。4段目にはツールバーにオプション領域を設け、オプション領域を選択(指定)すると、「headline」、「副詞」、「原子記号」等の表示が現れる。なお、オプション領域の代わりの直接「headline」、「副詞」、「原子記号」等の表示を設けることもできる。   FIG. 5 is an explanatory diagram of the toolbar display. In FIG. 5, the display screen 30 of the output device 4 shows the title 31 of the data in the top row, the command string 32 for specifying the processing in the second row, and the viewing location in the third row. . In the fourth row, an option area is provided on the tool bar. When the option area is selected (designated), displays such as “headline”, “adverb”, and “atomic symbol” appear. It is also possible to provide a direct display of “headline”, “adverb”, “atomic symbol”, etc. instead of the option area.

この「副詞」を選択することにより、図3、図4の処理が行われ、下の画面35に表示されている文(テキストデータ)の副詞(又は形容詞)をイメージにより異なる強調表示を行う。また、「副詞」を再度選択することにより強調表示されない通常の表示に戻すことができる。   By selecting this “adverb”, the processing of FIG. 3 and FIG. 4 is performed, and the adverb (or adjective) of the sentence (text data) displayed on the lower screen 35 is highlighted differently depending on the image. Further, by selecting “adverb” again, it is possible to return to a normal display that is not highlighted.

なお、「headline」を選択することにより、画面35に表示されている文書(テキストデータ)のタイトルに出てくる重要語を強調表示することができる。また、「原子記号」を選択することにより、文書(画面35)中の原子記号を強調表示するものである。   By selecting “headline”, it is possible to highlight an important word appearing in the title of the document (text data) displayed on the screen 35. Also, by selecting “atomic symbol”, the atomic symbol in the document (screen 35) is highlighted.

(7):具体例の説明
形容詞と副詞の例を評価ごとに文例を含めて説明する。副詞の方はWEBテキストの例も含んでいる。それぞれ順番に0( 中立) 、p(肯定的)、n(否定的)の順に副詞(形容詞)例文という形で記している。また、該当する副詞(形容詞)は[]でくくっている。
(7): Description of specific examples Examples of adjectives and adverbs will be described for each evaluation including sentence examples. The adverb includes examples of WEB text. They are written in the form of adverb (adjective) example sentences in the order of 0 (neutral), p (positive), and n (negative), respectively. In addition, the relevant adverbs (adjectives) are enclosed in [].

・副詞の例

たまたま &image のように、CGI 呼び出し中の& に続くパラメタが、[たまた ま]定義されている実体参照と同じだった場合にもこの警告が出るこ とがあります。
[たまたま]近くを通りかかったのでお寄りしました。
・ Example of adverb 0
You may also get this warning if, as in & image, the parameter following & in the CGI call is the same as the entity reference defined.
[Sincidentally] I stopped by as I passed by.

ほとんど 98年のナビスコカップ準優勝以外は[ほとんど]結果を残せていな い。
昨日は[ほとんど]一日中家で本を読んでいた。
Almost no result except [98] Nabisco Cup runner-up.
Yesterday [almost] reading books at home all day.

急遽 13 日に変更したばかりでしたが、折角の七五三お参りでしたので [急遽]変更いたしました。
課長の急死で出張先から[急遽]呼び戻された。
It was just changed on the 13th, but it was changed suddenly because it was a round trip.
The section manager suddenly died and was called back from the business trip destination.

徐々に、 父親も電車に興味があり、そこから[徐々に]電車に興味を持ち始 めた。
SL は[徐々に]スピードを上げていった。
Gradually, his father was also interested in the train, and from there [gradually] began to be interested in the train.
SL was [slowly] speeding up.

要するに CyberBookとは、[要するに]コンピュータ上で読む本のことです 。
私が言いたいのは、[要するに]日本の政治は今のままではだめだ ということです。
In short, a CyberBook is a book that you read on your computer.
I would like to say that [in short] Japanese politics can't be as it is now.


すかさず [すかさず]、取り出して、美味しいステーキをお皿にスタンバイ させる。
西武の選手は四球で塁に出ると[すかさず]走る。
p
Susakazu [Sukasazu], take it out and put a delicious steak on the plate.
Seibu's player runs [Sukaazu] when he goes to the base in the four balls.

ふんだんに "食" に関する" 役立つノウハウ" ," おいしい情報" [ふんだん に]詰まっているチャンネル。
バターを[ふんだんに]使ってケーキを焼いた。
Channels that are full of “helpful know-how” and “delicious information” about “food”.
I baked the cake with [bundant] butter.

ようやく "デジタルカメラ" が[ようやく]本当のカメラになってくれて、 すっごくうれしいです!
一週間降り続いた雨が[ようやく]上がった。
Finally, the “digital camera” has finally become a real camera.
The rain that lasted for a week went up.

早速 16 日付け、沖縄タイムス社の『北谷町伊平の県道23号(国体道 路)沿い米軍嘉手納基地内から古墓発見』の記事を見て[早速]見に 行ってきました。
電話の修理を頼んだら[早速]やってきてくれた。
On the 16th, I went to see the Okinawa Times article, “I found an old grave from inside Kadena US Army along Prefectural Road No. 23 (Kokutan Road) on Chatancho Ippei”.
[Immediately] when I asked to repair my phone.

断然 CATV 回線を使った通信だから、[断然]速い!
犬を飼うなら[断然]秋田犬だね。
Because it is communication using the CATV line, it is [absolutely] fast!
If you keep a dog, [by far] it's an Akita dog.

n
せいぜい 1 年に[せいぜい]6 人の歌手だけが選ばれるという訳だ。
今のうちに[せいぜい]遊んでおくんだね。
n
At best, only six singers are selected in the year.
I'll be playing [at best] now.

ややもすれば しかし、教員主導のコンピュータの授業は、[ややもすれば]、単 純にソフトウェアの使い方を知らせるだけになりがちです。
この問題は[ややもすれば]大事件に発展しかねない危険性をはら んでいる。
However, faculty-led computer classes tend to simply inform you how to use the software.
This problem has a risk that [if any] could develop into a major case.

わざわざ 2〜3 年前の話では、「ISO 」のために[わざわざ]新たに雇い入 れたという話もありましたが、そうでなくても従業員の方々が「ISO 」に費やす時間を計算していくと相当なものになります。
奴は[わざわざ]俺に聞こえるように言ったんだ。
Two or three years ago, there was a story that [newly] hired for "ISO", but even if that was not the case, employees would calculate the time spent on "ISO" As you do it will be substantial.
He told me to bother me.

まだしも (サービスなら[まだしも]、しっかり勘定に入っており、おおむ ねマズイときている)これは当たり前のように習慣化しているが、居 酒屋の禁じ手の第一である。
傘だけなら[まだしも]鞄まで電車の中に忘れてきたのよ。
Mashimo (If it's a service [Mashimoshi], it's a good account, and it's usually a muzzle.) This is a habit of course, but it's the forbidden first of a tavern.
If you only have an umbrella, you have forgotten on the train to [Moshishimo].

無理矢理 22 時くらいまでは全然静かで、ボーカルが「イエーイ、みんな乗 ってるね」などと状況と違う事を言って[無理矢理]盛り上げようと して失笑してしまうほどでした。
男は嫌がる子供を[無理矢理]引きずっていった。
It was quite quiet until around 22:00, and the vocals laughed as they tried to excite them by saying something different from the situation such as “Yay, everyone is riding”.
The man dragged the child he hated.

・形容詞の例

まぶしい [まぶしい]真夏の太陽が照りつける。
何気ない 彼の[何気ない]一言が彼女をひどく傷つけた。
言い難い 他人には[言い難い]事情がある。
著しい 両者の間には[著しい]違いがある。
根強い そのベテラン俳優には[根強い]人気がある。
・ Example of adjectives 0
[Dazzling] The midsummer sun shines.
Casually his [quick] word hurt her badly.
Difficult to say Other people have [difficult] circumstances.
There are [significant] differences between the two.
Persistent The veteran actor is [persistent] popular.


初々しい 新入生の新しい制服姿は何とも[初々しい]。
懐かしい 都会にいると故郷の野山が[懐かしい]。
情け深い 裁判官は[情け深い]判決を申し渡した。
清々しい 彼は[清々しい]印象を残して去っていった。
慎ましい 彼は誰の前でも[慎ましい]態度を崩さない。
p
Innocent New student's new uniform appearance is [Innocent].
Nostalgia When I am in the city, my hometown Noyama is [nostalgic].
The compassionate judge handed down the [compassionate] judgment.
He was leaving with a [fresh] impression.
Humble He does not break his [modest] attitude in front of anyone.


耐えがたい 彼の暴言は[耐えがたい]侮辱だ。
疑わしい 彼が一人でいたかどうか[疑わしい]ところだ。
見苦しい 彼の髪型はじつに[見苦しい]。
執念深い 奴はヘビのように[執念深い]男だ。
情けない まだ一回も勝てないとは[情けない]。
n
Unbearable His rant is an [unbearable] insult.
Suspicious Whether he was alone [suspected].
Unsightly His hairstyle is actually [unsightly].
A tenacious guy, like a snake.
It ’s not sad that I have n’t won yet.

(8):プログラムインストールの説明
入力部(入力手段)1、処理部(処理手段)2、格納部(格納手段)3、出力部(出力手段)4、検索部(検索手段)21、強調表示部(強調表示手段)22、矛盾検出部(矛盾検出手段)23等は、プログラムで構成でき、主制御部(CPU)が実行するものであり、主記憶に格納されているものである。このプログラムは、一般的な、コンピュータ(情報処理装置)で処理されるものである。このコンピュータは、主制御部、主記憶、ファイル装置、表示装置、キーボード等の入力手段である入力装置などのハードウェアで構成されている。このコンピュータに、本発明のプログラムをインストールする。このインストールは、フロッピィ、光磁気ディスク等の可搬型の記録(記憶)媒体に、これらのプログラムを記憶させておき、コンピュータが備えている記録媒体に対して、アクセスするためのドライブ装置を介して、或いは、LAN等のネットワークを介して、コンピュータに設けられたファイル装置にインストールされる。そして、このファイル装置から処理に必要なプログラムステップを主記憶に読み出し、主制御部が実行するものである。
(8): Explanation of program installation Input unit (input unit) 1, processing unit (processing unit) 2, storage unit (storage unit) 3, output unit (output unit) 4, search unit (search unit) 21, highlighting The unit (highlight display unit) 22, the contradiction detection unit (contradiction detection unit) 23, and the like can be configured by a program, and are executed by the main control unit (CPU) and stored in the main memory. This program is processed by a general computer (information processing apparatus). This computer is composed of hardware such as an input device as input means such as a main control unit, main memory, file device, display device, and keyboard. The program of the present invention is installed on this computer. In this installation, these programs are stored in a portable recording (storage) medium such as a floppy disk or a magneto-optical disk, and a drive device for accessing the recording medium provided in the computer is used. Alternatively, it is installed in a file device provided in the computer via a network such as a LAN. Then, the program steps necessary for processing are read from the file device into the main memory and executed by the main control unit.

本発明の強調表示装置の説明図である。It is explanatory drawing of the highlight display apparatus of this invention. 本発明の矛盾を指摘する強調表示装置の説明図である。It is explanatory drawing of the highlight display apparatus which points out the contradiction of this invention. 本発明の強調表示処理フローチャートである。It is an emphasis display processing flowchart of the present invention. 本発明の矛盾を指摘する強調表示処理フローチャートである。It is a highlighting process flowchart which points out the contradiction of this invention. 本発明のツールバー表示の説明図である。It is explanatory drawing of the toolbar display of this invention.

符号の説明Explanation of symbols

1 入力部(入力手段)
2 処理部(処理手段)
3 格納部(格納手段)
4 出力部(出力手段)
21 検索部(検索手段)
22 強調表示部(強調表示手段)
1 Input section (input means)
2 processing unit (processing means)
3. Storage unit (storage means)
4 Output section (output means)
21 Search part (search means)
22 Highlight display section (highlight display means)

Claims (12)

プラスのイメージとマイナスのイメージの単語の辞書を格納する格納手段と、
入力された文から前記辞書の単語を検索する検索手段と、
前記検索した単語を前記イメージにより異なる強調表示をする強調表示手段とを備えることを特徴とした強調表示装置。
Storage means for storing a dictionary of positive and negative image words;
Search means for searching for words in the dictionary from input sentences;
A highlighting device comprising highlighting means for highlighting the searched word differently depending on the image.
前記辞書は、副詞又は形容詞の辞書であることを特徴とした請求項1記載の強調表示装置。   2. The highlighting apparatus according to claim 1, wherein the dictionary is an adverb or adjective dictionary. 前記強調表示手段は、前記入力された文を前記イメージにより異なる強調表示をすることを特徴とした請求項1又は2記載の強調表示装置。   The highlighting apparatus according to claim 1 or 2, wherein the highlighting means highlights the inputted sentence differently depending on the image. 前記副詞又は形容詞の辞書は、出現頻度が多い単語から順に登録して作成することを特徴とした請求項2又は3記載の強調表示装置。   The highlighting apparatus according to claim 2 or 3, wherein the adverb or adjective dictionary is created by registering words in descending order of appearance frequency. 前記副詞又は形容詞の辞書の作成は、単語を意味の近い順に並べ替え、該並べ替えた単語をそのイメージと共に表示して行うことを特徴とした請求項2〜4のいずれかに記載の強調表示装置。   5. The highlighting according to claim 2, wherein creation of the adverb or adjective dictionary is performed by rearranging words in order of meaning and displaying the rearranged words together with their images. apparatus. プラスのイメージとマイナスのイメージの単語が同時に現れる前記入力された文を検出する矛盾検出手段を備えることを特徴とした請求項1〜5のいずれかに記載の強調表示装置。   6. The highlighting apparatus according to claim 1, further comprising a contradiction detecting unit that detects the input sentence in which a word of a positive image and a negative image appear simultaneously. 前記入力された文を画面表示する出力手段を備え、
前記出力手段の画面のツールバーに前記強調表示を選択する選択部を備えることを特徴とした請求項1〜6のいずれかに記載の強調表示装置。
An output means for displaying the input sentence on a screen;
The highlighting apparatus according to claim 1, further comprising a selection unit that selects the highlighting on a toolbar of the screen of the output unit.
前記強調表示手段は、前記入力された文のファイルの大きさが所定値より大きい場合、前記強調表示を行わないことを特徴とした請求項7記載の強調表示装置。   8. The highlighting apparatus according to claim 7, wherein the highlighting unit does not perform the highlighting when the size of the input sentence file is larger than a predetermined value. 前記入力された文のテキスト処理を正規表現を含む文字列処理が可能なインタプリターなプログラミング言語で行なうことを特徴とした請求項7又は8記載の強調表示装置。   9. The highlighting apparatus according to claim 7, wherein the text processing of the inputted sentence is performed in an interpreted programming language capable of character string processing including a regular expression. 前記辞書である辞書ファイルを交換可能な格納手段に設け、
前記辞書ファイルで各単語をどのように強調表示するかを定義することを特徴とした請求項1〜9のいずれかに記載の強調表示装置。
Provide the storage means that can exchange the dictionary file that is the dictionary,
The highlighting apparatus according to claim 1, wherein how to highlight each word in the dictionary file is defined.
前記強調表示手段を交換可能に設け、
前記強調表示手段は、インタプリターなプログラミング言語で作成されたものであることを特徴とした請求項1〜10のいずれかに記載の強調表示装置。
The highlighting means is provided interchangeably,
The highlighting apparatus according to claim 1, wherein the highlighting means is created in an interpreted programming language.
プラスのイメージとマイナスのイメージの単語の辞書を格納する格納手段と、
入力された文から前記辞書の単語を検索する検索手段と、
前記検索した単語を前記イメージにより異なる強調表示をする強調表示手段として、
コンピュータを機能させるためのプログラム。
Storage means for storing a dictionary of positive and negative image words;
Search means for searching for words in the dictionary from input sentences;
As a highlighting means for highlighting the searched word differently depending on the image,
A program that allows a computer to function.
JP2006204466A 2006-07-27 2006-07-27 Highlight device and program Pending JP2008033503A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006204466A JP2008033503A (en) 2006-07-27 2006-07-27 Highlight device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006204466A JP2008033503A (en) 2006-07-27 2006-07-27 Highlight device and program

Publications (1)

Publication Number Publication Date
JP2008033503A true JP2008033503A (en) 2008-02-14

Family

ID=39122878

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006204466A Pending JP2008033503A (en) 2006-07-27 2006-07-27 Highlight device and program

Country Status (1)

Country Link
JP (1) JP2008033503A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103645911A (en) * 2013-11-01 2014-03-19 北京奇虎科技有限公司 Obtaining and modification method and device for highlight colors
JP2020024559A (en) * 2018-08-07 2020-02-13 Zホールディングス株式会社 Information processing program, information processing apparatus, and information processing method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04207639A (en) * 1990-11-30 1992-07-29 Nec Corp Selective calling receiver with display device
JPH08339371A (en) * 1995-06-09 1996-12-24 Casio Comput Co Ltd Document output device and character modification method
JP2003295999A (en) * 2002-04-05 2003-10-17 Sharp Corp Information processing device
JP2004240597A (en) * 2003-02-05 2004-08-26 Fuji Xerox Co Ltd Display control method, information display processing system, client's terminal, management server, and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04207639A (en) * 1990-11-30 1992-07-29 Nec Corp Selective calling receiver with display device
JPH08339371A (en) * 1995-06-09 1996-12-24 Casio Comput Co Ltd Document output device and character modification method
JP2003295999A (en) * 2002-04-05 2003-10-17 Sharp Corp Information processing device
JP2004240597A (en) * 2003-02-05 2004-08-26 Fuji Xerox Co Ltd Display control method, information display processing system, client's terminal, management server, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103645911A (en) * 2013-11-01 2014-03-19 北京奇虎科技有限公司 Obtaining and modification method and device for highlight colors
CN103645911B (en) * 2013-11-01 2017-11-21 北京奇虎科技有限公司 Acquisition, amending method and the equipment of highlight color
JP2020024559A (en) * 2018-08-07 2020-02-13 Zホールディングス株式会社 Information processing program, information processing apparatus, and information processing method
JP7231354B2 (en) 2018-08-07 2023-03-01 ヤフー株式会社 Information processing program, information processing apparatus, and information processing method

Similar Documents

Publication Publication Date Title
US11551567B2 (en) System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
US20180366013A1 (en) System and method for providing an interactive visual learning environment for creation, presentation, sharing, organizing and analysis of knowledge on subject matter
Chen et al. PreCo: A large-scale dataset in preschool vocabulary for coreference resolution
Juola et al. A prototype for authorship attribution studies
CN111259631B (en) Referee document structuring method and referee document structuring device
US20070112554A1 (en) System of interactive dictionary
Oelke et al. Visual readability analysis: How to make your writings easier to read
Scott The genitive case in Dutch and German: A study of morphosyntactic change in codified languages
Hickey Corpus presenter: software for language analysis with a manual and" A corpus of Irish English" as sample data
JP2008287517A (en) Highlighting device and program
Fraser et, al.(2015)
Wynne Searching and concordancing
JP3899414B2 (en) Teacher data creation device and program, and language analysis processing device and program
Wu et al. Supporting collocation learning with a digital library
Bertsch et al. Detection of puffery on the english wikipedia
Seadle Managing and mining historical research data
CN117436414A (en) Presentation generation method and device, electronic equipment and storage medium
JPH04152466A (en) Mechanical translation system
JP2008033503A (en) Highlight device and program
Salway et al. Investigating Curatorial Voice with Corpus Linguistic Techniques: the case of Dorothy George and applications in museological practice
Tursunov Description of the management system programs of the national corpus of the uzbek language
JP2002123544A (en) Retrieval preprocessing apparatus, document retrieving apparatus, and retrieval preprocessing method and document retrieving method
Schulz et al. From 0 to 10 million annotated words: part-of-speech tagging for Middle High German
Darģis et al. The use of text alignment in semi-automatic error analysis: use case in the development of the corpus of the Latvian language learners
JP2004145626A (en) Documents classification support device and computer program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120214