JPH01240924A - Negative expression corresponding japanese language analyzing system - Google Patents

Negative expression corresponding japanese language analyzing system

Info

Publication number
JPH01240924A
JPH01240924A JP63067407A JP6740788A JPH01240924A JP H01240924 A JPH01240924 A JP H01240924A JP 63067407 A JP63067407 A JP 63067407A JP 6740788 A JP6740788 A JP 6740788A JP H01240924 A JPH01240924 A JP H01240924A
Authority
JP
Japan
Prior art keywords
negative
clause
keyword
storage area
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63067407A
Other languages
Japanese (ja)
Inventor
Hiroyuki Kinukawa
博之 絹川
Nariyoshi Takahashi
成佳 高橋
Hideaki Shinohara
篠原 英彰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Keiyo Engineering Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Keiyo Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Keiyo Engineering Co Ltd filed Critical Hitachi Ltd
Priority to JP63067407A priority Critical patent/JPH01240924A/en
Publication of JPH01240924A publication Critical patent/JPH01240924A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To generate an enquiry text based on more natural idea by providing a means to recognize negative expression and a negative range. CONSTITUTION:When a Japanese language character string written by each clause is inputted, a keyword qualification part 2 is started up, and a keyword is qualified by referring to a keyword directionary 1 at every clause, and keyword information is stored in a clause storage area 3. A negative expression qualification part 5 collates the clause storage area 3 in which the keyword information is stored with a negative word table 4, and negative expression is recognized, and negative information is stored in the clause storage are 3. A qualification part 6 for the negative range refers to the clause storage are 3 for which the negative expression is qualified, and sets negative range information on the clause storage area 3, and outputs the content of the information. In such a way, more natural conversational environment can be offered to a user by utilizing the negative expression in an input Japanese language character string, and a load on the user at the time of generating the enquiry text can be reduced.

Description

【発明の詳細な説明】[Detailed description of the invention]

〔産業上の利用分野〕 本発明は、日本語処理機能を有するデータベース検索シ
ステム等の日本語解析部に係り、入力H氷詰文字列から
否定表現を認識し、その範囲を解析するのに好適な日本
語解析方式に関する。 〔従来の技術〕 特開昭58−88971 に記載のように、従来の日本
語解析方式は、入力日本語文字列から、自立語を取り出
し、自立語間の意味関係を決定することで日本語を解析
しようとするものであった。しかし自立語からの情報で
は、否定表現を認識できず、問い合わせ文中に否定表現
を使うことが、できなかった。 〔発明が解決しようとする問題点〕 上記従来技術は、問い合わせ文中に、否定表現が含まれ
た場合について配慮がなされておらず、問い合わせ文中
に否定表現を使えないという問題があった。 本発明の目的は、入力H氷詰文字列中に、否定表現を利
用できるようにすることで、利用者に、より自然な会話
環境を提供し1問い合わせ文作成時の利用者の負担を軽
減することにある。 〔問題点を解決するための手段〕 上記目的は、日本語解析部に人力[1本語文字列を文節
[Industrial Application Field] The present invention relates to a Japanese language analysis section of a database search system or the like having a Japanese language processing function, and is suitable for recognizing negative expressions from input H frozen character strings and analyzing their range. Concerning Japanese language analysis methods. [Prior Art] As described in Japanese Patent Application Laid-Open No. 58-88971, the conventional Japanese language analysis method extracts independent words from an input Japanese character string and determines the semantic relationship between the independent words. It was an attempt to analyze. However, using information from independent words, it was not possible to recognize negative expressions, and it was not possible to use negative expressions in query sentences. [Problems to be Solved by the Invention] The above-mentioned prior art does not take into consideration the case where a negative expression is included in an inquiry sentence, and there is a problem in that a negative expression cannot be used in an inquiry sentence. The purpose of the present invention is to provide the user with a more natural conversation environment and reduce the burden on the user when creating a query sentence by making it possible to use negative expressions in the input H frozen character string. It's about doing. [Means for resolving the problem] The above purpose is to use the Japanese language analysis department to manually

【a位で処理し、各々の文節を記憶装置に文節文字列と文節情報で構成される形式で格納する処理の後、該文節文字列を参照することで否定表現を認識する手段、および否定表現認識後、該文節情報を参照することで否定範囲を認識する手段を設けることによって達成される。 〔作用〕[After processing at position a and storing each clause in a storage device in a format consisting of a clause character string and clause information, a means for recognizing a negative expression by referring to the clause character string, and This is achieved by providing means for recognizing the range of negation by referring to the phrase information after recognizing the expression. [Effect]

否定表現を認識する手段は、各文節ごとに、否定語テー
ブルと照合し、否定語テーブル中の文字列が文節文字列
に含まれた場合、その文節は否定されていると認識する
。否定範囲を認識する手段は、否定表現が認識された文
節より前方に文節の文節情報2調べていき、それが条件
を満足する範囲を否定範囲と認識する。 〔実施例〕 以下、本発明の一実施例を第1図から第11図を用いて
説明する。 第1図は1本発明を用いたF1本氷詰析方式の機能ブロ
ックを示すものであり、1はキーワード辞書、2はキー
ワードの認定部、3は文節格納エリア、4は否定語テー
ブル、5は否定表現の認定部、6は否定範囲の認定部で
ある。文節分から書きのH氷詰文字列が入力されると、
キーワード認定部2か起動し、文節ごとに、キーワード
辞書1を参照して、キーワードを認定し、キーワード情
報を文節格納エリア3に格納する。否定表現認定部5は
、キーワード情報格納済みの文節格納エリア3と否定語
テーブル4とを照合し、否定表現を認識し、否定情報を
文節格納エリア3へ格納する。6は、査定表@認定済の
文節格納エリア3を参照し、否定範囲情報を文節格納エ
リア3にセットし、この内容を出力する。第2図以後で
、第1図の機能ブロックの詳細を述べるものとする。 第2図は、本発明の一実施例のハードウェア構成を示す
ものであり、7はプロセッサ、8は否定範囲認定結果出
力用の表示装置、9はH氷詰文字列入力用のキーボード
入力装置、1oは記憶装置であり、以下の記憶部からな
る。101は、プログラム格納エリア、11はキーワー
ド辞書格納エリア、41は否定語テーブル格納エリア、
102は、人力日本語文字列格納エリア、3は文節格納
エリア、103はワークエリアである。 第3図は、キーワード認定部の内容をフローチャートで
示したものである。キーワード認定部が起動すると、文
節分から書きH氷詰文字列を取得しく21)、先頭の文
節を参照しく22)、文節文字列が格納されているか判
別しく2.3)、格納されていなければ、処理を終了し
、格納されていれば、24へ分岐する。24では、辞書
を参照し文節中にキーワードが存在するか判定し、存在
すれば25へ分岐し、存在しなければ、26へ分岐する
。25では、文節をキーワードと付属部に分けて文節格
納エリアにセットする。、26では、次の文節に処理を
移し、23へ分岐する。 第4図は、入力日本語文字列例であり、第3図の人力と
なる。 第5図は、キーワード辞書フォーマットであり、キーワ
ード、項目コード、種別コードから構成され、第4図の
H氷詰文字列に対応した例を示す。 第6図は1文節格納エリアである。これは、キーワード
、付属部2項目コート、種別コード、否定情報から構成
され、第4図の人力日本語文字列を、第3図のキーワー
ド認定部で処理して得られた出力である。 第7図は、否定表現認定部の内容をフローチャートで示
したものである。否定表現認定部が起動すると、先頭の
文節格納エリアを参照しく51)、キーワードが格納さ
れているか判定しく52)、格納されていなければ処理
を終了し、格納されていれば、53へ分岐する。53で
は、文節格納エリアの付属部を参照し、54では否定語
テーブルと照合することで、否定表現が含まれるか判定
し。 含まれれば55へ分岐し、含まれなければ56へ分岐す
る。55では、文節格納エリアの否定情報に否定記号を
セットし、56へ分岐する。 5日では、次の文節へ処理を進め、52へ分岐する。 第8図は、否定語テーブルであり、否定語見出しから構
成され、第4図に示す日本語文字列に対応する例を示す
。 第9図は、否定表現認定処理が実行された後の文節格納
エリアの状態であり、第6図の文節格納エリアを入力と
して得られる出力である。 第10図は、否定範囲認定部の内容をフローチャートに
示したものである。否定範囲認定部が起動すると、文節
格納エリアの先頭の文節を参照しく60.1.)、キー
ワードが格納されているか判定しく602)−格納され
ていなければ処理が終Yし、格納されていれば603へ
分岐する。603では、文節格納エリアの否定情報を参
照し、604で否定記号がセットされているか判定し、
セット、されていなけ;h、ば613へ分岐し、セット
されていれば605へ分岐する。605では、現在処理
している文節格納エリアの位置を記憶しく位置をPとす
る)、606へ分岐する。606では、前方にキーワー
ドがあるか判定し、なければ612へ分岐し、あれば6
07へ分岐する。607では、前方の文節を参照し、6
08でキーワードの種別コードがデータかアトリビュー
トのどちらであるか判定し、アトリビュ・−トであるな
らば、612へ分岐し、データであれば609へ分岐す
る。 609では、Pの位置のキーワードの項目コードと現在
処理対象となっているキーワードの項目コードとを比較
し、610で両者の項目コードが等しいか判定し1等し
くなれければ612へ分岐し、等しければ61】へ分岐
する。611では現在処理対象となっているキーワード
に対応した文節格納エリアの否定情報エリアに否定記号
をセットし、606へ分岐する6612では処理対象と
なる文節格納エリアの位置をPにし613へ分岐する。 613では、次の位置の文節格納エリアを参照し、60
2へ分岐する。 第11図は、否定範囲認定部の処理が実行された後の文
節格納エリアの状態であり、第9図に示す文節格納エリ
ア撃人力として得られた出力である。 以上実施例について詳述した。 本実施例によれば、各機能がブロックは位に構成できる
ので5本否定表現認定機能および本否定範囲認定機能を
従来の日本語解析部に組み込むことは容易に実現できる
。 また各機能ブロックは、プログラム論理で実現されてい
るので、各機能ブロック単位にT、SI化することで高
速化でき、又、使用する処理用の情報を別に記憶してい
るので適用分野に応じて情報内容を入れ換え、汎用的に
使用できる効果がある。 〔発明の効果〕 本発明によれば、利用者は問い合わせ文中に否定表現を
使えるので、より自然な発想による問い合わせ文を作成
でき、問い合わせ文作成時の負担が軽減し、操作性が向
上するという効果がある。
The means for recognizing negative expressions compares each phrase with a negative word table, and when a character string in the negative word table is included in the phrase character string, recognizes that the phrase is negated. The means for recognizing the negative range checks the clause information 2 of the clause ahead of the clause in which the negative expression has been recognized, and recognizes the range in which it satisfies the conditions as the negative range. [Example] An example of the present invention will be described below with reference to FIGS. 1 to 11. FIG. 1 shows the functional blocks of the F1 ice-packing analysis method using the present invention, in which 1 is a keyword dictionary, 2 is a keyword recognition section, 3 is a phrase storage area, 4 is a negative word table, and 5 is the recognition part of the negative expression, and 6 is the recognition part of the range of negation. When the written H iced character string is input from Bunsetsu,
The keyword recognition section 2 is activated, the keyword dictionary 1 is referred to for each phrase, the keyword is recognized, and the keyword information is stored in the phrase storage area 3. The negative expression recognition unit 5 compares the phrase storage area 3 in which keyword information is already stored with the negative word table 4, recognizes a negative expression, and stores the negative information in the phrase storage area 3. 6 refers to the assessment table@certified phrase storage area 3, sets negative range information in the phrase storage area 3, and outputs this content. The functional blocks shown in FIG. 1 will be described in detail from FIG. 2 onwards. FIG. 2 shows the hardware configuration of an embodiment of the present invention, in which 7 is a processor, 8 is a display device for outputting the negative range recognition result, and 9 is a keyboard input device for inputting H ice string. , 1o is a storage device, which consists of the following storage units. 101 is a program storage area, 11 is a keyword dictionary storage area, 41 is a negative word table storage area,
102 is a human-powered Japanese character string storage area, 3 is a bunsetsu storage area, and 103 is a work area. FIG. 3 is a flowchart showing the contents of the keyword recognition section. When the keyword recognition section starts, it will try to obtain the written H iced string from the bunsetsu (21), refer to the first bunsetsu (22), determine whether the bunsetsu string is stored (2.3), and if it is not stored. , the process ends, and if it is stored, branches to 24. At step 24, it is determined whether the keyword exists in the phrase by referring to the dictionary, and if the keyword exists, the process branches to 25, and if it does not exist, the process branches to 26. In step 25, the phrase is divided into keywords and attached parts and set in the phrase storage area. , 26, the process moves to the next clause and branches to 23. FIG. 4 shows an example of an input Japanese character string, which is the human input shown in FIG. FIG. 5 shows a keyword dictionary format, which is composed of a keyword, an item code, and a type code, and shows an example corresponding to the H ice-packed character string shown in FIG. 4. FIG. 6 shows a one-phrase storage area. This consists of a keyword, an appendix 2 item code, a type code, and negative information, and is the output obtained by processing the human-powered Japanese character string in FIG. 4 with the keyword recognition section in FIG. 3. FIG. 7 is a flowchart showing the contents of the negative expression recognition section. When the negative expression recognition unit is activated, it refers to the phrase storage area at the beginning (51) and determines whether a keyword is stored (52). If it is not stored, the process ends; if it is stored, it branches to step 53. . At step 53, the appendix of the bunsetsu storage area is referred to, and at step 54, by checking with the negative word table, it is determined whether a negative expression is included. If it is included, the process branches to 55, and if it is not included, the process branches to 56. At 55, a negation symbol is set in the negation information in the phrase storage area, and the process branches to 56. On the 5th day, the process advances to the next clause and branches to 52. FIG. 8 is a negative word table, which is composed of negative word headings, and shows an example corresponding to the Japanese character string shown in FIG. FIG. 9 shows the state of the clause storage area after the negative expression recognition process has been executed, and is the output obtained by inputting the clause storage area of FIG. 6. FIG. 10 is a flowchart showing the contents of the negative range recognition section. When the negative range recognition unit starts up, it refers to the first phrase in the phrase storage area and checks 60.1. ), it is determined whether the keyword is stored (602) - If the keyword is not stored, the process ends Y; if it is stored, the process branches to 603. In 603, the negation information in the bunsetsu storage area is referred to, and in 604 it is determined whether a negation symbol is set.
If not set; h, branch to 613; if set, branch to 605. At 605, the location of the phrase storage area currently being processed is memorized (the location is designated as P), and the process branches to 606. In 606, it is determined whether there is a keyword ahead, and if not, the process branches to 612.
Branch to 07. 607 refers to the preceding clause, and 6
At 08, it is determined whether the keyword type code is data or attribute. If it is an attribute, the process branches to 612, and if it is data, the process branches to 609. At 609, the item code of the keyword at the position of P is compared with the item code of the keyword currently being processed. At 610, it is determined whether the two item codes are equal. If they are not equal to 1, the process branches to 612. Branches to [61]. In 611, a negation symbol is set in the negation information area of the clause storage area corresponding to the keyword currently being processed, and in 6612, which branches to 606, the position of the clause storage area to be processed is set to P, and the process branches to 613. At 613, refer to the clause storage area at the next position, and at 60
Branch to 2. FIG. 11 shows the state of the phrase storage area after the processing of the negative range recognition unit has been executed, and is the output obtained as the phrase storage area gunman force shown in FIG. 9. The embodiments have been described in detail above. According to this embodiment, since each function can be configured into blocks, it is possible to easily incorporate the five negative expression recognition function and the main negative range recognition function into a conventional Japanese language analysis section. In addition, since each functional block is realized by program logic, speed can be increased by converting each functional block to T and SI.Also, since the processing information to be used is stored separately, it can be used depending on the field of application. It has the effect of being able to be used for general purposes by replacing the information content. [Effects of the Invention] According to the present invention, since users can use negative expressions in inquiry sentences, they can create inquiry sentences based on more natural ideas, which reduces the burden of creating inquiry sentences and improves operability. effective.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明を用いたト1氷詰解析方式の機能ブロッ
ク図、第2図は本発明の実施例のハードウェア構成を示
すブロック図、第3図は本実施例のキーワード認定部の
処理フローチャート、第4図は六カド1本語文字列の例
示図、第5図はキーワード辞書の格納形式を示す説明図
、第6図は文節格納エリアを示す説明図、第7図は本発
明の実施例の否定表現認定部の処理フローチャート、第
8図は否定語テーブルを示す説明図、第9図は否定表現
認定処理実行後の文節格納エリアを示す説明図、第10
図は本発明実施例の否定範囲認定部の処理フローチャー
ト、第11図は否定範囲認定処理実行後の文節格納エリ
アを示す説明図である。 1・・・キーワード辞書、2・・・キーワード認定部、
3・・・文節格納エリア、4・・・否定語テーブル、5
・・・否定表現認定部、6・・・否定範囲認定部。 第 / m q−舌を己巳チーフル S’JEj禮じし訳卿と 2 否糺E困め訳釦シ 第2 図 記l央又1 第 3 国 第 t、L  聞 第5″ 口 第 4 囚 第 7 図 芋3閃 第2図 峯//箇 第 10 昌 (A) 第 /Q 呂
Fig. 1 is a functional block diagram of the To1 ice pack analysis method using the present invention, Fig. 2 is a block diagram showing the hardware configuration of an embodiment of the present invention, and Fig. 3 is a block diagram of the keyword recognition section of this embodiment. Processing flowchart, FIG. 4 is an example of a Rokukado 1 Japanese character string, FIG. 5 is an explanatory diagram showing the storage format of the keyword dictionary, FIG. 6 is an explanatory diagram showing the bunsetsu storage area, and FIG. 7 is an illustration of the present invention FIG. 8 is an explanatory diagram showing the negative word table, FIG. 9 is an explanatory diagram showing the phrase storage area after execution of the negative expression recognition process, and FIG.
The figure is a processing flowchart of the negative range recognition section according to the embodiment of the present invention, and FIG. 11 is an explanatory diagram showing the clause storage area after the negative range recognition process is executed. 1...Keyword dictionary, 2...Keyword certification department,
3... Clause storage area, 4... Negative word table, 5
... Negative expression certification section, 6... Negative range certification section. No. / m q-Tongue to the self-sniffing Tiful S'JEj 禮jishi translator and 2 No. Prisoner No. 7 Zu Imo 3 Sen No. 2 Mine//Ka No. 10 Masa (A) No. /Q Lu

Claims (1)

【特許請求の範囲】 1、データベス検索システム等が有する日本語解析部に
おいて、否定表現および、否定範囲を認識する手段を設
けたことを特徴とする否定表現対応日本語解析方式。 2、否定表現および、否定範囲を認識する手段として、
入力日本語文字列を文節単位で処理し、各文節を、記憶
装置上で、文節文列格納部と文節情報格納部から構成さ
れるエリアにセットするステップを有することを特徴と
する第1項記載の否定表現対応日本語解析方式。 3、否定表現を認識する手段として、記憶装置に否定見
出し語を格納しておき、これと前記文節文字列格納部と
を照合するステップを有することを特徴とする第2項記
載の否定表現対応日本語解析方式。 4、否定範囲を認識する手段として、前記文節情報格納
部を参照するステップを有することを特徴とする第2項
記載の否定表現対応日本語解析方式。
[Scope of Claims] 1. A Japanese language analysis method for negative expressions, characterized in that a Japanese language analysis unit included in a database search system or the like is provided with means for recognizing negative expressions and the range of negation. 2. As a means of recognizing negative expressions and the scope of negation,
Item 1, comprising the step of processing the input Japanese character string in units of clauses and setting each clause in an area on the storage device that is composed of a clause string storage section and a clause information storage section. Japanese language analysis method for negative expressions in the description. 3. Negative expression support according to item 2, characterized in that the means for recognizing negative expressions includes the step of storing a negative headword in a storage device and comparing this with the clause character string storage unit. Japanese analysis method. 4. The Japanese language analysis method corresponding to negative expressions according to item 2, further comprising the step of referring to the clause information storage unit as means for recognizing the range of negation.
JP63067407A 1988-03-23 1988-03-23 Negative expression corresponding japanese language analyzing system Pending JPH01240924A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63067407A JPH01240924A (en) 1988-03-23 1988-03-23 Negative expression corresponding japanese language analyzing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63067407A JPH01240924A (en) 1988-03-23 1988-03-23 Negative expression corresponding japanese language analyzing system

Publications (1)

Publication Number Publication Date
JPH01240924A true JPH01240924A (en) 1989-09-26

Family

ID=13344046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63067407A Pending JPH01240924A (en) 1988-03-23 1988-03-23 Negative expression corresponding japanese language analyzing system

Country Status (1)

Country Link
JP (1) JPH01240924A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014061288A1 (en) * 2012-10-19 2014-04-24 株式会社コナミデジタルエンタテインメント Reservation assistance device, control method for reservation assistance device, and computer-readable non-transient recording medium having reservation-assistance-device program recorded thereon

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014061288A1 (en) * 2012-10-19 2014-04-24 株式会社コナミデジタルエンタテインメント Reservation assistance device, control method for reservation assistance device, and computer-readable non-transient recording medium having reservation-assistance-device program recorded thereon
JP2014099144A (en) * 2012-10-19 2014-05-29 Konami Digital Entertainment Co Ltd Reservation support device, method for controlling reservation support device, and program of reservation support device

Similar Documents

Publication Publication Date Title
US7546235B2 (en) Unsupervised learning of paraphrase/translation alternations and selective application thereof
EP1462948B1 (en) Ordering component for sentence realization for a natural language generation system, based on linguistically informed statistical models of constituent structure
US6556973B1 (en) Conversion between data representation formats
US20080221863A1 (en) Search-based word segmentation method and device for language without word boundary tag
US20060106592A1 (en) Unsupervised learning of paraphrase/ translation alternations and selective application thereof
Vinnarasu et al. Speech to text conversion and summarization for effective understanding and documentation
Veronis Morphosyntactic correction in natural language interfaces
Dhanalakshmi et al. Natural language processing tools for tamil grammar learning and teaching
JPH01240924A (en) Negative expression corresponding japanese language analyzing system
Khoufi et al. Chunking Arabic texts using conditional random fields
Abdelghany et al. Doc2Vec: An approach to identify Hadith Similarities
NithyaKalyani et al. Speech summarization for tamil language
Daelemans et al. Part-of-speech tagging for Dutch with MBT, a memory-based tagger generator
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
Uszkoreit Language technology a first overview
Sawant et al. AI Model to Generate SQL Queries from Natural Language Instructions through Voice
JPH07244669A (en) Document retrieval system
Bhowmik et al. Development of A Word Based Spell Checker for Bangla Language
Lin Handling Reduplication in a Morphological Analyzer for Wamesa
Chaudhari et al. Implementation on Voice based SQL query Generation using NLP
Zeng et al. Gram2Vec: An Interpretable Document Vectorizer
Ahmed Detection of foreign words and names in written text
Maisto LG-Starship: A Framework for Text Analysis
JP2939348B2 (en) Image processing device
Ornan A morphological, syntactic and semantic search engine for Hebrew texts