JP2004030697A - 文分類装置 - Google Patents

文分類装置 Download PDF

Info

Publication number
JP2004030697A
JP2004030697A JP2003353595A JP2003353595A JP2004030697A JP 2004030697 A JP2004030697 A JP 2004030697A JP 2003353595 A JP2003353595 A JP 2003353595A JP 2003353595 A JP2003353595 A JP 2003353595A JP 2004030697 A JP2004030697 A JP 2004030697A
Authority
JP
Japan
Prior art keywords
keyword
classification
keywords
classification number
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003353595A
Other languages
English (en)
Other versions
JP3505565B2 (ja
Inventor
Tamotsu Mizuguchi
水口 有
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003353595A priority Critical patent/JP3505565B2/ja
Publication of JP2004030697A publication Critical patent/JP2004030697A/ja
Application granted granted Critical
Publication of JP3505565B2 publication Critical patent/JP3505565B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 本発明は、入力文を分類する文分類装置に関し、複数のキーワードの組み合わせで分類してキーワード数を減らして細かい分類を実現することを目的とする。
【解決手段】 文字列の入力を受け付ける入力手段と、複数のキーワードを1の分類番号に対応づけて登録したキーワードテーブルと、キーワードテーブルの全分類番号を参照し、各分類番号に対応づけられた全てのキーワードが入力された文字列に含まれるかのマッチングを行って該当する分類番号を取り出し、分類番号を取り出す際に、複数の分類番号が該当する場合、対応づけられたキーワード数が最多の分類番号を取り出すキーワードマッチング手段と、入力された文字列を前記取り出された分類番号に分類する分類手段とを備える。
【選択図】 図1

Description

 本発明は、入力文を分類する文分類装置に関するものである。
 従来、ニュースの分類・保存・データベース化などのときに、キーワード文字列のマッチング方法が使われていた。このキーワード文字列のマッチング方法によって、例えば「自動車」というようにキーワード分類していた(特許文献1など参照)。
特開平05−233706号公報
 従来は上述したように単純な単語、例えば上述した「自動車」をキーワード文字列として抽出していた。このため、「早い自動車」と「遅い自動車」や、「早い自動車」と「早くない自動車」などの反対の意味を持つ日本語文の分類を行うことができない問題があった。
 また、従来は、例えば「早い自動車」、「早く走る自動車」、「早く走っている自動車」とを同じ「早い自動車」に分類するには、それぞれをキーワード文字列として持っていなければならないという問題もあった。
 本発明は、これらの問題を解決するため、分類番号に対応づけて1つあるいは複数のキーワード、および優先分類順を予め登録したキーワードテーブルを準備し、これらを順次探索して一致したキーワードの分類番号に分類し、1つあるいは複数のキーワードの組み合わせで分類してキーワード数を減らして細かい分類を実現したり、更に優先分類順を設定して優先的に所望の分類先への分類を実現したりすることを目的としている。
 図1は、本発明の原理ブロック図を示す。
 図1において、入力装置1は、分類しようとする文字列を人力するものである。
 入力文字管理手段2は、入力装置1から入力された文字を管理するものである。
 キーワードマッチング手段3は、人力された文字列についてキーワードテーブル4のキーワードと一部あるいは全部が一致したときのその分類番号を取り出したりなどするものである。
 キーワードテーブル4は、分類番号に対応づけてキーワード、優先分類順を予め登録したものである。
 分類結果格納手段5は、キーワードマッチング手段3によって分類された分類番号を入力された文字列に対応づけて、文格納テーブル6に格納するものである。
 文格納テーブル6は、分類結果を入力された文字列に対応づけて格納するものである。
 以上説明したように、本発明によれば、分類番号に対応づけて1つあるいは複数のキーワード、および優先分類順を予め登録したキーワードテーブル4を準備し、これらを順次探索して一致したキーワードの分類番号に分類する構成を採用しているため、1つあるいは複数のキーワードの組み合わせで分類してキーワード数を減らして細かい分類を実現したり、更に優先分類順をキーワードテーブル4に設定して関連する優先するキーワードから先に−致させたより望ましい分類を行うことができる。これらにより、
 (1) 例えば「早い AND 自動車」というキーワードの組み合わせをキーワードテーブル4に登録しておき、入力文として、
      「早い自動車」
      「早く走る自動車」
      「早く走っている自動車」
を分類先の「早い自動車」にそれぞれ分類することが可能となる。
 (2) また、
      「遅 AND 自動車」
      「早 AND ない AND 自動車」
という2つあるいは3つのキーワードの組み合わせをキーワードテーブル4に登録しておき、両者に関連する入力文について、いずれも「遅い自動車」に分類することができる。これらにより、キーワード数を減らしても細かな分類を行うことが可能となった。
 本発明は、図1に示すように、入力装置1から分類しようとする文字列が入力されたことに対応して、キーワードマッチング手段3が入力された文字列について、キーワードテーブル4のキーワードと−部あるいは全部が一致したときの分類番号を取り出し、入力された文字列をこの取り出した分類番号に分類するようにしている。
 また、キーワードマッチング手段3が入力された文字列について、キーワードテーブル4の複数のキーワードの全てと一部あるいは全部が一致したときの分類番号を取り出し、入力された文字列をこの取り出した分類番号に分類するようにしている。
 また、キーワードマッチング手段3が入力された文字列について、キーワードテーブル4の1つのキーワードと一部あるいは全部が一致したときの優先分類順に設定されている分類番号のキーワードと一部あるいは全部が−致したときに当該分類番号を取り出し、一方、−致しなかったときに1つのキーワードと一致した分類番号を取り出し、入力された文字列をこの取り出した分類番号に分類するようにしている。
 また、キーワードマッチング手段3が入力された文字文について、キーワードテーブル4の複数のキーワードと一部あるいは全部が一致したときの優先分類順に設定されている分類番号のキーワードと一部あるいは全部が一致したときに当該分類番号を取り出し、一方、一致しなかったときに複数のキーワードと一致した分類番号を取り出し、入力された文字列をこの取り出した分類番号に分類するようにしている。
 これらの際に、キーワードマッチング手段3が入力された文字列について、1つあるいは複数のキーワードと一部あるいは全部が一致したときに、一致したキーワードの数が多い方、キーワードの数が同一のときはキーワードの文字数の多い方、キーワードの文字数が同一のときは最長のキーワードの方、最長のキーワードが同一のときはキーワードの総文字数の多い方に分類するようにしている。
 また、キーワードとして、仮名、漢字、アルファベット、数字が混在する文字列とするようにしている。
 従って、分類番号に対応づけて1つあるいは複数のキーワード、および優先分類順を予め登録したキーワードテーブル4を準備し、これらを順次探索して一致したキーワードの分類番号に分類したり、更に分類優先順に分類したりすることにより、1つあるいは複数のキーワードの組み合わせで分類してキーワード数を減らして細かい分類を実現したり、更に優先分類順をキーワードテーブル4に設定して関連する優先するキーワードから先にマッチしてより望ましい分類を行ったりすることが可能となる。
 次に、図2から図14を用いて本発明の実施例の構成および動作を順次詳細に説明する。
 図2のフローチャート(その1)に示す順序に従い、図3のキーワードテーブル4(その1)を使用したときの図1の構成の動作を詳細に説明する。
 図2において、Slは、ユーザに対する入力要求する。
 S2は、Slの入力要求に対応して、ユーザが分類対象の文(文字列、入力文)を入力する。例えば右側に記載した下記の
  「この問題は遺伝的アルゴリズム手法で解いた」
を入力する。
 S3は、終わりか判別する。YESの場合には、終了する(END)。NOの場合には、S4に進む。
 S4は、入力文と、図3の(a)あるいは(b)のキーワードテーブル4とのマッチングを行う。
 S5は、見つかったか判別する。これは、S4のマッチングにより、入力文の一部あるいは全部が図3の(a)あるいは(b)のキーワードテーブル4のいずれかのキーワードとマッチング(一致)するものが見つかったか判別する。YESの場合には、S6でキーワードテーブル4からマッチングした分類番号を取り出して人力文に付加し、S7で結果表示として、分類番号、キーワード、入力文を関連づけて表示する。一方、NOの場合には、S3に戻る。例えば上述した入力文「この問題は遺伝的アルゴリズム手法で解いた」の場合、図3の(a)のキーワードテーブル4とマッチングを行い、ここでは、キーワード「遺伝的アルゴリズム」とマッチング(一致)するので、このときの分類番号30が得られるので、結果表示として、
  ・分類番号:30
  ・キーワード:「遺伝的アルゴリズム」
  ・入力文:「この問題は遺伝的アルゴリズム手法で解いた」
を表示する。
 以上によって、ユーザが文を入力して分類を指示したことに対応して、入力文と図3の(a)あるいは(b)のキーワードテーブル4と一部あるいは全部が一致するかのマッチングを行い、一部あるいは全部が−致する分類番号を取り出し、この分類番号を入力文に付加して保存すると共に、分類番号、キーワード、入文を対応づけて表示する。これらにより、キーワードテーブル4に予め登録した漢字、かな、カタカナ、アルファベット、数字などにどのような文字列であっても、分類してその分類番号を決定することが可能となる。
 図3は、本発明のキーワードテーブル例(その1)を示す。これは、図2のフローチャートに使用するキーワードテーブル4の例である。
 図3の(a)は、キーワードテーブル例を示す。この図示のキーワードテーブル4は、分類番号に対応づけてキーワードを予め登録したものであって、ここでは、漢字、ひらがな、数字、アルファベットから構成されるものである。
 図3の(b)は、キーワードテーブル例を示す。この図示のキーワードテーブル4は、分類番号に対応づけてキーワードを予め登録したものであって、ここでは、漢字、ひらがな、数字、アルファベット、記号などから構成されるものである。
 図4は、本発明の文格納テーブル例を示す。この文格納テーブル6は、キーワードマッチング手段3が入力文を図3の(a)あるいは(b)のキーワードテーブル4のキーワードとマッチングを行い、一致した部分(下線部分)に分類番号を付与したものを模式的に表したものである。このように、文字列を入力すると、キーワードテーブル4に予め設定されているキーワードと−致したときの一致部分とその分類番号を対応づけて表示することにより、入力文の分類を自動的に行うことが可能となる。
 次に、図5のフローチャート(その2)に示す順序に従い、図6のキーワードテーブル4(その2)を使用したときの図1の構成の動作を詳細に説明する。
 図5において、Sllは、ユーザに対する入力要求する。
  S12は、Sllの入力要求に対応して、ユーザが分類対象の文を入力する。例えば右側に記載した下記の
  「早い自動車」
を入力する。
 S13は、終わりか判別する。YESの場合には、終了する(END)。NOの場合には、S14に進む。
 S14は、入力文に全てのキーワードが含まれるかを、図6のキーワードテーブル4とのマッチングを行う。これは、キーワードテーブル4の分類番号に対応づけて複数のキーワードが予め登録されているので、ここでは全てのキーワードが当該入力文に含まれるか(論理積の場合)のマッチングを行う。この他に、論理和の場合には、いずれかのキーワードに一致したときにその分類番号を取り出す。ここでは、以下論理積の場合に限って説明する。
 S15は、見つかったか判別する。これは、S14のマッチングにより、入力文中で図6のキーワードテーブル4の全てのキーワードと一致するものが見つかったか判別する。YESの場合には、S16でキーワードテーブル4から一致した分類番号を取り出して人力文に付加し、S7で結果表示として、分類番号、キーワード、入力文を関連づけて表示する。一方、NOの場合には、S13に戻る。例えば上述した人力文「早い自動車」の場合、図6のキーワードテーブル4とマッチングを行い、ここでは、キーワード1「早」、キーワード2「自動車」と一致するので、このときの分類番号10が得られるので、結果表示として、
  ・分類番号:10
  ・キーワード1:「早い」、キーワード2:「自動車」
  ・人力文:「早い自動車」
を表示する。
 以上によって、ユーザが文を入力して分類を指示したことに対応して、入力文中で図6のキーワードテーブル4の複数のキーワードと、ここでは全部一致するかマッチングを行い、全部が一致する分類番号を取り出し、この分類番号を入力文に付加して保存すると共に、分類番号、キーワード、入力文を対応づけて表示する。これらにより、キーワードテーブル4に予め登録した漢字、かな、カタカナ、アルファベット、数字などかなる複数のキーワードの論理積を満足した場合(他に論理和を満足した場合もある)に、分類してその分類番号を決定することが可能となる。
 図6は、本発明のキーワードテーブル例(その2)を示す。これは、図5のフローチャートに使用するキーワードテーブル4の例であって、分類番号に対応づけて複数のキーワードを登録し、ここでは、全部のキーワードが入力文中に含まれていたときに一致するとしたものである。
 次に、図7のフローチャート(その3)に示す順序に従い、図8のキーワードテーブル4(その3)を使用したときの図1の構成の動作を詳細に説明する。
 図7において、S21は、ユーザに対する入力要求する。
 S22は、S21の入力要求に対応して、ユーザが分類対象の文を入力する。例えば右側に記載した下記の
  「男性」
を入力する。
 S23は、終わりか判別する。YESの場合には、終了する(END)。NOの場合には、S24に進む。
 S24は、入力文中にキーワードが含まれるかを、図8のキーワードテーブル4とのマッチングを行う。これは、キーワードテーブル4の分類番号に対応づけてキーワードが予め登録されているので、このキーワードが当該入力文に含まれるかのマッチングを行う。
 S25は、見つかったか判別する。これは、S24のマッチングにより、入力文中で図8のキーワードテーブル4のキーワードと−致するものが見つかったか判別する。YESの場合には、S26に進む。NOの場合にはS23に戻る。
 S26は、キーワードテーブル4の一致したキーワードに優先分類順が設定されているか判別する。YESの場合には、S27に進む。NOの場合には、優先分類順が設定されていなかったので、S30で一致したキーワードの分類番号に決定し、S31に進む。
 S27は、優先分類順が終わりか判別する。YESの場合には、優先分類順が設定されていなかったので、S30で一致したキーワードの分類番号に決定し、S31に進む。一方、NOの場合には、S28に進む。
 S28は、優先分類順に設定されている分類番号を取り出し、この取り出した分類番号(優先分類番号)のキーワードが入力文中にあるかマッチングする。YESの場合には、優先分類順の分類番号のキーワードと一致したので、S29で一致した分類番号に決定し、S31に進む。一方、NOの場合には、S27に戻る。
 S31は、キーワードテーブル4から分類番号を取り出して入力文に付加する。例えば右側に記載したように「分類番号:1100」を入力文「男性」に付加する。
 S32は、結果表示する。例えば上述した人力文「男性」の場合、図8ののキーワードテーブル4とマッチングを行い、ここでは、分類番号1000のキーワド「男」と一致したので、優先分類順「1200」、「1100」を順次取り出して、その分類番号のキーワード「男性」、「男女」と入力文とをマッチングし、ここでは、キーワード「男性」と一致したので、分類番号1100と決定し、結果を
  ・分類番号:1100
  ・キーワード:「男性」
  ・人力文:「男性」
と表示する。
 以上によって、ユーザが文を入力して分類を指示したことに対応して、入力文中で図8のキーワードテーブル4のキーワードと一致するかマッチングを行い、一致したキーワードの分類優先順の分類番号のキーワードと優先的にマッチングを行い、一致したときの分類番号を優先的に入力文に対応づけて表示する。これらにより、キーワードテーブル4に予めキーワードおよび分類優先順の分類番号を設定しておくことにより、入力文に含まれる文字について優先順に分類番号を決定することが可能となる。
 図8は、本発明のキーワードテーブル例(その3)を示す。これは、図7のフローチャートに使用するキーワードテーブル4の例であって、分類番号に対応づけてキーワードおよび分類優先順を登録し、入力文がキーワードに−致したときに優先して分類を行う分類番号(キーワード)を任意に指定することが可能となる。
 次に、図9のフローチャート(その4)に示す順序に従い、図10のキーワードテーブル4(その4)を使用したときの図1の構成の動作を詳細に説明する。
 図9において、S41は、ユーザに対する入力要求する。
 S42は、S41の入力要求に対応して、ユーザが分類対象の文を入力する。例えば右側に記載した下記の
  「サッカーボール」
を入力する。
 S43は、入力文とキーワードテーブル4とのマッチングを終わりまで行う。これは、図10のキーワードテーブル4の分類番号に対応づけてキーワードが予め登録されているので、このキーワードが当該入力文に含まれるかのマッチングを終わりまで行う。
 S44は、見つかったか判別する。これは、S43のマッチングにより、入力文中で図10のキーワードテーブル4のキーワードと一致するものが見つかったか判別する。YESの場合には、S45に進む。NOの場合には終了する(END)。
 S45は、マッチングしたのが1つか判別する。YESの場合には、S46でその分類番号に決定し、S48に進む。一方、NOの場合には、複数のキーワードが−致したので、S47でキーワードの文字数の一番長い分類番号に決定し、S48に進む。
 S48は、キーワード4から分類番号を取り出して入力文に付加する。例えば右側に記載したように「分類番号:100」を入力文「サッカボール」に付加する。
 S49は、結果表示する。例えば上述した入力文「サッカボール」の場合、図10ののキーワードテーブル4とマッチングを行い、ここでは、分類番号40のキーワード「サッカー」および分類番号100のキーワード「サッカーボール」の2つに一致したが、キーワードの文字数が長い「サッカーボール」の分類番号と決定し、結果を
  ・分類番号:100
  ・キーワード:「サッカーボール」
  ・入力文:「サッカーボール」
と表示する。
 以上によって、ユーザが文を人力して分類を指示したことに対応して、人力文中で図10のキーワードテーブル4のキーワードと一致するものが含まれるかのマッチングを全て行い、一致したキーワードのうちの一番長いキーワードの分類番号と決定して入力文に対応づけて表示する。これらにより、キーワードテーブル4に予めキーワードの付加される文字列によって異なるものとして分類される文字列についてそれぞれのキーワードを登録して一番長いキーワードの分類番号に分類することが可能となる。
 図10、本発明のキーワードテーブル例(その4)を示す。これは、図9のフローチャートで使用するキーワードテーブル4の例であって、分類番号に対応づけてキーワードを登録し、入力文がキーワードに一致したのを全て取り出し、そのうちから一番キーワードの長いものの分類番号に分類することが可能となる。例えば図示の
  分類番号   キーワード
    40   サッカー
   100   サッカーボール
というように登録しておき、人力文の一部がこれらキーワードに一致したときに、一致したキーワードの最も長いものの分類番号と決定する。
 次に、図11のフローチャート(その5)に示す順序に従い、図12のキーワードテーブル4(その5)を使用したときの図1の構成の動作を詳細に説明する。
 図11において、S51は、ユーザに対する入力要求する。
 S52は、S51の入力要求に対応して、ユーザが分類対象の文を入力する。例えば右側に記載した下記の
  「傷付く」
を入力する。
 S53は、絡わりか判別する。YESの場合には、キーワードテーブル4の全てのキーワードとのマッチングを終わったので、終了する(END)。一方、NOの場合には、S54に進む。
 S54は、入力文に全てのキーワードが含まれるかのマッチングを行う。これは、例えば図12のキーワードテーブル4中のキーワードの全てが入力文に含まれるものがあるかのマッチングを行う。ここでは、入力文「傷付く」は、分類番号2000に、キーワード「傷」とキーワード「付く」の2つがあって全てが入力文に含まれると判明する。
 S55は、マッチして全て一致したものが見つかったか判別する。YESの場合には、S56に進む。NOの場合には、S53に戻る。
 S56は、キーワードテーブル4の一致したキーワードに優先分類順が設定されているか判別する。YESの場合には、S57に進む。NOの場合には、優先分類順が設定されていなかったので、S60で一致したキーワードの分類番号に決定し、S61に進む。
 S57は、優先分類順が終わりか判別する。YESの場合には、優先分類順が設定されていなかったので、S60でマッチングしたキーワードの分類番号に決定し、S61に進む。−方、NOの場合には、S58に進む。
 S58は、優先分類順に設定されている分類番号を取り出し、この取り出した分類番号(優先分類番号)のキーワードが人力文中にあるかマッチングする。YESの場合には、優先分類順の分類番号のキーワードと一致したので、S59で一致した分類番号に決定し、S61に進む。一方、NOの場合には、S57に戻る。
 S61は、キーワードテーブル4から分類番号を取り出して入力文に付加する。例えば右側に記載したように「分類番号:2000」を入力文「傷付く」に付加する。
 S62は、結果表示する。例えば上述した入力文「傷付く」の場合、図12のキーワードテーブル4とマッチングを行い、ここでは、分類番号2000のキーワード「傷付く」と−致したので、優先分類順「2100」、「2200」を順次取り出して、その分類番号のキーワード「傷」、「付きやすい」と、キーワード「傷」、「付きにくい」と入力文とをマッチングし、ここでは、分類番号2100、2200が一致しなかったので、分類番号2000と決定し、結果を
  ・分類番号:2000
  ・キーワード:「傷」、「付」
  ・入力文:「傷付く」
と表示する。
 以上によって、ユーザが文を入力して分類を指示したことに対応して、入力文中で図11のキーワードテーブル4のキーワードと一致するかマッチングを行い、一致したキーワードの分類優先順の分類番号のキーワードと優先的にマッチングを行い、一致したときの分類番号を優先的に入力文に対応づけて表示し、一方、一致しないときは元の一致した分類番号を入力文に対応づけて表示する。これらにより、キーワードテーブル4に予めキーワードおよび分類優先順の分類番号を設定しておくことにより、入力文に含まれる文字について優先順に分類番号を決定することが可能となる。
 図12は、本発明のキーワードテーブル例(その5)を示す。これは、図11のフローチャートに使用するキーワードテーブル4の例であって、分類番号に対応づけてキーワードおよび分類優先順を登録し、入力文がキーワードに一致したときに、優先して分類を行う分類番号(キーワード)を任意に指定することが可能となる。
 次に、図13のフローチャート(その6)に示す順序に従い、図14のキーワードテーブル4(その6)を使用したときの図1の構成の動作を詳細に説明する。
 図13において、S71は、ユーザに対する入力要求する。
 S72は、S71の入力要求に対応して、ユーザが分類対象の文を人力する。例えば右側こ記載した下記の
  「男女兼用」
を入力する。
 S73は、入力文の全てのキーワードが含まれるかのマッチングをキーワードテーブルの最後まで行う。これは、例えば図14のキーワードテーブル4の分類番号に対応づけて予め登録されているキーワード1、2、3などの全てが入力文に含まれるかのマッチングを、当該キーワードテーブル4の最後まで行う。
 S74は、入力文に全てのキーワードを含むものがマッチングして見つかったか判別する。YESの場合には、キーワードテーブル4の全てのキーワードとのマッチングを終わったので、絡了する(END)。一方、NOの場合には、S75に進む。
 S75は、見つかったのが1つか判別する。YESの場合には、S76でその分類番号に決定し、S78に進む。一方、NOの場合には、複数の一致する分類番号のものが見つかったので、S77でキーワード数の一番多い分類番号に決定し、S78に進む。
 S78は、キーワードテーブル4から分類番号を取り出して入力文に付加する。例えば右側に記載したように「分類番号:3000」を入力文「男女兼用」に付加する。
 S79は、結果表示する。例えば上述した入力文「男女兼用」の場合、図14のキーワードテーブル4とマッチングを行い、ここでは、分類番号200のキーワード1「男」、キーワード2「女」、および分類番号3000のキーワード1「男」、キーワード2「女」、キーワード3「兼用」の2つに一致したので、キーワード数の一番多い分類番号3000と決定し、結果を
  ・分類番号:3000
  ・キーワード:「男」、「女」、「兼用」
  ・入力文:「男女兼用」
と表示する。
 以上によって、ユーザが文を人力して分類を指示したことに対応して、入力文中で図14のキーワードテーブル4の複数のキーワードと一致するかマッチングを行い、一致した分類番号が複数あるときは一致した分類番号のキーワード文字数の多い方の分類番号と決定し、決定した分類番号およびキーワードに対応づけて入力文を表示する。これらにより、キーワードテーブル4に予め複数のキーワードを設定しておくことにより、人力文に含まれる複数に分割しうる文字列について個々および全体の文字列の任意の組み合わせについても分類番号を決定することが可能となる。
 図13は、本発明のキーワードテーブル例(その6)を示す。これは、図13のフローチャートで使用するキーワードテーブル4の例であって、分類番号に対応づけて複数のキーワードを登録し、入力文が複数のキーワードに一致したときにキーワード数の一番長いものの分類番号に分類することが可能となる。
本発明の原理ブロック図である。 本発明の動作説明フローチャート(その1)である。 本発明のキーワードテーブル例(その1)である。 本発明の文格納テーブル例である。 本発明の動作説明フローチャート(その2)である。 本発明のキーワードテーブル例(その2)である。 本発明の動作説明フローチャート(その3)である。 本発明のキーワードテーブル例(その3)である。 本発明の動作説明フローチャート(その4)である。 本発明のキーワードテーブル例(その4)である。 本発明の動作説明フローチャート(その5)である。 本発明のキーワードテーブル例(その5)である。 本発明の動作説明フローチャート(その6)である。 本発明のキーワードテーブル例(その6)である。
符号の説明
1:入力装置
2:入力文字管理手段
3:キーワードマッチング手段
4:キーワードテーブル
5:分類結果格納手段
6:文格納テーブル

Claims (1)

  1.  文字列の入力を受け付ける入力手段と、
     複数のキーワードを1の分類番号に対応づけて登録したキーワードテーブルと、
     前記キーワードテーブルの全分類番号を参照し、各分類番号に対応づけられた全てのキーワードが入力された前記文字列に含まれるかのマッチングを行って該当する分類番号を取り出し、分類番号を取り出す際に、複数の分類番号が該当する場合、対応づけられたキーワード数が最多の分類番号を取り出すキーワードマッチング手段と、
     前記入力された文字列を前記取り出された分類番号に分類する分類手段と
    を備えたことを特徴とする文分類装置。
JP2003353595A 2003-10-14 2003-10-14 文分類装置 Expired - Lifetime JP3505565B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003353595A JP3505565B2 (ja) 2003-10-14 2003-10-14 文分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003353595A JP3505565B2 (ja) 2003-10-14 2003-10-14 文分類装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP6048457A Division JPH07262200A (ja) 1994-03-18 1994-03-18 文分類装置

Publications (2)

Publication Number Publication Date
JP2004030697A true JP2004030697A (ja) 2004-01-29
JP3505565B2 JP3505565B2 (ja) 2004-03-08

Family

ID=31185627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003353595A Expired - Lifetime JP3505565B2 (ja) 2003-10-14 2003-10-14 文分類装置

Country Status (1)

Country Link
JP (1) JP3505565B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61182131A (ja) * 1985-02-06 1986-08-14 Hitachi Ltd 情報検索システム
JPS63244259A (ja) * 1987-03-31 1988-10-11 Matsushita Electric Ind Co Ltd キ−ワ−ド抽出装置
JPH0232469A (ja) * 1988-07-22 1990-02-02 Nippon Telegr & Teleph Corp <Ntt> 情報検索方式
JPH0298778A (ja) * 1988-10-06 1990-04-11 Nippon Telegr & Teleph Corp <Ntt> 文書自動分類装置
JPH05128152A (ja) * 1991-11-06 1993-05-25 Hitachi Ltd 文書検索支援方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61182131A (ja) * 1985-02-06 1986-08-14 Hitachi Ltd 情報検索システム
JPS63244259A (ja) * 1987-03-31 1988-10-11 Matsushita Electric Ind Co Ltd キ−ワ−ド抽出装置
JPH0232469A (ja) * 1988-07-22 1990-02-02 Nippon Telegr & Teleph Corp <Ntt> 情報検索方式
JPH0298778A (ja) * 1988-10-06 1990-04-11 Nippon Telegr & Teleph Corp <Ntt> 文書自動分類装置
JPH05128152A (ja) * 1991-11-06 1993-05-25 Hitachi Ltd 文書検索支援方法

Also Published As

Publication number Publication date
JP3505565B2 (ja) 2004-03-08

Similar Documents

Publication Publication Date Title
JPH07262200A (ja) 文分類装置
CN105917327A (zh) 用于将文本输入到电子设备中的系统和方法
JP2005157524A (ja) 質問応答システムおよび質問応答処理方法
CN111125457A (zh) 一种深度跨模态哈希检索方法及装置
JP2005092825A (ja) 文書フィルタリング装置、文書フィルタリング方法、および文書フィルタリングプログラム
JP2000148748A (ja) 仮名漢字変換及び画像検索表示システム
JP2005038395A (ja) データベース検索装置
JP2007316743A (ja) 部分文書検索プログラム、部分文書検索方法および部分文書検索装置
JP2004030697A (ja) 文分類装置
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
WO2009136426A1 (ja) 検索クエリ提供装置
JPH064584A (ja) 文章検索装置
JP2000020538A (ja) 情報検索方法、情報検索装置および情報検索プログラム記憶媒体
JPH09319767A (ja) 類義語辞書登録方法
JP3517665B2 (ja) 文分類装置
JPH10232871A (ja) 検索装置
JPH03286371A (ja) 文書情報検索装置
JP2007272699A (ja) 文書インデキシング装置、文書検索装置、文書分類装置、並びにその方法及びプログラム
JP2008102641A (ja) 検索装置、検索方法及びプログラム
WO2022113256A1 (ja) 事例出力装置、事例出力システム、事例出力方法、プログラムおよび記憶媒体
JP4337382B2 (ja) 情報表示制御装置、サーバ及びプログラム
JP3774431B2 (ja) 辞書構築支援装置および辞書構築支援方法
JPH0869474A (ja) 類似文字列検索装置
JPH10124524A (ja) 文書検索装置及び文書検索方法
JP2000057133A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031118

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071226

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081226

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091226

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091226

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101226

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111226

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121226

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131226

Year of fee payment: 10

EXPY Cancellation because of completion of term