JP2002108936A - Information retrieving device, control method therefor and computer readable storage medium - Google Patents

Information retrieving device, control method therefor and computer readable storage medium

Info

Publication number
JP2002108936A
JP2002108936A JP2000304027A JP2000304027A JP2002108936A JP 2002108936 A JP2002108936 A JP 2002108936A JP 2000304027 A JP2000304027 A JP 2000304027A JP 2000304027 A JP2000304027 A JP 2000304027A JP 2002108936 A JP2002108936 A JP 2002108936A
Authority
JP
Japan
Prior art keywords
information
search
similarity
word
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000304027A
Other languages
Japanese (ja)
Inventor
Yuji Kobayashi
雄二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000304027A priority Critical patent/JP2002108936A/en
Publication of JP2002108936A publication Critical patent/JP2002108936A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information retrieving device, a control method therefor and a computer readable storage medium, with which an operator can select a desired similar retrieving method out of similar retrieving methods of plural kinds at the viewpoint of similarity. SOLUTION: The operator inputs a retrieval sentence 303 for retrieving desired multimedia information in order to retrieve that information and selects any one of radio buttons 305-307 capable of selecting the viewpoint in the case of similar retrieval. When a retrieve button 308 is operated, according to the viewpoint selected by the operator, the information retrieving device retrieves multimedia information matched to the retrieval sentence 303 or having similarity based on the relevant viewpoint out of a database storing a plurality of multimedia information beforehand.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数のマルチメデ
ィア情報を管理し、その管理されているマルチメディア
情報から所望のマルチメディア情報を検索する情報検索
装置及びその制御方法及びコンピュータ読み取り可能な
記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval apparatus which manages a plurality of multimedia information, retrieves desired multimedia information from the managed multimedia information, a control method thereof, and a computer-readable storage. Regarding the medium.

【0002】[0002]

【従来の技術】従来より、情報検索の分野においては、
例えば、画像等の情報に、その情報のコンテンツを記述
する文書或いは文字が付帯された所謂マルチメディア情
報を検索する情報検索装置が提案されており、このよう
な装置として、例えば、所望の情報を表す語或いは文を
操作者が入力するのに応じて、入力された語或いは文と
一致する語或いは文を、予めデータベースとして蓄積さ
れている多数のマルチメディア情報の中から検索(取
得)する、所謂、全文検索と呼ばれる手法を適用した情
報検索装置が知られている。
2. Description of the Related Art Conventionally, in the field of information retrieval,
For example, there has been proposed an information search device for searching for so-called multimedia information in which a document or character describing information content is added to information such as an image. As such a device, for example, desired information is searched for. In response to the operator's input of a word or sentence to be represented, a word or sentence that matches the input word or sentence is searched (acquired) from a large number of pieces of multimedia information stored in a database in advance. 2. Description of the Related Art There is known an information search device to which a so-called full text search method is applied.

【0003】また、近年においては、操作者によって入
力された語或いは文と一致する語或いは文を単に検索す
るのみならず、入力された語或いは文と類似する概念と
判断される語或いは文を保持するマルチメディア情報を
検索する、所謂、類似概念検索と呼ばれる手法を適用し
た情報検索装置も提案されている。
In recent years, a word or sentence that matches a word or sentence input by an operator is not only searched for, but also a word or sentence determined to be similar to the input word or sentence is detected. An information search device that applies a so-called similar concept search method for searching for held multimedia information has also been proposed.

【0004】更に、文書の内容ではなく、文書のレイア
ウトや構造に着目することにより、帳票などのように類
似性を有するフォーマットの文書や画像を検索する視覚
的な類似検索を適用した情報検索装置も提案されてい
る。
[0004] Furthermore, an information retrieval apparatus to which a visual similarity search for retrieving a document or image in a format having similarity such as a form by focusing on the layout and structure of the document instead of the content of the document is applied. Has also been proposed.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上記従
来の情報検索装置においては、内容が類似しているマル
チメディア情報を検索可能な類似情報検索も、画像のカ
ラー情報や文書のスタイル、或いはレイアウトなど視覚
的に類似しているマルチメディア情報を検索可能な類似
情報検索もあるといったように、複数種類の類似情報検
索の方式が存在するので、操作者は、自分が入手するこ
とを所望するマルチメディア情報を、どのような観点の
類似情報によって検索されるのかを判断することが困難
であり、操作性が問題となっている。
However, in the above-mentioned conventional information retrieval apparatus, similar information retrieval capable of retrieving multimedia information having similar contents is not limited to color information of an image, style of a document, layout or the like. Since there are a plurality of types of similar information search methods such as a similar information search that can search for visually similar multimedia information, an operator can select a multimedia information that he or she wants to obtain. It is difficult to determine from what viewpoint similar information is searched for information, and operability is a problem.

【0006】そこで、本発明は、複数種類の類似検索手
法の中から類似性の観点によって所望の類似検索手法を
操作者が選択可能な情報検索装置及びその制御方法及び
コンピュータ読み取り可能な記憶媒体の提供を目的とす
る。
Accordingly, the present invention provides an information retrieval apparatus which allows an operator to select a desired similarity retrieval technique from a plurality of types of similarity retrieval techniques from the viewpoint of similarity, a control method thereof, and a computer-readable storage medium. For the purpose of providing.

【0007】[0007]

【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る情報検索装置は、以下の構成を特徴と
する。
In order to achieve the above object, an information retrieval apparatus according to the present invention has the following configuration.

【0008】即ち、データベースに予め格納された複数
のマルチメディア情報の中から所望のマルチメディア情
報を検索する情報検索装置であって、所望のマルチメデ
ィア情報を検索するための検索要求を入力可能な入力手
段と、前記入力手段より入力された検索要求について、
第1の類似性の観点に基づいて、前記データベースから
類似するマルチメディア情報を検索する第1の類似情報
検索手段と、前記検索要求について、前記第1の類似性
とは異なる第2の観点に基づいて、前記データベースか
ら類似するマルチメディア情報を検索する第2の類似情
報検索手段と、前記所望のマルチメディア情報を検索す
る際の類似性の観点を選択可能な類似観点選択手段と、
前記類似観点選択手段によって選択された類似性の観点
に従って、前記第1または第2の類似情報検索手段によ
る情報検索が行われるように制御する情報検索制御手段
とを備える。
That is, an information search apparatus for searching for desired multimedia information from a plurality of pieces of multimedia information stored in a database in advance, wherein a search request for searching for desired multimedia information can be input. Input means, for the search request input from the input means,
A first similarity information search unit that searches for similar multimedia information from the database based on a first similarity viewpoint, and a second viewpoint different from the first similarity for the search request. A second similarity information search unit that searches for similar multimedia information from the database, and a similar viewpoint selection unit that can select a similarity viewpoint when searching for the desired multimedia information,
An information search control unit that controls the first or second similar information search unit to perform an information search in accordance with the similarity viewpoint selected by the similar viewpoint selection unit.

【0009】好適な実施形態において、前記第1の類似
情報検索手段は、前記検索要求について、 ・前記複数のマルチメディア情報に付帯する言語表現さ
れた文字情報との類似性を測る、 ・前記複数のマルチメディア情報に付帯するレイアウト
情報に基づいて視覚的な類似性を測る、或いは、 ・前記複数のマルチメディア情報に付帯するメタデータ
の類似性を測ると良い。
[0009] In a preferred embodiment, the first similar information search means measures similarity of the search request with character information expressed in a language attached to the plurality of multimedia information. The visual similarity may be measured based on the layout information attached to the multimedia information, or the similarity of the metadata attached to the plurality of pieces of multimedia information may be measured.

【0010】また、前記第1の類似情報検索手段は、前
記メタデータとして、前記複数のマルチメディア情報に
付帯するところの、該情報のタイトル,該情報の作成
者,該情報の管理者,該情報の作成者の所属情報,該情
報の利用可能者,該情報の作成日時,該情報の内容記述
の要約文,該情報の内容記述言語,該情報の内容記述形
式,該情報の利用料金,該情報のデータサイズの少なく
とも何れか1つを用いると良い。
[0010] The first similar information search means may include, as the metadata, a title of the information, a creator of the information, a manager of the information, Affiliation information of the creator of the information, who can use the information, the date and time of creation of the information, a summary sentence of the description of the information, a description language of the information, a description format of the information, a usage fee of the information, Preferably, at least one of the data sizes of the information is used.

【0011】上記の同目的を達成するため、本発明に係
る情報検索装置の制御方法は、以下の構成を特徴とす
る。
[0011] In order to achieve the above object, a control method of an information retrieval apparatus according to the present invention has the following configuration.

【0012】即ち、データベースに予め格納された複数
のマルチメディア情報の中から所望のマルチメディア情
報を検索する情報検索装置の制御方法であって、所望の
マルチメディア情報を検索するための検索要求が入力さ
れる入力工程と、複数種類の類似性の観点の中から、前
記所望のマルチメディア情報を検索する際に基準とする
類似性の観点が選択される類似観点選択工程と、前記入
力工程にて入力された検索要求について、前記類似観点
選択工程にて選択された類似性の観点に基づいて、前記
データベースから類似するマルチメディア情報を検索す
る類似情報検索工程とを有することを特徴とする。
That is, the present invention relates to a method for controlling an information retrieval apparatus for retrieving desired multimedia information from a plurality of pieces of multimedia information stored in advance in a database, wherein a retrieval request for retrieving the desired multimedia information is provided. An input step to be input, and a similar viewpoint selection step in which a similar viewpoint to be used as a reference when searching for the desired multimedia information is selected from among a plurality of types of similar viewpoints. And a similar information search step of searching the database for similar multimedia information based on the similarity viewpoint selected in the similar viewpoint selection step.

【0013】好適な実施形態において、前記類似観点選
択工程では、前記類似情報検索工程において、 ・前記複数のマルチメディア情報に付帯する言語表現さ
れた文字情報との類似性の観点に基づく情報検索処理が
実行されるように、 ・前記複数のマルチメディア情報に付帯するレイアウト
情報に基づいて、視覚的な類似性の観点に基づく情報検
索処理が実行されるように、或いは、 ・前記複数のマルチメディア情報に付帯するメタデータ
の類似性の観点に基づく情報検索処理が実行されるよう
に、類似性の観点を選択可能であると良い。
[0013] In a preferred embodiment, in the similarity viewpoint selecting step, the similarity information searching step includes:-an information search process based on a viewpoint of similarity with linguistically expressed character information accompanying the plurality of pieces of multimedia information; The information search processing is performed based on visual similarity based on the layout information attached to the plurality of pieces of multimedia information; or It is preferable that a similarity viewpoint can be selected so that an information search process is performed based on a similarity viewpoint of metadata attached to information.

【0014】更に、上記の情報検索装置及びその制御方
法を、コンピュータによって実現するプログラムコード
が格納されている、コンピュータ読み取り可能な記憶媒
体を特徴とする。
Further, the present invention is characterized by a computer-readable storage medium storing a program code for realizing the above-mentioned information retrieval apparatus and its control method by a computer.

【0015】[0015]

【発明の実施の形態】以下、本発明を、文書情報を検索
する情報検索装置に適用した実施形態として、図面を参
照して詳細に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the drawings as an embodiment applied to an information retrieval apparatus for retrieving document information.

【0016】<装置構成>図1は、本実施形態における
情報検索装置の装置構成を示すブロック図である。
<Apparatus Configuration> FIG. 1 is a block diagram showing an apparatus configuration of an information retrieval apparatus according to the present embodiment.

【0017】図1において、11はマイクロプロセッサ
(CPU)であり、情報検索のための演算や論理判断等
を行ない、アドレスバスAB,コントロールバスCB,
データバスDBを介して、それらのバスに接続された各
構成要素を制御する。
In FIG. 1, reference numeral 11 denotes a microprocessor (CPU) which performs an operation for information retrieval, logical judgment, etc., and comprises an address bus AB, a control bus CB,
Each component connected to these buses is controlled via a data bus DB.

【0018】アドレスバスABは、CPU11が制御の
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBは、CPU11が制御の対象
とする各構成要素のコントロール信号を転送する。そし
て、データバスDBは、各構成機器相互間のデータ転送
を行なう。
The address bus AB transfers an address signal designating a component to be controlled by the CPU 11. The control bus CB transfers a control signal of each component to be controlled by the CPU 11. The data bus DB performs data transfer between the constituent devices.

【0019】12は、読出し専用の固定メモリ(RO
M)であり、本実施形態で実行される処理プログラム等
の制御プログラムコードを記憶する。
Reference numeral 12 denotes a read-only fixed memory (RO)
M), and stores a control program code such as a processing program executed in the present embodiment.

【0020】13は、1ワード16ビットで構成される
書き込み可能なランダムアクセスメモリ(RAM)であ
り、各構成要素に転送すべき各種データ及び受信した各
種データの一時記憶に用いられる。また、RAM13
は、図2を参照して後述する検索語保持部202、検索
観点保持部203、展開語保持部207、検索概念特徴
1保持部210、検索概念特徴2保持部225、検索結
果保持部213を記憶する。
Reference numeral 13 denotes a writable random access memory (RAM) composed of 16 bits per word, which is used for temporarily storing various data to be transferred to each component and various received data. Also, the RAM 13
Is a search term holding unit 202, a search viewpoint holding unit 203, a developed word holding unit 207, a search concept feature 1 holding unit 210, a search concept feature 2 holding unit 225, and a search result holding unit 213, which will be described later with reference to FIG. Remember.

【0021】14は、大容量記憶装置としての外部メモ
リ(DISK)であり、図2を参照して後述する検索語
展開辞書206、概念辞書208、蓄積文書概念特徴1
保持部209、蓄積文書概念特徴2保持部218、蓄積
文書フォーム保持部219、蓄積文書属性保持部22
0、蓄積文書217、単語インデックス226が格納さ
れる。
Reference numeral 14 denotes an external memory (DISK) as a large-capacity storage device, which is a search word expansion dictionary 206, a concept dictionary 208, and a stored document concept feature 1 described later with reference to FIG.
Holding unit 209, stored document conceptual feature 2 holding unit 218, stored document form holding unit 219, stored document attribute holding unit 22
0, stored document 217, and word index 226 are stored.

【0022】ここで、本実施形態において、蓄積文書2
17は、後述する文書検索処理(図9)における検索対
象としての複数の文書(文書データファイル)が格納さ
れたデータベースである。また、登録文書224は、当
該文書検索処理に必要な各種情報を用意すべく、後述す
る文書登録処理(図12)にて処理の対象とする文書
(文書データファイル)であり、操作者が、当該文書登
録処理の実行に際して、蓄積文書217の中から任意に
選択した文書である。
Here, in the present embodiment, the stored document 2
Reference numeral 17 denotes a database storing a plurality of documents (document data files) to be searched in a document search process (FIG. 9) described later. The registered document 224 is a document (document data file) to be processed in a document registration process (FIG. 12) described later in order to prepare various information necessary for the document search process. This is a document arbitrarily selected from the stored documents 217 when the document registration process is executed.

【0023】更に、外部メモリ14には、図2を参照し
て後述する検索要求入力処理部201、類似検索処理判
定部204、検索語展開処理部205、概念特徴1抽出
処理部209、関連語抽出処理部211、類似概念特徴
検索処理部214、類似フォーム検索処理部215、類
似属性検索処理部216、概念特徴2抽出処理部22
1、文書フォーム判定処理部222、文書属性抽出処理
部223の各処理部を実行するプログラムコードが格納
される。
Further, in the external memory 14, a search request input processing unit 201, a similar search processing determination unit 204, a search word expansion processing unit 205, a conceptual feature 1 extraction processing unit 209, a related word Extraction processing unit 211, similar concept feature search processing unit 214, similar form search processing unit 215, similar attribute search processing unit 216, concept feature 2 extraction processing unit 22
1. A program code for executing each processing unit of the document form determination processing unit 222 and the document attribute extraction processing unit 223 is stored.

【0024】尚、外部メモリ14に記憶されるデータ及
びプログラムを格納する記憶媒体としては、ROM,フ
ロッピー(登録商標)ディスク,CD−ROM,DVD
−ROM,メモリカード,光磁気ディスクなどを用いる
ことができる。
As storage media for storing data and programs stored in the external memory 14, ROM, floppy (registered trademark) disk, CD-ROM, DVD
-ROMs, memory cards, magneto-optical disks and the like can be used.

【0025】15は、キーボード(KB)であり、アル
ファベットキー,ひらがなキー,カタカナキー,句点等
の文字記号入力キー,検索を指示する検索キー及びカー
ソル移動を指示するカーソル移動キー等のような各種の
機能キーを備えている。
Reference numeral 15 denotes a keyboard (KB), such as an alphabet key, a hiragana key, a katakana key, a character symbol input key such as a period, a search key for instructing a search, and a cursor movement key for instructing a cursor movement. Function keys.

【0026】16は、表示用ビデオメモリ(VRAM)
であり、表示すべきデータのパターンを一時的に蓄え
る。
Reference numeral 16 denotes a display video memory (VRAM).
And temporarily stores the data pattern to be displayed.

【0027】17は、CRTコントローラ(CRTC)
であり、表示用ビデオメモリVRAM16に蓄えられた
描画内容を、表示装置18に表示する役割を担う。
17 is a CRT controller (CRTC)
And plays a role of displaying the drawing contents stored in the display video memory VRAM 16 on the display device 18.

【0028】18は、陰極線管、液晶パネル等の表示装
置(CRT)であり、その表示装置CRTにおけるドッ
ト構成の表示パターンおよびカーソルの表示をCRTコ
ントローラ17で制御する。
Reference numeral 18 denotes a display device (CRT) such as a cathode ray tube, a liquid crystal panel, etc., and a display pattern of a dot configuration and a display of a cursor on the display device CRT are controlled by a CRT controller 17.

【0029】19は、ネットワークコントローラ(NI
C)であり、本実施形態における情報検索装置を、Ethe
rnetなどのネットワークに接続する役割を担う。
Reference numeral 19 denotes a network controller (NI
C), and the information retrieval device according to the present embodiment is Ethe
It plays the role of connecting to networks such as rnet.

【0030】上述した構成を備える情報検索装置は、キ
ーボードKB15を介した操作者による各種入力、並び
にネットワークコントローラ19から供給されるネット
ワーク経由の各種入力に応じて作動する。即ち、キーボ
ードKB15からの入力及び/またはネットワークコン
トローラ19からの入力が当該情報検索装置(図1)に
供給されると、まず、インタラプト信号がマイクロプロ
セッサCPU11に送られ、そのマイクロプロセッサC
PU11が外部メモリDISK14内に記憶してある各
種の制御信号を読み出し、それらの制御信号に従って、
各種の制御が行なわれる。
The information retrieval apparatus having the above-described configuration operates according to various inputs by the operator via the keyboard KB15 and various inputs via the network supplied from the network controller 19. That is, when an input from the keyboard KB15 and / or an input from the network controller 19 are supplied to the information search device (FIG. 1), first, an interrupt signal is sent to the microprocessor CPU11, and the microprocessor C
The PU 11 reads out various control signals stored in the external memory DISK 14 and according to the control signals,
Various controls are performed.

【0031】また、本実施形態において説明する検索動
作に係わるプログラムを予め格納した記憶媒体を、図1
に示す装置(システム)に供給し、その装置のコンピュ
ータが、記憶媒体に格納されたプログラムコードを読み
出し実行することによっても本実施形態における検索動
作は達成される。
A storage medium in which a program related to a search operation described in the present embodiment is stored in advance is shown in FIG.
, And the computer of the device reads and executes the program code stored in the storage medium, thereby achieving the search operation in the present embodiment.

【0032】<機能構成>次に、本実施形態に係る情報
検索装置の機能構成について、図2を参照して説明す
る。
<Functional Configuration> Next, a functional configuration of the information retrieval apparatus according to the present embodiment will be described with reference to FIG.

【0033】図2は、本実施形態における情報検索装置
の機能構成を示すブロック図である。
FIG. 2 is a block diagram showing a functional configuration of the information search device according to the present embodiment.

【0034】図2において、201は、例えば操作者に
よってキーボード15を介して入力された所望の検索対
象に関する要求事項(検索文或いは検索語,類似検索観
点等)が設定される検索要求入力処理部である。202
は、検索要求入力処理部201に入力された検索語を記
憶する検索語保持部である。203は、検索要求入力処
理部201に入力された類似検索観点を記憶する検索観
点保持部である。
In FIG. 2, reference numeral 201 denotes a search request input processing unit in which requirements (a search sentence or a search word, a similar search viewpoint, etc.) regarding a desired search target input by the operator via the keyboard 15 are set. It is. 202
Is a search word holding unit that stores the search words input to the search request input processing unit 201. A search viewpoint holding unit 203 stores the similar search viewpoint input to the search request input processing unit 201.

【0035】204は、検索観点保持部203に記憶さ
れた類似検索観点に従って、実行すべき類似検索処理の
種類を決定する類似検索処理判定部である。
A similarity search processing determination unit 204 determines the type of similarity search process to be executed according to the similarity search viewpoint stored in the search viewpoint holding unit 203.

【0036】206は、見出しとなる単語と、その単語
について展開されるべき関連語とが対応する状態で、両
者の関連度と共に格納された検索語展開辞書である。2
05は、検索語保持部202に記憶された検索語或いは
検索文に対して、検索語展開辞書206を参照すること
により、展開可能な関連語に展開する検索語展開処理部
である。207は、検索対象としている検索語について
検索語展開処理部205で展開された関連語を記憶する
展開語保持部である。
Reference numeral 206 denotes a search word expansion dictionary in which a word serving as a heading and a related word to be expanded with respect to the word are stored together with the degree of relevance between the two. 2
Reference numeral 05 denotes a search word expansion processing unit that expands search words or search sentences stored in the search word holding unit 202 into related words that can be expanded by referring to the search word expansion dictionary 206. Reference numeral 207 denotes a developed word holding unit that stores related words developed by the search word development processing unit 205 for the search word to be searched.

【0037】208は、見出しとなる単語の意味特徴が
記述された概念が格納された概念辞書である。209
は、展開語保持部207、概念辞書208、及び登録文
書224を参照して、検索要求文或いは登録文書の概念
特徴を概念特徴1として抽出する概念特徴1抽出処理部
である。
Reference numeral 208 denotes a concept dictionary that stores a concept in which the semantic characteristics of a word serving as a heading are described. 209
Is a concept feature 1 extraction processing unit that extracts the concept feature of the search request sentence or the registered document as the concept feature 1 by referring to the expanded word holding unit 207, the concept dictionary 208, and the registered document 224.

【0038】210は、概念特徴1抽出処理部209に
よって抽出されたところの、検索語202に対する概念
特徴1を保持する検索概念特徴1保持部である。225
は、概念特徴2抽出処理部221によって抽出されたと
ころの、検索語202に対する概念特徴2を保持する検
索概念特徴2保持部である。
Reference numeral 210 denotes a search concept feature 1 holding unit that holds the concept feature 1 for the search term 202 extracted by the concept feature 1 extraction processing unit 209. 225
Is a search concept feature 2 holding unit that holds the concept feature 2 for the search word 202 extracted by the concept feature 2 extraction processing unit 221.

【0039】211は、蓄積文書217に蓄積された各
文書から、関連度の高い単語の組を抽出し、抽出した単
語の組みを、検索語展開辞書206に格納する関連語抽
出処理部である。
Reference numeral 211 denotes a related word extraction processing unit that extracts a set of highly relevant words from each document stored in the stored document 217 and stores the extracted word set in the search word expansion dictionary 206. .

【0040】221は、登録文書224に対して概念特
徴2を抽出する概念特徴2抽出処理部である。218
は、概念特徴2抽出処理部221で抽出された概念特徴
2を、登録文書224と対応付けて記憶する蓄積文書概
念特徴2保持部である。212は、概念特徴1抽出処理
部209で抽出された登録文書224に対応する概念特
徴1を保持する蓄積文書概念特徴1保持部である。
Reference numeral 221 denotes a concept feature 2 extraction processing unit for extracting the concept feature 2 from the registered document 224. 218
Is a storage document concept feature 2 holding unit that stores the concept feature 2 extracted by the concept feature 2 extraction processing unit 221 in association with the registered document 224. Reference numeral 212 denotes a storage document concept feature 1 holding unit that holds the concept feature 1 corresponding to the registered document 224 extracted by the concept feature 1 extraction processing unit 209.

【0041】214は、蓄積文書概念特徴1保持部21
2、検索概念特徴1保持部210、及び蓄積文書概念特
徴2保持部218を参照して、類似概念検索処理を実行
する類似概念特徴検索処理部である。
Reference numeral 214 denotes a stored document conceptual feature 1 holding unit 21
2. A similar concept feature search processing unit that executes a similar concept search process with reference to the search concept feature 1 holding unit 210 and the stored document concept feature 2 holding unit 218.

【0042】222は、登録文書224の文書フォーム
を判定する文書フォーム判定処理部である。219は、
文書フォーム判定処理部222で判定された文書フォー
ムを登録文書224に対応付けて記憶する蓄積文書フォ
ーム保持部である。215は、蓄積文書フォーム保持部
219を参照して、類似フォーム文書を検索する類似フ
ォーム検索処理部である。
Reference numeral 222 denotes a document form determination processing unit that determines the document form of the registered document 224. 219 is
A stored document form holding unit that stores the document form determined by the document form determination processing unit 222 in association with the registered document 224. A similar form search processing unit 215 searches for a similar form document by referring to the stored document form holding unit 219.

【0043】223は、登録文書224の文書属性を抽
出する文書属性抽出処理部である。220は、文書属性
抽出処理部223で抽出された文書属性を、登録文書2
24に対応付けて記憶する蓄積文書属性保持部である。
216は、蓄積文書属性保持部220を参照して、類似
属性文書を検索する類似属性検索処理部である。
Reference numeral 223 denotes a document attribute extraction processing unit for extracting the document attributes of the registered document 224. Reference numeral 220 denotes a document attribute extracted by the document attribute extraction processing unit 223,
24 is a stored document attribute storage unit that stores the stored document attribute in association with 24.
A similar attribute search processing unit 216 searches for a similar attribute document by referring to the stored document attribute holding unit 220.

【0044】そして213は、類似概念特徴検索処理部
214、類似フォーム検索処理部215、及び類似属性
検索処理部216の各検索処理部の処理結果を保持する
検索結果保持部である。
Reference numeral 213 denotes a search result holding unit that holds the processing results of each of the similar concept feature search processing unit 214, the similar form search processing unit 215, and the similar attribute search processing unit 216.

【0045】次に、検索要求入力処理部201におい
て、類似検索の検索要求文或いは検索要求語と、どの観
点で類似検索を実行するかを操作者が指示する場合の操
作パネルの表示例について、図3を用いて説明する。
Next, in the search request input processing unit 201, a display example of an operation panel when the operator instructs a search request sentence or a search request word of a similar search and a viewpoint from which to execute a similar search will be described. This will be described with reference to FIG.

【0046】図3は、本実施形態における検索要求文或
いは検索要求語と、類似検索観点とを指示する場合の操
作パネルの表示例を示す図である。
FIG. 3 is a diagram showing a display example of the operation panel in the case of instructing a search request sentence or a search request word and a similar search viewpoint in this embodiment.

【0047】図3において、301は、検索要求をすべ
く入力操作を行う表示ウィンドウである。302は、検
索要求の対象となる文或いは語を入力する検索文入力領
域である。303は、操作者による入力中の検索要求文
を例示しており、図示においては「モバイル機器の市場
動向」と入力されている。304は、検索文入力領域に
おける入力位置を示す入力カーソルである。
In FIG. 3, reference numeral 301 denotes a display window for performing an input operation to make a search request. Reference numeral 302 denotes a search sentence input area for inputting a sentence or a word as a target of a search request. Reference numeral 303 denotes an example of a search request sentence being input by the operator, and in the figure, "mobile device market trend" is input. An input cursor 304 indicates an input position in the search sentence input area.

【0048】305,306,307は、類似文書検索
における類似性の判別観点を操作者が指定可能なラジオ
ボタンであり、具体的には、文書内容類似305は、そ
れぞれ文書の意味内容の観点で類似している文書の検索
を指示する場合に指定する。文書フォーム類似306
は、文書の体裁,書式が類似している文書の検索を指示
する場合に指定する。文書属性類似307は、タイト
ル,作成者,作成日時,管理者,分類,キーワードなど
の文書の書誌的属性情報が類似している文書の検索を指
示する場合に指定する。また、本実施形態において、こ
れらのラジオボタンによる操作者による明示的な指示が
なされない場合には、暗黙的に文書内容類似305が選
択される。
Reference numerals 305, 306, and 307 denote radio buttons that allow the operator to specify a similarity determination viewpoint in similar document search. More specifically, the document content similarity 305 is used in terms of the meaning of the document. Specify when instructing to search for similar documents. Document form similar 306
Is specified when a search for a document having a similar format and format is performed. The document attribute similarity 307 is specified when instructing a search for documents having similar document bibliographic attribute information such as title, creator, creation date and time, manager, classification, and keyword. In the present embodiment, when the operator does not give an explicit instruction using these radio buttons, the document content similarity 305 is implicitly selected.

【0049】308は、検索処理の実行を指定する検索
実行ボタンであり、検索実行ボタン308を押下するこ
とで、指定した検索処理が実行される。309は、検索
処理の終了或いは中止を指定するキャンセルボタンであ
り、キャンセルボタン309を押下すると、ただちに検
索処理を終了し、表示ウィンドウ301を閉じて終了す
る。
Reference numeral 308 denotes a search execution button for designating execution of the search processing. When the search execution button 308 is pressed, the specified search processing is executed. Reference numeral 309 denotes a cancel button for designating termination or cancellation of the search processing. When the cancel button 309 is pressed, the search processing is immediately terminated, and the display window 301 is closed and terminated.

【0050】310は、検索ボタン308の押下によっ
て検索処理を行った結果を表示する検索結果表示領域で
あり、図示においては検索処理がなされていない状態で
あるので、何も表示されていない。
Reference numeral 310 denotes a search result display area for displaying the result of the search processing performed by pressing the search button 308. In the figure, nothing is displayed since the search processing is not performed.

【0051】次に、検索要求入力処理部201の処理に
より、上述した図3の画面において類似検索の検索要求
文或いは検索要求語と、どの観点で類似検索を実行すべ
きかが操作者により指示され、それらの指示項目に従っ
て検索処理が実行された場合について、図4を参照して
説明する。
Next, by the processing of the search request input processing unit 201, the operator instructs the search request sentence or the search request word of the similar search on the screen of FIG. The case where the search process is executed in accordance with these instruction items will be described with reference to FIG.

【0052】図4は、本実施形態における検索結果の表
示例、及び引き続き類似検索を実行する場合の検索要求
文或いは検索要求語或いは類似要求文書指定と、類似検
索観点の入力を示す図である。
FIG. 4 is a diagram showing a display example of a search result in the present embodiment, a search request sentence or a search request word or a similar request document designation when a similar search is to be subsequently performed, and an input of a similar search viewpoint. .

【0053】図4において、401は、図3の310に
相当する検索結果の表示領域である。402は、検索結
果の順位を示すランク表示領域である。本実施形態にお
いて、検索結果は、検索要求に類似している順にランク
付けされ、ランク順に表示される。図4の表示例では、
ランク25位から30位までの検索結果が表示されてい
る。
In FIG. 4, reference numeral 401 denotes a search result display area corresponding to 310 in FIG. Reference numeral 402 denotes a rank display area indicating the rank of a search result. In the present embodiment, the search results are ranked in an order similar to the search request, and displayed in the rank order. In the display example of FIG.
Search results from the 25th to 30th ranks are displayed.

【0054】403には、検索された文書の表題が表示
され、404には、検索された文書のファイル名が表示
される。405には、検索された文書の大意が掴める程
度の内容が表示される。即ち、文書内容表示405に
は、予め文書の書誌的属性として与えられた要約文或い
は、文書から自動的に要約した要約文、或いは文書の一
部を大意として抽出した大意文などが表示される。
At 403, the title of the retrieved document is displayed, and at 404, the file name of the retrieved document is displayed. In 405, the content of the retrieved document is displayed to the extent that it can be understood. That is, in the document content display 405, an abstract sentence given in advance as a bibliographic attribute of the document, an abstract automatically summarized from the document, a rough sentence extracted from a part of the document as an outline, and the like are displayed. .

【0055】406は、検索結果表示領域401に表示
しきれない場合に、表示領域401内において検索結果
を部分表示しながら、表示されていない他の部分を表示
するために、表示位置を指定するために同種のウィンド
ウ表示装置において用いられているエレベータバーであ
る。
Reference numeral 406 designates a display position in order to display another part which is not displayed while partially displaying the search result in the display area 401 when the display result cannot be completely displayed in the search result display area 401. This is the elevator bar used in the same type of window display device.

【0056】図4に例示されている表示状態は、検索文
303に示された「モバイル機器の市場動向」に対し
て、文書内容類似ラジオボタン305で指示された文書
内容類似検索を行った検索結果を表示している。このと
き、操作者が引き続いて類似検索を行う場合には、検索
要求文入力領域302に上述した如く検索文を入力する
か、或いは検索結果表示領域401から、類似検索を所
望する文書の表示行を選択すると共に、選択した表示行
を検索要求文入力領域302にドラッグ&ドロップする
ことで、選択された文書の文書内容が検索要求文入力領
域302にコピー(不図示)すればよい。
The display state illustrated in FIG. 4 is a search in which the document content similarity search designated by the document content similarity radio button 305 is performed on “the market trend of the mobile device” indicated in the search sentence 303. The result is displayed. At this time, when the operator continues to perform a similarity search, he or she inputs a search sentence in the search request sentence input area 302 as described above, or displays a display line of a document for which a similar search is desired from the search result display area 401. Is selected, and by dragging and dropping the selected display line to the search request sentence input area 302, the document content of the selected document may be copied (not shown) to the search request sentence input area 302.

【0057】<検索語展開辞書203>次に、検索語展
開辞書203の構成について、図5を用いて説明する。
<Search Word Expansion Dictionary 203> Next, the configuration of the search word expansion dictionary 203 will be described with reference to FIG.

【0058】図5は、本実施形態における検索語展開辞
書の構成を例示する図である。
FIG. 5 is a diagram exemplifying a configuration of a search word expansion dictionary in the present embodiment.

【0059】検索語展開辞書203は、図5に示すよう
に、展開情報の識別情報を示すID501と、展開見出
し語502、展開見出し語502と関連する展開語50
3、展開見出し語502と展開語503との関連度50
4、展開語の種別を示すFLG505の各項目が対応付
けられた状態で予め格納されている。
As shown in FIG. 5, the search word expansion dictionary 203 includes an ID 501 indicating identification information of expansion information, an expansion headword 502, and an expansion word 50 related to the expansion headword 502.
3. The degree of association 50 between the expanded headword 502 and the expanded word 503
4. Each item of the FLG 505 indicating the type of the expanded word is stored in advance in a state where the items are associated with each other.

【0060】即ち、ID501は、検索展開辞書203
に格納された各レコードに対して一意に付与された識別
番号である。展開見出し語502は、展開見出し語とな
るべき単語が格納される。展開語503は、展開見出し
語502と関連する連想語、関連語などの展開可能な単
語である。関連度504は、展開見出し語502に対応
する展開語503の関連性の度合(関連度)を、0から
9の数値で表わしており、格納されている数値が高いほ
ど関連性が高いことを示す。FLG505は、展開語種
別(即ち、展開見出し語502に対応する展開語503
が、標準的に予め用意された初期登録語であるのか、或
いは、蓄積文書から抽出された関連語であるのかの種
別)を示す識別情報であり、「S」は初期登録されてい
る標準展開語,「A」は蓄積文書から抽出された関連語
を示す。
That is, the ID 501 is the search expansion dictionary 203
Is an identification number uniquely assigned to each record stored in the. The expansion entry word 502 stores a word to be an expansion entry word. The expansion word 503 is an expandable word such as an association word or a related word related to the expansion headword 502. The degree of relevance 504 indicates the degree of relevance (relevance) of the expansion word 503 corresponding to the expansion headword 502 by a numerical value from 0 to 9, and indicates that the higher the stored numerical value is, the higher the relevance is. Show. The FLG 505 stores the expansion word type (that is, the expansion word 503 corresponding to the expansion headword 502).
Is identification information indicating whether the word is an initially registered word prepared in advance as a standard or a related word extracted from a stored document), and “S” is a standard expansion registered in the initial registration. The word “A” indicates a related word extracted from the stored document.

【0061】<概念辞書208>次に、概念辞書208
の構成について、図6を用いて説明する。
<Concept Dictionary 208> Next, the concept dictionary 208
Will be described with reference to FIG.

【0062】図6は、本実施形態における概念辞書の構
成を示す図である。
FIG. 6 is a diagram showing the configuration of the concept dictionary in this embodiment.

【0063】概念辞書208は、単語の概念を、普遍的
な意味素の重みを要素とする多次元ベクトルで表したも
のであり、図6に示すように、概念辞書の見出しとなる
単語601と、256次元で表される意味素ベクトルの
各要素を表す添え字602とに対応した状態で、意味素
ベクトルの各要素の重み(重み付け値)603が格納さ
れている。この意味素ベクトルの重み603は、0から
1の間の実数をとり、意味素ベクトルの大きさが1とな
るよう正規化して格納する。
The concept dictionary 208 is a representation of a concept of a word as a multidimensional vector having elements of universal semantic weights as shown in FIG. 6. As shown in FIG. The weight (weight value) 603 of each element of the semantic vector is stored in a state corresponding to the subscript 602 representing each element of the semantic vector expressed in 256 dimensions. The weight 603 of the semantic vector takes a real number between 0 and 1, and is normalized and stored so that the size of the semantic vector becomes 1.

【0064】ここで、概念辞書208を構成する多次元
ベクトルの要素となる普遍的な意味素とは、ひとつのま
とまった意味概念を表すラベルであり、例えば、「こ
れ、それ、あれ、どっち」などの語が内包している「指
示の概念」、「クラス、グレード、級、ランク、順位、
劣等、優劣、優等」などの語が内包している「等級の概
念」、「変化、変身、革新、勃興」などの語が内包して
いる「変化の概念」、「協力、挨拶、団結、握手、友
好、国交、交友」などの語が内包している「交わりの概
念」、「動物、哺乳類、ペンギン、犬、人間、金魚」な
どの語が内包している「生物の概念」等のように、特定
の語に依存しない各々独立した普遍的な意味素を用い
る。本実施形態では、図6に例示するように256種の
意味素を用い、256次元の概念表現ベクトルを構成す
る。
Here, a universal semantic element which is an element of a multi-dimensional vector constituting the concept dictionary 208 is a label representing a single semantic concept, for example, “this, that, that, which”. Such as "concept of instruction", "class, grade, grade, rank, ranking,
Words such as Inferiority, Inferiority, and Honor are included in the concept of "grade", and words such as "change, transformation, innovation, and rise" are included in the concept of change, "cooperation, greeting, unity, Such as "concept of communion", which includes words such as "handshake, friendship, diplomatic relations, and companionship", and "concept of life", which includes words such as "animal, mammal, penguin, dog, human, goldfish". In this way, each independent universal semantic that does not depend on a specific word is used. In the present embodiment, as shown in FIG. 6, 256 types of semantics are used to form a 256-dimensional concept expression vector.

【0065】<単語インデックス226>次に、単語イ
ンデックス226の構成について、図7及び図8を用い
て説明する。
<Word Index 226> Next, the structure of the word index 226 will be described with reference to FIGS.

【0066】図7は、本実施形態における単語インデッ
クスの構成を示す図である。
FIG. 7 is a diagram showing the structure of a word index in this embodiment.

【0067】単語インデックス226は、登録文書22
4中に出現する全ての単語について、文書中の出現頻度
を格納するテーブルである。図7において、テーブルの
第1列情報である701は、登録文書を一意に同定する
文書IDである。テーブルの第2列情報から第n列情報
702は、図8において示される各々の単語を表す添え
字である。テーブルの末尾行703は、各々の単語の出
現数の総和を格納する。図7において、文書IDが00
146である文書は、添え字1256の示す単語「市
場」が12回文書中に出現していることを示している。
The word index 226 is the registered document 22
4 is a table that stores the frequency of appearance of all words that appear in the document. In FIG. 7, reference numeral 701, which is the first column information of the table, is a document ID for uniquely identifying a registered document. The second column information to the n-th column information 702 of the table are suffixes representing each word shown in FIG. The last row 703 of the table stores the sum of the number of occurrences of each word. In FIG. 7, the document ID is 00
The document 146 indicates that the word “market” indicated by the subscript 1256 appears 12 times in the document.

【0068】次に、単語インデックス226において、
単語と、単語インデックステーブルの添え字の対応を格
納した対応テーブルの構成について、図8を用いて説明
する。
Next, in the word index 226,
The configuration of a correspondence table storing correspondence between words and subscripts in the word index table will be described with reference to FIG.

【0069】図8は、本実施形態における単語インデッ
クスと単語との対応テーブルの構成を示す図であり、当
該対応テーブルには、単語801と対応付けられた一意
の単語インデックス802とが対応付けられた状態で格
納されており、例えば、単語「市場」の単語インデック
スは、1256である。
FIG. 8 is a diagram showing the structure of a correspondence table between word indexes and words in the present embodiment. In the correspondence table, a unique word index 802 associated with a word 801 is associated. For example, the word index of the word “market” is 1256.

【0070】<文書類似検索処理>次に、本実施形態で
実行される文書類似検索処理について、図9を用いて説
明する。
<Document Similarity Search Process> Next, a document similarity search process executed in this embodiment will be described with reference to FIG.

【0071】図9は、本実施形態において情報検索装置
(図2)が実行する文書類似検索処理を示すフローチャ
ートである。
FIG. 9 is a flowchart showing a document similarity search process executed by the information search device (FIG. 2) in the present embodiment.

【0072】同図において、ステップS1001では、
図2における検索要求入力処理部201の動作を行う処
理モジュールによって、検索要求入力処理を行う。尚、
この検索要求入力処理の詳細については後述する。
In the figure, in step S1001,
A search request input process is performed by a processing module that performs the operation of the search request input processing unit 201 in FIG. still,
Details of the search request input processing will be described later.

【0073】ステップS1002では、ステップS10
01の処理で図2における検索観点保持部203に記憶
された類似検索観点に従って、類似検索処理種別を判定
する。即ち、文書概念類似検索処理(ステップS100
3)、文書フォーム類似検索処理(ステップS100
4)、文書属性類似検索処理(ステップS1005)の
いずれかの処理に分岐する。
In step S1002, step S10
In the process 01, the similarity search processing type is determined according to the similarity search viewpoint stored in the search viewpoint holding unit 203 in FIG. That is, the document concept similarity search process (step S100)
3), document form similarity search processing (step S100)
4), branch to any of document attribute similarity search processing (step S1005).

【0074】ステップS1003では、検索要求入力処
理(ステップS1001)で入力された検索要求に従っ
て、文書内容の表す概念が類似する文書を検索する文書
概念類似検索処理を行う。尚、この文書概念類似検索処
理の詳細については後述する。
In step S1003, a document concept similarity search process for searching for a document having a similar concept represented by the document contents is performed according to the search request input in the search request input process (step S1001). The details of the document concept similarity search process will be described later.

【0075】ステップS1004では、検索要求入力処
理(ステップS1001)で入力された文書IDと文書
体裁が類似する文書を検索する文書フォーム類似検索処
理を行う。この文書フォーム類似検索処理には、現在で
は一般的な類似検索手法を採用するものとして、本実施
形態における説明は省略する。
In step S1004, a document form similarity search process is performed to search for a document whose document format is similar to the document ID input in the search request input process (step S1001). This document form similarity search process employs a currently common similarity search method, and a description in this embodiment is omitted.

【0076】ステップS1005では、検索要求入力処
理(ステップS1001)で入力された文書IDと文書
の書誌的属性情報が類似している文書を検索する文書属
性類似検索処理を行う。この文書属性類似検索処理に
は、文書のメタデータを検索する現在では一般的な類似
検索手法を採用するものとして、本実施形態における説
明は省略する。
In step S1005, a document attribute similarity search process is performed to search for documents in which the document ID input in the search request input process (step S1001) and the bibliographic attribute information of the document are similar. The document attribute similarity search process employs a currently common similarity search method for searching metadata of a document, and a description in this embodiment is omitted.

【0077】ステップS1006では、ステップS10
03,ステップS1004,ステップS1005のいず
れかのステップにおいて検索された検索結果を、図2に
おける検索結果保持部213より取り出して表示する。
尚、検索結果を表示する処理には、現在では一般的な手
法を採用するものとして、本実施形態における説明は省
略する。
In step S1006, step S10
03, the search results searched in any of the steps S1004 and S1005 are retrieved from the search result holding unit 213 in FIG. 2 and displayed.
It should be noted that the processing for displaying the search result employs a general method at present, and the description in this embodiment is omitted.

【0078】(検索要求入力処理)次に、ステップS1
001の検索要求入力処理の詳細について、図10を用
いて説明する。
(Search Request Input Processing) Next, step S1
Details of the search request input process 001 will be described with reference to FIG.

【0079】図10は、本発明の実施形態における検索
要求入力処理の詳細を示すフローチャートである。
FIG. 10 is a flowchart showing details of the search request input process in the embodiment of the present invention.

【0080】同図において、ステップS2001では、
操作者の指示操作により、検索要求の対象となる検索文
が、図3を参照して上述した如く、検索文入力領域30
2内の入力カーソル304の示す位置に入力される。こ
こで、検索文は、単一の語であってもよいし、複数の語
からなる文であってもよい。検索文の入力は、KB15
から入力された文字コードをRAM13上の検索語保持
部202に格納することにより行われる。
In the figure, in step S2001,
As a result of the operator's instruction operation, the search sentence to be the target of the search request is, as described above with reference to FIG.
2 is input at the position indicated by the input cursor 304. Here, the search sentence may be a single word or a sentence composed of a plurality of words. Input of search sentence is KB15
Is stored in the search word holding unit 202 on the RAM 13.

【0081】次にステップS2002では、検索文入力
領域302への入力があったかどうか判定し、検索文入
力領域302への検索文入力がなく、検索結果表示領域
401に表示された検索結果文書のいずれかが検索文入
力領域302へドラッグされたことを検知したならば、
ステップS2003へ処理を分岐し、検索文入力を検知
したならば、ステップS2006の処理へ分岐する。
Next, in step S2002, it is determined whether or not an input has been made to the search sentence input area 302. If there is no search sentence input to the search sentence input area 302, any of the search result documents displayed in the search result display area 401 If it is detected that is dragged to the search sentence input area 302,
The process branches to step S2003, and if a search sentence input is detected, the process branches to step S2006.

【0082】ステップS2003では、検索文入力領域
302へドラッグされた文書の文書ファイル名を、ファ
イル名404(図4参照)に表示される情報より取得
し、そのファイル名に対応する文書を、読み出しのため
にオープンする。
In step S2003, the document file name of the document dragged to the search text input area 302 is obtained from the information displayed in the file name 404 (see FIG. 4), and the document corresponding to the file name is read. Open for

【0083】次にステップS2004では、ステップS
2003にてオープンした文書の内容を読み込み、ステ
ップS2005において、読み込んだ文書内容を、新た
な検索要求文として、検索語保持部202に格納すると
共に、検索要求文入力領域302にその内容を表示す
る。
Next, in step S2004, step S
The content of the document opened in 2003 is read, and in step S2005, the read document content is stored as a new search request sentence in the search word holding unit 202, and the content is displayed in the search request sentence input area 302. .

【0084】ステップS2006では、類似文書検索を
どの観点で行うかを、文書内容類似ボタン305、文書
フォーム類似ボタン306、文書属性類似ボタン307
のいずれがチェックされたかによって判別し、選択され
た類似検索観点を検索観点保持部203へ格納し、処理
を終了する。
In step S 2006, the viewpoint from which similar document search is to be performed is determined based on the document content similar button 305, document form similar button 306, and document attribute similar button 307.
Is determined based on which one has been checked, the selected similarity search viewpoint is stored in the search viewpoint holding unit 203, and the process ends.

【0085】(文書概念類似検索処理)次に、ステップ
S1003の文書概念類似検索処理の詳細について図1
1を用いて説明する。
(Document Concept Similarity Search Process) Next, the details of the document concept similarity search process in step S1003 will be described with reference to FIG.
1 will be described.

【0086】図11は、本実施形態における文書概念類
似検索処理の詳細を示すフローチャートである。
FIG. 11 is a flowchart showing details of the document concept similarity search process in the present embodiment.

【0087】ステップS3001では、上述した検索要
求入力処理(図10)にて検索語保持部202に格納さ
れている検索文(操作者が所望の文書を検索するために
入力した文、または再検索のために選択された文)を取
り出し、取り出した検索文を構成する文字列を、単語
(検索語)に分割する。検索文の単語(検索語)への分
割は、形態素解析処理として公知の手法を適用する。
In step S3001, the search sentence stored in search word holding unit 202 in the above-described search request input process (FIG. 10) (the sentence input by the operator to search for a desired document, or the re-search Is extracted, and the character string constituting the retrieved search sentence is divided into words (search words). To divide the search sentence into words (search words), a technique known as morphological analysis processing is applied.

【0088】次にステップS3002では、ステップS
3001で得られた全ての検索語について、検索展開辞
書206の展開見出し語502と一致する展開語データ
を検索する。そして、検索語に一致する見出し語が存在
する場合には、その展開語503を、対応する関連度5
04及び検索語と共に、全て展開語保持部207に格納
する。
Next, in step S3002, step S
With respect to all the search words obtained in 3001, expansion word data that matches the expansion entry word 502 of the search expansion dictionary 206 is searched. If there is a headword that matches the search word, the expansion word 503 is set to the corresponding relevance degree 5
04 and the search word are all stored in the expanded word holding unit 207.

【0089】ステップS3003では、ステップS30
02にて展開語保持部207に格納されている展開語を
取り出し、概念辞書208の見出し語601(図6)と
一致するものがあるか検索する。そして、展開語に一致
する概念辞書見出し語601が存在する場合には、対応
する概念ベクトルデータを、概念辞書208より取り出
す。
In step S3003, step S30
In step 02, the expansion word stored in the expansion word holding unit 207 is extracted, and a search is made to see if there is any word that matches the entry word 601 (FIG. 6) in the concept dictionary 208. If there is a concept dictionary entry word 601 that matches the expanded word, the corresponding concept vector data is extracted from the concept dictionary 208.

【0090】次にS3004では、取得した概念ベクト
ルデータの構成要素の成分値と、展開語保持部207に
展開語と対応して格納されている関連度504の値とを
乗じて、得られた積を検索要求概念特徴1に加算するこ
とにより、類似性を評価する第1の類似性評価尺度情報
として、検索要求概念特徴1データを構築する。尚、検
索要求概念特徴1は、予めベクトルの全ての次元要素を
0に初期化しておく。
In step S3004, the obtained value is obtained by multiplying the component value of the component of the acquired concept vector data by the value of the degree of association 504 stored in the expanded word holding unit 207 in correspondence with the expanded word. By adding the product to the search request concept feature 1, search request concept feature 1 data is constructed as first similarity evaluation scale information for evaluating similarity. In the search request concept feature 1, all the dimension elements of the vector are initialized to 0 in advance.

【0091】ステップS3005では、展開語保持部2
07に格納された全ての展開語を処理したかどうか判定
し、全ての展開語の処理を終えたならば、検索要求概念
特徴1ベクトルデータを、各要素の2乗和が1になるよ
う正規化を行った後、検索概念特徴1保持部210に格
納し、ステップS3006へ分岐する。未処理の展開語
があればステップS3003の処理へループする。
In step S3005, expanded word holding unit 2
It is determined whether or not all expansion words stored in 07 have been processed. When all expansion words have been processed, the search request concept feature 1 vector data is normalized so that the sum of squares of each element becomes 1. After the conversion, it is stored in the search concept feature 1 holding unit 210, and the process branches to step S3006. If there is an unprocessed expansion word, the process loops to step S3003.

【0092】次にステップS3006では、検索要求概
念特徴1ベクトルデータが構築できたかどうかを、検索
要求概念特徴1ベクトルデータがゼロベクトルであるか
どうかによって判定し、この判定の結果、ゼロベクトル
であった場合は、ステップS3010の処理へ分岐し、
一方、検索要求概念特徴1ベクトルデータが構築できた
場合は、ステップS3007へ分岐する。
Next, in step S3006, it is determined whether or not the search request concept feature 1 vector data has been constructed, based on whether or not the search request concept feature 1 vector data is a zero vector. If so, the process branches to step S3010,
On the other hand, if the search request concept feature 1 vector data has been constructed, the flow branches to step S3007.

【0093】ステップS3007では、ステップS30
06の判断において検索要求概念特徴1ベクトルデータ
がゼロではなく、検索要求概念特徴1ベクトルデータが
構築できたと判定されたので、後述する文書登録処理
(図13)のステップS5007において予め格納した
ところの、対応する蓄積文書概念特徴1ベクトルデータ
を、蓄積文書概念特徴1保持部212より取得する。
At step S3007, at step S30
In the determination of step 06, it was determined that the search request concept feature 1 vector data was not zero and that the search request concept feature 1 vector data could be constructed, so the search request concept feature 1 vector data stored in advance in step S5007 of the document registration process (FIG. 13) described later. , The corresponding stored document concept feature 1 vector data is acquired from the stored document concept feature 1 holding unit 212.

【0094】ステップS3008では、取得した蓄積文
書概念特徴1ベクトルデータと、検索要求概念特徴1保
持部210に格納された検索要求概念特徴1ベクトルデ
ータとの概念類似度を算出する。本ステップにおいて、
概念類似度の算出は、当該両ベクトルデータの余弦測度
によって求めることができる。算出した概念類似度は、
蓄積文書の文書IDと対応付けて不図示のバッファメモ
リに一時記憶する。
In step S 3008, the concept similarity between the acquired stored document concept feature 1 vector data and the search request concept feature 1 vector data stored in the search request concept feature 1 holding unit 210 is calculated. In this step,
The concept similarity can be calculated from the cosine measure of the two vector data. The calculated concept similarity is
The data is temporarily stored in a buffer memory (not shown) in association with the document ID of the stored document.

【0095】ステップS3009では、全ての蓄積文書
についてステップS3008の処理を終えたかどうかを
判定し、未処理の蓄積文書があれば、ステップS300
7へループし、全ての蓄積文書に対して処理を終えてい
ればステップS3016へ分岐する。
In step S3009, it is determined whether or not the processing in step S3008 has been completed for all the stored documents.
7 and if all stored documents have been processed, the flow branches to step S3016.

【0096】一方、ステップS3006の判断において
検索要求概念特徴1ベクトルデータがゼロのままであ
り、検索要求概念特徴1ベクトルデータが構築できなか
ったと判定された場合には、以下に説明するステップS
3010乃至ステップS3015の各ステップの処理に
より、検索要求概念特徴2ベクトルデータを構築し、蓄
積文書の概念特徴2ベクトルデータとの概念類似度を算
出することにより、文書内容の類似概念検索を行う。
On the other hand, if it is determined in step S3006 that the search request concept feature 1 vector data remains zero and that the search request concept feature 1 vector data cannot be constructed, step S3006 described below is performed.
Through the processing of each step from step 3010 to step S3015, search request concept feature 2 vector data is constructed, and a similar concept search of the document content is performed by calculating the concept similarity with the concept feature 2 vector data of the stored document.

【0097】即ち、ステップS3010において、展開
語保持部207より展開語を取り出す。
That is, in step S3010, a developed word is extracted from the developed word holding unit 207.

【0098】次に、ステップS3011では、単語イン
デックス226を参照して、単語インデックスを次元要
素とするベクトルデータを、検索要求概念特徴2データ
として構築する。この検索要求概念特徴2データは、上
述した検索要求概念特徴1とは異なる評価尺度であると
ころの、類似性を評価する第2の類似性評価尺度情報で
ある。即ち、単語インデックステーブルから単語ID8
02がインデックスとして取得できる単語については、
そのインデックスを添え字とする要素値として、該単語
の出現頻度を与え、出現しなかった単語のインデックス
を添え字とする要素値として0を与える。
Next, in step S3011, with reference to the word index 226, vector data having the word index as a dimension element is constructed as search request concept feature 2 data. The search request concept feature 2 data is second similarity evaluation scale information for evaluating similarity, which is an evaluation scale different from the search request concept feature 1 described above. That is, word ID 8 is obtained from the word index table.
For words that 02 can be obtained as an index,
The occurrence frequency of the word is given as an element value with the index as a subscript, and 0 is given as an element value with the index of the word that did not appear as a subscript.

【0099】ステップS3012では、展開語保持部2
07に格納された全ての展開語を処理し終えたかどうか
判定し、未処理の展開語があればステップS3010へ
ループし、全ての展開語の処理を終えれば、検索要求概
念特徴2ベクトルデータの各要素値の2乗和が1となる
ように正規化して、検索要求ステップS3013へ分岐
する。
In step S3012, expanded word holding unit 2
In step S3010, it is determined whether or not all expanded words stored in 07 have been processed. If there are unprocessed expanded words, the process loops to step S3010. Are normalized so that the sum of the squares of the respective element values becomes 1 and the process branches to a search requesting step S3013.

【0100】ステップS3013では、後述する文書登
録処理(図13)のステップS5007において予め格
納したところの、蓄積文書概念特徴2ベクトルデータ
を、蓄積文書概念特徴2保持部218より取り出し、も
し、ステップS3011で構築した検索要求概念特徴2
ベクトルデータの次元要素のうち、蓄積文書概念特徴2
ベクトルデータの次元要素にないものがあれば、その単
語インデックスに相当する成分要素値を0とし、蓄積文
書概念特徴2ベクトルデータの要素として追加する。
In step S3013, the stored document concept feature 2 vector data stored in advance in step S5007 of the document registration process (FIG. 13) described later is extracted from the stored document concept feature 2 holding unit 218. Feature 2 of search request concept constructed by
Of the dimensional elements of vector data, stored document concept feature 2
If any of the dimension elements of the vector data does not exist, the component element value corresponding to the word index is set to 0 and added as an element of the stored document concept feature 2 vector data.

【0101】ステップS3014では、ステップS30
13で取得した蓄積文書概念特徴2ベクトルデータと、
ステップS3011で算出した検索要求概念特徴2ベク
トルデータとの概念類似度を算出する。本ステップにお
ける概念類似度の算出は、当該両ベクトルデータの余弦
測度によって求めることができる。算出した概念類似度
は、蓄積文書の文書IDと対応付けて不図示のバッファ
メモリに一時記憶する。
In step S3014, step S30
13, the stored document conceptual feature 2 vector data acquired in
The concept similarity with the search request concept feature 2 vector data calculated in step S3011 is calculated. The calculation of the concept similarity in this step can be obtained from the cosine measure of the two vector data. The calculated concept similarity is temporarily stored in a buffer memory (not shown) in association with the document ID of the stored document.

【0102】そしてステップS3016では、ステップ
S3008或いはステップS3014において算出さ
れ、且つ不図示のバッファメモリに格納された類似概念
の全ての検索結果を、概念類似度の降順にソートし、そ
のソートした結果を検索結果保持部213に格納して、
終了する。
In step S3016, all search results of similar concepts calculated in step S3008 or S3014 and stored in a buffer memory (not shown) are sorted in descending order of concept similarity, and the sorted results are sorted. Stored in the search result holding unit 213,
finish.

【0103】<文書登録処理>次に、文書登録処理につ
いて図12を参照して説明する。本実施形態において、
文書登録処理は、当該情報検索装置による効率的な情報
検索を担保すべく、上述した文書検索処理による文書の
検索とは別個に、メンテナンスの位置付けで定期または
不定期に実行される。
<Document Registration Processing> Next, the document registration processing will be described with reference to FIG. In this embodiment,
The document registration process is executed regularly or irregularly at a maintenance position separately from the document search by the above-described document search process in order to ensure efficient information search by the information search device.

【0104】図12は、本実施形態で実行される文書登
録処理を示すフローチャートである。
FIG. 12 is a flowchart showing a document registration process executed in this embodiment.

【0105】同図において、ステップS4001では、
登録文書の内容から概念特徴を抽出して登録する文書内
容概念登録処理を行う。尚、この文書内容概念登録処理
の詳細については後述する。
In the figure, in step S4001,
A document content concept registration process for extracting and registering concept features from the content of the registered document is performed. The details of the document content concept registration process will be described later.

【0106】次にステップS4002では、登録文書を
含めた蓄積文書217から検索関連語を抽出して検索語
展開辞書に登録する処理を行う。尚、この検索関連語抽
出処理の詳細については後述する。
Next, in step S4002, a process of extracting a search related word from the stored document 217 including the registered document and registering it in the search word expansion dictionary is performed. The details of the search-related word extraction processing will be described later.

【0107】次にステップS4003では、概念辞書2
08(図6)に見出し単語601として登録されていな
い検索語について概念特徴1を推定し、追加登録を行う
検索語概念抽出処理を行う。尚、この検索語概念抽出処
理の詳細については後述する。
Next, in step S4003, the concept dictionary 2
Concept feature 1 is estimated for a search word that is not registered as a headline word 601 in 08 (FIG. 6), and a search word concept extraction process for performing additional registration is performed. The details of the search term concept extraction processing will be described later.

【0108】次にステップS4004では、登録文書の
スタイル,体裁,フォーマットなどの文書フォーマット
情報に基づいて、文書フォーム情報を登録する文書フォ
ーム登録処理を行う。この処理は同種の情報検索装置に
おいて公知の処理を行うものである。
In step S4004, a document form registration process for registering document form information is performed based on document format information such as the style, appearance, and format of the registered document. This process performs a known process in the same type of information search device.

【0109】次にステップS4005では、登録文書の
タイトル,作者,管理者,作成日時,作成部門,作成目
的,その他の文書に附帯するメタデータを文書属性とし
て登録する文書属性登録処理を行う。この処理は同種の
情報検索装置において公知の処理を行うものである。
In step S4005, document attribute registration processing for registering the metadata, the author, the administrator, the creation date and time, the creation department, the creation purpose, and other metadata accompanying the document as document attributes of the registered document is performed. This process performs a known process in the same type of information search device.

【0110】そして、ステップS4006では、対象と
している登録文書に、ステップS4001乃至ステップ
S4005の各ステップにて取得した各種データを対応
付けした状態で、登録文書224に登録する。
In step S4006, the target registration document is registered in the registration document 224 in a state where the various data obtained in the steps S4001 to S4005 are associated with each other.

【0111】(文書内容概念登録処理)次に、ステップ
S4001の文書内容概念登録処理の詳細について図1
3を用いて説明する。
(Document Content Concept Registration Process) Next, the details of the document content concept registration process in step S4001 will be described with reference to FIG.
3 will be described.

【0112】図13は、本実施形態における文書概念登
録処理の詳細を示すフローチャートである。
FIG. 13 is a flowchart showing details of the document concept registration process in this embodiment.

【0113】同図において、ステップS5001では、
登録対象とする登録文書224(対象登録文書)の文字
列を構成する単語を抽出する。単語の抽出は、形態素解
析処理として一般に用いられる手法を適用する。
In FIG. 17, in step S 5001,
The words forming the character string of the registered document 224 (target registered document) to be registered are extracted. For the extraction of words, a method generally used for morphological analysis is applied.

【0114】次にステップS5002では、ステップS
5001にて抽出した各単語について、単語インデック
ス226への登録を行う。即ち、単語インデックステー
ブル内の単語801に一致する単語であれば、該当する
単語IDを取得し、取得した単語IDをインデックスと
する当該テーブルの列情報に、対象登録文書における出
現頻度を格納する。一方、単語インデックステーブルの
単語801と一致しない単語については、その単語を単
語インデックステーブルに追加すべく、当該単語に対し
て新規に一意な単語IDを割り振り、割り振られた単語
IDを当該テーブルの列情報の欄に加え、登録済みの蓄
積文書に対しては頻度として0を格納し、対象登録文書
に対しては出現頻度を格納する。
Next, in step S5002, step S500
Each word extracted in 5001 is registered in the word index 226. That is, if the word matches the word 801 in the word index table, the corresponding word ID is acquired, and the appearance frequency in the target registered document is stored in the column information of the table using the acquired word ID as an index. On the other hand, for a word that does not match the word 801 in the word index table, a new unique word ID is assigned to the word in order to add the word to the word index table, and the assigned word ID is stored in a column of the table. In addition to the information column, 0 is stored as a frequency for a registered stored document, and an appearance frequency is stored for a target registered document.

【0115】次にステップS5003では、単語インデ
ックス226を参照して、文書概念特徴2ベクトルデー
タを構築する。即ち、単語インデックス226の対象登
録文書の行データを取り出し、各単語インデックスに対
する成分要素として、出現頻度を与える。
Next, in step S5003, document concept feature 2 vector data is constructed with reference to the word index 226. That is, the line data of the target registered document of the word index 226 is extracted, and the appearance frequency is given as a component element for each word index.

【0116】ステップS5004では、ステップS50
01にて抽出した単語と一致する見出し語601がある
か否かを概念辞書208にて検索し、その検索の結果、
一致する見出し語が存在すれば、対応する概念特徴1ベ
クトルデータを取り出す。
In step S5004, step S50
01 is searched in the concept dictionary 208 for a headword 601 that matches the word extracted in 01, and as a result of the search,
If there is a matching headword, the corresponding concept feature 1 vector data is extracted.

【0117】ステップS5005では、ステップS50
04にて取り出した概念特徴1ベクトルデータに頻度に
応じた重みを乗じて、算出した積を、ステップS500
3にて構築した蓄積文書概念特徴2ベクトルデータに加
算する。ここで頻度に乗じた重みとは、文書内単語頻度
(TF値)と逆文書頻度(IDF)の積に応じて与える
ものとする。
In step S5005, in step S50
The product calculated by multiplying the conceptual feature 1 vector data extracted in step 04 by a weight corresponding to the frequency is calculated in step S500.
3 is added to the stored document conceptual feature 2 vector data. Here, the weight multiplied by the frequency is given according to the product of the word frequency in the document (TF value) and the inverse document frequency (IDF).

【0118】ステップS5006では、登録文書の全て
の単語について処理を終えたかどうか判定し、未処理の
単語があればステップS5001へループし、全ての単
語について処理を終えていればステップS5007へ分
岐する。
In step S5006, it is determined whether or not processing has been completed for all words in the registered document. If there is an unprocessed word, the processing loops to step S5001, and if processing has been completed for all words, processing branches to step S5007. .

【0119】そして、ステップS5007では、文書概
念特徴1ベクトルデータをベクトル要素の2乗和が1と
なるように正規化し、その正規化したデータを、図11
のステップS3008にて使用する蓄積文書概念特徴1
ベクトルデータとして、蓄積文書概念特徴1保持部21
2に登録する。また、文書概念特徴2ベクトルデータ
も、同様に要素の2乗和が1となるように正規化して長
さをそろえて、その正規化したデータを、図11のステ
ップS3014にて使用する蓄積文書概念特徴2ベクト
ルデータとして、蓄積文書概念特徴2保持部218に登
録して終了する。
In step S5007, the document concept feature 1 vector data is normalized so that the sum of squares of the vector elements becomes 1, and the normalized data is converted to the data shown in FIG.
Stored document conceptual feature 1 used in step S3008
As vector data, stored document conceptual feature 1 holding unit 21
Register in 2. Also, the document concept feature 2 vector data is similarly normalized such that the sum of squares of the elements becomes 1, and the lengths thereof are made uniform. It is registered as the concept feature 2 vector data in the stored document concept feature 2 holding unit 218, and the processing ends.

【0120】(検索関連語抽出処理)次に、ステップS
4002の検索関連語抽出処理の詳細について図14を
用いて説明する。
(Search Related Word Extraction Process) Next, step S
Details of the search-related word extraction processing 4002 will be described with reference to FIG.

【0121】図14は、本実施形態における検索関連語
抽出処理の詳細を示すフローチャートである。
FIG. 14 is a flowchart showing details of the search-related word extraction processing in this embodiment.

【0122】同図において、ステップS6001では、
登録文書224(対象登録文書)の文字列を構成する単
語を抽出する。単語の抽出は、形態素解析処理として一
般に用いられる手法を適用する。
In the figure, in step S6001,
The words constituting the character string of the registered document 224 (target registered document) are extracted. For the extraction of words, a method generally used for morphological analysis is applied.

【0123】ステップS6002では、抽出された各々
の単語について、登録文書224に出現する他の単語と
の相関度を求めて、関連性の高い共起語を取得する。相
関度の求め方としては、単語インデックステーブル22
6を参照して、他の文書への出現頻度は低いが、当該対
象登録文書において、注目する単語と特異的に共起して
出現する単語を、単語頻度(TF値)と逆文書頻度(I
DF値)との積が最大になるものからランク付けして決
定する。
In step S6002, for each extracted word, the degree of correlation with other words appearing in the registered document 224 is obtained, and a co-occurring word having a high relevance is obtained. As a method of calculating the degree of correlation, the word index table 22
Referring to FIG. 6, words appearing specifically in the target registered document that co-occur with the word of interest, although the frequency of appearance in other documents is low, are referred to as word frequency (TF value) and inverse document frequency (TF value). I
DF value) is determined by ranking from the product with the largest product.

【0124】ステップS6003では、ステップS60
02で求めた共起語が検索語展開辞書206に展開語5
03として既に登録済みであるかどうか検索し、その検
索の結果、登録済みであればステップS6002へルー
プして次の共起語を取得し、未登録の展開語であれば、
ステップS6004の処理へ分岐する。
In step S6003, step S60
02 is stored in the search word expansion dictionary 206 as the expansion word 5
03, it is searched whether it has already been registered. As a result of the search, if it has been registered, the process loops to step S6002 to acquire the next co-occurrence word.
Processing branches to step S6004.

【0125】ステップS6004では、ステップS60
03にて検索語展開辞書206に未登録と判定された共
起語を、該単語に対応する展開語として検索語展開辞書
206に追加登録する。その際、ステップS6002に
て求めた共起相関度を按分して関連度504の値とし、
FLG505として追加展開語であることを示すフラグ
情報「A」と対応付けて登録する。
In step S6004, step S60
In 03, the co-occurrence word determined not to be registered in the search word development dictionary 206 is additionally registered in the search word expansion dictionary 206 as a development word corresponding to the word. At this time, the co-occurrence correlation calculated in step S6002 is proportionally divided into a value of the relevance 504,
FLG 505 is registered in association with flag information “A” indicating an additional expansion word.

【0126】ステップS6005では、全ての共起語を
処理したか判定し、未処理の共起語があればステップS
6002へループする。
In step S6005, it is determined whether or not all co-occurring words have been processed.
Loop to 6002.

【0127】そしてステップS6006では、登録文書
224の全ての単語を処理したか判定し、未処理の単語
があればステップS6001へループし、全ての単語の
処理を終えれば終了する。
In step S6006, it is determined whether all the words of the registered document 224 have been processed. If there is an unprocessed word, the process loops to step S6001. If all the words have been processed, the process ends.

【0128】(検索語概念抽出処理)次に、ステップS
4003の検索語概念抽出処理の詳細について図15を
用いて説明する。
(Search Word Concept Extraction Processing) Next, step S
Details of the search term concept extraction processing 4003 will be described with reference to FIG.

【0129】図15は、本発明実施形態の検索語概念抽
出処理の詳細を示すフローチャートである。
FIG. 15 is a flowchart showing details of the search term concept extraction processing according to the embodiment of the present invention.

【0130】ステップS7001では、概念辞書208
の見出し語601に登録されていない未知概念語を取得
する。ここで、未知概念語であるか否かの判定は、単語
インデックス226の単語801に存在して、且つ概念
辞書208の見出し語601に存在しない単語を、未知
概念語であると判定する。
In step S7001, the concept dictionary 208
An unknown concept word that is not registered in the headword 601 is acquired. Here, to determine whether or not the word is an unknown concept word, a word that exists in the word 801 of the word index 226 and does not exist in the headword 601 of the concept dictionary 208 is determined to be an unknown concept word.

【0131】ステップS7002では、取り出した未知
概念語の関連語を、検索語展開辞書206を検索するこ
とによって取得し、取得した関連語、その関連語を展開
見出し語502として持つ展開語、並びに両者の関連度
504を、展開語保持部207に格納する。
In step S7002, a related word of the extracted unknown concept word is obtained by searching the search word expansion dictionary 206, and the obtained related word, an expansion word having the relevant word as an expansion headword 502, and both Is stored in the expanded word holding unit 207.

【0132】ステップS7003では、展開語保持部2
07に格納された関連語を取得し、取得した関連語に従
って概念辞書208を検索することにより、当該関連語
に対応する概念特徴1ベクトルデータを取得する。この
とき、当該関連語が概念辞書208に見出し語として登
録されていない場合には、概念特徴1ベクトルデータと
して要素全てが0であるゼロベクトルとする。
In the step S7003, the expanded word holding unit 2
The related word stored in 07 is acquired, and the concept dictionary 208 is searched according to the acquired related word, thereby acquiring the concept feature 1 vector data corresponding to the related word. At this time, if the related word is not registered as a headword in the concept dictionary 208, a zero vector in which all the elements are 0 is set as the concept feature 1 vector data.

【0133】ステップS7004では、ステップS70
03で得られた関連語の概念特徴1ベクトルデータに、
展開語保持部207に格納された関連度を乗じたものを
未知概念語の概念特徴1ベクトルデータに加算する。
尚、未知概念語の概念特徴1ベクトルデータは、予め各
要素値が全て0のゼロベクトルに初期化しておく。
In step S7004, step S70
In the concept feature 1 vector data of the related word obtained in 03,
The product obtained by multiplying the degree of association stored in the expanded word holding unit 207 is added to the concept feature 1 vector data of the unknown concept word.
The concept feature 1 vector data of the unknown concept word is initialized in advance to a zero vector in which all element values are 0.

【0134】ステップS7006では、展開語保持部2
07に格納された全ての関連語を処理し終えたかどうか
判定し、未処理の関連語があればステップS7003へ
ループし、全ての関連語について処理し終えればステッ
プS7007へ分岐する。
In the step S7006, the expanded word holding unit 2
It is determined whether all the related words stored in 07 have been processed. If there is any unprocessed related word, the process loops to step S7003. If all the related words have been processed, the process branches to step S7007.

【0135】ステップS7007では、未知語概念特徴
1ベクトルを各要素値の2乗和が1となるように正規化
した後、概念辞書208に登録する。
In step S7007, the unknown word concept feature 1 vector is normalized so that the sum of squares of each element value becomes 1, and then registered in the concept dictionary 208.

【0136】ステップS7008では、全ての未知概念
語を処理し終えたかどうか判定し、未処理の未知概念語
があればステップS7001へループし、全ての未知概
念語について処理を終えたならば終了する。
In step S7008, it is determined whether or not all unknown concept words have been processed. If there is an unprocessed unknown concept word, the process loops to step S7001. If all unknown concept words have been processed, the process ends. .

【0137】上述した本実施形態によれば、類似情報検
索の操作指示を、図3(図4)に例示するような1つの
操作画面にまとめつつ、且つ、何れの類似情報検索を行
うかを、操作者が類似性の観点によって明示的に且つ容
易に指定可能に構成することによって、適切な概念類似
検索を行うことができ、利便性も向上する。
According to the above-described embodiment, the operation instruction for similarity information search is combined into one operation screen as illustrated in FIG. 3 (FIG. 4), and which similar information search is to be performed. In this configuration, the operator can explicitly and easily specify the concept from the viewpoint of the similarity, so that an appropriate concept similarity search can be performed, and the convenience is improved.

【0138】[0138]

【他の実施形態】上述した実施形態では、検索対象とし
て文書情報を用いて説明したが、文書情報以外の内容記
述メタデータが付随した画像情報,動画情報,番組内容
記述情報などのマルチメディア情報についても、内容記
述された文章情報に対して、情報特徴量抽出を行い、情
報特徴量の類似測度を求めることによって、本発明を適
用することができる。
[Other Embodiments] In the above embodiment, description was made using document information as a search target. However, multimedia information such as image information, moving image information, and program content description information accompanied by content description metadata other than document information is described. Also, the present invention can be applied by extracting the information feature amount from the text information in which the content is described, and calculating the similarity measure of the information feature amount.

【0139】また、上述した実施形態において、検索対
象となる蓄積文書217、蓄積文書概念特徴1保持部2
12、蓄積文書概念特徴2保持部218、蓄積文書フォ
ーム保持部219、蓄積文書属性保持部220、単語イ
ンデックス226、概念辞書208、検索語展開辞書2
06は、単一の装置を構成するDISK14に配置する
ものとして説明したが、これらの構成要件を異なる装置
に分散配置し、NIC19を介してネットワーク上で処
理を行うようにすることも可能である。
In the above-described embodiment, the stored document 217 to be searched and the stored document conceptual feature 1 holding unit 2
12, storage document concept feature 2 storage unit 218, storage document form storage unit 219, storage document attribute storage unit 220, word index 226, concept dictionary 208, search word expansion dictionary 2
06 has been described as being arranged in the DISK 14 constituting a single device, but it is also possible to distribute these components to different devices and perform processing on a network via the NIC 19. .

【0140】尚、本発明は複数の機器(例えばホストコ
ンピュータ,インタフェース機器,リーダー,プリンタ
など)から構成されるシステムに適用しても、ひとつの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
Even if the present invention is applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), a device including one device (for example, a copying machine, a facsimile machine, etc.) ) May be applied.

【0141】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システム或いは装置に供給し、その
システム或いは装置のコンピュータ(またはCPUやM
PU)が記憶媒体に格納されたプログラムコードを読出
し実行することによっても達成される。
Further, an object of the present invention is to provide a storage medium storing a program code of software for realizing the functions of the above-described embodiments to a system or an apparatus, and to provide a computer (or CPU or MPU) of the system or apparatus.
PU) reads out and executes the program code stored in the storage medium.

【0142】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention.

【0143】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピーディスク,ハードディ
スク,光磁気ディスク,CD−ROM,CD−R,CD
−RW,DVD−ROM,DVD−RAM,DVD−R
W,DVD+RW,磁気テープ,不揮発性のメモリカー
ド,ROMなどを用いることができる。
As a storage medium for supplying the program code, for example, a floppy disk, hard disk, magneto-optical disk, CD-ROM, CD-R, CD
-RW, DVD-ROM, DVD-RAM, DVD-R
W, DVD + RW, magnetic tape, nonvolatile memory card, ROM and the like can be used.

【0144】また、コンピュータが読み出したプログラ
ムコードを実行することにより、前述した実施形態の機
能が実現されるだけでなく、そのプログラムコードの指
示に基づき、コンピュータ上で稼動しているOS(オペ
レーティングシステム)などが実際の処理の一部または
全部を行い、その処理によって前述した実施形態の機能
が実現される場合も含まれる。
When the computer executes the readout program code, not only the functions of the above-described embodiment are realized, but also the OS (Operating System) running on the computer based on the instruction of the program code. ) Performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0145】更に、記憶媒体から読み出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書き込まれた後、そのプログラムコードの指示
に基づき、その機能拡張ボードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれる。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, based on the instruction of the program code, The CPU provided in the function expansion board or function expansion unit performs part or all of the actual processing,
The case where the function of the above-described embodiment is realized by the processing is also included.

【0146】[0146]

【発明の効果】以上説明したように、本発明によれば、
複数種類の類似検索手法の中から類似性の観点によって
所望の類似検索手法を操作者が選択可能な情報検索装置
及びその制御方法及びコンピュータ読み取り可能な記憶
媒体の提供が実現する。
As described above, according to the present invention,
An information search apparatus, a control method thereof, and a computer-readable storage medium capable of allowing an operator to select a desired similarity search technique from the viewpoint of similarity among a plurality of types of similarity search techniques are provided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態における情報検索装置の装置構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a device configuration of an information search device according to an embodiment.

【図2】本実施形態における情報検索装置の機能構成を
示すブロック図である。
FIG. 2 is a block diagram illustrating a functional configuration of the information search device according to the embodiment.

【図3】本実施形態における検索要求文或いは検索要求
語と、類似検索観点とを指示する場合の操作パネルの表
示例を示す図である。
FIG. 3 is a diagram illustrating a display example of an operation panel when a search request sentence or a search request word and a similar search viewpoint are instructed in the present embodiment.

【図4】本実施形態における検索要求文及び類似検索観
点に対応する検索結果の表示例を示す図である。
FIG. 4 is a diagram showing a display example of a search request sentence and a search result corresponding to a similar search viewpoint in the embodiment.

【図5】本実施形態における検索語展開辞書の構成を例
示する図である。
FIG. 5 is a diagram exemplifying a configuration of a search word expansion dictionary in the embodiment.

【図6】本実施形態における概念辞書の構成を示す図で
ある。
FIG. 6 is a diagram showing a configuration of a concept dictionary in the present embodiment.

【図7】本実施形態における単語インデックスの構成を
示す図である。
FIG. 7 is a diagram illustrating a configuration of a word index according to the present embodiment.

【図8】本実施形態における単語インデックスにおける
単語IDと単語の対応関係を示す図である。
FIG. 8 is a diagram showing the correspondence between word IDs and words in a word index according to the embodiment.

【図9】本実施形態において実行される類似文書検索処
理を示すフローチャートである。
FIG. 9 is a flowchart illustrating a similar document search process executed in the embodiment.

【図10】本実施形態において実行される検索要求入力
処理の詳細を示すフローチャートである。
FIG. 10 is a flowchart illustrating details of a search request input process executed in the embodiment.

【図11】本実施形態において実行される文書概念類似
検索処理の詳細を示すフローチャートである。
FIG. 11 is a flowchart illustrating details of a document concept similarity search process executed in the present embodiment.

【図12】本実施形態において実行される文書登録処理
を示すフローチャートである。
FIG. 12 is a flowchart illustrating a document registration process executed in the embodiment.

【図13】本実施形態において実行される文書内容概念
登録処理の詳細を示すフローチャートである。
FIG. 13 is a flowchart illustrating details of a document content concept registration process executed in the present embodiment.

【図14】本実施形態において実行される検索関連語抽
出処理の詳細を示すフローチャートである。
FIG. 14 is a flowchart illustrating details of a search-related word extraction process executed in the present embodiment.

【図15】本実施形態において実行される検索語概念抽
出処理の詳細を示すフローチャートである。
FIG. 15 is a flowchart illustrating details of a search term concept extraction process executed in the present embodiment.

【符号の説明】[Explanation of symbols]

11:CPU, 12:ROM, 13:RAM, 14:DISK, 15:KB, 16:VRAM, 17:CRTC, 18:CRT, 19:NIC, 11: CPU, 12: ROM, 13: RAM, 14: DISK, 15: KB, 16: VRAM, 17: CRTC, 18: CRT, 19: NIC,

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 データベースに予め格納された複数のマ
ルチメディア情報の中から所望のマルチメディア情報を
検索する情報検索装置であって、 所望のマルチメディア情報を検索するための検索要求を
入力可能な入力手段と、 前記入力手段より入力された検索要求について、第1の
類似性の観点に基づいて、前記データベースから類似す
るマルチメディア情報を検索する第1の類似情報検索手
段と、 前記検索要求について、前記第1の類似性とは異なる第
2の観点に基づいて、前記データベースから類似するマ
ルチメディア情報を検索する第2の類似情報検索手段
と、 前記所望のマルチメディア情報を検索する際の類似性の
観点を選択可能な類似観点選択手段と、 前記類似観点選択手段によって選択された類似性の観点
に従って、前記第1または第2の類似情報検索手段によ
る情報検索が行われるように制御する情報検索制御手段
と、を備えることを特徴とする情報検索装置。
1. An information search device for searching for desired multimedia information from a plurality of multimedia information stored in a database in advance, wherein a search request for searching for the desired multimedia information can be input. Input means; first similarity information search means for searching for similar multimedia information from the database based on a first similarity viewpoint with respect to the search request input from the input means; A second similarity information searching means for searching the database for similar multimedia information based on a second viewpoint different from the first similarity; and a similarity when searching for the desired multimedia information. Similar viewpoint selection means capable of selecting a viewpoint of gender; Other information retrieval apparatus characterized by comprising, an information search control means for controlling so that the information retrieval is performed by the second similarity information retrieval means.
【請求項2】 前記第1の類似情報検索手段は、前記検
索要求について、前記複数のマルチメディア情報に付帯
する言語表現された文字情報との類似性を測ることを特
徴とする請求項1記載の情報検索装置。
2. The method according to claim 1, wherein the first similar information search unit measures the similarity of the search request with linguistically expressed character information accompanying the plurality of multimedia information. Information retrieval device.
【請求項3】 前記第1の類似情報検索手段は、前記検
索要求について、前記複数のマルチメディア情報に付帯
するレイアウト情報に基づいて視覚的な類似性を測るこ
とを特徴とする請求項1記載の情報検索装置。
3. The method according to claim 1, wherein the first similar information search unit measures visual similarity of the search request based on layout information attached to the plurality of pieces of multimedia information. Information retrieval device.
【請求項4】 前記第1の類似情報検索手段は、前記検
索要求について、前記複数のマルチメディア情報に付帯
するメタデータの類似性を測ることを特徴とする請求項
1に記載の情報検索装置。
4. The information search apparatus according to claim 1, wherein the first similar information search unit measures similarity of metadata attached to the plurality of pieces of multimedia information with respect to the search request. .
【請求項5】 前記第1の類似情報検索手段は、前記メ
タデータとして、前記複数のマルチメディア情報に付帯
するところの、該情報のタイトル,該情報の作成者,該
情報の管理者,該情報の作成者の所属情報,該情報の利
用可能者,該情報の作成日時,該情報の内容記述の要約
文,該情報の内容記述言語,該情報の内容記述形式,該
情報の利用料金,該情報のデータサイズの少なくとも何
れか1つを用いることを特徴とする請求項4記載の情報
検索装置。
5. The first similar information search means, as the metadata, a title of the information, a creator of the information, a manager of the information, Affiliation information of the creator of the information, who can use the information, the date and time of creation of the information, a summary sentence of the description of the information, a description language of the information, a description format of the information, a usage fee of the information, The information retrieval apparatus according to claim 4, wherein at least one of the data sizes of the information is used.
【請求項6】 データベースに予め格納された複数のマ
ルチメディア情報の中から所望のマルチメディア情報を
検索する情報検索装置の制御方法であって、 所望のマルチメディア情報を検索するための検索要求が
入力される入力工程と、 複数の類似性の観点の中から、前記所望のマルチメディ
ア情報を検索する際に基準とする類似性の観点が選択さ
れる類似観点選択工程と、 前記入力工程にて入力された検索要求について、前記類
似観点選択工程にて選択された類似性の観点に基づい
て、前記データベースから類似するマルチメディア情報
を検索する類似情報検索工程と、を有することを特徴と
する情報検索装置の制御方法。
6. A control method of an information search device for searching for desired multimedia information from a plurality of pieces of multimedia information stored in a database in advance, wherein a search request for searching for the desired multimedia information is provided. An input step to be input, and a similarity point selection step in which a similarity point to be used as a reference when searching for the desired multimedia information is selected from a plurality of similarity points of view. A similar information search step of searching the database for similar multimedia information based on the similarity viewpoint selected in the similar viewpoint selection step for the input search request. Control method of search device.
【請求項7】 前記類似観点選択工程では、前記類似情
報検索工程において、前記複数のマルチメディア情報に
付帯する言語表現された文字情報との類似性の観点に基
づく情報検索処理が実行されるように、類似性の観点を
選択可能であることを特徴とする請求項6記載の情報検
索装置の制御方法。
7. In the similarity viewpoint selection step, an information search process is performed in the similarity information search step based on a viewpoint of similarity with linguistically expressed character information accompanying the plurality of pieces of multimedia information. 7. The method according to claim 6, wherein a similarity viewpoint can be selected.
【請求項8】 前記類似観点選択工程では、前記類似情
報検索工程において、前記複数のマルチメディア情報に
付帯するレイアウト情報に基づいて、視覚的な類似性の
観点に基づく情報検索処理が実行されるように、類似性
の観点を選択可能であることを特徴とする請求項6記載
の情報検索装置の制御方法。
8. In the similarity viewpoint selection step, in the similarity information search step, an information search process based on a viewpoint of visual similarity is executed based on layout information attached to the plurality of pieces of multimedia information. 7. The method according to claim 6, wherein the similarity viewpoint can be selected.
【請求項9】 前記類似観点選択工程では、前記類似情
報検索工程において、前記複数のマルチメディア情報に
付帯するメタデータの類似性の観点に基づく情報検索処
理が実行されるように、類似性の観点を選択可能である
ことを特徴とする請求項6記載の情報検索装置の制御方
法。
9. The similarity viewpoint selecting step includes: executing a similarity search so that an information search process based on a similarity viewpoint of metadata attached to the plurality of pieces of multimedia information is performed in the similarity information search step. 7. The method according to claim 6, wherein a viewpoint can be selected.
【請求項10】 前記前記類似情報検索工程では、前記
複数のマルチメディア情報に付帯するところの、該情報
のタイトル,該情報の作成者,該情報の管理者,該情報
の作成者の所属情報,該情報の利用可能者,該情報の作
成日時,該情報の内容記述の要約文,該情報の内容記述
言語,該情報の内容記述形式,該情報の利用料金,該情
報のデータサイズの少なくとも何れか1つが、前記メタ
データとして用いられることを特徴とする請求項9記載
の情報検索装置の制御方法。
10. In the similar information search step, a title of the information, a creator of the information, a manager of the information, and affiliation information of a creator of the information, which are attached to the plurality of pieces of multimedia information. , The user who can use the information, the creation date and time of the information, a summary sentence of the description of the information, the description language of the information, the description format of the information, the usage fee of the information, and the data size of the information. 10. The control method according to claim 9, wherein any one is used as the metadata.
【請求項11】 請求項1乃至請求項5の何れかに記載
の情報検索装置としてコンピュータを動作させるプログ
ラムコードが格納されていることを特徴とするコンピュ
ータ読み取り可能な記憶媒体。
11. A computer-readable storage medium storing a program code for operating a computer as the information search device according to claim 1. Description:
【請求項12】 請求項6乃至請求項10記載の情報検
索装置の制御方法をコンピュータによって実現可能なプ
ログラムコードが格納されていることを特徴とするコン
ピュータ読み取り可能な記憶媒体。
12. A computer-readable storage medium storing a program code capable of realizing a control method of the information search device according to claim 6 by a computer.
JP2000304027A 2000-10-03 2000-10-03 Information retrieving device, control method therefor and computer readable storage medium Pending JP2002108936A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000304027A JP2002108936A (en) 2000-10-03 2000-10-03 Information retrieving device, control method therefor and computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000304027A JP2002108936A (en) 2000-10-03 2000-10-03 Information retrieving device, control method therefor and computer readable storage medium

Publications (1)

Publication Number Publication Date
JP2002108936A true JP2002108936A (en) 2002-04-12

Family

ID=18785136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000304027A Pending JP2002108936A (en) 2000-10-03 2000-10-03 Information retrieving device, control method therefor and computer readable storage medium

Country Status (1)

Country Link
JP (1) JP2002108936A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102723A (en) * 2005-10-07 2007-04-19 Hitachi Ltd Document retrieval device, document retrieval method and document retrieval program
JP2007183765A (en) * 2006-01-05 2007-07-19 Matsushita Electric Ind Co Ltd Relevant word acquisition device
JP2007524898A (en) * 2003-04-22 2007-08-30 マイクロソフト コーポレーション Relationship view
JP2010044626A (en) * 2008-08-13 2010-02-25 Internatl Business Mach Corp <Ibm> Information processor, information processing method, and program
US9424563B2 (en) 2005-03-11 2016-08-23 Microsoft Technology Licensing, Llc Accessing medial context information using contextual links

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000049526A1 (en) * 1999-02-16 2000-08-24 Hewlett-Packard Company Similarity searching by combination of different data-types

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000049526A1 (en) * 1999-02-16 2000-08-24 Hewlett-Packard Company Similarity searching by combination of different data-types

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007524898A (en) * 2003-04-22 2007-08-30 マイクロソフト コーポレーション Relationship view
US7689525B2 (en) 2003-04-22 2010-03-30 Microsoft Corporation Relationship view
US9424563B2 (en) 2005-03-11 2016-08-23 Microsoft Technology Licensing, Llc Accessing medial context information using contextual links
US11481086B2 (en) 2005-03-11 2022-10-25 Microsoft Technology Licensing, Llc Accessing media context information using contextual links
JP2007102723A (en) * 2005-10-07 2007-04-19 Hitachi Ltd Document retrieval device, document retrieval method and document retrieval program
JP4592556B2 (en) * 2005-10-07 2010-12-01 株式会社日立製作所 Document search apparatus, document search method, and document search program
JP2007183765A (en) * 2006-01-05 2007-07-19 Matsushita Electric Ind Co Ltd Relevant word acquisition device
JP2010044626A (en) * 2008-08-13 2010-02-25 Internatl Business Mach Corp <Ibm> Information processor, information processing method, and program

Similar Documents

Publication Publication Date Title
CA2539431C (en) Personalized searchable library with highlighting capabilities
US8380728B2 (en) Personalized searchable library with highlighting capabilities
US7174054B2 (en) Method and system for access to electronic images of text based on user ownership of corresponding physical text
US7149353B2 (en) Method and system for suppression of features in digital images of content
US20180004850A1 (en) Method for inputting and processing feature word of file content
WO2011040025A1 (en) Method for setting metadata, system for setting metadata, and program
KR20160015326A (en) Method for searching a database
JP2002108936A (en) Information retrieving device, control method therefor and computer readable storage medium
JP7125322B2 (en) Attribute extraction device and attribute extraction method
JP2002175329A (en) Information retrieval device, its method and computer- readable storage medium
JP2002108914A (en) Device and method for retrieving information and computer readable storage medium
JP4289891B2 (en) Information search device, information search method and program
KR100750674B1 (en) Method For Providing Font Service Enabling Selecting A Font By Area On Service Page And System For Executing The Method
JP2002230020A (en) Information retrieving device and its method and storage medium
JP2002123550A (en) Apparatus and method for information retrieval and storage medium
JP3529659B2 (en) Multimedia information search / presentation method and system, and recording medium recording multimedia information search / presentation system
JP2002123551A (en) Device and method for information retrieval, and storage medium
JP7453505B2 (en) Information processing system, its control method and program
JP7284371B2 (en) Information processing device, information processing method, and program
JP3243949B2 (en) Document creation support device
JP2003091556A (en) Information retrieval method, information retrieval unit, recording medium and program
JP2003108796A (en) Document sales system
JP3447534B2 (en) Information access device
JP2006146578A (en) Search device, search method, and program
JP2011154718A5 (en)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071003

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071003

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100531

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101004