JP2007317188A

JP2007317188A - データインテリジェント加工システム及びその方法

Info

Publication number: JP2007317188A
Application number: JP2007132174A
Authority: JP
Inventors: Kaihao Zhao; 趙開▲コウ▼
Original assignee: Individual
Current assignee: Individual
Priority date: 2006-05-22
Filing date: 2007-05-17
Publication date: 2007-12-06
Also published as: DE112007000053T5; SMP200800032B; US20080235190A1; CN1845104A; CN1845104B; KR20070112730A; SMAP200800032A; WO2007143899A1

Abstract

【課題】一種の新型の情報インテリジェント検索加工システム及びその方法を提供する。
【解決手段】システムがユーザの検索要求を獲得した後、本システムは検索条件に対して予め処理部13による処理を行う。予め処理部13による処理を実行した後、検索要求は細分化されて常軌の簡易直接検索部16、高度組合せ検索部17、分類閲覧検索部18、全文検索部19及びインテリジェント論理検索部20による処理がなされ、且つインテリジェント論理検索部20は論理関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジン22で再び検索を行い、該論理関係の演算は前記の３要素関係モデル、分類インデックスバンク及び知識ユニットインデックス方法に基づいている。最終的に関連検索エンジン22及び全文検索エンジン23を通じては検索結果を獲得した後、システムは検索条件及び検索結果を充分に体現できる内在論理連携の検索結果返送インタフェース24を使用することができる。
【選択図】図９

Description

本発明は、一種の情報インテリジェント検索加工システム及び方法に関わるものであり、特に一種の文書、画像、音声、映像に対するインテリジェント検索加工システム及びその方法に関するものである。

従来、データ情報とテキストファイルの効果的な検索及び加工は、データベースの応用分野において中心及び重要事項であり、各種電子データ、文献、商業用データベースソースとインターネットにおける情報検索に広汎に応用されている。

現在、この分野におけるデータ情報検索技術は、キーワードによる統計方法が一般的であり、キーワードのブーリアン演算式を用いて語句検索を行っている。ファイルデータベースについては、キーワードを使用してキーワードがファイル中の所定位置に出現するように構成された辞書であり、検索語句のキーワードとファイルデータベース中のキーワードとを比較する辞書を用いて、対応するファイルを探し出すようになされている。また他のものは、ファジィ論理モデル、ベクトル空間モデル及び確率検索モデル等を採用するように改良したものも知られている。

しかしながら、これらの方法は単にテキストファイル単位で検索可能に編集が行われているのみで、且つ検索キーワードと編集されたテキストファイル間の類似関連の度合に関しては、現在において暫時努力して改善高精度化を図っている過程であり、未だに満足できる解決方策は無く、情報検索結果の正確さが実現できない現状にある。例えば、同意義語で異なる形のキーワードを探し出すことはできず、または検索可能なものとしては同じ形で異なる意義のキーワード等であった。編集されたテキストファイル内部に含まれている各種データ及び情報に対して、これらの方法では単独識別、区分、並びに属性関係に基づいてインテリジェント加工及び利用を行うことができず、更に異なるテキストファイル間において交差した分析と比較などが行えず、また異なるテキストファイル間において情報内容を多元的角度から加工利用することは実現できていない。

現在、各種データベース内のインテリジェント処理及び検索結果はいずれも編集されたテキストファイルが最小単位を成し、編集されたテキストファイル内に含まれる属性情報はかなり豊富であることから、この方法でインテリジェント処理及び検索され提供される一連の結果は、いずれも不十分であるという問題が存在する。

インテリジェント処理においては、現在、操作はすべてテーマインデックス、個別のキーワード注釈、テキストファイルのアブストラクト方式によって、テキストファイル全体に対し属性表示を行って検索過程の検索キーワードとしており、このような方式ではテキストファイル全体の情報内容を完全に反映させることはできず、最終的な検索結果中に該当するテキストファイルが欠落する虞れがある。

検索結果の提供においては、編集されたテキストファイルが保有する大量の非相関情報は余分な情報やノイズとなるケースが多く、検索結果の精度に影響し、最終的に検索結果において膨大なテキストファイルが抽出され、有効性の低下を招く結果となる。

特許文献１には、従来の情報検索システムの問題点を解決した多次元階層化式の情報検索システムとして、検索文字の表現を使用せずにイメージや実際の形状をグラフィカルに表現しかつ検索文字の入力を使用せずにマウス若しくはタッチパネル等のインタフェースを使用し、前記情報検索を簡単容易に引き出しかつ該情報をピンポイントでターゲットして検索情報を見易くする情報検索システムであり、ドメインの分類、情報発信場所の地域分類、技術・政治・個人等の検索情報の分類等の検索データを多次元の階層化構造で構成しかつインデックスを多重化させてＲＤＢを構築することにより、どの部分からのアクセスにも柔軟に対応できるシステムが開示されている。
特開２００３-７６７０８号公報

上記の問題を解決するため、本発明は一種の新型の情報インテリジェント検索加工システム及びその方法を提供するものである。データ情報及びテキストファイル検索における各種の問題を解決することができ、更にテキストファイル中の異なるキーワード間において、或いは異なるテキストファイル間のキーワードについて満足する検索を行うことができ、情報、内容の比較、分析、新たな関係等のデータ情報に関するインテリジェント加工要求に応えることができ、“隠れた代替・指示”等のような複雑な検索要求をサポートすることができる情報インテリジェント検索加工システム及びその方法を提供する。これと共にシステムにサポートされた多角的な位置表示技術を通じて、文書、画像、音声、映像等のような多種の媒体においても、全ての情報内容を検索及び加工することのできる情報インテリジェント検索加工システム及びその方法を提供する。

本発明は下記の手段により実現される。一種の情報インテリジェント検索加工システムであり、データインテリジェント加工システム、加工用データベース、報知管理モジュール、検索用データベース、インテリジェント検索サービスシステムが含まれており、その中の報知管理モジュールにはデータ報知及びシンクロナイズモジュール、データ公開管理モジュールが含まれている。

上記において、上記データインテリジェント加工システムはデータに対してインテリジェント加工を行い、データ処理して深く分析して知識ユニットを引き出し、及び融通性を持つ正確なインデックス情報を得て、加工用データベース内に保存し、加工用データベース内に更に識別可能に構成された大量の情報を保存し、更に加工を速めるために、生じた中間結果を保存する。

前記報知管理モジュールは、指示を与えた情報内容及びインデックス情報をインテリジェント検索サービスシステムにおいて表示したデータとシンクロさせ、データシンクロはデータ報知及びシンクロナイズモジュールによる処理によって、加工用データベースの情報を検索用データベースにシンクロさせ、検索過程におけるフィードバック情報を検索用データベースから加工用データベース内にシンクロさせる。データ公開管理モジュールは、データのアクセスコールについて権限設置する責務を負うものである。

前記インテリジェント検索サービスシステムは、インテリジェント検索サービス作業ステージを提供し、顧客から到来する検索要求に対して統一処理を行い、検索用データベースを調べて、関連内容を情報検索することを特徴とする情報インテリジェント検索加工システムである。

本発明は、手順が以下の如きである一種の情報インテリジェント検索加工方法である。
１．検索条件の入力ステップ。現在大多数の検索サービスシステムが提供するキーワード入力とインデックス閲覧２種の入力方式以外に、本システムでは更に字根、筆順入力法を通じてユニコード文字データベース中に含まれる又は含まれない大量の希少漢字を入力可能である。
２．検索条件を予め処理するステップ。このステップには代理番号の変換とインデックスの複雑度の評価が含まれる。
３．検索要求について、通常の簡易直接検索、高度組合せ検索、分類閲覧検索、全文検索及びインテリジェント論理的検索に細分化し、前３種の検索方法は関係検索エンジンを直接通じて検索を行い、全文検索は全文検索エンジンを通じて検索を行い、且つインテリジェント論理的検索は論理的関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジンで再び検索を行うステップ。
４．関係検索エンジン又は全文検索エンジンを通じて検索して結果を得た後、元の検索結果に戻るステップ。

本発明は深く分析して引き出した文書情報を保持し、及び高い融通性と知識をもつインデックスの仕組みを基礎とした複数の媒体検索方法とインデックスシステムを確立した。設計と３要素モデル及び漢字字句間の関係の多角度描写を通じて、融通性があって効率が高い交差インデックス体系が確立され、並びにこの交差インデックスシステムの基礎の上に、語義分析機能を具備するインテリジェント検索技術を実現する。同時に、情報内容の検索手法の規範化を通じて、字句と情報内容の関連がより以上にインテリジェント化され、例えば“隠れた代替・指示”等の比較的複雑な検索要求をサポートすることができる。同時にインテリジェントシステムを通じて多角的位置表示技術をサポートし、文字及び画像、表、音声、映像等が多種の形式による媒体に入っていても全て検索することができる。

本発明は下記の顕著な優れた点を持っている。
１．情報内容検索の正確化を実現でき、検索の要求に正確に合致し、無用な検索結果を最大限に減少する。
２．検索過程中の使用者の任意の要求を満足できる。
３．システムの豊富な知識を背景として有し、正確な知識発散手段を通じて、知識に基づく従来実現されていない情報の検索結果を提供することができる。
４．任意知識源間の知識ベースステージに基づく全く新しい情報内容の組合せ及び知識の組合せを実現でき、人、事、時、地、物等の人類の基本的な生産、生活、活動の通用属性間の交差対比に基づいて任意情報内容の検索を実現し、文書、画像、音声、映像等が多種の形式による媒体に入る場合にも内容を２次加工して、自動的に２次、３次又は多次加工された文献を生成することができる。
５．大量の知識に対する活性化及び２次加工が実現でき、情報の知識への速くて秩序ある転化を実現する。
６．人類の生産、生活、活動中の各方面及び異なる知識点を内包し、大量の情報検索中における知識手段問題を最良に解決し、より良い完備性を体現する。
７．人類の知識に対する主観要求に完全に対応し、高い汎用性及び適用性を備え、正、逆の方向で検索を行うことができ、調査と記憶の便宜を図り、操作が簡便で、訓練を必要としない。

以下、図面と具体的な実施例を組合せて本発明を更に詳細に説明する。
本発明の出発点は、検索または処理された情報内容の内在する意味及び構造を分析し、この基礎の上に検索及び加工体系を構築することである。よって、本発明は完全に文書対比の制限を受けず、意味の正確さを完成し、即ち関係の無い又は単に字面が同じであるだけの情報を含まない。一方、情報の完全を期し、即ち字面は異なるが意味が同じ又はユーザ指定の関連特徴の情報を含むことができる。

別の面で、本発明は高い融通性と知能をもつインデックスの仕組みを確立し、並びにこの基礎の上に一方では各種分類情報の科学性を充分に保証し、別の一方では人々の各種習慣及び約定に合致する容易性を備えている。

本発明は現有の検索エンジン及び検索サービスシステムを排斥せず、逆に、本発明は現有の検索エンジン及び検索サービスシステムをとても良く集成し、異なる検索要求の下で相応の機能を発揮し、並びに更に強力な検索サービス能力を生み出すものである。

本発明において、正確な内容検索の実現は、“知識”形式で示された検索結果に対し分析を行うことである。この分析は２つの段階が含まれ、１つは検索結果自身に対する分析を行い、完成、独立した意味を特徴とする“知識ユニット”又は“知識片”を形成する。２つ目は内容中に含まれているキーワードを取出し、キーワードの意味相関度情報を増加させ、及び“隠れた代替・指示”等の関係を備えた有効キーワードを強化し、主要情報の知識属性を豊かにする。相関度が高くない無効キーワードを除き、以って全てのデータ源中の相対検索から言えば、主要な情報に対する副次的な情報の干渉を減少させる。

本発明のインテリジェント検索方式は、インデックス分類閲覧及び文書キーワードに従がって２種の常用の検索方式を組み合わせる。常用の検索エンジンと異なるのは、本発明中ではインデックス分類閲覧に従い、よく見かける学科、習慣など分類方法によって構成要素の主従関係毎に細分化できる以外に、等価別名関係及び背景参考関係の２種に基づく横向きに広く展開した検索手段を提供するものである。よく見られるシステム中の相関連結によるジャンプとは異なり、上記の横向き検索手段が元通りのインデックス分類によって進められており、明確な指向性を備えている。常用の検索エンジンと異なる別の一面は、本発明中の文書キーワードによって同名で異なる意味のキーワードが検索可能で適合して進められ、これは検索ユーザがシステム提示を通じることができ、明確に同名で異なる意味のキーワードの相関情報を理解し、直接素早い２次検索が進められ、自身が必要とする結果集の位置決めをする。

本発明は自然意味によって提起し、完成した自然意味の最小ユニットを知識ユニットの区分標準として記述し、これは概して知識処理したとき、各個知識ユニットの属性を出し切ることができ、又検索結果が現れたときにおいて正確に反応し、情報に対するノイズを減少する。

本発明の情報インテリジェント検索加工システムは完全に人的自然要求本能の思考論理でシステムの分類を進める。本発明は人類検索及び使用した知識の思考方式に基づいて、情報データを12の大分類、即ち人物、事件、時間、地点、物品、生物、衣類、食物、住居、活動器材、教育器材、娯楽器材(略称人、事、時、地、物、生、衣、食、住、行、育、樂)に分け、各大分類は更に幾つかの中分類、例えば人物の中分類は人の姓名、人の性別、人の本籍等に、各中分類は幾つかの小分類、例えば人の姓名は又姓趙、姓張、姓李等に細分化される。このようなツリー状的な多段階構造を形成し、インデックス構造30層とし各種細分データを記述できる。各大分類及び中小分類のインデックスは全て相応する代理番号で表示し、この基礎の上でインデックスの２次加工を更に進め、インデックス構造の背景情報を引き出し、新たに順序と類別を配列し、高い融通性、正確さ、多くの指向性を有する、互いに交差するインテリジェント化インデックスを形成する。

各種の文献、電子データが含まれる各情報データをその内容の長さ又は容量によって幾つかの知識ユニットに区分し、文書知識ユニットの容量は600字符号以内であり、該知識ユニットについて番号を編成する。然る後、各個の知識ユニットの内容について分析、解析を進め、各キーワードを上記の分類方法によって、番号を編成した後対応する上記の関係を分類上に定義する。

本発明の分類方法と過去の伝統的専業分類論理には本質的な違いが有り、完全に伝統的な分類概念を打破した。現在その他の各種専業の分類方法は主に専業の構造段階に基づくもので、人の自然な知識要求を満足させることを考慮したものではなく、汎用性の程度は高くない。ユーザの自然知識の要求に基づいた検索要求に対して、実現過程中の転換の複雑性は高く、全く適用していない。

本発明の別の一大特徴はその他の各種専業分類法を含むことができることであり、本発明の分類方法は人類の基本的知識要求に合致させることに着眼することによって、その分類角度の普遍性はその他の各種の専業に基づく分類方法を含むことができる。このように各種異なる分類方法を統一して整合することができ、知識処理及び使用した整合創造技術条件とすることができることが本発明の一大特徴である。

本発明では、高い融通性とインテリジェントをもつインデックスの仕組みを構成するために、自己包括、自己構成の３要素関係モデルを構築した。一般的な各種言語には主要な文法構造があり（主語、述語、目的語）、本発明はこのような３要素関係情報を対比し、３要素関係モデルに基づくデータの表現、記憶及び検索を実現する。

図１に示すように、本発明の３要素関係モデルは３要素グループKa、Kr、Kb形式を採用している。ここで、Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係を表している。システムは第１のステップで、ソースファイル情報に入力されるキーワードを使用してキーワードが前記ファイル中の所定位置に出現するように構成された辞書を作製する。前記３要素グループの形式は、キーワード間の構成要素の主従関係、等価別名関係及び背景参考関係を含むので、システムは３種類のタイプの関連関係を表示並びに対応付けを行う第２のステップを実行する。システムは第３のステップで、応付けた入力に対し、Ｋｒ、Ｋｒ_ｒ、Ｋｒ’を対応付けた情報を検索データベースに登録する。第１のステップ中のキーワードと第３のステップにより設定された関係に基づいて、キーワード間の新たな関係、即ち、Ｋａ’のキーワードとＫｂ’のキーワードの新たな関係Ｋｒ’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。

係る３要素関係モデルに基づくデータの表現、記憶及び検索を実現するシステムにより、どのタイプもより細かに分類することができ、また各種の関係の間でも３種類のタイプの関連を実現することができる。このような３要素関係モデルを基礎として演算を行うことで、単純な個々のキーワードの組合せの検索方法とは異なり、論理的な包含内容もカバーする検索を行うことができる。

Kr_ｒは関係キーワード間の関係、例えば逆関係、二段反復、同一主語、対称等を表し、Kr’はKrのKr_ｒを根拠として導き出した関係を表し、これからKa^’キーワードとKb’キーワードは新たな関係Kr’をもつことになる。

図２は人物インデックスキーワード間の関係の一例である。システム中の人物キーワードには以下の３つの３要素グループが含まれる。
（田中祖父、息子、田中父）；（田中父、息子、田中子１）；（田中父、息子、田中子２）、

同時に、図３に示すように、システムには以下の関係キーワードに対する３要素グループも定義されている。
（息子、逆関係、父親）；（息子、二段反復、孫）；（息子、同一主語、兄弟）；（兄弟、対称、兄弟）。

このように設定すると、システムはその他の情報を追加しなくとも以下の結論を自動的に導き出すことができる。図４に示すように、“逆関係”を根拠として（田中父、父親、田中祖父）；（田中子１、父親、田中父）；（田中子２、父親、田中父）を推論する。

図５に示すように、“二段反復”関係を根拠として（田中祖父、孫、田中子１）；（田中祖父、孫、田中子２）を推論する。図６、図７に示すように、“同一主語”関係を根拠として（田中子１、兄弟、田中子２）を推論するとともに、これを基礎とし“対称”関係を根拠として（田中子２、兄弟、田中子１）を推論する。
注意：推論する順序の前後は実際の情況に応じて異なることもある。以上の結果は、関係キーワード３要素グループを一度だけ応用した場合の結論であり、複数回応用、組合せて応用した場合にはより多くの論理的結果が得られる。

既存の検索システムと比較して、上記推論には次のような特徴がある。
１．基礎データ量を大幅に削減する：上記の例の中で、基礎データは僅かに３人の人物３要素グループと４つの関係３要素グループを有するのみであり、現在存在する検索システムは、様々な検索要求を満足するために基礎データを完備しなければならず、上記の例の中で推論される全ての結論を基礎データとしてシステムに加える必要がある。
２．検索可能なデータを大幅に増加できる：上記の例から推計して分かるように、ユーザが検索できるデータは、基礎データ量だけに依存するわけではなく、関係３要素グループの数に関係する。関係３要素グループは高い汎用性をもつため、関係３要素グループが一つ増えると、それに伴う検索可能データは、倍、または幾何級数的に倍増する。
３．データの関係一致性がより強まる：大量の結論はシステムが論理的推論を行って得られるものであるため、厳密な論理性を有している。現在存在する検索システムでは、基礎データは独立してデータベースに加わるため、（田中祖父、息子、田中父）（田中父、兄弟、田中祖父）が同時に現れる可能性があり、データの一致性を保障できない。
４．関係の拡張性：上記の例から推計して分かるように、論理的な関係３要素グループに適合さえすればシステム中で定義することができ、その意義としては、このシステムによって、生活経験及び現有のテクノロジーの発展情況に基づいて総括された関係を実現することができ、また、社会、テクノロジーのとどまることのない進歩にともなって新たな関係も次々に生まれるが、このような新たな関係も同様にシステムにおいて実現可能であることであり、さらに、新たに定義された関連３要素グループに対しても、以前の全てのデータは対応するグループを即時に得て検索に用いることができる。

本発明は、キーワードの３要素モデルに類似する知識ユニットインデックス方法を採用しシステム構成した。知識ユニットインデックスは（C、R、K）グループと(Ca、R、Cb)３要素グループを採り入れて表示並びに実現されており、それにおけるCは知識ユニットの内容を表し、Kはキーワードを表し、Rは知識ユニットとキーワードとの関係を表している。Caは知識ユニットaの内容を表し、Cbは知識ユニットbの内容を表し、Rは知識ユニットaと知識ユニットbとの関係を表している。この手法では、知識ユニット中のキーワードの位置、長さ、関係の程度等および知識ユニット間の相互引用等の関連知識を記録する。このようなインデックスのシステムによって、知識ユニットを構造的に示してユーザの関連情報への要求を満たすことができるほか、知識のリソースの初期モードに従って示すこともできる。

また、（C、R、K）の３要素グループによるインデックス手法は、知識ユニット中の“代替・指示”関係を有効に解決することができ、例えば一つの知識ユニットに存在する代名詞“彼”に対して、３要素グループ中で実際の代替・指示の対象を確定することにより、システムは、文字の相同や類似だけでなく、代替・指示の対象に対する検索をユーザに提供することができる。

図８は本発明中の情報インテリジェント検索加工システムの全体構造である。本システムは、データインテリジェント加工システム1、加工用データベース2、報知管理モジュール3、検索用データベース6、インテリジェント検索サービスシステム7を具備し、上記報知管理モジュール3はデータ報知シンクロナイズモジュール4、データ開放管理モジュール5を具備している。

データ加工はデータインテリジェント加工システム1で完成する。データはここでは異なる媒体の各種出所から処理を経た後に深く解析及びインデックスした文書又はその他の形式を有する媒体内容及び融通性があり正確なインテリジェントインデックス情報である。この段階で主に加工用データベース2について操作を進め、最終的に検索に用いた各項情報以外に、加工用データベース2中には、まだ大量に表示した情報及び、加工を速めるために生成した中間結果が保存されている。

データ加工ステップにおいて、全体の処理過程は３つの手順に分けられる。
（１）先ず、基礎データ加工工程である。これは文書内容に対して正確に加工する手順である。この手順の中でシステムはデータベースに入力したデータを校正し、校正する内容は文字、目録及び段落の次層、注釈の引用等を含む。本発明はまた標準ユニコード文字データベース内に含まれる又は含まれない大量の希少文字をサポートする。即ち所謂異体字又は画像字を照会及び顕示し、これは異体字又は画像字の番号編成を通じて実現する。
（２）次に、基礎データの正確さは保証が得られると言う前提の下で、知識ユニットのインテリジェント加工を進める。この手順の中で、システムは元の自然段階を基礎ユニットのデータとして解析を進め、独立完備した意味の“知識ユニット”を形成する。同時にこの手順中において、システムはまた“知識ユニット”及びキーワード間の関連関係を確立する。
（３）データ加工の第3の手順はインテリジェントインデックス加工であり、１つ前の手順である知識ユニットインテリジェント加工と実際操作は平行に進められ、インテリジェントインデックス加工は知識ユニットインテリジェント加工中から取出したキーワードに対しインデックス化処理を行う必要があり、更にインデックス化処理した後の結果を二次加工し、高い融通性、正確さ、多くの指向性を有する、互いに交差するインテリジェント化インデックスを編成する。
（４）インテリジェント化インデックスは知識ユニット過程に反作用し、ユーザの必要に応じて随時、新しい分類、配列順序と類別を形成し、二次、三次又は多次の文献、表、画像、音声、映像を生成する。

データインテリジェント加工システム1はまた工程管理及びモジュール制御を含み、これらの手順内の中間結果に対して、データ状態の管理を行う。このモジュール自身はデータに直接影響を生じず、データの流れ方向に対して監視制御及び管理を行う。

報知管理モジュール3は報知管理の任務を受け持っている。該モジュールは主にバックの指示を与えた内容をインデックス情報及びフロントのデータとシンクロさせる。過程の実現は両方向であり、主にデータの流れは加工用データベース2から検索用データベース6に向いているが、しかし、これと同時に、幾らかの検索過程中のフィードバック情報も検索用データベース6から加工用データベース６中にシンクロし、これらデータのシンクロの過程はデータ報知シンクロナイズモジュール4により執行される。報知管理モジュール3のもう１つの重要な役割は、データのアクセスコールに対し権限設置を行い、データ開放管理モジュール5によって機能を受け持つことである。

インターネットユーザによる検索操作は、インテリジェント検索サービスシステム7により完成する。ユーザによる検索要求は横向きの汎用検索及び縦向きの専用検索（汎用検索要求とは常用のキーワードまたはキーワードの組合せを使用した検索要求を指し、専用検索要求とは本システムが提供する分類法による検索要求を指す）を含み、転換された相応の内部検索要求は、内容とインデックス情報に対してインテリジェント検索を行う。また、この段階で、システムはまた幾つかの専業検索要求サービス等、公共のアクセスコールのインタフェースを提供し、例えば、その他のウェブサイトが本システムに接続して専業検索サービスを提供することができる。

本システムは１つの公共のインテリジェント検索ステージ（インテリジェント検索サービスステージ）を提供し、異なるユーザから到来する各種検索要求を統一処理する。この基礎の上において、システム自身は豊富な関連内容を獲得することを目的とする横向きのウェブサイト汎用検索サービス8の機能及び深い次層の知識を獲得することを目的とする縦向きのウェブサイト専用検索サービス9を提供する。また、前面で提示した公共のアクセスコールのインタフェースは、専業検索サービス10の形式で提供するものである。

図９は本発明の情報インテリジェント検索加工方法の使用説明図であり、ユーザ11の検索要求に対して、本発明は如何にして処理するかを説明している。図中のブロックは各種の処理操作を表し、円柱はインデックスデータ61及び内容データ62を含む検索用データベース6を示している。図中の実線矢印は操作のフローを表し、且つ点線矢印は主にデータの流れ方向を示している。

実際の操作中において、ユーザ11は主にシステムが提供するウェブサイトを通じて又は開放のインタフェースを通じて本システムのその他のシステムの入力検索条件ユーザインタフェース12に接続している。提供したキーワード入力及びインデックス閲覧する２種の入力方式以外に、本システムではピンイン又は筆順の入力方式でユニコード文字データベース中に含まれる又は含まれない大量の希少文字入力することを提供する。

システムがユーザの検索要求を獲得した後、本システムは検索条件に対して予め処理部13による処理を行う。その中で既に常用の代理番号転換部14の技術が含まれ、同時にインデックス複雑度評価部15の技術が含まれている。予め処理部13による処理を実行した後、検索要求は細分化されて常軌の簡易直接検索部16、高度組合せ検索部17、分類閲覧検索部18、全文検索部19及びインテリジェント論理検索部20による処理がなされ、前３種の常軌検索方式は直接に関係検索エンジン22を通じて検索を行い、全文検索部19は全文検索エンジン23を通じて直接に検索を行い、且つインテリジェント論理検索部20は論理関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジン22で再び検索を行い、該論理関係の演算は前記の３要素関係モデル、分類インデックスバンク及び知識ユニットインデックス方法に基づいている。最終的に関連検索エンジン22及び全文検索エンジン23を通じては検索結果を獲得した後、システムは検索条件及び検索結果を充分に体現できる内在論理連携の検索結果返送インタフェース24を使用することができる。

本発明に関わるシステム及び方法は、コンピュータの単体、局域のインターネット、企業内部のイントラネット(Intranet)、インターネット(Internet)等多くの環境の下に応用することができ、システムユーザは情報内容検索を求める任意の人達に広く発展できる。

本発明は情報内容のインテリジェント化検索及び加工の実現ができ、検索の意向に正しく合致し、検索結果の余剰を最大限に減少し、任意知識源間の知識ベースのステージに基づく全く新しい情報内容及び知識のインテリジェント化に係る組合せを実現でき、人、事、時、地、物等人類の基本的な生産、生活、活動の通用属性間のインテリジェント化の分類、順序配列、類集め過程に基づいて任意情報内容を実現する。

本発明の特定実施例によって発明内容をすでに詳細に説明した。この分野の技術者が本発明の原理を逸脱しない前提で行う容易想到な全ての変更は、全て本発明の範囲であり、相応の法律責任を持つことになる。

本発明の実施例におけるインデックスした３要素関係モデルの一例を示す図。本発明の実施例中の人物インデックスキーワード間の関係を示す図。本発明の実施例における関係キーワード間の関係を示す図。本発明の実施例における“逆関係”の推論ルートを示す図。本発明の実施例における“二段反復” の推測手段を示す図。本発明の実施例における“同一主語”の推論ルートを示す図。本発明の実施例における“対称” の推論ルートを示す図。本発明実施例のシステムブロック図。本発明の実施例による処理のフローチャート。

符号の説明

1 データインテリジェント加工システム
2 加工用データベース
3 報知管理モジュール
4 データ報知シンクロナイズモジュール
5 データ開放管理モジュール
6 検索用データベース
7 インテリジェント検索サービスシステム
8 ウェブサイト汎用検索サービス
9 ウェブサイト専用検索サービス
10 専業検索サービス
11 ユーザ
12 入力検索条件ユーザインタフェース
13 処理部
14 代理番号転換部
15 インデックス複雑度評価部
16 簡易直接検索部
17 検索部
18 分類閲覧検索部
19 全文検索部
20 インテリジェント論理検索部
22 関連検索エンジン
23 全文検索エンジン
24 検索結果返送インタフェース
61 インデックスデータ
62 内容データ

Claims

データインテリジェント加工システム、加工用データベース、報知管理モジュール、検索用データベース、インテリジェント検索サービスシステムを含み、前記報知管理モジュールがデータ報知シンクロナイズモジュール、データ公開管理モジュールを有する報インテリジェント検索加工システムにおいて、
前記データインテリジェント加工システムは、文書、画像、音声、映像データに対し加工を加え、データ処理して深く分析して知識ユニットを引き出し、及び融通性を持つ正確なインデックス情報を得て、加工用データベース内に保存し、加工用データベース内に更に識別可能に構成された大量の情報を保存し、更に加工を速めるために、生じた中間結果を保存し、
前記報知管理モジュールは、指示を与えた情報内容及びインデックス情報をインテリジェント検索サービスシステムにおいて表示したデータとシンクロさせ、データシンクロはデータ報知シンクロナイズモジュールの執行によって、加工用データベースの内容を検索用データベースにシンクロさせ、検索過程中のフィードバック情報を検索用データベースから加工用データベース内にシンクロさせるものであり、データ公開管理モジュールはデータのアクセスコールについて権限設置する責務を負うものであり、
前記インテリジェント検索サービスシステムはインテリジェント検索サービス作業ステージを提供し、顧客から到来する検索要求に対して統一処理を行い、検索用データベースを調べて、関連内容を情報検索することを特徴とする情報インテリジェント検索加工システム。
前記データインテリジェント加工システムはデータの加工を行い、データを12の大分類、即ち、人物、事件、時間、地点、物品、生物、衣類、食物、住居、活動器材、教育器材、娯楽器材に分けることを特徴とする請求項１に記載の情報インテリジェント検索加工システム。
各大分類を更に細分化していくつかの中分類とし、各中分類はまたいくつかの小分類として、ツリー状的な複数類の構造を形成してインデックス構造とし、ツリー状構造内の知識項目節点は複数の交差主従関係があり、各大分類及び主従の中小分類のインデックスは全て代理番号を用いることを特徴とする請求項２に記載の情報インテリジェント検索加工システム。
前記中小分類は30項目以下であることを特徴とする請求項３に記載の情報インテリジェント検索加工システム。
前記データインテリジェント加工システムは、データを加工して、情報データを、その内容の長さ又は容量によって所定個数の知識ユニットに区分することを特徴とする請求項１に記載の情報インテリジェント検索加工システム。
１個の文書知識ユニットの容量は600字符号以内であることを特徴とする請求項５に記載の情報インテリジェント検索加工システム。
前記データインテリジェント加工システムは、３要素関係モデルを採用し、３要素グループKa、Kr、Kb形式で、その中のKaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係を表し、該３要素グループの形式はキーワード間の主従関係、等価別名関係及び背景参考関係を含む３種類のタイプの関連関係を表示並びに実現することを特徴とする請求項１に記載の情報インテリジェント検索加工システム。
（１）検索条件の入力ステップと、
（２）代理番号の変換とインデックスの複雑度の評価を含み、検索条件を予め処理するステップと、
（３）検索要求は通常の簡易直接検索、高度組合せ検索、分類閲覧検索、全文検索及びインテリジェント論理的検索に細分化し、前３種の検索方法は関係検索エンジンを通じて直接検索を行い、全文検索は全文検索エンジンを通じて検索を行い、且つインテリジェント論理的検索は論理的関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジンで再び検索を行うステップと、
（４）関係検索エンジン又は全文検索エンジンを通じて検索結果を得た元の検索結果に戻るステップと、
を有することを特徴とする情報インテリジェント検索加工方法。
（１）システムがデータベースに入力したデータに対しインテリジェント的な校正を行い、この校正の内容には文字、目録と段落数、注釈の引用が含まれており、基礎データインテリジェント加工を行うステップと、
（２）知識ユニットインテリジェント加工を行い、システムは元の自然段階を基礎ユニットのデータとしてインテリジェント分析を進め、独立完備した意味の知識ユニットを形成すると共に、この手順内に置いて、システムはまた知識ユニットとインデックスキーワード間の関連関係を確立するステップと、
（３）インデックスインテリジェント加工の処理であって、１つ前の手順である知識ユニットインテリジェント加工と実際操作は平行して行われており、インデックスインテリジェント加工は知識ユニットインテリジェント加工結果から取出したキーワードに対しインデックス化処理を行い、更にインデックス化処理した後の結果を二次加工し、インデックス構造の背景情報を引き出し、新たに順序と類別を配列し、高い融通性、正確さ、多くの指向性を有すると共に、相互に交差するインテリジェント化インデックスを形成するステップと、
（４）インテリジェント化インデックスは知識ユニット過程に反作用し、利用者の必要に応じて随時、新しい分類、配列順序と類別を形成し、二次、三次又は多次の文献、表、画像、音声、映像を生成するステップと、
を有することを特徴とするデータインテリジェント加工処理方法。
異体字又は画像字に対し分析、配列編成、番号編成を行い、標準ユニコード文字データベース内に含まれ又は含まれない大量の希少漢字をサポートし、異体字又は画像字の筆順、字根の調整、検査と顕示を実現することを特徴とする請求項８に記載の情報インテリジェント検索加工方法。
異体字又は画像に対し分析、配列編成、番号編成を行い、標準ユニコード文字データベース内に含まれ又は含まれない大量の希少漢字をサポートし、異体字又は画像字の筆順、字根の調整、検査と顕示を実現することを特徴とする請求項９に記載のデータインテリジェント加工処理方法。