JP2007317188A - データインテリジェント加工システム及びその方法 - Google Patents

データインテリジェント加工システム及びその方法 Download PDF

Info

Publication number
JP2007317188A
JP2007317188A JP2007132174A JP2007132174A JP2007317188A JP 2007317188 A JP2007317188 A JP 2007317188A JP 2007132174 A JP2007132174 A JP 2007132174A JP 2007132174 A JP2007132174 A JP 2007132174A JP 2007317188 A JP2007317188 A JP 2007317188A
Authority
JP
Japan
Prior art keywords
search
intelligent
data
information
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007132174A
Other languages
English (en)
Inventor
Kaihao Zhao
趙開▲コウ▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JP2007317188A publication Critical patent/JP2007317188A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution

Abstract

【課題】一種の新型の情報インテリジェント検索加工システム及びその方法を提供する。
【解決手段】システムがユーザの検索要求を獲得した後、本システムは検索条件に対して予め処理部13による処理を行う。予め処理部13による処理を実行した後、検索要求は細分化されて常軌の簡易直接検索部16、高度組合せ検索部17、分類閲覧検索部18、全文検索部19及びインテリジェント論理検索部20による処理がなされ、且つインテリジェント論理検索部20は論理関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジン22で再び検索を行い、該論理関係の演算は前記の3要素関係モデル、分類インデックスバンク及び知識ユニットインデックス方法に基づいている。最終的に関連検索エンジン22及び全文検索エンジン23を通じては検索結果を獲得した後、システムは検索条件及び検索結果を充分に体現できる内在論理連携の検索結果返送インタフェース24を使用することができる。
【選択図】図9

Description

本発明は、一種の情報インテリジェント検索加工システム及び方法に関わるものであり、特に一種の文書、画像、音声、映像に対するインテリジェント検索加工システム及びその方法に関するものである。
従来、データ情報とテキストファイルの効果的な検索及び加工は、データベースの応用分野において中心及び重要事項であり、各種電子データ、文献、商業用データベースソースとインターネットにおける情報検索に広汎に応用されている。
現在、この分野におけるデータ情報検索技術は、キーワードによる統計方法が一般的であり、キーワードのブーリアン演算式を用いて語句検索を行っている。ファイルデータベースについては、キーワードを使用してキーワードがファイル中の所定位置に出現するように構成された辞書であり、検索語句のキーワードとファイルデータベース中のキーワードとを比較する辞書を用いて、対応するファイルを探し出すようになされている。また他のものは、ファジィ論理モデル、ベクトル空間モデル及び確率検索モデル等を採用するように改良したものも知られている。
しかしながら、これらの方法は単にテキストファイル単位で検索可能に編集が行われているのみで、且つ検索キーワードと編集されたテキストファイル間の類似関連の度合に関しては、現在において暫時努力して改善高精度化を図っている過程であり、未だに満足できる解決方策は無く、情報検索結果の正確さが実現できない現状にある。例えば、同意義語で異なる形のキーワードを探し出すことはできず、または検索可能なものとしては同じ形で異なる意義のキーワード等であった。編集されたテキストファイル内部に含まれている各種データ及び情報に対して、これらの方法では単独識別、区分、並びに属性関係に基づいてインテリジェント加工及び利用を行うことができず、更に異なるテキストファイル間において交差した分析と比較などが行えず、また異なるテキストファイル間において情報内容を多元的角度から加工利用することは実現できていない。
現在、各種データベース内のインテリジェント処理及び検索結果はいずれも編集されたテキストファイルが最小単位を成し、編集されたテキストファイル内に含まれる属性情報はかなり豊富であることから、この方法でインテリジェント処理及び検索され提供される一連の結果は、いずれも不十分であるという問題が存在する。
インテリジェント処理においては、現在、操作はすべてテーマインデックス、個別のキーワード注釈、テキストファイルのアブストラクト方式によって、テキストファイル全体に対し属性表示を行って検索過程の検索キーワードとしており、このような方式ではテキストファイル全体の情報内容を完全に反映させることはできず、最終的な検索結果中に該当するテキストファイルが欠落する虞れがある。
検索結果の提供においては、編集されたテキストファイルが保有する大量の非相関情報は余分な情報やノイズとなるケースが多く、検索結果の精度に影響し、最終的に検索結果において膨大なテキストファイルが抽出され、有効性の低下を招く結果となる。
特許文献1には、従来の情報検索システムの問題点を解決した多次元階層化式の情報検索システムとして、検索文字の表現を使用せずにイメージや実際の形状をグラフィカルに表現しかつ検索文字の入力を使用せずにマウス若しくはタッチパネル等のインタフェースを使用し、前記情報検索を簡単容易に引き出しかつ該情報をピンポイントでターゲットして検索情報を見易くする情報検索システムであり、ドメインの分類、情報発信場所の地域分類、技術・政治・個人等の検索情報の分類等の検索データを多次元の階層化構造で構成しかつインデックスを多重化させてRDBを構築することにより、どの部分からのアクセスにも柔軟に対応できるシステムが開示されている。
特開2003-76708号公報
上記の問題を解決するため、本発明は一種の新型の情報インテリジェント検索加工システム及びその方法を提供するものである。データ情報及びテキストファイル検索における各種の問題を解決することができ、更にテキストファイル中の異なるキーワード間において、或いは異なるテキストファイル間のキーワードについて満足する検索を行うことができ、情報、内容の比較、分析、新たな関係等のデータ情報に関するインテリジェント加工要求に応えることができ、“隠れた代替・指示”等のような複雑な検索要求をサポートすることができる情報インテリジェント検索加工システム及びその方法を提供する。これと共にシステムにサポートされた多角的な位置表示技術を通じて、文書、画像、音声、映像等のような多種の媒体においても、全ての情報内容を検索及び加工することのできる情報インテリジェント検索加工システム及びその方法を提供する。
本発明は下記の手段により実現される。一種の情報インテリジェント検索加工システムであり、データインテリジェント加工システム、加工用データベース、報知管理モジュール、検索用データベース、インテリジェント検索サービスシステムが含まれており、その中の報知管理モジュールにはデータ報知及びシンクロナイズモジュール、データ公開管理モジュールが含まれている。
上記において、上記データインテリジェント加工システムはデータに対してインテリジェント加工を行い、データ処理して深く分析して知識ユニットを引き出し、及び融通性を持つ正確なインデックス情報を得て、加工用データベース内に保存し、加工用データベース内に更に識別可能に構成された大量の情報を保存し、更に加工を速めるために、生じた中間結果を保存する。
前記報知管理モジュールは、指示を与えた情報内容及びインデックス情報をインテリジェント検索サービスシステムにおいて表示したデータとシンクロさせ、 データシンクロはデータ報知及びシンクロナイズモジュールによる処理によって、加工用データベースの情報を検索用データベースにシンクロさせ、検索過程におけるフィードバック情報を検索用データベースから加工用データベース内にシンクロさせる。 データ公開管理モジュールは、データのアクセスコールについて権限設置する責務を負うものである。
前記インテリジェント検索サービスシステムは、インテリジェント検索サービス作業ステージを提供し、顧客から到来する検索要求に対して統一処理を行い、検索用データベースを調べて、関連内容を情報検索することを特徴とする情報インテリジェント検索加工システムである。
本発明は、手順が以下の如きである一種の情報インテリジェント検索加工方法である。
1.検索条件の入力ステップ。 現在大多数の検索サービスシステムが提供するキーワード入力とインデックス閲覧2種の入力方式以外に、本システムでは更に字根、筆順入力法を通じてユニコード文字データベース中に含まれる又は含まれない大量の希少漢字を入力可能である。
2.検索条件を予め処理するステップ。このステップには代理番号の変換とインデックスの複雑度の評価が含まれる。
3.検索要求について、通常の簡易直接検索、高度組合せ検索、分類閲覧検索、全文検索及びインテリジェント論理的検索に細分化し、前3種の検索方法は関係検索エンジンを直接通じて検索を行い、全文検索は全文検索エンジンを通じて検索を行い、且つインテリジェント論理的検索は論理的関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジンで再び検索を行うステップ。
4.関係検索エンジン又は全文検索エンジンを通じて検索して結果を得た後、元の検索結果に戻るステップ。
本発明は深く分析して引き出した文書情報を保持し、及び高い融通性と知識をもつインデックスの仕組みを基礎とした複数の媒体検索方法とインデックスシステムを確立した。設計と3要素モデル及び漢字字句間の関係の多角度描写を通じて、融通性があって効率が高い交差インデックス体系が確立され、並びにこの交差インデックスシステムの基礎の上に、語義分析機能を具備するインテリジェント検索技術を実現する。同時に、情報内容の検索手法の規範化を通じて、字句と情報内容の関連がより以上にインテリジェント化され、例えば“隠れた代替・指示”等の比較的複雑な検索要求をサポートすることができる。同時にインテリジェントシステムを通じて多角的位置表示技術をサポートし、文字及び画像、表、音声、映像等が多種の形式による媒体に入っていても全て検索することができる。
本発明は下記の顕著な優れた点を持っている。
1.情報内容検索の正確化を実現でき、検索の要求に正確に合致し、無用な検索結果を最大限に減少する。
2.検索過程中の使用者の任意の要求を満足できる。
3.システムの豊富な知識を背景として有し、正確な知識発散手段を通じて、知識に基づく従来実現されていない情報の検索結果を提供することができる。
4.任意知識源間の知識ベースステージに基づく全く新しい情報内容の組合せ及び知識の組合せを実現でき、人、事、時、地、物等の人類の基本的な生産、生活、活動の通用属性間の交差対比に基づいて任意情報内容の検索を実現し、文書、画像、音声、映像等が多種の形式による媒体に入る場合にも内容を2次加工して、自動的に2次、3次又は多次加工された文献を生成することができる。
5.大量の知識に対する活性化及び2次加工が実現でき、情報の知識への速くて秩序ある転化を実現する。
6.人類の生産、生活、活動中の各方面及び異なる知識点を内包し、大量の情報検索中における知識手段問題を最良に解決し、より良い完備性を体現する。
7.人類の知識に対する主観要求に完全に対応し、高い汎用性及び適用性を備え、正、逆の方向で検索を行うことができ、調査と記憶の便宜を図り、操作が簡便で、訓練を必要としない。
以下、図面と具体的な実施例を組合せて本発明を更に詳細に説明する。
本発明の出発点は、検索または処理された情報内容の内在する意味及び構造を分析し、この基礎の上に検索及び加工体系を構築することである。よって、本発明は完全に文書対比の制限を受けず、意味の正確さを完成し、即ち関係の無い又は単に字面が同じであるだけの情報を含まない。 一方、情報の完全を期し、即ち字面は異なるが意味が同じ又はユーザ指定の関連特徴の情報を含むことができる。
別の面で、本発明は高い融通性と知能をもつインデックスの仕組みを確立し、並びにこの基礎の上に一方では各種分類情報の科学性を充分に保証し、別の一方では人々の各種習慣及び約定に合致する容易性を備えている。
本発明は現有の検索エンジン及び検索サービスシステムを排斥せず、逆に、本発明は現有の検索エンジン及び検索サービスシステムをとても良く集成し、異なる検索要求の下で相応の機能を発揮し、並びに更に強力な検索サービス能力を生み出すものである。
本発明において、正確な内容検索の実現は、“知識”形式で示された検索結果に対し分析を行うことである。この分析は2つの段階が含まれ、1つは検索結果自身に対する分析を行い、完成、独立した意味を特徴とする“知識ユニット”又は“知識片”を形成する。 2つ目は内容中に含まれているキーワードを取出し、キーワードの意味相関度情報を増加させ、及び“隠れた代替・指示”等の関係を備えた有効キーワードを強化し、主要情報の知識属性を豊かにする。相関度が高くない無効キーワードを除き、以って全てのデータ源中の相対検索から言えば、主要な情報に対する副次的な情報の干渉を減少させる。
本発明のインテリジェント検索方式は、インデックス分類閲覧及び文書キーワードに従がって2種の常用の検索方式を組み合わせる。常用の検索エンジンと異なるのは、本発明中ではインデックス分類閲覧に従い、よく見かける学科、習慣など分類方法によって構成要素の主従関係毎に細分化できる以外に、等価別名関係及び背景参考関係の2種に基づく横向きに広く展開した検索手段を提供するものである。よく見られるシステム中の相関連結によるジャンプとは異なり、上記の横向き検索手段が元通りのインデックス分類によって進められており、明確な指向性を備えている。常用の検索エンジンと異なる別の一面は、本発明中の文書キーワードによって同名で異なる意味のキーワードが検索可能で適合して進められ、これは検索ユーザがシステム提示を通じることができ、明確に同名で異なる意味のキーワードの相関情報を理解し、直接素早い2次検索が進められ、自身が必要とする結果集の位置決めをする。
本発明は自然意味によって提起し、完成した自然意味の最小ユニットを知識ユニットの区分標準として記述し、これは概して知識処理したとき、各個知識ユニットの属性を出し切ることができ、又検索結果が現れたときにおいて正確に反応し、情報に対するノイズを減少する。
本発明の情報インテリジェント検索加工システムは完全に人的自然要求本能の思考論理でシステムの分類を進める。本発明は人類検索及び使用した知識の思考方式に基づいて、情報データを12の大分類、即ち人物、事件、時間、地点、物品、生物、衣類、食物、住居、活動器材、教育器材、娯楽器材(略称人、事、時、地、物、生、衣、食、住、行、育、樂)に分け、各大分類は更に幾つかの中分類、例えば人物の中分類は人の姓名、人の性別、人の本籍等に、 各中分類は幾つかの小分類、例えば人の姓名は又姓趙、姓張、姓李等に細分化される。このようなツリー状的な多段階構造を形成し、インデックス構造30層とし各種細分データを記述できる。各大分類及び中小分類のインデックスは全て相応する代理番号で表示し、この基礎の上でインデックスの2次加工を更に進め、インデックス構造の背景情報を引き出し、新たに順序と類別を配列し、高い融通性、正確さ、多くの指向性を有する、互いに交差するインテリジェント化インデックスを形成する。
各種の文献、電子データが含まれる各情報データをその内容の長さ又は容量によって幾つかの知識ユニットに区分し、文書知識ユニットの容量は600字符号以内であり、該知識ユニットについて番号を編成する。然る後、各個の知識ユニットの内容について分析、解析を進め、各キーワードを上記の分類方法によって、番号を編成した後対応する上記の関係を分類上に定義する。
本発明の分類方法と過去の伝統的専業分類論理には本質的な違いが有り、完全に伝統的な分類概念を打破した。現在その他の各種専業の分類方法は主に専業の構造段階に基づくもので、人の自然な知識要求を満足させることを考慮したものではなく、汎用性の程度は高くない。ユーザの自然知識の要求に基づいた検索要求に対して、実現過程中の転換の複雑性は高く、全く適用していない。
本発明の別の一大特徴はその他の各種専業分類法を含むことができることであり、本発明の分類方法は人類の基本的知識要求に合致させることに着眼することによって、その分類角度の普遍性はその他の各種の専業に基づく分類方法を含むことができる。このように各種異なる分類方法を統一して整合することができ、知識処理及び使用した整合創造技術条件とすることができることが本発明の一大特徴である。
本発明では、高い融通性とインテリジェントをもつインデックスの仕組みを構成するために、自己包括、自己構成の3要素関係モデルを構築した。一般的な各種言語には主要な文法構造があり(主語、述語、目的語)、本発明はこのような3要素関係情報を対比し、3要素関係モデルに基づくデータの表現、記憶及び検索を実現する。
図1に示すように、本発明の3要素関係モデルは3要素グループKa、Kr、Kb形式を採用している。ここで、Kaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係を表している。システムは第1のステップで、ソースファイル情報に入力されるキーワードを使用してキーワードが前記ファイル中の所定位置に出現するように構成された辞書を作製する。前記3要素グループの形式は、キーワード間の構成要素の主従関係、等価別名関係及び背景参考関係を含むので、システムは3種類のタイプの関連関係を表示並びに対応付けを行う第2のステップを実行する。システムは第3のステップで、応付けた入力に対し、Kr、Kr、Kr’を対応付けた情報を検索データベースに登録する。第1のステップ中のキーワードと第3のステップにより設定された関係に基づいて、キーワード間の新たな関係、即ち、Ka’のキーワードとKb’のキーワードの新たな関係Kr’を自動的に導き出すとともに、キーワードと関係を対応付けて辞書に記録する。
係る3要素関係モデルに基づくデータの表現、記憶及び検索を実現するシステムにより、どのタイプもより細かに分類することができ、また各種の関係の間でも3種類のタイプの関連を実現することができる。このような3要素関係モデルを基礎として演算を行うことで、単純な個々のキーワードの組合せの検索方法とは異なり、論理的な包含内容もカバーする検索を行うことができる。
Krは関係キーワード間の関係、例えば逆関係、二段反復、同一主語、対称等を表し、Kr’はKrのKrを根拠として導き出した関係を表し、これからKaキーワードとKb’キーワードは新たな関係Kr’をもつことになる。
図2は人物インデックスキーワード間の関係の一例である。システム中の人物キーワードには以下の3つの3要素グループが含まれる。
(田中祖父、息子、田中父);(田中父、息子、田中子1);(田中父、息子、田中子2)、
同時に、図3に示すように、システムには以下の関係キーワードに対する3要素グループも定義されている。
(息子、逆関係、父親);(息子、二段反復、孫);(息子、同一主語、兄弟);(兄弟、対称、兄弟)。
このように設定すると、システムはその他の情報を追加しなくとも以下の結論を自動的に導き出すことができる。図4に示すように、“逆関係”を根拠として(田中父、父親、田中祖父);(田中子1、父親、田中父);(田中子2、父親、田中父)を推論する。
図5に示すように、“二段反復”関係を根拠として(田中祖父、孫、田中子1);(田中祖父、孫、田中子2)を推論する。図6、図7に示すように、“同一主語”関係を根拠として(田中子1、兄弟、田中子2)を推論するとともに、これを基礎とし“対称”関係を根拠として(田中子2、兄弟、田中子1)を推論する。
注意:推論する順序の前後は実際の情況に応じて異なることもある。以上の結果は、関係キーワード3要素グループを一度だけ応用した場合の結論であり、複数回応用、組合せて応用した場合にはより多くの論理的結果が得られる。
既存の検索システムと比較して、上記推論には次のような特徴がある。
1.基礎データ量を大幅に削減する:上記の例の中で、基礎データは僅かに3人の人物3要素グループと4つの関係3要素グループを有するのみであり、現在存在する検索システムは、様々な検索要求を満足するために基礎データを完備しなければならず、上記の例の中で推論される全ての結論を基礎データとしてシステムに加える必要がある。
2.検索可能なデータを大幅に増加できる:上記の例から推計して分かるように、ユーザが検索できるデータは、基礎データ量だけに依存するわけではなく、関係3要素グループの数に関係する。関係3要素グループは高い汎用性をもつため、関係3要素グループが一つ増えると、それに伴う検索可能データは、倍、または幾何級数的に倍増する。
3.データの関係一致性がより強まる:大量の結論はシステムが論理的推論を行って得られるものであるため、厳密な論理性を有している。現在存在する検索システムでは、基礎データは独立してデータベースに加わるため、(田中祖父、息子、田中父)(田中父、兄弟、田中祖父)が同時に現れる可能性があり、データの一致性を保障できない。
4.関係の拡張性:上記の例から推計して分かるように、論理的な関係3要素グループに適合さえすればシステム中で定義することができ、その意義としては、このシステムによって、生活経験及び現有のテクノロジーの発展情況に基づいて総括された関係を実現することができ、また、社会、テクノロジーのとどまることのない進歩にともなって新たな関係も次々に生まれるが、このような新たな関係も同様にシステムにおいて実現可能であることであり、さらに、新たに定義された関連3要素グループに対しても、以前の全てのデータは対応するグループを即時に得て検索に用いることができる。
本発明は、キーワードの3要素モデルに類似する知識ユニットインデックス方法を採用しシステム構成した。知識ユニットインデックスは(C、R、K)グループと(Ca、R、Cb)3要素グループを採り入れて表示並びに実現されており、それにおけるCは知識ユニットの内容を表し、Kはキーワードを表し、Rは知識ユニットとキーワードとの関係を表している。Caは知識ユニットaの内容を表し、Cbは知識ユニットbの内容を表し、Rは知識ユニットaと知識ユニットbとの関係を表している。この手法では、知識ユニット中のキーワードの位置、長さ、関係の程度等および知識ユニット間の相互引用等の関連知識を記録する。このようなインデックスのシステムによって、知識ユニットを構造的に示してユーザの関連情報への要求を満たすことができるほか、知識のリソースの初期モードに従って示すこともできる。
また、(C、R、K)の3要素グループによるインデックス手法は、知識ユニット中の“代替・指示”関係を有効に解決することができ、例えば一つの知識ユニットに存在する代名詞“彼”に対して、3要素グループ中で実際の代替・指示の対象を確定することにより、システムは、文字の相同や類似だけでなく、代替・指示の対象に対する検索をユーザに提供することができる。
図8は本発明中の情報インテリジェント検索加工システムの全体構造である。本システムは、データインテリジェント加工システム1、加工用データベース2、報知管理モジュール3、検索用データベース6、インテリジェント検索サービスシステム7を具備し、上記報知管理モジュール3はデータ報知シンクロナイズモジュール4、データ開放管理モジュール5を具備している。
データ加工はデータインテリジェント加工システム1で完成する。データはここでは異なる媒体の各種出所から処理を経た後に深く解析及びインデックスした文書又はその他の形式を有する媒体内容及び融通性があり正確なインテリジェントインデックス情報である。この段階で主に加工用データベース2について操作を進め、最終的に検索に用いた各項情報以外に、加工用データベース2中には、まだ大量に表示した情報及び、加工を速めるために生成した中間結果が保存されている。
データ加工ステップにおいて、全体の処理過程は3つの手順に分けられる。
(1) 先ず、基礎データ加工工程である。これは文書内容に対して正確に加工する手順である。この手順の中でシステムはデータベースに入力したデータを校正し、校正する内容は文字、目録及び段落の次層、注釈の引用等を含む。本発明はまた標準ユニコード文字データベース内に含まれる又は含まれない大量の希少文字をサポートする。即ち所謂異体字又は画像字を照会及び顕示し、これは異体字又は画像字の番号編成を通じて実現する。
(2)次に、基礎データの正確さは保証が得られると言う前提の下で、知識ユニットのインテリジェント加工を進める。この手順の中で、システムは元の自然段階を基礎ユニットのデータとして解析を進め、独立完備した意味の“知識ユニット”を形成する。同時にこの手順中において、システムはまた“知識ユニット”及びキーワード間の関連関係を確立する。
(3)データ加工の第3の手順はインテリジェントインデックス加工であり、1つ前の手順である知識ユニットインテリジェント加工と実際操作は平行に進められ、インテリジェントインデックス加工は知識ユニットインテリジェント加工中から取出したキーワードに対しインデックス化処理を行う必要があり、更にインデックス化処理した後の結果を二次加工し、高い融通性、正確さ、多くの指向性を有する、互いに交差するインテリジェント化インデックスを編成する。
(4) インテリジェント化インデックスは知識ユニット過程に反作用し、ユーザの必要に応じて随時、新しい分類、配列順序と類別を形成し、二次、三次又は多次の文献、表、画像、音声、映像を生成する。
データインテリジェント加工システム1はまた工程管理及びモジュール制御を含み、これらの手順内の中間結果に対して、データ状態の管理を行う。このモジュール自身はデータに直接影響を生じず、データの流れ方向に対して監視制御及び管理を行う。
報知管理モジュール3は報知管理の任務を受け持っている。該モジュールは主にバックの指示を与えた内容をインデックス情報及びフロントのデータとシンクロさせる。過程の実現は両方向であり、主にデータの流れは加工用データベース2から検索用データベース6に向いているが、しかし、これと同時に、幾らかの検索過程中のフィードバック情報も検索用データベース6から加工用データベース6中にシンクロし、これらデータのシンクロの過程はデータ報知シンクロナイズモジュール4により執行される。報知管理モジュール3のもう1つの重要な役割は、データのアクセスコールに対し権限設置を行い、データ開放管理モジュール5によって機能を受け持つことである。
インターネットユーザによる検索操作は、インテリジェント検索サービスシステム7により完成する。ユーザによる検索要求は横向きの汎用検索及び縦向きの専用検索(汎用検索要求とは常用のキーワードまたはキーワードの組合せを使用した検索要求を指し、専用検索要求とは本システムが提供する分類法による検索要求を指す)を含み、転換された相応の内部検索要求は、内容とインデックス情報に対してインテリジェント検索を行う。また、この段階で、システムはまた幾つかの専業検索要求サービス等、公共のアクセスコールのインタフェースを提供し、例えば、その他のウェブサイトが本システムに接続して専業検索サービスを提供することができる。
本システムは1つの公共のインテリジェント検索ステージ(インテリジェント検索サービスステージ)を提供し、異なるユーザから到来する各種検索要求を統一処理する。この基礎の上において、システム自身は豊富な関連内容を獲得することを目的とする横向きのウェブサイト汎用検索サービス8の機能及び深い次層の知識を獲得することを目的とする縦向きのウェブサイト専用検索サービス9を提供する。また、前面で提示した公共のアクセスコールのインタフェースは、専業検索サービス10の形式で提供するものである。
図9は本発明の情報インテリジェント検索加工方法の使用説明図であり、ユーザ11の検索要求に対して、本発明は如何にして処理するかを説明している。図中のブロックは各種の処理操作を表し、円柱はインデックスデータ61及び内容データ62を含む検索用データベース6を示している。図中の実線矢印は操作のフローを表し、且つ点線矢印は主にデータの流れ方向を示している。
実際の操作中において、ユーザ11は主にシステムが提供するウェブサイトを通じて又は開放のインタフェースを通じて本システムのその他のシステムの入力検索条件ユーザインタフェース12に接続している。提供したキーワード入力及びインデックス閲覧する2種の入力方式以外に、本システムではピンイン又は筆順の入力方式でユニコード文字データベース中に含まれる又は含まれない大量の希少文字入力することを提供する。
システムがユーザの検索要求を獲得した後、本システムは検索条件に対して予め処理部13による処理を行う。その中で既に常用の代理番号転換部14の技術が含まれ、同時にインデックス複雑度評価部15の技術が含まれている。予め処理部13による処理を実行した後、検索要求は細分化されて常軌の簡易直接検索部16、高度組合せ検索部17、分類閲覧検索部18、全文検索部19及びインテリジェント論理検索部20による処理がなされ、前3種の常軌検索方式は直接に関係検索エンジン22を通じて検索を行い、全文検索部19は全文検索エンジン23を通じて直接に検索を行い、且つインテリジェント論理検索部20は論理関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジン22で再び検索を行い、該論理関係の演算は前記の3要素関係モデル、分類インデックスバンク及び知識ユニットインデックス方法に基づいている。最終的に関連検索エンジン22及び全文検索エンジン23を通じては検索結果を獲得した後、システムは検索条件及び検索結果を充分に体現できる内在論理連携の検索結果返送インタフェース24を使用することができる。
本発明に関わるシステム及び方法は、コンピュータの単体、局域のインターネット、企業内部のイントラネット(Intranet)、インターネット(Internet)等多くの環境の下に応用することができ、システムユーザは情報内容検索を求める任意の人達に広く発展できる。
本発明は情報内容のインテリジェント化検索及び加工の実現ができ、検索の意向に正しく合致し、検索結果の余剰を最大限に減少し、任意知識源間の知識ベースのステージに基づく全く新しい情報内容及び知識のインテリジェント化に係る組合せを実現でき、人、事、時、地、物等人類の基本的な生産、生活、活動の通用属性間のインテリジェント化の分類、順序配列、類集め過程に基づいて任意情報内容を実現する。
本発明の特定実施例によって発明内容をすでに詳細に説明した。この分野の技術者が本発明の原理を逸脱しない前提で行う容易想到な全ての変更は、全て本発明の範囲であり、相応の法律責任を持つことになる。
本発明の実施例におけるインデックスした3要素関係モデルの一例を示す図。 本発明の実施例中の人物インデックスキーワード間の関係を示す図。 本発明の実施例における関係キーワード間の関係を示す図。 本発明の実施例における“逆関係”の推論ルートを示す図。 本発明の実施例における“二段反復” の推測手段を示す図。 本発明の実施例における“同一主語”の推論ルートを示す図。 本発明の実施例における“対称” の推論ルートを示す図。 本発明実施例のシステムブロック図。 本発明の実施例による処理のフローチャート。
符号の説明
1 データインテリジェント加工システム
2 加工用データベース
3 報知管理モジュール
4 データ報知シンクロナイズモジュール
5 データ開放管理モジュール
6 検索用データベース
7 インテリジェント検索サービスシステム
8 ウェブサイト汎用検索サービス
9 ウェブサイト専用検索サービス
10 専業検索サービス
11 ユーザ
12 入力検索条件ユーザインタフェース
13 処理部
14 代理番号転換部
15 インデックス複雑度評価部
16 簡易直接検索部
17 検索部
18 分類閲覧検索部
19 全文検索部
20 インテリジェント論理検索部
22 関連検索エンジン
23 全文検索エンジン
24 検索結果返送インタフェース
61 インデックスデータ
62 内容データ

Claims (11)

  1. データインテリジェント加工システム、加工用データベース、報知管理モジュール、検索用データベース、インテリジェント検索サービスシステムを含み、前記報知管理モジュールがデータ報知シンクロナイズモジュール、データ公開管理モジュールを有する報インテリジェント検索加工システムにおいて、
    前記データインテリジェント加工システムは、文書、画像、音声、映像データに対し加工を加え、データ処理して深く分析して知識ユニットを引き出し、及び融通性を持つ正確なインデックス情報を得て、加工用データベース内に保存し、加工用データベース内に更に識別可能に構成された大量の情報を保存し、更に加工を速めるために、生じた中間結果を保存し、
    前記報知管理モジュールは、指示を与えた情報内容及びインデックス情報をインテリジェント検索サービスシステムにおいて表示したデータとシンクロさせ、データシンクロはデータ報知シンクロナイズモジュールの執行によって、加工用データベースの内容を検索用データベースにシンクロさせ、検索過程中のフィードバック情報を検索用データベースから加工用データベース内にシンクロさせるものであり、データ公開管理モジュールはデータのアクセスコールについて権限設置する責務を負うものであり、
    前記インテリジェント検索サービスシステムはインテリジェント検索サービス作業ステージを提供し、顧客から到来する検索要求に対して統一処理を行い、検索用データベースを調べて、関連内容を情報検索することを特徴とする情報インテリジェント検索加工システム。
  2. 前記データインテリジェント加工システムはデータの加工を行い、データを12の大分類、即ち、人物、事件、時間、地点、物品、生物、衣類、食物、住居、活動器材、教育器材、娯楽器材に分けることを特徴とする請求項1に記載の情報インテリジェント検索加工システム。
  3. 各大分類を更に細分化していくつかの中分類とし、各中分類はまたいくつかの小分類として、ツリー状的な複数類の構造を形成してインデックス構造とし、ツリー状構造内の知識項目節点は複数の交差主従関係があり、各大分類及び主従の中小分類のインデックスは全て代理番号を用いることを特徴とする請求項2に記載の情報インテリジェント検索加工システム。
  4. 前記中小分類は30項目以下であることを特徴とする請求項3に記載の情報インテリジェント検索加工システム。
  5. 前記データインテリジェント加工システムは、データを加工して、情報データを、その内容の長さ又は容量によって所定個数の知識ユニットに区分することを特徴とする請求項1に記載の情報インテリジェント検索加工システム。
  6. 1個の文書知識ユニットの容量は600字符号以内であることを特徴とする請求項5に記載の情報インテリジェント検索加工システム。
  7. 前記データインテリジェント加工システムは、3要素関係モデルを採用し、3要素グループKa、Kr、Kb形式で、その中のKaはキーワードaを表し、Kbはキーワードbを表し、Krはキーワードaとキーワードbとの関係を表し、該3要素グループの形式はキーワード間の主従関係、等価別名関係及び背景参考関係を含む3種類のタイプの関連関係を表示並びに実現することを特徴とする請求項1に記載の情報インテリジェント検索加工システム。
  8. (1)検索条件の入力ステップと、
    (2)代理番号の変換とインデックスの複雑度の評価を含み、検索条件を予め処理するステップと、
    (3)検索要求は通常の簡易直接検索、高度組合せ検索、分類閲覧検索、全文検索及びインテリジェント論理的検索に細分化し、前3種の検索方法は関係検索エンジンを通じて直接検索を行い、全文検索は全文検索エンジンを通じて検索を行い、且つインテリジェント論理的検索は論理的関係の演算を通じて検索条件を新たに組合せた後、関係検索エンジンで再び検索を行うステップと、
    (4)関係検索エンジン又は全文検索エンジンを通じて検索結果を得た元の検索結果に戻るステップと、
    を有することを特徴とする情報インテリジェント検索加工方法。
  9. (1)システムがデータベースに入力したデータに対しインテリジェント的な校正を行い、この校正の内容には文字、目録と段落数、注釈の引用が含まれており、基礎データインテリジェント加工を行うステップと、
    (2)知識ユニットインテリジェント加工を行い、システムは元の自然段階を基礎ユニットのデータとしてインテリジェント分析を進め、独立完備した意味の知識ユニットを形成すると共に、この手順内に置いて、システムはまた知識ユニットとインデックスキーワード間の関連関係を確立するステップと、
    (3)インデックスインテリジェント加工の処理であって、1つ前の手順である知識ユニットインテリジェント加工と実際操作は平行して行われており、インデックスインテリジェント加工は知識ユニットインテリジェント加工結果から取出したキーワードに対しインデックス化処理を行い、更にインデックス化処理した後の結果を二次加工し、インデックス構造の背景情報を引き出し、新たに順序と類別を配列し、高い融通性、正確さ、多くの指向性を有すると共に、相互に交差するインテリジェント化インデックスを形成するステップと、
    (4)インテリジェント化インデックスは知識ユニット過程に反作用し、利用者の必要に応じて随時、新しい分類、配列順序と類別を形成し、二次、三次又は多次の文献、表、画像、音声、映像を生成するステップと、
    を有することを特徴とするデータインテリジェント加工処理方法。
  10. 異体字又は画像字に対し分析、配列編成、番号編成を行い、標準ユニコード文字データベース内に含まれ又は含まれない大量の希少漢字をサポートし、異体字又は画像字の筆順、字根の調整、検査と顕示を実現することを特徴とする請求項8に記載の情報インテリジェント検索加工方法。
  11. 異体字又は画像に対し分析、配列編成、番号編成を行い、標準ユニコード文字データベース内に含まれ又は含まれない大量の希少漢字をサポートし、異体字又は画像字の筆順、字根の調整、検査と顕示を実現することを特徴とする請求項9に記載のデータインテリジェント加工処理方法。
JP2007132174A 2006-05-22 2007-05-17 データインテリジェント加工システム及びその方法 Withdrawn JP2007317188A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100813676A CN1845104B (zh) 2006-05-22 2006-05-22 信息智能检索加工的系统和方法

Publications (1)

Publication Number Publication Date
JP2007317188A true JP2007317188A (ja) 2007-12-06

Family

ID=37064032

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007132174A Withdrawn JP2007317188A (ja) 2006-05-22 2007-05-17 データインテリジェント加工システム及びその方法

Country Status (7)

Country Link
US (1) US20080235190A1 (ja)
JP (1) JP2007317188A (ja)
KR (1) KR20070112730A (ja)
CN (1) CN1845104B (ja)
DE (1) DE112007000053T5 (ja)
SM (1) SMAP200800032A (ja)
WO (1) WO2007143899A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000627B (zh) * 2007-01-15 2010-05-19 北京搜狗科技发展有限公司 一种相关信息的发布方法和装置
US8572102B2 (en) * 2007-08-31 2013-10-29 Disney Enterprises, Inc. Method and system for making dynamic graphical web content searchable
CN101425061B (zh) * 2007-10-31 2010-12-08 财团法人资讯工业策进会 概念关联网络的数据标签建构方法与系统
CN102043817B (zh) * 2009-10-12 2014-11-12 深圳市世纪光速信息技术有限公司 呈现人物关联词的方法和装置
CN102033910A (zh) * 2010-11-19 2011-04-27 福建富士通信息软件有限公司 一种基于多数据源的企业搜索引擎技术
CN102004775A (zh) * 2010-11-19 2011-04-06 福建富士通信息软件有限公司 一种基于智能搜索的福富企业搜索引擎技术
CN102129539A (zh) * 2011-03-11 2011-07-20 清华大学 基于访问控制列表的数据资源权限管理方法
WO2013000027A1 (en) * 2011-06-30 2013-01-03 Aconex Limited Information management systems and methods
CN102857483B (zh) 2011-06-30 2016-06-29 国际商业机器公司 预取数据的方法、设备和装置
CN103959286B (zh) * 2011-08-26 2019-02-12 谷歌有限责任公司 用于识别媒体项的可用性的系统和方法
CN102521267B (zh) * 2011-11-21 2014-01-22 沈文策 站内信息搜索方法和搜索系统
CN102880625A (zh) * 2012-04-11 2013-01-16 佳都新太科技股份有限公司 一种基于族性检索的通用数据库检索新方法
CN102693320B (zh) * 2012-06-01 2015-03-25 中国科学技术大学 一种搜索方法及装置
CN104169930B (zh) * 2012-07-02 2017-02-22 华为技术有限公司 资源访问方法及装置
DE102013000369A1 (de) 2013-01-11 2014-07-17 Audi Ag Verfahren zum Betreiben eines Infotainmentsystem
CN103077162A (zh) * 2013-01-23 2013-05-01 北京理工大学 Word文档中参考文献编排装置
CN105095319B (zh) * 2014-05-23 2019-04-19 邓寅生 基于时间序列化的文档的标识、关联、搜索及展现的系统
CN105095320B (zh) * 2014-05-23 2019-04-19 邓寅生 基于关系叠加组合的文档的标识、关联、搜索及展现的系统
CN104915449B (zh) * 2015-06-30 2018-11-09 河海大学 一种基于水利对象分类标签的分面检索系统及方法
CN106453449A (zh) 2015-08-06 2017-02-22 泰兴市智瀚科技有限公司 信息即时推送的方法和分布式系统服务器
CN106202019B (zh) * 2016-07-14 2018-12-11 长安大学 一种更改word/wps文档中参考文献上标顺序及编号顺序的方法
CN106844698B (zh) * 2017-01-26 2020-07-10 四川省和信源创劳务有限公司 一种数字云服务平台
CN106844714A (zh) * 2017-02-08 2017-06-13 河海大学常州校区 一种知识库管理系统
CN107122436A (zh) * 2017-04-19 2017-09-01 重庆水利电力职业技术学院 大数据统计分析系统
CN108304531B (zh) * 2018-01-26 2020-11-03 中国信息通信研究院 一种数字对象标识符引用关系的可视化方法及装置
CN108804863A (zh) * 2018-05-04 2018-11-13 深圳晶泰科技有限公司 通用力场数据库及其更新方法和检索方法
CN109726299B (zh) * 2018-12-19 2023-03-17 中国科学院重庆绿色智能技术研究院 一种不完备专利自动标引方法
CN110442670B (zh) * 2019-06-11 2023-05-26 天津交通职业学院 一种基于文本标引的消费者画像生成方法
US11250060B2 (en) * 2020-04-03 2022-02-15 Carlos E. Lopez-Nieto Graphic representation of the composition of a database and selection tool
CN111523019B (zh) * 2020-04-23 2023-05-09 北京百度网讯科技有限公司 用于输出信息的方法、装置、设备以及存储介质
CN112052369A (zh) * 2020-08-27 2020-12-08 安徽聚戎科技信息咨询有限公司 一种大数据智能检索方法
CN112434125A (zh) * 2020-11-30 2021-03-02 中国人寿保险股份有限公司 索引结构、非结构化数据的检索方法、装置和设备
CN112948533A (zh) * 2021-04-13 2021-06-11 天津禄智技术有限公司 一种多次检索和排序的文本检索方法
CN113190692B (zh) * 2021-05-28 2022-06-24 山东顺势教育科技有限公司 一种知识图谱的自适应检索方法、系统及装置
CN114238588B (zh) * 2022-02-24 2022-06-17 江西医之健科技有限公司 数据检索方法、系统、可读存储介质及计算机设备
CN114860778A (zh) * 2022-05-30 2022-08-05 上海博般数据技术有限公司 电网计量数据的检索方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999005614A1 (en) * 1997-07-23 1999-02-04 Datops S.A. Information mining tool
US6243713B1 (en) * 1998-08-24 2001-06-05 Excalibur Technologies Corp. Multimedia document retrieval by application of multimedia queries to a unified index of multimedia data for a plurality of multimedia data types
US7523114B2 (en) * 2000-04-24 2009-04-21 Ebay Inc. Method and system for categorizing items in both actual and virtual categories
US6665661B1 (en) * 2000-09-29 2003-12-16 Battelle Memorial Institute System and method for use in text analysis of documents and records
CN1335574A (zh) * 2001-09-05 2002-02-13 罗笑南 智能语义搜索方法
US20040221236A1 (en) * 2001-09-20 2004-11-04 Choi Kam Chung Happy, interesting, quick learning inputting method of Chinese characters in stroke character pattern codes
GB2382170B (en) * 2001-11-16 2005-04-13 Inventec Corp Method for synchronously updating screen data of database application program at clients over network
CN1432943A (zh) * 2002-01-17 2003-07-30 北京标杆网络技术有限公司 标杆智能搜索引擎系统
CN1152334C (zh) * 2002-11-18 2004-06-02 北京慧讯信息技术有限公司 自主智能异构数据集成系统
JP2004206629A (ja) * 2002-12-26 2004-07-22 Hitachi Ltd 異種データソース統合検索サーバシステム
JP4634736B2 (ja) * 2004-04-22 2011-02-16 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 専門的記述と非専門的記述間の語彙変換方法・プログラム・システム
CN100543729C (zh) * 2004-06-24 2009-09-23 北京数码大方科技有限公司 动态对象存取系统及方法

Also Published As

Publication number Publication date
DE112007000053T5 (de) 2008-08-28
SMP200800032B (it) 2008-05-14
US20080235190A1 (en) 2008-09-25
CN1845104A (zh) 2006-10-11
CN1845104B (zh) 2012-04-25
KR20070112730A (ko) 2007-11-27
SMAP200800032A (it) 2008-05-14
WO2007143899A1 (fr) 2007-12-21

Similar Documents

Publication Publication Date Title
JP2007317188A (ja) データインテリジェント加工システム及びその方法
KR101835345B1 (ko) 지식베이스 기반의 개념그래프 확장 시스템
Marx et al. Towards an open question answering architecture
CN110612522B (zh) 实体模型的建立
JP2007317189A (ja) 3要素モデルに基づく検索情報加工方法
Lin et al. OWL Ontology Extraction from Relational Databases via Database Reverse Engineering.
Mazeika et al. Entity timelines: visual analytics and named entity evolution
Rossetto et al. LifeGraph: a knowledge graph for lifelogs
Vu et al. Graph-based interactive data federation system for heterogeneous data retrieval and analytics
Both et al. A service-oriented search framework for full text, geospatial and semantic search
Drakopoulos et al. Tensor-based document retrieval over Neo4j with an application to PubMed mining
CN116108194A (zh) 基于知识图谱的搜索引擎方法、系统、存储介质和电子设备
Tran et al. Usability of keyword-driven schema-agnostic search: a comparative study of keyword search, faceted search, query completion and result completion
Li et al. An approach for design rationale retrieval using ontology-aided indexing
Sellami et al. Keyword-based faceted search interface for knowledge graph construction and exploration
KR101374195B1 (ko) 학술적 과학 지식 메모리 기반의 심층 지식 제공 방법 및 이에 적합한 장치
Pradhan et al. Ontology based meta knowledge extraction with semantic web tools for ubiquitous computing
Jun et al. Semantics-preserving optimisation of mapping multi-column key constraints for RDB to RDF transformation
Rapti et al. A survey: Mining linked cultural heritage data
Cherichi et al. Upgrading event and pattern detection to big data
Sheela et al. Criminal event detection and classification in web documents using ANN classifier
Meimaris et al. RDF resource search and exploration with LinkZoo
Taveekarn et al. Data++: An automated tool for intelligent data augmentation using wikidata
Kiong et al. Health Ontology Generator: Design And Implementation
Nagarajan et al. Structured and Unstructured Information Extraction Using Text Mining and Natural Language Processing Techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110426

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20110426

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110426