JPH11219363A - データベースの検索支援システム - Google Patents

データベースの検索支援システム

Info

Publication number
JPH11219363A
JPH11219363A JP10019870A JP1987098A JPH11219363A JP H11219363 A JPH11219363 A JP H11219363A JP 10019870 A JP10019870 A JP 10019870A JP 1987098 A JP1987098 A JP 1987098A JP H11219363 A JPH11219363 A JP H11219363A
Authority
JP
Japan
Prior art keywords
list
attribute
information
permission
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10019870A
Other languages
English (en)
Inventor
Kentarou Yokoi
謙太朗 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10019870A priority Critical patent/JPH11219363A/ja
Publication of JPH11219363A publication Critical patent/JPH11219363A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索する対象に対して設定者の微妙な検討の
機会を与え、更に検索ユーザの検索希望の情報に対して
検索すべき情報のリストを追加する機能をもったデータ
ベース検索支援システムを提供することを目的とする。 【解決手段】 複数情報を格納する機能DBと、この複
数情報のそれぞれが与えられた属性に該当するか否かを
判断しこれに関するリストを作成し格納するリスト機能
14,15と、この判断ができない保留情報を表示し設
定オペレータの指示に応じて属性に該当するか否かを判
断しリストに加える機能17とをもつ検索支援システ
ム。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、データベース検
索システムであって、例えば文字画像データやWWWサ
イトの検索システムに関するものである。
【0002】
【従来の技術】近年、コンピュータシステムにて、デー
タベースの管理・運用が盛んになされているが、更にこ
のシステムにてデータベース要素に付与された属性をも
とに、検索を行なうデータベース検索システムが用いら
れている。そしてこれらのデータベース検索システムで
は、例えば文字画像データが管理される。
【0003】又更に、近年のインターネットの飛躍的な
普及に伴い、WWW観覧において、RSACなどの公的
な機関やプロキシサーバの管理者(プロバイダ)が設定
したWWWサイトの有害性を判定した属性のリストに基
づき、あるサイトの情報を観覧しようとする要求を許可
または却下できるインターネットページ情報検索システ
ムが開発され実用化されている。
【0004】しかし、上記したデータベース検索システ
ムにおいては、設定者が設定した属性に応じて文字画像
データが選別されるが、初めに与えられた属性がもつ制
限値の付近の文字画像について微妙な選別を行うことが
できない。つまり文字画像データは、初めに与えられた
属性に応じて自動的に選別されてしまうものであり、設
定者が属性の値の付近の文字画像データとの比較・検討
を行う等の機会が与えられることがないため、微妙な属
性の設定が困難となる。
【0005】更に、上記したデータベース検索システム
では、データベース要素に付与する属性の判断はデータ
ベースサーバ側に任されている。そのため、ユーザが希
望する属性がサーバ側が設定した属性と異なっている場
合は、ユーザは、サーバ側が作成した検索リストを利用
して検索することができない。また、ユーザが独自の基
準で属性付与の判断を行なうのは困難である。
【0006】同様に、上記したインターネットページ情
報検索システムにおいても、有害情報を公開しているW
WWサイトのリスト作成は公的機関、またはプロキシサ
ーバ管理者に任されており、有害情報を判断する基準を
一度設定すると、この基準に応じて一律にページの判断
が行われリストが作成される。このため、この基準に微
妙に抵触する内容のページをプロバイダオペレータが個
々に判断する等の作業が行われることがないため、個々
のページを参照して微妙な判断を行うことは困難であ
る。
【0007】同様に、上記したインターネットページ情
報検索システムにおいても、有害情報を公開しているW
WWサイトのリストの作成は公的機関、またはプロキシ
サーバ管理者に任されており、有害情報を判断する基準
がユーザのそれと異なっている場合は利用することがで
きない。また、ユーザが独自の基準で有害情報の判断を
行なうのは困難である。
【0008】
【発明が解決しようとする課題】従って従来のデータベ
ース検索システムでは、与えられた属性に応じて全ての
文字画像データを一律に処理・判断してリストが作成さ
れるため、オペレータが個々の文字画像データを参照し
て、微妙に属性を修正する等の判断をする機会が与えら
れることがない。このため、属性に応じた微妙な判断
や、与えられた属性を文字画像データに応じ、微妙な調
整を行うことができないという問題がある。
【0009】又、従来のインターネットページ情報検索
システムでは、一度与えられた基準に応じて多くのWW
Wページが一律に処理・判断され、観覧許可・不許可リ
ストが作成されるため、プロバイダオペレータによるペ
ージの子細な検討の機会が与えられることがない。この
ため、プロバイダオペレータにより観覧の基準が実際の
ページの参照を通じて調整されることもなく、基準に基
づく微妙な判断・検討の機会が与えられないため、微妙
なページの判断が行えないという問題がある。
【0010】又更に、プロバイダオペレータの操作によ
り作成されたリストに基づき、一般ユーザがページを検
索するわけであるが、この際、リストに存在しないペー
ジを検索してもリストに基づいて検索が行われるのみで
ありこれ以上検索は行われず、更にこの一般ユーザの検
索不可のページについてリストが作製される機会も与え
られないという問題がある。
【0011】
【課題を解決するための手段】本発明は上記した課題を
解決すべく、検索する対象に対して設定者の微妙な検討
の機会を与え、更に検索ユーザの検索希望の情報に対し
て検索すべき情報のリストを追加する機能をもったデー
タベース検索支援システムを提供することを目的とす
る。
【0012】本発明は、複数文字画像を格納する格納手
段と、前記格納手段に格納された前記複数文字画像が与
えられた属性に該当するか否かに関するリストを作成し
これを格納するリスト手段と、前記属性に該当するか否
かの判断ができない前記複数文字画像の中の保留情報を
表示する表示手段と、前記表示手段に表示される前記保
留情報につき設定オペレータの指示に応じて前記属性に
該当するか否かを判断し前記リスト手段が作成する前記
リストに加える追加手段とを具備することを特徴とする
文字画像検索支援システムである。
【0013】本発明は上記した構造により、与えられた
属性から一律にリストが作成されるわけではなく、判断
が難しい判断基準に近い文字画像は、オペレータの目視
による判断を行った上で、より正確なオペレータの判断
に応じてリストが作成される。これにより従来に比べよ
り確実な判断に基づくリストの作成が可能となる。
【0014】又本発明は、複数文字画像を格納する格納
手段と、前記格納手段に格納された前記複数文字画像が
与えられた第1属性に該当するか否かに関するリストを
作成しこれを格納するリスト手段と、前記第1属性に該
当するか否かの判断ができない前記複数文字画像の中の
保留情報を表示する表示手段と、前記表示手段に表示さ
れる前記保留情報につき設定オペレータの指示に応じて
前記第1属性に該当するか否かを判断し前記リスト手段
が作成する前記リストに加える追加手段と、前記設定オ
ペレータとは異なる検索オペレータの指示による第2属
性を受け、前記リストを参照して前記第2属性に該当す
る前記複数文字画像を検索する検索手段とを具備するこ
とを特徴とする文字画像検索支援システムである。
【0015】これにより本発明は、設定オペレータの詳
細な属性と文字画像との吟味・検討の後に得られたリス
トに基づき、検索オペレータの希望の属性に応じて文字
画像が検索されることとなる。このため、従来に比べよ
り迅速で正確な検索結果を得ることができる。
【0016】又更に本発明は、WWWネットワークにア
クセスしてページ情報を獲得する獲得手段と、前記獲得
手段が獲得した前記ページ情報が与えられた属性に該当
するか否かに関する観覧許可・不許可リストを作成しこ
れを格納するリスト手段と、前記属性に該当するか否か
の判断ができない前記ページ情報の中の保留情報を表示
する表示手段と、前記表示手段に表示される前記保留情
報につきプロバイダオペレータの指示に応じて前記属性
に該当するか否かを判断し前記リスト手段が作成する前
記観覧許可・不許可リストに加える追加手段とを具備す
ることを特徴とするインターネットページ情報検索シス
テムである。
【0017】本発明のインターネットページ情報検索シ
ステムは上記した構造により、従来のように一度与えら
れた基準に応じて一律に複数ページを観覧許可・不許可
リストに振り分けるのではなく、判断が微妙なページに
ついてはプロバイダオペレータに判断の機会を提供する
ことで、より詳細に検討・判断を行うことにより、より
正確なリストの作成を実現するものである。
【0018】又更に本発明は、WWWネットワークにア
クセスしてページを獲得する獲得手段と、前記獲得手段
が獲得した前記ページ情報が与えられた属性に該当する
か否かに関する観覧許可・不許可リストを作成しこれを
格納するリスト手段と、前記属性に該当するか否かの判
断ができない前記複数ページ情報の中の保留情報を表示
する表示手段と、前記表示手段に表示される前記保留情
報につきプロバイダオペレータの指示に応じて前記属性
に該当するか否かを判断し前記観覧許可・不許可リスト
に加える追加手段と、インターネットユーザの指示によ
るアドレス情報を受け、前記リスト手段が作成する前記
観覧許可・不許可リストを参照して前記アドレスに該当
する前記複数ページ情報を検索する検索手段とを具備す
ることを特徴とするインターネットページ情報検索シス
テムである。
【0019】本発明のインターネットページ情報検索シ
ステムは上記した構成により、プロバイダオペレータが
詳細に吟味した観覧許可・不許可リストに基づき、イン
ターネットユーザの希望のページの検索が可能となり、
より正確で迅速な検索処理を実現するものである。
【0020】又更に本発明は、WWWネットワークにア
クセスしてページを獲得する獲得手段と、前記獲得手段
が獲得した前記ページ情報が与えられた属性に該当する
か否かに関する観覧許可・不許可リストを作成しこれを
格納するリスト手段と、前記属性に該当するか否かの判
断ができない前記複数ページ情報の中の保留情報を表示
する表示手段と、前記表示手段に表示される前記保留情
報につきプロバイダオペレータの指示に応じて前記属性
に該当するか否かを判断し前記観覧許可・不許可リスト
に加える追加手段と、インターネットユーザの指示によ
るアドレス情報を受け、前記リスト手段が作成する前記
観覧許可・不許可リストを参照して前記アドレスに該当
する前記複数ページ情報を検索し、更に前記アドレス情
報に該当するページ情報が前記観覧許可・不許可リスト
にない場合に設定待ちページリストとして前記アドレス
情報を格納し、後にこの設定待ちページリストに応じて
再度、観覧許可・不許可リストを作成する検索手段とを
具備することを特徴とするインターネットページ情報検
索システムである。
【0021】本発明は上記した構造により、インターネ
ットオペレータが希望したにもかかわらず、プロバイダ
オペレータがまだ観覧許可・不許可リストを作成してい
ないページについては、このページの情報を格納してお
き、その後にプロバイダオペレータの希望のページにつ
いても属性に基づき判断を行ない観覧許可・不許可リス
トに加える。これにより、従来のようにプロバイダが与
えたリストだけでなく、インターネットユーザの希望に
応じた許可・不許可リストの作成も行われるため、より
完成度の高いインターネットページ情報検索システムが
提供されることとなる。
【0022】
【発明の実施の形態】以下、この発明の実施形態につい
て図面を用いて詳細に説明する。
【0023】以下の説明において、1.認識アルゴリズ
ム開発・検証用データベースでの検索支援システムの実
施形態と、2.データベースとしてWWWを想定し、そ
こでの観覧許可/不許可を指定するインターネットペー
ジ情報検索システムの実施形態とが示される。
【0024】1.認識アルゴリズム開発・検証用データ
ベースでの検索支援システム 以下において、(1)本発明を用いて認識アルゴリズム
開発・検証用データベースでの検索支援システムの処理
概要と、(2)〜(7)これに必要な各処理とインター
フェースの例とが示される。
【0025】(1)処理概要 図1と図2は、ある曖昧な検索特徴(キー)にヒットし
たデータベース要素(ページ)の特徴量をもとに半自動
で検索制御設定を行なう本特許の実施形態の構成図であ
る。図1にデータベース管理者側、図2に検索者側の構
成を示す。
【0026】ここで検索キーとしては、例えば、対象コ
ンテンツが画像であった場合は画像の対象の種別(人、
動物、機械等)、輝度、移動速度、対象の向き等がこれ
に相当する。そして、検索者はこれら検索キーをGUI
的に表現した後述の図10のようなインターフェースを
用いて、例えば輝度、向き、対象種別等の度合いを指定
することでデータベース要素を抽出する。
【0027】図1において、データベース要素自動取得
手段11は、設定待ちデータベース要素リスト12に基
づいてデータベース上からデータベース要素を取得す
る。検索キー一致/不一致判断機構13は、取得したデ
ータベース要素から特徴量を抽出し、あらかじめ設定さ
れた検索キー一致データベース要素特徴量16との類似
度から検索キーに対する一致/不一致を判断する。一致
の場合はそのデータベース要素を対応するキーのキー一
致リスト14に追加し、不一致の場合は、キー不一致リ
スト15に追加する。
【0028】一方データベース要素によっては、検索キ
ーに対する明確な一致/不一致の判断がつけがたい類似
度をとるものがあり、このような判断の難しいデータベ
ース要素に対しては自動設定を行なわず、検索キー一致
/不一致手動設定インターフェース17により設定者の
判断を仰ぐ。設定者がデータベース要素の内容をチェッ
クし、指定キーとの一致/不一致を設定すると、システ
ムはこの判断に従って当該データベース要素を検索キー
一致リスト14または検索キー不一致リスト15に追加
する。この際、設定者はデータベース要素のどの部分の
内容について検索キーに一致したと判断したかを指定す
ることができ、キー一致データベース要素特徴量学習機
構18はその指定部分からキー一致データベース要素特
徴量16を学習する。これによりシステムはより設定者
の基準を反映した特徴量16を持つようになり、より適
切な判断・設定を自動で行なえるようになる。
【0029】次に図2でデータベース要素の検索者側の
処理を説明する。図2において、ユーザから検索要求が
あった場合、キー一致/不一致リスト検索機構29は検
索キー一致リスト24と検索キー不一致リスト25に基
づいて、データベース要素の検索キーに対する一致/不
一致を判断する。もし、検索キー一致リスト24にも検
索キー不一致リスト25にも存在しないデータベース要
素があった場合(未設定の場合)には、検索キー一致/
不一致自動判断機構30が図1と同様の処理によりキー
一致データベース要素特徴量26との類似度から検索キ
ーに対する一致/不一致を判断する。そして、検索キー
について一致と判断された場合はそのデータベース要素
を24に追加し、不一致の場合は検索キー不一致リスト
25に追加する。一致/不一致の判断が難しいデータベ
ース要素の場合は設定待ちデータベース要素リスト優先
度付け処理機構11はそのデータベース要素を設定待ち
データベース要素リスト22に追加する。
【0030】(2)検索キーとの一致/不一致自動判断
機構の処理の例 図3は、図1における検索キーとの一致/不一致自動判
断機構13の処理を示すフローチャートである。検索キ
ーとの一致/不一致自動判断機構13はデータベース要
素を受けとると(S11)、その要素の内容(画像、映
像、音声、文章など)から要素検索キーとの一致/不一
致に有効な特徴量を抽出する(S12)。抽出する特徴
量としては、画像・映像の場合は色合いや画像パターン
の配置、音声の場合は音声認識結果やケプストラム、パ
ワー、文字の場合は単語テンプレートや意味分類、など
を用いる。これらの特徴量から主成分分析などの特徴選
択手法にもとづいて有効な特徴ベクトルを抽出する。こ
の特徴ベクトルをx(i=1〜n)、あらかじめ設定
された検索キーとの一致データベース要素特徴量6の特
徴ベクトルをyi(i=1〜n)とすると、ベクトルx
とyの類似度、つまり当該データベース要素と検索キー
との類似度Simは Sim=1/(1+sqrt(Σ{i}(xi−yi))) …(1) 又は Sim=cosθ=(x,y)/(|x|*|y|) …(2) ただし(x,y)はベクトルxとyの内積 |x|はベクトルxのノルムを表す で計算できる。式(1)はベクトルの距離をもとにした
計算法、式(2)はベクトルの角度をもとにした計算法
である。
【0031】つまりこれらの式により、検索キーと対象
となる例えば文字画像との各属性の類似度のそれぞれが
合計され、一致度Simが求められることとなる(S1
3)。
【0032】このようにして得られた検索キーとの類似
度が、検索キーと一致したと判定するのに十分高い場合
は(S14)、そのデータベース要素を一致データベー
ス要素リスト15に追加し(S17)、逆に類似度が検
索キーと不一致であると判定するのに十分低い場合は
(S15)不一致データベース要素リスト14に追加す
る(S18)。一致/不一致の判断を付け難い中間の類
似度の場合は、手動設定を行なうインターフェース17
により設定者の指示を仰ぐ(S16)。
【0033】図4は、図2におけるデータベース要素検
索希望者側の検索キーとの一致/不一致自動判断機構1
0の処理を示すフローチャート(S19〜S29)であ
る。図3と異なる点は、データベース要素を検索しよう
としている希望者に対して、そのデータベース要素の検
索キーを付与する処理が加わっていることと、その検索
キーの付与において判断し難い中間の類似度の場合には
設定待ちデータベース要素リスト22に追加する処理が
加わっていることであり、基本的には図3と同じ処理を
行なう。
【0034】(3)複数しきい値による一致/不一致の
判断 図5は、(2)における一致/不一致の判断処理におい
て用いる複数しきい値による判断発明を説明した図であ
る。一致/不一致の判断をする際、単一のしきい値で一
致か不一致を二値判断するのではなく、一致しきい値と
不一致しきい値という複数のしきい値により判断する。
【0035】ある検索キーとの類似度が不一致しきい値
よりも低い場合は、十分な確信度をもってその検索キー
とは不一致であると判断できるということで、設定者の
判断を仰ぐことなく自動的に不一致設定を行なう。逆に
類似度が一致しきい値よりも高い場合にも、十分な確信
度をもって検索キーと一致しているデータベース要素で
あると判断できるということで自動的に一致設定を行な
う。一方類似度が一致しきい値と不一致しきい値の中間
の値をとる場合は、確信度が十分でなく一致/不一致を
自動的に判断するのは難しいということで安全のために
自動設定は行なわず、この場合のみ設定者の判断を仰
ぐ。
【0036】図6は、これらの一致しきい値、不一致し
きい値の設定処理を示すフローチャートである。検索キ
ーとの類似度の最小値を0、最大値を1として、まず一
致しきい値ThOKを1、不一致しきい値ThNGを0
(最も安全なしきい値設定)として初期化を行なう(S
31)。あるデータベース要素に対し設定者が検索キー
と一致と判断した場合(S32)、そのデータベース要
素と検索キーとの類似度Simに対し、次式のようにし
きい値を更新する(S33〜S39)。
【0037】 ThOK=ThOK+a1*(Sim−ThOK) ThNG=ThNG+a2*1/(ThNG−Sim) (a1,a2は小さな正の係数) 具体的には、一致しきい値については類似度Simとし
きい値ThOKの差が大きいほど大きく上げ(Simに
近づけ)、不一致しきい値については類似度Simとし
きい値ThNGの差が小さいほど大きく上げる(Sim
から遠ざける)(S34〜S36)。一方設定者が検索
キー不一致とした場合(S33)は、次式のようにな
る。
【0038】 ThOK=ThOK−a1*1/(Sim−ThOK) ThNG=ThNG−a2*(ThNG−Sim) (a1,a2は小さな正の係数) このとき、一致しきい値については類似度Simとしき
い値ThOKの差が小さいほど大きく下げ(Simから
遠ざけ)、不一致しきい値については類似度Simとし
きい値ThNGの差が大きいほど大きく下げる(Sim
に近づける)(S37〜S39)。このようにしきい値
を類似度Simとの差にもとづいて適応的に変化させて
いくことで、最適なしきい値に近付けていく。
【0039】以上のようにして複数のしきい値を用いる
ことにより、一致と判断できる部分と不一致を判断でき
る部分だけでなく判断が難しいグレーゾーンというもの
を設定し、この部分にのみ設定者の判断を仰ぐことで、
自動設定による不適切な設定の回避と設定者の作業部分
の削減を実現することができる。
【0040】(4)検索キー一致データベース要素特徴
量の学習の処理 図7は、検索キーと一致したデータベース要素特徴量の
学習機構全体の処理を示すフローチャートを示した図で
ある。検索キー一致/不一致手動設定インターフェース
7により設定者が検索キーとの一致に関連のある部分を
指定すると(S41)、検索キー一致データベース要素
特徴量学習機構8は指定箇所にもとづいた部分学習
(a)を行なう(S44)。具体的には、指定箇所から
抽出された特徴ベクトルをx(i=1〜n)、あらか
じめ設定された検索キー一致データベース要素特徴量6
の特徴ベクトルをy(i=1〜n)とすると、次式の
ようにyをxに近づけて更新する。
【0041】y=y+a*(x−y) (aは小さな正の係数) このとき、処理の軽減のために通常はこのように現在設
定を行なっているデータベース要素に対してのみの部分
学習を行なう。
【0042】一方、ある一定の周期(完全再学習周期)
ごとに設定済みの全データベース要素に対して完全再学
習(b)を行ない(S42)、より最適に近い検索キー
一致データベース要素特徴量6の学習を行なう(S4
5)。具体的には設定済みのデータベース要素の内容か
ら特徴量を抽出し、これらの特徴量に対しFKL法(参
考文献、若林,鶴岡,木村,三宅“少クラス分類問題に
おける特徴選択に関する考察”,信学論D−11,Vo
l.J80−D−11,No.1,pp73−80,1
997)を適用することで、検索キー一致/不一致の各
クラスを最適に判別する特徴量選択行列を求め、これに
もとづいて検索キー一致データベース要素特徴量6を更
新する。
【0043】さらに、設定者の検索キーの一致/不一致
の基準が経年変化を起こすのを反映するため、ある一定
の周期(経年変化学習周期)ごとに設定済みのデータベ
ース要素の一部(できるだけ設定時期の古いもの)を設
定者に提示し、検索キー一致/不一致手動設定インター
フェース7を通して検索キーに問題のある部分を指定さ
せる(S43)。つまり、指定された箇所に対して部分
学習(a)と同様の処理を行なうことで、経年変化学習
(c)を行なう(S46)。
【0044】(5)設定待ちデータベース要素リストの
優先度制御の例 図8は、優先度付きの設定待ちデータベース要素リスト
の例である。設定待ちデータベース要素リストは、検索
キーの設定を待っているデータベース要素のアドレス
(URL)とその優先度を保持している。優先度は検索
キー希望者からの検索キー希望が多いデータベース要素
ほど高い値をとり、設定者が検索キー設定の処理を行な
う時にこの優先度が高いデータベース要素から処理させ
ることにより、利用者の要求を反映した設定作業を行な
うことができる。例えば、あるユーザから検索キー設定
要求があり、なおかつ(そのデータベース要素に対する
一致/不一致の自動判断が難しいということで)検索キ
ーが保留になった場合、そのデータベース要素の優先度
が上がり、より優先的に設定者の判断を受けることがで
きるようになる。
【0045】(6)検索キーの一致/不一致設定支援イ
ンターフェースの例 図9は、検索キーの一致/不一致の判断を設定者に仰ぐ
場合のインターフェースの例である。システムは、検索
キーの一致/不一致の自動判断が難しいデータベース要
素に対し設定者に検索キーの一致/不一致を設定させる
ためデータベース要素の内容を提示する際、システムが
検索キーに問題がある可能性が高いと判断した部分、つ
まり検索キー一致データベース要素特徴量6との類似度
が高い部分を強調表示する。例えば、一致データベース
要素との類似度の高い文章部分は大きなフォントや点滅
による表示に加え背景に内容分類に応じた色ラベルを付
与するなどして強調表示を行なう(d)。画像に対して
は縁どりを行ない、内容分類に応じた色ラベルを付与す
る(e)。映像に対しては、インデックス表示を行なっ
た上で該当部分のインデックスに色ラベルを付与する
(f)。音声の場合も同様である。このようにして強調
表示を行なうことで、設定者はシステムの判断部分が適
切であるかを容易に検証することができ、また一方で自
分が一致/不一致の判断を下す際に強調部分を判断材料
として利用することができる。さらに設定者は、検索キ
ーに問題があると考える部分を新たに指定することがで
き(g)、これによりシステムは検索キー一致データベ
ース要素特徴量6を学習することができる。
【0046】(7)検索キーとの一致/不一致設定のク
ラス化の例 図10は、各検索キーとの類似度をグラフ化したインタ
ーフェースである。各検索キーとの類似度がつまみとし
て表示され、それぞれの検索キーにおける類似度に応じ
てクラス分けをする際の境界が同じグラフ上に表示され
る。このグラフ上で設定者がクラスを指定することで、
あいまいとされたデータベースの一致/不一致判断を直
観的に行なうことができる。また既に自動設定されてい
るデータベース要素に関しても、設定者が改めて見た時
に間違っていると気づいた時にはつまみを動かして正し
いクラスに訂正する。また、各クラスに属するデータベ
ース要素の特徴量分布の平均をとることで各クラスの代
表特徴ベクトルが算出できる。これにより、あるデータ
ベース要素の特徴ベクトルに対し最も類似度の高い代表
特徴ベクトルをもつクラスをそのデータベース要素の属
するクラスであると判定することができる。この結果、
判定されたクラスから検索キーとの一致/不一致を判断
することもできる。
【0047】一方これらのクラスの持つ特徴量分布に対
してFKL法を適用すると、各クラスの判別に適した
(各クラスの分離度が高い)特徴軸を選択することがで
き、より正確なクラス判別を行なうことができる。また
ここで寄与率の高い特徴軸のみを選択することで、判別
に必要な特徴量の次元を減少させることができる。
【0048】逆に検索者が検索するときのしきいクラス
設定にもこのインターフェースは使われる。ここで、あ
る検索者にとってはその基準では「明るすぎる」と判定
されても、別の検索者にとっては「普通の明るさ」と判
定されたりするなど基準が異なるため、そのクラス分け
を特定の検索者むけに調整できるようにしている。これ
らの分類されたクラスを一つのセルとし、各検索キーご
とに検索したいキーごとに「高」「中」「低」などのク
ラスを設定できる。
【0049】また、二つの検索キーにまたがる条件指定
などをしたい場合のために図10のグラフを二本クリッ
クすると、図11のようにその二本を軸とした平面セル
図を表示する。図11において画像データを考えた場
合、絵の特徴を表す検索キーを「画像の回転」「明る
さ」とし、それぞれを内容の度合いに従って、複数のセ
ルを指定することができる。図において(h)の領域は
「明るさ」が「中」で「画像回転」は「低」に分類さ
れ、(i)は「明るさ」が「高」で「画像回転」は
「中」に分類されることを示しており、それらを同時に
指定することも可能となる。
【0050】2.データベースとしてWWWページを用
いた場合の観覧許可/不許可の支援機構 以下に、(1)本発明を用いてWWWページ観覧の許可
/不許可の設定を行なう支援機構の処理概要、(2)本
発明を用いて公的機関が設定情報を公開する実施形態、
(3)〜(8)これに必要な各処理とインターフェース
の例が示される。
【0051】(1)WWWページ観覧の許可/不許可の
設定支援機構の処理概要と実施形態 図12と図13は、観覧を許可しないページの特徴量を
もとに半自動でWWWページの観覧制御設定を行なう本
特許の実施形態の構成図である。図12に設定者側、図
13に観覧希望者側の構成を示す。
【0052】図12において、WWWページ自動取得手
段1は設定待ちページリスト42に基づいてWWW空間
上からページ内容を取得する。観覧許可/不許可自動判
断機構43は、取得したページから特徴量を抽出し、あ
らかじめ設定された観覧不許可ページ特徴量46との類
似度から観覧の許可/不許可を判断する。許可された場
合はそのページを観覧許可ページリスト44に追加し、
不許可の場合は観覧不許可ページリスト45に追加す
る。
【0053】一方ページの内容によっては明確な許可/
不許可の判断がつけがたい類似度をとるものがあり、こ
のような判断の難しいページに対しては自動設定を行な
わず、観覧許可/不許可手動設定インターフェース47
により設定者の判断を仰ぐ。設定者がページの内容をチ
ェックし観覧の許可/不許可を設定すると、システムは
この判断に従って当該ページを観覧許可ページリスト4
4または観覧不許可ページリスト45に追加する。この
際、設定者はページのどの部分の内容について観覧が不
適当であると判断したかを指定することができ、観覧不
許可ページ特徴量学習機構48はその指定部分から観覧
不許可ページ特徴量46を学習する。これによりシステ
ムはより設定者の基準を反映した観覧不許可ページ特徴
量46を持つようになり、より適切な判断・設定を自動
で行なえるようになる。
【0054】次に図13でWWWページの観覧希望者側
の処理を説明する。図13において、ユーザがWWWペ
ージの観覧を希望すると、ユーザ認証により得られてい
る年齢情報などから、必要に応じて観覧制御を行なう
(ユーザの年齢など情報は、OSまたは本機構のユーザ
認証により得られる)。観覧要求があると、許可/不許
可リスト検索機構9は観覧許可ページリスト4と観覧不
許可ページリスト55に基づいて観覧の許可/不許可を
判断する。観覧許可ページリスト54にも観覧不許可ペ
ージリスト55にも存在しないページであった場合(未
設定の場合)には、観覧許可/不許可自動判断機構60
が図12と同様の処理により観覧不許可ページ特徴量5
6との類似度から観覧の許可/不許可を判断する。観覧
が許可された場合はそのページを観覧許可ページリスト
54に追加し、観覧希望者にページの観覧を許可する。
一方不許可の場合は観覧不許可ページリスト55に追加
し、ページの観覧を却下する。観覧の許可/不許可の判
断が難しいページの場合はページの観覧を保留し、設定
待ちページリスト優先度付け処理機構61はそのページ
を設定待ちページリスト52に追加する。
【0055】(2)公的機関によるWWWページ観覧の
許可/不許可設定情報の公開の実施形態 図14は、図12における観覧許可ページリスト44観
覧不許可ページリスト45、観覧不許可ページ特徴量4
6を公的機関が公開する機構の実施形態である。公的機
関は、WWWページ観覧の許可/不許可の設定情報収集
に協力するアンケート協力登録メンバーを持っている。
公的機関はこれらの登録メンバーに対し、観覧許可/不
許可の設定を行ないたいページのアドレス情報を送付す
る。送付を受けた登録メンバーは、そのページ群に対
し、図12の設定支援機構(設定者側)を用いて観覧の
許可/不許可の設定と観覧不許可ページ特徴量の学習を
行なう。登録メンバーは作業の終了後、観覧許可ページ
リスト44観覧不許可ページリスト45、観覧不許可ペ
ージ特徴量46などの設定情報を公的機関に返送する。
返送を受けた公的機関は、同じく図12、図13の設定
支援機構を用いてそれらの設定情報の判断基準による観
覧制御の妥当性を検証し、必要に応じて修正したのち
「当該機関により認証された基準による設定情報」とし
て公開する。このような処理を一定期間ごとに行なうこ
とで、時勢に即した一般的な判断基準を提供する。一般
ユーザ(例えば子どもに対する観覧制御を行ないたい保
護者)はWWWのPUSH技術によりこれらの情報を定
期的に自動取得し、設定情報として利用する。
【0056】(3)観覧の許可/不許可自動判断機構の
処理の例 図15は、図12における観覧の許可/不許可自動判断
機構43の処理を示すフローチャートである。観覧の許
可/不許可自動判断機構43はページ内容を受けとると
(S51)、そのページの内容(文章、画像、音声、映
像など)からページ観覧の許可/不許可判断に有効な特
徴量を抽出する(S52)。抽出する特徴量としては、
文字の場合は単語テンプレートや意味分類、画像・映像
の場合は色合いや画像パターンの配置、音声の場合は音
声認識結果やケプストラム、パワーなどを用いる。これ
らの特徴量から主成分分析などの特徴選択手法にもとづ
いて有効な特徴ベクトルを抽出する。この特徴ベクトル
をx(i=1〜n)、あらかじめ設定された観覧不許
可ページ特徴量46の特徴ベクトルをy(i=1〜
n)とすると、ベクトルxとyの類似度、つまり当該ペ
ージと不許可ページとの類似度Simは次式で計算する
ことができる。
【0057】 Sim=1/(1+sqrt(Σ{i}(x−y)) … (1) または Sim=cosθ=(x,y)/(|x|*|y|) … (2) ただし(x,y)はベクトルxとyの内積 |x|はベクトルxのノルム を表す 式(1)はベクトルの距離をもとにした計算法、式
(2)はベクトルの角度をもとにした計算法である。こ
のようにして得られた不許可ページとの類似度が、観覧
を不許可にするのに十分高い場合はそのページを不許可
ページリスト45に追加し、逆に類似度が観覧を許可に
するのに十分低い場合は許可ページリスト44に追加す
る。許可/不許可の判断を付け難い中間の類似度の場合
は、手動設定を行なうインターフェース47により設定
者の指示を仰ぐ。
【0058】図16は、図13における観覧希望者側の
観覧の許可/不許可自動判断機構60の処理を示すフロ
ーチャート(S61〜S72)である。図15と異なる
点は、観覧希望者に対して実際に観覧を許可/不許可す
る処理が加わっていることと、許可/不許可の判断を付
け難い中間の類似度の場合には設定待ちページリスト5
2に追加する処理が加わっていることであり、基本的に
は図15と同じ処理を行なう。
【0059】(4)複数しきい値による許可/不許可の
判断 図17は、(3)における許可/不許可の判断処理にお
いて用いる複数しきい値による判断発明を説明した図で
ある。許可/不許可の判断をする際、単一のしきい値で
許可か不許可を二値判断するのではなく、許可しきい値
と不許可しきい値という複数のしきい値により判断す
る。不許可ページとの類似度が許可しきい値よりも低い
場合は、十分な確信度をもって許可ページであると判断
できるということで設定者の判断を仰ぐことなく自動的
に許可設定を行なう。また、不許可ページとの類似度が
不許可しきい値よりも高い場合にも、十分な確信度をも
って不許可ページであると判断できるということで自動
的に不許可設定を行なう。一方類似度が許可しきい値と
不許可しきい値の中間の値をとる場合は、確信度が十分
でなく許可/不許可を自動的に判断するのは難しいとい
うことで安全のために自動設定は行なわず、この場合の
み設定者の判断を仰ぐ。
【0060】図18は、これらの許可しきい値、不許可
しきい値の設定処理を示すフローチャートである。不許
可ページとの類似度の最小値を0、最大値を1として、
まず許可しきい値ThOKを0、不許可しきい値Th
NGを1(最も安全なしきい値設定)として初期化を行
なう(S81)。あるページに対し設定者が観覧許可と
した場合(S82)、そのページと不許可ページとの類
似度Simに対し、次式のようにしきい値を更新する
(S83〜S89)。
【0061】 ThOK=ThOK+a1*(Sim−ThOK) ThNG=ThNG+a2*1/(ThNG−Sim) (a1,a2は小さな正の係数) 具体的には、許可しきい値については類似度Simとし
きい値ThOKの差が大きいほど大きく上げ(Simに
近付け)、不許可しきい値については類似度Simとし
きい値ThNGの差が小さいほど大きく上げる(Sim
から遠ざける)。一方、設定者が観覧不許可とした場合
(S82)は、次式のように行う。
【0062】 ThOK=ThOK−a1*1/(Sim−ThOK) ThNG=ThNG−a2*(ThNG−Sim) (a1,a2は小さな正の係数) つまり、許可しきい値については類似度Simとしきい
値ThOKの差が小さいほど大きく下げ(Simから遠
ざけ)、不許可しきい値については類似度Simとしき
い値ThNGの差が大きいほど大きく下げる(Simに
近付ける)。このようにしきい値を類似度Simとの差
にもとづいて適応的に変化させていくことで、最適なし
きい値に近付けていく(S83〜S89)。
【0063】以上のようにして複数のしきい値を用いる
ことにより、許可と判断できる部分と不許可を判断でき
る部分だけでなく判断が難しいグレーゾーンというもの
を設定し、この部分にのみ設定者の判断を仰ぐことで、
自動設定による不適切な設定の回避と設定者の作業部分
の削減を実現することができる。
【0064】(5)観覧不許可ページ特徴量の学習の処
理 図19は、観覧不許可ページ特徴量の学習機構全体の処
理を示すフローチャートを示した図である。観覧許可/
不許可手動設定インターフェース7により設定者が観覧
に問題のある部分を指定すると、観覧不許可ページ特徴
量学習機構8は指定箇所にもとづいた部分学習(a)を
行なう(S91)。具体的には、指定箇所から抽出され
た特徴ベクトルをx(i=1〜n)、あらかじめ設定
された観覧不許可ページ特徴量6の特徴ベクトルをy
(i=1〜n)とすると、次式に従って、yをx
近付けて更新する。
【0065】y=y+a*(x−y) (aは小さな正の係数) つまり、処理の軽減のため、通常はこのように現在設定
を行なっているページに対してのみの部分学習を行なう
(S94)。
【0066】一方、ある一定の周期(完全再学習周期)
ごとに設定済みの全ページに対して完全再学習(b)を
行ない、より最適に近い観覧不許可ページ特徴量6の学
習を行なう(S92)。具体的には設定済みのページの
内容から特徴量を抽出し、これらの特徴量に対しFKL
法を適用することで、観覧許可/不許可の各クラスを最
適に判別する特徴量選択行列を求め、これにもとづいて
観覧不許可ページ特徴量6を更新する(S95)。
【0067】さらに、設定者の観覧の許可/不許可の基
準が経年変化を起こすのを反映するため(S93)、あ
る一定の周期(経年変化学習周期)ごとに設定済みのペ
ージの一部(できるだけ設定時期の古いもの)を設定者
に提示し、観覧許可/不許可手動設定インターフェース
7を通して観覧に問題のある部分を指定させる。指定さ
れた箇所に対して部分学習(a)と同様の処理を行なう
ことで、経年変化学習(c)を行なう(S96)。
【0068】(6)設定待ちページリストの優先度制御
の例 図20は、優先度付きの設定待ちページリストの例であ
る。設定待ちページリストは、観覧の設定を待っている
WWWページのアドレス(URL)とその優先度を保持
している。優先度は観覧希望者からの観覧希望が多いペ
ージほど高い値をとり、設定者が観覧設定の処理を行な
う時にこの優先度が高いページから処理させることによ
り、利用者の要求を反映した設定作業を行なうことがで
きる。例えば、あるユーザから観覧設定要求があり、な
おかつ(そのページに対する許可/不許可の自動判断が
難しいということで)観覧が保留になった場合、そのペ
ージの優先度が上がり、より優先的に設定者の処理を受
けることができるようになる。
【0069】(7)観覧の許可/不許可設定支援インタ
ーフェースの例 図21は、観覧の許可/不許可の判断を設定者に仰ぐ場
合のインターフェースの例である。システムは、観覧の
許可/不許可の自動判断が難しいページに対し設定者に
観覧の許可/不許可を設定させるためページの内容を提
示する際、システムが観覧に問題がある可能性が高いと
判断した部分、つまり観覧不許可ページ特徴量6との類
似度が高い部分を強調表示する。例えば、不許可ページ
との類似度の高い文章部分は大きなフォントや点滅によ
る表示に加え背景に内容分類に応じた色ラベルを付与す
るなどして強調表示を行なう(d)。画像に対しては縁
どりを行ない、内容分類に応じた色ラベルを付与する
(e)。映像に対しては、インデックス表示を行なった
上で該当部分のインデックスに色ラベルを付与する
(f)。音声の場合も同様である。このようにして強調
表示を行なうことで、設定者はシステムの判断部分が適
切であるかを容易に検証することができ、また一方で自
分が許可/不許可の判断を下す際に強調部分を判断材料
として利用することができる。さらに設定者は、観覧に
問題があると考える部分を新たに指定することができ
(g)、これによりシステムは観覧不許可ページ特徴量
46を学習することができる。
【0070】(8)観覧の許可/不許可の設定のクラス
化の例 図22は、観覧の許可/不許可設定をクラス化したイン
ターフェースの例である。例えば、内容分類を性的表現
と暴力表現とし、それぞれを内容の度合に従って、16
歳未満禁止、18歳未満禁止、20歳未満禁止などの段
階に分類する。図において(h)の領域は性的表現が1
6歳未満禁止で暴力表現は16歳未満禁止の内容分類を
示しており、(i)は性的表現は18歳未満禁止で暴力
表現は18歳未満禁止の内容分類を示している。設定者
はあるページ内容に対し、これらの分類されたセルの一
つを指定することで、直観的に設定を行なうことができ
る。また、各クラスに属するページの特徴量分布の平均
をとることで各クラスの代表特徴ベクトルが算出でき
る。これにより、あるページの特徴ベクトルに対し最も
類似度の高い代表特徴ベクトルをもつクラスをそのペー
ジの属するクラスであると判定することができる。この
結果、判定されたクラスとユーザの年齢情報から観覧の
許可/不許可を判断することができる。
【0071】一方これらのクラスの持つ特徴量分布に対
してFKL法を適用すると、各クラスの判別に適した
(各クラスの分離度が高い)特徴軸を選択することがで
き、より正確なクラス判別を行なうことができる。また
ここで寄与率の高い特徴軸のみを選択することで、判別
に必要な特徴量の次元を減少させることができる。
【0072】又更に以下のように本発明のポイントを整
理することができる。
【0073】1.データベース検索に用いる属性情報の
配信システム データベース要素に付与された属性をもとにデータベー
ス検索を行なうシステムにおいて、データベース要素に
付与された属性リストを定期的にユーザ(クライアン
ト)に配信することで、最新のデータベース情報に基づ
いた検索を容易に実現するシステム。
【0074】2.データベース要素に対する属性付与の
判断基準の収集 データベース要素に属性を付与する際、ある被験者群に
対し、あるデータベース要素群を対象とした属性付与の
回答を収集し、これらの結果を統合することで、一般的
な判断基準に基づいた属性付与の判断基準を得るシステ
ム。
【0075】3.データベース検索のための属性付与支
援機構 データベース要素に付与された属性をもとにデータベー
ス検索を行なうシステムにおいて、属性の付与を行なう
作業を支援するシステム。
【0076】データベース上から属性付与が未設定のデ
ータベース要素を自動取得し、あらかじめ設定された検
索者の感性(意図)と合致した検索属性の特徴と比較す
る。その比較結果に基づき、未設定データベース要素の
属性を自動的に判断し付与する。
【0077】3.1.データベース要素に付与する属性
の特徴の学習 発明のポイント3のデータベース要素に付与する属性の
特徴において、あるデータベース要素に対して設定者が
属性の特徴となる画像・映像・文字などの部分を指定
し、システムがそれをもとに属性の特徴を学習すること
で、システムの判断をより設定者の判断に近付けていく
ことができる。
【0078】3.1.1.データベース要素に付与する
属性の特徴の自動再学習 発明のポイント3.1のデータベース要素に付与する属
性の特徴の学習の際、処理量を抑えるため、通常はその
時点で判断を行なっているデータベース要素のみを対象
とした部分学習を行なうにとどめ、一方で定期的に全設
定済みデータベース要素を対象とした完全再学習を行な
って真に最適な学習を行う。通常は処理量の少ない部分
学習で近似的な解を学習するとともに、定期的に処理量
の多い完全学習を行なって最適解も保証する。
【0079】3.1.2.データベース要素に付与する
属性の特徴の経年変化を反映する再学習 発明のポイント3.1のデータベース要素に付与する属
性の特徴の学習の際、設定者の属性付与の判断が経年変
化を起こす可能性があるため、定期的に設定者にデータ
ベース要素を表示してそれに付与すべき属性を入力さ
せ、再学習を行なうことで、付与する属性の特徴の経年
変化を反映する。
【0080】3.2.属性の付与が未設定のデータベー
ス要素に対する検索と属性の自動付与 発明のポイント3でデータベース要素に付与された属性
をもとにデータベース検索を行う際、属性の付与が未設
定のデータベース要素が検索対象にあった場合、検索時
に検索属性の特徴との比較を行ない、属性の付与/不付
与を判断して検索処理を続ける一方、当該データベース
要素に対し判断された属性の付与/不付与を反映する。
【0081】3.3.クライアント側でのデータベース
要素に対する属性付与機構 発明のポイント3の属性付与をクライアント側で行なう
場合、データベース要素に付与された属性とその特徴量
の初期値として、発明のポイント1によりサーバから配
信された情報を用い、それをもとに発明のポイント3.
1のデータベース要素に付与する属性の特徴の学習を行
なう。サーバからの信頼できる基準を用いることで初期
設定が容易になり、一方でクライアント側での学習によ
りユーザの基準に近い属性付与を行なうことができる。
【0082】4.データベース要素に対する属性付与の
支援インターフェース データベース要素に付与する属性の判断を設定者に問い
合わせる際、システムが付与すべき属性に関連が深いと
判断した画像・映像・文字・音声の部分に対し、拡大表
示・色つき表示・点滅表示・映像のインデックス表示な
どの強調を行なったうえで、設定者にデータベース要素
を提示する。これにより設定者は、付与する属性の判断
を行なう際に、以下のことが可能になる。
【0083】1)システムが判断を下した際の注目部分
が適切であるかの容易な検証 2)付与すべき属性の判断を下す際に強調部分を判断材
料として参考 5.付与属性のクラス化とそのユーザーインターフェー
ス データベース要素に対する属性の付与を行なう際、属性
の種類をnとし、その中を内容の度合に従ってk段階に
分類することで、各k段階、n個の特徴軸を設定する。
このようにしてクラス化されたn×kの領域に対し、属
性を付与するデータベース要素がどれに対応するかをシ
ステムは判断し、クラス領域として表示する。一方設定
者もデータベース要素が対応する領域を指定する。この
ように、クラス化を行なった領域として表示・指定を行
なうことで、直観的な設定作業が可能になる。
【0084】5.1.付与属性のクラス化による特徴抽
出 発明のポイント5の付与属性のクラス化において、内容
分類空間に対する特徴抽出手法を用いることで、各クラ
スの判別がしやすい特徴軸を選択することができ、また
特徴量を減少させることができる。
【0085】5.2.クラスの代表特徴ベクトルをもと
にした観覧可否決定手段 発明のポイント5で設定するn×kのクラスと、発明の
ポイント5.1で示す特徴量との対応づけを行なうため
に、ポイント5で各クラスに設定された特徴ベクトルの
統計的分布を用いてクラスごとに代表的な特徴ベクトル
を算出する。検索要求があった場合には、そのデータベ
ース要素の特徴ベクトルが発明のポイント5で定めたど
のクラスに対応するかを、この代表特徴ベクトルをもと
に求めることで観覧可否を決定するようにした観覧可否
決定手段。
【0086】6.優先度つき設定待ちデータベース要素
リストによる設定作業の効率化 データベース検索の対象となったデータベース要素に対
して属性の付与が未設定で、かつ付与属性が自動判断で
きないデータベース要素があった場合、そのデータベー
ス要素は検索対象から外すと共に、設定待ちデータベー
ス要素リストに記憶する。検索要求の多いデータベース
要素に対しては高い優先度を付与する。
【0087】設定者が属性の付与作業を行なう際、設定
待ちデータベース要素リストに存在する優先度の高いデ
ータベース要素を優先的に選択して設定作業を行なうこ
とで、ユーザの検索要求を反映した効率の良い設定作業
を可能にする。
【0088】7.複数しきい値による判断 データベース要素に付与する属性を自動的に判断する
際、判断の評価値に対して単一のしきい値を設定して属
性の付与/不付与を二分するのではなく、複数のしきい
値を用いて判断する。複数のしきい値により区分され
た、付与にも不付与にも該当しない中間領域を判断の難
しいグレーな部分とし、これに該当するデータベース要
素に対してのみ設定者の判断を仰ぐことで、設定者の作
業の省力化と、自動設定による判断誤りの抑制を実現す
る。
【0089】7.1.設定者の判断にもとづいた複数し
きい値の動的設定 発明のポイント7の複数のしきい値を設定する際、設定
者の判断結果が得られるたびに、判断結果としきい値の
差にもとづいて動的にしきい値を変更することで、より
設定者の判断に近いしきい値を設定できるようになる。
【0090】8.WWWページ観覧制御のためのページ
リスト配信システム 判定者がWWWページの内容を検査し未成年者などに対
する観覧の許可/不許可を判定したリストをもとに、W
WWブラウザが観覧できるWWWページを制限するシス
テムに対し、観覧の許可/不許可を判定したリストを定
期的にユーザに配信することで、最新の情報に基づいた
観覧制御を容易に実現するシステム。
【0091】9.WWWページ観覧制御の判断基準の収
集 未成年者などに対する観覧の許可/不許可を判定したW
WWページのリストを作成する際、ある被験者群に対
し、あるページ群を対象とした観覧の許可/不許可の回
答を収集し、これらの結果を統合することで、一般的な
判断基準に基づいた観覧の許可/不許可リストを得るシ
ステム。
【0092】10.WWWページ観覧の許可/不許可の
設定支援機構 未成年者などに対する観覧の許可/不許可を設定したリ
ストをもとにWWWブラウザが観覧できるWWWページ
を制限するシステムにおいて、観覧の許可/不許可の設
定を行なう作業を支援するシステム。
【0093】WWW上からページ内容を自動取得し、あ
らかじめ設定された観覧を許可しないページの文字・画
像・映像情報の特徴と比較する。その比較結果に基づ
き、ページ観覧の許可/不許可の判断を自動的に行なっ
て設定する。
【0094】10.1.観覧を許可しないページの特徴
の学習 発明のポイント10の観覧を許可しないページの特徴に
対して、あるページに対して設定者が不許可の原因とな
る文字・画像・映像情報などの部分を指定し、それをも
とに観覧を許可しないページの特徴を学習することで、
システムの判断をより設定者の判断に近付けていくこと
ができる。
【0095】10.1.1.観覧を許可しないページの
特徴の自動再学習 発明のポイント10.1の観覧を許可しないページの特
徴の学習の際、処理量を抑えるため、通常はその時点で
判断を行なっているページ内容のみを対象した部分学習
を行なうにとどめ、一方で定期的に全設定済みページを
対象とした完全再学習を行なって真に最適な学習を行
う。通常は処理量の少ない部分学習で近似的な解を学習
するとともに、定期的に処理量の多い完全学習を行なっ
て最適解も保証する。
【0096】10.1.2.観覧を許可しないページの
特徴の経年変化を反映する再学習 発明のポイント10.1の観覧を許可しないページの特
徴の学習の際、設定者の許可/不許可の判断が経年変化
を起こす可能性があるため、定期的に設定者にページ内
容を表示してそれに対する許可/不許可の設定を入力さ
せ、再学習を行なうことで、観覧を許可しないページの
特徴の経年変化を反映する。
【0097】10.2.観覧の許可/不許可が未設定の
ページに対する観覧制御と自動設定 発明のポイント10のWWWブラウザが観覧できるWW
Wページを制限する際、ページ観覧の許可/不許可が未
設定であるページに対する観覧要求があった場合、要求
時に、観覧を許可しないページの特徴との比較を行な
い、その比較結果に基づいてページ観覧を許可(表示)
または不許可(非表示)したのち、設定にも反映する。
【0098】10.3.公的機関による観覧制御の設定
公開支援機構 発明のポイント10の観覧の許可/不許可の設定と観覧
を許可しないページの特徴について、発明のポイント9
の収集機構によりWWWページ観覧制御の一般的な判断
基準の収集を行ない、これを公的機関が発明のポイント
10.1の学習機構を用いて基準のチェックと再学習を
行なう。このようにして得られた観覧の許可/不許可の
設定リストと特徴量を、公的機関による認証された基準
として、発明のポイント8の配信システムを用いて利用
者に配信する。
【0099】10.4.保護者などによる観覧制御の設
定支援機構 発明のポイント10の観覧の許可/不許可の設定を保護
者などが行なう際、観覧の許可/不許可の設定リストと
特徴量の初期値として発明のポイント10.3において
公的機関により配信された情報を用い、それをもとに発
明のポイント10.1の観覧を許可しないページの特徴
の学習を行なう。公的機関による信頼できる基準を用い
ることで初期設定が容易になり、さらに学習により保護
者の基準に近い観覧制御を行なうことができる。
【0100】
【発明の効果】以上詳述したようにこの発明によれば、
以下のような効果を得ることができる。
【0101】つまり、データベース要素に付与する属性
の特徴量をもとに、データベース要素の属性を自動的に
判断・付与することにより、データベース要素に対する
属性付与作業の省力化が行なえる。
【0102】又、データベース要素に付与する属性の特
徴量を学習することで、よりユーザの基準に適した属性
付与を行なえるようになる。
【0103】又、設定者が手動で属性付与の作業を行な
う際、特徴量に適合した部分を強調表示するユーザーイ
ンターフェースや、検索要求の多いデータベース要素を
優先的に設定させる機構により、より効率的な設定作業
が可能になる。
【0104】又、上記した特徴をWWWブラウザ上に実
装することで、容易に検索を実現することができる。
【0105】又、WWWの観覧制御において、観覧を許
可しないページの特徴量をもとに観覧の許可/不許可を
自動的に判断・設定することにより、観覧制御に必要な
設定作業の省力化が行なえる。
【0106】又、WWWの観覧許可/不許可の判断に用
いる観覧を許可しないページの特徴量を学習すること
で、よりユーザの基準に適した観覧制御を行なえるよう
になる。
【0107】又、設定者が手動でWWWの観覧の許可/
不許可の設定を行なう際、特徴量に適合した部分を強調
表示するユーザーインターフェースや、観覧者の観覧希
望の多いページを優先設定させる機構により、より効率
的な設定作業が可能になる。
【図面の簡単な説明】
【図1】本発明を用いたデータベース検索キーの一致/
不一致の設定支援機構の実施形態(データベース管理者
側)の構成部分図。
【図2】本発明を用いたデータベース検索キーの一致/
不一致の設定支援機構の実施形態(データベース検索者
側)の構成部分図。
【図3】データベース管理者側での検索キーとの一致/
不一致自動判断機構の処理を示すフローチャート。
【図4】検索者側での検索キーとの一致/不一致自動判
断機構の処理を示すフローチャート。
【図5】複数しきい値によるキー一致/不一致判断の説
明図。
【図6】キー一致/不一致しきい値設定の処理を示すフ
ローチャート。
【図7】キー一致/不一致データベース特徴量の学習の
処理を示すフローチャート。
【図8】設定待ちデータベース要素優先度付け処理の
例。
【図9】検索キーとの一致/不一致設定支援インターフ
ェースの例。
【図10】各検索キーとの類似度、および一致/不一致
クラス化インターフェースの例。
【図11】2つの検索キーにおけるクラス化インターフ
ェースの例。
【図12】本発明を用いたWWWページ観覧制御の設定
支援機構実施形態の構成部分図。
【図13】本発明を用いたWWWページ観覧制御の設定
支援機構実施形態の構成部分図。
【図14】本発明の公的機関による設定情報公開実施形
態の構成図。
【図15】設定者側での観覧許可/不許可自動判断機構
の処理を示すフローチャート。
【図16】観覧希望者側での観覧許可/不許可自動判断
機構の処理を示すフローチャート。
【図17】複数しきい値による許可/不許可判断の説明
図。
【図18】許可/不許可しきい値設定の処理を示すフロ
ーチャート。
【図19】観覧不許可ページ特徴量の学習の処理を示す
フローチャート。
【図20】設定待ちページリスト優先度付け処理の例。
【図21】観覧許可/不許可設定支援インターフェース
の例。
【図22】観覧許可/不許可設定のクラス化インターフ
ェースの例。
【符号の説明】
11 … データベース要素自動取得手段 12 … 設定待ちデータベース要素リスト 13 … 検索キー一致/不一致判断機構 14 … キー一致データベース要素リスト 15 … キー不一致データベース要素リスト 16 … 検索キー一致データベース要素特徴量 17 … 検索キー一致/不一致手動設定インターフェ
ース 18 … キー一致データベース要素特徴量学習機構 22 … 設定待ちデータベース要素リスト 24 … キー一致データベース要素リスト 25 … キー不一致データベース要素リスト 26 … 検索キー一致データベース要素特徴量 29 … キー一致/不一致リスト検索機構 30 … 検索キー一致/不一致自動判断機構 31 … 設定待ちデータベースリスト優先度付け処理
機構 41 … WWWページ自動取得手段 42 … 設定待ちページリスト 43 … 観覧許可/不許可自動判断機構 44 … 観覧許可ページリスト 45 … 観覧不許可ページリスト

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 複数情報を格納する格納手段と、 前記格納手段に格納された前記複数情報のそれぞれが与
    えられた属性に該当するか否かに関するリストを作成し
    これを格納するリスト手段と、 前記属性に該当するか否かの判断ができない前記複数情
    報の中の保留情報を表示する表示手段と、 前記表示手段に表示される前記保留情報につき設定オペ
    レータの指示に応じて前記属性に該当するか否かを判断
    し前記リスト手段が作成する前記リストに加える追加手
    段と、 を具備することを特徴とする検索支援システム。
  2. 【請求項2】 複数情報を格納する格納手段と、 前記格納手段に格納された前記複数情報のそれぞれが与
    えられた第1属性に該当するか否かに関するリストを作
    成しこれを格納するリスト手段と、 前記属性に該当するか否かの判断ができない前記複数情
    報の中の保留情報を表示する表示手段と、 前記表示手段に表示される前記保留情報につき設定オペ
    レータの指示に応じて前記属性に該当するか否かを判断
    し前記リスト手段が作成する前記リストに加える追加手
    段と、 前記設定オペレータとは異なる検索オペレータの指示に
    よる第2属性を受け、前記リスト手段が作成する前記リ
    ストを参照して前記第2属性に該当する前記複数情報を
    検索する検索手段と、 を具備することを特徴とする検索支援システム。
  3. 【請求項3】 複数文字画像を格納する格納手段と、 前記格納手段に格納された前記複数文字画像が与えられ
    た属性に該当するか否かに関するリストを作成しこれを
    格納するリスト手段と、 前記属性に該当するか否かの判断ができない前記複数文
    字画像の中の保留情報を表示する表示手段と、 前記表示手段に表示される前記保留情報につき設定オペ
    レータの指示に応じて前記属性に該当するか否かを判断
    し前記リスト手段が作成する前記リストに加える追加手
    段と、 を具備することを特徴とする文字画像検索支援システ
    ム。
  4. 【請求項4】 複数文字画像を格納する格納手段と、 前記格納手段に格納された前記複数文字画像が与えられ
    た第1属性に該当するか否かに関するリストを作成しこ
    れを格納するリスト手段と、 前記第1属性に該当するか否かの判断ができない前記複
    数文字画像の中の保留情報を表示する表示手段と、 前記表示手段に表示される前記保留情報につき設定オペ
    レータの指示に応じて前記第1属性に該当するか否かを
    判断し前記リスト手段が作成する前記リストに加える追
    加手段と、 前記設定オペレータとは異なる検索オペレータの指示に
    よる第2属性を受け、前記リスト手段が作成する前記リ
    ストを参照して前記第2属性に該当する前記複数文字画
    像を検索する検索手段と、 を具備することを特徴とする文字画像検索支援システ
    ム。
  5. 【請求項5】 前記検索手段は、前記第2属性に該当す
    る文字画像が前記リスト手段が作成する前記リストにな
    い場合に前記第2属性を格納し、後に前記複数文字画像
    のそれぞれがこの格納された第2属性に該当するか否か
    に関するリストを作成しこれを格納する手段を更に有す
    ることを特徴とする請求項4に記載の文字画像検索支援
    システム。
  6. 【請求項6】 前記リスト手段は前記複数情報のそれぞ
    れが与えられた前記第1属性がもつ複数の属性のそれぞ
    れが前記文字画像にどの程度該当するかの一致度をそれ
    ぞれ求めこれを合計して一致度を算出する手段を有する
    ことを特徴とする請求項4に記載の文字画像検索支援シ
    ステム。
  7. 【請求項7】 前記追加手段は、前記設定オペレータの
    指示に応じて、前記リスト手段で前記第1属性と前記複
    数文字画像との近似を判断する際のしきい値を変更する
    変更手段を有することを特徴とする請求項4に記載の文
    字画像検索支援システム。
  8. 【請求項8】 前記リスト手段は、一定周期で新たな前
    記複数情報のそれぞれが与えられた前記第1属性を取り
    入れ、前記リストを更新する更新手段を有することを特
    徴とする請求項4に記載の文字画像検索支援システム。
  9. 【請求項9】 前記検索手段は、前記第2属性に該当す
    る文字画像が前記リストにない場合に前記第2属性を所
    定領域に格納し、後に前記複数文字画像のそれぞれがこ
    の格納された第2属性に該当するか否かに関するリスト
    を作成しこれを格納する手段と、 前記所定領域に前記第2属性がすでに存在するときは前
    記第2属性の処理のための優先度を上げる手段とを更に
    有することを特徴とする請求項4に記載の文字画像検索
    支援システム。
  10. 【請求項10】 前記表示手段は、前記複数情報のそれ
    ぞれが与えられた前記第1属性に該当するか否かの判断
    ができない前記複数文字画像の中の保留情報を画面上で
    その箇所だけ強調して表示する表示手段を更に有するこ
    とを特徴とする請求項4に記載の文字画像検索支援シス
    テム。
  11. 【請求項11】 前記追加手段は、前記文字画像が前記
    複数情報のそれぞれが与えられた前記第1属性のそれぞ
    れの属性に対してどの程度の値をもつかを並列に表示す
    る表示手段を更に有することを特徴とする請求項4に記
    載の文字画像検索支援システム。
  12. 【請求項12】 前記追加手段は、前記文字画像が前記
    第1属性の中の二つの属性に対してどの程度の値をもつ
    かを、一つの属性を縦軸、もう一つの属性を横軸として
    表示しする表示手段を更に有することを特徴とする請求
    項4に記載の文字画像検索支援システム。
  13. 【請求項13】 WWWネットワークにアクセスしてペ
    ージ情報を獲得する獲得手段と、 前記獲得手段が獲得した前記ページ情報が与えられた属
    性に該当するか否かに関する観覧許可・不許可リストを
    作成しこれを格納するリスト手段と、 前記ページ情報が与えられた前記属性に該当するか否か
    の判断ができない前記ページ情報の中の保留情報を表示
    する表示手段と、 前記表示手段に表示される前記保留情報につきプロバイ
    ダオペレータの指示に応じて前記ページ情報が与えられ
    た前記属性に該当するか否かを判断し前記観覧許可・不
    許可リストに加える追加手段と、 を具備することを特徴とするインターネットページ情報
    検索システム。
  14. 【請求項14】 WWWネットワークにアクセスしてペ
    ージを獲得する獲得手段と、 前記獲得手段が獲得した前記ページ情報が与えられた属
    性に該当するか否かに関する観覧許可・不許可リストを
    作成しこれを格納するリスト手段と、 前記ページ情報が与えられた前記属性に該当するか否か
    の判断ができない前記複数ページ情報の中の保留情報を
    表示する表示手段と、 前記表示手段に表示される前記保留情報につきプロバイ
    ダオペレータの指示に応じて前記ページ情報が与えられ
    た前記属性に該当するか否かを判断し前記観覧許可・不
    許可リストに加える追加手段と、 インターネットユーザの指示によるアドレス情報を受
    け、前記観覧許可・不許可リストを参照して前記アドレ
    スに該当する前記複数ページ情報を検索する検索手段
    と、 を具備することを特徴とするインターネットページ情報
    検索システム。
  15. 【請求項15】 前記検索手段は、前記アドレス情報に
    該当するページ情報が前記観覧許可・不許可リストにな
    い場合に設定待ちページリストとして前記アドレス情報
    を格納し、後にこの設定待ちページリストに応じて再
    度、観覧許可・不許可リストを作成する手段を更に有す
    ることを特徴とする請求項14に記載のインターネット
    ページ情報検索システム。
  16. 【請求項16】 前記リスト手段は、前記属性がもつ複
    数の属性のそれぞれが前記ページ情報にどの程度該当す
    るかの一致度をそれぞれ求めこれを合計して一致度を算
    出する手段を有することを特徴とする請求項14に記載
    のインターネットページ情報検索システム。
  17. 【請求項17】 前記追加手段は、前記プロバイダオペ
    レータの指示に応じて、前記リスト手段で前記属性と前
    記複数ページ情報との近似を判断する際のしきい値を変
    更する変更手段を有することを特徴とする請求項14に
    記載のインターネットページ情報検索システム。
  18. 【請求項18】 前記リスト手段は、一定周期で新たな
    前記ページ情報が与えられた前記属性を取り入れ、前記
    観覧許可・不許可リストを更新する更新手段を有するこ
    とを特徴とする請求項14に記載のインターネットペー
    ジ情報検索システム。
  19. 【請求項19】 前記検索手段は、前記アドレス情報に
    該当するページ情報が前記観覧許可・不許可リストにな
    い場合に設定待ちページリストとして前記アドレス情報
    を格納し、後にこの設定待ちページリストに応じて再
    度、観覧許可・不許可リストを作成する手段と、 前記所定領域に前記インターネットユーザの指示による
    前記アドレス情報がすでに存在するときは前記アドレス
    情報の処理のための優先度を上げる手段とを更に有する
    ことを特徴とする請求項14に記載のインターネットペ
    ージ情報検索システム。
  20. 【請求項20】 前記表示手段は、前記属性に該当する
    か否かの判断ができない前記獲得手段が獲得した前記複
    数ページ情報の中の保留情報を画面上でその箇所だけ強
    調して表示する表示手段を更に有することを特徴とする
    請求項14に記載のインターネットページ情報検索シス
    テム。
  21. 【請求項21】 前記追加手段は、前記ページ情報が前
    記属性のそれぞれの属性に対してどの程度の値をもつか
    を並列に表示する表示手段を更に有することを特徴とす
    る請求項14に記載のインターネットページ情報検索シ
    ステム。
  22. 【請求項22】 前記追加手段は、前記ページ情報が前
    記属性の中の二つの属性に対してどの程度の値をもつか
    を、一つの属性を縦軸、もう一つの属性を横軸として表
    示しする表示手段を更に有することを特徴とする請求項
    14に記載のインターネットページ情報検索システム。
JP10019870A 1998-01-30 1998-01-30 データベースの検索支援システム Pending JPH11219363A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10019870A JPH11219363A (ja) 1998-01-30 1998-01-30 データベースの検索支援システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10019870A JPH11219363A (ja) 1998-01-30 1998-01-30 データベースの検索支援システム

Publications (1)

Publication Number Publication Date
JPH11219363A true JPH11219363A (ja) 1999-08-10

Family

ID=12011260

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10019870A Pending JPH11219363A (ja) 1998-01-30 1998-01-30 データベースの検索支援システム

Country Status (1)

Country Link
JP (1) JPH11219363A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041773A (ja) * 2000-07-31 2002-02-08 Fujitsu Kiden Ltd 自動決裁方法、自動決裁装置及び自動決裁プログラムを記録した記録媒体
WO2002077867A1 (fr) * 2001-03-27 2002-10-03 Mitsubishi Space Software Co., Ltd. Procede et systeme de surveillance du web
JP2005242833A (ja) * 2004-02-27 2005-09-08 Dainippon Printing Co Ltd Web画面解析装置、web画面解析方法、web解析型音楽装置、及びweb監視装置
JP2006171719A (ja) * 2004-12-01 2006-06-29 Honda Motor Co Ltd 対話型情報システム
JP2010044785A (ja) * 2009-10-15 2010-02-25 Websense Inc インターネットサイトへのアクセスを制御するシステムに用いられるデータベースの作成方法、システムおよびプログラム
US8978140B2 (en) 2006-07-10 2015-03-10 Websense, Inc. System and method of analyzing web content
US9003524B2 (en) 2006-07-10 2015-04-07 Websense, Inc. System and method for analyzing web content
US9378282B2 (en) 2008-06-30 2016-06-28 Raytheon Company System and method for dynamic and real-time categorization of webpages
US9503423B2 (en) 2001-12-07 2016-11-22 Websense, Llc System and method for adapting an internet filter
US9565235B2 (en) 2000-01-28 2017-02-07 Websense, Llc System and method for controlling access to internet sites
US9654495B2 (en) 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
EP3944039A4 (en) * 2019-03-22 2023-01-18 Hitachi Industrial Equipment Systems Co., Ltd. PRESSURE RECORDING SYSTEM AND METHOD OF CONTROLLING A PRESSURE RECORDING SYSTEM

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9565235B2 (en) 2000-01-28 2017-02-07 Websense, Llc System and method for controlling access to internet sites
JP2002041773A (ja) * 2000-07-31 2002-02-08 Fujitsu Kiden Ltd 自動決裁方法、自動決裁装置及び自動決裁プログラムを記録した記録媒体
WO2002077867A1 (fr) * 2001-03-27 2002-10-03 Mitsubishi Space Software Co., Ltd. Procede et systeme de surveillance du web
JP2002288173A (ja) * 2001-03-27 2002-10-04 Mitsubishi Space Software Kk Web監査システム及び方法
US9503423B2 (en) 2001-12-07 2016-11-22 Websense, Llc System and method for adapting an internet filter
JP2005242833A (ja) * 2004-02-27 2005-09-08 Dainippon Printing Co Ltd Web画面解析装置、web画面解析方法、web解析型音楽装置、及びweb監視装置
JP4611649B2 (ja) * 2004-02-27 2011-01-12 大日本印刷株式会社 Web解析型音楽装置
JP2006171719A (ja) * 2004-12-01 2006-06-29 Honda Motor Co Ltd 対話型情報システム
US9003524B2 (en) 2006-07-10 2015-04-07 Websense, Inc. System and method for analyzing web content
US8978140B2 (en) 2006-07-10 2015-03-10 Websense, Inc. System and method of analyzing web content
US9680866B2 (en) 2006-07-10 2017-06-13 Websense, Llc System and method for analyzing web content
US9723018B2 (en) 2006-07-10 2017-08-01 Websense, Llc System and method of analyzing web content
US9654495B2 (en) 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
US9378282B2 (en) 2008-06-30 2016-06-28 Raytheon Company System and method for dynamic and real-time categorization of webpages
JP2010044785A (ja) * 2009-10-15 2010-02-25 Websense Inc インターネットサイトへのアクセスを制御するシステムに用いられるデータベースの作成方法、システムおよびプログラム
EP3944039A4 (en) * 2019-03-22 2023-01-18 Hitachi Industrial Equipment Systems Co., Ltd. PRESSURE RECORDING SYSTEM AND METHOD OF CONTROLLING A PRESSURE RECORDING SYSTEM

Similar Documents

Publication Publication Date Title
KR102203320B1 (ko) 인공지능 기반의 학습데이터셋 제공 시스템
US6208988B1 (en) Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
US7613685B2 (en) System and method for personalized presentation of web pages
US6947924B2 (en) Group based search engine generating search results ranking based on at least one nomination previously made by member of the user group where nomination system is independent from visitation system
US20230079326A1 (en) Identifying legitimate websites to remove false positives from domain discovery analysis
US7027633B2 (en) Collaborative diagnostic systems
US8718383B2 (en) Image and website filter using image comparison
EP0802489B1 (en) Method of image retrieval based on probabilistic function
US7216121B2 (en) Search engine facility with automated knowledge retrieval, generation and maintenance
US7007174B2 (en) System and method for determining user identity fraud using similarity searching
US20110188713A1 (en) Facial image recognition and retrieval
US20050149496A1 (en) System and method for dynamic context-sensitive federated search of multiple information repositories
US20070016583A1 (en) Enforcing native access control to indexed documents
US20100058204A1 (en) Methods and systems for web site categorisation and filtering
US20030177118A1 (en) System and method for classification of documents
US7620679B2 (en) System and method for generating aggregated data views in a computer network
JPH11219363A (ja) データベースの検索支援システム
JP2011504673A (ja) オブジェクト認識およびデータベース移植
US7558800B2 (en) Information providing apparatus, terminal apparatus, information providing system and information providing method
JP3746233B2 (ja) 知識分析システムおよび知識分析方法
CN107357881A (zh) 一种基于新闻数据的中文文本分类系统
JP2000194707A (ja) 情報共有装置および方法および記憶媒体
US20200125680A1 (en) Systems and methods for producing search results based on user preferences
KR100616216B1 (ko) 온라인 맞춤 정보의 검색 관리 시스템 및 그 방법
US10719541B2 (en) Method and system to capture and find information and relationships