JP2004280472A - Web document diagnostic device and method - Google Patents
Web document diagnostic device and method Download PDFInfo
- Publication number
- JP2004280472A JP2004280472A JP2003070936A JP2003070936A JP2004280472A JP 2004280472 A JP2004280472 A JP 2004280472A JP 2003070936 A JP2003070936 A JP 2003070936A JP 2003070936 A JP2003070936 A JP 2003070936A JP 2004280472 A JP2004280472 A JP 2004280472A
- Authority
- JP
- Japan
- Prior art keywords
- web document
- logo
- database
- term
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、インターネットを介して公開されるWeb文書を診断する装置および方法に係り、更に詳しくは、Web文書に含まれている不適切用語を適切用語に置き換えるとともに、Web文書に含まれている写真およびロゴが契約など所定の取り決め通りに掲載されているかを診断するWeb文書診断装置およびWeb文書診断方法に関する。
【0002】
【従来の技術】
現在、インターネットに接続されたWebブラウザを介して閲覧可能なホームページが、官民を問わず多くの企業や団体、あるいは個人等によって開設されている。
【0003】
このようなホームページは、テキストデータや、静止画像データ、動画データ、音声データなど様々な形態のデータによって作成されたWeb文書からなっている。そして、一般公衆に対するコマーシャル、PR、イメージ向上、情報提供、サービス、ビジネス等といった様々なことに利用されている。
【0004】
このようにホームページは、企業や団体、あるいは個人等といったホームページ開設者の顔と言っても過言ではない。
【0005】
したがって、ホームページを開設する場合、あるいは更新する場合には、Web文書に記載されている用語の一語一句に及ぶまで万全の注意を払って作成する必要がある。特に、企業においては、企業内ルールに適合しているかどうかの判断やチェックの必要性がコンプライアンスの観点で高まっている。
【0006】
万が一、Web文書に不適切な用語や、誤解を招くような用語が使用された場合には、ホームページ開設者のイメージが著しく損なわれるのみならず、企業や事業者の場合、ビジネスに即悪影響を及ぼしてしまう恐れもある。
【0007】
また、企業には、社内用語等、社外公開に関して企業内で規定されたルールが存在する場合がある。例えば、同じ商品であっても、企業毎にその呼び名が異なる場合や、顧客向けに使用する用語等がこれに該当する。したがって、Web文書では、これら規定されたルールに則った用語を使用しなくてはならない。
【0008】
なお、近年、企業統合が頻繁に行われているが、企業統合によって従来使用していた用語が別の用語に変更になる場合もあるために、このルールは流動的なものである。ルールが変更になった場合には、Web文書に用いられている用語についても、即刻新しい用語に変更する必要がある。
【0009】
一方、商品やサービスのコマーシャルのためにホームページを開設した場合には、該商品やサービスのキャンペーンのために契約したタレントの写真をホームページに掲載する場合がよくある。通常、このような契約は、タレントの写真等の使用期間が契約条項に含まれている。また、契約していないタレントの写真は、著作権やパブリシティ権といった知的財産権処理の問題を発生させる。テレビやラジオのコマーシャルの場合だと、契約期間が過ぎてしまうとそのコマーシャルは放映されなくなるので、契約期間が過ぎた写真やタレントの名前を利用することは未然に防止される。
【0010】
しかしながら、ホームページは、一旦開設すると、開設側で自主的に撤去しなければ表示可能になったままの状態が保たれる。このため、使用期間が過ぎた写真が掲載されていてもそれに気がつかず、そのまま表示されてしまい、契約違反を犯してしまう危険性をはらんでいる。契約で定められた使用期間を過ぎた写真をそのまま掲載していると、ペナルティを支払わねばならないことに発展する可能性がある。
【0011】
また、社名や商品名のロゴ等がホームページに記載される場合があるが、そのロゴは商標として使用されていることが多いため、そのデザインは社内で統一して使われるようルール化されている場合がある。
【0012】
このように、ホームページを開設する場合、あるいは更新する場合には、Web文書に記載されている用語の一語一句に及ぶまで万全の注意を払って作成することのみならず、一旦作成した後であっても、掲載した写真やロゴについては、その掲載が許可された使用期間や表示方法を遵守していることをチェックする必要がある。
【0013】
従来、このようなチェックは、ホームページの管理者による人間系作業によって行われている。つまり、ホームページの開設や更新が行われると、ホームページ管理者は、最新の社内規定集あるいは社内用語集を常に備えておくことはもちろん、不適切な用語をまとめた不適切用語集を予め作成しておき、ホームページに掲載されているWeb文書に用いられている全ての用語を、これらと逐一突き合わせてチェックすることによって、不適切な用語を駆除するとともに、適切な用語への置き換え作業がなされている。
【0014】
また、写真やロゴについては、ホームページに掲載されている全ての写真やロゴについて、それが契約範囲内のものであるか、或いは社内ルールに従っているかが定期的にチェックされ、契約やルール上正しい写真やロゴのみが掲載されるようになされている。
【0015】
【発明が解決しようとする課題】
しかしながら、このような従来のWeb文書のチェック方法では、以下のような問題がある。
【0016】
すなわち、ホームページは、通常、階層構造状にリンクの張られた多数のページからなっており、それに含まれるWeb文書、写真、およびロゴは極めて膨大なものとなる。
【0017】
その上、上述したように、社内規定によって規定された用語は流動的である。また、タレントの写真の掲載が許可されている期間についても予め定められている。ロゴについても、特に商品名ロゴであれば掲載が許可されている期間、表示サイズ、色等が予め定められている。
【0018】
社内規定等のルールが変更になった場合には、Web文書に用いられている用語についても、即刻新しい用語に変更する必要がある。最近は、企業統合等によって、社内規定の変更が頻繁になされている。新たな規定が追加され、チェック項目が増加する場合もある。タレントの写真については、使用期間を越えて掲載されることがないようにする必要がある。ロゴについても、使用期間はもちろん、その表示サイズ、色等についても正しく表示されていることをチェックする必要がある。
【0019】
このように流動的にチェック項目の変わりうる条件の下で、極めて膨大な用語、写真、およびロゴに対し、多くのチェック項目について逐一人間が突き合わせ作業を行うことは、甚だ効率的ではないという問題がある。
【0020】
仮にこのような作業を複数の人間で分担して行ったとしても、チェックの精度やレベルにバラツキが生じてしまう可能性がある。
【0021】
本発明はこのような事情に鑑みてなされたものであり、その第1の目的は、Web文書に用いられている用語を、社内規定、コンプライアンス、社会ルール等の観点から自動的にチェックし、用語のチェック作業の効率化およびチェック精度の均一化を図ることが可能なWeb文書診断装置およびWeb文書診断方法を提供することにある。
【0022】
また、その第2の目的は、Web文書に掲載されている写真やロゴを自動的に抽出し、内容に関するチェック作業の合理化を図ることが可能なWeb文書診断装置およびWeb文書診断方法を提供することにある。
【0023】
【課題を解決するための手段】
上記第1および第2の目的を達成するために、本発明では、以下のような手段を講じる。
【0024】
すなわち、請求項1の発明のWeb文書診断方法は、公開用のWeb文書に含まれる用語を、予め定めた不適切用語とそれに対する適切用語とを定義した用語データベースと比較することによって、Web文書に含まれる不適切用語を抽出し、抽出した不適切用語を、用語データベースで定義された該不適切用語に対する適切用語に置き換える置換段階と、Web文書に含まれる写真およびロゴを抽出する抽出段階とを備えている。
【0025】
従って、請求項1の発明のWeb文書診断方法においては、以上のような手段を講じることにより、Web文書に不適切用語が含まれていても、それを抽出し、適切用語に置き換えることができる。このように、Web文書を自動的に診断することができるので、従来Web文書のチェックを行っていた管理者の負担を低減することができるのみならず、均一な精度で確実に不適切用語を適切用語に置き換えることができ、Web文書の信頼性を高めることが可能となる。
【0026】
また、Web文書に用いられている写真やロゴを全て抽出することができるので、使用期間や仕様等をチェックすべき写真やロゴを把握することができる。
【0027】
請求項2の発明は、請求項1の発明のWeb文書診断方法において、抽出段階において抽出された写真を、Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと比較することによって、Web文書への使用が許可された写真であるか否かを判定する。また、抽出段階において抽出されたロゴを、Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと比較することによって、Web文書への使用が許可されたロゴであるか否かを判定する。
【0028】
従って、請求項2の発明のWeb文書診断方法においては、以上のような手段を講じることにより、Web文書への使用が許可された写真、およびロゴであるか否かを判定することができ、使用が許可されていない写真、およびロゴの掲載を阻止することが可能となる。
【0029】
請求項3の発明のWeb文書診断方法は、公開用のWeb文書に含まれる用語を、予め定めた不適切用語とそれに対する適切用語とを定義した用語データベースと比較することによって、Web文書に含まれる不適切用語を抽出し、抽出した不適切用語を、用語データベースで定義された該不適切用語に対する適切用語に置き換える。また、Web文書に含まれ、予め定められたALTデータがおのおの付された写真およびロゴのALTデータを抽出する。そして、Web文書への使用が許可される写真、写真のALTデータ、および写真の使用許可条件が書き込まれた写真データベースを参照することによって、抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、Web文書への使用が許可された写真であるか否かを判定する。更に、Web文書への使用が許可されるロゴ、ロゴのALTデータ、およびロゴの使用許可条件が書き込まれたロゴデータベースを参照することによって、抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、Web文書への使用が許可されたロゴであるか否かを判定する。
【0030】
従って、請求項3の発明のWeb文書診断方法においては、以上のような手段を講じることにより、写真およびロゴに付されたALTデータに基づいて写真およびロゴを識別し、識別した写真およびロゴが使用が許可されたものであるか否かを判定することができる。
【0031】
請求項4の発明のWeb文書診断装置は、Web文書に用いて公開することが不適切であると予め定めた不適切用語と、不適切用語の代わりにWeb文書に用いて公開することが可能であると予め定めた適切用語とを定義した用語データベースを備えている。また、公開用のWeb文書から用語と写真およびロゴとを抽出する抽出手段と、用語データベースに基づいて抽出手段によって抽出された用語から不適切用語を抽出し、抽出した不適切用語を適切用語に置き換える置換手段と、抽出手段によって抽出された写真およびロゴを一覧表示する一覧表示手段とを備えている。
【0032】
従って、請求項4の発明のWeb文書診断装置においては、以上のような手段を講じることにより、Web文書に不適切用語が含まれていても、それを抽出し、適切用語に置き換えることができる。このように、Web文書を自動的に診断することができるので、従来Web文書のチェックを行っていた管理者の負担を低減することができるのみならず、均一な精度で確実に不適切用語を適切用語に置き換えることができ、Web文書の信頼性を高めることが可能となる。
【0033】
また、Web文書に含まれる全ての写真およびロゴを一覧表示することができるので、どの写真やロゴが使用されているかを容易に把握することが可能となる。
【0034】
請求項5の発明は、請求項4の発明のWeb文書診断装置において、Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと、Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと、抽出手段によって抽出された写真が写真データベースに書き込まれた使用許可条件を満足する写真であるか否かを判定する写真判定手段と、抽出手段によって抽出されたロゴがロゴデータベースに書き込まれた使用許可条件を満足するロゴであるか否かを判定するロゴ判定手段とを備えている。
【0035】
従って、請求項5の発明のWeb文書診断装置においては、以上のような手段を講じることにより、写真データベースを参照することによってWeb文書への使用が許可された写真であるか否かを判定することができ、使用許可条件を満たさない写真の掲載を阻止することが可能となる。また、ロゴデータベースを参照することによって、使用許可条件を満たさないロゴの掲載を阻止することが可能となる。
【0036】
請求項6の発明のWeb文書診断装置は、Web文書に用いて公開することが不適切であると予め定めた不適切用語と、不適切用語の代わりにWeb文書に用いて公開することが可能であると予め定めた適切用語とを定義した用語データベースを備えている。また、公開用のWeb文書から用語と予め定められたALTデータが付された写真のALTデータと予め定められたALTデータが付されたロゴのALTデータとを抽出する抽出手段と、用語データベースに基づいて抽出手段によって抽出された用語から不適切用語を抽出し抽出した不適切用語を適切用語に置き換える置換手段とを備えている。更に、Web文書への使用が許可される写真、写真のALTデータ、および写真の使用許可条件が書き込まれた写真データベースと、Web文書への使用が許可されるロゴ、ロゴのALTデータ、およびロゴの使用許可条件が書き込まれたロゴデータベースを備えている。更にまた、写真データベースを参照することによって、抽出手段によって抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、Web文書への使用が許可された写真であるか否かを判定する写真判定手段と、ロゴデータベースを参照することによって、抽出手段によって抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定手段とを備えている。
【0037】
従って、請求項6の発明のWeb文書診断装置においては、以上のような手段を講じることにより、写真およびロゴに付されたALTデータに基づいて写真およびロゴを識別し、識別した写真およびロゴが使用可能なものであるか否かを判定することが可能となる。
【0038】
【発明の実施の形態】
以下に、本発明の実施の形態について図面を参照しながら説明する。
【0039】
本発明の実施の形態を図1から図15を用いて説明する。
【0040】
図1は、本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の一例を示す機能ブロック図である。
【0041】
すなわち、本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置は、不適切用語データベース10と、規定文書データベース11と、企業内用語データベース12と、写真データベース13と、ロゴデータベース14と、統合データベース15と、入力受付部16と、抽出部18と、置換部20と、置換結果表示部21と、写真・ロゴ判定部22と、一覧表示部24と、判定結果表示部26とを備えている。
【0042】
不適切用語データベース10は、Web文書に用いて公開することが不適切であると予め定めた不適切用語と、不適切用語の代わりにWeb文書に用いて公開することが適切であると予め定めた適切用語との対応関係を書き込んだデータベースである。不適切用語データベース10は、例えば図2に示すように、不適切用語とそれに対する適切用語とを一対一で記録したテーブル構成のデータベースである。
【0043】
規定文書データベース11は、Web文章に含まれるテキストデータの記載ルールや表示ルールについての規定を書き込んだデータベースであり、不適切用語データベースと同様に、例えば図3に示すように、不適切表現とそれに対する適切表現とを一対一で記録したテーブル構成のデータベースである。
【0044】
不適切用語データベース10は、社会一般に広く規定されているものであるのに対し、規定文書データベース11は、企業レベルで規定されたものである。社会一般に広く規定されるルールと、企業レベルで規定されるルールとは、ルールが改訂される頻度が異なるので、このように別のデータベースに分けている。
【0045】
企業内用語データベース12は、企業内で使用されている用語、例えば商品名、プロジェクト名、正式会社名、社内組織名、事業所名、代表者氏名等を書き込んだデータベースである。
【0046】
写真データベース13は、例えば図4に示すように、Web文書に貼り付けて公開することが可能な写真データ、写真データ名、サイズ、大きさ、作成日、更新日、写真のALTデータ、および写真の公開可能開始日/終了日、関連サイト等を書き込んだデータベースである。なお、ALTデータとは、図5に示すように、Webブラウザ上でマウスを用いて写真データをポイントした場合に表示されるコメントのことである。Web文書に写真データを貼り付ける場合に、写真データを識別するための必要な情報を予めALTデータaとして書き込んでおく。これによって、Webブラウザ上に写真データが表示された場合、その写真データをマウスでポイントすることによってALTデータaが表示されるようにしている。
【0047】
ロゴデータベース14は、例えば図6に示すように、Web文書に貼り付けて公開することが可能なロゴデータ、ロゴデータ名、サイズ、大きさ、作成日、更新日、ロゴのALTデータ、およびロゴの公開可能開始日/終了日、関連サイト等を書き込んだデータベースである。
【0048】
統合データベース15は、例えば図7および図8に示すように、不適切用語データベース10と、規定文書データベース11と、企業内用語データベース12と、写真データベース13と、ロゴデータベース14とをすべて統合したデータベースである。図7および図8に示す例では、シリアルに付されたレコード番号RIDに対して、診断分類1、診断分類2、および診断分類3からなる診断分類と、ヒト名1、ヒト名2、誤り用語、正式用語、モノ名1、モノ名2、ALTデータ、公開開始日、および公開終了日からなる値データと、ヒト属性1、ヒト属性2、ヒト属性3、モノ属性1、モノ属性2、モノ属性3、カネ属性1、カネ属性2、およびカネ属性3からなる属性データとを書き込んでいる。本来、図7と図8とをあわせて1つの統合データベース15を構成しているが、ここでは、紙面の都合もあり、1つの統合データベース15を図7と図8とに分図して示している。
【0049】
診断分類データでは、診断分類1、診断分類2、診断分類3の順に細かな分類になっている。すなわち、診断分類1には、各データが使用される項目を書き込んでいる。診断分類2には、診断分類1を更に具体化した項目を書き込み、診断分類3には、診断分類2を更に具体化した項目を書き込んできる。なお、図7では、診断分類データとして診断分類3までしか記載していないが、診断分類データは、項目を固定していないので、必要な場合には診断分類4、診断分類5、・・・のように適宜項目を増やせるようにしている。
【0050】
値データおよび属性データについても同様に、必要な場合には新たな項目を適宜増やせるようにしている。
【0051】
このように、統合データベース15は、項目を固定していないので、将来的に新たな項目のデータを取り扱う必要性が生じた場合であっても、新たな項目のデータを柔軟に取り込むことによって対応可能としている。
【0052】
図7に示す例において、レコード番号RID=1〜7は、診断分類1に示すようにロゴの使用に関するデータを書き込んでいる。これらは、ロゴデータベース14に書き込まれたデータを転記したものであって、診断分類2において、社名ロゴ管理に係るものか、商品管理に係るものか、タレント・商標管理に係るものかを書き込んでいる。現時点でこれ以上の診断分類は必要ないので診断分類3には何も書き込んではいない。
【0053】
更に、レコード番号RID=1はヒト名1に書き込まれているように企業ロゴに関するものであって、ロゴのデータ名はモノ名2に書き込まれているように××.gifであり、ALTデータは「CC」であり、掲載開始日は2003年1月6日であり、掲載終了日は2003年12月31日であり、データの大きさはモノ属性1に書き込まれているように120×240ピクセルである。また、データのサイズは、モノ属性2に書き込まれているように1055バイトである。
【0054】
レコード番号RID=8〜13は、診断分類1に示すように全社リスクマネジメントに関するデータを書き込んでおり、更に診断分類2に示すように用語管理および差別用語管理に関するデータを書き込んでいる。これらは、不適切用語データベース10や規定文書データベース11に書き込まれたデータを転記したものであって、「値データ」の「誤り用語」欄に不適切用語を、「正式用語」欄に適切用語をそれぞれ書き込んでいる。
【0055】
レコード番号RID=14〜30は、診断分類1に示すように商品・サービスの告知に関するデータを書き込んでおり、更に診断分類2に示すように採用情報管理、企業情報、募集文書管理、およびリンク管理に係るデータを書き込んでいる。
【0056】
診断分類2が採用情報管理であるレコード番号RID14〜17は、正式用語として「採用」、「募集」、および「お問い合わせ」を書き込んでいる。また、診断分類2が企業情報であるレコード番号RID18〜28は、診断分類3として会社名、資本金、代表者名(社長名)、従業員数、業務、職種、給与、諸手当、勤務地、休日・休暇、制度を書き込んでいる。更に、それらに対応する細分類データを値データおよび属性データにそれぞれ書き込んでいる。これら採用情報管理および企業情報は、企業内用語データベース12に書き込まれたデータを転記したものである。
【0057】
診断分類2がリンク情報であるレコード番号RID=29〜30は、診断分類3に契約事項および個人情報を書き込んでおり、更にモノ名1としてリンク先のURLを書き込んでいる。
【0058】
入力受付部16は、公開前のWeb文書のデータの入力を受け付ける。Web文書は、テキストデータや、静止画像データ、動画データ、あるいは音声データなどからなっている。入力受付部16は、このようなWeb文書のデータが入力されると、入力されたWeb文書のデータを抽出部18へと出力する。
【0059】
抽出部18は、入力受付部16から出力されたWeb文書のデータからテキストデータを抽出し、抽出したテキストデータを置換部20へと出力する。また、入力受付部16から出力されたWeb文書のデータから写真データおよびロゴデータを、それに付されたALTデータとともに抽出する。そして、抽出した写真データおよびロゴデータを、そのALTデータとともに写真・ロゴ判定部22へと出力する。
【0060】
置換部20は、抽出部18からテキストデータが出力されると、このテキストデータに含まれる用語と、統合データベース15との突き合わせを行う。そして、このテキストデータに含まれる用語のうち、統合データベース15の「誤り用語」に書き込まれている用語がある場合には、これを「正式用語」に書き込まれている用語に置換する。このようにして得られた置換後のテキストデータを、置換履歴データとともに置換結果表示部21へと出力する。
【0061】
置換結果表示部21は、置換部20から出力された置換後のテキストデータおよび置換履歴データを表示する。図9は抽出部18から置換部20に入力された置換前のテキストデータ、図10は置換部20によって置換された置換後のテキストデータ、図11は置換部20によって作成された置換履歴データの一例をそれぞれ示すものである。
【0062】
置換前のテキストデータとしては、図9に示すように「お問合わせの件。当社的には、表日本に在住される外人の加入者を対象に製品紹介を行う予定です。」であったものが、置換部20が統合データベース15を参照し、不適切用語を適切用語に置換したことにより、図10に示すように「お問い合わせの件。当社といたしましては、太平洋側に在住される外国人の顧客を対象に製品紹介を行う予定です。」となる。更に図11に示すような置換履歴データを参照することによって、どの箇所がどのように置換されたのかを確認できるようにしている。
【0063】
写真・ロゴ判定部22は、抽出部18から、写真データおよびロゴデータがそのALTデータとともに出力されると、それを一覧表示部24へと出力する。また、写真・ロゴ判定部22は、出力されたALTデータと、統合データベース15のALTデータとの突き合わせを行う。例えば、抽出部18から出力されたALTデータが「CC」の場合、このロゴは、レコード番号RID=1のロゴであると認識する。図7に示すように、レコード番号RID=1のロゴは、公開開始日が2003年1月6日であり、公開終了日が2003年12月31日である。
【0064】
これに基づいて、ALTデータ「CC」に該当するロゴデータが掲載可能であるか否かを判定する。また、図8のモノ属性1に示すように、レコード番号RID=1のロゴの大きさは120×240ピクセルである。したがって、抽出部18から出力されたロゴの大きさと比較することにより、このロゴが正しい大きさで表示されているか否かを判定する。更に、図8のモノ属性2に示すように、レコード番号RID=1のロゴのデータのサイズは1055バイトである。したがって、抽出部18から出力されたロゴのデータのサイズと比較することにより、このロゴが正しいデータサイズで表示されているか否かを判定する。更にまた、図7のモノ名2に示すように、レコード番号RID=1のロゴのデータ名は、××.gifである。したがって、このデータを開き、抽出部18から出力されたロゴと比較することにより、このロゴが正しいデザインで表示されているか否かを判定する。
【0065】
写真データについても、上述したようなロゴデータの判定方法と同様にして契約期間を遵守しているか否か、定められたサイズで表示されているか、定められたデザインで表示されているかを判定するようにしている。
【0066】
そして、ロゴデータ、写真データいずれの場合であっても判定結果を判定結果表示部26へ出力する。
【0067】
一覧表示部24は、置換部20から、写真データおよびロゴデータがそのALTデータとともに出力されると、それを例えば図12に示すように一覧表示する。図12では、写真およびロゴの画像データを表示し、そのデータ名、およびそのALTデータを一覧表示したフォーマットの一例を示している。
【0068】
判定結果表示部26は、写真・ロゴ判定部22から判定結果が出力されると、この出力された判定結果を表示する。図13は、このような判定結果の一例を示す図である。
【0069】
図13における1)は、Web文書に正しい画像データが表示されていることを示す判定結果である。すなわち、ALTデータが「CC」である写真またはロゴの画像データは、大きさ、データ名、サイズともに統合データベース15に書き込まれた値と一致しており、判定日である2003年3月3日現在で、公開が許可されている。
【0070】
一方、図13における2)は、Web文書に、公開期間を過ぎた画像データが表示されていることを示す判定結果である。すなわち、ALTデータが「BB」であるWeb文書に用いられた写真またはロゴの画像データは、大きさ、データ名、サイズともに統合データベース15に書き込まれた値に一致しているものの、公開終了日が2002年12月31日であり、判定日である2003年3月3日現在、公開が許可されていない。
【0071】
また、図13における3)は、Web文書に、正しくない(不正な)画像データが表示されていることを示す判定結果である。すなわち、ALTデータが「GG」であるWeb文書に用いられた写真またはロゴの画像データは、大きさおよびデータのサイズが統合データベース15に書き込まれた値と異なっている。
【0072】
したがって、図13に例示するような判定結果を参照するWeb文書に用いられた写真またはロゴが、公開が許可されたものであるか否か、また不許可の場合どのような理由で不許可であるのかを、認識できるようにしている。
【0073】
次に、以上のように構成した本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の動作について説明する。
【0074】
本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置を用いてWeb文書の診断を行う場合には、先ず、例えば図7および図8に示すような統合データベース15を作成する必要がある。統合データベース15に書き込まれるデータを提供する元データベースとしては、例えば不適切用語データベース10、規定文書データベース11、企業内用語データベース12、写真データベース13、およびロゴデータベース14等がある。各々のデータベースの詳細については、既に述べたとおりである。
【0075】
このようにして統合データベース15を作成すると、次に図14および図15のフローチャートに示すように動作する。
【0076】
すなわち、先ず、入力受付部16へ、公開前のWeb文書のデータ、すなわち診断されるWeb文書のデータが入力される(S1)。Web文書には、テキストデータや、静止画像データ、動画データ、あるいは音声データなどが含まれている。入力されたWeb文書のデータは、入力受付部16から更に抽出部18へと出力される(S2)。
【0077】
抽出部18では、入力受付部16から出力されたWeb文書のデータからテキストデータと、写真データおよびロゴデータとがそれぞれ抽出される(S3)。そして、テキストデータは置換部20へと、写真データおよびロゴデータは、それに付されたALTデータとともに写真・ロゴ判定部22へとそれぞれ出力される(S4)。
【0078】
置換部20では、抽出部18から出力されたテキストデータに含まれる用語と、統合データベース15との突き合わせが行われる(S5)。そして、このテキストデータに含まれる用語のうち、統合データベース15の「誤り用語」に書き込まれている用語がある場合(S6:Yes)には、「正式用語」に書き込まれている用語に置換される(S7)。このようにして得られた置換後のテキストデータは、置換履歴データとともに置換結果表示部21へと出力される(S8)。統合データベース15の「誤り用語」に書き込まれている用語がない場合(S6:No)には処理を終了する。
【0079】
そして、置換結果表示部21では、置換部20から出力された置換後のテキストデータおよび置換履歴データが、図10および図11にその一例を示すように表示される(S9)。
【0080】
一方、ステップS4において抽出部18から写真・ロゴ判定部22へとそのALTデータとともに出力された写真データおよびロゴデータは、さらに写真・ロゴ判定部22から一覧表示部24へと出力される(S10)。
【0081】
そして一覧表示部24からは、例えば図12に示すように写真およびロゴの画像データが表示され、さらにそのデータ名、およびそのALTデータが一覧表示される(S11)。
【0082】
また、写真・ロゴ判定部22では、抽出部18から出力された写真データおよびロゴデータについて、同じALTデータを有する統合データベース15内のデータがチェックされる。
【0083】
具体的には、まず、抽出部18から出力された写真データおよびロゴデータの画像データに付されたALTデータと同じALTデータが統合データベース15から検索される(S12)。次に、統合データベース15から、該当するレコード番号RIDの公開開始日と公開終了日に基づいて、この画像データが公開可能であるか否かが判定される(S13)。公開可能である場合(S13:Yes)には、更に、この画像データのファイル名が統合データベース15のモノ名2に書き込まれているファイル名と一致しているか、この画像データのサイズが統合データベース15のモノ属性1に書き込まれているサイズと一致しているか、この画像データの大きさが統合データベース15のモノ属性2に書き込まれている大きさと一致しているかが比較される(S14)。そして、全てが一致する場合(S15:Yes)には、抽出部18から出力された写真データおよびロゴデータには、公開許可されたデータであると判定され処理を終了する(S16)。この判定結果は、例えば図13に示すように判定結果表示部26から表示される。
【0084】
一方、公開可能ではないと判定された場合(S13:No)、あるいはファイル名、サイズ、および大きさのうち何れかが一致しない場合(S15:No)には、抽出部18から出力された写真データおよびロゴデータには、公開が許可されていないデータが使用されているものと判定される(S17)。この判定結果もまた、例えば図13に示すように判定結果表示部26から表示される。
【0085】
したがって、図13に例示するような判定結果を参照するWeb文書に用いられた写真またはロゴが、公開が許可されたものであるか否か、また不許可の場合どのような理由で不許可であるのかを、容易に認識することができる。
【0086】
上述したように、本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置においては、上記のような作用により、Web文書に用いられている用語を、管理者による人間系の診断に代えて自動的に診断することができる。
【0087】
これによって、不適切用語や、公開許可日を過ぎた、あるいは不正なデザインの写真およびロゴの表示を阻止することができ、Web文書の品質の向上を図ることのみならず、契約の遵守、ホームページ開設者のイメージの護持等を図ることが可能となる。また、従来、不適切な用語を掲載したことによって受けてきたクレームの低減化を図ることも可能となる。
【0088】
また、この診断は、社内規定、コンプライアンス、社会ルール等を反映して行うことができるので、従来、管理者によってなされていたものと同レベルの観点から行うことができる。しかも、自動的に行うことにより、人間系による診断とは異なり、診断結果の精度がバラついたりすることはない。診断すべきWeb文書の量が多い場合であっても、自動化のメリットによって管理者の負担の増大をもたらすことはない。
【0089】
また、チェック項目が変更になった場合、あるいはチェック項目が増えた場合であっても、統合データベース15の内容をそれに応じて書き換えることによって容易に対応することができる。
【0090】
更に、診断結果を出力することができるので、どの箇所がどのように診断されたかを把握することができる。これによって、必要に応じて管理者判断を加味することも可能となる。
【0091】
以上、本発明の好適な実施の形態について、添付図面を参照しながら説明したが、本発明はかかる構成に限定されない。特許請求の範囲の発明された技術的思想の範疇において、当業者であれば、各種の変更例及び修正例に想到し得るものであり、それら変更例及び修正例についても本発明の技術的範囲に属するものと了解される。
【0092】
【発明の効果】
以上説明したように、本発明のWeb文書診断装置およびWeb文書診断方法によれば、Web文書に用いられている用語を、社内規定、コンプライアンス、社会ルール等の観点から自動的にチェックすることができる。
【0093】
以上により、用語のチェック作業の効率化およびチェック精度の均一化を図ることが可能となる。
【0094】
また、Web文書に掲載されている写真やロゴを自動的に抽出し、内容に関するチェック作業の合理化を図ることが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の一例を示す機能ブロック図。
【図2】不適切用語データベースの一例を示すデータ構成図。
【図3】規定文書データベースの一例を示すデータ構成図。
【図4】写真データベースの一例を示すデータ構成図。
【図5】ALTデータが表示されたWeb画面の一例を示す模式図。
【図6】ロゴデータベースの一例を示すデータ構成図。
【図7】統合データベースの一例を示すデータ構成図。
【図8】統合データベースの一例を示すデータ構成図。
【図9】置換前のテキストデータの一例を示す図。
【図10】置換後のテキストデータの一例を示す図。
【図11】置換履歴データの一例を示す図。
【図12】一覧表示データの一例を示す図。
【図13】写真・ロゴ判定部によってなされた判定結果の表示例を示す図。
【図14】同実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の動作を示すフローチャート。
【図15】同実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の動作を示すフローチャート。
【符号の説明】
10…不適切用語データベース、11…規定文書データベース、12…企業内用語データベース、13…写真データベース、14…ロゴデータベース、15…統合データベース、16…入力受付部、18…抽出部、20…置換部、21…置換結果表示部、22…写真・ロゴ判定部、24…一覧表示部、26…判定結果表示部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an apparatus and a method for diagnosing a Web document published via the Internet, and more particularly, to replacing an inappropriate term contained in the Web document with an appropriate term and including the term in the Web document. The present invention relates to a Web document diagnosis apparatus and a Web document diagnosis method for diagnosing whether a photograph and a logo are posted according to a predetermined agreement such as a contract.
[0002]
[Prior art]
At present, homepages that can be browsed through a Web browser connected to the Internet are opened by many companies, organizations, individuals, and the like, both public and private.
[0003]
Such a homepage is composed of Web documents created by various forms of data such as text data, still image data, moving image data, and audio data. It is used for various purposes such as commercials, public relations, image enhancement, information provision, services, and business to the general public.
[0004]
Thus, it is no exaggeration to say that a homepage is the face of a homepage creator such as a company, an organization, or an individual.
[0005]
Therefore, when opening or updating a homepage, it is necessary to create the homepage with great care until it reaches every word in the Web document. Particularly in companies, the necessity of judging and checking whether or not the data conforms to the rules in the company is increasing from the viewpoint of compliance.
[0006]
In the unlikely event that inappropriate or misleading terms are used in Web documents, not only will the website owner's image be significantly impaired, but in the case of companies and businesses, the business will be immediately adversely affected. There is also a risk that it will be affected.
[0007]
In addition, a company may have rules defined in the company regarding disclosure to the outside, such as internal terms. For example, even if the products are the same, the names are different for each company, or terms used for customers correspond to this. Therefore, a Web document must use terms that comply with these prescribed rules.
[0008]
In recent years, corporate integration has frequently been performed, but since the terms conventionally used by corporate integration may be changed to different terms, this rule is fluid. When the rule is changed, it is necessary to immediately change the term used in the Web document to a new term.
[0009]
On the other hand, when a homepage is opened for commercialization of a product or service, a photograph of a talent contracted for a campaign of the product or service is often posted on the homepage. Usually, such a contract includes a term of use such as a photograph of a talent in a contract clause. In addition, photos of talents who have not contracted create problems in processing intellectual property rights such as copyrights and publicity rights. In the case of television or radio commercials, the commercials will not be aired after the contract expires, preventing the use of photos or talent names whose contracts have expired.
[0010]
However, once the homepage is opened, it remains openable unless the opening side voluntarily removes it. For this reason, even if a photograph whose usage period has expired is posted, the photographer does not notice it and displays it as it is, which poses a risk of violating the contract. Posting photos that have expired in the contract may result in having to pay a penalty.
[0011]
In addition, logos of company names and product names may be described on the website, but since the logos are often used as trademarks, the design is ruled so that it is used consistently in the company There are cases.
[0012]
As described above, when a homepage is opened or updated, not only is it necessary to create the word in the Web document with full care until it reaches the word and phrase, but also once created, Even so, it is necessary to check that the posted photos and logos comply with the permitted use period and display method.
[0013]
Conventionally, such a check is performed by a human system operation by a homepage administrator. In other words, when the homepage is established or updated, the homepage administrator not only keeps up-to-date internal regulations and internal glossaries, but also creates an inappropriate glossary that summarizes inappropriate terms in advance. In addition, by checking all the terms used in the Web document posted on the homepage one by one against these, it is possible to eliminate inappropriate terms and replace them with appropriate terms. I have.
[0014]
In addition, for photos and logos, all photos and logos posted on the website are regularly checked to see if they are within the scope of the contract or comply with company rules. And logos only.
[0015]
[Problems to be solved by the invention]
However, such a conventional Web document checking method has the following problems.
[0016]
That is, the home page is usually composed of a large number of pages linked in a hierarchical structure, and the web documents, photos, and logos contained therein are extremely large.
[0017]
Moreover, as noted above, terms defined by company regulations are in flux. In addition, the period during which the posting of the talent photo is permitted is also predetermined. Regarding the logo, the period during which the publication is permitted, the display size, the color, and the like are determined in advance if the logo is a product name logo.
[0018]
When rules such as company rules are changed, it is necessary to immediately change the terms used in the Web document to new terms. Recently, internal regulations are frequently changed due to corporate integration and the like. New rules may be added and check items may increase. It is necessary to ensure that talent photos are not published beyond the period of use. It is necessary to check that the logo is correctly displayed not only for the period of use but also for its display size and color.
[0019]
Under such a condition that check items can be changed in a fluid manner, it is not very efficient for humans to match many check items against an extremely large number of terms, photos and logos. There is.
[0020]
Even if such a task is shared by a plurality of persons, there is a possibility that the accuracy and level of the check may vary.
[0021]
The present invention has been made in view of such circumstances, and a first object of the present invention is to automatically check terms used in Web documents from the viewpoint of internal rules, compliance, social rules, and the like. An object of the present invention is to provide a Web document diagnosis apparatus and a Web document diagnosis method capable of improving the efficiency of term checking work and uniforming the checking accuracy.
[0022]
A second object of the present invention is to provide a Web document diagnosis apparatus and a Web document diagnosis method capable of automatically extracting a photograph or a logo posted on the Web document and streamlining a check operation on the contents. It is in.
[0023]
[Means for Solving the Problems]
In order to achieve the first and second objects, the present invention takes the following measures.
[0024]
That is, the Web document diagnosis method according to the first aspect of the present invention compares a term included in a public Web document with a term database that defines a predetermined inappropriate term and an appropriate term corresponding to the term. A replacement step of extracting inappropriate words included in the document, replacing the extracted inappropriate words with an appropriate term corresponding to the inappropriate words defined in the term database, and an extracting step of extracting a photograph and a logo included in the Web document. It has.
[0025]
Therefore, in the Web document diagnosis method according to the first aspect of the present invention, by taking the above-described means, even if the Web document contains an inappropriate term, it can be extracted and replaced with an appropriate term. . As described above, since the Web document can be automatically diagnosed, not only the burden on the administrator who has conventionally checked the Web document can be reduced, but also the unsuitable term can be surely detected with uniform accuracy. It can be replaced with an appropriate term, and the reliability of the Web document can be improved.
[0026]
In addition, since all the photos and logos used in the Web document can be extracted, it is possible to grasp the photos and logos whose usage period, specifications, and the like should be checked.
[0027]
According to a second aspect of the present invention, in the web document diagnostic method according to the first aspect of the present invention, the photograph extracted in the extraction stage is stored in a photograph database in which a photograph permitted to be used for the Web document and a use permission condition are written. By performing the comparison, it is determined whether or not the photograph is permitted to be used for the Web document. Further, the logo extracted in the extraction stage is compared with a logo permitted to be used in the Web document and a logo database in which the use permission condition is written, so that the logo is permitted to be used in the Web document. It is determined whether or not.
[0028]
Therefore, in the Web document diagnosis method according to the second aspect of the present invention, by taking the above measures, it can be determined whether or not the photograph and the logo are permitted to be used for the Web document. It will be possible to prevent the posting of photos and logos that are not allowed to be used.
[0029]
The Web document diagnosis method according to the third aspect of the present invention includes a term included in a Web document for publication by comparing a term included in a Web document for publication with a term database defining a predetermined inappropriate term and an appropriate term corresponding thereto. An inappropriate term to be extracted is extracted, and the extracted inappropriate term is replaced with an appropriate term for the inappropriate term defined in the term database. In addition, ALT data of a photograph and a logo included in the Web document and having predetermined ALT data attached thereto are extracted. Then, by referring to the photograph database in which the photograph permitted to be used for the Web document, the ALT data of the photograph, and the photograph use permit condition are written, the photograph use permit condition corresponding to the extracted ALT data is determined. Then, based on the use permission condition, it is determined whether or not the photo corresponding to the ALT data is a photo permitted to be used for a Web document. Further, by referring to a logo database in which logos permitted to be used for Web documents, logo ALT data, and logo use permission conditions are written, the logo use permission conditions corresponding to the extracted ALT data are determined. Then, based on the use permission condition, it is determined whether the logo corresponding to the ALT data is a logo permitted to be used for a Web document.
[0030]
Therefore, in the Web document diagnosis method according to the third aspect of the present invention, by taking the above measures, the photograph and the logo are identified based on the ALT data attached to the photograph and the logo, and the identified photograph and logo are It can be determined whether or not use is permitted.
[0031]
The Web document diagnosis apparatus according to the fourth aspect of the present invention can publish using a Web document instead of an unsuitable term that is determined in advance to be inappropriate for use in a Web document and an inappropriate term. Is provided with a term database that defines appropriate terms that have been determined in advance. Further, extracting means for extracting terms, pictures and logos from a public Web document, and extracting inappropriate terms from the terms extracted by the extracting means based on the term database, and converting the extracted inappropriate terms into appropriate terms The image processing apparatus includes a replacing means for replacing, and a list displaying means for displaying a list of pictures and logos extracted by the extracting means.
[0032]
Therefore, in the Web document diagnosis apparatus according to the fourth aspect of the invention, by taking the above-described means, even if the Web document contains an inappropriate term, it can be extracted and replaced with an appropriate term. . As described above, since the Web document can be automatically diagnosed, not only the burden on the administrator who has conventionally checked the Web document can be reduced, but also the unsuitable term can be surely detected with uniform accuracy. It can be replaced with an appropriate term, and the reliability of the Web document can be improved.
[0033]
In addition, since all the photos and logos included in the Web document can be displayed in a list, it is possible to easily grasp which photos and logos are used.
[0034]
According to a fifth aspect of the present invention, there is provided the web document diagnostic apparatus according to the fourth aspect of the present invention, wherein a photograph permitted to be used for a Web document and a photograph database in which conditions for permitting use of the photograph are written, and a use permitted for the Web document. A logo database in which the logos and usage permission conditions thereof are written, a photograph determination means for determining whether or not the photograph extracted by the extraction means is a photo satisfying the usage permission conditions written in the photo database; Logo determination means for determining whether the logo extracted by the means satisfies the use permission condition written in the logo database.
[0035]
Therefore, in the Web document diagnostic apparatus according to the fifth aspect of the present invention, by taking the above measures, it is determined whether or not the photograph is permitted to be used for the Web document by referring to the photograph database. This makes it possible to prevent the posting of photos that do not satisfy the license conditions. Also, by referring to the logo database, it is possible to prevent the posting of logos that do not satisfy the use permission conditions.
[0036]
The Web document diagnosis apparatus according to the sixth aspect of the present invention can publish using a Web document instead of an inappropriate term and an inappropriate term that is determined to be inappropriate for use in a Web document. Is provided with a term database that defines appropriate terms that have been determined in advance. Further, extraction means for extracting ALT data of a photograph to which a term and predetermined ALT data are attached and ALT data of a logo to which the predetermined ALT data is attached from a public Web document, and a term database. Replacement means for extracting inappropriate terms from the terms extracted by the extraction means based on the extracted terms and replacing the extracted inappropriate terms with appropriate terms. Further, a photograph database in which a photograph permitted to be used for a Web document, ALT data of the photograph, and conditions for permitting use of the photograph are written, a logo permitted to be used for the Web document, ALT data of a logo, and a logo. It has a logo database in which the license conditions are written. Furthermore, by referring to the photo database, the usage permission condition of the photo corresponding to the ALT data extracted by the extraction means is grasped, and the photo corresponding to the ALT data is converted to a Web document based on the usage permission condition. By referring to the photo determination means for determining whether or not the photo is a photo permitted to be used and the logo database, the use permission condition of the logo corresponding to the ALT data extracted by the extraction means is grasped. Logo determination means is provided for determining whether the logo corresponding to the ALT data is a logo permitted to be used for a Web document based on the permission condition.
[0037]
Therefore, in the Web document diagnostic apparatus according to the sixth aspect of the present invention, by taking the above measures, the photograph and the logo are identified based on the ALT data attached to the photograph and the logo, and the identified photograph and the logo are identified. It is possible to determine whether or not it is usable.
[0038]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0039]
An embodiment of the present invention will be described with reference to FIGS.
[0040]
FIG. 1 is a functional block diagram showing an example of a Web document diagnosis apparatus to which a Web document diagnosis method according to an embodiment of the present invention is applied.
[0041]
That is, the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention is applied includes an
[0042]
The
[0043]
The
[0044]
The
[0045]
The in-
[0046]
For example, as shown in FIG. 4, the
[0047]
As shown in FIG. 6, for example, the
[0048]
As shown in FIGS. 7 and 8, for example, the
[0049]
In the diagnostic classification data, the detailed classification is performed in the order of
[0050]
Similarly, new items can be appropriately added to the value data and the attribute data if necessary.
[0051]
As described above, since the
[0052]
In the example shown in FIG. 7, record numbers RID = 1 to 7 write data relating to the use of a logo as shown in
[0053]
Further, the record number RID = 1 relates to the company logo as written in the
[0054]
Record numbers RID = 8 to 13 write data on company-wide risk management as shown in
[0055]
Record numbers RID = 14 to 30 write data relating to notification of goods and services as shown in
[0056]
Record numbers RID14 to RID17 in which the
[0057]
For record numbers RID = 29 to 30 in which the
[0058]
The
[0059]
The
[0060]
When the text data is output from the
[0061]
The replacement
[0062]
As shown in Fig. 9, the text data before replacement was "Inquiries. We plan to introduce products to foreign subscribers living in Japan." When the
[0063]
When the photograph data and the logo data are output together with the ALT data from the
[0064]
Based on this, it is determined whether or not logo data corresponding to the ALT data “CC” can be posted. As shown in the
[0065]
In the same manner as the logo data determination method described above, it is determined whether or not the photograph data is in compliance with the contract period, is displayed in a predetermined size, or is displayed in a predetermined design. Like that.
[0066]
The determination result is output to the determination
[0067]
When the photo data and the logo data are output together with the ALT data from the replacing
[0068]
When the determination result is output from the photograph /
[0069]
1) in FIG. 13 is a determination result indicating that correct image data is displayed on the Web document. That is, the image data of the picture or logo whose ALT data is “CC” matches the values written in the
[0070]
On the other hand, 2) in FIG. 13 is a determination result indicating that image data after the disclosure period is displayed on the Web document. That is, the image data of the photograph or logo used for the Web document whose ALT data is “BB” has the same size, data name, and size as the values written in the
[0071]
13) shows a determination result indicating that incorrect (incorrect) image data is displayed in the Web document. That is, the size and the size of the image data of the photograph or the logo used for the Web document whose ALT data is “GG” are different from the values written in the
[0072]
Therefore, whether the photograph or logo used in the Web document referring to the determination result as illustrated in FIG. 13 is permitted to be disclosed or not, and in the case of non-permission, for whatever reason, We make it possible to recognize if there is.
[0073]
Next, an operation of the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention configured as described above is applied will be described.
[0074]
When diagnosing a Web document using a Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention is applied, first, for example, an
[0075]
When the
[0076]
That is, first, data of a Web document before disclosure, that is, data of a Web document to be diagnosed, is input to the input receiving unit 16 (S1). The Web document includes text data, still image data, moving image data, audio data, and the like. The input Web document data is further output from the
[0077]
The
[0078]
In the
[0079]
Then, the replacement
[0080]
On the other hand, the photo data and the logo data output together with the ALT data from the
[0081]
Then, from the
[0082]
Further, the photo /
[0083]
Specifically, first, the same ALT data as the ALT data added to the image data of the photograph data and the logo data output from the
[0084]
On the other hand, if it is determined that it is not possible to publish (S13: No), or if any of the file name, size, and size do not match (S15: No), the photograph output from the
[0085]
Therefore, whether the photograph or logo used in the Web document referring to the determination result as illustrated in FIG. 13 is permitted to be disclosed or not, and in the case of non-permission, for whatever reason, It can be easily recognized that there is.
[0086]
As described above, in the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention is applied, the term used in the Web document is changed by the administrator into a human system by the above operation. Diagnosis can be made automatically instead of diagnosis.
[0087]
This will prevent the display of improper terminology, photos and logos that have passed the permission date or that have been improperly designed, not only to improve the quality of Web documents, but also to comply with contracts, It becomes possible to protect the image of the establisher. In addition, it is possible to reduce the number of claims that have conventionally been received due to posting inappropriate terms.
[0088]
In addition, since this diagnosis can be performed by reflecting in-house rules, compliance, social rules, and the like, it can be performed from the same level of viewpoint as that conventionally performed by an administrator. In addition, since the diagnosis is performed automatically, the accuracy of the diagnosis result does not vary unlike the diagnosis based on the human system. Even when the number of Web documents to be diagnosed is large, the burden of the administrator does not increase due to the advantage of automation.
[0089]
Further, even when the check items are changed or the number of check items is increased, the contents of the
[0090]
Further, since a diagnosis result can be output, it is possible to grasp which part has been diagnosed and how. This makes it possible to take into account the manager's judgment as needed.
[0091]
Although the preferred embodiments of the present invention have been described with reference to the accompanying drawings, the present invention is not limited to such configurations. Within the scope of the invented technical concept of the claims, those skilled in the art will be able to conceive various changes and modifications, and those changes and modifications will be described in the technical scope of the present invention. It is understood that it belongs to.
[0092]
【The invention's effect】
As described above, according to the Web document diagnosis apparatus and the Web document diagnosis method of the present invention, it is possible to automatically check terms used in a Web document from the viewpoint of company rules, compliance, social rules, and the like. it can.
[0093]
As described above, it is possible to improve the efficiency of the term check operation and the uniformity of the check accuracy.
[0094]
In addition, it is possible to automatically extract a photograph or a logo posted on a Web document, and to streamline a check operation on the contents.
[Brief description of the drawings]
FIG. 1 is a functional block diagram showing an example of a Web document diagnosis apparatus to which a Web document diagnosis method according to an embodiment of the present invention is applied.
FIG. 2 is a data configuration diagram showing an example of an inappropriate term database.
FIG. 3 is a data configuration diagram showing an example of a prescribed document database.
FIG. 4 is a data configuration diagram showing an example of a photo database.
FIG. 5 is a schematic diagram showing an example of a Web screen on which ALT data is displayed.
FIG. 6 is a data configuration diagram showing an example of a logo database.
FIG. 7 is a data configuration diagram showing an example of an integrated database.
FIG. 8 is a data configuration diagram showing an example of an integrated database.
FIG. 9 is a diagram showing an example of text data before replacement.
FIG. 10 is a view showing an example of text data after replacement.
FIG. 11 is a diagram showing an example of replacement history data.
FIG. 12 is a diagram showing an example of list display data.
FIG. 13 is a diagram illustrating a display example of a determination result made by a photograph / logo determination unit.
FIG. 14 is a flowchart showing the operation of the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment is applied.
FIG. 15 is a flowchart showing the operation of the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment is applied.
[Explanation of symbols]
10: Unsuitable term database, 11: Standard document database, 12: Corporate term database, 13: Photo database, 14: Logo database, 15: Integrated database, 16: Input receiving unit, 18: Extracting unit, 20: Substituting unit , 21: Replacement result display section, 22: Photo / logo determination section, 24: List display section, 26: Determination result display section
Claims (6)
前記Web文書に含まれる写真およびロゴを抽出する抽出段階と
を備えたWeb文書診断方法。By comparing the terms included in the public Web document with a term database that defines predetermined inappropriate terms and appropriate terms corresponding thereto, the inappropriate terms included in the Web document are extracted and extracted. Replacing the inappropriate term with an appropriate term for the inappropriate term defined in the term database;
Extracting a photograph and a logo included in the Web document.
前記抽出段階において抽出された写真を、前記Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと比較することによって、前記Web文書への使用が許可された写真であるか否かを判定する写真判定段階と、
前記抽出段階において抽出されたロゴを、前記Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと比較することによって、前記Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定段階と
を備えたWeb文書診断方法。The Web document diagnosis method according to claim 1,
The photograph extracted in the extracting step is compared with the photograph permitted to be used for the Web document and the photograph database in which the use permission condition is written, so that the photograph permitted to be used for the Web document is compared with the photograph. A photograph determination step of determining whether or not there is,
By comparing the logo extracted in the extracting step with a logo database in which logos permitted to be used for the Web document and the conditions for using the logo are written, the logos permitted to be used in the Web document are compared. A logo determination step of determining whether or not there is a web document diagnosis method.
前記Web文書に含まれ、予め定められたALTデータがおのおの付された写真およびロゴのALTデータを抽出する抽出段階と
前記Web文書への使用が許可される写真、前記写真のALTデータ、および前記写真の使用許可条件が書き込まれた写真データベースを参照することによって、前記抽出段階において抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、前記Web文書への使用が許可された写真であるか否かを判定する写真判定段階と、
前記Web文書への使用が許可されるロゴ、前記ロゴのALTデータ、および前記ロゴの使用許可条件が書き込まれたロゴデータベースを参照することによって、前記抽出段階において抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、前記Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定段階と
を備えたWeb文書診断方法。By comparing the terms included in the public Web document with a term database that defines predetermined inappropriate terms and appropriate terms corresponding thereto, the inappropriate terms included in the Web document are extracted and extracted. Replacing the inappropriate term with an appropriate term for the inappropriate term defined in the term database;
An extracting step of extracting ALT data of a photograph and a logo included in the Web document and having predetermined ALT data attached thereto, a photograph permitted to be used in the Web document, ALT data of the photograph, and By referring to the photo database in which the usage permission condition of the photo is written, the usage permission condition of the photo corresponding to the ALT data extracted in the extraction step is grasped, and the ALT data corresponding to the ALT data is determined based on the usage permission condition. A photo determination step of determining whether the photo to be performed is a photo permitted to be used for the Web document;
The logo corresponding to the ALT data extracted in the extracting step is referred to by referring to the logo permitted to be used for the Web document, the ALT data of the logo, and the logo database in which the licensing conditions of the logo are written. And a logo judging step of judging whether the logo corresponding to the ALT data is a logo permitted to be used for the Web document based on the use permission condition. Web document diagnosis method.
公開用のWeb文書から用語と、写真およびロゴとを抽出する抽出手段と、
前記用語データベースに基づいて、前記抽出手段によって抽出された用語から前記不適切用語を抽出し、前記抽出した不適切用語を前記適切用語に置き換える置換手段と、
前記抽出手段によって抽出された写真およびロゴを一覧表示する一覧表示手段と
を備えたWeb文書診断装置。An unsuitable term determined in advance to be inappropriate for use in a Web document and an appropriate term determined in advance to be disclosed in the Web document in place of the unsuitable term A defined term database,
Extracting means for extracting terms, photos and logos from a Web document for publication,
Based on the term database, to extract the inappropriate terms from the terms extracted by the extraction means, replacement means to replace the extracted inappropriate terms with the appropriate terms,
A web document diagnostic apparatus comprising: a list display unit for displaying a list of photos and logos extracted by the extraction unit.
前記Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと、
前記Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと、
前記抽出手段によって抽出された写真が、前記写真データベースに書き込まれた使用許可条件を満足する写真であるか否かを判定する写真判定手段と、
前記抽出手段によって抽出されたロゴが、前記ロゴデータベースに書き込まれた使用許可条件を満足するロゴであるか否かを判定するロゴ判定手段と
を備えたWeb文書診断装置。The web document diagnostic device according to claim 4,
A photograph database in which photos permitted to be used for the Web document and conditions for using the photos are written;
A logo database in which logos permitted to be used for the Web document and conditions for using the logos are written;
A photo determination unit that determines whether the photo extracted by the extraction unit is a photo that satisfies the usage permission condition written in the photo database,
A web document diagnostic apparatus comprising: a logo determination unit configured to determine whether a logo extracted by the extraction unit satisfies a use permission condition written in the logo database.
公開用のWeb文書から用語と、予め定められたALTデータが付された写真のALTデータと、予め定められたALTデータが付されたロゴのALTデータとを抽出する抽出手段と、
前記用語データベースに基づいて、前記抽出手段によって抽出された用語から前記不適切用語を抽出し、前記抽出した不適切用語を前記適切用語に置き換える置換手段と、
前記Web文書への使用が許可される写真、前記写真のALTデータ、および前記写真の使用許可条件が書き込まれた写真データベースと、
前記Web文書への使用が許可されるロゴ、前記ロゴのALTデータ、および前記ロゴの使用許可条件が書き込まれたロゴデータベースと、
前記写真データベースを参照することによって、前記抽出手段によって抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、前記Web文書への使用が許可された写真であるか否かを判定する写真判定手段と、
前記ロゴデータベースを参照することによって、前記抽出手段によって抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、前記Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定手段と
を備えたWeb文書診断装置。An unsuitable term determined in advance to be inappropriate for use in a Web document and an appropriate term determined in advance to be disclosed in the Web document in place of the unsuitable term A defined term database,
Extracting means for extracting a term, ALT data of a photograph to which predetermined ALT data is attached, and ALT data of a logo to which predetermined ALT data is attached, from a public Web document;
Based on the term database, to extract the inappropriate terms from the terms extracted by the extraction means, replacement means to replace the extracted inappropriate terms with the appropriate terms,
A photograph database in which a photograph permitted to be used for the Web document, ALT data of the photograph, and conditions for permitting use of the photograph are written;
A logo database in which logos permitted to be used for the Web document, ALT data of the logo, and conditions for permitting use of the logo are written;
By referring to the photo database, the use permission condition of the photograph corresponding to the ALT data extracted by the extraction means is grasped, and the photograph corresponding to the ALT data is stored in the Web document based on the use permission condition. A photo determining means for determining whether or not the photo is a photo permitted to be used;
By referring to the logo database, the use permission condition of the logo corresponding to the ALT data extracted by the extraction means is grasped, and the logo corresponding to the ALT data is transferred to the Web document based on the use permission condition. A web document diagnostic apparatus comprising: a logo determination unit that determines whether the logo is a logo permitted to be used.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003070936A JP2004280472A (en) | 2003-03-14 | 2003-03-14 | Web document diagnostic device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003070936A JP2004280472A (en) | 2003-03-14 | 2003-03-14 | Web document diagnostic device and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004280472A true JP2004280472A (en) | 2004-10-07 |
Family
ID=33287547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003070936A Pending JP2004280472A (en) | 2003-03-14 | 2003-03-14 | Web document diagnostic device and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004280472A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009534776A (en) * | 2006-02-15 | 2009-09-24 | マイクロソフト コーポレーション | Generate ads with context images |
JP2011008622A (en) * | 2009-06-26 | 2011-01-13 | Fujitsu Ltd | Display test device, display test program, and display test method |
JP2016122458A (en) * | 2016-02-04 | 2016-07-07 | キヤノンマーケティングジャパン株式会社 | Information processing device, information processing system, control method of information processing system, and computer program |
WO2024018595A1 (en) * | 2022-07-21 | 2024-01-25 | 日本電信電話株式会社 | Questionnaire explanatory text checking device, questionnaire explanatory text checking method, and program |
-
2003
- 2003-03-14 JP JP2003070936A patent/JP2004280472A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009534776A (en) * | 2006-02-15 | 2009-09-24 | マイクロソフト コーポレーション | Generate ads with context images |
US8417568B2 (en) | 2006-02-15 | 2013-04-09 | Microsoft Corporation | Generation of contextual image-containing advertisements |
JP2011008622A (en) * | 2009-06-26 | 2011-01-13 | Fujitsu Ltd | Display test device, display test program, and display test method |
JP2016122458A (en) * | 2016-02-04 | 2016-07-07 | キヤノンマーケティングジャパン株式会社 | Information processing device, information processing system, control method of information processing system, and computer program |
WO2024018595A1 (en) * | 2022-07-21 | 2024-01-25 | 日本電信電話株式会社 | Questionnaire explanatory text checking device, questionnaire explanatory text checking method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10977614B2 (en) | Point of scan/copy redaction | |
US10114821B2 (en) | Method and system to access to electronic business documents | |
US9355255B1 (en) | System and method of facilitating compliance with information sharing regulations | |
US20130036348A1 (en) | Systems and Methods for Identifying a Standard Document Component in a Community and Generating a Document Containing the Standard Document Component | |
US8949241B2 (en) | Systems and methods for interactive disambiguation of data | |
US20140317758A1 (en) | Focused personal identifying information redaction | |
US20070038437A1 (en) | Document anonymization apparatus and method | |
US20090030754A1 (en) | Methods, systems and computer software utilizing xbrl to identify, capture, array, manage, transmit and display documents and data in litigation preparation, trial and regulatory filings and regulatory compliance | |
US8793574B2 (en) | Methods and systems for identification and transcription of individual ancestral records and family | |
US11250149B2 (en) | Article management system | |
US20180232493A1 (en) | Case-level review tool for physicians | |
JP5735403B2 (en) | Document management device | |
JP2009271573A (en) | Information processing system, information processor, information processing method, and program | |
US20020173975A1 (en) | Litigation management | |
CA2997461A1 (en) | Dynamic de-identification of healthcare data | |
US8131546B1 (en) | System and method for adaptive sentence boundary disambiguation | |
JP2004280472A (en) | Web document diagnostic device and method | |
RU2549515C2 (en) | Method of identifying personal data of open sources of unstructured information | |
US20060053105A1 (en) | Method for information retrieval | |
US8838543B2 (en) | Archiving system that facilitates systematic cataloguing of archived documents for searching and management | |
JP2007299093A (en) | Document management system | |
Heurix et al. | Recognition and pseudonymisation of medical records for secondary use | |
CN111753537A (en) | Divorce dispute referee document label extraction method and device | |
Anish et al. | Towards enhanced accountability in complying with Healthcare regulations | |
JP7331404B2 (en) | Document management device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070808 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070911 |