JP2004280472A - Web document diagnostic device and method - Google Patents

Web document diagnostic device and method Download PDF

Info

Publication number
JP2004280472A
JP2004280472A JP2003070936A JP2003070936A JP2004280472A JP 2004280472 A JP2004280472 A JP 2004280472A JP 2003070936 A JP2003070936 A JP 2003070936A JP 2003070936 A JP2003070936 A JP 2003070936A JP 2004280472 A JP2004280472 A JP 2004280472A
Authority
JP
Japan
Prior art keywords
web document
logo
database
term
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003070936A
Other languages
Japanese (ja)
Inventor
Atsushi Sakuma
敦 佐久間
Rei Iwata
麗 岩田
Hidekazu Kurita
英和 栗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003070936A priority Critical patent/JP2004280472A/en
Publication of JP2004280472A publication Critical patent/JP2004280472A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve efficiency in checking work of terminology and achieve homogenization of checking accuracy by automatically checking terminology used in a Web document from viewpoints of company regulations, compliance, social rules, etc. <P>SOLUTION: The Web document diagnostic device comprises an integrated database 15 that defines inappropriate terms beforehand as inappropriate to be used in a Web document and opened publicly, and defines appropriate terms as appropriate to be used in a Web document and opened publicly in place of the inappropriate terms. The device also comprises an extraction part 18 that extracts terms, pictures and logos from a Web document to be opened publicly; a substitution part 20 that extracts inappropriate terms from the terms extracted by the extraction part 18 based on the integrated database 15, and substitutes appropriate terms for the extracted inappropriate terms; and a list display part 24 that lists the photographs and logos extracted by the extraction part 18. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、インターネットを介して公開されるWeb文書を診断する装置および方法に係り、更に詳しくは、Web文書に含まれている不適切用語を適切用語に置き換えるとともに、Web文書に含まれている写真およびロゴが契約など所定の取り決め通りに掲載されているかを診断するWeb文書診断装置およびWeb文書診断方法に関する。
【0002】
【従来の技術】
現在、インターネットに接続されたWebブラウザを介して閲覧可能なホームページが、官民を問わず多くの企業や団体、あるいは個人等によって開設されている。
【0003】
このようなホームページは、テキストデータや、静止画像データ、動画データ、音声データなど様々な形態のデータによって作成されたWeb文書からなっている。そして、一般公衆に対するコマーシャル、PR、イメージ向上、情報提供、サービス、ビジネス等といった様々なことに利用されている。
【0004】
このようにホームページは、企業や団体、あるいは個人等といったホームページ開設者の顔と言っても過言ではない。
【0005】
したがって、ホームページを開設する場合、あるいは更新する場合には、Web文書に記載されている用語の一語一句に及ぶまで万全の注意を払って作成する必要がある。特に、企業においては、企業内ルールに適合しているかどうかの判断やチェックの必要性がコンプライアンスの観点で高まっている。
【0006】
万が一、Web文書に不適切な用語や、誤解を招くような用語が使用された場合には、ホームページ開設者のイメージが著しく損なわれるのみならず、企業や事業者の場合、ビジネスに即悪影響を及ぼしてしまう恐れもある。
【0007】
また、企業には、社内用語等、社外公開に関して企業内で規定されたルールが存在する場合がある。例えば、同じ商品であっても、企業毎にその呼び名が異なる場合や、顧客向けに使用する用語等がこれに該当する。したがって、Web文書では、これら規定されたルールに則った用語を使用しなくてはならない。
【0008】
なお、近年、企業統合が頻繁に行われているが、企業統合によって従来使用していた用語が別の用語に変更になる場合もあるために、このルールは流動的なものである。ルールが変更になった場合には、Web文書に用いられている用語についても、即刻新しい用語に変更する必要がある。
【0009】
一方、商品やサービスのコマーシャルのためにホームページを開設した場合には、該商品やサービスのキャンペーンのために契約したタレントの写真をホームページに掲載する場合がよくある。通常、このような契約は、タレントの写真等の使用期間が契約条項に含まれている。また、契約していないタレントの写真は、著作権やパブリシティ権といった知的財産権処理の問題を発生させる。テレビやラジオのコマーシャルの場合だと、契約期間が過ぎてしまうとそのコマーシャルは放映されなくなるので、契約期間が過ぎた写真やタレントの名前を利用することは未然に防止される。
【0010】
しかしながら、ホームページは、一旦開設すると、開設側で自主的に撤去しなければ表示可能になったままの状態が保たれる。このため、使用期間が過ぎた写真が掲載されていてもそれに気がつかず、そのまま表示されてしまい、契約違反を犯してしまう危険性をはらんでいる。契約で定められた使用期間を過ぎた写真をそのまま掲載していると、ペナルティを支払わねばならないことに発展する可能性がある。
【0011】
また、社名や商品名のロゴ等がホームページに記載される場合があるが、そのロゴは商標として使用されていることが多いため、そのデザインは社内で統一して使われるようルール化されている場合がある。
【0012】
このように、ホームページを開設する場合、あるいは更新する場合には、Web文書に記載されている用語の一語一句に及ぶまで万全の注意を払って作成することのみならず、一旦作成した後であっても、掲載した写真やロゴについては、その掲載が許可された使用期間や表示方法を遵守していることをチェックする必要がある。
【0013】
従来、このようなチェックは、ホームページの管理者による人間系作業によって行われている。つまり、ホームページの開設や更新が行われると、ホームページ管理者は、最新の社内規定集あるいは社内用語集を常に備えておくことはもちろん、不適切な用語をまとめた不適切用語集を予め作成しておき、ホームページに掲載されているWeb文書に用いられている全ての用語を、これらと逐一突き合わせてチェックすることによって、不適切な用語を駆除するとともに、適切な用語への置き換え作業がなされている。
【0014】
また、写真やロゴについては、ホームページに掲載されている全ての写真やロゴについて、それが契約範囲内のものであるか、或いは社内ルールに従っているかが定期的にチェックされ、契約やルール上正しい写真やロゴのみが掲載されるようになされている。
【0015】
【発明が解決しようとする課題】
しかしながら、このような従来のWeb文書のチェック方法では、以下のような問題がある。
【0016】
すなわち、ホームページは、通常、階層構造状にリンクの張られた多数のページからなっており、それに含まれるWeb文書、写真、およびロゴは極めて膨大なものとなる。
【0017】
その上、上述したように、社内規定によって規定された用語は流動的である。また、タレントの写真の掲載が許可されている期間についても予め定められている。ロゴについても、特に商品名ロゴであれば掲載が許可されている期間、表示サイズ、色等が予め定められている。
【0018】
社内規定等のルールが変更になった場合には、Web文書に用いられている用語についても、即刻新しい用語に変更する必要がある。最近は、企業統合等によって、社内規定の変更が頻繁になされている。新たな規定が追加され、チェック項目が増加する場合もある。タレントの写真については、使用期間を越えて掲載されることがないようにする必要がある。ロゴについても、使用期間はもちろん、その表示サイズ、色等についても正しく表示されていることをチェックする必要がある。
【0019】
このように流動的にチェック項目の変わりうる条件の下で、極めて膨大な用語、写真、およびロゴに対し、多くのチェック項目について逐一人間が突き合わせ作業を行うことは、甚だ効率的ではないという問題がある。
【0020】
仮にこのような作業を複数の人間で分担して行ったとしても、チェックの精度やレベルにバラツキが生じてしまう可能性がある。
【0021】
本発明はこのような事情に鑑みてなされたものであり、その第1の目的は、Web文書に用いられている用語を、社内規定、コンプライアンス、社会ルール等の観点から自動的にチェックし、用語のチェック作業の効率化およびチェック精度の均一化を図ることが可能なWeb文書診断装置およびWeb文書診断方法を提供することにある。
【0022】
また、その第2の目的は、Web文書に掲載されている写真やロゴを自動的に抽出し、内容に関するチェック作業の合理化を図ることが可能なWeb文書診断装置およびWeb文書診断方法を提供することにある。
【0023】
【課題を解決するための手段】
上記第1および第2の目的を達成するために、本発明では、以下のような手段を講じる。
【0024】
すなわち、請求項1の発明のWeb文書診断方法は、公開用のWeb文書に含まれる用語を、予め定めた不適切用語とそれに対する適切用語とを定義した用語データベースと比較することによって、Web文書に含まれる不適切用語を抽出し、抽出した不適切用語を、用語データベースで定義された該不適切用語に対する適切用語に置き換える置換段階と、Web文書に含まれる写真およびロゴを抽出する抽出段階とを備えている。
【0025】
従って、請求項1の発明のWeb文書診断方法においては、以上のような手段を講じることにより、Web文書に不適切用語が含まれていても、それを抽出し、適切用語に置き換えることができる。このように、Web文書を自動的に診断することができるので、従来Web文書のチェックを行っていた管理者の負担を低減することができるのみならず、均一な精度で確実に不適切用語を適切用語に置き換えることができ、Web文書の信頼性を高めることが可能となる。
【0026】
また、Web文書に用いられている写真やロゴを全て抽出することができるので、使用期間や仕様等をチェックすべき写真やロゴを把握することができる。
【0027】
請求項2の発明は、請求項1の発明のWeb文書診断方法において、抽出段階において抽出された写真を、Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと比較することによって、Web文書への使用が許可された写真であるか否かを判定する。また、抽出段階において抽出されたロゴを、Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと比較することによって、Web文書への使用が許可されたロゴであるか否かを判定する。
【0028】
従って、請求項2の発明のWeb文書診断方法においては、以上のような手段を講じることにより、Web文書への使用が許可された写真、およびロゴであるか否かを判定することができ、使用が許可されていない写真、およびロゴの掲載を阻止することが可能となる。
【0029】
請求項3の発明のWeb文書診断方法は、公開用のWeb文書に含まれる用語を、予め定めた不適切用語とそれに対する適切用語とを定義した用語データベースと比較することによって、Web文書に含まれる不適切用語を抽出し、抽出した不適切用語を、用語データベースで定義された該不適切用語に対する適切用語に置き換える。また、Web文書に含まれ、予め定められたALTデータがおのおの付された写真およびロゴのALTデータを抽出する。そして、Web文書への使用が許可される写真、写真のALTデータ、および写真の使用許可条件が書き込まれた写真データベースを参照することによって、抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、Web文書への使用が許可された写真であるか否かを判定する。更に、Web文書への使用が許可されるロゴ、ロゴのALTデータ、およびロゴの使用許可条件が書き込まれたロゴデータベースを参照することによって、抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、Web文書への使用が許可されたロゴであるか否かを判定する。
【0030】
従って、請求項3の発明のWeb文書診断方法においては、以上のような手段を講じることにより、写真およびロゴに付されたALTデータに基づいて写真およびロゴを識別し、識別した写真およびロゴが使用が許可されたものであるか否かを判定することができる。
【0031】
請求項4の発明のWeb文書診断装置は、Web文書に用いて公開することが不適切であると予め定めた不適切用語と、不適切用語の代わりにWeb文書に用いて公開することが可能であると予め定めた適切用語とを定義した用語データベースを備えている。また、公開用のWeb文書から用語と写真およびロゴとを抽出する抽出手段と、用語データベースに基づいて抽出手段によって抽出された用語から不適切用語を抽出し、抽出した不適切用語を適切用語に置き換える置換手段と、抽出手段によって抽出された写真およびロゴを一覧表示する一覧表示手段とを備えている。
【0032】
従って、請求項4の発明のWeb文書診断装置においては、以上のような手段を講じることにより、Web文書に不適切用語が含まれていても、それを抽出し、適切用語に置き換えることができる。このように、Web文書を自動的に診断することができるので、従来Web文書のチェックを行っていた管理者の負担を低減することができるのみならず、均一な精度で確実に不適切用語を適切用語に置き換えることができ、Web文書の信頼性を高めることが可能となる。
【0033】
また、Web文書に含まれる全ての写真およびロゴを一覧表示することができるので、どの写真やロゴが使用されているかを容易に把握することが可能となる。
【0034】
請求項5の発明は、請求項4の発明のWeb文書診断装置において、Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと、Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと、抽出手段によって抽出された写真が写真データベースに書き込まれた使用許可条件を満足する写真であるか否かを判定する写真判定手段と、抽出手段によって抽出されたロゴがロゴデータベースに書き込まれた使用許可条件を満足するロゴであるか否かを判定するロゴ判定手段とを備えている。
【0035】
従って、請求項5の発明のWeb文書診断装置においては、以上のような手段を講じることにより、写真データベースを参照することによってWeb文書への使用が許可された写真であるか否かを判定することができ、使用許可条件を満たさない写真の掲載を阻止することが可能となる。また、ロゴデータベースを参照することによって、使用許可条件を満たさないロゴの掲載を阻止することが可能となる。
【0036】
請求項6の発明のWeb文書診断装置は、Web文書に用いて公開することが不適切であると予め定めた不適切用語と、不適切用語の代わりにWeb文書に用いて公開することが可能であると予め定めた適切用語とを定義した用語データベースを備えている。また、公開用のWeb文書から用語と予め定められたALTデータが付された写真のALTデータと予め定められたALTデータが付されたロゴのALTデータとを抽出する抽出手段と、用語データベースに基づいて抽出手段によって抽出された用語から不適切用語を抽出し抽出した不適切用語を適切用語に置き換える置換手段とを備えている。更に、Web文書への使用が許可される写真、写真のALTデータ、および写真の使用許可条件が書き込まれた写真データベースと、Web文書への使用が許可されるロゴ、ロゴのALTデータ、およびロゴの使用許可条件が書き込まれたロゴデータベースを備えている。更にまた、写真データベースを参照することによって、抽出手段によって抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、Web文書への使用が許可された写真であるか否かを判定する写真判定手段と、ロゴデータベースを参照することによって、抽出手段によって抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定手段とを備えている。
【0037】
従って、請求項6の発明のWeb文書診断装置においては、以上のような手段を講じることにより、写真およびロゴに付されたALTデータに基づいて写真およびロゴを識別し、識別した写真およびロゴが使用可能なものであるか否かを判定することが可能となる。
【0038】
【発明の実施の形態】
以下に、本発明の実施の形態について図面を参照しながら説明する。
【0039】
本発明の実施の形態を図1から図15を用いて説明する。
【0040】
図1は、本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の一例を示す機能ブロック図である。
【0041】
すなわち、本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置は、不適切用語データベース10と、規定文書データベース11と、企業内用語データベース12と、写真データベース13と、ロゴデータベース14と、統合データベース15と、入力受付部16と、抽出部18と、置換部20と、置換結果表示部21と、写真・ロゴ判定部22と、一覧表示部24と、判定結果表示部26とを備えている。
【0042】
不適切用語データベース10は、Web文書に用いて公開することが不適切であると予め定めた不適切用語と、不適切用語の代わりにWeb文書に用いて公開することが適切であると予め定めた適切用語との対応関係を書き込んだデータベースである。不適切用語データベース10は、例えば図2に示すように、不適切用語とそれに対する適切用語とを一対一で記録したテーブル構成のデータベースである。
【0043】
規定文書データベース11は、Web文章に含まれるテキストデータの記載ルールや表示ルールについての規定を書き込んだデータベースであり、不適切用語データベースと同様に、例えば図3に示すように、不適切表現とそれに対する適切表現とを一対一で記録したテーブル構成のデータベースである。
【0044】
不適切用語データベース10は、社会一般に広く規定されているものであるのに対し、規定文書データベース11は、企業レベルで規定されたものである。社会一般に広く規定されるルールと、企業レベルで規定されるルールとは、ルールが改訂される頻度が異なるので、このように別のデータベースに分けている。
【0045】
企業内用語データベース12は、企業内で使用されている用語、例えば商品名、プロジェクト名、正式会社名、社内組織名、事業所名、代表者氏名等を書き込んだデータベースである。
【0046】
写真データベース13は、例えば図4に示すように、Web文書に貼り付けて公開することが可能な写真データ、写真データ名、サイズ、大きさ、作成日、更新日、写真のALTデータ、および写真の公開可能開始日/終了日、関連サイト等を書き込んだデータベースである。なお、ALTデータとは、図5に示すように、Webブラウザ上でマウスを用いて写真データをポイントした場合に表示されるコメントのことである。Web文書に写真データを貼り付ける場合に、写真データを識別するための必要な情報を予めALTデータaとして書き込んでおく。これによって、Webブラウザ上に写真データが表示された場合、その写真データをマウスでポイントすることによってALTデータaが表示されるようにしている。
【0047】
ロゴデータベース14は、例えば図6に示すように、Web文書に貼り付けて公開することが可能なロゴデータ、ロゴデータ名、サイズ、大きさ、作成日、更新日、ロゴのALTデータ、およびロゴの公開可能開始日/終了日、関連サイト等を書き込んだデータベースである。
【0048】
統合データベース15は、例えば図7および図8に示すように、不適切用語データベース10と、規定文書データベース11と、企業内用語データベース12と、写真データベース13と、ロゴデータベース14とをすべて統合したデータベースである。図7および図8に示す例では、シリアルに付されたレコード番号RIDに対して、診断分類1、診断分類2、および診断分類3からなる診断分類と、ヒト名1、ヒト名2、誤り用語、正式用語、モノ名1、モノ名2、ALTデータ、公開開始日、および公開終了日からなる値データと、ヒト属性1、ヒト属性2、ヒト属性3、モノ属性1、モノ属性2、モノ属性3、カネ属性1、カネ属性2、およびカネ属性3からなる属性データとを書き込んでいる。本来、図7と図8とをあわせて1つの統合データベース15を構成しているが、ここでは、紙面の都合もあり、1つの統合データベース15を図7と図8とに分図して示している。
【0049】
診断分類データでは、診断分類1、診断分類2、診断分類3の順に細かな分類になっている。すなわち、診断分類1には、各データが使用される項目を書き込んでいる。診断分類2には、診断分類1を更に具体化した項目を書き込み、診断分類3には、診断分類2を更に具体化した項目を書き込んできる。なお、図7では、診断分類データとして診断分類3までしか記載していないが、診断分類データは、項目を固定していないので、必要な場合には診断分類4、診断分類5、・・・のように適宜項目を増やせるようにしている。
【0050】
値データおよび属性データについても同様に、必要な場合には新たな項目を適宜増やせるようにしている。
【0051】
このように、統合データベース15は、項目を固定していないので、将来的に新たな項目のデータを取り扱う必要性が生じた場合であっても、新たな項目のデータを柔軟に取り込むことによって対応可能としている。
【0052】
図7に示す例において、レコード番号RID=1〜7は、診断分類1に示すようにロゴの使用に関するデータを書き込んでいる。これらは、ロゴデータベース14に書き込まれたデータを転記したものであって、診断分類2において、社名ロゴ管理に係るものか、商品管理に係るものか、タレント・商標管理に係るものかを書き込んでいる。現時点でこれ以上の診断分類は必要ないので診断分類3には何も書き込んではいない。
【0053】
更に、レコード番号RID=1はヒト名1に書き込まれているように企業ロゴに関するものであって、ロゴのデータ名はモノ名2に書き込まれているように××.gifであり、ALTデータは「CC」であり、掲載開始日は2003年1月6日であり、掲載終了日は2003年12月31日であり、データの大きさはモノ属性1に書き込まれているように120×240ピクセルである。また、データのサイズは、モノ属性2に書き込まれているように1055バイトである。
【0054】
レコード番号RID=8〜13は、診断分類1に示すように全社リスクマネジメントに関するデータを書き込んでおり、更に診断分類2に示すように用語管理および差別用語管理に関するデータを書き込んでいる。これらは、不適切用語データベース10や規定文書データベース11に書き込まれたデータを転記したものであって、「値データ」の「誤り用語」欄に不適切用語を、「正式用語」欄に適切用語をそれぞれ書き込んでいる。
【0055】
レコード番号RID=14〜30は、診断分類1に示すように商品・サービスの告知に関するデータを書き込んでおり、更に診断分類2に示すように採用情報管理、企業情報、募集文書管理、およびリンク管理に係るデータを書き込んでいる。
【0056】
診断分類2が採用情報管理であるレコード番号RID14〜17は、正式用語として「採用」、「募集」、および「お問い合わせ」を書き込んでいる。また、診断分類2が企業情報であるレコード番号RID18〜28は、診断分類3として会社名、資本金、代表者名(社長名)、従業員数、業務、職種、給与、諸手当、勤務地、休日・休暇、制度を書き込んでいる。更に、それらに対応する細分類データを値データおよび属性データにそれぞれ書き込んでいる。これら採用情報管理および企業情報は、企業内用語データベース12に書き込まれたデータを転記したものである。
【0057】
診断分類2がリンク情報であるレコード番号RID=29〜30は、診断分類3に契約事項および個人情報を書き込んでおり、更にモノ名1としてリンク先のURLを書き込んでいる。
【0058】
入力受付部16は、公開前のWeb文書のデータの入力を受け付ける。Web文書は、テキストデータや、静止画像データ、動画データ、あるいは音声データなどからなっている。入力受付部16は、このようなWeb文書のデータが入力されると、入力されたWeb文書のデータを抽出部18へと出力する。
【0059】
抽出部18は、入力受付部16から出力されたWeb文書のデータからテキストデータを抽出し、抽出したテキストデータを置換部20へと出力する。また、入力受付部16から出力されたWeb文書のデータから写真データおよびロゴデータを、それに付されたALTデータとともに抽出する。そして、抽出した写真データおよびロゴデータを、そのALTデータとともに写真・ロゴ判定部22へと出力する。
【0060】
置換部20は、抽出部18からテキストデータが出力されると、このテキストデータに含まれる用語と、統合データベース15との突き合わせを行う。そして、このテキストデータに含まれる用語のうち、統合データベース15の「誤り用語」に書き込まれている用語がある場合には、これを「正式用語」に書き込まれている用語に置換する。このようにして得られた置換後のテキストデータを、置換履歴データとともに置換結果表示部21へと出力する。
【0061】
置換結果表示部21は、置換部20から出力された置換後のテキストデータおよび置換履歴データを表示する。図9は抽出部18から置換部20に入力された置換前のテキストデータ、図10は置換部20によって置換された置換後のテキストデータ、図11は置換部20によって作成された置換履歴データの一例をそれぞれ示すものである。
【0062】
置換前のテキストデータとしては、図9に示すように「お問合わせの件。当社的には、表日本に在住される外人の加入者を対象に製品紹介を行う予定です。」であったものが、置換部20が統合データベース15を参照し、不適切用語を適切用語に置換したことにより、図10に示すように「お問い合わせの件。当社といたしましては、太平洋側に在住される外国人の顧客を対象に製品紹介を行う予定です。」となる。更に図11に示すような置換履歴データを参照することによって、どの箇所がどのように置換されたのかを確認できるようにしている。
【0063】
写真・ロゴ判定部22は、抽出部18から、写真データおよびロゴデータがそのALTデータとともに出力されると、それを一覧表示部24へと出力する。また、写真・ロゴ判定部22は、出力されたALTデータと、統合データベース15のALTデータとの突き合わせを行う。例えば、抽出部18から出力されたALTデータが「CC」の場合、このロゴは、レコード番号RID=1のロゴであると認識する。図7に示すように、レコード番号RID=1のロゴは、公開開始日が2003年1月6日であり、公開終了日が2003年12月31日である。
【0064】
これに基づいて、ALTデータ「CC」に該当するロゴデータが掲載可能であるか否かを判定する。また、図8のモノ属性1に示すように、レコード番号RID=1のロゴの大きさは120×240ピクセルである。したがって、抽出部18から出力されたロゴの大きさと比較することにより、このロゴが正しい大きさで表示されているか否かを判定する。更に、図8のモノ属性2に示すように、レコード番号RID=1のロゴのデータのサイズは1055バイトである。したがって、抽出部18から出力されたロゴのデータのサイズと比較することにより、このロゴが正しいデータサイズで表示されているか否かを判定する。更にまた、図7のモノ名2に示すように、レコード番号RID=1のロゴのデータ名は、××.gifである。したがって、このデータを開き、抽出部18から出力されたロゴと比較することにより、このロゴが正しいデザインで表示されているか否かを判定する。
【0065】
写真データについても、上述したようなロゴデータの判定方法と同様にして契約期間を遵守しているか否か、定められたサイズで表示されているか、定められたデザインで表示されているかを判定するようにしている。
【0066】
そして、ロゴデータ、写真データいずれの場合であっても判定結果を判定結果表示部26へ出力する。
【0067】
一覧表示部24は、置換部20から、写真データおよびロゴデータがそのALTデータとともに出力されると、それを例えば図12に示すように一覧表示する。図12では、写真およびロゴの画像データを表示し、そのデータ名、およびそのALTデータを一覧表示したフォーマットの一例を示している。
【0068】
判定結果表示部26は、写真・ロゴ判定部22から判定結果が出力されると、この出力された判定結果を表示する。図13は、このような判定結果の一例を示す図である。
【0069】
図13における1)は、Web文書に正しい画像データが表示されていることを示す判定結果である。すなわち、ALTデータが「CC」である写真またはロゴの画像データは、大きさ、データ名、サイズともに統合データベース15に書き込まれた値と一致しており、判定日である2003年3月3日現在で、公開が許可されている。
【0070】
一方、図13における2)は、Web文書に、公開期間を過ぎた画像データが表示されていることを示す判定結果である。すなわち、ALTデータが「BB」であるWeb文書に用いられた写真またはロゴの画像データは、大きさ、データ名、サイズともに統合データベース15に書き込まれた値に一致しているものの、公開終了日が2002年12月31日であり、判定日である2003年3月3日現在、公開が許可されていない。
【0071】
また、図13における3)は、Web文書に、正しくない(不正な)画像データが表示されていることを示す判定結果である。すなわち、ALTデータが「GG」であるWeb文書に用いられた写真またはロゴの画像データは、大きさおよびデータのサイズが統合データベース15に書き込まれた値と異なっている。
【0072】
したがって、図13に例示するような判定結果を参照するWeb文書に用いられた写真またはロゴが、公開が許可されたものであるか否か、また不許可の場合どのような理由で不許可であるのかを、認識できるようにしている。
【0073】
次に、以上のように構成した本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の動作について説明する。
【0074】
本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置を用いてWeb文書の診断を行う場合には、先ず、例えば図7および図8に示すような統合データベース15を作成する必要がある。統合データベース15に書き込まれるデータを提供する元データベースとしては、例えば不適切用語データベース10、規定文書データベース11、企業内用語データベース12、写真データベース13、およびロゴデータベース14等がある。各々のデータベースの詳細については、既に述べたとおりである。
【0075】
このようにして統合データベース15を作成すると、次に図14および図15のフローチャートに示すように動作する。
【0076】
すなわち、先ず、入力受付部16へ、公開前のWeb文書のデータ、すなわち診断されるWeb文書のデータが入力される(S1)。Web文書には、テキストデータや、静止画像データ、動画データ、あるいは音声データなどが含まれている。入力されたWeb文書のデータは、入力受付部16から更に抽出部18へと出力される(S2)。
【0077】
抽出部18では、入力受付部16から出力されたWeb文書のデータからテキストデータと、写真データおよびロゴデータとがそれぞれ抽出される(S3)。そして、テキストデータは置換部20へと、写真データおよびロゴデータは、それに付されたALTデータとともに写真・ロゴ判定部22へとそれぞれ出力される(S4)。
【0078】
置換部20では、抽出部18から出力されたテキストデータに含まれる用語と、統合データベース15との突き合わせが行われる(S5)。そして、このテキストデータに含まれる用語のうち、統合データベース15の「誤り用語」に書き込まれている用語がある場合(S6:Yes)には、「正式用語」に書き込まれている用語に置換される(S7)。このようにして得られた置換後のテキストデータは、置換履歴データとともに置換結果表示部21へと出力される(S8)。統合データベース15の「誤り用語」に書き込まれている用語がない場合(S6:No)には処理を終了する。
【0079】
そして、置換結果表示部21では、置換部20から出力された置換後のテキストデータおよび置換履歴データが、図10および図11にその一例を示すように表示される(S9)。
【0080】
一方、ステップS4において抽出部18から写真・ロゴ判定部22へとそのALTデータとともに出力された写真データおよびロゴデータは、さらに写真・ロゴ判定部22から一覧表示部24へと出力される(S10)。
【0081】
そして一覧表示部24からは、例えば図12に示すように写真およびロゴの画像データが表示され、さらにそのデータ名、およびそのALTデータが一覧表示される(S11)。
【0082】
また、写真・ロゴ判定部22では、抽出部18から出力された写真データおよびロゴデータについて、同じALTデータを有する統合データベース15内のデータがチェックされる。
【0083】
具体的には、まず、抽出部18から出力された写真データおよびロゴデータの画像データに付されたALTデータと同じALTデータが統合データベース15から検索される(S12)。次に、統合データベース15から、該当するレコード番号RIDの公開開始日と公開終了日に基づいて、この画像データが公開可能であるか否かが判定される(S13)。公開可能である場合(S13:Yes)には、更に、この画像データのファイル名が統合データベース15のモノ名2に書き込まれているファイル名と一致しているか、この画像データのサイズが統合データベース15のモノ属性1に書き込まれているサイズと一致しているか、この画像データの大きさが統合データベース15のモノ属性2に書き込まれている大きさと一致しているかが比較される(S14)。そして、全てが一致する場合(S15:Yes)には、抽出部18から出力された写真データおよびロゴデータには、公開許可されたデータであると判定され処理を終了する(S16)。この判定結果は、例えば図13に示すように判定結果表示部26から表示される。
【0084】
一方、公開可能ではないと判定された場合(S13:No)、あるいはファイル名、サイズ、および大きさのうち何れかが一致しない場合(S15:No)には、抽出部18から出力された写真データおよびロゴデータには、公開が許可されていないデータが使用されているものと判定される(S17)。この判定結果もまた、例えば図13に示すように判定結果表示部26から表示される。
【0085】
したがって、図13に例示するような判定結果を参照するWeb文書に用いられた写真またはロゴが、公開が許可されたものであるか否か、また不許可の場合どのような理由で不許可であるのかを、容易に認識することができる。
【0086】
上述したように、本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置においては、上記のような作用により、Web文書に用いられている用語を、管理者による人間系の診断に代えて自動的に診断することができる。
【0087】
これによって、不適切用語や、公開許可日を過ぎた、あるいは不正なデザインの写真およびロゴの表示を阻止することができ、Web文書の品質の向上を図ることのみならず、契約の遵守、ホームページ開設者のイメージの護持等を図ることが可能となる。また、従来、不適切な用語を掲載したことによって受けてきたクレームの低減化を図ることも可能となる。
【0088】
また、この診断は、社内規定、コンプライアンス、社会ルール等を反映して行うことができるので、従来、管理者によってなされていたものと同レベルの観点から行うことができる。しかも、自動的に行うことにより、人間系による診断とは異なり、診断結果の精度がバラついたりすることはない。診断すべきWeb文書の量が多い場合であっても、自動化のメリットによって管理者の負担の増大をもたらすことはない。
【0089】
また、チェック項目が変更になった場合、あるいはチェック項目が増えた場合であっても、統合データベース15の内容をそれに応じて書き換えることによって容易に対応することができる。
【0090】
更に、診断結果を出力することができるので、どの箇所がどのように診断されたかを把握することができる。これによって、必要に応じて管理者判断を加味することも可能となる。
【0091】
以上、本発明の好適な実施の形態について、添付図面を参照しながら説明したが、本発明はかかる構成に限定されない。特許請求の範囲の発明された技術的思想の範疇において、当業者であれば、各種の変更例及び修正例に想到し得るものであり、それら変更例及び修正例についても本発明の技術的範囲に属するものと了解される。
【0092】
【発明の効果】
以上説明したように、本発明のWeb文書診断装置およびWeb文書診断方法によれば、Web文書に用いられている用語を、社内規定、コンプライアンス、社会ルール等の観点から自動的にチェックすることができる。
【0093】
以上により、用語のチェック作業の効率化およびチェック精度の均一化を図ることが可能となる。
【0094】
また、Web文書に掲載されている写真やロゴを自動的に抽出し、内容に関するチェック作業の合理化を図ることが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の一例を示す機能ブロック図。
【図2】不適切用語データベースの一例を示すデータ構成図。
【図3】規定文書データベースの一例を示すデータ構成図。
【図4】写真データベースの一例を示すデータ構成図。
【図5】ALTデータが表示されたWeb画面の一例を示す模式図。
【図6】ロゴデータベースの一例を示すデータ構成図。
【図7】統合データベースの一例を示すデータ構成図。
【図8】統合データベースの一例を示すデータ構成図。
【図9】置換前のテキストデータの一例を示す図。
【図10】置換後のテキストデータの一例を示す図。
【図11】置換履歴データの一例を示す図。
【図12】一覧表示データの一例を示す図。
【図13】写真・ロゴ判定部によってなされた判定結果の表示例を示す図。
【図14】同実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の動作を示すフローチャート。
【図15】同実施の形態に係るWeb文書診断方法を適用したWeb文書診断装置の動作を示すフローチャート。
【符号の説明】
10…不適切用語データベース、11…規定文書データベース、12…企業内用語データベース、13…写真データベース、14…ロゴデータベース、15…統合データベース、16…入力受付部、18…抽出部、20…置換部、21…置換結果表示部、22…写真・ロゴ判定部、24…一覧表示部、26…判定結果表示部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an apparatus and a method for diagnosing a Web document published via the Internet, and more particularly, to replacing an inappropriate term contained in the Web document with an appropriate term and including the term in the Web document. The present invention relates to a Web document diagnosis apparatus and a Web document diagnosis method for diagnosing whether a photograph and a logo are posted according to a predetermined agreement such as a contract.
[0002]
[Prior art]
At present, homepages that can be browsed through a Web browser connected to the Internet are opened by many companies, organizations, individuals, and the like, both public and private.
[0003]
Such a homepage is composed of Web documents created by various forms of data such as text data, still image data, moving image data, and audio data. It is used for various purposes such as commercials, public relations, image enhancement, information provision, services, and business to the general public.
[0004]
Thus, it is no exaggeration to say that a homepage is the face of a homepage creator such as a company, an organization, or an individual.
[0005]
Therefore, when opening or updating a homepage, it is necessary to create the homepage with great care until it reaches every word in the Web document. Particularly in companies, the necessity of judging and checking whether or not the data conforms to the rules in the company is increasing from the viewpoint of compliance.
[0006]
In the unlikely event that inappropriate or misleading terms are used in Web documents, not only will the website owner's image be significantly impaired, but in the case of companies and businesses, the business will be immediately adversely affected. There is also a risk that it will be affected.
[0007]
In addition, a company may have rules defined in the company regarding disclosure to the outside, such as internal terms. For example, even if the products are the same, the names are different for each company, or terms used for customers correspond to this. Therefore, a Web document must use terms that comply with these prescribed rules.
[0008]
In recent years, corporate integration has frequently been performed, but since the terms conventionally used by corporate integration may be changed to different terms, this rule is fluid. When the rule is changed, it is necessary to immediately change the term used in the Web document to a new term.
[0009]
On the other hand, when a homepage is opened for commercialization of a product or service, a photograph of a talent contracted for a campaign of the product or service is often posted on the homepage. Usually, such a contract includes a term of use such as a photograph of a talent in a contract clause. In addition, photos of talents who have not contracted create problems in processing intellectual property rights such as copyrights and publicity rights. In the case of television or radio commercials, the commercials will not be aired after the contract expires, preventing the use of photos or talent names whose contracts have expired.
[0010]
However, once the homepage is opened, it remains openable unless the opening side voluntarily removes it. For this reason, even if a photograph whose usage period has expired is posted, the photographer does not notice it and displays it as it is, which poses a risk of violating the contract. Posting photos that have expired in the contract may result in having to pay a penalty.
[0011]
In addition, logos of company names and product names may be described on the website, but since the logos are often used as trademarks, the design is ruled so that it is used consistently in the company There are cases.
[0012]
As described above, when a homepage is opened or updated, not only is it necessary to create the word in the Web document with full care until it reaches the word and phrase, but also once created, Even so, it is necessary to check that the posted photos and logos comply with the permitted use period and display method.
[0013]
Conventionally, such a check is performed by a human system operation by a homepage administrator. In other words, when the homepage is established or updated, the homepage administrator not only keeps up-to-date internal regulations and internal glossaries, but also creates an inappropriate glossary that summarizes inappropriate terms in advance. In addition, by checking all the terms used in the Web document posted on the homepage one by one against these, it is possible to eliminate inappropriate terms and replace them with appropriate terms. I have.
[0014]
In addition, for photos and logos, all photos and logos posted on the website are regularly checked to see if they are within the scope of the contract or comply with company rules. And logos only.
[0015]
[Problems to be solved by the invention]
However, such a conventional Web document checking method has the following problems.
[0016]
That is, the home page is usually composed of a large number of pages linked in a hierarchical structure, and the web documents, photos, and logos contained therein are extremely large.
[0017]
Moreover, as noted above, terms defined by company regulations are in flux. In addition, the period during which the posting of the talent photo is permitted is also predetermined. Regarding the logo, the period during which the publication is permitted, the display size, the color, and the like are determined in advance if the logo is a product name logo.
[0018]
When rules such as company rules are changed, it is necessary to immediately change the terms used in the Web document to new terms. Recently, internal regulations are frequently changed due to corporate integration and the like. New rules may be added and check items may increase. It is necessary to ensure that talent photos are not published beyond the period of use. It is necessary to check that the logo is correctly displayed not only for the period of use but also for its display size and color.
[0019]
Under such a condition that check items can be changed in a fluid manner, it is not very efficient for humans to match many check items against an extremely large number of terms, photos and logos. There is.
[0020]
Even if such a task is shared by a plurality of persons, there is a possibility that the accuracy and level of the check may vary.
[0021]
The present invention has been made in view of such circumstances, and a first object of the present invention is to automatically check terms used in Web documents from the viewpoint of internal rules, compliance, social rules, and the like. An object of the present invention is to provide a Web document diagnosis apparatus and a Web document diagnosis method capable of improving the efficiency of term checking work and uniforming the checking accuracy.
[0022]
A second object of the present invention is to provide a Web document diagnosis apparatus and a Web document diagnosis method capable of automatically extracting a photograph or a logo posted on the Web document and streamlining a check operation on the contents. It is in.
[0023]
[Means for Solving the Problems]
In order to achieve the first and second objects, the present invention takes the following measures.
[0024]
That is, the Web document diagnosis method according to the first aspect of the present invention compares a term included in a public Web document with a term database that defines a predetermined inappropriate term and an appropriate term corresponding to the term. A replacement step of extracting inappropriate words included in the document, replacing the extracted inappropriate words with an appropriate term corresponding to the inappropriate words defined in the term database, and an extracting step of extracting a photograph and a logo included in the Web document. It has.
[0025]
Therefore, in the Web document diagnosis method according to the first aspect of the present invention, by taking the above-described means, even if the Web document contains an inappropriate term, it can be extracted and replaced with an appropriate term. . As described above, since the Web document can be automatically diagnosed, not only the burden on the administrator who has conventionally checked the Web document can be reduced, but also the unsuitable term can be surely detected with uniform accuracy. It can be replaced with an appropriate term, and the reliability of the Web document can be improved.
[0026]
In addition, since all the photos and logos used in the Web document can be extracted, it is possible to grasp the photos and logos whose usage period, specifications, and the like should be checked.
[0027]
According to a second aspect of the present invention, in the web document diagnostic method according to the first aspect of the present invention, the photograph extracted in the extraction stage is stored in a photograph database in which a photograph permitted to be used for the Web document and a use permission condition are written. By performing the comparison, it is determined whether or not the photograph is permitted to be used for the Web document. Further, the logo extracted in the extraction stage is compared with a logo permitted to be used in the Web document and a logo database in which the use permission condition is written, so that the logo is permitted to be used in the Web document. It is determined whether or not.
[0028]
Therefore, in the Web document diagnosis method according to the second aspect of the present invention, by taking the above measures, it can be determined whether or not the photograph and the logo are permitted to be used for the Web document. It will be possible to prevent the posting of photos and logos that are not allowed to be used.
[0029]
The Web document diagnosis method according to the third aspect of the present invention includes a term included in a Web document for publication by comparing a term included in a Web document for publication with a term database defining a predetermined inappropriate term and an appropriate term corresponding thereto. An inappropriate term to be extracted is extracted, and the extracted inappropriate term is replaced with an appropriate term for the inappropriate term defined in the term database. In addition, ALT data of a photograph and a logo included in the Web document and having predetermined ALT data attached thereto are extracted. Then, by referring to the photograph database in which the photograph permitted to be used for the Web document, the ALT data of the photograph, and the photograph use permit condition are written, the photograph use permit condition corresponding to the extracted ALT data is determined. Then, based on the use permission condition, it is determined whether or not the photo corresponding to the ALT data is a photo permitted to be used for a Web document. Further, by referring to a logo database in which logos permitted to be used for Web documents, logo ALT data, and logo use permission conditions are written, the logo use permission conditions corresponding to the extracted ALT data are determined. Then, based on the use permission condition, it is determined whether the logo corresponding to the ALT data is a logo permitted to be used for a Web document.
[0030]
Therefore, in the Web document diagnosis method according to the third aspect of the present invention, by taking the above measures, the photograph and the logo are identified based on the ALT data attached to the photograph and the logo, and the identified photograph and logo are It can be determined whether or not use is permitted.
[0031]
The Web document diagnosis apparatus according to the fourth aspect of the present invention can publish using a Web document instead of an unsuitable term that is determined in advance to be inappropriate for use in a Web document and an inappropriate term. Is provided with a term database that defines appropriate terms that have been determined in advance. Further, extracting means for extracting terms, pictures and logos from a public Web document, and extracting inappropriate terms from the terms extracted by the extracting means based on the term database, and converting the extracted inappropriate terms into appropriate terms The image processing apparatus includes a replacing means for replacing, and a list displaying means for displaying a list of pictures and logos extracted by the extracting means.
[0032]
Therefore, in the Web document diagnosis apparatus according to the fourth aspect of the invention, by taking the above-described means, even if the Web document contains an inappropriate term, it can be extracted and replaced with an appropriate term. . As described above, since the Web document can be automatically diagnosed, not only the burden on the administrator who has conventionally checked the Web document can be reduced, but also the unsuitable term can be surely detected with uniform accuracy. It can be replaced with an appropriate term, and the reliability of the Web document can be improved.
[0033]
In addition, since all the photos and logos included in the Web document can be displayed in a list, it is possible to easily grasp which photos and logos are used.
[0034]
According to a fifth aspect of the present invention, there is provided the web document diagnostic apparatus according to the fourth aspect of the present invention, wherein a photograph permitted to be used for a Web document and a photograph database in which conditions for permitting use of the photograph are written, and a use permitted for the Web document. A logo database in which the logos and usage permission conditions thereof are written, a photograph determination means for determining whether or not the photograph extracted by the extraction means is a photo satisfying the usage permission conditions written in the photo database; Logo determination means for determining whether the logo extracted by the means satisfies the use permission condition written in the logo database.
[0035]
Therefore, in the Web document diagnostic apparatus according to the fifth aspect of the present invention, by taking the above measures, it is determined whether or not the photograph is permitted to be used for the Web document by referring to the photograph database. This makes it possible to prevent the posting of photos that do not satisfy the license conditions. Also, by referring to the logo database, it is possible to prevent the posting of logos that do not satisfy the use permission conditions.
[0036]
The Web document diagnosis apparatus according to the sixth aspect of the present invention can publish using a Web document instead of an inappropriate term and an inappropriate term that is determined to be inappropriate for use in a Web document. Is provided with a term database that defines appropriate terms that have been determined in advance. Further, extraction means for extracting ALT data of a photograph to which a term and predetermined ALT data are attached and ALT data of a logo to which the predetermined ALT data is attached from a public Web document, and a term database. Replacement means for extracting inappropriate terms from the terms extracted by the extraction means based on the extracted terms and replacing the extracted inappropriate terms with appropriate terms. Further, a photograph database in which a photograph permitted to be used for a Web document, ALT data of the photograph, and conditions for permitting use of the photograph are written, a logo permitted to be used for the Web document, ALT data of a logo, and a logo. It has a logo database in which the license conditions are written. Furthermore, by referring to the photo database, the usage permission condition of the photo corresponding to the ALT data extracted by the extraction means is grasped, and the photo corresponding to the ALT data is converted to a Web document based on the usage permission condition. By referring to the photo determination means for determining whether or not the photo is a photo permitted to be used and the logo database, the use permission condition of the logo corresponding to the ALT data extracted by the extraction means is grasped. Logo determination means is provided for determining whether the logo corresponding to the ALT data is a logo permitted to be used for a Web document based on the permission condition.
[0037]
Therefore, in the Web document diagnostic apparatus according to the sixth aspect of the present invention, by taking the above measures, the photograph and the logo are identified based on the ALT data attached to the photograph and the logo, and the identified photograph and the logo are identified. It is possible to determine whether or not it is usable.
[0038]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0039]
An embodiment of the present invention will be described with reference to FIGS.
[0040]
FIG. 1 is a functional block diagram showing an example of a Web document diagnosis apparatus to which a Web document diagnosis method according to an embodiment of the present invention is applied.
[0041]
That is, the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention is applied includes an inappropriate term database 10, a prescribed document database 11, a company term database 12, a photograph database 13, a logo database, and the like. 14, an integrated database 15, an input receiving unit 16, an extracting unit 18, a replacing unit 20, a replacing result displaying unit 21, a photograph / logo determining unit 22, a list displaying unit 24, and a determining result displaying unit 26. And
[0042]
The inappropriate term database 10 determines in advance that it is inappropriate to publish using a Web document, and that it is appropriate to publish using a Web document instead of the inappropriate term. This is a database in which the correspondences with the appropriate terms are written. The inappropriate term database 10 is, for example, as shown in FIG. 2, a database having a table configuration in which an inappropriate term and an appropriate term corresponding thereto are recorded on a one-to-one basis.
[0043]
The definition document database 11 is a database in which rules regarding the description rules and display rules of the text data included in the Web document are written. Like the inappropriate term database, for example, as shown in FIG. Is a database having a table configuration in which an appropriate expression with respect to is recorded one-to-one.
[0044]
The inappropriate term database 10 is widely defined in society in general, while the prescribed document database 11 is defined at a company level. Rules that are widely defined in society in general and rules that are defined at the company level differ in the frequency with which rules are revised, and are thus separated into different databases.
[0045]
The in-company term database 12 is a database in which terms used in the company, for example, product names, project names, official company names, in-house organization names, office names, representative names, and the like are written.
[0046]
For example, as shown in FIG. 4, the photo database 13 includes photo data, photo data name, size, size, creation date, update date, ALT data of the photo, and photo data that can be pasted and published on a Web document. This is a database in which the start date / end date, related sites, and the like, which can be disclosed, are written. The ALT data is a comment that is displayed when the user points the photograph data using a mouse on a Web browser, as shown in FIG. When the photo data is pasted on the Web document, information necessary for identifying the photo data is written in advance as ALT data a. Thus, when the photo data is displayed on the Web browser, the ALT data a is displayed by pointing the photo data with the mouse.
[0047]
As shown in FIG. 6, for example, the logo database 14 includes logo data, logo data name, size, size, creation date, update date, logo ALT data, and logo that can be pasted on a Web document and made public. This is a database in which the start date / end date, related sites, and the like, which can be disclosed, are written.
[0048]
As shown in FIGS. 7 and 8, for example, the integrated database 15 is a database obtained by integrating all of the inappropriate term database 10, the prescribed document database 11, the in-company term database 12, the photograph database 13, and the logo database 14. It is. In the example shown in FIG. 7 and FIG. 8, a diagnostic classification including a diagnostic classification 1, a diagnostic classification 2, and a diagnostic classification 3 and a human name 1, a human name 2, , Formal terms, product name 1, product name 2, ALT data, disclosure start date, and release end date, as well as human attribute 1, human attribute 2, human attribute 3, product attribute 1, product attribute 2, product attribute Attribute data including attribute 3, money attribute 1, money attribute 2, and money attribute 3 are written. Originally, one integrated database 15 is configured by combining FIG. 7 and FIG. 8, but here, due to space limitations, one integrated database 15 is shown separately in FIG. 7 and FIG. ing.
[0049]
In the diagnostic classification data, the detailed classification is performed in the order of diagnosis classification 1, diagnosis classification 2, and diagnosis classification 3. In other words, items for which each data is used are written in the diagnosis category 1. In the diagnosis category 2, an item that further embodies the diagnosis class 1 can be written, and in the diagnosis class 3, an item that further embodies the diagnosis class 2 can be written. In FIG. 7, only the diagnosis classification data up to the diagnosis classification 3 is described. However, since the diagnosis classification data does not fix the items, the diagnosis classification data 4, the diagnosis classification 5,. The items can be increased as needed.
[0050]
Similarly, new items can be appropriately added to the value data and the attribute data if necessary.
[0051]
As described above, since the integrated database 15 does not fix items, even if it becomes necessary to handle data of new items in the future, it is possible to respond by flexibly importing data of new items. It is possible.
[0052]
In the example shown in FIG. 7, record numbers RID = 1 to 7 write data relating to the use of a logo as shown in diagnosis category 1. These are transcripts of the data written in the logo database 14. In the diagnostic category 2, write whether the data is related to company name logo management, product management, or talent / trademark management. I have. No further diagnostic classification is required at this time, so nothing is written in diagnostic classification 3.
[0053]
Further, the record number RID = 1 relates to the company logo as written in the human name 1, and the data name of the logo is XX. gif, the ALT data is "CC", the posting start date is January 6, 2003, the posting end date is December 31, 2003, and the data size is written in the mono attribute 1. 120 × 240 pixels. The size of the data is 1055 bytes as written in the mono attribute 2.
[0054]
Record numbers RID = 8 to 13 write data on company-wide risk management as shown in diagnosis category 1, and further write data on term management and discriminatory term management as shown in diagnosis category 2. These are transcripts of data written in the inappropriate term database 10 or the specified document database 11, and include an inappropriate term in the "error term" column of the "value data" and an appropriate term in the "official term" column. Are written respectively.
[0055]
Record numbers RID = 14 to 30 write data relating to notification of goods and services as shown in diagnosis category 1, and further employ information management, company information, recruitment document management, and link management as shown in diagnosis category 2. Is written.
[0056]
Record numbers RID14 to RID17 in which the diagnostic classification 2 is the recruitment information management have written "recruitment", "recruitment", and "inquiry" as official terms. The record numbers RID18 to 28 in which the diagnosis category 2 is the company information have the company name, the capital, the representative name (the name of the president), the number of employees, the work, the occupation, the salary, various allowances, the work location, and the like as the diagnosis category 3. Writes holidays, vacations, and systems. Further, the corresponding sub-classified data is written in the value data and the attribute data, respectively. The recruitment information management and the company information are obtained by transcribing data written in the company term database 12.
[0057]
For record numbers RID = 29 to 30 in which the diagnosis category 2 is link information, contract items and personal information are written in the diagnosis category 3, and the link destination URL is written as the product name 1.
[0058]
The input receiving unit 16 receives input of data of a Web document before disclosure. The Web document includes text data, still image data, moving image data, audio data, and the like. When such web document data is input, the input receiving unit 16 outputs the input web document data to the extraction unit 18.
[0059]
The extraction unit 18 extracts text data from the Web document data output from the input reception unit 16 and outputs the extracted text data to the replacement unit 20. In addition, photo data and logo data are extracted from the Web document data output from the input receiving unit 16 together with the ALT data attached thereto. Then, the extracted photo data and logo data are output to the photo / logo determination unit 22 together with the ALT data.
[0060]
When the text data is output from the extraction unit 18, the replacement unit 20 matches a term included in the text data with the integrated database 15. Then, among the terms included in the text data, if there is a term written in the “error term” of the integrated database 15, the term is replaced with the term written in the “official term”. The replacement text data thus obtained is output to the replacement result display unit 21 together with the replacement history data.
[0061]
The replacement result display unit 21 displays the replaced text data and replacement history data output from the replacement unit 20. 9 is text data before replacement inputted from the extraction unit 18 to the replacement unit 20, FIG. 10 is text data after replacement replaced by the replacement unit 20, and FIG. 11 is replacement history data created by the replacement unit 20. An example is shown respectively.
[0062]
As shown in Fig. 9, the text data before replacement was "Inquiries. We plan to introduce products to foreign subscribers living in Japan." When the replacement unit 20 refers to the integrated database 15 and replaces inappropriate terms with appropriate terms, as shown in FIG. 10, “Inquiries. Our company lives on the Pacific Ocean side. We will introduce products to foreign customers. " Further, by referring to the replacement history data as shown in FIG. 11, it is possible to confirm which part has been replaced and how.
[0063]
When the photograph data and the logo data are output together with the ALT data from the extraction unit 18, the photo / logo determination unit 22 outputs them to the list display unit 24. Further, the photograph / logo determination unit 22 compares the outputted ALT data with the ALT data of the integrated database 15. For example, when the ALT data output from the extraction unit 18 is “CC”, this logo is recognized as the logo of the record number RID = 1. As shown in FIG. 7, the logo with the record number RID = 1 has a release start date of January 6, 2003 and a release end date of December 31, 2003.
[0064]
Based on this, it is determined whether or not logo data corresponding to the ALT data “CC” can be posted. As shown in the mono attribute 1 in FIG. 8, the size of the logo with the record number RID = 1 is 120 × 240 pixels. Therefore, by comparing with the size of the logo output from the extraction unit 18, it is determined whether or not this logo is displayed in the correct size. Further, as shown in the mono attribute 2 in FIG. 8, the size of the logo data with the record number RID = 1 is 1055 bytes. Therefore, by comparing with the size of the logo data output from the extraction unit 18, it is determined whether or not this logo is displayed with the correct data size. Furthermore, as shown in the item name 2 in FIG. 7, the data name of the logo with the record number RID = 1 is XX. gif. Therefore, by opening this data and comparing it with the logo output from the extraction unit 18, it is determined whether or not this logo is displayed with a correct design.
[0065]
In the same manner as the logo data determination method described above, it is determined whether or not the photograph data is in compliance with the contract period, is displayed in a predetermined size, or is displayed in a predetermined design. Like that.
[0066]
The determination result is output to the determination result display unit 26 regardless of the case of the logo data or the photograph data.
[0067]
When the photo data and the logo data are output together with the ALT data from the replacing unit 20, the list display unit 24 displays the list as shown in FIG. 12, for example. FIG. 12 shows an example of a format in which image data of a photograph and a logo are displayed, and the data names and the ALT data are displayed in a list.
[0068]
When the determination result is output from the photograph / logo determination unit 22, the determination result display unit 26 displays the output determination result. FIG. 13 is a diagram illustrating an example of such a determination result.
[0069]
1) in FIG. 13 is a determination result indicating that correct image data is displayed on the Web document. That is, the image data of the picture or logo whose ALT data is “CC” matches the values written in the integrated database 15 in both the size, the data name, and the size, and is the judgment date of March 3, 2003. At present, publication is allowed.
[0070]
On the other hand, 2) in FIG. 13 is a determination result indicating that image data after the disclosure period is displayed on the Web document. That is, the image data of the photograph or logo used for the Web document whose ALT data is “BB” has the same size, data name, and size as the values written in the integrated database 15, but the release date Is December 31, 2002, and disclosure is not permitted as of March 3, 2003, which is the determination date.
[0071]
13) shows a determination result indicating that incorrect (incorrect) image data is displayed in the Web document. That is, the size and the size of the image data of the photograph or the logo used for the Web document whose ALT data is “GG” are different from the values written in the integrated database 15.
[0072]
Therefore, whether the photograph or logo used in the Web document referring to the determination result as illustrated in FIG. 13 is permitted to be disclosed or not, and in the case of non-permission, for whatever reason, We make it possible to recognize if there is.
[0073]
Next, an operation of the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention configured as described above is applied will be described.
[0074]
When diagnosing a Web document using a Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention is applied, first, for example, an integrated database 15 as shown in FIGS. 7 and 8 is created. There is a need. Source databases that provide data to be written to the integrated database 15 include, for example, an improper term database 10, a prescribed document database 11, a company term database 12, a photograph database 13, a logo database 14, and the like. Details of each database are as described above.
[0075]
When the integrated database 15 is created in this manner, it operates as shown in the flowcharts of FIGS.
[0076]
That is, first, data of a Web document before disclosure, that is, data of a Web document to be diagnosed, is input to the input receiving unit 16 (S1). The Web document includes text data, still image data, moving image data, audio data, and the like. The input Web document data is further output from the input receiving unit 16 to the extracting unit 18 (S2).
[0077]
The extraction unit 18 extracts text data, photo data, and logo data from the Web document data output from the input reception unit 16 (S3). Then, the text data is output to the replacing unit 20, and the photo data and the logo data are output to the photo / logo determining unit 22 together with the ALT data attached thereto (S4).
[0078]
In the replacement unit 20, the terms included in the text data output from the extraction unit 18 are matched with the integrated database 15 (S5). When there is a term included in the “error term” of the integrated database 15 among the terms included in the text data (S6: Yes), the term is replaced with the term written in the “official term”. (S7). The replacement text data thus obtained is output to the replacement result display unit 21 together with the replacement history data (S8). If there is no term written in the “error term” of the integrated database 15 (S6: No), the process ends.
[0079]
Then, the replacement result display unit 21 displays the replaced text data and replacement history data output from the replacement unit 20 as shown in FIGS. 10 and 11 as an example (S9).
[0080]
On the other hand, the photo data and the logo data output together with the ALT data from the extraction unit 18 to the photo / logo determination unit 22 in step S4 are further output from the photo / logo determination unit 22 to the list display unit 24 (S10). ).
[0081]
Then, from the list display section 24, for example, image data of a photograph and a logo are displayed as shown in FIG. 12, and the data names and the ALT data thereof are displayed in a list (S11).
[0082]
Further, the photo / logo determination unit 22 checks the data in the integrated database 15 having the same ALT data for the photo data and the logo data output from the extraction unit 18.
[0083]
Specifically, first, the same ALT data as the ALT data added to the image data of the photograph data and the logo data output from the extraction unit 18 is searched from the integrated database 15 (S12). Next, it is determined from the integrated database 15 whether or not the image data can be disclosed based on the disclosure start date and disclosure end date of the corresponding record number RID (S13). If the image data can be made public (S13: Yes), the file name of the image data matches the file name written in the object name 2 of the integrated database 15, or the size of the image data is changed to the integrated database. It is compared whether the size matches the size written in the object attribute 1 of 15 or whether the size of the image data matches the size written in the object attribute 2 of the integrated database 15 (S14). If all of them match (S15: Yes), the photograph data and the logo data output from the extraction unit 18 are determined to be data permitted to be disclosed, and the process ends (S16). This determination result is displayed from the determination result display unit 26, for example, as shown in FIG.
[0084]
On the other hand, if it is determined that it is not possible to publish (S13: No), or if any of the file name, size, and size do not match (S15: No), the photograph output from the extraction unit 18 It is determined that the data and the logo data use data whose disclosure is not permitted (S17). This determination result is also displayed from the determination result display unit 26, for example, as shown in FIG.
[0085]
Therefore, whether the photograph or logo used in the Web document referring to the determination result as illustrated in FIG. 13 is permitted to be disclosed or not, and in the case of non-permission, for whatever reason, It can be easily recognized that there is.
[0086]
As described above, in the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment of the present invention is applied, the term used in the Web document is changed by the administrator into a human system by the above operation. Diagnosis can be made automatically instead of diagnosis.
[0087]
This will prevent the display of improper terminology, photos and logos that have passed the permission date or that have been improperly designed, not only to improve the quality of Web documents, but also to comply with contracts, It becomes possible to protect the image of the establisher. In addition, it is possible to reduce the number of claims that have conventionally been received due to posting inappropriate terms.
[0088]
In addition, since this diagnosis can be performed by reflecting in-house rules, compliance, social rules, and the like, it can be performed from the same level of viewpoint as that conventionally performed by an administrator. In addition, since the diagnosis is performed automatically, the accuracy of the diagnosis result does not vary unlike the diagnosis based on the human system. Even when the number of Web documents to be diagnosed is large, the burden of the administrator does not increase due to the advantage of automation.
[0089]
Further, even when the check items are changed or the number of check items is increased, the contents of the integrated database 15 can be easily rewritten according to the change.
[0090]
Further, since a diagnosis result can be output, it is possible to grasp which part has been diagnosed and how. This makes it possible to take into account the manager's judgment as needed.
[0091]
Although the preferred embodiments of the present invention have been described with reference to the accompanying drawings, the present invention is not limited to such configurations. Within the scope of the invented technical concept of the claims, those skilled in the art will be able to conceive various changes and modifications, and those changes and modifications will be described in the technical scope of the present invention. It is understood that it belongs to.
[0092]
【The invention's effect】
As described above, according to the Web document diagnosis apparatus and the Web document diagnosis method of the present invention, it is possible to automatically check terms used in a Web document from the viewpoint of company rules, compliance, social rules, and the like. it can.
[0093]
As described above, it is possible to improve the efficiency of the term check operation and the uniformity of the check accuracy.
[0094]
In addition, it is possible to automatically extract a photograph or a logo posted on a Web document, and to streamline a check operation on the contents.
[Brief description of the drawings]
FIG. 1 is a functional block diagram showing an example of a Web document diagnosis apparatus to which a Web document diagnosis method according to an embodiment of the present invention is applied.
FIG. 2 is a data configuration diagram showing an example of an inappropriate term database.
FIG. 3 is a data configuration diagram showing an example of a prescribed document database.
FIG. 4 is a data configuration diagram showing an example of a photo database.
FIG. 5 is a schematic diagram showing an example of a Web screen on which ALT data is displayed.
FIG. 6 is a data configuration diagram showing an example of a logo database.
FIG. 7 is a data configuration diagram showing an example of an integrated database.
FIG. 8 is a data configuration diagram showing an example of an integrated database.
FIG. 9 is a diagram showing an example of text data before replacement.
FIG. 10 is a view showing an example of text data after replacement.
FIG. 11 is a diagram showing an example of replacement history data.
FIG. 12 is a diagram showing an example of list display data.
FIG. 13 is a diagram illustrating a display example of a determination result made by a photograph / logo determination unit.
FIG. 14 is a flowchart showing the operation of the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment is applied.
FIG. 15 is a flowchart showing the operation of the Web document diagnosis apparatus to which the Web document diagnosis method according to the embodiment is applied.
[Explanation of symbols]
10: Unsuitable term database, 11: Standard document database, 12: Corporate term database, 13: Photo database, 14: Logo database, 15: Integrated database, 16: Input receiving unit, 18: Extracting unit, 20: Substituting unit , 21: Replacement result display section, 22: Photo / logo determination section, 24: List display section, 26: Determination result display section

Claims (6)

公開用のWeb文書に含まれる用語を、予め定めた不適切用語とそれに対する適切用語とを定義した用語データベースと比較することによって、前記Web文書に含まれる不適切用語を抽出し、前記抽出した不適切用語を、前記用語データベースで定義された該不適切用語に対する適切用語に置き換える置換段階と、
前記Web文書に含まれる写真およびロゴを抽出する抽出段階と
を備えたWeb文書診断方法。
By comparing the terms included in the public Web document with a term database that defines predetermined inappropriate terms and appropriate terms corresponding thereto, the inappropriate terms included in the Web document are extracted and extracted. Replacing the inappropriate term with an appropriate term for the inappropriate term defined in the term database;
Extracting a photograph and a logo included in the Web document.
請求項1に記載のWeb文書診断方法において、
前記抽出段階において抽出された写真を、前記Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと比較することによって、前記Web文書への使用が許可された写真であるか否かを判定する写真判定段階と、
前記抽出段階において抽出されたロゴを、前記Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと比較することによって、前記Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定段階と
を備えたWeb文書診断方法。
The Web document diagnosis method according to claim 1,
The photograph extracted in the extracting step is compared with the photograph permitted to be used for the Web document and the photograph database in which the use permission condition is written, so that the photograph permitted to be used for the Web document is compared with the photograph. A photograph determination step of determining whether or not there is,
By comparing the logo extracted in the extracting step with a logo database in which logos permitted to be used for the Web document and the conditions for using the logo are written, the logos permitted to be used in the Web document are compared. A logo determination step of determining whether or not there is a web document diagnosis method.
公開用のWeb文書に含まれる用語を、予め定めた不適切用語とそれに対する適切用語とを定義した用語データベースと比較することによって、前記Web文書に含まれる不適切用語を抽出し、前記抽出した不適切用語を、前記用語データベースで定義された該不適切用語に対する適切用語に置き換える置換段階と、
前記Web文書に含まれ、予め定められたALTデータがおのおの付された写真およびロゴのALTデータを抽出する抽出段階と
前記Web文書への使用が許可される写真、前記写真のALTデータ、および前記写真の使用許可条件が書き込まれた写真データベースを参照することによって、前記抽出段階において抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、前記Web文書への使用が許可された写真であるか否かを判定する写真判定段階と、
前記Web文書への使用が許可されるロゴ、前記ロゴのALTデータ、および前記ロゴの使用許可条件が書き込まれたロゴデータベースを参照することによって、前記抽出段階において抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、前記Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定段階と
を備えたWeb文書診断方法。
By comparing the terms included in the public Web document with a term database that defines predetermined inappropriate terms and appropriate terms corresponding thereto, the inappropriate terms included in the Web document are extracted and extracted. Replacing the inappropriate term with an appropriate term for the inappropriate term defined in the term database;
An extracting step of extracting ALT data of a photograph and a logo included in the Web document and having predetermined ALT data attached thereto, a photograph permitted to be used in the Web document, ALT data of the photograph, and By referring to the photo database in which the usage permission condition of the photo is written, the usage permission condition of the photo corresponding to the ALT data extracted in the extraction step is grasped, and the ALT data corresponding to the ALT data is determined based on the usage permission condition. A photo determination step of determining whether the photo to be performed is a photo permitted to be used for the Web document;
The logo corresponding to the ALT data extracted in the extracting step is referred to by referring to the logo permitted to be used for the Web document, the ALT data of the logo, and the logo database in which the licensing conditions of the logo are written. And a logo judging step of judging whether the logo corresponding to the ALT data is a logo permitted to be used for the Web document based on the use permission condition. Web document diagnosis method.
Web文書に用いて公開することが不適切であると予め定めた不適切用語と、前記不適切用語の代わりに前記Web文書に用いて公開することが可能であると予め定めた適切用語とを定義した用語データベースと、
公開用のWeb文書から用語と、写真およびロゴとを抽出する抽出手段と、
前記用語データベースに基づいて、前記抽出手段によって抽出された用語から前記不適切用語を抽出し、前記抽出した不適切用語を前記適切用語に置き換える置換手段と、
前記抽出手段によって抽出された写真およびロゴを一覧表示する一覧表示手段と
を備えたWeb文書診断装置。
An unsuitable term determined in advance to be inappropriate for use in a Web document and an appropriate term determined in advance to be disclosed in the Web document in place of the unsuitable term A defined term database,
Extracting means for extracting terms, photos and logos from a Web document for publication,
Based on the term database, to extract the inappropriate terms from the terms extracted by the extraction means, replacement means to replace the extracted inappropriate terms with the appropriate terms,
A web document diagnostic apparatus comprising: a list display unit for displaying a list of photos and logos extracted by the extraction unit.
請求項4に記載のWeb文書診断装置において、
前記Web文書への使用が許可される写真およびその使用許可条件が書き込まれた写真データベースと、
前記Web文書への使用が許可されるロゴおよびその使用許可条件が書き込まれたロゴデータベースと、
前記抽出手段によって抽出された写真が、前記写真データベースに書き込まれた使用許可条件を満足する写真であるか否かを判定する写真判定手段と、
前記抽出手段によって抽出されたロゴが、前記ロゴデータベースに書き込まれた使用許可条件を満足するロゴであるか否かを判定するロゴ判定手段と
を備えたWeb文書診断装置。
The web document diagnostic device according to claim 4,
A photograph database in which photos permitted to be used for the Web document and conditions for using the photos are written;
A logo database in which logos permitted to be used for the Web document and conditions for using the logos are written;
A photo determination unit that determines whether the photo extracted by the extraction unit is a photo that satisfies the usage permission condition written in the photo database,
A web document diagnostic apparatus comprising: a logo determination unit configured to determine whether a logo extracted by the extraction unit satisfies a use permission condition written in the logo database.
Web文書に用いて公開することが不適切であると予め定めた不適切用語と、前記不適切用語の代わりに前記Web文書に用いて公開することが可能であると予め定めた適切用語とを定義した用語データベースと、
公開用のWeb文書から用語と、予め定められたALTデータが付された写真のALTデータと、予め定められたALTデータが付されたロゴのALTデータとを抽出する抽出手段と、
前記用語データベースに基づいて、前記抽出手段によって抽出された用語から前記不適切用語を抽出し、前記抽出した不適切用語を前記適切用語に置き換える置換手段と、
前記Web文書への使用が許可される写真、前記写真のALTデータ、および前記写真の使用許可条件が書き込まれた写真データベースと、
前記Web文書への使用が許可されるロゴ、前記ロゴのALTデータ、および前記ロゴの使用許可条件が書き込まれたロゴデータベースと、
前記写真データベースを参照することによって、前記抽出手段によって抽出されたALTデータに対応する写真の使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応する写真が、前記Web文書への使用が許可された写真であるか否かを判定する写真判定手段と、
前記ロゴデータベースを参照することによって、前記抽出手段によって抽出されたALTデータに対応するロゴの使用許可条件を把握し、この使用許可条件に基づいてこのALTデータに対応するロゴが、前記Web文書への使用が許可されたロゴであるか否かを判定するロゴ判定手段と
を備えたWeb文書診断装置。
An unsuitable term determined in advance to be inappropriate for use in a Web document and an appropriate term determined in advance to be disclosed in the Web document in place of the unsuitable term A defined term database,
Extracting means for extracting a term, ALT data of a photograph to which predetermined ALT data is attached, and ALT data of a logo to which predetermined ALT data is attached, from a public Web document;
Based on the term database, to extract the inappropriate terms from the terms extracted by the extraction means, replacement means to replace the extracted inappropriate terms with the appropriate terms,
A photograph database in which a photograph permitted to be used for the Web document, ALT data of the photograph, and conditions for permitting use of the photograph are written;
A logo database in which logos permitted to be used for the Web document, ALT data of the logo, and conditions for permitting use of the logo are written;
By referring to the photo database, the use permission condition of the photograph corresponding to the ALT data extracted by the extraction means is grasped, and the photograph corresponding to the ALT data is stored in the Web document based on the use permission condition. A photo determining means for determining whether or not the photo is a photo permitted to be used;
By referring to the logo database, the use permission condition of the logo corresponding to the ALT data extracted by the extraction means is grasped, and the logo corresponding to the ALT data is transferred to the Web document based on the use permission condition. A web document diagnostic apparatus comprising: a logo determination unit that determines whether the logo is a logo permitted to be used.
JP2003070936A 2003-03-14 2003-03-14 Web document diagnostic device and method Pending JP2004280472A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003070936A JP2004280472A (en) 2003-03-14 2003-03-14 Web document diagnostic device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003070936A JP2004280472A (en) 2003-03-14 2003-03-14 Web document diagnostic device and method

Publications (1)

Publication Number Publication Date
JP2004280472A true JP2004280472A (en) 2004-10-07

Family

ID=33287547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003070936A Pending JP2004280472A (en) 2003-03-14 2003-03-14 Web document diagnostic device and method

Country Status (1)

Country Link
JP (1) JP2004280472A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009534776A (en) * 2006-02-15 2009-09-24 マイクロソフト コーポレーション Generate ads with context images
JP2011008622A (en) * 2009-06-26 2011-01-13 Fujitsu Ltd Display test device, display test program, and display test method
JP2016122458A (en) * 2016-02-04 2016-07-07 キヤノンマーケティングジャパン株式会社 Information processing device, information processing system, control method of information processing system, and computer program
WO2024018595A1 (en) * 2022-07-21 2024-01-25 日本電信電話株式会社 Questionnaire explanatory text checking device, questionnaire explanatory text checking method, and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009534776A (en) * 2006-02-15 2009-09-24 マイクロソフト コーポレーション Generate ads with context images
US8417568B2 (en) 2006-02-15 2013-04-09 Microsoft Corporation Generation of contextual image-containing advertisements
JP2011008622A (en) * 2009-06-26 2011-01-13 Fujitsu Ltd Display test device, display test program, and display test method
JP2016122458A (en) * 2016-02-04 2016-07-07 キヤノンマーケティングジャパン株式会社 Information processing device, information processing system, control method of information processing system, and computer program
WO2024018595A1 (en) * 2022-07-21 2024-01-25 日本電信電話株式会社 Questionnaire explanatory text checking device, questionnaire explanatory text checking method, and program

Similar Documents

Publication Publication Date Title
US10977614B2 (en) Point of scan/copy redaction
US10114821B2 (en) Method and system to access to electronic business documents
US9355255B1 (en) System and method of facilitating compliance with information sharing regulations
US20130036348A1 (en) Systems and Methods for Identifying a Standard Document Component in a Community and Generating a Document Containing the Standard Document Component
US8949241B2 (en) Systems and methods for interactive disambiguation of data
US20140317758A1 (en) Focused personal identifying information redaction
US20070038437A1 (en) Document anonymization apparatus and method
US20090030754A1 (en) Methods, systems and computer software utilizing xbrl to identify, capture, array, manage, transmit and display documents and data in litigation preparation, trial and regulatory filings and regulatory compliance
US8793574B2 (en) Methods and systems for identification and transcription of individual ancestral records and family
US11250149B2 (en) Article management system
US20180232493A1 (en) Case-level review tool for physicians
JP5735403B2 (en) Document management device
JP2009271573A (en) Information processing system, information processor, information processing method, and program
US20020173975A1 (en) Litigation management
CA2997461A1 (en) Dynamic de-identification of healthcare data
US8131546B1 (en) System and method for adaptive sentence boundary disambiguation
JP2004280472A (en) Web document diagnostic device and method
RU2549515C2 (en) Method of identifying personal data of open sources of unstructured information
US20060053105A1 (en) Method for information retrieval
US8838543B2 (en) Archiving system that facilitates systematic cataloguing of archived documents for searching and management
JP2007299093A (en) Document management system
Heurix et al. Recognition and pseudonymisation of medical records for secondary use
CN111753537A (en) Divorce dispute referee document label extraction method and device
Anish et al. Towards enhanced accountability in complying with Healthcare regulations
JP7331404B2 (en) Document management device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060111

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070808

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070911