JP2009238131A - 著作物比較システム - Google Patents
著作物比較システム Download PDFInfo
- Publication number
- JP2009238131A JP2009238131A JP2008086374A JP2008086374A JP2009238131A JP 2009238131 A JP2009238131 A JP 2009238131A JP 2008086374 A JP2008086374 A JP 2008086374A JP 2008086374 A JP2008086374 A JP 2008086374A JP 2009238131 A JP2009238131 A JP 2009238131A
- Authority
- JP
- Japan
- Prior art keywords
- document
- character string
- test
- reprint
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Storage Device Security (AREA)
Abstract
【解決手段】転載検査装置100は、ユーザ端末300から取得した被験文書と、文書提供装置200から取得した基礎文書との間で合致する文字列を特定する。転載検査装置100は、合致する文字列の属性に応じて、基礎文書から被験文書への情報の転載有無を判定する。転載検査装置100は、転載有無の判定結果をユーザ端末300に通知する。
【選択図】図1
Description
転載検査システム1000においては、転載検査装置100と、文書提供装置200と、ユーザ端末300とが通信網400を介して接続されている。通信網400には、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット等、様々な通信手段が含まれる。
データ保持部10は、各種データを保持するための記憶領域である。ユーザ支援部20は、ユーザ端末300に対してユーザインタフェースを提供して、ユーザ端末300とのデータ交換を実行する。データ処理部30は、データ保持部10、ユーザ支援部20および文書提供装置200からデータを取得して、各種のデータ処理を実行する。
文書保持部12は、後述する文書収集部32において文書提供装置200から収集された文書と、その文書を特定するためのキーワードとを対応づけて保持する。比較結果保持部14は、基礎文書と被験文書間で合致する文字列の属性情報を記録する。記録される属性情報の例は後述する。
検査要求受信部22は、転載検査サービスを要求する検査要求データをユーザ端末300から受信する。この検査要求データには、被験文書と、被験文書の内容を示すキーワード文字列とが含まれる。
第1の判定は、基礎文字列がそのまま被験文書に転載された場合の検出を主な目的とする。転載判定部40は、各被験文字列についての合致文字列長のうち、いずれかの合致文字列長が所定の確定閾値以上であるとき、基礎文書から被験文書への情報の転載があったと判定する。
第2の判定は、基礎文字列が被験文書に転載されているが、転載された基礎文字列の途中にユーザ作成の文字列が挿入された場合の検出を主な目的とする。転載判定部40は、各被験文字列についての合致文字列長のうち、所定個以上の合致文字列長が所定の警戒閾値以上であり、かつ、それらの被験文字列が被験文書上の所定距離内にあるとき、基礎文書から被験文書へ情報の転載があったと判定する。
第3の判定は、被験文書の比較的広範囲に亘って、基礎文字列が少しずつ転載されている場合、および、基礎文書がアイデアレベルで被験文書に転載されている場合の検出を主な目的とする。転載判定部40は、合致文字列長が所定の足きり閾値以上の被験文字列を特定して、特定した被験文字列のうち、被験文書上の所定距離内にある被験文字列についての合致文字列長を合算する。転載判定部40は、この合算値が所定の合算閾値以上であるとき、基礎文書から被験文書への情報の転載があったと判定する。
図9(a)は、転載検査装置における転載検査サービスの処理を説明するためのフローチャートである。検査要求受信部22は、ユーザからの検査要求を受け付ける(S10)。基礎文書取得部34は、文書提供装置200の提供文書が保持されている文書保持部12を参照して、ユーザが指定したキーワードに対応づけられた文書を基礎文書として取得する(S12)。
Claims (8)
- 被験文書と基礎文書とを取得する文書取得部と、
前記被験文書の文字列と前記基礎文書の文字列とを比較して、両文書間で合致する文字列を特定する文字列比較部と、
前記両文書間で合致する文字列の属性に応じて、前記基礎文書から前記被験文書への情報の転載有無を判定する転載判定部と、
前記転載判定部における判定結果に応じて、所定の後処理を実行する後処理部と、
を備えることを特徴とする著作物比較システム。 - 前記転載判定部は、前記両文書間で合致する文字列の長さが所定の閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項1に記載の著作物比較システム。
- 前記文字列比較部は、前記両文書間で合致する複数の文字列を特定し、
前記転載判定部は、前記複数の文字列のうち、いずれかの長さが前記閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項2に記載の著作物比較システム。 - 前記転載判定部は、前記複数の文字列のうち、所定個以上の文字列の長さが前記閾値より小さい別の閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項3に記載の著作物比較システム。
- 前記転載判定部は、前記所定個以上の文字列が、前記被験文書上、所定の距離内にあることを加重条件として、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項4に記載の著作物比較システム。
- 前記文字列比較部は、前記両文書間で合致する複数の文字列を特定し、
前記転載判定部は、前記複数の文字列の長さを合算し、その合算値が所定の閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項1に記載の著作物比較システム。 - 前記転載判定部は、前記複数の文字列のうち、その長さが第1の閾値以上の文字列の長さを合算し、その合算値が前記第1の閾値より大きい第2の閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項6に記載の著作物比較システム。
- 前記転載判定部は、前記複数の文字列が、前記被験文書上、所定の距離内にあることを加重条件として、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項6に記載の著作物比較システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008086374A JP5301862B2 (ja) | 2008-03-28 | 2008-03-28 | 著作物比較システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008086374A JP5301862B2 (ja) | 2008-03-28 | 2008-03-28 | 著作物比較システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009238131A true JP2009238131A (ja) | 2009-10-15 |
JP5301862B2 JP5301862B2 (ja) | 2013-09-25 |
Family
ID=41251947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008086374A Active JP5301862B2 (ja) | 2008-03-28 | 2008-03-28 | 著作物比較システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5301862B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049651A (ja) * | 2015-08-31 | 2017-03-09 | ヤフー株式会社 | 審査システム、審査方法、及び審査プログラム |
JP2018077604A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社Personal AI | 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置 |
JP2020511059A (ja) * | 2017-07-14 | 2020-04-09 | ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド | 情報認証方法及びシステム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06314307A (ja) * | 1992-08-10 | 1994-11-08 | Fujitsu F I P Kk | キーワード照合検索処理方法 |
JPH09198409A (ja) * | 1996-01-19 | 1997-07-31 | Hitachi Ltd | 酷似文書抽出方法 |
WO2004034282A1 (ja) * | 2002-10-10 | 2004-04-22 | Fujitsu Limited | コンテンツ再利用管理装置およびコンテンツ再利用支援装置 |
-
2008
- 2008-03-28 JP JP2008086374A patent/JP5301862B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06314307A (ja) * | 1992-08-10 | 1994-11-08 | Fujitsu F I P Kk | キーワード照合検索処理方法 |
JPH09198409A (ja) * | 1996-01-19 | 1997-07-31 | Hitachi Ltd | 酷似文書抽出方法 |
WO2004034282A1 (ja) * | 2002-10-10 | 2004-04-22 | Fujitsu Limited | コンテンツ再利用管理装置およびコンテンツ再利用支援装置 |
Non-Patent Citations (2)
Title |
---|
田代 崇 外4名: "Webページを対象とした著作権違反自動検知システム", 情報処理学会研究報告, vol. 第2006巻第78号, JPN6012055829, 14 July 2006 (2006-07-14), JP, pages 27 - 33, ISSN: 0002550902 * |
高橋 勇 外5名: "Webからの剽窃レポート検出手法の実装と評価", 第46回 先進的学習科学と工学研究会資料 (SIG−ALST−A503), JPN6012055830, 13 March 2006 (2006-03-13), JP, pages 01 - 06, ISSN: 0002550903 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017049651A (ja) * | 2015-08-31 | 2017-03-09 | ヤフー株式会社 | 審査システム、審査方法、及び審査プログラム |
JP2018077604A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社Personal AI | 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置 |
JP2020511059A (ja) * | 2017-07-14 | 2020-04-09 | ジョンアン インフォメーション テクノロジー サービシズ カンパニー リミテッド | 情報認証方法及びシステム |
Also Published As
Publication number | Publication date |
---|---|
JP5301862B2 (ja) | 2013-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4936028B2 (ja) | 情報提供支援装置および情報提供支援方法 | |
US9361317B2 (en) | Method for entity enrichment of digital content to enable advanced search functionality in content management systems | |
US10628411B2 (en) | Repairing a link based on an issue | |
Ford et al. | Getting to the source: where does Wikipedia get its information from? | |
US10417267B2 (en) | Information processing terminal and method, and information management apparatus and method | |
US8572118B2 (en) | Computer method and apparatus of information management and navigation | |
US20090313536A1 (en) | Dynamically Providing Relevant Browser Content | |
US20140281877A1 (en) | Website Excerpt Validation and Management System | |
US20080235565A1 (en) | System and Method for Reference Validation in Word Processor Documents | |
Vaidya et al. | DBpedia commons: structured multimedia metadata from the wikimedia commons | |
JP2010044462A (ja) | コンテンツ評価サーバ、コンテンツ評価方法及びコンテンツ評価プログラム | |
JP2004086851A (ja) | 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体 | |
JP5301862B2 (ja) | 著作物比較システム | |
Nogales et al. | Linking from Schema. org microdata to the Web of Linked Data: An empirical assessment | |
Király et al. | Evaluating data quality in europeana: Metrics for multilinguality | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
TW201316186A (zh) | 中文數位反抄襲偵測比對系統與方法 | |
US20070179937A1 (en) | Apparatus, method, and computer program product for extracting structured document | |
US7711648B2 (en) | Method and apparatus for obtaining content license rights via a document link resolver | |
JP3648101B2 (ja) | コンテンツ不正利用探索装置およびコンテンツ不正利用探索方法 | |
JP2011086156A (ja) | 漏洩情報追跡システムおよび漏洩情報追跡プログラム | |
JP5373439B2 (ja) | 著作物比較システム | |
JP2011209886A (ja) | アノテーション方法、アノテーションプログラム及びアノテーション装置 | |
JP6530002B2 (ja) | コンテンツ探索装置、コンテンツ探索方法、プログラム | |
Sun | Investigating the effectiveness of android privacy policies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130620 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5301862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |