JP5301862B2 - 著作物比較システム - Google Patents
著作物比較システム Download PDFInfo
- Publication number
- JP5301862B2 JP5301862B2 JP2008086374A JP2008086374A JP5301862B2 JP 5301862 B2 JP5301862 B2 JP 5301862B2 JP 2008086374 A JP2008086374 A JP 2008086374A JP 2008086374 A JP2008086374 A JP 2008086374A JP 5301862 B2 JP5301862 B2 JP 5301862B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- character string
- test
- reprint
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Storage Device Security (AREA)
Description
転載検査システム1000においては、転載検査装置100と、文書提供装置200と、ユーザ端末300とが通信網400を介して接続されている。通信網400には、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット等、様々な通信手段が含まれる。
データ保持部10は、各種データを保持するための記憶領域である。ユーザ支援部20は、ユーザ端末300に対してユーザインタフェースを提供して、ユーザ端末300とのデータ交換を実行する。データ処理部30は、データ保持部10、ユーザ支援部20および文書提供装置200からデータを取得して、各種のデータ処理を実行する。
文書保持部12は、後述する文書収集部32において文書提供装置200から収集された文書と、その文書を特定するためのキーワードとを対応づけて保持する。比較結果保持部14は、基礎文書と被験文書間で合致する文字列の属性情報を記録する。記録される属性情報の例は後述する。
検査要求受信部22は、転載検査サービスを要求する検査要求データをユーザ端末300から受信する。この検査要求データには、被験文書と、被験文書の内容を示すキーワード文字列とが含まれる。
第1の判定は、基礎文字列がそのまま被験文書に転載された場合の検出を主な目的とする。転載判定部40は、各被験文字列についての合致文字列長のうち、いずれかの合致文字列長が所定の確定閾値以上であるとき、基礎文書から被験文書への情報の転載があったと判定する。
第2の判定は、基礎文字列が被験文書に転載されているが、転載された基礎文字列の途中にユーザ作成の文字列が挿入された場合の検出を主な目的とする。転載判定部40は、各被験文字列についての合致文字列長のうち、所定個以上の合致文字列長が所定の警戒閾値以上であり、かつ、それらの被験文字列が被験文書上の所定距離内にあるとき、基礎文書から被験文書へ情報の転載があったと判定する。
第3の判定は、被験文書の比較的広範囲に亘って、基礎文字列が少しずつ転載されている場合、および、基礎文書がアイデアレベルで被験文書に転載されている場合の検出を主な目的とする。転載判定部40は、合致文字列長が所定の足きり閾値以上の被験文字列を特定して、特定した被験文字列のうち、被験文書上の所定距離内にある被験文字列についての合致文字列長を合算する。転載判定部40は、この合算値が所定の合算閾値以上であるとき、基礎文書から被験文書への情報の転載があったと判定する。
図9(a)は、転載検査装置における転載検査サービスの処理を説明するためのフローチャートである。検査要求受信部22は、ユーザからの検査要求を受け付ける(S10)。基礎文書取得部34は、文書提供装置200の提供文書が保持されている文書保持部12を参照して、ユーザが指定したキーワードに対応づけられた文書を基礎文書として取得する(S12)。
Claims (4)
- 被験文書と基礎文書とを取得する文書取得部と、
前記被験文書の文字列と前記基礎文書の文字列とを比較して、両文書間で合致する複数の文字列を特定する文字列比較部と、
(A)前記複数の文字列のうち、いずれかの長さが所定の閾値以上であるとき、または、(B)前記複数の文字列のうち、所定個以上の文字列の長さが前記閾値より小さい別の閾値以上で、かつ、別の閾値以上である文字列が、前記被験文書上、所定の距離内にあるとき、前記基礎文書から前記被験文書への情報の転載があると判定する転載判定部と、
前記転載判定部における判定結果に応じて、所定の後処理を実行する後処理部と、
を備えることを特徴とする著作物比較システム。 - 被験文書と基礎文書とを取得する文書取得部と、
前記被験文書の文字列と前記基礎文書の文字列とを比較して、両文書間で合致する複数の文字列を特定する文字列比較部と、
前記複数の文字列のうち、前記被験文書上、所定の距離内にある文字列の長さを合算し、その合算値が所定の閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定する転載判定部と、
前記転載判定部における判定結果に応じて、所定の後処理を実行する後処理部と、
を備えることを特徴とする著作物比較システム。 - 被験文書と基礎文書とを取得する文書取得部と、
前記被験文書の文字列と前記基礎文書の文字列とを比較して、両文書間で合致する複数の文字列を特定する文字列比較部と、
(a)前記複数の文字列のうち、所定個以上の文字列の長さが警戒閾値以上で、かつ、警戒閾値以上である文字列が、前記被験文書上、第1の距離内にあるとき、または、(b)前記複数の文字列のうち、その長さが、前記警戒閾値より小さい足切り閾値以上の文字列で、かつ、前記被験文書上、前記第1の距離より大きい第2の距離内にある文字列の長さを合算し、その合算値が前記足切り閾値より大きい合算閾値以上であるとき、前記基礎文書から前記被験文書への情報の転載があると判定する転載判定部と、
前記転載判定部における判定結果に応じて、所定の後処理を実行する後処理部と、
を備えることを特徴とする著作物比較システム。 - 前記転載判定部は、(c)前記複数の文字列のうち、いずれかの長さが確定閾値以上であるときにも、前記基礎文書から前記被験文書への情報の転載があると判定することを特徴とする請求項3に記載の著作物比較システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008086374A JP5301862B2 (ja) | 2008-03-28 | 2008-03-28 | 著作物比較システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008086374A JP5301862B2 (ja) | 2008-03-28 | 2008-03-28 | 著作物比較システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009238131A JP2009238131A (ja) | 2009-10-15 |
JP5301862B2 true JP5301862B2 (ja) | 2013-09-25 |
Family
ID=41251947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008086374A Active JP5301862B2 (ja) | 2008-03-28 | 2008-03-28 | 著作物比較システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5301862B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6271482B2 (ja) * | 2015-08-31 | 2018-01-31 | ヤフー株式会社 | 審査システム、審査方法、及び審査プログラム |
JP2018077604A (ja) * | 2016-11-08 | 2018-05-17 | 株式会社Personal AI | 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置 |
CN107316239A (zh) * | 2017-07-14 | 2017-11-03 | 众安信息技术服务有限公司 | 一种基于区块链的信息认证和溯源方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2786380B2 (ja) * | 1992-08-10 | 1998-08-13 | 富士通エフ・アイ・ピー株式会社 | キーワード照合検索処理方法 |
JPH09198409A (ja) * | 1996-01-19 | 1997-07-31 | Hitachi Ltd | 酷似文書抽出方法 |
WO2004034282A1 (ja) * | 2002-10-10 | 2004-04-22 | Fujitsu Limited | コンテンツ再利用管理装置およびコンテンツ再利用支援装置 |
-
2008
- 2008-03-28 JP JP2008086374A patent/JP5301862B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009238131A (ja) | 2009-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4936028B2 (ja) | 情報提供支援装置および情報提供支援方法 | |
US10628411B2 (en) | Repairing a link based on an issue | |
KR100723867B1 (ko) | 피싱웹페이지 차단 장치 및 방법 | |
US9361317B2 (en) | Method for entity enrichment of digital content to enable advanced search functionality in content management systems | |
US10417267B2 (en) | Information processing terminal and method, and information management apparatus and method | |
US8572118B2 (en) | Computer method and apparatus of information management and navigation | |
US20150178476A1 (en) | System and method of monitoring font usage | |
US20140281877A1 (en) | Website Excerpt Validation and Management System | |
US9665543B2 (en) | System and method for reference validation in word processor documents | |
Vaidya et al. | DBpedia commons: structured multimedia metadata from the wikimedia commons | |
JP2010044462A (ja) | コンテンツ評価サーバ、コンテンツ評価方法及びコンテンツ評価プログラム | |
TWI444838B (zh) | 中文數位反抄襲偵測比對系統與方法 | |
JP2004086851A (ja) | 電子文書有意更新検知装置、方法及びプログラム、並びに、電子文書有意更新検知プログラムを記録した記録媒体 | |
JP5301862B2 (ja) | 著作物比較システム | |
Nogales et al. | Linking from Schema. org microdata to the Web of Linked Data: An empirical assessment | |
Király et al. | Evaluating data quality in europeana: Metrics for multilinguality | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
KR20130093230A (ko) | 웹상에서의 저작권 침해 컨텐츠에 대한 검출 및 관리 시스템 | |
US7711648B2 (en) | Method and apparatus for obtaining content license rights via a document link resolver | |
JP3648101B2 (ja) | コンテンツ不正利用探索装置およびコンテンツ不正利用探索方法 | |
JP2011086156A (ja) | 漏洩情報追跡システムおよび漏洩情報追跡プログラム | |
JP5373439B2 (ja) | 著作物比較システム | |
JP2011209886A (ja) | アノテーション方法、アノテーションプログラム及びアノテーション装置 | |
Sun | Investigating the effectiveness of android privacy policies | |
KR101487356B1 (ko) | 검색논문의 참고문헌정보를 제공하는 서버 및 제공방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121005 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130620 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5301862 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |