KR100717998B1 - 문서의 표절 검사 방법 - Google Patents
문서의 표절 검사 방법 Download PDFInfo
- Publication number
- KR100717998B1 KR100717998B1 KR1020050129610A KR20050129610A KR100717998B1 KR 100717998 B1 KR100717998 B1 KR 100717998B1 KR 1020050129610 A KR1020050129610 A KR 1020050129610A KR 20050129610 A KR20050129610 A KR 20050129610A KR 100717998 B1 KR100717998 B1 KR 100717998B1
- Authority
- KR
- South Korea
- Prior art keywords
- plagiarism
- sentences
- document
- index
- sentence
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
리포트명 | 표절 정도(%) | 크기 | 내용어수 | 고유단어비율(%) |
문서3.hwp | 62 | 29696 | 677 | 7.53 |
문서6.doc | 57 | 1901 | 2396 | 3.17 |
문서18.hwp | 52 | 33792 | 3880 | 2.50 |
문서4.doc | 49 | 83456 | 2469 | 5.83 |
문서13.hwp | 40 | 43008 | 5076 | 4.59 |
문서20.hwp | 38 | 19456 | 950 | 6.32 |
문서8.doc | 33 | 70144 | 1126 | 4.00 |
문서1.hwp | 32 | 46592 | 1937 | 4.65 |
문서14.doc | 32 | 478208 | 1970 | 8.22 |
문서23.doc | 23 | 36864 | 676 | 2.22 |
문서26.doc | 19 | 54784 | 2026 | 6.91 |
72.hwp | 13 | 77824 | 874 | 13.73 |
문서17.hwp | 7 | 63488 | 9354 | 11.06 |
문서25.doc | 7 | 55808 | 1955 | 7.42 |
문서7.doc | 1 | 33792 | 923 | 8.88 |
문서12.doc | 0 | 27136 | 364 | 7.14 |
** 표절 검사 대상 문서 ** |
이 이론을 토대로 만들어진 독특한 스릴러 영화가 나비효과이다. 이 영화는 이 이론을 인생의 흐름에 대입시켜 순간의 선택이 한 사람의 인생 혹은 그와 관련된 주위 사람들까지의 인생을 얼마나 다르게 바꾸어 놓을 수 있는가를 보여주고 있다. 한 소년이 있다. 귀엽고 천진난만한 얼굴로 정신병원에 간 아빠를 그리워하지만 엄마를 가슴아프게 하지 않기 위해 견디는 착한 아이이다. 학교 그림시간에 장래 희망으로 사람을 살해하는 살인마가 되어있는 그림을 그려 선생님을 놀라게 한다. 그러나 이 소년은 그림을 그린 자신을 기억하지 못한다. 소년의 삶에서 이 같은 기억의 흐름이 종종 끊기는 일이 생긴다. 그것은 언제나 자신에게 성착취의 위기가 다가오거나 신변에 위험이 느껴지거나 의도하지 않게 사람을 죽이게 되는 사건에 휘말리거나 할 때처럼 감정적으로 크게 동요하게 될 때 꼭 나타난다. |
** 웹문서의 유사 문장들 ** |
어린 시절 순간의 선택이 한 사람의 인생 혹은 그와 관련된 주위 사람들까지의 인생을 얼마나 다르게 바꾸어 놓을 수 있는가 하는 것이 영화가 내세우는 주제다. ............................................... 소년의 삶에서 이 같은 기억의 흐름이 종종 끊기는 일이 생긴다. 그것은 언제나 자신에게 성적인 착취의 위기가 다가오거나 의도하지 않게 사람을 죽이게 되는 사건에 휘말리거나 할 때처럼 감정적으로 크게 동요하게 될 때 꼭 나타난다. ............................................. 그러나 다시 돌아간 현제에서 그는 그 과거의 또 다른 선택 때문에 또 다른 불행에 맞닥뜨리게 된다. |
Claims (9)
- 컴퓨터가 표절 검사 대상 문서의 표절 여부를 검사하는 방법에 있어서,(a) 상기 표절 검사 대상 문서에서 복수개의 검색어들을 추출하는 단계;(b) 인터넷을 통하여 상기 검색어들이 포함된 웹문서를 추출하는 단계;(c) 상기 표절 검사 대상 문서 내 문장들과 상기 추출된 웹문서 내 문장들로부터 복수개의 색인어들을 추출하는 단계;(d) 상기 표절 검사 대상 문서에서 추출된 색인어들과 상기 웹문서에서 추출된 색인어들에 대해서, 전체 문장의 개수, 문장 내의 색인어의 빈도 및 색인어가 존재하는 문장의 개수에 따라 상기 색인어들의 색인어 가중치를 계산하고, 상기 색인어 가중치를 이용하여 상기 색인어들이 포함된 문장들의 유사성을 검사하는 단계; 및(e) 상기 유사성 검사 결과 서로 유사한 문장들이 발견되면, 상기 유사한 문장들의 주변 문장들을 상호 비교하는 지역 유사성 검사를 하여 상기 표절 검사 대상 문서의 표절 여부를 판정하는 단계를 포함하는 것을 특징으로 하는 문서의 표절 검사 방법.
- 제1항에 있어서, 상기 검색어들은 각각 단어열로 구성하는 것을 특징으로 하는 문서의 표절 검사 방법.
- 제2항에 있어서, 상기 단어열은 3개 이상의 단어들을 포함하는 것을 특징으로 하는 문서의 표절 검사 방법.
- 제1항에 있어서, 상기 색인어들은 명사, 동사, 수식어, 외국어를 포함하는 실질 형태소인 것을 특징으로 하는 문서의 표절 검사 방법.
- 제5항에 있어서, 상기 문장 유사도 계산 결과가 (Sim(Si,Sj)≥δ1,δ1=0.5∼0.6)일 때 유사한 문장으로 판정하는 것을 특징으로 하는 문서의 표절 검사 방법.
- 제1항에 있어서, 상기 (e) 단계 후에 상기 표절 검사 결과를 상기 컴퓨터의 모니터에 표시하는 단계를 더 포함하는 것을 특징으로 하는 문서의 표절 검사 방법.
- 제1항에 있어서, 상기 검색어들은 상기 표절 검사 대상 문서에 포함된 문장들 중에서 임의의 순서로 선택된 문장들 중에서 추출하는 것을 특징으로 하는 문서의 표절 검사 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050129610A KR100717998B1 (ko) | 2005-12-26 | 2005-12-26 | 문서의 표절 검사 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050129610A KR100717998B1 (ko) | 2005-12-26 | 2005-12-26 | 문서의 표절 검사 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100717998B1 true KR100717998B1 (ko) | 2007-05-15 |
Family
ID=38270695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050129610A KR100717998B1 (ko) | 2005-12-26 | 2005-12-26 | 문서의 표절 검사 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100717998B1 (ko) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100863943B1 (ko) * | 2007-10-04 | 2008-10-16 | 부산대학교 산학협력단 | 표절탐색 방법 및 장치 |
KR100918489B1 (ko) * | 2007-10-17 | 2009-09-24 | 주식회사 컨텐츠컴퍼니제이 | 텍스트 비교 방법 및 텍스트 비교 시스템 |
KR100945223B1 (ko) * | 2009-03-02 | 2010-03-03 | (주)아이비즈넷 | 중복수상을 검증하는 경진대회 진행 시스템 및 그 방법 |
KR100948749B1 (ko) | 2008-03-05 | 2010-03-22 | 엔에이치엔(주) | 빈출 문구를 이용한 복사 문서 판단 시스템 및 방법,그리고 빈출 문구 추출 시스템 및 방법 |
KR101033670B1 (ko) * | 2008-12-04 | 2011-05-12 | (주)야긴스텍 | 문서 간 유사도 산출 시스템 및 방법 |
KR101115003B1 (ko) | 2010-05-07 | 2012-03-06 | (주)휴먼토크 | 통합뷰어를 활용한 표절검사 시스템 |
KR20140052685A (ko) * | 2012-10-25 | 2014-05-07 | 에스케이텔레콤 주식회사 | 문장 유사도를 이용한 문장 평가 방법, 이를 위한 장치 및 이 방법이 기록된 컴퓨터로 판독 가능한 기록 매체 |
KR101414171B1 (ko) * | 2013-12-30 | 2014-07-04 | 주식회사 메쉬코리아 | 전자 문서 모델링 방법 및 그 전자 장치 |
KR101580784B1 (ko) | 2015-09-04 | 2015-12-31 | 주식회사 무하유 | 문서 표절률 산출 방법 및 이 방법을 수행하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 저장매체 |
KR101626247B1 (ko) * | 2015-01-06 | 2016-06-01 | 인하대학교 산학협력단 | 온라인 서비스 가능한 유의어 사전 기반의 표절문서 탐색 시스템 |
KR101687674B1 (ko) * | 2015-11-26 | 2016-12-19 | 성신여자대학교 산학협력단 | 유사도를 이용한 데이터 평가 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터로 판독 가능한 기록 매체 |
KR101713612B1 (ko) * | 2015-09-22 | 2017-03-09 | 조선대학교산학협력단 | 지능형 스토리텔링 지원 시스템 |
KR20180054308A (ko) | 2016-11-15 | 2018-05-24 | 한국과학기술원 | 함의 문장 생성 기술을 활용한 문장 표절 판단 장치, 이를 구현하기 위한 프로그램 및 기록 매체 |
KR20180078626A (ko) * | 2016-12-30 | 2018-07-10 | 주식회사 로크미디어 | 출판 정보 제공 시스템 및 방법 |
KR20180109788A (ko) * | 2018-09-21 | 2018-10-08 | 주식회사 로크미디어 | 웹 저작물 검증 시스템 |
KR20180109789A (ko) * | 2018-09-21 | 2018-10-08 | 주식회사 로크미디어 | 온라인 저작물 평가 방법 |
JP2021022252A (ja) * | 2019-07-30 | 2021-02-18 | 株式会社ウェブサークル | 類似文章検索装置およびプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282331A (ja) * | 1996-04-09 | 1997-10-31 | Canon Inc | 文書類似判定装置および文書類似判定方法 |
JPH10171803A (ja) | 1996-12-09 | 1998-06-26 | Oki Electric Ind Co Ltd | 文類似度計算装置 |
KR20020009077A (ko) * | 2000-07-24 | 2002-02-01 | 김회율 | 문장 표절 및 도용 검색 방법 |
KR20030044949A (ko) * | 2003-04-24 | 2003-06-09 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
KR20040064681A (ko) * | 2004-06-30 | 2004-07-19 | 부산대학교 산학협력단 | 프로그램 소스의 표절 탐색 방법 및 이를 이용한프로그래밍 과제의 채점 시스템 |
-
2005
- 2005-12-26 KR KR1020050129610A patent/KR100717998B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282331A (ja) * | 1996-04-09 | 1997-10-31 | Canon Inc | 文書類似判定装置および文書類似判定方法 |
JPH10171803A (ja) | 1996-12-09 | 1998-06-26 | Oki Electric Ind Co Ltd | 文類似度計算装置 |
KR20020009077A (ko) * | 2000-07-24 | 2002-02-01 | 김회율 | 문장 표절 및 도용 검색 방법 |
KR20030044949A (ko) * | 2003-04-24 | 2003-06-09 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
KR20040064681A (ko) * | 2004-06-30 | 2004-07-19 | 부산대학교 산학협력단 | 프로그램 소스의 표절 탐색 방법 및 이를 이용한프로그래밍 과제의 채점 시스템 |
Non-Patent Citations (1)
Title |
---|
논문 |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100863943B1 (ko) * | 2007-10-04 | 2008-10-16 | 부산대학교 산학협력단 | 표절탐색 방법 및 장치 |
KR100918489B1 (ko) * | 2007-10-17 | 2009-09-24 | 주식회사 컨텐츠컴퍼니제이 | 텍스트 비교 방법 및 텍스트 비교 시스템 |
KR100948749B1 (ko) | 2008-03-05 | 2010-03-22 | 엔에이치엔(주) | 빈출 문구를 이용한 복사 문서 판단 시스템 및 방법,그리고 빈출 문구 추출 시스템 및 방법 |
KR101033670B1 (ko) * | 2008-12-04 | 2011-05-12 | (주)야긴스텍 | 문서 간 유사도 산출 시스템 및 방법 |
KR100945223B1 (ko) * | 2009-03-02 | 2010-03-03 | (주)아이비즈넷 | 중복수상을 검증하는 경진대회 진행 시스템 및 그 방법 |
KR101115003B1 (ko) | 2010-05-07 | 2012-03-06 | (주)휴먼토크 | 통합뷰어를 활용한 표절검사 시스템 |
KR102004831B1 (ko) * | 2012-10-25 | 2019-07-29 | 에스케이텔레콤 주식회사 | 문장 유사도를 이용한 문장 평가 방법, 이를 위한 장치 및 이 방법이 기록된 컴퓨터로 판독 가능한 기록 매체 |
KR20140052685A (ko) * | 2012-10-25 | 2014-05-07 | 에스케이텔레콤 주식회사 | 문장 유사도를 이용한 문장 평가 방법, 이를 위한 장치 및 이 방법이 기록된 컴퓨터로 판독 가능한 기록 매체 |
KR101414171B1 (ko) * | 2013-12-30 | 2014-07-04 | 주식회사 메쉬코리아 | 전자 문서 모델링 방법 및 그 전자 장치 |
KR101626247B1 (ko) * | 2015-01-06 | 2016-06-01 | 인하대학교 산학협력단 | 온라인 서비스 가능한 유의어 사전 기반의 표절문서 탐색 시스템 |
KR101580784B1 (ko) | 2015-09-04 | 2015-12-31 | 주식회사 무하유 | 문서 표절률 산출 방법 및 이 방법을 수행하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 저장매체 |
KR101713612B1 (ko) * | 2015-09-22 | 2017-03-09 | 조선대학교산학협력단 | 지능형 스토리텔링 지원 시스템 |
KR101687674B1 (ko) * | 2015-11-26 | 2016-12-19 | 성신여자대학교 산학협력단 | 유사도를 이용한 데이터 평가 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터로 판독 가능한 기록 매체 |
KR20180054308A (ko) | 2016-11-15 | 2018-05-24 | 한국과학기술원 | 함의 문장 생성 기술을 활용한 문장 표절 판단 장치, 이를 구현하기 위한 프로그램 및 기록 매체 |
KR20180078626A (ko) * | 2016-12-30 | 2018-07-10 | 주식회사 로크미디어 | 출판 정보 제공 시스템 및 방법 |
KR101904063B1 (ko) * | 2016-12-30 | 2018-11-28 | 주식회사 로크미디어 | 출판 정보 제공 시스템 및 방법 |
KR20180109788A (ko) * | 2018-09-21 | 2018-10-08 | 주식회사 로크미디어 | 웹 저작물 검증 시스템 |
KR20180109789A (ko) * | 2018-09-21 | 2018-10-08 | 주식회사 로크미디어 | 온라인 저작물 평가 방법 |
KR102037473B1 (ko) * | 2018-09-21 | 2019-11-01 | 주식회사 로크미디어 | 온라인 게시 저작물 출판을 위한 출판 정보 제공 시스템 |
KR102037475B1 (ko) * | 2018-09-21 | 2019-11-01 | 주식회사 로크미디어 | 온라인 게시 저작물 출판을 위한 출판 정보 제공 방법 |
JP2021022252A (ja) * | 2019-07-30 | 2021-02-18 | 株式会社ウェブサークル | 類似文章検索装置およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100717998B1 (ko) | 문서의 표절 검사 방법 | |
Kousha et al. | Are Wikipedia citations important evidence of the impact of scholarly articles and books? | |
US9959776B1 (en) | System and method for automated scoring of texual responses to picture-based items | |
Bjørkelund et al. | A study of opinion mining and visualization of hotel reviews | |
Overell et al. | Using co‐occurrence models for placename disambiguation | |
Shardlow | The cw corpus: A new resource for evaluating the identification of complex words | |
JP2008282366A (ja) | 質問応答装置、質問応答方法、質問応答プログラム並びにそのプログラムを記録した記録媒体 | |
Serigos | Using distributional semantics in loanword research: A concept-based approach to quantifying semantic specificity of Anglicisms in Spanish | |
Yalcin et al. | An external plagiarism detection system based on part-of-speech (POS) tag n-grams and word embedding | |
US20150142780A1 (en) | Apparatus and method for analyzing event time-space correlation in social web media | |
Hollenstein et al. | Inconsistency detection in semantic annotation | |
US20190155912A1 (en) | Multi-dimensional query based extraction of polarity-aware content | |
Davoodi et al. | Clac at semeval-2016 task 11: Exploring linguistic and psycho-linguistic features for complex word identification | |
De Wilde et al. | Semantic enrichment of a multilingual archive with linked open data | |
CN105701085A (zh) | 一种网络查重方法及系统 | |
Dornescu et al. | Relative clause extraction for syntactic simplification | |
Bär et al. | Composing measures for computing text similarity | |
Leveling et al. | On metonymy recognition for geographic information retrieval | |
Duran et al. | Some issues on the normalization of a corpus of products reviews in Portuguese | |
Putri et al. | Software feature extraction using infrequent feature extraction | |
Ehsan et al. | A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection. | |
JP2007164635A (ja) | 同義語彙獲得方法及び装置及びプログラム | |
Piskorski et al. | Exploiting twitter for border security-related intelligence gathering | |
Flanagan et al. | Classification of English language learner writing errors using a parallel corpus with SVM | |
Thelwall et al. | Are Wikipedia citations important evidence of the impact of scholarly articles and books? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130405 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140310 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150502 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160503 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170202 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180504 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20190401 Year of fee payment: 13 |