JP5510912B2 - Citation determination support apparatus and citation determination support program - Google Patents

Citation determination support apparatus and citation determination support program Download PDF

Info

Publication number
JP5510912B2
JP5510912B2 JP2009019477A JP2009019477A JP5510912B2 JP 5510912 B2 JP5510912 B2 JP 5510912B2 JP 2009019477 A JP2009019477 A JP 2009019477A JP 2009019477 A JP2009019477 A JP 2009019477A JP 5510912 B2 JP5510912 B2 JP 5510912B2
Authority
JP
Japan
Prior art keywords
determination
citation
range
data
target data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009019477A
Other languages
Japanese (ja)
Other versions
JP2009205674A (en
Inventor
一成 杉光
景樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kanazawa Institute of Technology (KIT)
Original Assignee
Kanazawa Institute of Technology (KIT)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kanazawa Institute of Technology (KIT) filed Critical Kanazawa Institute of Technology (KIT)
Priority to JP2009019477A priority Critical patent/JP5510912B2/en
Publication of JP2009205674A publication Critical patent/JP2009205674A/en
Application granted granted Critical
Publication of JP5510912B2 publication Critical patent/JP5510912B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Description

本発明は、判定対象となる判定対象データの中で、文献データが引用されているか否かの判定を支援する引用判定支援装置および引用判定支援プログラムに関する。   The present invention relates to a citation determination support apparatus and a citation determination support program that assist in determining whether or not document data is cited in determination target data to be determined.

学生や研究者等が作成した論文において、他人の著作物が無断で引用される場合がある。特にインターネットが発達した近年では、WEBページ等から他人の著作物を検索して、検索された他人の著作物を無断で引用して文書を作成することが容易になり、不正利用の問題が深刻化してきている。   In a paper created by a student or researcher, the copyrighted work of others may be cited without permission. In particular, in recent years when the Internet has developed, it has become easier to search for other people's works from WEB pages, etc., and to create documents by quoting the searched other people's works without permission. It has become.

このため、文書の内容における著作物の引用を判断することが必要となってくるが、人手によって引用有無を判断することは極めて煩雑である。このため、他人の著作物が引用されているか否かを自動的に判別するソフトウェアも種々提案されている。   For this reason, it is necessary to determine the citation of the copyrighted work in the content of the document, but it is extremely complicated to manually determine the presence or absence of citation. For this reason, various softwares have been proposed that automatically determine whether or not someone else's work is cited.

例えば、特許文献1には、サーバから受信した著作権情報に基づいて、ウェブページ内のコンテンツの著作権侵害を調べ、著作権侵害が発見されたらその旨の通知をサーバに送信する技術が開示されている。また、特許文献2には、技術文書間の類似度を判定して両文書の関係を視覚的に表示する技術が開示されている。   For example, Patent Literature 1 discloses a technology for examining copyright infringement of content in a web page based on copyright information received from a server, and transmitting a notification to that effect to the server when copyright infringement is found. Has been. Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for visually displaying the relationship between two documents by determining the degree of similarity between technical documents.

特開2002−366531号公報JP 2002-366531 A 特開2000−363384号公報JP 2000-363384 A

このような判定ソフトウェアでは、著作物の引用判定の精度を向上させることが望まれる。この判定精度の向上を図るためには、高度な判定アルゴリズムを開発することが好ましいが、この場合には、判定ソフトウェアの開発工程が増大し、この結果、判定ソフトウェアの製造コストも増大するという問題がある。   In such determination software, it is desired to improve the accuracy of citation determination of a copyrighted work. In order to improve the determination accuracy, it is preferable to develop an advanced determination algorithm. However, in this case, the development process of the determination software increases, and as a result, the manufacturing cost of the determination software increases. There is.

本発明は、上記に鑑みてなされたものであって、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができる引用判定支援装置および引用判定支援プログラムを提供することを目的とする。   The present invention has been made in view of the above, and a citation determination support apparatus capable of improving the accuracy of determination while preventing an increase in development process and manufacturing cost using a general-purpose determination algorithm, and The purpose is to provide a citation judgment support program.

上述した課題を解決し、目的を達成するために、請求項1に記載の引用判定支援装置は、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段とを備えたことを特徴とする。 To solve the above problems and achieve the object, reference determination assisting device according to claim 1, in the determination target data to be determined, to determine whether document data is quoted A citation determination support apparatus, wherein a determination range specifying means for specifying a determination range of the presence or absence of citation of the document data from the determination target data, and a comparison between the determination target data from the reference data A comparison range specifying means for specifying a range, and a description content of the determination range specified by the determination range specifying means is searched from the comparison range specified by the comparison range specifying means, and the determination range The similarity calculation means for calculating the mutual similarity between the description content of the comparison range and the description content of the comparison range, and the determination range when the similarity calculated by the similarity calculation means is equal to or greater than a predetermined threshold Before And determining citation determining means and cites comparison range, and output means for outputting the determination range of the determination target data that cite the comparison range of the document data at the document cited judging means When it is determined that the determination range refers to the comparison range, it is determined whether or not the reference is a legal reference based on the reference position of the comparison range in the determination range and its vicinity. And a legality determining means .

また、請求項2に記載の引用判定支援装置は、請求項1に記載の引用判定支援装置において、前記適法性判定手段は、前記引用箇所の引用元である前記文献データを特定する引用元情報が、前記判定対象データに含まれているか否かを判定することを特徴とする。 Further, the citation determination support apparatus according to claim 2 is the citation determination support apparatus according to claim 1, wherein the legality determination means specifies the document data that is the citation source of the cited part. Is determined to be included in the determination target data .

また、請求項3に記載の引用判定支援装置は、請求項1又は2に記載の引用判定支援装置において、前記適法性判定手段は、前記判定範囲において前記類似度が所定の閾値以上である場合に、当該判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における前記比較範囲の引用が適法な引用であるか否かを判定することを特徴とする。 Further, the citation determination support device according to claim 3 is the citation determination support device according to claim 1 or 2 , wherein the legality determination means has the similarity equal to or greater than a predetermined threshold in the determination range. Determining whether or not the determination range matches a predetermined citation format, and determining whether or not the comparison range citation in the determination range is a legal citation based on the determination result. Features.

また、請求項4に記載の引用判定支援装置は、請求項に記載の引用判定支援装置において、前記判定対象データの種別と、前記所定の引用形式とを、相互に関連付けて格納する引用形式格納手段を備え、前記適法性判定手段は、前記判定対象データの種別を特定し、当該特定した種別に対応する前記引用形式を前記引用形式格納手段から取得し、当該取得した引用形式に前記判定範囲における前記比較範囲の引用が合致するか否かを判定することを特徴とする。 A citation determination support apparatus according to claim 4 is the citation determination support apparatus according to claim 3 , wherein the citation determination support apparatus according to claim 3 stores the type of the determination target data and the predetermined citation format in association with each other. Storage means, wherein the legality determination means identifies the type of the determination target data, acquires the citation format corresponding to the specified type from the citation format storage means, and determines the determination to the acquired citation format It is determined whether or not the reference of the comparison range in the range matches .

また、請求項5に記載の引用判定支援装置は、請求項1から4のいずれか一項に記載の引用判定支援装置において、前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該比較範囲を含む前記文献データを参照するための参照情報を、当該文献データに基づいて取得する参照情報取得手段を備え、前記出力手段は、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲に加えて、前記参照情報取得手段にて取得された前記参照情報を出力することを特徴とする。 The citation determination support apparatus according to claim 5 is the citation determination support apparatus according to any one of claims 1 to 4, wherein the determination range is referred to by the reference citation determination unit. A reference information acquisition unit that acquires reference information for referring to the document data including the comparison range based on the document data, and the output unit includes: In addition to the determination range of the determination target data citing the comparison range, the reference information acquired by the reference information acquisition unit is output .

また、請求項6に記載の引用判定支援装置は、請求項1から5のいずれか一項に記載の引用判定支援装置において、前記判定範囲特定手段は、前記判定対象データを構成する構成部分の中から、所定の構成部分を前記判定範囲として特定することを特徴とする。 Further, the citation determination support device according to claim 6 is the citation determination support device according to any one of claims 1 to 5, wherein the determination range specifying means is a component of the determination target data. A predetermined constituent part is specified as the determination range from the inside .

また、請求項7に記載の引用判定支援装置は、請求項1から6のいずれか一項に記載の引用判定支援装置において、過去に生成された前記判定対象データの作成者を一意に識別するための作成者識別情報に対して、前記判定対象データにおける不正な引用行為の有無を示す情報、又は前記作成者の成績を対応づけて記憶する履歴記憶手段を備え、判定対象となり得る前記判定対象データが複数存在する場合において、前記判定範囲特定手段は、前記不正な引用行為が有った旨を示す情報に対応する前記作成者識別情報を前記履歴記憶手段から取得し、又は所定値より低い前記作成者の成績に対応する前記作成者識別情報を前記履歴記憶手段から取得し、当該取得した作成者識別情報にて識別される作成者が作成した前記判定対象データを、前記複数の判定対象データの中から前記判定対象として選択することを特徴とする。 In addition, the citation determination support device according to claim 7 uniquely identifies the creator of the determination target data generated in the past in the citation determination support device according to any one of claims 1 to 6. The determination target may include a history storage unit that stores information indicating whether or not there is an illegal citation in the determination target data, or stores the creator's results in association with the creator identification information for the determination target data In a case where there are a plurality of data, the determination range specifying unit acquires the creator identification information corresponding to information indicating that there is an illegal quoting act from the history storage unit, or is lower than a predetermined value The creator identification information corresponding to the creator's grade is acquired from the history storage means, and the determination target data created by the creator identified by the acquired creator identification information is And selecting as the determination target from a plurality of judgment object data.

また、請求項8に記載の引用判定支援装置は、請求項1から7のいずれか一項に記載の引用判定支援装置において、前記文献データに含まれ得る単語に対して、当該単語を修正する際に用いられ得る単語を対応づけて記憶する辞書記憶手段と、前記判定対象データに含まれる単語を、前記辞書記憶手段にて記憶された単語に変換する単語変換手段とを備え、前記判定範囲特定手段は、前記単語変換手段による変換が行われた前記判定対象データを、前記判定対象とすることを特徴とする。 Moreover, the quotation determination assistance apparatus of Claim 8 is a quotation determination assistance apparatus as described in any one of Claims 1-7. WHEREIN: The said word is corrected with respect to the word which can be contained in the said literature data. Dictionary storage means for storing words that can be used in association with each other, and word conversion means for converting words included in the determination target data into words stored in the dictionary storage means, the determination range The specifying means uses the determination target data converted by the word conversion means as the determination target .

また、請求項9に記載の引用判定支援装置は、請求項1から8のいずれか一項に記載の引用判定支援装置において、当該引用判定支援装置に対する操作入力を受け付ける入力手段を備え、前記判定範囲特定手段は、前記判定対象データの中から、前記入力手段を介して指定された範囲を前記判定範囲として特定することを特徴とする。 A citation determination support apparatus according to claim 9 is the citation determination support apparatus according to any one of claims 1 to 8 , further comprising an input unit that receives an operation input to the citation determination support apparatus. The range specifying means specifies the range specified through the input means as the determination range from the determination target data .

また、請求項10に記載の引用判定支援装置は、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段とを備え、前記類似度算出手段は、さらに、前記判定対象データ記憶手段に記憶された前記複数の判定対象データの相互間において、前記類似度を算出し、前記文献引用判定手段は、さらに、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定することを特徴とする。 The citation determination support apparatus according to claim 10 is a citation determination support apparatus for determining whether or not document data is cited among the determination target data to be determined. A determination range specifying means for specifying a determination range for the presence or absence of citation of the document data from data; a comparison range specifying means for specifying a comparison range with the determination target data from the document data; and the determination The description content of the determination range specified by the range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range are mutually When the similarity calculated by the similarity calculator is greater than or equal to a predetermined threshold, it is determined that the determination range refers to the comparison range Sentence Citation determination means, output means for outputting the determination range of the determination target data quoting the comparison range of the document data, and determination target data storage means for storing a plurality of determination target data generated in the past The similarity calculation unit further calculates the similarity between the plurality of determination target data stored in the determination target data storage unit, and the document citation determination unit further includes: When the similarity calculated by the similarity calculation means is greater than or equal to a predetermined second threshold, it is determined that the plurality of determination target data are cited among each other, and the comparison range specifying means is A plurality of determination target data determined to be cited among the plurality of determination target data are specified as the comparison range .

また、請求項11に記載の引用判定支援装置は、請求項1から10のいずれか一項に記載の引用判定支援装置において、前記判定対象データの記述内容に基づいて、当該判定対象データの中から、当該判定対象データの課題を示す課題情報を抽出する課題抽出手段を備え、前記比較範囲特定手段は、前記課題抽出手段にて抽出された前記課題情報を検索キーとして前記文献データを検索し、当該検索された文献データを前記比較対象として特定することを特徴とする。 In addition, the citation determination support device according to claim 11 is the citation determination support device according to any one of claims 1 to 10, wherein the citation determination support device includes the determination target data based on the description content of the determination target data. From the above, the comparison range specifying means searches the document data using the assignment information extracted by the assignment extracting means as a search key. The retrieved document data is specified as the comparison target .

また、請求項12に記載の引用判定支援装置は、請求項1から11のいずれか一項に記載の引用判定支援装置において、前記判定範囲において引用されていると前記文献引用判定手段によって判定された前記文献データを記憶する文献データ記憶手段を備え、前記比較範囲特定手段は、前記判定対象データにおいて引用されている前記文献データを特定する引用元情報が当該判定対象データに含まれているか否かを判定し、当該引用元情報が当該判定対象データに含まれていると判定した場合、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されているか否かを判定し、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定することを特徴とする。 A citation determination support device according to claim 12 is determined by the document citation determination means in the citation determination support device according to any one of claims 1 to 11 as being cited in the determination range. The reference data storage means for storing the reference data, wherein the comparison range specifying means includes, in the determination target data, citation source information for specifying the reference data cited in the determination target data. If it is determined that the citation source information is included in the determination target data, whether or not the document data specified based on the citation source information is stored in the document data storage unit. If it is determined that the document data specified based on the citation source information is stored in the document data storage unit, the document data And identifies as a comparison range.

また、請求項13に記載の引用判定支援装置は、請求項1から12のいずれか一項に記載の引用判定支援装置において、前記類似度算出手段は、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を検索キーとして、前記比較範囲特定手段にて特定された前記比較範囲の中から検索した場合であって、前記検索キーの文字数が、予め定められた制限文字数を超えている場合に、前記検索キーとして前記制限文字数以内の文字を前記判定範囲の中から順次指定して、前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。 The citation determination support device according to claim 13 is the citation determination support device according to any one of claims 1 to 12, wherein the similarity calculation unit is specified by the determination range specification unit. When the description content of the determination range is used as a search key to search from the comparison range specified by the comparison range specifying unit, the number of characters of the search key exceeds a predetermined limit number of characters If the number of characters within the limit number is sequentially specified as the search key from the determination range, the search range is searched a plurality of times, and the appearance frequency is predetermined in a plurality of search results. A search result larger than the value is set as a target of the comparison range for calculating the degree of similarity with the description content of the determination range .

また、請求項14に記載の引用判定支援装置は、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段とを備え、前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。 The citation determination support apparatus according to claim 14 is a citation determination support apparatus for determining whether or not document data is cited among the determination target data to be determined. A determination range specifying means for specifying a determination range for the presence or absence of citation of the document data from data; a comparison range specifying means for specifying a comparison range with the determination target data from the document data; and the determination The description content of the determination range specified by the range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range are mutually When the similarity calculated by the similarity calculator is greater than or equal to a predetermined threshold, it is determined that the determination range refers to the comparison range Sentence A citation determination unit; and an output unit that outputs the determination range of the determination target data quoting the comparison range of the document data. The similarity calculation unit analyzes the determination range and analyzes the predetermined range. Using the appearing word as a search key, a search is performed a plurality of times from the comparison range specified by the comparison range specifying means for each word, and the appearance frequency is greater than a predetermined value in the search results of the plurality of times The search result is a target of the comparison range for calculating the degree of similarity with the description content of the determination range .

また、請求項15に記載の引用判定支援装置は、請求項1から14のいずれか一つに記載の引用判定支援装置において、前記所定の閾値の入力を受け付ける入力手段を備え、
前記文献引用判定手段は、前記類似度が前記入力手段を介して入力された所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定することを特徴とする。
A citation determination support apparatus according to claim 15 is the citation determination support apparatus according to any one of claims 1 to 14, further comprising an input unit that receives an input of the predetermined threshold value.
The document citation determination unit determines that the determination range refers to the comparison range when the similarity is equal to or higher than a predetermined threshold input via the input unit .

また、請求項16に記載の引用判定支援装置は、請求項1から15のいずれか一つに記載の引用判定支援装置において、前記判定範囲の記述内容の内、前記比較範囲から引用された記述内容が占める引用割合を算出する引用割合算出手段を備え、前記出力手段は、前記引用割合を出力することを特徴とする。 A citation determination support apparatus according to claim 16 is the citation determination support apparatus according to any one of claims 1 to 15 , wherein a description cited from the comparison range in the description contents of the determination range. A quoting ratio calculating means for calculating a quoting ratio occupied by the contents is provided, wherein the output means outputs the quoting ratio .

また、請求項17に記載の引用判定支援装置は、請求項16に記載の引用判定支援装置において、前記引用割合算出手段は、複数の前記判定対象データについて前記引用割合を算出し、前記出力手段は、前記複数の判定対象データを一意に識別する判定対象データ情報を、当該各判定対象データについて前記引用割合算出手段が算出した前記引用割合に基づく順序で出力することを特徴とする。 The citation determination support apparatus according to claim 17 is the citation determination support apparatus according to claim 16 , wherein the citation ratio calculation means calculates the citation ratio for a plurality of the determination target data, and the output means. Is characterized in that determination target data information for uniquely identifying the plurality of determination target data is output in an order based on the citation ratio calculated by the citation ratio calculation means for each determination target data .

また、請求項18に記載の引用判定支援装置は、請求項1から17のいずれか一項に記載の引用判定支援装置において、前記判定範囲の前記類似度と、前記出力手段による出力態様とを、相互に対応付けて格納する出力態様情報格納手段を備え、前記出力手段は、前記類似度算出手段にて算出された前記類似度に対応する前記出力態様を前記出力態様情報格納手段から取得し、当該取得した出力態様にて前記判定範囲を出力することを特徴とする。 In addition, the citation determination support device according to claim 18 is the citation determination support device according to any one of claims 1 to 17 , wherein the similarity of the determination range and an output mode by the output means. Output mode information storage means for storing the data in association with each other, wherein the output means obtains the output mode corresponding to the similarity calculated by the similarity calculation means from the output mode information storage means. The determination range is output in the acquired output mode .

また、請求項19に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段と、して機能させることを特徴とする。 The citation determination support program according to claim 19 is a citation determination support program for determining whether or not the document data is cited in the determination target data to be determined. A determination range specifying unit for specifying a determination range for the presence or absence of citation of the document data from the determination target data; and a comparison range specifying unit for specifying a comparison range with the determination target data from the document data; The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description of the comparison range When the similarity calculation unit calculates the mutual similarity of the contents, and the similarity calculated by the similarity calculation unit is a predetermined threshold or more, the determination range is the comparison range. The document citation determination unit that determines that the document is cited, the output unit that outputs the determination range of the determination target data that cites the comparison range of the document data, and the determination by the document citation determination unit When it is determined that the range refers to the comparison range, the legality for determining whether the reference is a legal reference based on the reference location of the comparison range in the determination range and the vicinity thereof It functions as a sex determination means .

また、請求項20に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、前記類似度算出手段は、過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段に記憶された当該複数の判定対象データの相互間において、前記類似度を算出し、前記文献引用判定手段は、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定することを特徴とする。
また、請求項21に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。
The citation determination support program according to claim 20 is a citation determination support program for determining whether or not the document data is cited in the determination target data to be determined. A determination range specifying unit for specifying a determination range for the presence or absence of citation of the document data from the determination target data; and a comparison range specifying unit for specifying a comparison range with the determination target data from the document data; The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description of the comparison range When the similarity calculation unit calculates the mutual similarity of the contents, and the similarity calculated by the similarity calculation unit is a predetermined threshold or more, the determination range is the comparison range. In the as determining citations determining means quotes, and output means for outputting the determination range of the determination target data that cite the comparison range of the document data, cited decision support program which to function And the similarity calculation means calculates the similarity between the plurality of determination target data stored in the determination target data storage means for storing the plurality of determination target data generated in the past, and The document citation determination unit determines that the plurality of determination target data are cited when the similarity calculated by the similarity calculation unit is a predetermined second threshold or more, and The comparison range specifying means specifies a plurality of determination target data determined to be cited among the plurality of determination target data as the comparison range .
The citation determination support program according to claim 21 is a citation determination support program for determining whether or not the document data is cited in the determination target data to be determined. A determination range specifying unit for specifying a determination range for the presence or absence of citation of the document data from the determination target data; and a comparison range specifying unit for specifying a comparison range with the determination target data from the document data; The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description of the comparison range When the similarity calculation unit calculates the mutual similarity of the contents, and the similarity calculated by the similarity calculation unit is a predetermined threshold or more, the determination range is the comparison range. A citation determination support program that functions as a document citation determination unit that determines that the document is cited, and an output unit that outputs the determination range of the determination target data quoting the comparison range of the document data. And the similarity calculation means analyzes the determination range and uses a word that appears a predetermined number or more as a search key, and searches the comparison range specified by the comparison range specification means for each word a plurality of times. In addition, a search result having an appearance frequency greater than a predetermined value among a plurality of search results is set as a target of the comparison range for calculating a mutual similarity with the description content of the determination range.

この請求項1に記載の引用判定支援装置によれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
また、引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の適法性を容易に判別することができる。
According to the citation determination support apparatus of the first aspect, since the determination of the similarity is performed after automatically limiting the determination range and the comparison range, the development process and the manufacturing cost are utilized using a general-purpose determination algorithm. It is possible to improve the accuracy of the determination while preventing the increase.
In addition, it is possible to easily determine whether or not the citation is a legal citation prescribed by the Copyright Act, and it is possible to easily determine the legality of the determination.

また、請求項2に記載の引用判定支援装置によれば、引用箇所の引用元である文献データを特定する引用元情報が判定対象データに含まれているか否かを判定するので、引用元情報の有無に基づいて引用の適法性を判定する際の判断材料を取得できる。 In addition, according to the citation determination support apparatus according to claim 2, since it is determined whether or not the citation source information for specifying the document data that is the citation source of the citation portion is included in the determination target data, the citation source information It is possible to obtain a judgment material for judging the legality of a citation based on the presence or absence of .

また、請求項3に記載の引用判定支援装置によれば、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定するので、予め設定した引用形式に基づき、引用の適法性を容易に判定することができる。 In addition, according to the citation determination support apparatus according to claim 3, it is determined whether or not the determination range matches a predetermined citation format, and the citation of the comparison range in the determination range is legal based on the determination result. Therefore, it is possible to easily determine the legality of the citation based on a preset citation format .

また、請求項4に記載の引用判定支援装置によれば、判定対象データの種別に対応する引用形式を引用形式格納手段から取得し、当該取得した引用形式に引用が合致するか否かを判定するので、判定対象データの種別毎に異なる引用形式に基づき、引用の適法性を判定することができる。 According to the citation determination support apparatus of claim 4, the citation format corresponding to the type of the determination target data is acquired from the citation format storage means, and it is determined whether or not the citation matches the acquired citation format. Therefore, it is possible to determine the legality of citation based on a citation format that is different for each type of determination target data .

また、請求項5に記載の引用判定支援装置によれば、文献データの引用文献を自動的に特定し、この引用文献を判定対象データの判定範囲に加えた上で引用判定を行なうので、引用文献を不正に引用している場合にはこれを容易に検知することができるという効果を奏する。 Further, according to the citation determination support apparatus according to claim 5, since the cited document of the document data is automatically specified and the cited determination is performed after adding the cited document to the determination range of the determination target data, If the document is illegally cited, this can be easily detected.

また、請求項6に記載の引用判定支援装置によれば、判定対象データの構成部分の中で無断で引用されやすい箇所を判定範囲に設定することができ、判定の精度をより向上させることができるという効果を奏する。 In addition, according to the citation determination support apparatus according to claim 6, it is possible to set, in the determination range, a portion that is likely to be quoted without permission among the constituent parts of the determination target data, thereby further improving the determination accuracy. There is an effect that can be done.

また、請求項7に記載の引用判定支援装置によれば、不正な引用を行う確率が高い者の判定対象データを自動的に判定対象に設定することができ、不正が再発する可能性を加味した上で判定を行なうことができ、判定の精度をより向上させることができるという効果を奏する。 In addition, according to the citation determination support apparatus according to claim 7, determination target data of a person who has a high probability of performing illegal citation can be automatically set as a determination target, taking into account the possibility that the fraud will recur. In addition, the determination can be performed and the determination accuracy can be further improved.

また、請求項8に記載の引用判定支援装置によれば、文献データをそのまま利用せずに修正した上で不正に引用した場合でも、引用か否かを判定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。 Further, according to the citation determination support apparatus according to claim 8, even when the document data is corrected without being used as it is and illegally cited, it can be determined whether or not it is a citation. There is an effect that the accuracy of determination can be further improved while preventing an increase in cost .

また、請求項9に記載の引用判定支援装置によれば、判定対象データの中から、入力手段を介して指定された範囲を判定範囲として特定するので、引用判定を行う対象を限定することができ、判定処理に伴う負荷を低減することができる。 Further, according to the quotation determination support apparatus according to claim 9, since the range designated through the input means is specified as the determination range from the determination target data, it is possible to limit the target for performing the citation determination. It is possible to reduce the load associated with the determination process.

また、請求項10に記載の引用判定支援装置によれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
また、他人の文献データを引用している可能性の高い文献データを自動的に比較範囲に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
Further, according to the citation determination support apparatus according to claim 10, since the determination of the similarity is performed after automatically limiting the determination range and the comparison range, the development process and the manufacturing are performed using a general-purpose determination algorithm. There is an effect that the accuracy of determination can be improved while preventing an increase in cost.
In addition, it is possible to automatically set the reference data that is likely to cite another person's reference data in the comparison range, and to improve the accuracy of determination while preventing an increase in the development process and manufacturing cost. There is an effect that can be done.

また、請求項11に記載の引用判定支援装置によれば、判定対象データの記述内容に即した適切な比較範囲を自動的に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。 Further, according to the citation determination support apparatus according to claim 11, it is possible to automatically set an appropriate comparison range in accordance with the description content of the determination target data, while preventing an increase in development process and manufacturing cost. There is an effect that the accuracy of determination can be further improved.

また、請求項12に記載の引用判定支援装置によれば、判定範囲において引用されていると文献引用判定手段によって判定された文献データを文献データ記憶手段に記憶させる。また、文献データを特定する引用元情報が判定対象データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定する。これにより、既に文献データ記憶手段に記憶されている文献データに比較範囲を限定することができ、比較範囲のデータから判定範囲の内容を検索する際の負荷を低減することができる。 According to the citation determination assisting device of the twelfth aspect, the document data storage unit stores the document data determined by the document citation determination unit as being cited in the determination range. In addition, when the citation source information for specifying the document data is included in the determination target data, when it is determined that the document data specified based on the citation source information is stored in the document data storage unit, Identify literature data as a comparison range. Thereby, the comparison range can be limited to the document data already stored in the document data storage means, and the load when searching the contents of the determination range from the data of the comparison range can be reduced.

また、請求項13に記載の引用判定支援装置によれば、判定対象になる論文データが検索キーの制限文字数を超えている場合であっても、検索を実行することが可能になる。また、論文データの各部を順次検索対象としつつ、最終的には論文データ全体を実質的に検索範囲に含めることができるので、引用判定の精度を向上させることができるという効果を奏する。 In addition, according to the citation determination support apparatus described in claim 13, it is possible to execute a search even when the paper data to be determined exceeds the limit number of characters of the search key. Further, since each part of the paper data is sequentially searched, and finally the whole paper data can be substantially included in the search range, the accuracy of citation determination can be improved.

また、請求項14に記載の引用判定支援装置によれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
また、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。
Further, according to the citation determination support apparatus according to claim 14, since the similarity is determined after automatically limiting the determination range and the comparison range, the development process and manufacturing are performed using a general-purpose determination algorithm. There is an effect that the accuracy of determination can be improved while preventing an increase in cost.
In addition, search results with a high frequency of occurrence are automatically identified, and this search result is automatically set as a comparison range used for similarity calculation. Therefore, a comparison range that matches the determination range is automatically extracted and cited. The determination can be performed, and the accuracy of the citation determination can be further improved.

また、請求項15に記載の引用判定支援装置によれば、類似度が入力手段を介して入力された所定の閾値以上である場合に、判定範囲が比較範囲を引用していると判定するので、判定の目的に合わせて最適な閾値を設定し、当該閾値に基づく判定を行わせることができる。 Further, according to the citation determination support device according to claim 15, when the similarity is equal to or higher than the predetermined threshold value input via the input means, it is determined that the determination range refers to the comparison range. It is possible to set an optimum threshold value in accordance with the purpose of the determination and make a determination based on the threshold value .

また、請求項16に記載の引用判定支援装置によれば、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出及び出力するので、引用の適法性の判断材料を提示することができる。 In addition, according to the citation determination support apparatus according to claim 16, since the citation ratio occupied by the description content cited from the comparison range in the description content of the determination range is calculated and output, Can be presented .

また、請求項17に記載の引用判定支援装置によれば、複数の判定対象データについて引用割合を算出し、各判定対象データについての引用割合に基づく順序で判定対象データ情報を出力するので、複数の判定対象データにおける引用の適法性を引用割合に基づいて比較するための判断材料を提示することができる。 Further, according to the citation determination support device according to claim 17, the citation ratio is calculated for a plurality of determination target data, and the determination target data information is output in an order based on the citation ratio for each determination target data. It is possible to present a determination material for comparing the legality of citations in the determination target data based on the citation ratio .

また、請求項18に記載の引用判定支援装置によれば、類似度算出手段にて算出された類似度に対応する出力態様を出力態様情報格納手段から取得し、当該取得した出力態様にて判定範囲を出力するので、ユーザが類似度を把握し易い態様で判定範囲を出力することができる。 According to the citation determination support apparatus according to claim 18, the output mode corresponding to the similarity calculated by the similarity calculation unit is acquired from the output mode information storage unit, and the determination is made based on the acquired output mode. Since the range is output, the determination range can be output in a manner in which the user can easily grasp the similarity .

また、請求項19に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
また、引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の適法性を容易に判別することができる。
Further, according to the citation determination support program according to claim 19, since the similarity is determined after automatically limiting the determination range and the comparison range, the development process and the manufacturing are performed using a general-purpose determination algorithm. There is an effect that the accuracy of determination can be improved while preventing an increase in cost.
In addition, it is possible to easily determine whether or not the citation is a legal citation prescribed by the Copyright Act, and it is possible to easily determine the legality of the determination .

また、請求項20に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。また、他人の文献データを引用している可能性の高い文献データを自動的に比較範囲に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
また、請求項21に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。また、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。
Further, according to the citation determination support program according to claim 20, since the similarity is determined after automatically limiting the determination range and the comparison range, the development process and the manufacturing are performed using a general-purpose determination algorithm. There is an effect that the accuracy of determination can be improved while preventing an increase in cost. In addition, it is possible to automatically set the reference data that is likely to cite another person's reference data in the comparison range, and to improve the accuracy of determination while preventing an increase in the development process and manufacturing cost. There is an effect that can be done.
Further, according to the quotation determination support program according to claim 21, since the determination of the similarity is performed after automatically limiting the determination range and the comparison range, the development process and the manufacturing are performed using a general-purpose determination algorithm. There is an effect that the accuracy of determination can be improved while preventing an increase in cost. In addition, search results with a high frequency of occurrence are automatically identified, and this search result is automatically set as a comparison range used for similarity calculation. Therefore, a comparison range that matches the determination range is automatically extracted and cited. The determination can be performed, and the accuracy of the citation determination can be further improved.

実施の形態1に係る引用判定支援装置を含むシステム構成を機能概念的に示すブロック図である。1 is a block diagram functionally conceptually showing a system configuration including a citation determination support apparatus according to Embodiment 1. FIG. 実施の形態1の引用判定支援処理の手順を示すフローチャートである。6 is a flowchart illustrating a procedure of a citation determination support process according to the first embodiment. 引用判定画面の一例を示す模式図である。It is a schematic diagram which shows an example of a quotation determination screen. 論文データ中で判定範囲として特定される本文の部分の一例を示す説明図である。It is explanatory drawing which shows an example of the part of the text specified as a determination range in paper data. 判定範囲の内容が表示された引用判定画面の一例を示す模式図である。It is a schematic diagram which shows an example of the quotation determination screen on which the content of the determination range was displayed. 比較範囲の特定処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the specific process of a comparison range. 引用判定画面において判定範囲内で引用箇所が強調表示されている状態を示す模式図である。It is a schematic diagram which shows the state by which the quotation location is highlighted within the determination range on the quotation determination screen. 引用判定画面において参照情報が表示された状態を示す模式図である。It is a schematic diagram which shows the state by which the reference information was displayed on the quotation determination screen. 実施の形態2に係る引用判定支援装置の機能的構成を示すブロック図である。6 is a block diagram illustrating a functional configuration of a citation determination support apparatus according to Embodiment 2. FIG. 履歴データの一例を示す説明図である。It is explanatory drawing which shows an example of log | history data. 実施の形態2の引用判定支援処理の手順を示すフローチャートである。10 is a flowchart illustrating a procedure of a citation determination support process according to the second embodiment. 実施の形態2の判定対象の特定処理の手順を示すフローチャートである。10 is a flowchart illustrating a procedure of determination target identification processing according to the second embodiment. 実施の形態3に係る引用判定支援装置の機能的構成を示すブロック図である。10 is a block diagram showing a functional configuration of a citation determination support apparatus according to Embodiment 3. FIG. 専門辞書の一例を示す説明図である。It is explanatory drawing which shows an example of a specialized dictionary. 実施の形態3の判定対象の特定の手順を示すフローチャートである。10 is a flowchart illustrating a specific procedure to be determined according to the third embodiment. 実施の形態4に係る引用判定支援装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the quotation determination assistance apparatus which concerns on Embodiment 4. FIG. 実施の形態4の比較判定処理の手順を示すフローチャートである。14 is a flowchart illustrating a procedure of comparison determination processing according to the fourth embodiment. 実施の形態5に係る引用判定支援装置の機能的構成を示すブロック図である。FIG. 10 is a block diagram illustrating a functional configuration of a citation determination support apparatus according to a fifth embodiment. 実施の形態5の比較範囲特定処理の手順を示すフローチャートである。16 is a flowchart illustrating a procedure of comparison range specifying processing according to the fifth embodiment. 実施の形態6に係る引用判定支援装置の機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of the quotation determination assistance apparatus which concerns on Embodiment 6. FIG. 実施の形態6の類似度算出における検索処理の手順を示すフローチャートである。20 is a flowchart illustrating a procedure of search processing in similarity calculation according to the sixth embodiment. 変形例1の類似度算出処理の手順を示すフローチャートである。10 is a flowchart illustrating a procedure of similarity calculation processing according to Modification 1; 変形例2の比較範囲特定処理の手順を示すフローチャートである。10 is a flowchart illustrating a procedure of a comparison range specifying process according to Modification 2. 実施の形態7に係る引用判定支援装置の機能的構成を示すブロック図である。FIG. 20 is a block diagram showing a functional configuration of a citation determination support apparatus according to Embodiment 7. 引用形式DBに格納される情報を示した表である。It is the table | surface which showed the information stored in quotation format DB. 実施の形態7の引用判定支援処理の手順を示すフローチャートである。18 is a flowchart illustrating a procedure of citation determination support processing according to the seventh embodiment. 引用形式設定処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a quotation format setting process. 引用形式設定入力画面を例示した図である。It is the figure which illustrated the quotation format setting input screen. 適法性判定処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a legality determination process. 実施の形態8に係る引用判定支援装置の機能的構成を示すブロック図である。FIG. 20 is a block diagram illustrating a functional configuration of a citation determination support apparatus according to an eighth embodiment. 引用割合DBに格納される情報を例示した表である。It is the table | surface which illustrated the information stored in quotation ratio DB. 実施の形態8の引用判定支援処理の手順を示すフローチャートである。20 is a flowchart illustrating a procedure of citation determination support processing according to an eighth embodiment. 引用割合を出力表示した場合の引用判定画面を例示した図である。It is the figure which illustrated the quotation determination screen at the time of outputting and displaying a quotation rate. リスト表示処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a list display process. 引用割合の合計値の降順で論文データ情報のリストを表示する判定結果画面を示す図である。It is a figure which shows the determination result screen which displays the list | wrist of article data information in descending order of the total value of a quotation rate. 実施の形態9に係る引用判定支援装置の機能的構成を示すブロック図である。FIG. 38 is a block diagram showing a functional configuration of a citation determination support apparatus according to Embodiment 9. 出力態様DBに格納される情報を例示した表である。It is the table | surface which illustrated the information stored in output mode DB. 実施の形態9の引用判定支援処理の手順を示すフローチャートである。30 is a flowchart illustrating a procedure of a citation determination support process according to the ninth embodiment. 表示装置上の引用判定画面に表示された論文データを示す図である。It is a figure which shows the paper data displayed on the quotation determination screen on a display apparatus. 引用元情報が表示された引用判定画面を示す図である。It is a figure which shows the quotation determination screen on which quotation origin information was displayed. 実施の形態10の引用判定支援処理の手順を示すフローチャートである。FIG. 38 is a flowchart illustrating a citation determination support process according to the tenth embodiment. 実施の形態10の比較判定処理の手順を示すフローチャートである。32 is a flowchart illustrating a procedure of comparison determination processing according to the tenth embodiment.

以下に添付図面を参照して、この発明に係る引用判定支援装置および引用判定支援プログラムの実施の形態を詳細に説明する。まず、本実施の形態の構成を説明した後、本実施の形態の処理内容について説明し、最後に本実施の形態に対する変形例について説明する。ただし、本実施の形態によって本発明が限定されるものではない。   Exemplary embodiments of a citation determination support apparatus and a citation determination support program according to the present invention will be described below in detail with reference to the accompanying drawings. First, after describing the configuration of the present embodiment, the processing content of the present embodiment will be described, and finally, a modification to the present embodiment will be described. However, the present invention is not limited by the present embodiment.

〔実施の形態1〕
まず実施の形態1について説明する。この形態は、論文データのうち、第三者の文献を引用する可能性が高い構成部分を自動的に選定して判定範囲とする形態である。
[Embodiment 1]
First, the first embodiment will be described. This form is a form that automatically selects a constituent part that is highly likely to cite a third-party document from the paper data and sets it as a determination range.

図1は、実施の形態1に係る引用判定支援装置を含むシステム構成を機能概念的に示すブロック図である。引用判定支援装置100は、図1に示すように、インターネット130等の任意のネットワークを介して、WEBサイト131やファイルサーバ133に対して通信可能に接続されている。なお、これらWEBサイト131やファイルサーバ133は従来と同様に構成することができるので、その詳細な説明を省略する。   FIG. 1 is a block diagram functionally conceptually showing a system configuration including a citation determination support apparatus according to the first embodiment. As shown in FIG. 1, the quotation determination support apparatus 100 is communicably connected to a WEB site 131 and a file server 133 via an arbitrary network such as the Internet 130. Since the WEB site 131 and the file server 133 can be configured in the same manner as in the past, detailed description thereof will be omitted.

(構成)
引用判定支援装置100は、図1に示すように、記憶部101及び制御部102をバスにて接続して構成されると共に、入力装置103及び表示装置104とを備えている。
(Constitution)
As shown in FIG. 1, the quotation determination support apparatus 100 is configured by connecting a storage unit 101 and a control unit 102 via a bus, and includes an input device 103 and a display device 104.

記憶部101は、引用判定支援装置100の制御に必要な各種のプログラム及びデータを格納する記憶手段であり、例えばハードディスクドライブ装置(HDD)やメモリ等の記憶媒体にて構成されている。特に、記憶部101には、図示しない記録媒体に格納され図示しない読み取り装置にて読み取られた引用判定支援プログラムがインストールされている。この記憶部101には、文献データ記憶部101a、文献リスト記憶部101b、及び論文データ記憶部101cが設けられている。   The storage unit 101 is a storage unit that stores various programs and data necessary for control of the citation determination support apparatus 100, and is configured by a storage medium such as a hard disk drive (HDD) or a memory. In particular, a citation determination support program stored in a recording medium (not shown) and read by a reading device (not shown) is installed in the storage unit 101. The storage unit 101 includes a document data storage unit 101a, a document list storage unit 101b, and a paper data storage unit 101c.

文献データ記憶部101aは、論文データの引用元となりうる文献データを記憶するものである。本実施の形態では、文献データが、引用判定支援装置100に備えた文献データ記憶部101aに記憶されると共に、WEBサイト131及びファイルサーバ133にも保存されているものとする。   The document data storage unit 101a stores document data that can be a citation source of paper data. In the present embodiment, it is assumed that document data is stored in the document data storage unit 101 a provided in the citation determination support apparatus 100 and is also stored in the WEB site 131 and the file server 133.

文献リスト記憶部101bは、文献データ記憶部101aに記録された文献データおよびインターネット上の文献データの文献名、URL(Uniform Resource Locator)やフォルダ名等の保存場所、ファイル名、作成者、作成年月日等の書誌情報の一覧を記憶するものである。   The document list storage unit 101b stores the document data recorded in the document data storage unit 101a and the document name, URL (Uniform Resource Locator) and folder name of the document data on the Internet, file name, creator, creation year A list of bibliographic information such as dates is stored.

論文データ記憶部101cは、引用判定の対象となる論文データを、論文データの作成者である学生を識別するための学籍簿番号と対応づけて記憶するものである。この論文データ記憶部101cには、今回引用判定の対象となる論文データを学生の端末から受信して格納しておく他、過去に提出されて引用判定を行った全ての論文データがその作成者である学生の学籍簿番号と対応づけられて格納されている。   The thesis data storage unit 101c stores the article data that is subject to citation determination in association with a student register number for identifying a student who is the creator of the article data. In this paper data storage unit 101c, the paper data that is the subject of citation determination this time is received from the student's terminal and stored, and all the paper data submitted in the past and subjected to citation determination are the creators of them. Is stored in association with the student register number of the student.

制御部102は、引用判定支援装置100の制御を行う制御手段であり、機能概念的に、判定範囲特定部102a、比較範囲特定部102b、類似度算出部102c、文献引用判定部102d、適法性判定部102e、参照情報取得部102f、入力制御部102g、及び出力制御部102hを備える。この制御部102の具体的構成は任意であるが、例えば、OS(Operating System)などの制御プログラム、各種の処理手順などを規定した組み込みプログラム、所要データを格納するための内部メモリ、及び、これらのプログラムを実行するCPU(Central Processing Unit)を備えて構成される。   The control unit 102 is a control unit that controls the citation determination support apparatus 100, and functionally conceptually includes a determination range specifying unit 102a, a comparison range specifying unit 102b, a similarity calculation unit 102c, a document citation determination unit 102d, and legality. A determination unit 102e, a reference information acquisition unit 102f, an input control unit 102g, and an output control unit 102h are provided. The specific configuration of the control unit 102 is arbitrary. For example, a control program such as an OS (Operating System), an embedded program that defines various processing procedures, an internal memory for storing required data, and these And a CPU (Central Processing Unit) for executing the program.

判定範囲特定部102aは、論文データ記憶部101cに保存されている論文データの中から、文献データの引用の有無の判定範囲を特定する判定範囲特定手段である。   The determination range specifying unit 102a is a determination range specifying unit for specifying a determination range for the presence or absence of citation of document data from among the paper data stored in the paper data storage unit 101c.

比較範囲特定部102bは、論文データの判定範囲との比較範囲となる文献データ等を特定する比較範囲特定手段である。   The comparison range specifying unit 102b is a comparison range specifying unit that specifies document data or the like that is a comparison range with the determination range of the article data.

類似度算出部102cは、判定範囲特定部102aによって特定された判定範囲の記述内容を検索キーとして、比較範囲特定部102bによって特定された文献データや過去の論文データ(以下、「文献データ等」という)の比較範囲を検索し、相互の類似度を算出する類似度算出手段である。   The similarity calculation unit 102c uses the description content of the determination range specified by the determination range specification unit 102a as a search key, and the document data specified by the comparison range specification unit 102b or past paper data (hereinafter referred to as “reference data etc.”). The similarity calculation means for searching the comparison range and calculating the mutual similarity.

文献引用判定部102dは、類似度算出部102cによって算出された類似度が所定の閾値以上である場合に、論文データの判定範囲が比較範囲の文献データ等を引用していると判定する文献引用判定手段である。   The document citation determination unit 102d determines that the determination range of the article data is citation of reference data in the comparison range when the similarity calculated by the similarity calculation unit 102c is equal to or greater than a predetermined threshold. It is a determination means.

適法性判定部102eは、文献引用判定部102dによって、論文データの判定範囲が比較範囲の文献データ等を引用していると判定された場合に、判定範囲における文献データ等の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段である。   The legitimacy determination unit 102e, when it is determined by the document citation determination unit 102d that the determination range of the article data is quoting the document data or the like of the comparison range, the citation location of the document data or the like in the determination range and its vicinity It is legality determination means for determining whether or not the citation is a legal citation based on the location.

参照情報取得部102fは、論文データの判定範囲が比較範囲の文献データ等を引用していると判定された場合に、文献データ等を参照するための参照情報として、文献データ等の名称や題名、URLやフォルダ名等を、文献データ等の属性等から取得する参照情報取得手段である。   When it is determined that the determination range of the article data refers to the reference data in the comparison range, the reference information acquisition unit 102f uses the name or title of the reference data as reference information for referring to the reference data or the like. Reference information acquisition means for acquiring a URL, a folder name, and the like from attributes such as document data.

入力制御部102gは、入力装置103から操作入力されることによるイベントを受付けたり、操作入力の入力制御を行う入力制御手段である。   The input control unit 102g is an input control unit that receives an event caused by an operation input from the input device 103 and performs input control of the operation input.

出力制御部102hは、表示装置104に対する各種画面の表示制御を行う出力制御手段である。この出力制御部102hは、判定範囲の表示や文献データ等の比較範囲を引用している論文データの判定範囲と上記参照情報を示す引用判定画面(後述)を表示装置104に表示する。   The output control unit 102 h is an output control unit that performs display control of various screens on the display device 104. The output control unit 102h displays on the display device 104 a citation determination screen (described later) showing the determination range of the article data quoting the comparison range such as display of the determination range and literature data and the reference information.

入力装置103は、キーボードやマウス等のポインティングデバイスの如き入力手段である。   The input device 103 is an input means such as a pointing device such as a keyboard or a mouse.

表示装置104は、モニタの如き出力手段である。   The display device 104 is output means such as a monitor.

(処理)
次に、以上のように構成された実施の形態1の引用判定支援装置100で実行される引用判定支援処理について説明する。図2は、実施の形態1の引用判定支援処理の手順を示すフローチャートである。
(processing)
Next, a citation determination support process executed by the citation determination support apparatus 100 of the first embodiment configured as described above will be described. FIG. 2 is a flowchart illustrating a procedure of the citation determination support process according to the first embodiment.

利用者が入力装置103を介して所定方法で引用判定支援処理の実行を指示すると、まず、引用判定画面が出力制御部102hによって表示装置104に表示される。図3は、引用判定画面の一例を示す模式図である。この画面で、「簡易」ボタンをクリックすると判定範囲の特定が行われる。なお、引用判定画面の「詳細」ボタンをクリックすると、文献データ記憶部101aの文献データ等を管理する検索データベース、言語、引用文献データの生成期間、キーワード、作成者などの検索のための各種設定を行う画面(図示せず)が表示される。   When the user instructs execution of the quotation determination support process by a predetermined method via the input device 103, first, a quotation determination screen is displayed on the display device 104 by the output control unit 102h. FIG. 3 is a schematic diagram illustrating an example of a citation determination screen. When the “simple” button is clicked on this screen, the determination range is specified. Clicking the “Details” button on the citation determination screen makes various settings for searching the search database for managing the document data in the document data storage unit 101a, the language, the generation period of the cited document data, keywords, creator, and the like. A screen (not shown) for performing is displayed.

判定範囲を特定するため、判定範囲特定部102aは、作成された論文データを論文データ記憶部101cから読み出す(ステップS11)。そして、判定範囲特定部102aは、公知の手法で論文データの構成の構造解析を行い(ステップS12)、論文を構成する導入部分(「はじめに」の構成部分等)、本文部分、最終部分等(「最後に」、「謝辞」の構成部分等)の構成部分を得る。そして、本文部分が論文データの主要部分であり、第三者の文献を引用する可能性が高い構成部分であることから、判定範囲特定部102aは、構造解析により得られた構成部分の中から、本文部分を判定範囲として特定する(ステップS13)。   In order to specify the determination range, the determination range specifying unit 102a reads the created paper data from the paper data storage unit 101c (step S11). Then, the determination range specifying unit 102a performs structural analysis of the structure of the paper data by a known method (step S12), and introduces parts (such as "Introduction" constituent parts) constituting the paper, text part, final part, etc. ( “Finally”, “Acknowledgment” components, etc.). Since the body part is the main part of the article data and is a constituent part that is highly likely to cite a third-party document, the determination range specifying unit 102a selects the constituent part obtained by the structural analysis. The body part is specified as the determination range (step S13).

図4は、論文データ中で判定範囲として特定される本文の部分の一例を示す説明図である。図4に示すようなレポートの場合、回答欄に記載された内容が本文に相当する構成部分であるため、判定範囲特定部102aは、この回答欄の記載内容を判定範囲として特定することになる。このように判定範囲が特定されると、出力制御部102hは、図5に示すように、特定された判定範囲の内容を引用判定画面の判定範囲欄に表示する。   FIG. 4 is an explanatory diagram showing an example of a body part specified as a determination range in the paper data. In the case of the report shown in FIG. 4, since the content described in the answer column is a component corresponding to the text, the determination range specifying unit 102a specifies the description content of the answer column as the determination range. . When the determination range is specified in this way, the output control unit 102h displays the contents of the specified determination range in the determination range column of the citation determination screen as shown in FIG.

図2に戻り、判定範囲の特定が終了したら、図5に示す引用判定画面において利用者は「検索実行」ボタンをクリックする。この「検索実行」ボタンがクリックされると入力制御部102gはそのイベントを受信し、これにより比較範囲特定部102bによる比較範囲の特定処理が行われる(ステップS14)。   Returning to FIG. 2, when the determination range is specified, the user clicks the “execute search” button on the quotation determination screen shown in FIG. When the “execute search” button is clicked, the input control unit 102g receives the event, whereby the comparison range specifying unit 102b performs the comparison range specifying process (step S14).

図6は、比較範囲の特定処理の手順を示すフローチャートである。比較範囲特定部102bは、まず、論文データ記憶部101cに格納されている過去に提出された全ての論文データを読み出す(ステップS21)。次に、比較範囲特定部102bは、文献リスト記憶部101bに保存されている文献リストに記載されている全ての文献データを文献データ記憶部101aおよびインターネット130上から読み出す(ステップS22)。そして、比較範囲特定部102bは、読み出した全ての論文データと取得した文献データ(文献データ等)とを比較範囲として特定する(ステップS23)。   FIG. 6 is a flowchart showing the procedure of the comparison range specifying process. First, the comparison range specifying unit 102b reads all the paper data submitted in the past stored in the paper data storage unit 101c (step S21). Next, the comparison range specifying unit 102b reads all document data described in the document list stored in the document list storage unit 101b from the document data storage unit 101a and the Internet 130 (step S22). Then, the comparison range specifying unit 102b specifies all the read paper data and the acquired document data (document data, etc.) as the comparison range (step S23).

図2に戻り、比較範囲の特定が終了したら、類似度算出部102cは、特定された判定範囲の記述内容を検索キーとして特定された比較範囲のデータを検索し(ステップS15)、比較範囲の記述内容の類似度を算出する(ステップS16)。類似度算出部102cは、具体的には、公知の検索技術を利用した検索プログラムや検索エンジン、またはこれらの検索プログラムや検索エンジンに対して検索キーを指定して検索指示を実行させる。ここでは、類似度の算出ロジックとして、例えば、論文データの判定範囲の記述内容、文献データの記述内容をそれぞれ構文解析し、各単語や文節の一致度を数値化する等の公知のロジックを用いる。そして、文献引用判定部102dは、算出された類似度が所定の閾値以上であるか否かを判断することにより、判定範囲が比較範囲の文献を引用しているか否かを判断する(ステップS17)。   Returning to FIG. 2, when the comparison range is specified, the similarity calculation unit 102c searches for data in the specified comparison range using the description content of the specified determination range as a search key (step S15). The similarity of the description content is calculated (step S16). Specifically, the similarity calculation unit 102c causes a search program or search engine using a known search technique, or a search instruction to be executed by specifying a search key for these search program or search engine. Here, as the similarity calculation logic, for example, known logic such as syntactic analysis of the description contents of the determination range of the article data and the description contents of the document data, and quantification of the degree of coincidence of each word or phrase is used. . Then, the document citation determination unit 102d determines whether or not the determination range cites a document in the comparison range by determining whether or not the calculated similarity is equal to or greater than a predetermined threshold (step S17). ).

そして、算出された類似度が所定の閾値より小さい場合には(ステップS17,No)、判定範囲は比較範囲の文献データ等を引用していないと判断し、処理を終了する。ここで、所定の閾値は、引用判定の求める精度に応じて任意に定めることができる。   If the calculated similarity is smaller than the predetermined threshold (No in step S17), it is determined that the determination range does not cite literature data in the comparison range, and the process ends. Here, the predetermined threshold value can be arbitrarily determined according to the accuracy required for citation determination.

一方、算出された類似度が所定の閾値以上である場合には(ステップS17,Yes)、判定範囲は比較範囲の文献データ等を引用していると判断し、次に、適法性判定部102eがこの引用が適法な引用か否かを判断する(ステップS18)。ここで、引用が「適法」とは、当該引用が著作権法上適法であること、あるいは利用者が予め設定した要件を具備していること等を含む概念である。具体的には、適法性判定部102eは、判定範囲における文献データ等の引用箇所の下方近傍に書籍名の表示がある場合、引用箇所の直前直後に引用を示す括弧「」の表示がある場合、引用部分であることを示すため引用箇所を他の部分のフォントと異なるフォントで表示している場合には、引用箇所が著作権法に基づいて適法に引用されたものであると判断する。この他にも、文献データ等の引用箇所の下方近傍に、引用の適法性を肯定するような所定表示(例えば、作者名、著者名、あるいは出版社名)がある場合に、当該引用箇所は適法に引用されたものであると判断するようにしてもよい。   On the other hand, when the calculated similarity is equal to or greater than the predetermined threshold (Yes in step S17), it is determined that the determination range is cited from the comparison range document data, and then the legality determination unit 102e. It is determined whether this citation is a legal citation (step S18). Here, the citation “legal” is a concept including that the citation is legal under the Copyright Act, or that the user has preset requirements. Specifically, when the legality determination unit 102e has a display of the book name near the lower part of the citation part of the reference data or the like in the determination range, there is a display of parentheses “” indicating the citation immediately before and after the citation part. If the quoted portion is displayed in a font different from the fonts of other portions to indicate that it is a quoted portion, it is determined that the quoted portion is legally quoted based on the copyright law. In addition to this, when there is a predetermined indication (for example, author name, author name, or publisher name) that confirms the legality of the citation near the lower part of the citation location such as literature data, the citation location is You may make it judge that it was quoted legally.

そして、判定範囲の引用が適法な引用であると判断された場合には(ステップS18,Yes)、処理を終了する。   If it is determined that the citation in the determination range is a legal citation (step S18, Yes), the process ends.

一方、判定範囲の引用が適法な引用でないと判断された場合には(ステップS18,No)、参照情報取得部102fは、文献データ等(引用された文献データ若しくは引用された論文データ)を参照するための参照情報(文献データ等のファイル名や題名、URLやフォルダ名等)、文献データの属性等若しくは引用された論文データの属性等から取得する(ステップS19)。そして、出力制御部102hは、文献データ等を判定範囲内で引用している箇所を引用判定画面に明示するとともに参照情報を表示する(ステップS20)。   On the other hand, when it is determined that the citation of the determination range is not a legal citation (step S18, No), the reference information acquisition unit 102f refers to document data or the like (cited document data or cited paper data). It is acquired from the reference information (file name and title of document data, URL, folder name, etc.), the attribute of document data, the attribute of cited article data, etc. (step S19). Then, the output control unit 102h clearly indicates the part where the document data or the like is cited within the determination range on the quotation determination screen and displays the reference information (step S20).

以上のステップS15からS20までの処理は、特定された比較範囲のデータの全てについて繰り返し実行される(ステップS20a,No)。ステップS15からS20までの処理が特定された比較範囲のデータの全てについて実行された場合には(ステップS20a,Yes)、処理を終了する。   The processing from step S15 to S20 is repeatedly executed for all the data in the specified comparison range (No in step S20a). If the processing from step S15 to S20 has been executed for all the data in the specified comparison range (step S20a, Yes), the processing ends.

本実施の形態では、出力制御部102hは、まず判定範囲内で引用している箇所を変色、反転等で強調表示を行う。図7は、引用判定画面において判定範囲内で引用箇所が強調表示されている状態を示す模式図である。なお、図7において太字かつ下線が付されている部分が、強調表示された部分、すなわち引用箇所の部分である。   In the present embodiment, the output control unit 102h first highlights a portion cited within the determination range by discoloration, inversion, or the like. FIG. 7 is a schematic diagram showing a state in which a quoted portion is highlighted within the determination range on the quote determination screen. In FIG. 7, the bold and underlined portion is the highlighted portion, that is, the quoted portion.

そして、利用者がこの引用箇所を入力装置103を介して指示すると、かかる指示を入力制御部102gで受け付けて、出力制御部102hは、指示された箇所に参照情報を表示するように制御している。   Then, when the user instructs this citation location via the input device 103, the input control unit 102g accepts the instruction, and the output control unit 102h controls to display the reference information at the designated location. Yes.

図8は、引用判定画面において参照情報が表示された状態を示す模式図である。図8の例では、インターネット130上の文献データが引用された場合を示しており、その参照情報として文献データのURLが表示されている。本実施の形態では、ユーザは、このURLを入力装置103のポインティングデバイスでクリックしたときに、出力制御部102h、当該URLの示すWEBページにアクセスして引用元の文献データ等を表示するように構成している。これにより、論文データの引用判定を行う教授などは引用元の文献データを容易に取得することが可能となる。   FIG. 8 is a schematic diagram showing a state in which the reference information is displayed on the citation determination screen. The example of FIG. 8 shows a case where document data on the Internet 130 is cited, and the URL of the document data is displayed as the reference information. In this embodiment, when the user clicks this URL with the pointing device of the input device 103, the output control unit 102h accesses the WEB page indicated by the URL so as to display the citation source document data and the like. It is composed. This makes it possible for a professor or the like who makes a citation determination of article data to easily obtain the document data of the citation source.

(効果)
このように実施の形態1の引用判定支援装置100では、論文データの判定範囲と比較範囲の文献データ等を自動的に限定して類似度判定を行なうので、汎用的な類似算出などの判定アルゴリズムを利用して引用判定を行うことができる。このため、本実施の形態によれば、開発工程および製造コストの増大を防止しつつ判定の精度を向上させることができる。
(effect)
As described above, in the citation determination support apparatus 100 according to the first embodiment, since the similarity determination is performed by automatically limiting the document data determination range and the document data in the comparison range, etc., a general determination algorithm such as similarity calculation is used. Citation determination can be performed using. For this reason, according to this Embodiment, the precision of determination can be improved, preventing the increase in a development process and manufacturing cost.

また、実施の形態1の引用判定支援装置100では、判定範囲特定部102aによって論文データを構成する構成部分の中から、無断で引用されやすい本文部分を判定範囲として特定しているので、判定の精度をより向上させることができる。   In the citation determination support apparatus 100 according to the first embodiment, the determination range specifying unit 102a specifies the text part that is easily cited without permission from the constituent parts constituting the article data. The accuracy can be further improved.

また、実施の形態1の引用判定支援装置100では、判定範囲が比較範囲を引用していると判定された場合に、適法性判定部102eによって判定範囲における比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定しているので、文献データ等の引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の精度を向上させることができる。   Further, in the citation determination support apparatus 100 of the first embodiment, when it is determined that the determination range is quoting the comparison range, the legality determination unit 102e applies the reference range of the comparison range in the determination range and the vicinity thereof. Since it is determined whether or not the citation is a legal citation, it can be easily determined whether or not the citation of the document data is a legal citation prescribed in the Copyright Act. Accuracy can be improved.

また、実施の形態1の引用判定支援装置100では、参照情報取得部102fによって、比較範囲を含む文献データを参照するための参照情報を、当該文献データに基づいて取得し、文献データの比較範囲を引用している判定対象データの判定範囲に加えて取得された参照情報を出力することで、文献データを容易に参照することができる。   Moreover, in the quotation determination support apparatus 100 of Embodiment 1, the reference information acquisition unit 102f acquires reference information for referring to document data including a comparison range based on the document data, and compares the reference range of the document data. By outputting the reference information acquired in addition to the determination range of the determination target data quoting the document data, it is possible to easily refer to the document data.

〔実施の形態2〕
次に、実施の形態2について説明する。この形態は、過去に不正な引用行為を行った学生や成績が低い学生の論文データを判定対象として選択する形態である。ただし、実施の形態2に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 2]
Next, a second embodiment will be described. In this form, the paper data of students who have performed illegal citations in the past or students with low grades are selected as judgment targets. However, the configuration and processing according to the second embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図9は、実施の形態2に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置900は、記憶部101に履歴データ記憶部101dを備えると共に、制御部102に判定範囲特定部102iを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
(Constitution)
FIG. 9 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the second embodiment. The citation determination support apparatus 900 differs from the citation determination support apparatus 100 according to Embodiment 1 in that the storage unit 101 includes a history data storage unit 101d and the control unit 102 includes a determination range specifying unit 102i.

履歴データ記憶部101dは、過去に生成された論文データに関する履歴データを記憶するメモリ、HDDなどの記憶媒体である。図10は、履歴データの一例を示す説明図である。履歴データは、過去に生成された全ての論文データに対し、論文データの作成日付と、論文データの作成者である学生を一意に識別するための学籍簿番号と、論文データにおける不正な引用行為の有無を示す不正引用の有無と、学生の成績(A,B,C,Dであり、Aが最も優秀で、次いで優秀度合いはB,C,Dの順になる)とを対応づけたデータである。ここでは、過去に不正な引用を行った学生の論文データに対しては、不正引用の有無に「有」が設定されている。なお、過去の論文データ自体は、実施の形態1と同様に、学籍簿番号に対応づけられて論文データ記憶部101cに格納されている。   The history data storage unit 101d is a storage medium such as a memory or HDD that stores history data relating to paper data generated in the past. FIG. 10 is an explanatory diagram showing an example of history data. Historical data includes the creation date of the paper data, the student register number for uniquely identifying the student who created the paper data, and illegal citations in the paper data for all the paper data generated in the past. Data that correlates the presence or absence of illegal citations that indicate the presence or absence of a student and the student's grades (A, B, C, D, where A is the best, and then the degree of excellence is in the order of B, C, D) is there. Here, “Yes” is set in the presence / absence of illegal citations for the paper data of students who have made illegal citations in the past. The past paper data itself is stored in the paper data storage unit 101c in association with the student register number, as in the first embodiment.

判定範囲特定部102iは、この履歴データを参照して、不正な引用を行う確率が高い者として、不正引用の有無が「有」の学籍簿番号と、成績がC以下(すなわち、CおよびD)の学籍簿番号を取得して、取得した学籍簿番号の学生が提出した論文データを、提出された複数の論文データ(論文データ記憶部101cに保存されている)の中から判定対象として選択する。また、判定範囲特定部102iは、判定対象として選択された論文データの構成部分の中から、実施の形態1と同様に、本文部分を判定範囲として特定する。   The determination range specifying unit 102i refers to the history data, and as a person who has a high probability of performing an illegal citation, the student register number with the presence / absence of an illegal citation and a grade of C or less (that is, C and D) ), And the paper data submitted by the student with the acquired student book number is selected as the judgment target from the submitted paper data (stored in the paper data storage unit 101c) To do. In addition, the determination range specifying unit 102i specifies the body part as the determination range from the constituent parts of the paper data selected as the determination target, as in the first embodiment.

(処理)
次に、以上のように構成された実施の形態2の引用判定支援装置900による引用判定支援処理について説明する。図11は、実施の形態2の引用判定支援処理の手順を示すフローチャートである。
(processing)
Next, a citation determination support process performed by the citation determination support apparatus 900 according to Embodiment 2 configured as described above will be described. FIG. 11 is a flowchart illustrating a procedure of the citation determination support process according to the second embodiment.

表示装置104に表示されている実施の形態1と同様の図3に示す引用判定画面において利用者が簡易ボタンをクリックすると、まず、判定範囲特定部102iによって判定対象の特定処理が行われる(ステップS31)。かかる判定対象の特定処理の詳細については後述する。   When the user clicks the simple button on the quotation determination screen shown in FIG. 3 that is the same as that of the first embodiment displayed on the display device 104, first, the determination range specifying unit 102i performs determination target specifying processing (Step S1). S31). Details of the determination target specifying process will be described later.

この判定対象の特定処理が完了すると、判定対象となった学生の論文データに対して、実施の形態1と同様に判定範囲の特定が行われ(ステップS32,33)、以降は実施の形態1と同様の処理で引用判定が行われる(ステップS34からS40a)。   When the determination target specifying process is completed, the determination range is specified in the same manner as in the first embodiment for the student's paper data as the determination target (steps S32 and 33). The citation determination is performed by the same processing as (Steps S34 to S40a).

次に、ステップS31における判定対象の特定処理について詳細に説明する。図12は、実施の形態2の判定対象の特定処理の手順を示すフローチャートである。   Next, the determination target specifying process in step S31 will be described in detail. FIG. 12 is a flowchart illustrating the procedure of the determination target identification process according to the second embodiment.

まず、判定範囲特定部102iは、作成された論文データと当該論文データに対応する学籍簿番号とを論文データ記憶部101cから読み出す(ステップS41)。次に、判定範囲特定部102iは、履歴データ記憶部101dに記憶されている履歴データを参照して、読み出した学籍簿番号に対応する不正引用の有無と成績とを読み出す(ステップS42)。   First, the determination range specifying unit 102i reads the created paper data and the student register number corresponding to the paper data from the paper data storage unit 101c (step S41). Next, the determination range specifying unit 102i refers to the history data stored in the history data storage unit 101d, and reads the presence / absence of an incorrect citation corresponding to the read student register number and the grade (step S42).

そして、判定範囲特定部102iは、履歴データから読み出した不正利用の有無が「有」であるか否かを判断する(ステップS43)。そして、不正利用の有無が「有」の場合には(ステップS43,Yes)、この学籍簿番号の学生が作成した論文データ、すなわち、ステップS41で読み出した論文データを判定対象として特定する(ステップS45)。   Then, the determination range specifying unit 102i determines whether the presence / absence of unauthorized use read from the history data is “present” (step S43). If the presence / absence of unauthorized use is “Yes” (step S43, Yes), the paper data created by the student with this student ID number, that is, the paper data read out in step S41 is specified as a determination target (step S43). S45).

一方、ステップS43において、不正利用の有無が「無」の場合には(ステップS43,No)、判定範囲特定部102iは、さらに、履歴データから読み出した成績がC以下、すなわち、CまたはDであるか否かを判断する(ステップS44)。   On the other hand, when the presence / absence of unauthorized use is “none” in step S43 (step S43, No), the determination range specifying unit 102i further determines that the result read from the history data is C or less, that is, C or D. It is determined whether or not there is (step S44).

そして、成績がCまたはDである場合には(ステップS44,Yes)、この学籍簿番号の学生が作成した論文データを判定対象として特定する(ステップS45)。   If the grade is C or D (step S44, Yes), the paper data created by the student with this student register number is specified as a determination target (step S45).

一方、ステップS44において成績がCより高い(すなわち、AまたはBである場合)には(ステップS44,No)、ステップS41で読み出した論文データを判定対象としない。   On the other hand, if the grade is higher than C in step S44 (ie, if it is A or B) (No in step S44), the paper data read in step S41 is not determined.

引用判定すべき作成された論文データが複数存在する場合には、このステップS41からS45までの処理を当該複数の論文データに対して行って、判定対象の論文データを特定する。   If there are a plurality of created paper data to be cited, the processes from step S41 to S45 are performed on the paper data to identify the paper data to be determined.

(効果)
このように実施の形態2の引用判定支援装置900では、履歴データから過去に不正な引用行為が有った旨を示す不正引用の有無の「有」に対応する学籍簿番号、成績は所定値であるC以下の学籍簿番号の学生が作成した論文データを、複数の論文データの中から判定対象として選択しているので、不正な引用を行う確率が高い者の論文データを判定対象とすることができ、判定の精度をより向上させることができると共に、不正引用の確率が高い論文データのみに判定対象を限定することで判定処理負荷を低減して判定効率を高めることができる。
(effect)
As described above, in the quotation determination support apparatus 900 according to the second embodiment, the student register number corresponding to “Yes” indicating the presence / absence of an illegal citation indicating that there has been an illegal citation act in the past from the history data is a predetermined value. Since the paper data created by students with a student ID number of C or less is selected from among multiple paper data, the paper data of those who have a high probability of illegal citations are used In addition, the accuracy of the determination can be further improved, and the determination processing load can be reduced and the determination efficiency can be increased by limiting the determination target only to the article data having a high probability of illegal citation.

なお、本実施の形態では、判定範囲特定部102iが履歴データから過去に不正な引用行為が有った旨を示す不正引用の有無の判断、成績が所定値以下であるかの判断を両方行っているが、一方のみの判断で判定対象の論文データを特定するように構成してもよい。   In the present embodiment, the determination range specifying unit 102i performs both determination of whether or not there is an illegal citation indicating that there has been an illegal citation in the past from the history data, and whether or not the result is below a predetermined value. However, the configuration may be such that the article data to be determined is specified by only one of the determinations.

〔実施の形態3〕
次に、実施の形態3について説明する。この形態は、引用元の文献が単語を修正された上で論文に不正引用された場合の対策として、当該単語を修正前の単語に変換した上で類似度判定を行う形態である。ただし、実施の形態3に係る構成及び処理は、特に説明する場合を除いては実施の形態2に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態2で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 3]
Next, Embodiment 3 will be described. This form is a form in which the similarity is determined after converting the word into a word before correction as a countermeasure when the document of the citation is illegally cited in the paper after the word is corrected. However, the configuration and processing according to the third embodiment are the same as the configuration and processing according to the second embodiment unless otherwise described, and the same configuration and processing are described in the second embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図13は、実施の形態3に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1300は、記憶部101に辞書記憶部101eを備えると共に、制御部102に判定範囲特定部102j及び単語変換部102kを備えている点において、実施の形態2に係る引用判定支援装置900と異なる。
(Constitution)
FIG. 13 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the third embodiment. The citation determination support apparatus 1300 includes the dictionary storage unit 101e in the storage unit 101 and the citation determination support according to the second embodiment in that the control unit 102 includes a determination range specifying unit 102j and a word conversion unit 102k. Different from the device 900.

辞書記憶部101eは、論文データの技術分野における専門用語とその専門用語と関連して使用され得る一または複数の用語を対応づけて登録した専門辞書を記憶するHDDやメモリ等の記憶媒体である。図14は、専門辞書の一例を示す説明図である。専門辞書は、図14に示すように、文献データ等に含まれる得る用語に対して、第1候補用語、第2候補用語など、関連して使用され得る用語が対応づけられている。この専門辞書は、後述する単語変換部102kによって論文データ中の単語を修正する際に使用される。   The dictionary storage unit 101e is a storage medium such as an HDD or a memory that stores a specialized dictionary in which technical terms in the technical field of article data and one or more terms that can be used in association with the technical terms are registered in association with each other. . FIG. 14 is an explanatory diagram of an example of a specialized dictionary. In the specialized dictionary, as shown in FIG. 14, terms that can be used in association with each other, such as first candidate terms and second candidate terms, are associated with terms that can be included in the document data or the like. This specialized dictionary is used when a word in the paper data is corrected by a word conversion unit 102k described later.

判定範囲特定部102jは、単語変換部102kよる変換が行われた論文データを判定対象として選択するものである。また、判定範囲特定部102jは、判定対象として選択された論文データの構成部分の中から、実施の形態1と同様に、本文部分を判定範囲として特定する。   The determination range specifying unit 102j selects article data that has been converted by the word conversion unit 102k as a determination target. In addition, the determination range specifying unit 102j specifies the body part as the determination range from the constituent parts of the paper data selected as the determination target, as in the first embodiment.

単語変換部102kは、論文データに含まれる単語を、専門辞書の該当する用語の第1候補用語、第2候補用語等に変換するものである。   The word conversion unit 102k converts words included in the paper data into first candidate terms, second candidate terms, and the like corresponding terms in the specialized dictionary.

(処理)
次に、以上のように構成された実施の形態3の引用判定支援装置1300による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理は、図11で説明した実施の形態2の引用判定支援処理と同様に行われる。本実施の形態では、図11のステップS31における判定対象の特定処理が実施の形態2と異なっている。
(processing)
Next, a citation determination support process performed by the citation determination support apparatus 1300 according to the third embodiment configured as described above will be described. The entire citation determination process of the present embodiment is performed in the same manner as the citation determination support process of the second embodiment described with reference to FIG. In the present embodiment, the determination target specifying process in step S31 of FIG. 11 is different from that of the second embodiment.

図15は、実施の形態3の判定対象の特定の手順を示すフローチャートである。まず、判定範囲特定部102jは、作成された論文データを論文データ記憶部101cから読み出す(ステップS51)。そして、判定範囲特定部102jは、読み出した論文データの内容を公知の手法で形態素解析を行って、形態素に分割する(ステップS52)。   FIG. 15 is a flowchart illustrating a specific procedure of a determination target according to the third embodiment. First, the determination range specifying unit 102j reads the created paper data from the paper data storage unit 101c (step S51). Then, the determination range specifying unit 102j performs morpheme analysis on the content of the read paper data by a known method, and divides it into morphemes (step S52).

次に、単語変換部102kは、得られた形態素の単語を検索キーとして専門辞書を検索して、専門辞書の用語として登録されている単語に対して、当該単語を専門辞書の用語に対応する第1候補用語に変換する(ステップS53)。なお、2回目以降の単語変換の場合には、第n候補用語(nは2以上の整数)に変換する。   Next, the word conversion unit 102k searches the specialized dictionary using the obtained morpheme word as a search key, and corresponds the word to the specialized dictionary term for the word registered as the specialized dictionary term. Conversion into the first candidate term (step S53). In the second and subsequent word conversions, the word is converted into the nth candidate term (n is an integer of 2 or more).

そして、論文データの全ての単語に対して単語変換の処理が終了したか否かを判断し(ステップS54)、終了していなければ(ステップS54,No)、このステップS53の単語変換の処理を繰り返し行う。   Then, it is determined whether or not the word conversion process has been completed for all the words in the paper data (step S54). If not completed (step S54, No), the word conversion process of step S53 is performed. Repeat.

一方、論文データの全ての単語に対して単語変換の処理が終了した場合には(ステップS54,Yes)、単語変換部102kは、変換された単語の論文データを修正版論文データとして論文データ記憶部101cに保存する(ステップS55)。   On the other hand, when the word conversion processing has been completed for all the words in the paper data (step S54, Yes), the word conversion unit 102k stores the paper data of the converted words as corrected version paper data. The data is stored in the unit 101c (step S55).

そして、単語変換部102kは、専門辞書の全ての候補用語に変換したか否かを判断する(ステップS56)。そして、まだ全ての候補用語に変換していない場合には(ステップS56,No)、単語変換部102kは、専門辞書の用語として次の候補用語(第n+1候補用語)を選択し(ステップS57)、ステップS53からS55までの処理を繰り返す。これにより、論文データの一の単語につき、複数の候補用語に変換された複数の修正版論文データが得られ、論文データ記憶部101cに保存されることになる。   Then, the word conversion unit 102k determines whether or not conversion to all candidate terms in the specialized dictionary has been made (step S56). If all the candidate terms have not been converted yet (step S56, No), the word conversion unit 102k selects the next candidate term (the n + 1 candidate term) as a term in the specialized dictionary (step S57). The processes from step S53 to S55 are repeated. As a result, a plurality of revised paper data converted into a plurality of candidate terms is obtained for one word of the paper data, and stored in the paper data storage unit 101c.

ステップS56において、専門辞書の全ての候補用語に変換したと判断した場合には(ステップS56,Yes)、判定範囲特定部102jは、得られた複数の修正版論文データを判定対象として特定する(ステップS58)。   If it is determined in step S56 that all the candidate terms in the specialized dictionary have been converted (step S56, Yes), the determination range specifying unit 102j specifies a plurality of obtained revised paper data as determination targets (step S56). Step S58).

引用判定支援処理は、このように判定対象として特定された複数の修正版論文データに対して行われることになる。   The citation determination support process is performed for a plurality of revised paper data identified as determination targets in this way.

(効果)
このように実施の形態3の引用判定支援装置1300では、論文データに含まれる単語を、専門辞書に登録された用語に変換し、変換が行われた論文データを、判定対象としているので、文献データをそのまま利用せず修正した上で不正に引用した場合でも、引用か否かを判定することができ、判定の精度をより向上させることができる。
(effect)
As described above, in the citation determination support apparatus 1300 according to the third embodiment, the word included in the paper data is converted into the term registered in the specialized dictionary, and the converted paper data is set as the determination target. Even if the data is used without modification as it is, and it is illegally quoted, it can be determined whether or not the data is quoted, and the determination accuracy can be further improved.

〔実施の形態4〕
次に、実施の形態4について説明する。この形態は、学生の過去の論文データの相互間で、類似度を算出する形態である。ただし、実施の形態4に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 4]
Next, a fourth embodiment will be described. This form is a form in which the degree of similarity is calculated between the student's past paper data. However, the configuration and processing according to the fourth embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図16は、実施の形態4に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1600は、制御部102に、比較範囲特定部102l、類似度算出部102m、及び文献引用判定部102nを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
(Constitution)
FIG. 16 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the fourth embodiment. The citation determination support apparatus 1600 differs from the citation determination support apparatus 100 according to Embodiment 1 in that the control unit 102 includes a comparison range specifying unit 102l, a similarity calculation unit 102m, and a document citation determination unit 102n.

類似度算出部102mは、実施の形態1と同様の機能の他、論文データ記憶部101cに記憶された学生の過去の論文データの相互間で、類似度を算出するものである。類似度の算出は、実施の形態1と同様に公知の手法を用いる。   The similarity calculation unit 102m calculates the similarity between the student's past paper data stored in the paper data storage unit 101c, in addition to the same function as in the first embodiment. The similarity is calculated using a known method as in the first embodiment.

文献引用判定部102nは、実施の形態1と同様の機能の他、類似度算出部102mにより算出された類似度が所定の第2閾値以上である場合に、複数の過去の論文データの相互間において引用が有る旨の判定を行うものである。ここで、第2閾値は、任意に定めることができ、上述した閾値と同一の値、異なる値のいずれであってもよい。   In addition to the same function as in the first embodiment, the document citation determination unit 102n has a plurality of past paper data between each other when the similarity calculated by the similarity calculation unit 102m is equal to or greater than a predetermined second threshold. It is determined whether or not there is a quotation. Here, the second threshold value can be arbitrarily determined, and may be either the same value or a different value from the above-described threshold value.

比較範囲特定部102lは、文献引用判定部102nにより相互間において引用有りと判定された複数の過去の論文データを比較範囲として特定するものである。   The comparison range specifying unit 102l specifies a plurality of past paper data determined to be cited among each other by the document citation determination unit 102n as a comparison range.

(処理)
次に、以上のように構成された実施の形態4の引用判定支援装置1600による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、図2における比較判定処理(ステップS14)の手順が実施の形態1と異なっている。
(processing)
Next, a citation determination support process performed by the citation determination support apparatus 1600 according to Embodiment 4 configured as described above will be described. The entire citation determination process of the present embodiment is the same as the procedure of the citation determination support process in the first embodiment described with reference to FIG. In the present embodiment, the procedure of the comparison determination process (step S14) in FIG. 2 is different from that of the first embodiment.

図17は、実施の形態4の比較判定処理の手順を示すフローチャートである。比較範囲特定部102lは、まず、論文データ記憶部101cに格納されている過去に提出された全ての論文データの中から2つの論文データを抽出する(ステップS61)。次に、類似度算出部102mは、抽出された2つの論文データの記述内容の類似度を算出する(ステップS62)。ここで、類似度の算出は、まず、2つの論文データのうち一の論文データの中の一部の範囲の記述と他方の論文データの記述内容とを比較し、次に、一の論文データの一部の範囲を変更しながら他方の論文データの記述内容とを比較するような処理を繰り返し行いながら部分ごとの類似度を算出し、これらの部分的な比較結果の類似度の平均値等を論文データ全体同士の類似度として求めるように構成すればよい。ただし、類似度の算出の手法はこれに限定されるものではない。   FIG. 17 is a flowchart illustrating a procedure of comparison determination processing according to the fourth embodiment. First, the comparison range specifying unit 102l extracts two paper data from all the paper data submitted in the past stored in the paper data storage unit 101c (step S61). Next, the similarity calculation unit 102m calculates the similarity of the description contents of the two extracted paper data (step S62). Here, the similarity is calculated by first comparing the description of a part of one of the two paper data with the description of the other paper data, and then comparing the one paper data. Calculate the similarity for each part while repeating the process of comparing the description content of the other paper data while changing a part of the range, and the average value of the similarity of these partial comparison results, etc. May be obtained as the similarity between the entire article data. However, the method of calculating the similarity is not limited to this.

そして、比較範囲特定部102lは、全ての過去の論文データについて、このような類似度の算出処理を行ったか否かを判断し(ステップS63)、全ての過去の論文データに行っていなければ(ステップS63,No)、ステップS61およびS62の処理を繰り返し実行する。   Then, the comparison range specifying unit 102l determines whether or not such similarity calculation processing has been performed on all past paper data (step S63), and if not performed on all past paper data ( Steps S63, No) and Steps S61 and S62 are repeated.

一方、全ての過去の論文データに対して類似度の算出処理が完了した場合には(ステップS63,Yes)、文献引用判定部102nは、類似度が予め定められた第2閾値以上である複数の論文データがある場合には、これらの複数の論文データは相互間で引用箇所があるという引用有りの判断をおこなって、これらの複数の論文データを選択する(ステップS64)。そして、比較範囲特定部102lは、この選択された複数の論文データを比較範囲として特定する(ステップS65)。従って、互いに引用している過去の論文データが比較範囲となり、判定対象の論文データの引用判定が行われることになる。   On the other hand, when the similarity calculation processing has been completed for all past paper data (step S63, Yes), the document citation determination unit 102n has a plurality of similarity levels equal to or greater than a predetermined second threshold. If there is any paper data, the plurality of paper data is judged to have a quotation that there is a citation between them, and the paper data is selected (step S64). Then, the comparison range specifying unit 102l specifies the selected plurality of paper data as a comparison range (step S65). Therefore, the past paper data cited with each other becomes the comparison range, and the judgment of citation of the paper data to be judged is performed.

(効果)
このように実施の形態4にかかる引用判定支援装置1600では、相互間で引用している過去の論文データを比較範囲として、判定対象の論文データの引用判定を行うので、引用している可能性の高いものを比較範囲とすることができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができると共に、不正引用の確率が高い論文データのみに判定対象を限定することで判定処理負荷を低減して判定効率を高めることができる。
(effect)
As described above, in the citation determination support apparatus 1600 according to the fourth embodiment, the citation determination of the paper data to be determined is performed by using the past paper data cited between each other as the comparison range. Can be used as a comparative range, can improve the accuracy of judgment while preventing an increase in development process and manufacturing cost, and limit judgment objects only to article data with high probability of illegal citation. Thus, the determination processing load can be reduced and the determination efficiency can be increased.

なお、本実施の形態では、類似度が第2閾値以上であるものを、過去の論文データ相互間で引用していると判定しているが、さらに、適法性判定部102eによって、この引用が適法であるか否かを判断し、不適法である場合にのみ比較範囲として特定するように構成してもよい。   In the present embodiment, it is determined that a document whose similarity is greater than or equal to the second threshold value is cited between past paper data, but the legality determination unit 102e further determines It may be configured to determine whether or not it is legal, and to specify the comparison range only when it is illegal.

〔実施の形態5〕
次に、実施の形態5について説明する。この形態は、論文の課題文をキーワードとして判定対象を自動的に抽出する形態である。ただし、実施の形態5に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 5]
Next, a fifth embodiment will be described. This form is a form in which a determination target is automatically extracted by using a problem sentence of a paper as a keyword. However, the configuration and processing according to the fifth embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図18は、実施の形態5に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1800は、制御部102に課題抽出部102p及び比較範囲特定部102qを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
(Constitution)
FIG. 18 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the fifth embodiment. This citation determination support apparatus 1800 is different from the citation determination support apparatus 100 according to Embodiment 1 in that the control unit 102 includes a task extraction unit 102p and a comparison range identification unit 102q.

課題抽出部102pは、判定対象となった論文データの構造解析を行って、論文データの記述内容から、論文の課題文を抽出するものである。具体的には、課題抽出部102pは、構造解析の結果得られた論文の見出しや構造等により、課題文を特定して抽出する。   The assignment extraction unit 102p performs a structural analysis of the paper data that is the object of determination, and extracts the assignment sentence of the paper from the description content of the paper data. Specifically, the task extraction unit 102p identifies and extracts a task sentence based on the headline or structure of a paper obtained as a result of structural analysis.

比較範囲特定部102qは、課題抽出部102pで抽出された課題文を検索キーとしてインターネット130上のWEBサイト131やファイルサーバ133等から該当するWEBページを検索し、検索結果として出力されたURL等で指定される文献データを比較範囲として特定するものである。検索には、公知の検索エンジンなどを利用することができる。この場合には、比較範囲特定部102qは、公知の検索エンジンのAPI(Application Programing Interface)を利用して検索キーを指定した検索依頼コマンド等を検索エンジンのWEBサイトに送出して検索結果を受信するように構成すればよい。   The comparison range specifying unit 102q searches the WEB site 131, the file server 133, etc. on the Internet 130 using the task sentence extracted by the task extraction unit 102p as a search key, and the URL output as the search result. Is specified as a comparison range. A known search engine or the like can be used for the search. In this case, the comparison range specifying unit 102q uses a well-known search engine API (Application Programming Interface) to send a search request command specifying a search key to the search engine WEB site and receive the search result. What is necessary is just to comprise so.

(処理)
次に、以上のように構成された実施の形態5の引用判定支援装置1800による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、図2における比較判定処理(ステップS14)の手順が実施の形態1と異なっている。
(processing)
Next, a citation determination support process performed by the citation determination support apparatus 1800 of the fifth embodiment configured as described above will be described. The entire citation determination process of the present embodiment is the same as the procedure of the citation determination support process in the first embodiment described with reference to FIG. In the present embodiment, the procedure of the comparison determination process (step S14) in FIG. 2 is different from that of the first embodiment.

図19は、実施の形態5の比較範囲特定処理の手順を示すフローチャートである。まず、課題抽出部102pは、判定対象となった論文データに構造解析を行って、課題文を抽出する(ステップS81)。次に、比較範囲特定部102qは、抽出された課題文を検索キーとして、インターネット130上のWEBサイト131やファイルサーバ133等から該当するWEBページを検索する(ステップS82)。そして、比較範囲特定部102qは、検索結果としての検索されたWEBページのURLで指定された引用文献データを比較範囲として特定する(ステップS83)。   FIG. 19 is a flowchart illustrating a comparison range specifying process according to the fifth embodiment. First, the task extraction unit 102p performs a structural analysis on the paper data that is a determination target, and extracts a task sentence (step S81). Next, the comparison range specifying unit 102q searches for a corresponding WEB page from the WEB site 131, the file server 133, or the like on the Internet 130 using the extracted task sentence as a search key (step S82). Then, the comparison range specifying unit 102q specifies the cited document data specified by the URL of the searched WEB page as the search result as the comparison range (step S83).

(効果)
このように実施の形態5の引用判定支援装置1800では、論文データにおける課題文に基づいて引用文献の比較範囲を決定しているので、論文の内容に即して適切な引用文献の比較範囲を定めることができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができる。
(effect)
As described above, in the citation determination support apparatus 1800 according to the fifth embodiment, since the comparison range of the cited documents is determined based on the task sentence in the paper data, an appropriate comparison range of the cited documents is determined according to the content of the paper. The accuracy of determination can be further improved while preventing an increase in development process and manufacturing cost.

〔実施の形態6〕
次に、実施の形態6について説明する。この形態は、論文における比較対象の文字数が検索ロジックの文字制限数を超える場合の対応ロジックを含んだ形態である。ただし、実施の形態6に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 6]
Next, a sixth embodiment will be described. This form includes a corresponding logic when the number of characters to be compared in the paper exceeds the character limit number of the search logic. However, the configuration and processing according to the sixth embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図20は、実施の形態6に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置2000は、制御部102に類似度算出部102rを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
(Constitution)
FIG. 20 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the sixth embodiment. The citation determination support apparatus 2000 is different from the citation determination support apparatus 100 according to Embodiment 1 in that the control unit 102 includes a similarity calculation unit 102r.

類似度算出部102rは、公知の検索技術(検索エンジン等)を利用して、判定範囲特定部102aで特定された判定範囲の記述内容を検索キーとして、比較範囲特定部102bで特定した比較範囲の中から検索する。この際、検索キーの文字数が、予め定められた制限文字数(例えば、32文字)を超えている場合には、制限文字数を含み、検索キーの文字数が制限文字数を超えている旨のエラーメッセージが検索エンジン等から通知される。このような場合には、類似度算出部102rは、検索キーとして制限文字数以内の文字を判定範囲の先頭から指定して、比較範囲の中から検索を行い、検索結果をメモリ等に保存しておく。そして、類似度算出部102rは、判定範囲の中で次の制限文字数分の文字列を検索キーとして同様に比較範囲の中から検索を行う。このようにして、類似度算出部102rは、順次、制限文字数分だけ判定範囲の記述内容の文字列を移動させながら検索キーを指定し、複数回の検索を行って、その検索結果をメモリ等に保存する。類似度算出部102rは、複数の検索結果の中から最も出現頻度の高い検索結果を、類似度算出の対象となる比較範囲とし、判定範囲との類似度の算出を行う。なお、出現頻度が所定数以上の検索結果を類似度算出の対象とするように構成してもよい。   The similarity calculation unit 102r uses a known search technique (such as a search engine), and uses the description content of the determination range specified by the determination range specification unit 102a as a search key as a comparison range specified by the comparison range specification unit 102b. Search from within. At this time, if the number of characters in the search key exceeds a predetermined limit number of characters (for example, 32 characters), an error message indicating that the number of characters in the search key exceeds the limit number of characters is included. Notification from a search engine or the like. In such a case, the similarity calculation unit 102r designates characters within the limited number of characters as a search key from the beginning of the determination range, performs a search from the comparison range, and stores the search result in a memory or the like. deep. Then, the similarity calculation unit 102r similarly performs a search from the comparison range using a character string corresponding to the next limited number of characters in the determination range as a search key. In this way, the similarity calculation unit 102r sequentially designates the search key while moving the character string of the description content of the determination range by the limited number of characters, performs a plurality of searches, and stores the search results in a memory or the like. Save to. The similarity calculation unit 102r calculates the similarity with the determination range, using the search result with the highest appearance frequency among the plurality of search results as a comparison range to be subjected to similarity calculation. In addition, you may comprise so that the search result whose appearance frequency is more than a predetermined number may be made into the object of similarity calculation.

(処理)
次に、以上のように構成された実施の形態6の引用判定支援装置2000による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、図2における類似度算出部が行う検索処理(ステップS15)の手順が実施の形態1と異なっている。
(processing)
Next, a citation determination support process performed by the citation determination support apparatus 2000 according to the sixth embodiment configured as described above will be described. The entire citation determination process of the present embodiment is the same as the procedure of the citation determination support process in the first embodiment described with reference to FIG. In the present embodiment, the procedure of the search process (step S15) performed by the similarity calculation unit in FIG. 2 is different from that of the first embodiment.

図21は、実施の形態6の類似度算出における検索処理の手順を示すフローチャートである。まず、類似度算出部102rは、判定範囲の記述内容検索キーとして比較範囲のデータを検索する(ステップS91)。そして、類似度算出部102rは、検索キーが制限文字数を超えた旨のエラー通知を受信したか否かを判断する(ステップS92)。   FIG. 21 is a flowchart illustrating a procedure of search processing in similarity calculation according to the sixth embodiment. First, the similarity calculation unit 102r searches the comparison range data as a description content search key for the determination range (step S91). Then, the similarity calculation unit 102r determines whether an error notification indicating that the search key has exceeded the limit number of characters has been received (step S92).

そして、検索キーが制限文字数を超えた旨のエラー通知を受信しなかった場合には(ステップS92,No)、類似度算出部102rは、検索結果を選択し(ステップS100)、この検索結果の比較範囲が類似度算出の対象となり、実施の形態1と同様に、判定範囲との類似度が算出される。   If an error notification indicating that the search key exceeds the limit number of characters has not been received (step S92, No), the similarity calculation unit 102r selects a search result (step S100), and the search result The comparison range is a target of similarity calculation, and the similarity with the determination range is calculated as in the first embodiment.

一方、ステップS92において、検索キーが制限文字数を超えた旨のエラー通知を受信した場合には(ステップS92,Yes)、類似度算出部102rは、受信したエラー通知の中から制限文字数を取得する(ステップS93)。   On the other hand, if an error notification indicating that the search key has exceeded the limit number of characters is received in step S92 (step S92, Yes), the similarity calculation unit 102r acquires the limit number of characters from the received error notification. (Step S93).

そして、類似度算出部102rは、判定範囲の先頭から、制限文字数分の範囲の文字列を検索キーと指定し(ステップS94)、この検索キーで比較範囲のデータを検索する(ステップS95)。類似度算出部102rは、その検索結果をメモリに記憶する(ステップS96)。   Then, the similarity calculation unit 102r designates a character string within the limited number of characters from the beginning of the determination range as a search key (step S94), and searches for data in the comparison range using this search key (step S95). The similarity calculation unit 102r stores the search result in the memory (step S96).

そして、類似度算出部102rは、判定範囲の検索キーとして最終文字列まで到達したか否かを判断し(ステップS97)、まだ到達していない場合には(ステップS97,No)、判定範囲の中で次の制限文字数分の文字列を検索キーに指定して(ステップS98)、ステップS95およびS96の処理を繰り返し実行する。なお、このように制限文字数分の文字列を指定する場合の具体的な方法は任意であるが、一例としては、制限文字数分を一単位として移動させる方法(例えば、制限文字数=32文字の場合において、初回は1文字目から32文字目までの文字列を検索キーとし、2回目は33文字目からから64文字目までの文字列を検索キーとし、以下同様に検索キーの指定を行う方法)、一文字単位で移動させる方法(例えば、制限文字数=32文字の場合において、初回は1文字目から32文字目までの文字列を検索キーとし、2回目は2文字目からから33文字目までの文字列を検索キーとし、以下同様に検索キーの指定を行う方法)、あるいは任意の文字数毎に移動させる方法(例えば、制限文字数=32文字の場合であって、任意の文字数=10文字とする場合において、初回は1文字目から32文字目までの文字列を検索キーとし、2回目は11文字目から42文字目までの文字列を検索キーとし、以下同様に検索キーの指定を行う方法)を採用することができる。   Then, the similarity calculation unit 102r determines whether or not the final character string has been reached as a determination range search key (step S97). If the similarity has not yet been reached (step S97, No), Among them, a character string corresponding to the next limited number of characters is designated as a search key (step S98), and the processes of steps S95 and S96 are repeatedly executed. Note that the specific method for specifying a character string for the limited number of characters is arbitrary, but as an example, a method of moving the limited number of characters as a unit (for example, when the limited number of characters = 32 characters) In the first, a character string from the first character to the 32nd character is used as a search key for the first time, and a character string from the 33rd character to the 64th character is used as a search key for the second time, and the search key is designated in the same manner. ), A method of moving one character unit (for example, in the case of the limit number of characters = 32 characters, the first character string is used as the search key from the first character to the 32nd character, and the second time is from the second character to the 33rd character) The search key is used as a search key, and the search key is designated in the same manner), or a method of moving by any number of characters (for example, when the limit number of characters = 32 characters and the number of arbitrary characters = 1). When using characters, the first character string from the first character to the 32nd character is used as the search key for the first time, and the character string from the 11th character to the 42nd character is used as the search key for the second time. Can be employed.

一方、ステップS97において、判定範囲の検索キーとして最終文字列まで到達した場合には(ステップS97,Yes)、メモリに保存された検索結果の中で、最も出現頻度の高い検索結果を選択し(ステップS99)、選択された比較範囲が類似度算出の対象となり、判定範囲との類似度が算出される。   On the other hand, if the last character string is reached as the determination range search key in step S97 (step S97, Yes), the search result with the highest appearance frequency is selected from the search results stored in the memory ( In step S99), the selected comparison range is a target of similarity calculation, and the similarity with the determination range is calculated.

(効果)
このように実施の形態6の引用判定支援装置2000では、検索キーが制限文字数を超えた場合には、判定範囲の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての判定範囲の文字列をずらしながら複数回の検索を行っているので、検索キーの制限文字数にかかわらず、引用判定の精度を向上させることができる。
(effect)
As described above, in the quotation determination support apparatus 2000 according to the sixth embodiment, when the search key exceeds the limit number of characters, the search key is designated by the character string corresponding to the limit number of characters in the determination range, and the search key is Since the search is performed a plurality of times while shifting the character string of the determination range, the accuracy of the citation determination can be improved regardless of the limited number of characters in the search key.

〔実施の形態7〕
次に、実施の形態7について説明する。この形態は、適法性判定手段が、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定する形態である。ただし、実施の形態7に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 7]
Next, a seventh embodiment will be described. In this form, the legality determination means determines whether or not the determination range matches a predetermined citation format, and based on the determination result, whether or not the comparison range citation in the determination range is a legal citation. It is the form which determines whether. However, the configuration and processing according to the seventh embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図24は、実施の形態7に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、制御部102に引用形式設定部102sを備えると共に、記憶部101に引用形式データベース(以下、「データベース」を「DB」と略記する)101fを備えている。
(Constitution)
FIG. 24 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the seventh embodiment. The citation determination support apparatus 100 includes a citation format setting unit 102 s in the control unit 102 and a citation format database (hereinafter, “database” is abbreviated as “DB”) 101 f in the storage unit 101.

引用形式設定部102sは、引用の適法性が判定される際の基準となる引用形式を設定する引用形式設定手段である。   The citation format setting unit 102s is a citation format setting unit that sets a citation format that serves as a reference when the legality of citations is determined.

引用形式DB101fは、論文データを分類する種別と、所定の引用形式とを、相互に関連付けて格納する引用形式格納手段である。図25は、引用形式DB101fに格納される情報を示した表である。図25に示したように、引用形式DB101fはデータ項目として「種別」「引用形式」「適法文書格納場所」を備え、これらに対応する情報が相互に関連付けて格納されている。項目「種別」に対応して格納される情報は、論文データの種別を特定するための情報であり、図25に例示したように、「法律」や「工学」といった論文のテーマに応じた分野を特定する情報を格納することができる。項目「引用形式」に対応して格納される情報は、適法な引用形式を特定するための情報であり、図25に例示したように、「『』」や「””」等を格納することができる。項目「適法文書格納場所」に対応して格納される情報は、適法とみなす文書の格納場所を特定するための情報であり、例えば図25に示したように、「Z:¥quotaion¥law¥」や「Z:¥quotaion¥eng¥」等、文書の格納先となるフォルダ名等を格納することができる。なお、「適法とみなす文書」としては、例えば当該文書が引用された場合には適法とみなされる文書が該当する。この引用形式DB101fに格納される情報の格納方法や格納タイミングは任意で、例えば予め入力装置103を介して引用形式DB101fに格納することができ、あるいは後述する引用形式設定処理において引用形式DB101fに格納することができる。   The citation format DB 101f is a citation format storage unit that stores a classification for classifying article data and a predetermined citation format in association with each other. FIG. 25 is a table showing information stored in the citation format DB 101f. As shown in FIG. 25, the citation format DB 101f includes “type”, “citation format”, and “legitimate document storage location” as data items, and information corresponding to these is stored in association with each other. The information stored corresponding to the item “type” is information for specifying the type of the paper data, and as illustrated in FIG. 25, the field corresponding to the theme of the paper such as “law” or “engineering”. Can be stored. The information stored in correspondence with the item “quotation format” is information for specifying a legal citation format, and as shown in FIG. 25, stores ““ ””, ““ ””, and the like. Can do. The information stored in correspondence with the item “legitimate document storage location” is information for specifying the storage location of the document regarded as legal. For example, as shown in FIG. 25, “Z: ¥ quotation ¥ law ¥ "," Z: \ quotation \ eng \ ", and the like can store the name of the folder where the document is stored. Note that “a document regarded as legal” corresponds to, for example, a document regarded as legal when the document is cited. The storage method and the storage timing of the information stored in the citation format DB 101f are arbitrary. For example, the information can be stored in the citation format DB 101f via the input device 103 in advance, or stored in the citation format DB 101f in the citation format setting process described later. can do.

(処理−引用判定支援処理)
次に、以上のように構成された実施の形態7の引用判定支援装置100で実行される引用判定支援処理について説明する。図26は、実施の形態7の引用判定支援処理の手順を示すフローチャートである。なお、ステップSA2及びステップSA9を除くステップSA1からステップSA13までの各処理は、実施の形態1において図2を参照して説明したステップS11からステップS20aまでの各処理と同様であるので、詳細な説明は省略する。
(Processing-Citation determination support processing)
Next, a citation determination support process executed by the citation determination support apparatus 100 according to the seventh embodiment configured as described above will be described. FIG. 26 is a flowchart illustrating a procedure of citation determination support processing according to the seventh embodiment. Each process from step SA1 to step SA13 excluding step SA2 and step SA9 is the same as each process from step S11 to step S20a described with reference to FIG. Description is omitted.

ステップSA1において論文データの読み出しを行った後(ステップSA1)、引用形式設定部102sは引用形式の設定を行う(ステップSA2)。   After reading the article data in step SA1 (step SA1), the citation format setting unit 102s sets the citation format (step SA2).

ここで、引用形式設定処理について説明する。引用形式設定処理は、論文データにおける引用の適法性が判定される際の基準となる、引用形式を設定するための処理である。図27は、引用形式設定処理の手順を示すフローチャートである。   Here, the citation format setting process will be described. The citation format setting process is a process for setting a citation format, which is a standard for determining the legality of citations in article data. FIG. 27 is a flowchart showing the procedure of the citation format setting process.

図27に示すように、引用形式設定処理が起動されると、出力制御部102hは、引用形式設定入力画面を表示装置104に出力表示させる(ステップSB1)。図28は、引用形式設定入力画面を例示した図である。図28に示したように、引用形式設定入力画面には、例えば論文データの種別を選択する「種別」メニュー、適法な引用形式を入力する「引用形式」ボックス、適法とみなす文書の格納場所を指定する「適法文書格納場所」ボックス、引用形式設定入力画面における入力内容の確定指示を行うための確定ボタン、引用形式設定の終了指示を行うための終了ボタン等が表示される。   As shown in FIG. 27, when the citation format setting process is activated, the output control unit 102h outputs and displays a citation format setting input screen on the display device 104 (step SB1). FIG. 28 is a diagram illustrating a citation format setting input screen. As shown in FIG. 28, on the citation format setting input screen, for example, a “type” menu for selecting the type of article data, a “citation format” box for inputting a legal citation format, and a storage location of a document regarded as legal. A “legitimate document storage location” box to be specified, a confirmation button for instructing confirmation of input contents on the citation format setting input screen, an end button for instructing termination of citation format setting, and the like are displayed.

そして、引用形式設定部102sは、入力装置103を介した終了ボタンの押下により引用形式設定処理の終了指示がされた場合(ステップSB2、Yes)、引用形式設定処理を終了してメインルーチンに戻る。一方、終了ボタンが押下されず、引用形式設定処理の終了指示がされない場合(ステップSB2、No)、引用形式判定部は、入力装置103を介して「種別」メニューから論文データの種別(例えば、「法律」や「工学」等)が選択されるまで待機し(ステップSB3、No)、論文データの種別が選択された場合(ステップSB3、Yes)、当該選択された種別をRAM等に一時記憶する(ステップSB4)。   When the quit format setting process is instructed by pressing the end button via the input device 103 (Yes in step SB2), the citation format setting unit 102s ends the citation format setting process and returns to the main routine. . On the other hand, if the end button is not pressed and the end instruction of the citation format setting process is not instructed (No in step SB2), the citation format determination unit uses the input device 103 to select the type of article data (for example, Wait until “Law” or “Engineering” is selected (step SB3, No), and when the type of paper data is selected (step SB3, Yes), the selected type is temporarily stored in the RAM or the like. (Step SB4).

続いて、引用形式設定部102sは、入力装置103を介した確定ボタンの押下により入力内容の確定指示がされるまで待機し(ステップSB5、No)、入力内容の確定指示がされた場合(ステップSB5、Yes)、その時点で「引用形式」ボックスに入力されている引用形式(例えば、「『』」や「””」等)、及び「適法文書格納場所」で指定されている文書の格納場所(例えば、「Z:¥quotaion¥law¥」等)を取得し、ステップSB4でRAM等に一時記憶した種別と対応付けて、引用形式DB101fに格納する(ステップSB6)。その後、ステップSB2に戻り、終了指示がされたか否かの判定を行う(ステップSB2)。   Subsequently, the citation format setting unit 102s waits until an input content confirmation instruction is issued by pressing the confirmation button via the input device 103 (step SB5, No), and when the input content confirmation instruction is issued (step SB5). SB5, Yes), the citation format (for example, "" "," "" ", etc.) entered in the" citation format "box at that time, and storage of the document specified by" legitimate document storage location " A location (for example, “Z: ¥ quotation ¥ law ¥”, etc.) is acquired, and stored in the citation format DB 101f in association with the type temporarily stored in the RAM or the like in step SB4 (step SB6). Thereafter, the process returns to step SB2, and it is determined whether or not an end instruction has been issued (step SB2).

図26に示す引用判定支援処理に戻り、ステップSA8において、ステップSA7で類似度算出部102cによって算出された類似度が所定の閾値以上である場合(ステップSA8,Yes)、判定範囲は比較範囲の文献データ等を引用していると判断し、適法性判定部102eは当該引用が適法な引用か否かを判定するための適法性判定処理を実行する(ステップSA9)。   Returning to the citation determination support process shown in FIG. 26, in step SA8, when the similarity calculated by the similarity calculation unit 102c in step SA7 is greater than or equal to a predetermined threshold (step SA8, Yes), the determination range is the comparison range. It is determined that the document data is cited, and the legality determination unit 102e executes a legality determination process for determining whether the citation is a legal citation (step SA9).

(処理−適法性判定処理)
ここで、適法性判定処理について説明する。図29は、適法性判定処理の手順を示すフローチャートである。適法性判定処理が起動されると、適法性判定部102eは、判定対象の論文データの種別を特定する(ステップSC1)。例えば、種別入力画面(図示省略)を表示装置104に出力表示させ、入力装置103を介して判定対象の論文データの種別の入力を受け付けることができる。
(Processing-Legality judgment processing)
Here, the legality determination process will be described. FIG. 29 is a flowchart showing a procedure of legality determination processing. When the legality determination process is activated, the legality determination unit 102e specifies the type of article data to be determined (step SC1). For example, a type input screen (not shown) can be output and displayed on the display device 104, and an input of the type of paper data to be determined can be received via the input device 103.

次に、ステップSC1で特定した種別に基づいて引用形式DB101fを参照し、当該種別に対応する適法な引用形式、及び適法とみなす文書の格納場所を、引用形式DB101fから取得する(ステップSC2)。   Next, the citation format DB 101f is referred to based on the type specified in step SC1, and the legal citation format corresponding to the type and the storage location of the document regarded as legal are acquired from the citation format DB 101f (step SC2).

そして、ステップSA8で比較範囲の文献データ等を引用していると判断した引用が、ステップSC2で取得した適法な引用形式に準拠した引用か否かを判定する(ステップSC3)。例えば、引用部分の前後に、適法な引用形式「『』」が用いられている場合や、引用部分自体や引用部分の直後に当該引用部分の引用元を示す参考文献情報への参照番号が付記されている場合、あるいは当該引用部分が適法とみなす文書の格納場所に格納されている文書からの引用である場合、適法な引用形式に準拠した引用と判定する。   Then, it is determined whether or not the citation determined that the document data or the like in the comparison range is cited in step SA8 is a citation based on the legal citation format acquired in step SC2 (step SC3). For example, when the legitimate citation format ““ ”” is used before and after the citation, or when the citation is itself or immediately after the citation, a reference number is added to the reference information indicating the citation source of the citation. If it is a citation from a document stored in the document storage location where the citation is considered legal, it is determined that the citation conforms to a legal citation format.

その結果、適法な引用形式に準拠していないと判定した場合(ステップSC3、No)、適法性判定部102eは、当該引用部分が不適法である旨の表示を表示装置104に出力表示をさせる(ステップSC4)。例えば、図7に示した引用判定画面において、当該引用部分の表示を白黒反転させた表示とする。   As a result, when it is determined that it does not conform to the legal citation format (No in step SC3), the legality determination unit 102e causes the display device 104 to output and display a display indicating that the quoting part is illegal. (Step SC4). For example, in the citation determination screen shown in FIG.

一方、適法な引用形式に準拠していると判定した場合(ステップSC3、Yes)、又はステップSC4の処理の後、適法性判定部102eは比較範囲の文献データ等を引用していると判断した部分の全てについて適法性判定を行ったか否かを判定する(ステップSC5)。   On the other hand, when it is determined that it conforms to the legal citation format (step SC3, Yes), or after the processing of step SC4, the legality determination unit 102e determines that it has cited the document data in the comparison range. It is determined whether or not legality determination has been performed for all of the portions (step SC5).

その結果、引用部分の全てについて適法性判定を行っていないと判定した場合(ステップSC5、No)、適法性判定部102eは、適法性判定を行っていない他の引用部分について、適法な引用形式に準拠した引用か否かの判定を行う(ステップSC3)。一方、引用部分の全てについて適法性判定を行ったと判定した場合(ステップSC5、Yes)、適法性判定部102eは適法性判定処理を終了し、メインルーチンに戻る。   As a result, when it is determined that the legality determination is not performed for all of the citation parts (No in step SC5), the legality determination unit 102e determines the legal citation format for the other citation parts for which the legality determination is not performed. It is determined whether or not the quotation conforms to (step SC3). On the other hand, when it is determined that the legality determination has been performed for all the quoted portions (Yes in step SC5), the legality determination unit 102e ends the legality determination process and returns to the main routine.

(効果)
このように実施の形態7の引用判定支援装置100では、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定するので、予め設定した引用形式に基づき、引用の適法性を容易に判定することができる。
(effect)
As described above, the citation determination support apparatus 100 according to the seventh embodiment determines whether or not the determination range matches a predetermined citation format, and based on the determination result, the citation of the comparison range in the determination range is legal. Since it is determined whether or not it is a citation, it is possible to easily determine the legality of the citation based on a preset citation format.

また、論文データの種別に対応する引用形式を引用形式DB101fから取得し、当該取得した引用形式に引用が合致するか否かを判定するので、論文データの種別毎に異なる引用形式に基づき、引用の適法性を判定することができる。   In addition, the citation format corresponding to the type of the paper data is acquired from the citation format DB 101f, and it is determined whether or not the citation matches the acquired citation format. The legality of can be determined.

〔実施の形態8〕
次に、実施の形態8について説明する。この形態は、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出する形態である。ただし、実施の形態8に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 8]
Next, an eighth embodiment will be described. This form is a form in which the citation ratio occupied by the description content cited from the comparison range is calculated from the description content of the determination range. However, the configuration and processing according to the eighth embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図30は、実施の形態8に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、制御部102に引用割合算出部102tを備えると共に、記憶部101に引用割合DB101gを備えている。
(Constitution)
FIG. 30 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the eighth embodiment. In the citation determination support apparatus 100, the control unit 102 includes a citation rate calculation unit 102t, and the storage unit 101 includes a citation rate DB 101g.

引用割合算出部102tは、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出する引用割合算出手段である。   The quote ratio calculation unit 102t is a quote ratio calculation unit that calculates the quote ratio occupied by the description content cited from the comparison range in the description content of the determination range.

引用割合DB101gは、判定対象データを一意に識別する判定対象データ情報と、引用割合算出部102tが算出した引用割合とを、相互に関連付けて格納する引用割合格納手段である。図31は、引用割合DB101gに格納される情報を例示した表である。図31に示すように、引用割合DB101gはデータ項目として「論文データ情報」「文献データ情報」「引用割合」を備え、これらに対応する情報が相互に関連付けて格納されている。項目「論文データ情報」に格納される情報は、判定対象である論文データを一意に識別する判定対象データ情報であり、図31に示したように、例えば論文作成者の学籍簿番号及び論文作成日を含む識別番号が格納される。項目「文献データ情報」に格納される情報は、引用元である文献データを一意に識別する文献データ情報であり、図31に示したように、例えば文献データの文献情報が格納される。項目「引用割合」に格納される情報は、引用割合算出部102tが算出した引用割合を特定する情報であり、図31に示したように、例えば論文データにおける各文献データからの個別の引用割合及び当該個別の引用割合の合計値を百分率で示した数値が格納される。なお、引用割合の具体的内容については後述する。これらの情報は、次に述べる引用判定支援処理において引用割合DB101gに格納される。   The quotation ratio DB 101g is a quotation ratio storage unit that stores determination target data information for uniquely identifying determination target data and the quotation ratio calculated by the quotation ratio calculation unit 102t in association with each other. FIG. 31 is a table illustrating information stored in the citation ratio DB 101g. As shown in FIG. 31, the citation ratio DB 101g includes “article data information”, “literature data information”, and “citation ratio” as data items, and information corresponding to these is stored in association with each other. The information stored in the item “thesis data information” is judgment target data information for uniquely identifying the judgment subject paper data, and as shown in FIG. An identification number including the day is stored. The information stored in the item “document data information” is document data information that uniquely identifies the document data that is the citation source. For example, document information of the document data is stored as illustrated in FIG. The information stored in the item “quotation ratio” is information for specifying the citation ratio calculated by the citation ratio calculation unit 102t. As shown in FIG. 31, for example, individual citation ratios from each document data in the article data. And a numerical value indicating the total value of the individual citation ratios as a percentage. The specific content of the quoting ratio will be described later. These pieces of information are stored in the quotation ratio DB 101g in the quotation determination support process described below.

(処理)
次に、以上のように構成された実施の形態8の引用判定支援装置100で実行される処理について説明する。実施の形態8の引用判定支援装置100が実行する処理は、引用判定支援処理及びリスト表示処理に大別される。
(processing)
Next, processing executed by the quotation determination support apparatus 100 according to Embodiment 8 configured as described above will be described. The processes executed by the quotation determination support apparatus 100 according to the eighth embodiment are roughly classified into a quotation determination support process and a list display process.

(処理−引用判定支援処理)
まず、引用判定支援処理について説明する。図32は、実施の形態8の引用判定支援処理の手順を示すフローチャートである。なお、ステップSD1からステップSD11までの各処理は、実施の形態1において図2を参照して説明したステップS11からステップS20aまでの各処理と同様であるので、詳細な説明は省略する。
(Processing-Citation determination support processing)
First, the quotation determination support process will be described. FIG. 32 is a flowchart illustrating the procedure of the citation determination support process according to the eighth embodiment. Since each process from step SD1 to step SD11 is the same as each process from step S11 to step S20a described with reference to FIG. 2 in the first embodiment, detailed description thereof is omitted.

ステップSD11において、特定された比較範囲のデータの全てについてステップSD5からSD10までの処理が全て終了したと判定した場合(ステップSD11、Yes)、引用割合算出部102tは、判定範囲の記述内容のうち、比較範囲から引用された記述内容が占める引用割合を算出する(ステップSD12)。引用割合の具体的な内容は任意であり、例えば、判定範囲の文字数に対する引用部分の文字数の百分率を、引用割合として算出する。   In step SD11, when it is determined that the processing from steps SD5 to SD10 has been completed for all of the specified comparison range data (step SD11, Yes), the citation ratio calculation unit 102t includes the description contents of the determination range. Then, the quoting ratio occupied by the description content quoted from the comparison range is calculated (step SD12). The specific content of the quoting ratio is arbitrary. For example, the percentage of the number of characters in the citation portion with respect to the number of characters in the determination range is calculated as the quoting ratio.

そして、出力制御部102hは、引用割合算出部102tが算出した引用割合を表示装置104に出力表示させると共に、当該算出した引用割合を、判定対象の論文データを特定する論文データ情報に対応付けて引用割合DB101gに格納する(ステップSD13)。複数の文献データからの引用がある場合には、各文献データから引用された記述内容が占める個別の引用割合と、当該個別の引用割合の合計値とを算出し、引用割合DB101gに格納する。   Then, the output control unit 102h outputs and displays the citation ratio calculated by the citation ratio calculation unit 102t on the display device 104, and associates the calculated citation ratio with the article data information that specifies the article data to be determined. It is stored in the quotation rate DB 101g (step SD13). When there are citations from a plurality of document data, the individual citation ratio occupied by the description content cited from each document data and the total value of the individual citation ratios are calculated and stored in the citation ratio DB 101g.

図33は、引用割合を出力表示した場合の引用判定画面を例示した図である。図33の例では、判定範囲の文字数に対する引用部分の文字数の百分率として算出された引用割合を引用判定画面の右上部に表示する。なお、判定範囲の記述内容が複数の文献データから引用されている場合、図33に示したように各文献データからの引用割合の合計値と各文献データからの個別の引用割合とを共に表示させてもよく、各文献データからの引用割合の合計値のみを表示させてもよい。   FIG. 33 is a diagram exemplifying a citation determination screen when the citation ratio is output and displayed. In the example of FIG. 33, the quoting ratio calculated as a percentage of the number of characters in the citation part with respect to the number of characters in the determination range is displayed in the upper right part of the citation determination screen. In addition, when the description contents of the judgment range are cited from a plurality of document data, as shown in FIG. 33, the total value of the citation ratio from each document data and the individual citation ratio from each document data are displayed together. Only the total value of the citation ratios from each document data may be displayed.

(処理−リスト表示処理)
次に、リスト表示処理について説明する。このリスト表示処理は、各論文データの引用割合に基づく順序で論文データ情報を出力する処理である。図34は、リスト表示処理の手順を示すフローチャートである。このリスト表示処理の実行タイミングは任意で、例えば、入力装置103を介してリスト表示処理の実行指示が入力された場合に起動される。
(Processing-List display processing)
Next, list display processing will be described. This list display process is a process of outputting the article data information in the order based on the citation ratio of each article data. FIG. 34 is a flowchart showing the procedure of the list display process. The execution timing of the list display process is arbitrary, and is activated when, for example, an instruction to execute the list display process is input via the input device 103.

リスト表示処理が起動されると、出力制御部102hは、全ての論文データ情報及び対応する引用割合の合計値を引用割合DB101gから取得する(ステップSE1)。続いて、出力制御部102hは、取得した論文データ情報を、対応する引用割合の合計値の降順でソートし、表示装置104に出力表示させる(ステップSE2)。図35は、引用割合の合計値の降順で論文データ情報のリストを表示する判定結果画面を示す図である。図35に示すように、引用割合の降順で論文データ情報が画面表示される。この際、各論文データ情報について文献データ毎の個別の引用割合を併せて表示させてもよい。   When the list display process is activated, the output control unit 102h acquires the total value of all the article data information and the corresponding citation ratio from the citation ratio DB 101g (step SE1). Subsequently, the output control unit 102h sorts the acquired article data information in descending order of the total value of the corresponding citation ratios, and outputs and displays them on the display device 104 (step SE2). FIG. 35 is a diagram illustrating a determination result screen that displays a list of article data information in descending order of the total citation ratio. As shown in FIG. 35, the article data information is displayed on the screen in descending order of the citation rate. At this time, individual citation ratios for each document data may be displayed together for each piece of paper data information.

(効果)
このように実施の形態8の引用判定支援装置100では、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出及び出力するので、引用の適法性の判断材料を提示することができる。
(effect)
As described above, the citation determination support apparatus 100 according to the eighth embodiment calculates and outputs the citation ratio occupied by the description content quoted from the comparison range in the description content of the determination range. Can be presented.

また、複数の論文データについて引用割合を算出し、各論文データについての引用割合に基づく順序で論文データ情報を出力するので、複数の論文データにおける引用の適法性を引用割合に基づいて比較するための判断材料を提示することができる。   In addition, the citation ratio is calculated for multiple paper data, and the paper data information is output in the order based on the citation ratio for each paper data, so that the legality of citations in multiple paper data can be compared based on the citation ratio. The judgment materials can be presented.

〔実施の形態9〕
次に、実施の形態9について説明する。この形態は、引用箇所の引用元である文献データを特定する引用元情報が、判定対象データに含まれているか否かを判定する形態である。ただし、実施の形態9に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 9]
Next, Embodiment 9 will be described. This form is a form in which it is determined whether or not the citation source information that identifies the document data that is the citation source of the cited part is included in the determination target data. However, the configuration and processing according to the ninth embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(構成)
図36は、実施の形態9に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、記憶部101に出力態様DB101hを備えている。
(Constitution)
FIG. 36 is a block diagram illustrating a functional configuration of the citation determination support apparatus according to the ninth embodiment. The quotation determination support apparatus 100 includes an output mode DB 101h in the storage unit 101.

出力態様DB101hは、判定範囲の類似度と、表示装置104による出力態様とを、相互に対応付けて格納する出力態様情報格納手段である。図37は、出力態様DB101hに格納される情報を例示した表である。図37に示したように、出力態様DB101hはデータ項目として「類似度S[%]」「出力態様」を備え、これらに対応する情報が相互に関連付けて格納されている。項目「類似度S[%]」に対応して格納される情報は、判定範囲の類似度を特定する情報であり、引用判定の基準となる類似度の範囲を特定する情報(図37では「0≦S<20」「20≦S<80」等)が格納される。なお、図37では類似度の範囲を三段階に区分しているが、二段階、あるいは四段階以上に区分してもよい。項目「出力態様」に対応して格納される情報は、表示装置104による出力態様を特定するための情報であり、類似度に応じて出力させるべき態様を特定する情報が格納される。図37の例では、類似度が20%未満の場合は引用の可能性が低いと考えられることから文字の出力態様を「通常」とし、類似度が20%以上80%未満の場合は引用の可能性があることから文字の出力態様を「太字」とし、類似度が80%以上の場合は引用の可能性が高いことから文字の出力態様を「反転」としている。また、項目「出力態様」には、文字色や文字の背景色を特定する色情報、文字のフォントを特定するフォント情報等を格納してもよい。この出力態様DB101hに格納される情報の格納方法や格納タイミングは任意で、例えば予め入力装置103を介して出力態様DB101hに格納することができる。   The output mode DB 101h is output mode information storage means for storing the similarity of the determination range and the output mode by the display device 104 in association with each other. FIG. 37 is a table illustrating information stored in the output mode DB 101h. As shown in FIG. 37, the output mode DB 101h includes “similarity S [%]” and “output mode” as data items, and information corresponding to these items is stored in association with each other. The information stored corresponding to the item “similarity S [%]” is information that specifies the similarity of the determination range, and information that specifies the range of similarity that serves as a reference for citation determination (in FIG. 37, “ 0 ≦ S <20 ”,“ 20 ≦ S <80 ”, etc.) are stored. In FIG. 37, the range of similarity is divided into three stages, but it may be divided into two stages or four or more stages. The information stored corresponding to the item “output mode” is information for specifying the output mode by the display device 104, and stores information for specifying the mode to be output according to the degree of similarity. In the example of FIG. 37, since it is considered that the possibility of citation is low when the similarity is less than 20%, the character output mode is “normal”, and when the similarity is 20% or more and less than 80%, Since there is a possibility, the character output mode is “bold”, and when the similarity is 80% or more, the character output mode is “inverted” because the possibility of citation is high. In addition, the item “output mode” may store color information specifying the character color and the background color of the character, font information specifying the font of the character, and the like. The storage method and the storage timing of the information stored in the output mode DB 101h are arbitrary, and can be stored in the output mode DB 101h via the input device 103 in advance, for example.

(処理)
次に、以上のように構成された実施の形態9の引用判定支援装置100で実行される引用判定支援処理について説明する。図38は、実施の形態9の引用判定支援処理の手順を示すフローチャートである。なお、ステップSF1、ステップSF5、ステップSF8、ステップSF9、ステップSF12、及びステップSF15からステップSF17は、それぞれ実施の形態1において図2を参照して説明したステップS11、ステップS14、ステップS15、ステップS16、ステップS18、ステップS19からステップS20aの各処理と同様であるので、詳細な説明は省略する。
(processing)
Next, a citation determination support process executed by the citation determination support apparatus 100 of Embodiment 9 configured as described above will be described. FIG. 38 is a flowchart illustrating the procedure of the citation determination support process according to the ninth embodiment. Note that step SF1, step SF5, step SF8, step SF9, step SF12, and step SF15 to step SF17 are respectively step S11, step S14, step S15, and step S16 described with reference to FIG. 2 in the first embodiment. , Step S18 and Step S19 to Step S20a are the same as the respective processes, and detailed description thereof is omitted.

ステップSF1において論文データの読み出しを行った後(ステップSF1)、出力制御部102hは論文データを表示装置104に出力表示させる(ステップSF2)。図39は、表示装置104上の引用判定画面に表示された論文データを示す図である。図39に示した例では、出力制御部102hは引用判定画面上に、論文データ表示エリア105、範囲設定スライダ106、全体ビュー107、文献データ表示エリア108を表示させる。論文データ表示エリア105は、判定対象の論文データを表示させる領域である。範囲設定スライダ106は、判定対象の論文データにおける判定範囲を設定するものであり、上側の範囲設定スライダ106aと下側の範囲設定スライダ106bとに挟まれた領域が判定範囲として設定される。全体ビュー107は、判定対象の論文データの全体における、論文データ表示エリア105の表示範囲、判定範囲、及び引用部分の概略位置を表示させる領域である。文献データ表示エリア108は、引用された文献データの内容を表示させる領域である。図39に示したように、ステップSF2では、論文データ表示エリア105に論文データの内容が表示されると共に、論文データ表示エリア105の表示範囲が長方形の枠線として全体ビュー107に表示される。   After reading the paper data in step SF1 (step SF1), the output control unit 102h outputs and displays the paper data on the display device 104 (step SF2). FIG. 39 is a diagram showing the article data displayed on the citation determination screen on the display device 104. In the example shown in FIG. 39, the output control unit 102h displays a paper data display area 105, a range setting slider 106, an overall view 107, and a document data display area 108 on the citation determination screen. The paper data display area 105 is an area for displaying paper data to be determined. The range setting slider 106 sets a determination range in the paper data to be determined, and an area sandwiched between the upper range setting slider 106a and the lower range setting slider 106b is set as the determination range. The overall view 107 is an area for displaying the display range of the paper data display area 105, the determination range, and the approximate position of the cited portion in the entire paper data to be determined. The document data display area 108 is an area for displaying the contents of the cited document data. As shown in FIG. 39, in step SF2, the content of the paper data is displayed in the paper data display area 105, and the display range of the paper data display area 105 is displayed in the overall view 107 as a rectangular frame.

図38に戻り、判定範囲特定部102aは、入力装置103を介して判定範囲の指示入力がされたか否かを判定し(ステップSF3)、判定範囲の指示入力がされたと判定した場合(ステップSF3、Yes)、当該指示入力により指示された範囲を判定範囲として特定する(ステップSF4)。図39に示した例では、判定対象の論文データのうち、上側と下側との範囲設定スライダ106によって挟まれた範囲を判定範囲として特定する。また、出力制御部102hは、図39に例示したように、判定範囲外の領域を全体ビュー107において斜線ハッチングで表示させる。   Returning to FIG. 38, the determination range specifying unit 102a determines whether or not a determination range instruction is input via the input device 103 (step SF3), and determines that a determination range instruction is input (step SF3). , Yes), the range specified by the instruction input is specified as the determination range (step SF4). In the example shown in FIG. 39, the range between the upper and lower range setting sliders 106 in the paper data to be determined is specified as the determination range. In addition, as illustrated in FIG. 39, the output control unit 102h displays an area outside the determination range by hatching in the overall view 107.

図38に戻り、ステップSF5において比較範囲が特定された後、文献引用判定部102dは、入力装置103を介して類似度の閾値が入力されたか否かを判定し(ステップSF6)、類似度の閾値が入力されたと判定した場合(ステップSF6、Yes)、文献引用判定部102dは当該入力された閾値を引用判定における類似度の閾値として設定する(ステップSF7)。なお、閾値の入力方法は任意であり、例えば閾値の入力ボックスを引用判定画面に表示させ(図示省略)、入力装置103を介して当該入力ボックスに入力された数値を閾値として設定することができる。あるいは、閾値の設定スライダを引用判定画面に表示させ(図示省略)、入力装置103を介して位置変更された設定スライダの位置に対応する値を閾値として設定することができる。   Returning to FIG. 38, after the comparison range is specified in step SF5, the document citation determination unit 102d determines whether or not a similarity threshold value is input via the input device 103 (step SF6). When it is determined that a threshold value has been input (step SF6, Yes), the document citation determination unit 102d sets the input threshold value as a similarity threshold value in citation determination (step SF7). The threshold value input method is arbitrary. For example, a threshold value input box can be displayed on the citation determination screen (not shown), and a numerical value input to the input box via the input device 103 can be set as the threshold value. . Alternatively, a threshold setting slider can be displayed on the quotation determination screen (not shown), and a value corresponding to the position of the setting slider whose position has been changed via the input device 103 can be set as the threshold.

ステップSF9において類似度算出部102cが類似度を算出した後(ステップSF9)、出力制御部102hは、当該算出された類似度に対応する出力態様を出力態様DB101hから取得し(ステップSF10)、当該取得した出力態様に基づいて判定範囲を表示装置104に出力表示させる(ステップSF11)。図39の例では、論文データ表示エリア105における文字が、算出された類似度に対応して図37に例示した出力態様DB101hから取得された出力態様に基づいて表示されている。すなわち、類似度が20%未満の部分は通常の表示、類似度が20%以上80%未満の部分は太字表示、類似度が80%以上の部分は反転表示される。また、類似度が20%以上の部分については、全体ビュー107において交差線によるハッチングで表示される。これにより、論文データ全体において引用の可能性がある部分が占める範囲を、ユーザが概略的に把握することが可能となる。   After the similarity calculation unit 102c calculates the similarity in step SF9 (step SF9), the output control unit 102h acquires an output mode corresponding to the calculated similarity from the output mode DB 101h (step SF10). Based on the acquired output mode, the determination range is output and displayed on the display device 104 (step SF11). In the example of FIG. 39, characters in the paper data display area 105 are displayed based on the output mode acquired from the output mode DB 101h illustrated in FIG. 37 corresponding to the calculated similarity. That is, a portion with a similarity of less than 20% is displayed normally, a portion with a similarity of 20% or more and less than 80% is displayed in bold, and a portion with a similarity of 80% or more is highlighted. In addition, a portion having a similarity of 20% or more is displayed by crossing hatching in the overall view 107. As a result, the user can roughly grasp the range occupied by the portion that may be cited in the entire paper data.

図38に戻り、ステップSF12において、適法性判定部102eによって判定範囲の引用が適法な引用でないと判定された場合(ステップSF12、No)、適法性判定部102eは、適法でないと判定された引用箇所の引用元である文献データを特定する引用元情報が、判定対象の論文データに含まれているか否かを判定する(ステップSF13)。引用元情報の具体的な内容は任意で、例えば、引用元文献の著者名、発表年、タイトル、掲載雑誌、巻数、所在ペ―ジ等の情報を引用元情報とすることができる。また、引用元情報が含まれているか否かの判定基準は任意で、例えば、引用箇所の直後に引用元情報が記載されているか否か、あるいは、引用箇所の直後に記載された注番号に対応して論文データの末尾に引用情報が記載されているか否かを基準として判定を行うことができる。   Returning to FIG. 38, when the legality determination unit 102e determines in step SF12 that the citation of the determination range is not a legal citation (No in step SF12), the legality determination unit 102e determines that the citation is not legal. It is determined whether or not the citation source information that identifies the document data that is the citation source of the portion is included in the paper data to be determined (step SF13). The specific content of the citation source information is arbitrary. For example, information such as the author's name, publication year, title, publication magazine, number of volumes, and location page of the citation source information can be used as the citation source information. In addition, the criterion for determining whether or not the citation source information is included is arbitrary. For example, whether or not the citation source information is described immediately after the citation location, or the note number described immediately after the citation location is indicated. Correspondingly, the determination can be made based on whether or not the citation information is described at the end of the article data.

その結果、引用元情報が判定対象の論文データに含まれていると判定した場合(ステップSF13、Yes)、出力制御部102hは、当該引用元情報を表示装置104に出力表示させる(ステップSF14)。引用元情報を表示装置104に出力表示させる方法や手順は任意で、例えば適法な引用でないと判定された引用部分に対応する引用元情報を表示させる旨の指示入力が入力装置103を介してされた場合、当該引用部分に対応する引用元情報を表示させる。また、適法な引用でないと判定された引用部分が複数個所存在する場合は、入力装置103を介した指示入力により複数の引用部分の中から選択された引用部分に対応する引用元情報を表示させる。図40は、引用元情報が表示された引用判定画面を示す図である。図40に示したように、引用判定画面の論文データ表示エリア105において、指定された引用部分に対応する引用元情報(表示されている論文データの最下部の「○○○○,△△△△,「××××××」,□□誌,第○巻,△頁−□頁」部分)が強調表示される(図40では反転表示)。   As a result, when it is determined that the citation source information is included in the paper data to be determined (step SF13, Yes), the output control unit 102h outputs and displays the citation source information on the display device 104 (step SF14). . The method and procedure for outputting and displaying the citation source information on the display device 104 is arbitrary. For example, an instruction input for displaying the citation source information corresponding to the citation portion determined not to be a legal citation is input via the input device 103. If it is, the citation source information corresponding to the citation part is displayed. Further, when there are a plurality of citation parts determined not to be legal citations, the citation source information corresponding to the citation part selected from the plurality of citation parts is displayed by an instruction input via the input device 103. . FIG. 40 is a diagram illustrating a citation determination screen on which citation source information is displayed. As shown in FIG. 40, in the article data display area 105 of the citation determination screen, the citation source information corresponding to the designated citation part (“XXXXX, △△△ at the bottom of the displayed article data) is displayed. Δ, “XXX × XXX”, □□ Magazine, Vol. ○, △ Page- □ Page ”) is highlighted (inverted display in FIG. 40).

このように引用元情報を表示した後(ステップSF14)、又はステップSF13で引用元情報が論文データに含まれていないと判定した場合(ステップSF13、No)、参照情報取得部102fは参照情報を取得する(ステップSF15)。   After the citation source information is displayed in this way (step SF14), or when it is determined in step SF13 that the citation source information is not included in the paper data (step SF13, No), the reference information acquisition unit 102f displays the reference information. Obtain (step SF15).

(効果)
このように実施の形態9の引用判定支援装置100では、引用箇所の引用元である文献データを特定する引用元情報が論文データに含まれているか否かを判定するので、引用元情報の有無に基づいて引用の適法性を判定する際の判断材料を取得できる。
(effect)
As described above, in the citation determination support apparatus 100 according to the ninth embodiment, since it is determined whether or not the citation source information for identifying the document data that is the citation source of the citation portion is included in the paper data, the presence or absence of the citation source information. Based on the above, it is possible to obtain a judgment material for judging the legality of the citation.

また、論文データの中から、入力装置103を介して指定された範囲を判定範囲として特定するので、引用判定を行う対象を限定することができ、判定処理に伴う負荷を低減することができる。   In addition, since the range specified via the input device 103 is specified as the determination range from the article data, it is possible to limit the target of citation determination, and to reduce the load associated with the determination process.

また、類似度が入力装置103を介して入力された所定の閾値以上である場合に、判定範囲が比較範囲を引用していると判定するので、判定の目的に合わせて最適な閾値を設定し、当該閾値に基づく判定を行わせることができる。   In addition, when the similarity is equal to or higher than a predetermined threshold value input via the input device 103, it is determined that the determination range refers to the comparison range. Therefore, an optimal threshold value is set according to the purpose of the determination. The determination based on the threshold value can be performed.

また、類似度算出部102cにて算出された類似度に対応する出力態様を出力態様DB101hから取得し、当該取得した出力態様にて判定範囲を出力するので、ユーザが類似度を把握し易い態様で判定範囲を出力することができる。   Moreover, since the output mode corresponding to the similarity calculated by the similarity calculation unit 102c is acquired from the output mode DB 101h and the determination range is output in the acquired output mode, the mode in which the user can easily grasp the similarity Can output the judgment range.

〔実施の形態10〕
次に、実施の形態10について説明する。この形態は、文献データを特定する引用元情報が判定対象データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定する形態である。ただし、実施の形態10に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
[Embodiment 10]
Next, Embodiment 10 will be described. In this form, when the citation source information for specifying the document data is included in the determination target data, it is determined that the document data specified based on the citation source information is stored in the document data storage unit In this mode, the document data is specified as a comparison range. However, the configuration and processing according to the tenth embodiment are the same as the configuration and processing according to the first embodiment unless otherwise described, and the same configuration and processing are described in the first embodiment. The description is omitted by using the same name or symbol as used as necessary.

(処理−引用判定支援処理)
本実施の形態10の引用判定支援装置100で実行される引用判定支援処理について説明する。図41は、実施の形態10の引用判定支援処理の手順を示すフローチャートである。なお、ステップSG11を除くステップSG1からステップSG12までの各処理は、実施の形態1において図2を参照して説明したステップS11からステップS20aの各処理と同様であるので、詳細な説明は省略する。
(Processing-Citation determination support processing)
A citation determination support process executed by the citation determination support apparatus 100 of the tenth embodiment will be described. FIG. 41 is a flowchart illustrating the procedure of the citation determination support process according to the tenth embodiment. Since each process from step SG1 to step SG12 excluding step SG11 is the same as each process from step S11 to step S20a described with reference to FIG. 2 in the first embodiment, detailed description thereof is omitted. .

ステップSG10において、文献データ等を判定範囲内で引用している箇所を引用判定画面に明示するとともに参照情報を表示した後(ステップSG10)、比較範囲特定部102bは、引用されていた文献データを文献データ記憶部101aに記憶させると共に、当該文献データの書誌情報(例えば、著者名、発表年、タイトル、掲載雑誌、URL等)、及び当該文献データの保存場所(例えばフォルダ名)を文献リスト記憶部101bに記憶させる(ステップSG11)。その後、ステップSG5からステップSG11までの処理が、特定された比較範囲のデータの全てについて実行されたか否かを判定する(ステップSG12)。   In step SG10, after clearly showing on the citation determination screen the portion where the document data or the like is cited within the determination range, and displaying the reference information (step SG10), the comparison range specifying unit 102b converts the cited document data. The bibliographic information (for example, author name, publication year, title, published magazine, URL, etc.) of the document data and the storage location (for example, folder name) of the document data are stored in the document list while being stored in the document data storage unit 101a. Store in the unit 101b (step SG11). Thereafter, it is determined whether or not the processing from step SG5 to step SG11 has been executed for all the data in the specified comparison range (step SG12).

(処理−比較範囲特定処理)
ここで、引用判定支援処理のステップSG4で実行される比較範囲特定処理について説明する。図42は、実施の形態10の比較判定処理の手順を示すフローチャートである。なお、ステップSH5からステップSH7までの各処理は、実施の形態1において図6を参照して説明したステップS21からステップS23までの各処理と同様であるので、詳細な説明は省略する。
(Processing-Comparison range identification processing)
Here, the comparison range specifying process executed in step SG4 of the citation determination support process will be described. FIG. 42 is a flowchart illustrating a comparison determination process according to the tenth embodiment. Since each process from step SH5 to step SH7 is the same as each process from step S21 to step S23 described with reference to FIG. 6 in the first embodiment, detailed description thereof is omitted.

比較範囲特定処理が起動されると、比較範囲特定部102bは、引用判定支援処理のステップSG2で行われた論文データの構造解析の結果に基づき、論文データにおいて引用されている文献データを特定する引用元情報が、当該論文データに含まれているか否かを判定する(ステップSH1)。   When the comparison range specifying process is activated, the comparison range specifying unit 102b specifies the document data cited in the paper data based on the result of the structural analysis of the paper data performed in step SG2 of the citation determination support process. It is determined whether the citation source information is included in the paper data (step SH1).

その結果、引用元情報が含まれていた場合(ステップSH1、Yes)、比較範囲特定部102bは文献リスト記憶部101bを参照し、引用元情報に対応する書誌情報が当該文献リスト記憶部101bに記憶されているか否かを判定する(ステップSH2)。その結果、書誌情報が文献リスト記憶部101bに記憶されていた場合(ステップSH2、Yes)、比較範囲特定部102bは、当該書誌情報に対応付けて記憶されている保存場所に保存されている文献データを文献データ記憶部101aから読み出し(ステップSH3)、当該読出した文献データを、比較範囲として特定する(SH4)。   As a result, when the citation source information is included (step SH1, Yes), the comparison range specifying unit 102b refers to the document list storage unit 101b, and the bibliographic information corresponding to the citation source information is stored in the document list storage unit 101b. It is determined whether or not it is stored (step SH2). As a result, when the bibliographic information is stored in the document list storage unit 101b (step SH2, Yes), the comparison range specifying unit 102b stores the document stored in the storage location stored in association with the bibliographic information. Data is read from the document data storage unit 101a (step SH3), and the read document data is specified as a comparison range (SH4).

一方、ステップSH1において引用元情報が論文データに含まれていないと判定した場合(ステップSH1、No)、あるいはステップSH2において引用元情報に対応する書誌情報が文献リスト記憶部101bに記憶されていないと判定した場合(ステップSH2、No)、比較範囲特定部102bは、論文データ記憶部101cに格納されている過去に提出された全ての論文データを読み出す(ステップSH5)。   On the other hand, when it is determined in step SH1 that the citation information is not included in the paper data (step SH1, No), or bibliographic information corresponding to the citation information is not stored in the document list storage unit 101b in step SH2. (Step SH2, No), the comparison range specifying unit 102b reads all the paper data submitted in the past stored in the paper data storage unit 101c (step SH5).

ステップSH4又はステップSH7の処理の後、比較範囲特定部102bは比較範囲特定処理を終了し、メインルーチンに戻る。   After the process of step SH4 or step SH7, the comparison range specifying unit 102b ends the comparison range specifying process and returns to the main routine.

(効果)
このように実施の形態10の引用判定支援装置100では、判定範囲において引用されていると文献引用判定部102dによって判定された文献データを文献データ記憶部101aに記憶させる。また、文献データを特定する引用元情報が論文データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶部101aに格納されていると判定した場合、当該文献データを比較範囲として特定する。これにより、既に文献データ記憶部101aに記憶されている文献データに比較範囲を限定することができ、比較範囲のデータから判定範囲の内容を検索する際の負荷を低減することができる。
(effect)
As described above, the citation determination support apparatus 100 according to the tenth embodiment stores the document data determined by the document citation determination unit 102d as being cited in the determination range in the document data storage unit 101a. Further, in the case where the citation source information specifying the document data is included in the paper data, when it is determined that the document data specified based on the citation source information is stored in the document data storage unit 101a, Identify literature data as a comparison range. Thereby, the comparison range can be limited to the document data already stored in the document data storage unit 101a, and the load when the contents of the determination range are searched from the data of the comparison range can be reduced.

〔実施の形態6に対する変形例1〕
以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
[Modification 1 to Embodiment 6]
Although the embodiments of the present invention have been described above, the specific configuration and means of the present invention are arbitrarily modified and improved within the scope of the technical idea of each invention described in the claims. be able to. Hereinafter, such a modification will be described.

実施の形態6では、類似度算出部102rにおいて、検索キーの文字列が制限文字数を超えた場合の処理を行っているが、予め検索キーとして指定する文字列が制限文字数を超えないように処理することもできる。   In the sixth embodiment, the similarity calculation unit 102r performs processing when the character string of the search key exceeds the limited number of characters, but performs processing so that the character string specified in advance as the search key does not exceed the limited number of characters. You can also

すなわち、類似度算出部102rにおいて、判定範囲を形態素解析などを利用したテキストマイニング処理により解析して制限文字数以下の文字列の単語に分割し、所定数以上出現する単語を検索キーと指定して、単語ごとに比較範囲の中から複数回検索する。そして、類似度算出部102rは、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果の比較範囲を、判定範囲の記述内容との相互の類似度を算出する比較範囲の対象として決定するように構成すればよい。   That is, in the similarity calculation unit 102r, the determination range is analyzed by a text mining process using morphological analysis or the like, and divided into words of a character string equal to or less than the limited number of characters. Search multiple times from the comparison range for each word. Then, the similarity calculation unit 102r calculates the comparison range of the search results whose appearance frequency is larger than a predetermined value among the search results of a plurality of times, and the comparison range target for calculating the mutual similarity with the description content of the determination range. It may be configured to be determined as

このような変形例1における類似度算出処理について説明する。図22は、変形例1の類似度算出処理の手順を示すフローチャートである。   The similarity calculation process in Modification 1 will be described. FIG. 22 is a flowchart illustrating a procedure of similarity calculation processing according to the first modification.

まず、類似度算出部102rは、判定範囲の記述内容のデータに対して形態素解析等のテキストマイニング処理を施して、制限文字数以内の文字数の単語に分割する(ステップS111)。そして、類似度算出部102rは、単語ごとの出現頻度を算出し(ステップS112)、出現頻度の高い順に単語をソートする(ステップS113)。そして、類似度算出部102rは、最も出現頻度の高い単語を検索キーとして指定する(ステップS114)。   First, the similarity calculation unit 102r performs text mining processing such as morphological analysis on the data of the description contents in the determination range, and divides the data into words having a number of characters within the limited number of characters (step S111). Then, the similarity calculation unit 102r calculates the appearance frequency for each word (step S112), and sorts the words in descending order of appearance frequency (step S113). Then, the similarity calculation unit 102r designates a word having the highest appearance frequency as a search key (step S114).

次に、類似度算出部102rは、指定された検索キーで比較範囲を検索し(ステップS115)、その検索結果をメモリに記憶する(ステップS116)。   Next, the similarity calculation unit 102r searches the comparison range using the designated search key (step S115), and stores the search result in the memory (step S116).

次に、類似度算出部102rは、出現頻度が所定数以上の全ての単語につき検索の処理を行ったか否かを判断する(ステップS117)。そして、類似度算出部102rは、出現頻度が所定数以上の全ての単語に対してまだ検索処理を行っていないと判断した場合には(ステップS117,No)、次に出現頻度の高い単語を検索キーとして指定し(ステップS118)、ステップS115およびS116の検索処理を繰り返し実行する。   Next, the similarity calculation unit 102r determines whether or not a search process has been performed for all words having an appearance frequency equal to or greater than a predetermined number (step S117). If the similarity calculation unit 102r determines that the search processing has not yet been performed for all the words having the appearance frequency equal to or greater than the predetermined number (No in step S117), the word having the next highest appearance frequency is selected. The search key is designated (step S118), and the search processing of steps S115 and S116 is repeatedly executed.

一方、ステップS117において、類似度算出部102rは、出現頻度が所定数以上の全ての単語に対して検索処理が完了したと判断した場合には(ステップS117,Yes)、メモリに記憶された複数の検索結果の中で最も出現頻度の高い検索結果としての比較範囲を選択する(ステップS119)。これにより、選択された比較範囲が類似度算出の対象となり、判定範囲との類似度が算出される。   On the other hand, in step S117, when the similarity calculation unit 102r determines that the search processing has been completed for all words having an appearance frequency equal to or greater than the predetermined number (step S117, Yes), the similarity calculation unit 102r stores a plurality of items stored in the memory. The comparison range as the search result having the highest appearance frequency is selected from the search results (step S119). As a result, the selected comparison range becomes a target of similarity calculation, and the similarity with the determination range is calculated.

このように実施の形態6の変形例1によれば、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。また、判定範囲の記述内容の中から予め制限文字数以下の単語を検索キーとして検索を行うこともでき、この場合には、検索キーの制限文字数にかかわらず、引用判定の精度を向上させることができる。   As described above, according to the first modification of the sixth embodiment, a search result having a high appearance frequency is automatically specified, and this search result is automatically set as a comparison range used for similarity calculation. It is possible to automatically extract a comparison range that matches the above and perform citation determination, thereby further improving the accuracy of citation determination. In addition, it is possible to perform a search in advance using a search key with words that are equal to or less than the limit number of characters in the description contents of the determination range. it can.

なお、本変形例の処理を、実施の形態6と同様に、検索エンジン等から検索キーの文字数が制限文字数を超えている旨のエラー通知を受信したときのみに実行するように、類似度算出部102rを構成してもよい。   Similarity calculation is performed so that the process of this modification is executed only when an error notification indicating that the number of characters of the search key exceeds the limit number of characters is received from the search engine or the like, as in the sixth embodiment. The unit 102r may be configured.

〔実施の形態5および6に対する変形例2〕
実施の形態6では、類似度算出部102rにおいて、判定範囲と比較範囲の類似度を算出する際に、検索キーが制限文字数を超えた場合の処理をおこなっていたが、かかる処理を、実施の形態5における比較範囲特定部102qの処理に適用することもできる。
[Modification 2 to Embodiments 5 and 6]
In the sixth embodiment, when the similarity calculation unit 102r calculates the similarity between the determination range and the comparison range, the process is performed when the search key exceeds the limit number of characters. It can also be applied to the processing of the comparison range specifying unit 102q in the fifth embodiment.

すなわち、論文データから抽出した課題文を検索キーにしてWEBページを検索しているが、課題文が制限文字数を超えるような長い文章の場合には、検索エンジン等から実施の形態6で説明したエラー通知が送信される。このため、比較範囲特定部102qにおいて、検索キーが制限文字数を超える旨のエラー通知を受信した場合には、実施の形態6の類似度算出部102rと同様に、抽出された課題文の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての課題文の文字列をずらしながら複数回の検索を行う。そして、検索結果として出力された複数のURLの中から最も出現頻度の高いURLで指定された引用文献データを比較範囲と決定するように比較範囲特定部102qを構成すればよい。   In other words, the WEB page is searched using the assignment sentence extracted from the article data as a search key. However, if the assignment sentence is a long sentence exceeding the limit number of characters, the search engine explained in the sixth embodiment. An error notification is sent. For this reason, when the comparison range specifying unit 102q receives an error notification that the search key exceeds the limit number of characters, the comparison range specifying unit 102q, in the extracted task sentence, similarly to the similarity calculation unit 102r of the sixth embodiment. A search key is designated by a character string corresponding to the limit number of characters, and a search is performed a plurality of times while shifting the character string of the task sentence as the search key. Then, the comparison range specifying unit 102q may be configured to determine the cited document data specified by the URL with the highest appearance frequency from the plurality of URLs output as the search results as the comparison range.

図23は、変形例2の比較範囲特定処理の手順を示すフローチャートである。まず、課題抽出部102pは、判定対象となった論文データに構造解析を行って、課題文を抽出する(ステップS131)。次に、比較範囲特定部102qは、抽出された課題文を検索キーとして、インターネット130上のWEBサイト131やファイルサーバ133等から該当するWEBページを検索する(ステップS132)。   FIG. 23 is a flowchart illustrating a procedure of comparison range specifying processing according to the second modification. First, the task extraction unit 102p performs structural analysis on the paper data that is a determination target, and extracts a task sentence (step S131). Next, the comparison range specifying unit 102q searches for a corresponding WEB page from the WEB site 131, the file server 133, or the like on the Internet 130 using the extracted task sentence as a search key (step S132).

そして、比較範囲特定部102qは、検索キーが制限文字数を超えた旨のエラー通知を受信したか否かを判断する(ステップS133)。   Then, the comparison range specifying unit 102q determines whether or not an error notification indicating that the search key exceeds the limit number of characters has been received (step S133).

そして、検索キーが制限文字数を超えた旨のエラー通知を受信しなかった場合には(ステップS133,No)、比較範囲特定部102qは、検索結果のURLを選択し(ステップS141)、実施の形態5と同様に、この検索結果のURLで指定された引用文献データが比較範囲として特定されることになる。   If the error notification indicating that the search key exceeds the limit number of characters has not been received (step S133, No), the comparison range specifying unit 102q selects the search result URL (step S141), and As in the fifth aspect, the cited document data specified by the URL of the search result is specified as the comparison range.

一方、ステップS133において、検索キーが制限文字数を超えた旨のエラー通知を受信した場合には(ステップS133,Yes)、比較範囲特定部102qは、受信したエラー通知の中から制限文字数を取得する(ステップS134)。   On the other hand, if an error notification indicating that the search key has exceeded the limit number of characters is received in step S133 (step S133, Yes), the comparison range specifying unit 102q acquires the limit number of characters from the received error notification. (Step S134).

そして、比較範囲特定部102qは、課題文の先頭から、制限文字数分の範囲の文字列を検索キーと指定し(ステップS135)、この検索キーでWEBページを検索する(ステップS136)。比較範囲特定部102qは、その検索結果であるURLをメモリに記憶する(ステップS137)。   Then, the comparison range specifying unit 102q designates a character string in the range of the limited number of characters from the beginning of the task sentence as a search key (step S135), and searches the WEB page with this search key (step S136). The comparison range specifying unit 102q stores the URL that is the search result in the memory (step S137).

そして、比較範囲特定部102qは、課題文の検索キーとして最終文字列まで到達したか否かを判断し(ステップS138)、まだ到達していない場合には(ステップS138,No)、課題文の中で次の制限文字数分の文字列を検索キーに指定して(ステップS139)、ステップS136およびS137の処理を繰り返し実行する。   Then, the comparison range specifying unit 102q determines whether or not the final character string has been reached as the assignment key for the assignment sentence (step S138), and if it has not been reached yet (step S138, No), Among them, a character string corresponding to the next limited number of characters is designated as a search key (step S139), and the processes of steps S136 and S137 are repeatedly executed.

一方、ステップS138において、課題文の検索キーとして最終文字列まで到達した場合には(ステップS138,Yes)、メモリに保存された検索結果のURLの中で、最も出現頻度の高い検索結果のURLを選択し(ステップS140)、選択されたWEBページのURLで指定された引用文献データが比較範囲として特定されることになる。   On the other hand, in step S138, when the final character string is reached as the search key for the task sentence (step S138, Yes), the URL of the search result with the highest appearance frequency among the search result URLs stored in the memory. Is selected (step S140), and the cited document data designated by the URL of the selected WEB page is specified as the comparison range.

従って、この変形例2によれば、検索キーが制限文字数を超えた場合には、課題文の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての課題文の文字列をずらしながら複数回の検索を行っているので、検索キーの制限文字数にかかわらず、論文データの内容に即した適切な引用文献データの比較範囲を特定することができ、引用判定の精度をより向上させることができる。   Therefore, according to the second modification, when the search key exceeds the limit number of characters, the search key is specified by a character string corresponding to the limit number of characters in the task sentence, and the character string of the task sentence as the search key Since the search is performed multiple times while shifting, it is possible to specify an appropriate comparison range of cited reference data according to the content of the article data, regardless of the limited number of characters in the search key, and to improve the accuracy of citation determination. Can be improved.

〔実施の形態5および6に対する変形例3〕
さらに、実施の形態5の比較範囲特定部102qを、上記変形例1で説明したような処理、すなわち、予め検索キーとして指定する文字列が制限文字数を超えないように、課題文を単語に分割して検索キーとして指定して検索を行うように構成してもよい。
[Modification 3 with respect to Embodiments 5 and 6]
Further, the comparison range specifying unit 102q according to the fifth embodiment performs processing as described in the first modification, that is, the task sentence is divided into words so that the character string designated as a search key in advance does not exceed the limit number of characters. Then, the search may be performed by designating it as a search key.

〔実施の形態7に対する変形例〕
上述の実施の形態7では、類似度算出部102cによって算出された類似度が所定の閾値以上と判定された部分について引用の適法性の判定を行っているが、判定対象の論文データ全体について引用の適法性判定を行うように構成してもよい。例えば、判定対象の論文データに、当該論文データの種別に対応する引用形式の記号(例えば「『』」、「””」等)が含まれている場合、当該論文データにおける引用は適法である旨の判定をするように構成してもよい。また、当該判定結果に基づく出力態様で、論文データのファイル名を表示装置104に出力表示させてもよい。例えば、引用が不適法と判定された論文データのファイル名を白黒反転表示させ、適法と判定された論文データのファイル名と識別可能としてもよい。
[Modification to Embodiment 7]
In the seventh embodiment described above, the legitimacy of citation is determined for a portion where the similarity calculated by the similarity calculation unit 102c is determined to be equal to or greater than a predetermined threshold. You may comprise so that the legality determination may be performed. For example, if the paper data to be judged contains a citation symbol (for example, """,""", etc.) corresponding to the type of the paper data, citation in the paper data is legal. You may comprise so that determination may be carried out. Further, the file name of the article data may be output and displayed on the display device 104 in an output mode based on the determination result. For example, the file name of the paper data that is determined to be illegal can be displayed in black and white reversed so that it can be distinguished from the file name of the paper data that is determined to be legal.

〔実施の形態1から10に対するその他の変形例〕
上記各実施の形態にかかる引用判定支援装置の判定範囲特定部102a、102i、102jに自動参照の機能を組み込み、起動時に自動的に論文データ記憶部101cから、所望の論文データを利用者に選択させて選択された論文データを読み込むように構成してもよい。
また、上記実施の形態にかかる引用判定支援装置の比較範囲特定部102b、102l、102qを、比較範囲となる記憶部やWEBサイト等を一つに限定せず、WEBサイト、図書館検索データベース、ローカルサーバ、これらを任意に組み合わせたものから横断的に比較範囲を特定するように構成してもよい。
[Other Modifications to Embodiments 1 to 10]
The automatic reference function is incorporated into the determination range specifying units 102a, 102i, and 102j of the citation determination support device according to each of the above embodiments, and desired paper data is automatically selected by the user from the paper data storage unit 101c at startup. The selected paper data may be read.
In addition, the comparison range specifying units 102b, 102l, and 102q of the citation determination support apparatus according to the above embodiment are not limited to one storage unit or WEB site as a comparison range, but a WEB site, library search database, local You may comprise so that a comparison range may be specified across a server and what combined these arbitrarily.

また、以上説明した実施の形態では、判定対象データとして学生が作成した論文データをあげて説明したが、これに限定されるものではなく、文章が記述されたあらゆるデータを判定対象データとすることができる。   In the embodiment described above, the paper data created by the student is given as the judgment target data. However, the present invention is not limited to this, and any data in which a sentence is described is used as the judgment target data. Can do.

また、判定範囲の記述内容が複数の文献データから引用されている場合には、出力制御部102hが、文献データ毎に異なる出力態様(例えば、異なる色彩や字体等)で各引用部分を表示装置104に出力表示させるように構成してもよい。また、各文献データからの引用割合に応じて異なる表示態様で、各引用部分を表示させてもよい。   In addition, when the description content of the determination range is cited from a plurality of document data, the output control unit 102h displays each cited part in a different output mode (for example, different color or font) for each document data. It may be configured to output and display on 104. Moreover, you may display each quotation part with a display mode which changes according to the quotation rate from each literature data.

また、発明が解決しようとする課題や発明の効果は、前記した内容に限定されるものではなく、本発明によって、前記に記載されていない課題を解決したり、前記に記載されていない効果を奏することもでき、また、記載されている課題の一部のみを解決したり、記載されている効果の一部のみを奏することがある。   In addition, the problems to be solved by the invention and the effects of the invention are not limited to the above-described contents, and the present invention solves the problems not described above or has the effects not described above. There are also cases where only some of the described problems are solved or only some of the described effects are achieved.

実施の形態1から10および上記変形例の引用判定支援装置で実行される引用判定支援プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。   The citation determination support program executed by the citation determination support device according to the first to tenth embodiments and the modified example is a file in an installable format or an executable format, and is a CD-ROM, a flexible disk (FD), a CD-R. And recorded on a computer-readable recording medium such as a DVD (Digital Versatile Disk).

100,900,1300,1600,1800,2000 引用判定支援装置
101 記憶部
101a 文献データ記憶部
101b 文献リスト記憶部
101c 論文データ記憶部
101d 履歴データ記憶部
101e 辞書記憶部
101f 引用形式DB
101g 引用割合DB
101h 出力態様DB
102 制御部
102a、102i、102j 判定範囲特定部
102b、102l、102q 比較範囲特定部
102c、102m、102r 類似度算出部
102d、102n 文献引用判定部
102e 適法性判定部
102f 参照情報取得部
102g 入力制御部
102h 出力制御部
102k 単語変換部
102p 課題抽出部
102s 引用形式設定部
102t 引用割合算出部
103 入力装置
104 表示装置
105 論文データ表示エリア
106 範囲設定スライダ
106a 上側の範囲設定スライダ
106b 下側の範囲設定スライダ
107 全体ビュー
108 文献データ表示エリア
130 インターネット
131 WEBサイト
133 ファイルサーバ
100, 900, 1300, 1600, 1800, 2000 Citation determination support apparatus 101 Storage unit 101a Literature data storage unit 101b Literature list storage unit 101c Paper data storage unit 101d History data storage unit 101e Dictionary storage unit 101f Citation format DB
101g Citation DB
101h Output mode DB
102 Control unit 102a, 102i, 102j Determination range specifying unit 102b, 102l, 102q Comparison range specifying unit 102c, 102m, 102r Similarity calculation unit 102d, 102n Reference citation determination unit 102e Legality determination unit 102f Reference information acquisition unit 102g Input control Unit 102h output control unit 102k word conversion unit 102p task extraction unit 102s citation format setting unit 102t citation rate calculation unit 103 input device 104 display device 105 paper data display area 106 range setting slider 106a upper range setting slider 106b lower range setting Slider 107 Overall view 108 Document data display area 130 Internet 131 WEB site 133 File server

Claims (21)

判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、
前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段と、
を備えたことを特徴とする引用判定支援装置。
A citation determination support device for determining whether or not literature data is cited among the determination target data to be determined,
From the determination target data, a determination range specifying means for specifying a determination range for the presence or absence of citation of the document data,
Comparison range specifying means for specifying a comparison range with the determination target data from among the literature data,
The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range Similarity calculation means for calculating the similarity of each other,
A document citation determination unit that determines that the determination range cites the comparison range when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined threshold;
An output means for outputting the determination range of the determination target data citing the comparison range of the literature data;
When it is determined by the document citation determination means that the determination range refers to the comparison range, the reference is a legal citation based on the reference portion of the comparison range and the vicinity thereof in the determination range. Legality determining means for determining whether or not
A citation determination support apparatus characterized by comprising:
前記適法性判定手段は、前記引用箇所の引用元である前記文献データを特定する引用元情報が、前記判定対象データに含まれているか否かを判定すること、
を特徴とする請求項1に記載の引用判定支援装置。
The legality determining means determines whether or not the citation source information that identifies the document data that is the citation source of the cited part is included in the determination target data;
The citation determination support apparatus according to claim 1.
前記適法性判定手段は、前記判定範囲において前記類似度が所定の閾値以上である場合に、当該判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における前記比較範囲の引用が適法な引用であるか否かを判定すること、
を特徴とする請求項1又は2に記載の引用判定支援装置。
The legality determination means determines whether the determination range matches a predetermined citation format when the similarity is equal to or greater than a predetermined threshold in the determination range, and based on the determination result, Determining whether the comparison range citation in the determination range is a legal citation,
The citation determination support apparatus according to claim 1, wherein:
前記判定対象データの種別と、前記所定の引用形式とを、相互に関連付けて格納する引用形式格納手段を備え、
前記適法性判定手段は、前記判定対象データの種別を特定し、当該特定した種別に対応する前記引用形式を前記引用形式格納手段から取得し、当該取得した引用形式に前記判定範囲における前記比較範囲の引用が合致するか否かを判定すること、
を特徴とする請求項3に記載の引用判定支援装置。
A citation format storage means for storing the type of the determination target data and the predetermined citation format in association with each other;
The legality determination unit specifies the type of the determination target data, acquires the citation format corresponding to the specified type from the citation format storage unit, and adds the citation format to the comparison range in the determination range. To determine whether the citations in
The citation determination support apparatus according to claim 3 , wherein:
前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該比較範囲を含む前記文献データを参照するための参照情報を、当該文献データに基づいて取得する参照情報取得手段を備え、
前記出力手段は、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲に加えて、前記参照情報取得手段にて取得された前記参照情報を出力すること、
を特徴とする請求項1から4のいずれか一項に記載の引用判定支援装置。
When the reference citation determination means determines that the determination range refers to the comparison range, reference information for referring to the reference data including the comparison range is acquired based on the reference data. Reference information acquisition means for
The output means outputs the reference information acquired by the reference information acquisition means in addition to the determination range of the determination target data citing the comparison range of the document data;
The citation determination support apparatus according to claim 1, wherein:
前記判定範囲特定手段は、前記判定対象データを構成する構成部分の中から、所定の構成部分を前記判定範囲として特定すること、
を特徴とする請求項1から5のいずれか一項に記載の引用判定支援装置。
The determination range specifying means specifies a predetermined component as the determination range from among the components constituting the determination target data;
The citation determination support apparatus according to claim 1, wherein:
過去に生成された前記判定対象データの作成者を一意に識別するための作成者識別情報に対して、前記判定対象データにおける不正な引用行為の有無を示す情報、又は前記作成者の成績を対応づけて記憶する履歴記憶手段を備え、
判定対象となり得る前記判定対象データが複数存在する場合において、前記判定範囲特定手段は、前記不正な引用行為が有った旨を示す情報に対応する前記作成者識別情報を前記履歴記憶手段から取得し、又は所定値より低い前記作成者の成績に対応する前記作成者識別情報を前記履歴記憶手段から取得し、当該取得した作成者識別情報にて識別される作成者が作成した前記判定対象データを、前記複数の判定対象データの中から前記判定対象として選択すること、
を特徴とする請求項1から6のいずれか一項に記載の引用判定支援装置。
Corresponding to the creator identification information for uniquely identifying the creator of the determination target data generated in the past, information indicating the presence or absence of an illegal citation in the determination target data, or the grade of the creator A history storage means for storing the information;
In a case where there are a plurality of determination target data that can be determined, the determination range specifying unit acquires the creator identification information corresponding to information indicating that there is an illegal quoting action from the history storage unit. Or the determination target data created by the creator identified by the obtained creator identification information, obtained from the history storage means, the creator identification information corresponding to the grade of the creator lower than a predetermined value Selecting as the determination target from among the plurality of determination target data,
The citation determination support apparatus according to claim 1, wherein:
前記文献データに含まれ得る単語に対して、当該単語を修正する際に用いられ得る単語を対応づけて記憶する辞書記憶手段と、
前記判定対象データに含まれる単語を、前記辞書記憶手段にて記憶された単語に変換する単語変換手段とを備え、
前記判定範囲特定手段は、前記単語変換手段による変換が行われた前記判定対象データを、前記判定対象とすること、
を特徴とする請求項1から7のいずれか一項に記載の引用判定支援装置。
Dictionary storage means for storing words associated with words that can be included in the document data in association with words that can be used to correct the words;
A word conversion unit that converts a word included in the determination target data into a word stored in the dictionary storage unit;
The determination range specifying unit sets the determination target data converted by the word conversion unit as the determination target;
The citation determination support apparatus according to claim 1, wherein:
当該引用判定支援装置に対する操作入力を受け付ける入力手段を備え、
前記判定範囲特定手段は、前記判定対象データの中から、前記入力手段を介して指定された範囲を前記判定範囲として特定すること、
を特徴とする請求項1から8のいずれか一項に記載の引用判定支援装置。
Comprising an input means for receiving an operation input to the citation determination support device;
The determination range specifying means specifies the range specified through the input means as the determination range from the determination target data;
The citation determination support apparatus according to claim 1, wherein:
判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、
過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段とを備え、
前記類似度算出手段は、さらに、前記判定対象データ記憶手段に記憶された前記複数の判定対象データの相互間において、前記類似度を算出し、
前記文献引用判定手段は、さらに、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、
前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定すること、
を特徴とする引用判定支援装置。
A citation determination support device for determining whether or not literature data is cited among the determination target data to be determined,
From the determination target data, a determination range specifying means for specifying a determination range for the presence or absence of citation of the document data,
Comparison range specifying means for specifying a comparison range with the determination target data from among the literature data,
The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range Similarity calculation means for calculating the similarity of each other,
A document citation determination unit that determines that the determination range cites the comparison range when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined threshold;
An output means for outputting the determination range of the determination target data citing the comparison range of the literature data;
Determination target data storage means for storing a plurality of determination target data generated in the past,
The similarity calculation means further calculates the similarity between the plurality of determination target data stored in the determination target data storage means,
The document citation determination unit further determines that the plurality of determination target data are cited when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined second threshold. And
The comparison range specifying means specifies a plurality of determination target data determined to be cited among the plurality of determination target data as the comparison range;
Citation determination support device characterized by the above .
前記判定対象データの記述内容に基づいて、当該判定対象データの中から、当該判定対象データの課題を示す課題情報を抽出する課題抽出手段を備え、
前記比較範囲特定手段は、前記課題抽出手段にて抽出された前記課題情報を検索キーとして前記文献データを検索し、当該検索された文献データを前記比較対象として特定すること、
を特徴とする請求項1から10のいずれか一項に記載の引用判定支援装置。
Based on the description content of the determination target data, provided with problem extraction means for extracting problem information indicating a problem of the determination target data from the determination target data,
The comparison range specifying unit searches the document data using the task information extracted by the task extracting unit as a search key, and specifies the searched document data as the comparison target;
The citation determination support apparatus according to claim 1, wherein:
前記判定範囲において引用されていると前記文献引用判定手段によって判定された前記文献データを記憶する文献データ記憶手段を備え、
前記比較範囲特定手段は、前記判定対象データにおいて引用されている前記文献データを特定する引用元情報が当該判定対象データに含まれているか否かを判定し、当該引用元情報が当該判定対象データに含まれていると判定した場合、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されているか否かを判定し、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定すること、
を特徴とする請求項1から11のいずれか一項に記載の引用判定支援装置。
Comprising literature data storage means for storing the literature data determined by the literature citation determination means when being cited in the determination range;
The comparison range specifying unit determines whether or not the citation source information for specifying the document data cited in the determination target data is included in the determination target data, and the citation source information is the determination target data. When it is determined that the document data is included in the document data storage unit, it is determined whether the document data specified based on the citation source information is stored in the document data storage unit. If it is determined that the document data is stored in the document data storage means, the document data is specified as a comparison range;
The citation determination support apparatus according to any one of claims 1 to 11, wherein:
前記類似度算出手段は、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を検索キーとして、前記比較範囲特定手段にて特定された前記比較範囲の中から検索した場合であって、前記検索キーの文字数が、予め定められた制限文字数を超えている場合に、前記検索キーとして前記制限文字数以内の文字を前記判定範囲の中から順次指定して、前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすること、
を特徴とする請求項1から12のいずれか一つに記載の引用判定支援装置。
The similarity calculation means is a case where the description content of the determination range specified by the determination range specification means is used as a search key to search from the comparison range specified by the comparison range specification means. When the number of characters of the search key exceeds a predetermined limit of characters, a character within the limit of characters is sequentially designated as the search key from the determination range, and a plurality of characters are selected from the comparison range. A search result having a frequency of appearance greater than a predetermined value in a plurality of search results, and a target of the comparison range for calculating a mutual similarity with the description content of the determination range;
The citation determination support apparatus according to claim 1, wherein:
判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段とを備え、
前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすること、
を特徴とする引用判定支援装置。
A citation determination support device for determining whether or not literature data is cited among the determination target data to be determined,
From the determination target data, a determination range specifying means for specifying a determination range for the presence or absence of citation of the document data,
Comparison range specifying means for specifying a comparison range with the determination target data from among the literature data,
The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range Similarity calculation means for calculating the similarity of each other,
A document citation determination unit that determines that the determination range cites the comparison range when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined threshold;
Output means for outputting the determination range of the determination target data citing the comparison range of the document data,
The similarity calculation means analyzes the determination range and searches for a plurality of times from the comparison range specified by the comparison range specification means for each word using a word that appears a predetermined number or more as a search key, A search result having an appearance frequency greater than a predetermined value among a plurality of search results is set as a target of the comparison range for calculating a mutual similarity with the description content of the determination range;
Citation determination support device characterized by the above .
前記所定の閾値の入力を受け付ける入力手段を備え、
前記文献引用判定手段は、前記類似度が前記入力手段を介して入力された所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定すること、
を特徴とする請求項1から14のいずれか一項に記載の引用判定支援装置。
Input means for receiving an input of the predetermined threshold,
The literature citation determination unit determines that the determination range is quoting the comparison range when the similarity is equal to or higher than a predetermined threshold value input via the input unit;
The citation determination support apparatus according to claim 1, wherein:
前記判定範囲の記述内容の内、前記比較範囲から引用された記述内容が占める引用割合を算出する引用割合算出手段を備え、
前記出力手段は、前記引用割合を出力すること、
を特徴とする請求項1から15のいずれか一項に記載の引用判定支援装置。
Among the description contents of the determination range, comprising a citation ratio calculating means for calculating a citation ratio occupied by the description contents quoted from the comparison range,
The output means outputs the citation ratio;
The citation determination support apparatus according to claim 1, wherein:
前記引用割合算出手段は、複数の前記判定対象データについて前記引用割合を算出し、
前記出力手段は、前記複数の判定対象データを一意に識別する判定対象データ情報を、当該各判定対象データについて前記引用割合算出手段が算出した前記引用割合に基づく順序で出力すること、
を特徴とする請求項16に記載の引用判定支援装置。
The citation ratio calculation means calculates the citation ratio for a plurality of the determination target data,
The output means outputs determination target data information for uniquely identifying the plurality of determination target data in an order based on the citation ratio calculated by the citation ratio calculation means for each determination target data;
The citation determination support apparatus according to claim 16 .
前記判定範囲の前記類似度と、前記出力手段による出力態様とを、相互に対応付けて格納する出力態様情報格納手段を備え、
前記出力手段は、前記類似度算出手段にて算出された前記類似度に対応する前記出力態様を前記出力態様情報格納手段から取得し、当該取得した出力態様にて前記判定範囲を出力すること、
を特徴とする請求項1から17のいずれか一項に記載の引用判定支援装置。
An output mode information storage unit that stores the similarity of the determination range and the output mode by the output unit in association with each other;
The output means acquires the output mode corresponding to the similarity calculated by the similarity calculation unit from the output mode information storage unit, and outputs the determination range in the acquired output mode;
The citation determination support apparatus according to claim 1, wherein:
判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、
コンピュータを、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、
前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段と、
して機能させることを特徴とする引用判定支援プログラム。
A citation determination support program for determining whether or not document data is cited among the determination target data to be determined,
Computer
From the determination target data, a determination range specifying means for specifying a determination range for the presence or absence of citation of the document data,
Comparison range specifying means for specifying a comparison range with the determination target data from among the literature data,
The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range Similarity calculation means for calculating the similarity of each other,
A document citation determination unit that determines that the determination range cites the comparison range when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined threshold;
An output means for outputting the determination range of the determination target data citing the comparison range of the literature data;
When it is determined by the document citation determination means that the determination range refers to the comparison range, the reference is a legal citation based on the reference portion of the comparison range and the vicinity thereof in the determination range. Legality determining means for determining whether or not
A citation judgment support program characterized in that it is made to function.
判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、
コンピュータを、
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、
前記類似度算出手段は、過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段に記憶された当該複数の判定対象データの相互間において、前記類似度を算出し、
前記文献引用判定手段は、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、
前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定すること、
特徴とする引用判定支援プログラム。
A citation determination support program for determining whether or not document data is cited among the determination target data to be determined,
Computer
From the determination target data, a determination range specifying means for specifying a determination range for the presence or absence of citation of the document data,
Comparison range specifying means for specifying a comparison range with the determination target data from among the literature data,
The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range Similarity calculation means for calculating the similarity of each other,
A document citation determination unit that determines that the determination range cites the comparison range when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined threshold;
A citation determination support program that functions as an output unit that outputs the determination range of the determination target data quoting the comparison range of the document data,
The similarity calculation unit calculates the similarity between the plurality of determination target data stored in the determination target data storage unit that stores a plurality of determination target data generated in the past,
The literature citation determination unit determines that the plurality of determination target data are cited when the similarity calculated by the similarity calculation unit is a predetermined second threshold or more,
The comparison range specifying means specifies a plurality of determination target data determined to be cited among the plurality of determination target data as the comparison range;
Citation determination support program characterized by
判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、A citation determination support program for determining whether or not document data is cited among the determination target data to be determined,
コンピュータを、Computer
前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、From the determination target data, a determination range specifying means for specifying a determination range for the presence or absence of citation of the document data,
前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、Comparison range specifying means for specifying a comparison range with the determination target data from among the literature data,
前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、The description content of the determination range specified by the determination range specification unit is searched from the comparison range specified by the comparison range specification unit, and the description content of the determination range and the description content of the comparison range Similarity calculation means for calculating the similarity of each other,
前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、A document citation determination unit that determines that the determination range cites the comparison range when the similarity calculated by the similarity calculation unit is equal to or greater than a predetermined threshold;
前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、A citation determination support program that functions as an output unit that outputs the determination range of the determination target data quoting the comparison range of the document data,
前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすること、The similarity calculation means analyzes the determination range and searches for a plurality of times from the comparison range specified by the comparison range specification means for each word using a word that appears a predetermined number or more as a search key, A search result having an appearance frequency greater than a predetermined value among a plurality of search results is set as a target of the comparison range for calculating a mutual similarity with the description content of the determination range;
を特徴とする引用判定支援プログラム。Citation determination support program characterized by
JP2009019477A 2008-02-01 2009-01-30 Citation determination support apparatus and citation determination support program Active JP5510912B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009019477A JP5510912B2 (en) 2008-02-01 2009-01-30 Citation determination support apparatus and citation determination support program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008023234 2008-02-01
JP2008023234 2008-02-01
JP2009019477A JP5510912B2 (en) 2008-02-01 2009-01-30 Citation determination support apparatus and citation determination support program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014062283A Division JP5737772B2 (en) 2008-02-01 2014-03-25 Citation determination support apparatus and citation determination support program

Publications (2)

Publication Number Publication Date
JP2009205674A JP2009205674A (en) 2009-09-10
JP5510912B2 true JP5510912B2 (en) 2014-06-04

Family

ID=40912544

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009019477A Active JP5510912B2 (en) 2008-02-01 2009-01-30 Citation determination support apparatus and citation determination support program
JP2014062283A Active JP5737772B2 (en) 2008-02-01 2014-03-25 Citation determination support apparatus and citation determination support program

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014062283A Active JP5737772B2 (en) 2008-02-01 2014-03-25 Citation determination support apparatus and citation determination support program

Country Status (2)

Country Link
JP (2) JP5510912B2 (en)
WO (1) WO2009096190A1 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5207402B2 (en) * 2009-09-30 2013-06-12 キヤノンマーケティングジャパン株式会社 Information processing apparatus, information processing method, and program
KR101033611B1 (en) * 2010-07-09 2011-05-11 한국과학기술정보연구원 System and method for evaluating the suitability of reference
US9218344B2 (en) * 2012-06-29 2015-12-22 Thomson Reuters Global Resources Systems, methods, and software for processing, presenting, and recommending citations
JP5459422B2 (en) * 2013-02-14 2014-04-02 キヤノンマーケティングジャパン株式会社 Information processing apparatus, control method, and program
JP6052816B2 (en) 2014-10-27 2016-12-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method for supporting secondary use of contents of electronic work, server computer for supporting secondary use of contents of electronic work, and program for server computer
US20170270625A1 (en) * 2016-03-21 2017-09-21 Facebook, Inc. Systems and methods for identifying matching content
KR102152218B1 (en) * 2016-12-16 2020-09-07 미쓰비시덴키 가부시키가이샤 Search system
JP6691581B2 (en) * 2018-07-26 2020-04-28 楽天株式会社 Information processing apparatus, information processing method, program, storage medium
JP6695538B1 (en) * 2019-07-30 2020-05-20 株式会社ウェブサークル Similar sentence retrieval device and program
JP2022072383A (en) * 2020-10-29 2022-05-17 株式会社Ipsign System, method, and program for extracting infringement information

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263512A (en) * 1995-03-24 1996-10-11 Sumitomo Electric Ind Ltd Document retrieval device
JPH09198409A (en) * 1996-01-19 1997-07-31 Hitachi Ltd Extremely similar docuemtn extraction method
JPH1021239A (en) * 1996-06-28 1998-01-23 Toshiba Corp Machine translation system and its method
JP3625054B2 (en) * 2000-11-29 2005-03-02 松下電器産業株式会社 Technical document retrieval device
JP2006155556A (en) * 2004-10-27 2006-06-15 Hitachi Software Eng Co Ltd Text mining method and text mining server
US20070294610A1 (en) * 2006-06-02 2007-12-20 Ching Phillip W System and method for identifying similar portions in documents
JP2008015774A (en) * 2006-07-05 2008-01-24 Nagaoka Univ Of Technology Imitation document detection system and program

Also Published As

Publication number Publication date
JP5737772B2 (en) 2015-06-17
JP2009205674A (en) 2009-09-10
JP2014149848A (en) 2014-08-21
WO2009096190A1 (en) 2009-08-06

Similar Documents

Publication Publication Date Title
JP5737772B2 (en) Citation determination support apparatus and citation determination support program
JP4767694B2 (en) Unauthorized hyperlink detection device and method
US20180004838A1 (en) System and method for language sensitive contextual searching
Papadakis et al. Stavies: A system for information extraction from unknown web data sources through automatic web wrapper generation using clustering techniques
US20160239504A1 (en) Method for entity enrichment of digital content to enable advanced search functionality in content management systems
US20080162115A1 (en) Computer program, apparatus, and method for searching translation memory and displaying search result
JP2007141090A (en) Question answering system, data retrieval method and computer program
JP2005122295A (en) Relationship figure creation program, relationship figure creation method, and relationship figure generation device
US7853595B2 (en) Method and apparatus for creating a tool for generating an index for a document
JP2008152522A (en) Data mining system, data mining method and data retrieval system
JP2009116867A (en) Method and apparatus for controlling access to multilingual textual resource
Manaf et al. Comparison of carp rabin algorithm and Jaro-Winkler distance to determine the equality of Sunda languages
JP2013003663A (en) Information processing apparatus, information processing method, and program
JP2007065745A (en) Document search method and document search device, and program
JP2006323517A (en) Text classification device and program
JP5447368B2 (en) NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM
Ehsan et al. A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection.
Williams et al. Classifying and ranking search engine results as potential sources of plagiarism
JP6305671B1 (en) Template generating apparatus, template generating program, and template generating method
JP2009157620A (en) Information search support device
JP2006085234A (en) Electronic document forming device, electronic document forming method, and electronic document forming program
JP2004220226A (en) Document classification method and device for retrieved document
JP6707410B2 (en) Document search device, document search method, and computer program
JP2005115457A (en) Method of retrieving document file
Suchomel et al. Source retrieval for plagiarism detection

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140318

R150 Certificate of patent or registration of utility model

Ref document number: 5510912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250