JP6691581B2 - Information processing apparatus, information processing method, program, storage medium - Google Patents

Information processing apparatus, information processing method, program, storage medium Download PDF

Info

Publication number
JP6691581B2
JP6691581B2 JP2018140031A JP2018140031A JP6691581B2 JP 6691581 B2 JP6691581 B2 JP 6691581B2 JP 2018140031 A JP2018140031 A JP 2018140031A JP 2018140031 A JP2018140031 A JP 2018140031A JP 6691581 B2 JP6691581 B2 JP 6691581B2
Authority
JP
Japan
Prior art keywords
determination
quotation
content
blog
citation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018140031A
Other languages
Japanese (ja)
Other versions
JP2020017098A (en
Inventor
陽司 山本
陽司 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Priority to JP2018140031A priority Critical patent/JP6691581B2/en
Publication of JP2020017098A publication Critical patent/JP2020017098A/en
Application granted granted Critical
Publication of JP6691581B2 publication Critical patent/JP6691581B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は情報処理装置、情報処理方法、プログラム、記憶媒体に関し、特にブログを管理するサーバ装置への適用に好適な技術に関する。   The present invention relates to an information processing device, an information processing method, a program, and a storage medium, and particularly to a technique suitable for application to a server device that manages a blog.

インターネットを利用したサービスの1つとしてブログ環境を提供するサービスが知られている。ユーザはブログとしての任意の文章や画像による記事をサーバにアップロードし、当該ユーザの書き込み記事として保存してもらう。保存されたブログは、例えばウェブページの形式で一般に公開される。
多くのユーザは、自己発信のツールとしたり、或いは個人的な日記代わりなどとして、このようなブログサービスを利用している。
A service that provides a blog environment is known as one of services using the Internet. The user uploads an article with an arbitrary text or image as a blog to the server and asks the user to save the article as a written article. Saved blogs are made publicly available, for example in the form of web pages.
Many users use such a blog service as a tool for self-sending or as a personal diary substitute.

なお下記特許文献1,2,3には引用に関する技術が開示されている。
例えば特許文献1には、コピー元の電子文書からコピーしたテキスト列と共に、コピー元の電子文書を特定可能な文献情報を、コピー先の電子文書にペーストすることで引用した場合に引用元を容易に明示できることが示されている。
特許文献2には、操作履歴やコピー元文献情報を記憶し、引用量(率)を算出し、該引用量が所定値以上の場合、コピー文書と判定する技術が記載されている。
特許文献3にはURL(Uniform Resource Locator)を辿り、引用元が正しいか判定することが記載されている。
In addition, the following patent documents 1, 2, and 3 disclose technologies related to citation.
For example, in Patent Literature 1, when a text string copied from a copy source electronic document and document information that can identify the copy source electronic document are pasted into the copy destination electronic document and cited, the citation source is easy. It is shown that can be clarified in.
Patent Document 2 describes a technique in which an operation history and copy source document information are stored, a citation amount (rate) is calculated, and when the citation amount is equal to or larger than a predetermined value, it is determined as a copy document.
Patent Document 3 describes that a URL (Uniform Resource Locator) is traced to determine whether the citation source is correct.

特開2016−177721号公報JP, 2016-177721, A 特開2014−186641号公報JP, 2014-186641, A 特開2014−146257号公報JP, 2014-146257, A

ところでブログ等、サービス運営団体以外の一般ユーザが作成し、投稿するようなコンテンツの場合、他のウェブページ等からテキストデータや画像データを引用する場合がある。もちろん適法性のある引用であれば問題ないが、引用としての適法性や著作権侵害に関する判断は一般ユーザには難しいことが多い。このため、特に悪意がないユーザであったとしても、結果として不適切な引用を行ってしまうようなことも起こりえる。
そのためには、厳密に適法な引用であるか否かの判定とまではいかなくとも、著作権侵害リスクを未然に防止するために、コンテンツ作成時に自動的に引用の判定を行うようにすることが望ましい。しかしながら、引用の判定のために、膨大なウェブサイトのデータとの照合や、判定のための処理時間の増大等が生ずることは、ブログサービスシステムとしても、またユーザの使用性としても望ましくない。
By the way, in the case of content created and posted by general users other than service management organizations such as blogs, text data and image data may be quoted from other web pages. Of course, there is no problem if the quotation has legality, but it is often difficult for general users to judge the legality of the quotation and the copyright infringement. Therefore, even if the user has no malicious intent, as a result, inappropriate quoting may occur.
For that purpose, if it is not strictly determined whether it is a legal citation, in order to prevent the risk of copyright infringement, it is necessary to automatically determine the citation when creating the content. Is desirable. However, it is not desirable for the blog service system and the usability for the blog service system and the user to check the quotation with a huge amount of website data and increase the processing time for the determination.

そこで本発明では、ユーザに対して引用に関する適切なガイドを行う場合に、ユーザに判定のための待ち時間の増大等の不便を感じさせず、またシステムの処理負担の著しい増大を伴わないようにすることを目的とする。   Therefore, in the present invention, when the user is properly guided about quoting, the user does not feel inconvenience such as an increase in waiting time for determination, and the processing load of the system is not significantly increased. The purpose is to do.

本発明に係る情報処理装置は、端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する判定機会検出部と、前記判定機会検出部により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定部と、前記第1引用適否判定部が取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定部と、前記第1引用適否判定部の判定結果と前記第2引用適否判定部の判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起部とを備える。
コンテンツとは例えばブログ記事などを想定する。このようなコンテンツはユーザが作成してアップロードするものであるが、その作成中に、他のコンテンツのテキストデータや画像データがそのまま含まれることがある。これが引用として適切かどうかの判定はユーザには困難なことが多い。そこで判定機会が検出されたら、第1引用判定として、閲覧履歴情報を用いた判定を行う。またアップロード要求の際に第2引用適否判定として所定の判定基準を用いた判定を行う。これにより引用の適否を判定し、必要に応じてユーザに注意喚起する。
The information processing apparatus according to the present invention includes a determination opportunity detection unit that detects that a paste operation is detected during content creation in a terminal device and that a determination opportunity regarding citation is generated with the paste portion as a determination target; In response to the detection opportunity being detected by the detection unit, the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content, and the same data as the determination target portion exists. A first citation appropriateness determination unit that performs processing for confirming whether or not to perform, and acquires information of a web page in which the same data as the determination target portion exists as source information, and the first citation appropriateness determination A process for determining whether or not the source information acquired by the department is described in the content, and the total text amount of the content A process of determining whether the ratio of the amount of text of the determination target or the ratio of the image data of the determination target to the total display surface is equal to or more than a predetermined threshold, and the character attribute of the text of the determination target is the content of the content. A second quotation propriety determination unit that performs processing for determining whether the text is different from the text other than the determination target at the timing of the upload request for the content from the terminal device , the determination result of the first quotation propriety determination unit, and the The terminal device further includes a caution unit that performs a process of displaying a caution display in the terminal device according to the determination result of the second quotation adequacy determination unit.
The content is assumed to be a blog article, for example. Although such content is created and uploaded by the user, text data and image data of other content may be included as it is during the creation. It is often difficult for the user to determine whether this is appropriate as a citation. If a determination opportunity is detected, a determination using the browsing history information is performed as the first citation determination. In addition, when the upload request is made, a determination using a predetermined determination criterion is performed as the second quotation adequacy determination. In this way, the suitability of citation is determined, and the user is alerted if necessary.

上記した情報処理装置においては、前記注意喚起部は、前記第1引用適否判定部によりペースト操作に係るデータ部分が、前記判定対象とされた部分と同一データが存在したウェブページ内のデータの一部とはいえない量であると判定された場合、前記第2引用適否判定部により、前記出典情報が前記コンテンツに記載されていないと判定された場合、前記第2引用適否判定部により、前記判定対象とされた部分の割合が前記閾値以上であると判定された場合、又は、前記第2引用適否判定部により、前記判定対象とされた部分の文字属性が前記コンテンツの前記判定対象以外の本文と異なっていないと判定された場合、のいずれかに該当することに応じて、それぞれの判定ごとに設定された適正な引用とするためのガイド情報を含む注意喚起のメッセージを作成し前記端末装置に表示させる処理を行う。
適正な引用とするためのガイド情報とは、例えば出典記載のアシストのための情報、ペースト部分の一部削除やブログ本文の追加等を薦めるメッセージ、出典記載や記載態様などのモデルの提示などである。
In the above-described information processing device, the alerting unit is a part of the data in the web page in which the data portion related to the paste operation by the first quotation adequacy determining unit has the same data as the determination target portion. When it is determined that the amount is not equal to a part, when the second citation appropriateness determination unit determines that the source information is not described in the content, the second citation appropriateness determination unit When it is determined that the proportion of the portion to be determined is equal to or more than the threshold value, or by the second quotation adequacy determining unit, the character attribute of the portion to be determined is other than the determination target of the content. If it is determined not be different from the body, in response to fall under any Note including guide information to a proper citation is set for each determination Create a message performs a process of displaying on the terminal device.
Guide information for proper citation is, for example, information for assisting in citations, a message recommending deletion of a part of the paste part or addition of blog text, presentation of models such as citations and description modes, etc. is there.

上記した情報処理装置においては、前記判定機会検出部は、作成中のコンテンツにおいてペースト操作が検出されることで、ペースト部分についての判定機会と検出する。
引用部分は通常、テキストデータ又は画像データのコピー&ペースト操作により作成中のコンテンツ内に挿入される。従って、ペースト操作があった場合は、仮に引用が行われた可能性があるとして第1引用適否判定が行われるようにする。
In the above-described information processing device, the determination opportunity detection unit detects a paste operation in the content being created, thereby detecting the determination opportunity for the paste portion .
The quoted portion is usually inserted into the content being created by a copy and paste operation of text data or image data. Therefore, when there is a paste operation, the first citation appropriateness determination is made on the assumption that the citation may have been made.

上記した情報処理装置においては、前記判定機会検出部は、作成中のコンテンツにおいて所定文字数以上のペースト操作が検出されることで、ペースト部分についての判定機会と検出することが考えられる。
つまり文字データについて少ない文字数の場合、例えば10文字未満などの少数の文字のコピー&ペーストの操作の場合は、引用部分とは推定しないようにする。
In the above-described information processing device, it is conceivable that the determination opportunity detection unit detects a paste operation with a predetermined number of characters or more in the content being created, and thus detects the determination operation as to the paste portion.
That is, in the case of a small number of characters in the character data, for example, in the case of an operation of copying and pasting a small number of characters such as less than 10 characters, the quoted portion is not estimated.

上記した情報処理装置においては、前記判定機会検出部は、作成中のコンテンツにおいて入力されたテキストデータについての文体解析結果と、前記コンテンツ作成者により作成された他の文章についての文体解析結果とを比較して類似性を判定し、類似性が確認できない場合に、前記入力されたテキストデータの部分を判定対象として引用に関する判定機会が発生したと検出することが考えられる。
つまり言葉遣いの相違などから引用箇所を推定する。例えば、ユーザの過去投稿を参照して、形態素解析によってユーザ文体の特徴を特定し、記事内においてユーザ文体でない箇所を引用箇所とする。
In the above-described information processing device, the determination opportunity detection unit displays a stylistic analysis result for the text data input in the content being created, and a stylistic analysis result for another sentence created by the content creator. It is conceivable that the similarity is determined by comparison, and if the similarity cannot be confirmed, it is possible to detect that a determination opportunity regarding citation has occurred with the portion of the input text data as the determination target .
In other words, the quoted part is estimated from the difference in wording. For example, referring to the user's past post, the characteristics of the user writing style are specified by morphological analysis, and the portion other than the user writing style in the article is set as the quoted portion.

上記した情報処理装置においては、前記第1引用適否判定部は、閲覧履歴情報で示されるウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行うとともに、同一データが存在したウェブページの情報を出典情報として取得する
即ち閲覧履歴情報で示されたウェブページデータからテキストデータ又は画像データのコピー元を探索し、同一データが存在したウェブページについて、例えばウェブページのURLやウェブサイト名称、ウェブページ管理者等の情報を出典情報として取得する
In the above-described information processing device, the first quotation adequacy determining unit searches the web page data indicated by the browsing history information and confirms whether or not the same data as the portion estimated to be the quotation exists. At the same time, the information of the web page in which the same data exists is acquired as the source information .
That is, the copy source of the text data or the image data is searched from the web page data indicated by the browsing history information, and for the web page in which the same data exists, for example, the URL of the web page, the website name, the information of the web page manager, etc. As source information .

上記した情報処理装置においては、前記第1引用適否判定部は、閲覧履歴情報で示されるウェブページデータのうちで、閲覧時刻条件により抽出したウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行うことが考えられる。
即ち閲覧履歴情報の全てではなく、例えば直近の所定時間内であるとか、ブログ作成開始後であるとかの閲覧時刻条件に該当するウェブページデータからテキストデータ又は画像データのコピー元を探索する。
In the information processing apparatus described above, the first quotation propriety determination unit searches the web page data extracted by the browsing time condition from the web page data indicated by the browsing history information, and finds the portion estimated to be a quotation. It is conceivable to perform a process of confirming whether the same data as above exists.
That is, not all of the browsing history information, but the copy source of the text data or the image data is searched for from the web page data corresponding to the browsing time condition such as within the latest predetermined time or after the start of blog creation.

上記した情報処理装置においては、前記第2引用適否判定部は、前記第1引用適否判定部が取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理を行う
即ち引用と推定された部分に対して、出典(引用元)が記載されているか否かを確認する。
In the above-described information processing device, the second quotation appropriateness determination unit performs a process of determining whether or not the source information acquired by the first quotation appropriateness determination unit is described in the content .
That is, it is confirmed whether or not the source (citation source) is described for the portion estimated to be cited.

上記した情報処理装置においては、前記第2引用適否判定部は、前記コンテンツの総テキスト量に対する判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理を行う
即ち引用と推定された部分と本文の分量を比較する。
In the information processing apparatus described above, the second quotation adequacy determining unit determines whether the ratio of the determination target text amount to the total text amount of the content or the ratio of the determination target image data to the total display surface is equal to or greater than a predetermined threshold. Processing for determining whether or not there is is performed .
That is, the amount of the quoted part and the amount of the text are compared.

上記した情報処理装置においては、前記第2引用適否判定部は、判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理を行う
即ち引用と推定された部分が本文と明確に異なる態様で記載されているかを判定する
In the above-described information processing device, the second quotation adequacy determining unit performs a process of determining whether or not the character attribute of the text to be determined is different from the body of the content other than the determination target .
That is, it is judged whether the portion estimated to be quoted is described in a manner clearly different from the text.

上記した情報処理装置においては、前記第1引用適否判定部が取得した前記出典情報を基に、引用が行われたことを出典元に通知する処理を行う引用通知部を備えることが考えられる。
例えば引用と推定された部分が存在する場合に、その引用元に対して、引用が行われた旨の通知を行う。
It is conceivable that the information processing apparatus described above includes a citation notifying unit that performs a process of notifying the citation source that the citation has been performed , based on the citation information acquired by the first citation appropriateness determination unit .
For example, when there is a portion estimated to be a citation, the citation source is notified that the citation is performed.

本発明に係る情報処理装置が行う情報処理方法は、端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する判定機会検出ステップと、前記判定機会検出ステップにより判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定ステップと、前記第1引用適否判定ステップにおいて取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定ステップと、前記第1引用適否判定ステップの判定結果と前記第2引用適否判定ステップの判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起ステップとを行う。
これによりコンテンツの引用について、作成中とアップロード時に分散して行うようにする。
本発明に係るプログラムは、この情報処理方法の処理を情報処理装置に実行させるプログラムである。
本発明に係る記憶媒体は、上記プログラムを記憶した記憶媒体である。
このプログラムや記憶媒体により本発明の情報処理装置の実現及び提供を容易とする。
An information processing method of the information processing apparatus according to the present invention is carried out, by the detected paste operation is in content creation in the terminal device, the determination chance detection step of detecting a determination opportunities for citing paste portions as determination target has occurred And, in response to the determination opportunity being detected by the determination opportunity detection step, while the content is being created, the web page data indicated by the browsing history information in the terminal device is searched, and the portion that is the determination target is searched. a first reference appropriateness determination step of acquiring and executes a process of confirming whether the same data is present, the information of the web page that the determination target portion in the same data exists as the source information and the It is determined whether the source information acquired in the first citation appropriateness determination step is described in the content. And a process of determining whether the ratio of the determination target text amount to the total text amount of the content or the ratio of the determination target image data to the total display surface is a predetermined threshold value or more, A second citation suitability determination step of performing a process of determining whether or not a character attribute of the target text is different from a body of the content other than the determination target at a timing of an upload request of the content from the terminal device ; According to the determination result of the first quotation propriety determination step and the determination result of the second quotation propriety determination step, a caution calling step for performing a process of causing the terminal device to perform the caution display is performed.
As a result, content quoting is distributed and performed during creation and upload.
A program according to the present invention is a program that causes an information processing apparatus to execute the processing of this information processing method.
A storage medium according to the present invention is a storage medium storing the above program.
This program and storage medium facilitate the implementation and provision of the information processing apparatus of the present invention.

本発明によれば、第1引用適否判定では、ブログ記事等のコンテンツ作成中に行ってしまうことで、ユーザにこれらの処理時間を感じさせないようにすることができる。例えば処理時間がかかることが想定される閲覧履歴を用いたコピー元の探索や、コピー部分がそのコピー元の一部である以下否か等の処理を第1引用適否判定で、時間的な負担をユーザにかけずに実行できる。また第2引用適否判定では、コンテンツ完成の状態で引用適格性の判定を行うことで、無駄な判定が生じない。これらにより、引用に関する適切な注意喚起を、ユーザへの時間的な負担を感じさせず、またシステムの処理負担増もさほど生じさせずに実行できることになる。   According to the present invention, the first quotation adequacy determination is performed during the creation of content such as a blog article, so that it is possible to prevent the user from feeling these processing times. For example, the process of searching for a copy source using a browsing history, which is expected to take a long time, and whether or not the copy part is a part of the copy source, is the first quotation adequacy determination, and is a time burden. Can be executed without calling the user. Further, in the second quotation adequacy determination, useless determination does not occur because the quotation eligibility is determined in the state where the content is completed. As a result, an appropriate reminder regarding citation can be executed without causing a user to feel a time burden and without causing a significant increase in processing load on the system.

本発明の実施の形態のシステム構成のブロック図である。It is a block diagram of a system configuration of an embodiment of the invention. 実施の形態のコンピュータ装置のブロック図である。It is a block diagram of the computer device of an embodiment. 実施の形態のブログサーバの機能構成の説明図である。It is an explanatory view of functional composition of a blog server of an embodiment. 実施の形態のユーザ端末とサーバ装置の通信の説明図である。It is an explanatory view of communication of a user terminal and a server device of an embodiment. 実施の形態の注意喚起の状態の説明図である。It is explanatory drawing of the state of alerting of embodiment. 第1の実施の形態のブログサーバの処理のフローチャートである。It is a flow chart of processing of a blog server of a 1st embodiment. 実施の形態の第1引用適否判定処理のフローチャートである。It is a flow chart of the 1st quotation adequacy judging processing of an embodiment. 実施の形態のウェブページ調査の処理のフローチャートである。6 is a flowchart of a web page survey process according to the embodiment. 実施の形態の第2引用適否判定処理のフローチャートである。It is a flow chart of the 2nd quotation adequacy judging processing of an embodiment. 実施の形態の注意喚起処理のフローチャートである。It is a flowchart of the alerting process of the embodiment. 第2の実施の形態のブログサーバの処理のフローチャートである。It is a flow chart of processing of a blog server of a 2nd embodiment. 第3の実施の形態の処理のフローチャートである。It is a flow chart of processing of a 3rd embodiment.

以下、実施の形態を説明するが、以下の説明において、端末装置で作成するコンテンツの例としてブログ記事を挙げる。“ブログ”とは、ウェブログあるいは単にブログと呼ばれる日記形式のウェブページのことである。より具体的には、ブログサーバはユーザに対してブログを形成する環境(記憶容量やウェブページ)を提供し、ユーザは投稿等の形式で文章や画像による記事を自分のブログにアップロードする。ブログサーバは通常、当該記事を一般(又は限定した範囲)の閲覧に供する。
記事の内容については特に限定されない。ユーザが情報発信に用いる内容でも、個人的な日記等の内容でもよい。また「ブログ」と呼ばれていないものであっても、同等のものを含む。
Hereinafter, an embodiment will be described. In the following description, a blog article will be taken as an example of content created by a terminal device. A "blog" is a diary-style web page called a weblog or simply a blog. More specifically, the blog server provides the user with an environment (storage capacity or web page) for forming a blog, and the user uploads articles in the form of posts or the like in sentences and images to his or her blog. The blog server generally provides the article for general (or limited range) viewing.
The content of the article is not particularly limited. The contents may be contents used by the user for transmitting information or contents such as a personal diary. Even if it is not called "blog", it includes the equivalent.

“ブログ記事”(単に“記事”とも表記する)とは、ブログを構成する要素であって、文章や画像によって構成された1つの単位(例えば投稿単位)のことを指す。内容には関わらない。なお、必ずしも1つの話題としての記事ではなく、1又は複数の話題について1つのURLで閲覧される記事群を指すものと考えても良い。   “Blog article” (also simply referred to as “article”) is an element that constitutes a blog, and refers to one unit (for example, a posting unit) composed of sentences and images. It is not related to the content. It should be noted that it is not necessarily an article as one topic, and may be considered to refer to an article group browsed by one URL for one or a plurality of topics.

“ユーザ”とは、自己のブログに記事を書き込むブロガーとしてのユーザ(いわゆるブロガー)と、他人又は自己のブログを閲覧する閲覧者としてのユーザが想定される。これらを区別する場合、記事を書くユーザを「ブロガー」と表記し、ブログ閲覧者としてのユーザについては「閲覧者」と表記する。
もちろん一人のユーザがある時点ではブロガーとなり、ある時点では閲覧者となることが通常に想定される。
The “user” is assumed to be a user as a blogger who writes articles on his own blog (a so-called blogger) and a user as a viewer who browses other people's or own blog. To distinguish them, the user who writes the article is referred to as a "blogger", and the user as a blog reader is referred to as a "browser".
Of course, it is usually assumed that one user will be a blogger at some point and a viewer at some point.

<1.システム構成>
図1に実施の形態のブログサーバ1を含むネットワークシステムの構成例を示す。
本実施の形態に係るネットワークシステムは、ブログサーバ1と複数のユーザ端末5がネットワーク2により相互に通信可能に接続されている。
またブログサーバ1は各種データベースにアクセス可能とされている。なお、以下「データベース」については「DB」と表記する。図ではブログサーバ1がアクセス可能なDBとしてブログDB51、画像DB52、管理DB53を例示している。
<1. System configuration>
FIG. 1 shows a configuration example of a network system including the blog server 1 of the embodiment.
In the network system according to this embodiment, a blog server 1 and a plurality of user terminals 5 are connected via a network 2 so that they can communicate with each other.
The blog server 1 can access various databases. In the following, "database" will be referred to as "DB". In the figure, a blog DB 51, an image DB 52, and a management DB 53 are illustrated as DBs accessible by the blog server 1.

ネットワーク2の構成は多様な例が想定される。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、CATV(Community Antenna TeleVision)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が想定される。
またネットワーク2の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線等の有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
Various examples of the configuration of the network 2 are assumed. For example, the Internet, intranet, extranet, LAN (Local Area Network), CATV (Community Antenna TeleVision) communication network, virtual private network (Virtual Private Network), telephone line network, mobile communication network, satellite communication network, etc. are assumed. It
Also, various examples of transmission media forming all or part of the network 2 are envisioned. For example, even wired such as IEEE (Institute of Electrical and Electronics Engineers) 1394, USB (Universal Serial Bus), power line carrier, telephone line, infrared rays such as IrDA (Infrared Data Association), Bluetooth (registered trademark), 802.11 wireless It can also be used by radio such as mobile phone networks, satellite lines, and terrestrial digital networks.

ブログサーバ1は、ユーザに対するブログサービスの管理運営を行う組織によって用いられる情報処理装置である。ブログサーバ1は、ユーザ(ブロガー)へのブログ環境の提供やユーザ(閲覧者)のアクセス要求に応じたブログ記事ページ等のウェブページデータの配信を行う。
具体的にはブログを開設したいブロガーに対しては、そのブロガーのブログとしてのウェブページの設定やユーザ情報の登録などを行う。既にブログ開設済のブロガーに対しては、ブロガーが投稿する記事の保存を行う。
また一般の閲覧者となるユーザからのアクセス要求に応じて、該当のウェブページに係るウェブページデータを配信する。
このブログサーバ1が、本発明請求項の情報処理装置の実施の形態に相当する。
The blog server 1 is an information processing device used by an organization that manages and administers a blog service for users. The blog server 1 provides a blog environment to users (bloggers) and delivers web page data such as blog article pages in response to user (browser) access requests.
Specifically, for a blogger who wants to open a blog, the web page is set as the blog of the blogger and user information is registered. For bloggers who have already opened a blog, save the articles posted by bloggers.
Also, in response to an access request from a user who is a general viewer, the web page data relating to the corresponding web page is distributed.
The blog server 1 corresponds to an embodiment of the information processing device according to the claims of the present invention.

ユーザ端末5は、ブロガーや閲覧者としてのユーザが使用する端末である。このユーザ端末5は、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistant)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどが想定される。
ユーザ端末5では、必要に応じて各種の送受信処理や表示処理などが実行される。
閲覧者は、ユーザ端末5においてウェブブラウザを介して、関心のあるブログの閲覧を任意に行うことができる。
ブロガーは、ユーザ端末5により自分のブログページにアクセスし、閲覧したり、新規に記事を投稿することができる。
ユーザ端末5ではこれらの動作のための通信処理や表示処理等を行うことになる。
The user terminal 5 is a terminal used by a user as a blogger or a viewer. The user terminal 5 is assumed to be, for example, a PC (Personal Computer) having a communication function, a feature phone, a PDA (Personal Digital Assistant), or a smart device such as a smartphone or a tablet terminal.
The user terminal 5 executes various transmission / reception processing, display processing, and the like as necessary.
The viewer can arbitrarily browse the blog of interest via the web browser on the user terminal 5.
The blogger can access his / her blog page through the user terminal 5, browse, or post a new article.
The user terminal 5 performs communication processing and display processing for these operations.

図1に示したブログサーバ1やユーザ端末5を構成する情報処理装置のハードウエア構成を図2に示す。ブログサーバ1やユーザ端末5として示した各装置は、情報処理および情報通信が可能な図2に示すようなコンピュータ装置によって実現される。   FIG. 2 shows the hardware configuration of the information processing apparatus that constitutes the blog server 1 and the user terminal 5 shown in FIG. Each of the devices shown as the blog server 1 and the user terminal 5 is realized by a computer device capable of information processing and information communication as shown in FIG.

図2において、コンピュータ装置のCPU(Central Processing Unit)101は、ROM( Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM( Random Access Memory )103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インタフェース105も接続されている。
入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109が接続されている。
入力部106はキーボード、マウス、タッチパネルなどにより構成される。
出力部107はLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどにより構成される。
記憶部108はHDD(Hard Disk Drive)やフラッシュメモリ装置などにより構成される。
通信部109はネットワーク2を介しての通信処理や機器間通信を行う。
入出力インタフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
In FIG. 2, a CPU (Central Processing Unit) 101 of a computer device is provided with various types of programs according to a program stored in a ROM (Read Only Memory) 102 or a program loaded from a storage unit 108 into a RAM (Random Access Memory) 103. Execute the process. The RAM 103 also appropriately stores data necessary for the CPU 101 to execute various processes.
The CPU 101, the ROM 102, and the RAM 103 are connected to each other via a bus 104. An input / output interface 105 is also connected to the bus 104.
An input unit 106, an output unit 107, a storage unit 108, and a communication unit 109 are connected to the input / output interface 105.
The input unit 106 includes a keyboard, a mouse, a touch panel and the like.
The output unit 107 is configured by a display including an LCD (Liquid Crystal Display), a CRT (Cathode Ray Tube), an organic EL (Electroluminescence) panel, and a speaker.
The storage unit 108 includes an HDD (Hard Disk Drive), a flash memory device, and the like.
The communication unit 109 performs communication processing and inter-device communication via the network 2.
A media drive 110 is also connected to the input / output interface 105 as necessary, and a removable medium 111 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory is appropriately mounted to write information to the removable medium 111. Reading is performed.

このようなコンピュータ装置では、通信部109による通信によりデータやプログラムのアップロード、ダウンロードが行われる。またリムーバブルメディア111を介したデータやプログラムの受け渡しが可能である。
CPU101が各種のプログラムに基づいて処理動作を行うことで、ブログサーバ1やユーザ端末5としての必要な情報処理や通信が実行される。
なお、ブログサーバ1やユーザ端末5を構成する情報処理装置は、図2のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、LAN等によりシステム化されていてもよいし、インターネット等を利用したVPN等により遠隔地に配置されたものでもよい。複数の情報処理装置には、クラウドコンピューティングサービスによって利用可能なサーバ群(クラウド)としての情報処理装置が含まれてもよい。
In such a computer device, data and programs are uploaded and downloaded by communication by the communication unit 109. Also, data and programs can be transferred via the removable medium 111.
By the CPU 101 performing processing operations based on various programs, necessary information processing and communication as the blog server 1 and the user terminal 5 are executed.
It should be noted that the information processing device configuring the blog server 1 and the user terminal 5 is not limited to a single computer device as shown in FIG. 2, and may be configured by systematizing a plurality of computer devices. .. The plurality of computer devices may be systematized by a LAN or the like, or may be arranged at a remote place by a VPN or the like using the Internet or the like. The plurality of information processing devices may include an information processing device as a server group (cloud) that can be used by a cloud computing service.

<2.ブログサーバ及びデータベース>
図3に1又は複数の情報処理装置で構成されるブログサーバ1としての機能構成および各種のDBを示す。
ブログサーバ1としての各機能は、情報処理装置においてCPU101でプログラムに応じて実行される処理により実現される機能である。但し以下説明する全部又は一部の各構成の処理をハードウエアにより実現してもよい。
また各機能をソフトウエアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。1つのプログラムにより複数の機能の処理が実行されてもよいし、1つの機能が複数のプログラムモジュールの連携で実現されてもよい。
また各機能は複数の情報処理装置に分散されていてもよい。さらに機能の1つが、複数の情報処理装置によって実現されてもよい。
<2. Blog server and database>
FIG. 3 shows a functional configuration of the blog server 1 including one or a plurality of information processing devices and various DBs.
Each function as the blog server 1 is a function realized by a process executed by the CPU 101 in the information processing apparatus according to a program. However, the processing of all or part of each configuration described below may be realized by hardware.
Further, when each function is realized by software, each function does not need to be realized by an independent program. Processing of a plurality of functions may be executed by one program, or one function may be realized by cooperation of a plurality of program modules.
Further, each function may be distributed to a plurality of information processing devices. Further, one of the functions may be realized by a plurality of information processing devices.

ブログサーバ1は、図示するようにブログ管理部11、判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15、引用通知部16としての機能を備える。   The blog server 1 has functions as a blog management unit 11, a determination opportunity detection unit 12, a first citation appropriateness determination unit 13, a second citation appropriateness determination unit 14, an alerting unit 15, and a citation notification unit 16 as illustrated. .

ブログ管理部11は、ブログサービスを提供するサーバとして必要な処理を実行する。例えばユーザへのブログ環境の提供、ブロガーとしてのユーザの情報の管理、作成されたブログの記憶管理、各ブログに関する情報管理、アクセス要求に応じたブログ(記事)のウェブページの配信などを行う。
またブログ管理部11は管理DB53の情報の更新や読み出しを逐次行う。
The blog management unit 11 executes processing necessary as a server that provides a blog service. For example, it provides a blog environment to users, manages information of users as bloggers, manages storage of created blogs, manages information about each blog, and delivers web pages of blogs (articles) according to access requests.
In addition, the blog management unit 11 sequentially updates and reads information in the management DB 53.

判定機会検出部12は、ユーザ装置5におけるブログ記事の作成中に引用についての判定する機会が発生したことを検出する。即ち何らかの手法により、引用の可能性があると推定される部分が生じたことを検出する。
なお、引用について判定する機会の発生を検出するということは、実際に厳密に引用であるか否かを判定することではない。このため、例えばユーザ端末5においてペースト操作があったことにより判定機会が生じたと検出するなどの簡易な処理とすることができる。
The determination opportunity detection unit 12 detects that an opportunity to determine a citation has occurred while creating a blog article in the user device 5. That is, it is detected by some method that a portion estimated to be possible to be cited has occurred.
It should be noted that detecting the occurrence of an opportunity to make a decision regarding citation does not mean determining whether or not it is actually a citation. Therefore, it is possible to perform a simple process such as detecting that a determination opportunity has occurred due to a paste operation on the user terminal 5, for example.

なお、ユーザ端末5における操作をブログサーバ1において検出するために、例えばユーザ端末5に提供するブログ作成用のウェブページに、ユーザ操作を検出し送信するプログラムが含まれるようにすることが考えられる。
ブログ記事ページやブログ作成ページを形成するウェブページのデータは、例えば、HTML(HyperText Markup Language)やXHTML(Extensible HyperText Markup Language)などの構造化文書ファイルである。そしてこの構造化文書ファイルにおいて、ブロガーが作成する記事のテキストデータや画像の指定情報、さらにはそれらの配置や表示態様(文字色やフォントや大きさや装飾など)が記述される。
このようなウェブページデータには、例えばブラウザベースで動作可能なJava(登録商標)などのプログラミング言語やJavaScript(登録商標)などのスクリプト言語で生成されたプログラムを埋め込むことで、各種の処理をユーザ端末5(ブラウザ)に実行させることが可能である。これにより例えばユーザがブログ記事作成を行っている場合に、ユーザの操作や、編集中のデータ等をブログサーバ1側でモニタリングできるようにすることができ、例えばユーザの操作等に応じた判定機会検出を行うことができる。
In order to detect the operation on the user terminal 5 on the blog server 1, it is conceivable that, for example, the blog creation web page provided to the user terminal 5 includes a program for detecting and transmitting the user operation. .
The data of a web page forming a blog article page or a blog creation page is a structured document file such as HTML (HyperText Markup Language) or XHTML (Extensible HyperText Markup Language). Then, in this structured document file, the text data of the article created by the blogger and the designation information of the image, as well as the layout and display mode (character color, font, size, decoration, etc.) of them are described.
By embedding a program generated in a programming language such as Java (registered trademark) or a script language such as JavaScript (registered trademark) that can operate on a browser basis in such web page data, various processes can be performed by the user. It can be executed by the terminal 5 (browser). As a result, for example, when the user is creating a blog article, it is possible to monitor the user's operation, the data being edited, etc. on the blog server 1 side, and, for example, a judgment opportunity corresponding to the user's operation or the like. Detection can be performed.

第1引用適否判定部13は、ユーザ端末5においてブログ記事が作成されているときに、判定機会検出部12により引用についての判定機会が検出されたことに応じて、そのユーザ端末5における閲覧履歴情報を用いた引用適否判定(第1引用適否判定)を行う。
この第1引用適否判定としては、例えばユーザの閲覧履歴に沿って過去にさかのぼって、ペースト箇所と同一内容(コピー箇所)を探索する。またコピー箇所の、そのコピー元のウェブページのコンテンツ等における割合を算出するなどを行う。
When the blog article is being created in the user terminal 5, the first citation appropriateness determination unit 13 responds to the determination opportunity detection unit 12 detecting a determination opportunity for citation, and accordingly, the browsing history of the user terminal 5. A citation suitability determination (first citation suitability determination) using information is performed.
As the first quotation adequacy determination, for example, the same content as the paste location (copy location) is searched retroactively along the browsing history of the user. Also, the ratio of the copy location in the content of the web page of the copy source is calculated.

第2引用適否判定部14は、ユーザ端末5からのブログ記事のアップロード要求のタイミングで、設定された判定基準を用いて引用適否判定(第2引用適否判定)を行う。
この第2引用適否判定としては、例えばペースト部分が主記事部分に対して「従たる範囲」となっているか否かを判定や、引用元の提示有無の確認などを行う。
The second quotation adequacy determination unit 14 performs a quotation adequacy determination (second quotation adequacy determination) using the determination criterion set at the timing of the blog article upload request from the user terminal 5.
As the second quotation adequacy determination, for example, it is determined whether or not the paste portion is in a “subordinate range” with respect to the main article portion, and whether or not the quotation source is presented is confirmed.

注意喚起部15は、第1引用適否判定部13の判定結果と第2引用適否判定部14の判定結果に応じて、ユーザ端末5において注意喚起表示を実行させる処理を行う。
例えば第1、第2引用適否判定部のいずれかで不適切な引用や無断転載の可能性があると判定された際に、記事のアップロードを開始させずに、不適切引用の警告を行うことなどが想定される。
The alerting unit 15 performs processing for alerting the user terminal 5 according to the determination result of the first quotation appropriateness determining unit 13 and the determination result of the second quote appropriateness determining unit 14.
For example, when either the first or second citation appropriateness determination unit determines that there is a possibility of inappropriate citation or unauthorized reprinting, warning of inappropriate citation is issued without starting uploading of article. Is assumed.

引用通知部16は、引用が行われたことを出典元に通知する処理を行う。また出典元のユーザからの通知を受け取って必要な対応処理を行う場合もある。   The citation notifying unit 16 performs a process of notifying the source that the citation is performed. In some cases, a notification may be received from the user who is the source of the request, and necessary processing may be performed.

図3ではブログサーバ1がアクセスするDBとしてブログDB51、画像DB52、管理DB53を示している。
ブログDB51は、各ブロガーについてのブログデータを保存するDBである。各ブログのウェブページデータが保存され、また各ブログについては、ブロガーの投稿に応じて記事が追加されていく。
またブログに対しては閲覧者がコメントを投稿することもできる。そのような閲覧者からのコメントデータもブログやブログ内の個々の記事に紐づけてブログDB51に保存される。
ブログサーバ1は、ユーザ端末5から或るブログについてのアクセス要求があった場合は、要求されたブログページをブログDB51から読み出してユーザ端末5に配信することになる。
In FIG. 3, a blog DB 51, an image DB 52, and a management DB 53 are shown as DBs accessed by the blog server 1.
The blog DB 51 is a DB that stores blog data about each blogger. The web page data of each blog is saved, and articles are added to each blog according to the posts of bloggers.
Viewers can also post comments on the blog. The comment data from such a viewer is also stored in the blog DB 51 in association with the blog or individual articles in the blog.
When there is an access request for a certain blog from the user terminal 5, the blog server 1 reads the requested blog page from the blog DB 51 and delivers it to the user terminal 5.

画像DB52は、ブログに添付された画像データ(静止画データや動画データ)を保存するDBである。
ブログ内の記事には、画像を添付することができるが、例えばブログDB51には記事データ及び記事データに対応した画像の指定情報(リンク情報)が記憶される。そして画像データ自体は画像DB52に保存される。
画像が添付されたブログ記事へのアクセス要求の場合、そのウェブページデータがユーザ端末5においてブラウザにより表示されるが、その際、ユーザ端末5はウェブページ上のリンク設定により画像データをブログサーバ1に要求する。ブログサーバ1は当該要求に応じて画像データを画像DB52から読み出し、ユーザ端末5に配信する。これによりユーザ端末5上で、画像付きのブログ記事が表示される。
なおこれは一例であり、予め画像データを含むウェブページデータをブログDB51に格納するようにしてもよい。
The image DB 52 is a DB that stores image data (still image data or moving image data) attached to a blog.
Images can be attached to the articles in the blog. For example, the blog DB 51 stores article data and image designation information (link information) corresponding to the article data. Then, the image data itself is stored in the image DB 52.
In the case of a request for access to a blog article to which an image is attached, the web page data is displayed by the browser on the user terminal 5. At that time, the user terminal 5 sends the image data to the blog server 1 by the link setting on the web page. To request. The blog server 1 reads the image data from the image DB 52 in response to the request and delivers it to the user terminal 5. As a result, the blog article with the image is displayed on the user terminal 5.
Note that this is an example, and web page data including image data may be stored in advance in the blog DB 51.

管理DB53は、各ブログの管理のための情報を格納するDBである。
例えば1つのブログについてはブログID(Identification)が設定され、ブログIDにより付随する情報が管理される。例えば各ブログ(ブログID)毎に、ユーザ情報、ブログ管理情報、ブログ実績情報、サイズ情報などが、逐次更新されながら管理される。
The management DB 53 is a DB that stores information for managing each blog.
For example, a blog ID (Identification) is set for one blog, and accompanying information is managed by the blog ID. For example, for each blog (blog ID), user information, blog management information, blog performance information, size information, etc. are managed while being sequentially updated.

ユーザ情報は、ブログを開設したブロガーとしてのユーザ(ブログ管理者)の情報である。例えばユーザ情報としては、ユーザID、管理者としてのログインパスワード、ユーザの住所、氏名、年齢等の属性情報、管理者としてのログイン日時、などの情報が含まれる。
ブログ管理情報は、ブログ自体の属性情報である。例えばブログのURL、ブログのジャンル情報、ブログの開設日時、ブログに含まれる記事数、更新日時情報、ブログのレイアウト情報、リンク設定情報等が含まれる。
ブログ実績情報としては、総ページビュー数、アクセスしたユニークユーザ数、総被リンク数、総コメント数、ブログのページランク、広告クリック数などがあり、これらは逐次更新されていく。
サイズ情報は、そのブログ全体のデータサイズの情報である。また各記事のサイズ情報を記憶しても良い。サイズ情報は、ブログの更新に応じて更新される。
The user information is information on a user (blog administrator) as a blogger who has opened a blog. For example, the user information includes a user ID, a login password as an administrator, attribute information such as a user's address, name, and age, login date and time as an administrator, and the like.
The blog management information is attribute information of the blog itself. For example, the URL of the blog, the genre information of the blog, the opening date and time of the blog, the number of articles included in the blog, the update date and time information, the layout information of the blog, the link setting information and the like are included.
The blog performance information includes the total number of page views, the number of unique users who have accessed, the total number of backlinks, the total number of comments, the page rank of the blog, the number of clicks on advertisements, etc. These are sequentially updated.
The size information is information on the data size of the entire blog. Further, the size information of each article may be stored. The size information is updated as the blog is updated.

以上の各DB(ブログDB51、画像DB52、管理DB53)は、ブログサーバ1がアクセス可能とされていればどのような形態で実現されていてもよい。例えばブログサーバ1と同一システム内の記憶部に各DBのすべてが形成されていてもよいし、各DBの一部又は全部が別体、遠隔地等のコンピュータシステムに設けられていてもよい。もちろん各DBが一つの装置(例えば一つのHDD等)内に形成されている必要はない。また各DBのそれぞれが、それぞれ1つのDBとして構成される必要もない。例えば管理DB53として記憶される情報が、複数のDB(例えばブログに関するユーザ管理用のDBとブログ管理用のDBなど)により記憶管理されてもよい。以上の各DBは、実施の形態の処理に関連する情報の記憶部を、それぞれ1つのDBの形態で例示したものに過ぎない。
Each of the above DBs (blog DB 51, image DB 52, management DB 53) may be implemented in any form as long as the blog server 1 is accessible. For example, all of the DBs may be formed in the storage unit in the same system as the blog server 1, or a part or all of the DBs may be provided separately or in a computer system such as a remote place. Of course, each DB does not have to be formed in one device (for example, one HDD or the like). Further, each DB does not need to be configured as one DB. For example, the information stored as the management DB 53 may be stored and managed by a plurality of DBs (for example, a user management DB relating to blogs and a blog management DB). Each of the above DBs is merely an example of a storage unit of information related to the processing of the embodiment in the form of one DB.

<3.第1の実施の形態>
第1の実施の形態としてのブログサーバ1の処理を説明する。
ブログサーバ1は、ユーザ端末5にブログ作成用のウェブページを送信し、ユーザがブログ作成を行っている場合において、引用の可能性が検出されることに応じて適切な引用であるか否かの判定を行うとともに、アップロード要求の際にも引用適否判定を行い、必要に応じて注意喚起処理を行うものである。
<3. First Embodiment>
The processing of the blog server 1 as the first embodiment will be described.
The blog server 1 transmits a web page for creating a blog to the user terminal 5, and in the case where the user is creating the blog, whether or not the citation is appropriate according to the possibility of citation being detected. In addition to the above determination, the quotation adequacy determination is also performed at the time of an upload request, and attention processing is performed as necessary.

図4によりブログ作成の際のユーザ端末5とブログサーバ1の処理の流れを説明する。
ブログ記事を作成しようとするユーザは、ユーザ端末5上でブログサーバ1にブログ作成ページを要求する操作を行う。これによりステップS10としてユーザ端末5からブログサーバ1にブログ作成ページの要求が行われる。
ブログサーバ1はこの要求に応じて、ステップS20でブログ作成ページをユーザ端末5に送信する。これによりユーザ端末5では、ウェブブラウザ機能により、ブログ作成ページが表示される。ユーザは、ブログ作成ページを用いて記事としてのテキストデータ入力や画像データの指定等を行っていく。
ステップS11のブログ作成とは、ブログ作成ページに対するユーザ操作により、画面上でブログ記事の作成編集が行われている際のユーザ端末5の処理を総括的に示している。
The process flow of the user terminal 5 and the blog server 1 when creating a blog will be described with reference to FIG.
A user who wants to create a blog article performs an operation of requesting a blog creation page from the blog server 1 on the user terminal 5. As a result, in step S10, the blog creation page is requested from the user terminal 5 to the blog server 1.
In response to this request, the blog server 1 transmits the blog creation page to the user terminal 5 in step S20. As a result, the blog creation page is displayed on the user terminal 5 by the web browser function. The user uses the blog creation page to input text data as an article and specify image data.
The blog creation in step S11 generally indicates the processing of the user terminal 5 when the blog article is created and edited on the screen by the user operation on the blog creation page.

このブログ作成中においては、例えばユーザがコピー&ペーストの操作を行うことがある。例えばブログサーバ1は、作成中のブログ記事へのペースト操作を検出したら(S21)、これを引用に関する判定機会の発生として、ステップS22の第1引用適否判定の処理を行う。
この第1引用適否判定は、ペースト操作でペーストされたテキストデータや画像データについて、他のウェブページなどにおけるコピー元を探索する等の処理を行う。
この第1引用適否判定は、例えばペースト操作が検出される毎に実行される。
During the creation of this blog, for example, the user may perform copy and paste operations. For example, when the blog server 1 detects a paste operation to the blog article being created (S21), the blog server 1 regards this as a judgment opportunity regarding citation and performs the first citation appropriateness determination process in step S22.
The first quotation adequacy determination performs a process such as searching for a copy source in another web page or the like for the text data or the image data pasted by the paste operation.
This first quotation adequacy determination is executed, for example, every time a paste operation is detected.

ユーザは、ブログ記事を完成させると、それをアップロードする操作を行う。ユーザ端末5はこの操作に応じてステップS12でブログサーバ1に対してブログ記事のアップロードを要求する。
このときブログサーバ1は、ステップS23として第2引用適否判定を行い、所定の条件により適切な引用が行われているか否かを判定する。ただし、厳密な判定でなくてよく、例えば、「著作権侵害の可能性がある」又は「著作権侵害の可能性がないとはいえない」という程度の判定であればよい。
After completing the blog article, the user uploads it. In response to this operation, the user terminal 5 requests the blog server 1 to upload a blog article in step S12.
At this time, the blog server 1 makes a second citation appropriateness determination as a step S23, and determines whether or not an appropriate citation is made under a predetermined condition. However, the determination need not be a strict determination, and may be a determination such as “there is a possibility of copyright infringement” or “it cannot be said that there is no possibility of copyright infringement”.

ステップS24でブログサーバ1は、注意喚起が必要であるか否かを判定する。
引用と推定される部分が存在しない場合や、引用が適切に行われていると判定される場合は、注意喚起が不要であるとして、ブログサーバ1はステップS25からS27に進み、アップロードを受け付け、ユーザ端末5のアップロード処理(送信)を受信してブログ記事のデータをブログDB51に格納するアップロード処理を行う。
In step S24, the blog server 1 determines whether attention is required.
If there is no part that is estimated to be a citation, or if it is determined that the citation is properly performed, it is determined that the reminder is not necessary, and the blog server 1 proceeds from step S25 to S27 to accept the upload, The upload process (transmission) of the user terminal 5 is received, and the upload process of storing the blog article data in the blog DB 51 is performed.

一方、注意喚起が必要と判定した場合は、ブログサーバ1はステップS25からS26に進み、注意喚起処理を行う。この場合、例えばアップロードを開始させず、ユーザ端末5においてブログ作成ページとともに、注意喚起のメッセージが表示されるように制御を行う。ユーザ端末5側ではステップS13で注意喚起表示が行われる。   On the other hand, if the blog server 1 determines that the attention is required, the blog server 1 proceeds from step S25 to S26, and performs the attention processing. In this case, for example, the upload is not started, and control is performed so that the user terminal 5 displays a reminder message along with the blog creation page. On the user terminal 5 side, a caution display is performed in step S13.

図5に注意喚起表示が行われている状態の例を示している。
例えばユーザが作成し、アップロードをしようとしたブログ記事60において、例えば枠表示61により不適切な引用と判定された箇所が明示される。もちろん枠表示61以外にも、ハイライト表示、特定色表示、拡大表示その他の手法で、引用箇所が示されるようにしてもよい。
さらにメッセージ表示62により、必要なメッセージが表示される。ここでは無断転載の指摘や、出典元を明記することを薦める表示の例としている。
もちろんメッセージ内容は多様に考えられる。例えば対象法として、テキストの削除や文字数の削減、引用箇所の明示、文字等の態様(サイズやフォント等)の変更などのアドバイスを示すものでもよい。
FIG. 5 shows an example of a state in which the alert display is being performed.
For example, in the blog article 60 that the user has created and tried to upload, for example, the frame display 61 clearly indicates a portion determined to be inappropriate citation. Of course, in addition to the frame display 61, the quoted portion may be indicated by a highlight display, a specific color display, an enlarged display, or any other method.
Further, the message display 62 displays a necessary message. In this example, unauthorized reproduction is pointed out, and an example of a display recommending that the source of the source is specified is used.
Of course, various message contents are possible. For example, as the applicable law, advice such as deletion of text, reduction of the number of characters, clarification of a quoted portion, change of a mode (size, font, etc.) of characters and the like may be shown.

このような注意喚起表示を行った場合、例えばユーザ端末側はブログ作成の処理(S11)に戻してユーザの編集を受け付けるようにするとよい。ユーザは、不適切な引用の指摘がされないように所要の編集を行って、再度アップロードを要求すればよい。   When such a reminder display is performed, for example, the user terminal side may return to the blog creation process (S11) to accept the user's edit. The user may make necessary edits and request uploading again so that inappropriate citations are not pointed out.

以上は、ブログサーバ1とユーザ端末5の処理の流れの概要を示したが、このような処理を実現するためのブログサーバ1の具体的な処理例を説明していく。
図6はブログサーバ1が図3に示した機能、特に判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15としての機能により実行する処理例を示している。
The outline of the processing flow of the blog server 1 and the user terminal 5 has been described above, but a specific processing example of the blog server 1 for realizing such processing will be described.
FIG. 6 shows an example of processing executed by the blog server 1 by the functions shown in FIG. Shows.

ステップS100としてユーザ端末からブログ作成ページの要求が検知された場合、ブログサーバ1はステップS101に進み、ブログ作成ページを要求元のユーザ端末5に送信する。
そしてブログサーバ1はステップS102で変数Mを初期設定としてM=0とする。変数Mは作成されているブログ記事内で、引用元が発見された数を管理する変数である。
When a request for a blog creation page is detected from the user terminal in step S100, the blog server 1 proceeds to step S101 and transmits the blog creation page to the requesting user terminal 5.
Then, in step S102, the blog server 1 initializes the variable M to M = 0. The variable M is a variable for managing the number of times the citation source is found in the created blog article.

ユーザ端末5においてユーザの操作によりブログ記事の作成・編集が行われている期間は、ブログサーバ1はステップS103,S104,S105の監視処理を継続的に行っている。
ステップS103でブログサーバ1は、ユーザ端末5においてブログ作成ページが終了されたか否かを監視する。例えばユーザがブログ記事作成を中止して当該ウェブページを閉じたような場合である。
ブログ作成ページの終了が検出された場合、ブログサーバ1はステップS103から図6の処理を終える。
While the blog article is created / edited by the user's operation on the user terminal 5, the blog server 1 continuously performs the monitoring process of steps S103, S104, and S105.
In step S103, the blog server 1 monitors whether or not the blog creation page has ended on the user terminal 5. For example, this is the case when the user has stopped creating the blog article and closed the web page.
When the end of the blog creation page is detected, the blog server 1 ends the processing of FIG. 6 from step S103.

ステップS104でブログサーバ1は、ユーザ端末5からのアップロード要求を監視する。
ステップS105でブログサーバ1は、ユーザ端末5においてペースト処理が行われることを監視する。即ち作成中のブログ記事として、コピー&ペーストの操作によりテキストデータ又は画像データが貼り付けられたことを検知する。
In step S104, the blog server 1 monitors the upload request from the user terminal 5.
In step S105, the blog server 1 monitors that the paste process is performed in the user terminal 5. That is, it is detected that the text data or the image data is pasted by the copy & paste operation as the blog article being created.

ブログ記事作成中のある時点でペースト操作が検知されると、ブログサーバ1は処理をステップS105からS106に進め、第1引用適否判定を行う。この第1引用適否判定の処理例を図7に示す。   When a paste operation is detected at some point during the creation of a blog article, the blog server 1 advances the process from step S105 to S106, and makes a first quotation adequacy determination. FIG. 7 shows a processing example of the first quotation adequacy determination.

図7のステップS201でブログサーバ1は、ブログ記事内においてペーストされた部分を特定する。
ステップS202でブログサーバ1は、このコピー&ペーストの操作が、当該ブログ記事内(もしくはブログ内)で行われたものであるか否かを判定する。例えばペーストされた部分のデータが当該作成中のブログ記事内の他の部分からコピーされたものであるか、或いは当該ブログ(現在記事を作成中のブログ)の他の記事からコピーされたものであるかを確認する。このような場合は、コピー元がユーザ本人が作成した文章等と考えられるため、今回のペースト操作は、単なる文の移動、自己文章の転記、入力効率化のための操作などである可能性がある。またこの場合はユーザ自身の文章のコピー&ペースト操作であり著作権侵害の問題は生じないと考えられる。そこで不適切な引用の可能性があるとはしないで、ステップS202から図7の第1引用適否判定を終える。
In step S201 of FIG. 7, the blog server 1 identifies the pasted part in the blog article.
In step S202, the blog server 1 determines whether or not this copy & paste operation is performed in the blog article (or in the blog). For example, the data of the pasted part is copied from another part in the blog article being created, or is copied from another article of the blog (the blog currently being created). Check if there is. In such a case, the copy source is considered to be a sentence created by the user himself, so the paste operation this time may be a simple movement of a sentence, transcription of a self-sentence, or an operation for improving input efficiency. is there. Further, in this case, it is considered that the user's own text copy / paste operation does not cause the problem of copyright infringement. Therefore, it is not determined that there is a possibility of inappropriate citation, and the first citation suitability determination of FIG. 7 is finished from step S202.

ブログ内又は記事内からのコピー&ペーストではない場合は、ブログサーバ1はステップS203で、ペーストされたデータがテキストデータか画像データかにより処理を分岐する。
テキストデータであった場合はブログサーバ1はステップS204に進み、引用適否判定の対象のテキストデータをコピー元探索するデータとして取得する。
そしてステップS206でブログサーバ1は、当該テキストデータの文字数を、所定の閾値thTNと比較する。文字数が閾値thTN以上であればステップS207に進み、閾値thTN未満であれば図7の処理を終える。
これは、引用とは考えにくい、少ない文字数の場合を排除するためであり、閾値thTNは、例えば「10」などとされる。つまりペーストされた文字数が10文字未満であれば、それは引用ではないとみなして第1引用適否判定を行わないようにするものである。もちろんこの判定の閾値は10文字に限られない。
If it is not the copy and paste from the blog or the article, the blog server 1 branches the process in step S203 depending on whether the pasted data is text data or image data.
If the data is text data, the blog server 1 proceeds to step S204, and acquires the text data for which the quotation adequacy is determined as the data for searching the copy source.
Then, in step S206, the blog server 1 compares the number of characters of the text data with a predetermined threshold thTN. If the number of characters is greater than or equal to the threshold thTN, the process proceeds to step S207, and if less than the threshold thTN, the process of FIG. 7 ends.
This is to exclude a case where the number of characters is small, which is unlikely to be quoted, and the threshold thTN is set to, for example, “10”. That is, if the number of pasted characters is less than 10 characters, it is regarded as not a citation and the first citation appropriateness determination is not performed. Of course, the threshold for this determination is not limited to 10 characters.

ペーストされたのが画像データであった場合、ブログサーバ1はステップS203からS205に進み、引用適否判定の対象の画像データをコピー元探索するデータとして取得する。そしてステップS207に進む。   If the pasted is image data, the blog server 1 proceeds from step S203 to step S205, and acquires the image data of the quotation adequacy determination as the data for searching the copy source. Then, the process proceeds to step S207.

ステップS207でブログサーバ1は、ユーザ端末5から閲覧履歴データを取得する。
例えばユーザ端末5からブラウザが管理するウェブページの閲覧履歴を送信させ、これを取得する。
ステップS208でブログサーバ1は、閲覧履歴で示されるウェブページのうちで、調査対象のページを選択する。
取得した閲覧履歴で示される全てのウェブページを調査対象としてもよい。
また例えば閲覧履歴情報で示される閲覧日時の情報を用いて、現在より所定時間以内にユーザが閲覧したウェブページを調査対象としてもよい。
またブログサーバ1はブログ作成ページを送信した日時を把握しているため、その日時以降に閲覧したウェブページ、つまりブログ記事作成中に閲覧したウェブページを調査対象として選択してもよい。
In step S207, the blog server 1 acquires browsing history data from the user terminal 5.
For example, the browsing history of the web page managed by the browser is transmitted from the user terminal 5 and is acquired.
In step S208, the blog server 1 selects a survey target page from the web pages indicated by the browsing history.
All the web pages indicated by the acquired browsing history may be the survey targets.
Further, for example, by using the information of the browsing date and time indicated by the browsing history information, the web page browsed by the user within a predetermined time from the present may be the survey target.
Further, since the blog server 1 knows the date and time when the blog creation page is transmitted, the web page browsed after the date and time, that is, the web page browsed while creating the blog article may be selected as the survey target.

ステップS209でブログサーバ1は、変数N=1、変数Nmax=調査対象のウェブページ数とする。変数NはステップS208で調査対象として選択したウェブページを区別するための変数である。選択されたウェブページを第1のウェブページから第(Nmax)のウェブページとする。
そしてステップS210でブログサーバ1は、第Nのウェブページの調査を行う。この処理を図8に示す。
In step S209, the blog server 1 sets the variable N = 1 and the variable Nmax = the number of web pages to be surveyed. The variable N is a variable for distinguishing the web page selected as the survey target in step S208. The selected web pages are the first to the (Nmax) th web pages.
Then, in step S210, the blog server 1 investigates the Nth web page. This process is shown in FIG.

図8のステップS220でブログサーバ1は、まず調査するデータ(ペーストされたデータ)がテキストデータか画像データかで処理を分岐する。
テキストデータの場合は、ブログサーバ1はステップS221で、第Nのウェブページにアクセスしてそのページデータを取得する。
ステップS222でブログサーバ1は、当該ウェブページにテキストデータが存在するか否かを確認する。テキストデータが存在しなければ、そのウェブページはコピー元ではあり得ないため、当該第Nの(例えば第1の)ウェブページの調査を終了する。
この場合、ブログサーバ1は図7のステップS211に進み、変数N≧Nmaxでなければ、つまりまだ選択した全てのウェブページの調査が終了していなければ、ステップS212で変数NをインクリメントしてステップS210に戻る。そして第Nのウェブページ、つまり次のウェブページについて図8の処理を行うことになる。
In step S220 of FIG. 8, the blog server 1 first branches the process depending on whether the data to be investigated (pasted data) is text data or image data.
In the case of text data, the blog server 1 accesses the Nth web page and acquires the page data in step S221.
In step S222, the blog server 1 confirms whether or not text data exists on the web page. If the text data does not exist, the web page cannot be the copy source, and thus the inspection of the Nth (eg, first) web page ends.
In this case, the blog server 1 proceeds to step S211 of FIG. 7, and if the variable N ≧ Nmax is not satisfied, that is, if the survey of all selected web pages has not been completed, the variable N is incremented in step S212 and the step is performed. Return to S210. Then, the process of FIG. 8 is performed for the Nth web page, that is, the next web page.

調査中のウェブページにおいてステップS222でテキストデータが存在すると判定した場合、ブログサーバ1はステップS223で、そのウェブページ内でコピー元のテキストを検索する。つまりペーストされたテキストデータと同一のテキストデータが、そのウェブページ内に有るか否かを調べる。
無ければ、ステップS224から当該第Nのウェブページについての図8の処理を終える。
When it is determined in step S222 that the text data exists in the web page under investigation, the blog server 1 searches for the copy source text in the web page in step S223. That is, it is checked whether or not the same text data as the pasted text data exists in the web page.
If not, the process of FIG. 8 for the Nth web page is ended from step S224.

ペーストされたテキストデータと同一のテキストデータが、そのウェブページ内に発見された場合は、ブログサーバ1はステップS224からS225に進み、引用といえるか、或いは転載であるか否かを判定する。
適正な引用としては、出典元(コピー元)の文章等の一部であることが必要と考えることができる。逆に出典元のテキストデータの全部又は大部分が丸ごとコピー&ペーストされているのは、引用とはいえず、転載と考えられ、場合によっては無断転載と考えることもできる。
そこでステップS225では、コピー&ペースト操作に係るテキストデータ部分が、コピー元のウェブページ内のテキストデータの一部とはいえない量であるか否かを判定し、これによって引用か転載かを判定する。
If the same text data as the pasted text data is found in the web page, the blog server 1 proceeds from step S224 to step S225, and determines whether it is a citation or a reprint.
It can be considered that a proper citation needs to be a part of the text or the like of the source (copy source). On the contrary, the whole or most part of the text data of the source is copied and pasted as a whole, which is not a citation but is considered to be a reprint, and in some cases, it may be reprinted without permission.
Therefore, in step S225, it is determined whether the text data portion related to the copy & paste operation is an amount that cannot be said to be a part of the text data in the copy source web page, and it is determined whether the text data is quoted or reprinted. To do.

続いてブログサーバ1はステップS226で変数Mをインクリメントする。そしてステップS227で、今回コピー元が発見されたペースト部分について「第Mの引用箇所」に関する情報を生成する。
具体的にはコピーフラグF(M)1をオンとする。“(M)”は、作成中のブログ記事内で発見された第Mの引用箇所に対応するフラグであることを示すものとして、現時点の変数Mの値が挿入される。
このコピーフラグF(M)1=1とされるということは、現在調査対象としているテキストデータのコピー元として他のウェブサイトが発見されたことを示すことになり、ブログサーバ1はコピーフラグF(M)1をペースト部分のデータと対応づけて記憶する。
またブログサーバ1は、引用/転載フラグF(M)itも設定する。例えばステップS225で「引用」と判定されたらF(M)it=0、「転載」と判定されたらF(M)it=1とし、ペースト部分のデータと対応づけて記憶する。
Subsequently, the blog server 1 increments the variable M in step S226. Then, in step S227, information regarding the "Mth quoted portion" is generated for the paste portion where the copy source is found this time.
Specifically, the copy flag F (M) 1 is turned on. "(M)" indicates that the flag corresponds to the M-th quoted portion found in the blog article being created, and the current value of the variable M is inserted.
The fact that the copy flag F (M) 1 = 1 means that another website has been found as the copy source of the text data currently under investigation, and the blog server 1 uses the copy flag F (M) 1. (M) 1 is stored in association with the data of the paste portion.
The blog server 1 also sets a citation / reproduction flag F (M) it. For example, F (M) it = 0 is determined when it is determined to be "quotation" in step S225, and F (M) it = 1 is determined when it is determined to be "reprint", and the data is stored in association with the data of the paste portion.

ステップS228でブログサーバ1は、今回発見した第Mの引用箇所(ペースト箇所)についての出典情報を取得する。例えば現在調査していた第NのウェブページのURLやウェブサイト名称、ウェブページ管理者等の情報を取得する。
ブログサーバ1はこの出典情報を、ペースト箇所のデータ、コピーフラグF(M)1、引用/転載フラグF(M)itとともに、第1引用適否判定の結果として記憶する。例えば図2のRAM103又は記憶部108に記憶する。
In step S228, the blog server 1 acquires the source information about the Mth quoted portion (pasted portion) found this time. For example, the information on the URL of the Nth web page, the website name, the web page manager, etc. currently being investigated is acquired.
The blog server 1 stores this source information together with the data of the paste location, the copy flag F (M) 1 and the quotation / reprint flag F (M) it as the result of the first quotation adequacy determination. For example, it is stored in the RAM 103 or the storage unit 108 of FIG.

ステップS229では変数Nを強制的にNmaxとする。これは、コピー元が発見された段階で、他のウェブページを調査する必要がなくなるため、第1引用適否判定を終了させるためである。
即ちこの場合、図7のステップS211でN≧Nmaxとなり、図7の処理が終了される。
例えば閲覧履歴情報から5個の閲覧履歴が調査対象とされた場合、コピー元が見つかるまでは、5個のウェブページが順次図8の処理で調査対象とされるが、コピー元が見つかり次第、未調査のウェブページが残っていても、第1引用適否判定が終了されることになる。これにより冗長な調査処理が行われないようにする。
In step S229, the variable N is forcibly set to Nmax. This is because it is not necessary to investigate other web pages at the stage when the copy source is discovered, and thus the first quotation adequacy determination is ended.
That is, in this case, N ≧ Nmax in step S211 of FIG. 7, and the process of FIG. 7 is terminated.
For example, when five browsing histories are targeted for investigation from the browsing history information, five web pages are sequentially targeted for investigation by the processing of FIG. 8 until the copy source is found. Even if there is an unsearched web page, the first citation suitability determination will be completed. This prevents redundant investigation processing.

なお、例えばこの場合に5個のウェブページのいずれからもコピー元が発見されない場合もある。その場合は、ステップS226、S227、S228の処理が行われないため、当該ペースト部分は引用されたものではないとみなされることになる。
例えばユーザが他のアプリケーションソフトウエアを使用して自分で作成したデータをコピー&ペーストにより貼り付けたとする。そのような場合のペースト部分は引用ではなく、閲覧履歴にあるウェブページからは発見できない。このような場合、ペースト部分は第Mの引用箇所として記憶されないことになる。
但し、もちろん他人のテキストや画像からのコピー&ペーストはウェブページからとは限らない。例えば電子書籍その他の電子コンテンツであって、ユーザ端末5においてローカルに保存されているものもコピー元になり得る。
そこで、ローカルコンテンツを含めて閲覧履歴、再生履歴を取得できるようにし、それらについてもコピー元の調査を行うようにしてもよい。
In this case, for example, the copy source may not be found in any of the five web pages. In that case, since the processes of steps S226, S227, and S228 are not performed, it is considered that the paste portion is not quoted.
For example, suppose that the user pastes the data created by himself / herself using another application software by copy and paste. In such a case, the paste part is not a quote and cannot be found from the web page in the browsing history. In such a case, the paste portion is not stored as the Mth quoted portion.
However, of course copy and paste from other people's text or images is not always from the web page. For example, an electronic book or other electronic content that is locally stored in the user terminal 5 can also be the copy source.
Therefore, the browsing history and the reproduction history including the local content may be acquired, and the copy source may be investigated for these.

図8の処理においてペースト部分が画像データであった場合は、ブログサーバ1はステップS220からS231に進み、第Nのウェブページにアクセスしてそのページデータを取得する。
ステップS232でブログサーバ1は、当該ウェブページに画像データが存在するか否かを確認する。画像データが存在しなければ、そのウェブページはコピー元ではあり得ないため、当該第Nのウェブページの調査を終了する。
調査中のウェブページにおいてステップS232で画像データが存在すると判定した場合、ブログサーバ1はステップS233で、そのウェブページ内でコピー元の画像データを検索する。つまりペーストされた画像データと同一の画像データが、そのウェブページ内に有るか否かを調べる。
無ければ、ステップS234から、当該第Nのウェブページについての図8の処理を終える。
If the paste portion is image data in the process of FIG. 8, the blog server 1 proceeds from step S220 to step S231 and accesses the Nth web page to acquire the page data.
In step S232, the blog server 1 confirms whether image data exists in the web page. If the image data does not exist, the web page cannot be the copy source, and the survey of the Nth web page is terminated.
When it is determined in step S232 that image data exists in the web page under investigation, the blog server 1 searches for the copy-source image data in the web page in step S233. That is, it is checked whether or not the same image data as the pasted image data exists in the web page.
If not, the process of FIG. 8 for the Nth web page is ended from step S234.

ペーストされた画像データと同一の画像データが、そのウェブページ内に発見された場合は、ブログサーバ1はステップS234からS226、S227、S228、S229の処理を上記のテキストデータの場合と同様に行う。この場合、第Mのペースト箇所のデータとして、画像データと、コピーフラグF(M)1、引用/転載フラグF(M)it、出典情報が、第1引用適否判定の結果として記憶される。
なお画像データの場合は、通常は画像全体をコピー&ペーストすることから、引用/転載フラグF(M)itは、画像単位で考えて「転載」であることを示すようにすることが考えられる。
When the same image data as the pasted image data is found in the web page, the blog server 1 performs steps S234 to S226, S227, S228, and S229 in the same manner as the above text data. . In this case, the image data, the copy flag F (M) 1, the citation / reproduction flag F (M) it, and the source information are stored as the data of the Mth paste location as the result of the first citation suitability determination.
In the case of image data, the entire image is usually copied and pasted, so the citation / reproduction flag F (M) it can be considered to indicate "reproduction" in consideration of each image. .

調査対象とされたウェブページのうちからコピー元が見つかって図8の処理が終わった時点、または調査対象とされた全てのウェブページの調査が完了してもコピー元が見つからなかった時点で、図7のステップS211でN=Nmaxとなり、図7の第1引用適否判定が終了する。
図6のステップS106の第1引用適否判定では、以上の図7,図8のように処理が行われ、ペーストされたデータについてのコピー元が見つかった場合に、その情報が第Mの引用箇所として管理される状態となる。
ステップS105のペースト検出は、複数回行われることも当然想定されるが、引用としての蓋然性が高い場合にのみ、そのペースト部分のデータについて第Mの引用箇所のデータが生成されることになる。
変数MはステップS102でM=0とされた後、コピー元が検出された図8のステップS226でインクリメントされるものであるため、ブログ記事が完成するまでに、多数回のコピー&ペーストの操作が行われたとすると、その都度第1引用適否判定が行われ、コピー元が見つかる毎に、第1の引用箇所、第2の引用箇所・・・第Mの引用箇所として、引用箇所であると判定された結果の情報が保存されることになる。つまりM個のペースト箇所が引用箇所(転載も含む)として検出される。例えばブログ記事完成までに一度もコピー元が見つからない場合は、変数M=0のままで、引用箇所はなかったということになる。
When the copy source is found from the surveyed web pages and the processing of FIG. 8 is finished, or when the copy source is not found even after the survey of all the surveyed web pages is completed, In step S211 of FIG. 7, N = Nmax, and the first citation suitability determination of FIG. 7 ends.
In the first quotation propriety determination of step S106 of FIG. 6, the processing is performed as shown in FIGS. 7 and 8 above, and when the copy source of the pasted data is found, the information is the Mth quotation point. Will be managed as.
It is naturally assumed that the paste detection in step S105 is performed a plurality of times, but only when the probability of citation is high, the data of the Mth quoted portion is generated for the data of the paste portion.
Since the variable M is set to M = 0 in step S102 and then incremented in step S226 in FIG. 8 in which the copy source is detected, a number of copy and paste operations are performed until the blog article is completed. Is performed, the first quotation propriety determination is performed each time, and each time the copy source is found, the first quotation portion, the second quotation portion, ... Information of the determined result will be saved. That is, M paste locations are detected as quoted locations (including reprints). For example, if the copy source is never found by the time the blog article is completed, it means that the variable M = 0 remains and there is no quoted part.

ユーザは、ブログ記事を完成させると、アップロード操作を行うことになる。ユーザ端末5はブログサーバ1にアップロード要求を送信する。この場合図6のブログサーバ1の処理はステップS104からS110に進み、第2引用適否判定を行うことになる。
第2引用適否判定の具体例を図9に示す。
When the user completes the blog article, he will perform the upload operation. The user terminal 5 sends an upload request to the blog server 1. In this case, the process of the blog server 1 in FIG. 6 proceeds from step S104 to S110, and the second quotation adequacy determination is performed.
FIG. 9 shows a specific example of the second quotation adequacy determination.

図9のステップS300でブログサーバ1は、変数M=0であるか否かを確認する。上記のように変数M=0であるということは、引用箇所と判定されたペースト部分が存在しなかったということになる。その場合は、第2引用適否判定を終了し、図6のステップS111に進む。   In step S300 of FIG. 9, the blog server 1 confirms whether or not the variable M = 0. If the variable M = 0 as described above, it means that there is no paste portion determined to be a quoted portion. In that case, the second quotation adequacy determination is ended, and the process proceeds to step S111 in FIG.

一方、変数M=0でなければ、当該ブログ記事内に、第1引用適否判定で引用箇所と判定されたペースト部分が1箇所以上あったということである。
この場合ブログサーバ1はステップS302で変数Mmaxに変数Mの値を代入する。変数Mmaxは、第1引用適否判定で引用箇所と判定されたペースト部分の数となる。
そしてステップS303で変数M=1とする。これは引用箇所と判定された第1番目のペースト箇所から順に、第2引用適否判定を行っていくためである。
On the other hand, if the variable M is not 0, it means that there is at least one paste portion determined to be a quoted portion in the first citation appropriateness determination in the blog article.
In this case, the blog server 1 substitutes the value of the variable M for the variable Mmax in step S302. The variable Mmax is the number of paste parts determined to be a quoted portion in the first quotation propriety determination.
Then, in step S303, the variable M = 1 is set. This is because the second quotation adequacy determination is performed in order from the first paste location determined to be the quotation location.

但し、第1引用適否判定で引用箇所と判定されたペースト部分は、このアップロード時点では、消去されている可能性もある。第1引用適否判定はペースト処理の都度行われており、ユーザがそのペースト後のブログ記事作成の過程で、ペースト部分を削除することも通常に考えられるためである。従って、アップロード要求の時点で、必ずしもM個のペースト箇所が全て残っているとは限らない。
そこでステップS303でブログサーバ1は、アップロードされようとしているブログ記事において、第Mの引用箇所が存在しているか否かを確認する。つまり第1引用適否判定で保存された第Mの引用箇所の情報と、アップロード要求時点のブログ記事を照合し、当該部分が残されているか否かを確認する。
もし残されていなければ、その部分は引用適否判定を行う必要がないため、ブログサーバ1はステップS329で、その第Mの引用箇所についてのフラグ(コピーフラグF(M)1、引用/転載フラグF(M)it、及び後述するフラグF(M)2、フラグF(M)3、フラグF(M)4)を全てリセット(=0)とし、ステップS330に進む。そしてステップS330でM≧Mmaxであるか否か(全ての引用箇所について第2引用適否判定を終えたか否か)を確認し、M≧MmaxでなければステップS331で変数MをインクリメントしてステップS303に戻る。つまり次の引用箇所について、存在判定を行う。
However, the paste portion determined to be the quoted portion in the first quotation adequacy determination may have been deleted at the time of this upload. This is because the first quotation adequacy determination is performed each time the paste processing is performed, and it is usually conceivable that the user deletes the paste portion in the process of creating the blog article after the paste processing. Therefore, at the time of an upload request, not all M paste locations remain.
Therefore, in step S303, the blog server 1 confirms whether or not the M-th quoted portion exists in the blog article to be uploaded. That is, the information on the M-th quoted portion stored in the first quotation propriety judgment is collated with the blog article at the time of the upload request, and it is confirmed whether or not the relevant portion is left.
If it is not left, it is not necessary to determine whether or not the portion is appropriate for citation. Therefore, in step S329, the blog server 1 sets a flag (copy flag F (M) 1, citation / reprint flag) for the M-th citation portion. F (M) it and all flags F (M) 2, F (M) 3, and F (M) 4, which will be described later, are reset (= 0), and the process proceeds to step S330. Then, in step S330, it is confirmed whether or not M ≧ Mmax (whether or not the second quotation adequacy determination has been completed for all quotation points), and if M ≧ Mmax, the variable M is incremented in step S331 and step S303. Return to. That is, the presence determination is performed for the next quoted portion.

第Mの引用箇所について、ブログ記事内に存在すると判定した場合、ブログサーバ1はステップS304で、第Mの引用箇所の対象のデータがテキストデータであるか画像データであるかにより処理を分岐する。
テキストデータである場合、ブログサーバ1はステップS310に進み、生成されたブログ記事の総テキスト量に対する当該引用部分のテキスト量の比率を算出する。
そしてステップS311で、求められた比率が閾値thT以上であるか否かを判定する。適切な引用とするには、本文(引用以外)がコンテンツ内で支配的であり、本文と引用文に主従の関係が見つめられることが望ましいと考えられる。閾値thTはこのような関係を満たしているか否かを判定する閾値であり、適切な比率が設定される。
When it is determined that the Mth quoted portion is present in the blog article, the blog server 1 branches the process in step S304 depending on whether the target data of the Mth quoted portion is text data or image data. .
If the data is text data, the blog server 1 proceeds to step S310 and calculates the ratio of the text amount of the quoted portion to the total text amount of the generated blog article.
Then, in step S311, it is determined whether the obtained ratio is equal to or more than the threshold value thT. For proper citation, it is considered desirable that the text (other than citation) is dominant in the content, and that the relationship between the text and the quote is master-slave. The threshold thT is a threshold for determining whether or not such a relationship is satisfied, and an appropriate ratio is set.

ブログサーバ1は、求められた比率が閾値thT以上であれば、ステップS312に進みフラグF(M)2をオンとし、求められた比率が閾値thT以上でなければ、ステップS313に進みフラグF(M)2をオフとする。
フラグF(M)2は、第Mの引用箇所について、引用部分が本文中で従たる記載になっていない場合にオンとされるものとする。つまり本文と引用部分の量的な関係で不適切な引用となっている可能性があることを示すフラグである。
If the calculated ratio is greater than or equal to the threshold value thT, the blog server 1 proceeds to step S312 to turn on the flag F (M) 2, and if the calculated ratio is not greater than or equal to the threshold value thT, proceeds to step S313 and proceeds to flag F ( M) Turn 2 off.
The flag F (M) 2 is turned on when the quoted portion of the Mth quoted portion is not a subordinate description in the text. In other words, it is a flag indicating that there is a possibility that the citation is inappropriate due to the quantitative relationship between the text and the quoted portion.

次にブログサーバ1はステップS314で、第Mの引用箇所について、出典情報の記載を確認する。
そしてブログサーバ1は、アップロードしようとするブログ記事に第Mの引用箇所について出典情報が記載されていなければ、ステップS315からS316に進んでフラグF(M)3をオンとし、出典情報が記載されていればステップS315からS317に進みフラグF(M)3をオフとする。
つまりフラグF(M)3は、第Mの引用箇所について、引用部分ついての出典情報が記載されておらず、不適切な引用となっている可能性があることを示すフラグとされる。
なお、ブログサーバ1は第Mの引用箇所について出典情報を記憶しているため、ブログ記事内に出典情報が記載されているときに、それが正しい記載であるか否かも判定できる。そこで、出典情報が記載されている場合でも、それが正しいか否かを判定し、誤った記載となっている場合はフラグF(M)3をオンとすることが考えられる。
Next, in step S314, the blog server 1 confirms the description of the source information for the Mth quoted portion.
If the blog article to be uploaded does not include the source information about the M-th quoted portion, the blog server 1 proceeds from step S315 to S316, turns on the flag F (M) 3, and the source information is described. If so, the process proceeds from step S315 to S317, and the flag F (M) 3 is turned off.
That is, the flag F (M) 3 is a flag indicating that the citation information for the Mth quoted portion is not described and there is a possibility that the quoted portion is inappropriate.
Since the blog server 1 stores the source information about the M-th quoted portion, when the source information is described in the blog article, it can be determined whether or not the source information is correct. Therefore, even if the source information is described, it is possible to judge whether it is correct or not, and if it is incorrect, turn on the flag F (M) 3.

次にブログサーバ1はステップS318で、第Mの引用箇所について、文字属性を判定する。これは引用箇所が、本文と明確に区別されて記載されているか否かの判定である。例えば文字サイズやフォント、色等の文字属性が、引用箇所と本文とで明確に区別されて異なっているか否かを確認する。
そしてブログサーバ1は、明確な区別が認められなければステップS319からS320に進んでフラグF(M)4をオンとし、明確な区別が認められればステップS319からS321に進みフラグF(M)4をオフとする。
つまりフラグF(M)4は、第Mの引用箇所について、引用部分の明確性の点で不適切な引用となっている可能性があることを示すフラグとされる。
Next, in step S318, the blog server 1 determines the character attribute of the Mth quoted portion. This is a judgment as to whether or not the citation is clearly distinguished from the text. For example, it is confirmed whether or not the character attributes such as character size, font, and color are clearly distinguished between the quoted part and the text.
If the distinction is not recognized, the blog server 1 proceeds from step S319 to S320 to turn on the flag F (M) 4, and if the distinction is recognized, proceeds from step S319 to S321 and flags F (M) 4. To turn off.
That is, the flag F (M) 4 is a flag that indicates that the M-th quoted portion may be inappropriately quoted in terms of clarity of the quoted portion.

なお、本文と引用箇所の明確な区別は、文字サイズ、フォント、色のいずれかで行われることを要するものではない。例えば引用部分が枠で囲われているようにしたり、インデントによる文字の配置の違い、レイアウトなどによっても明確な区別は可能である。そこで文字属性に限らず、他の表示態様も考慮して判定するとよい。   It should be noted that the clear distinction between the text and the quoted part does not need to be made in any of the character size, font, and color. For example, it is possible to make a clear distinction by enclosing the quoted portion in a frame, different arrangement of characters by indentation, and layout. Therefore, not only the character attribute but also other display modes may be considered for the determination.

第Mの引用箇所がテキストデータである場合は、以上の処理を行った後、ステップS330で、最後の引用箇所まで処理を終えたか否かを判定し、終えていなければ次の引用箇所について第2引用適否判定を行うためステップS331で変数MをインクリメントしてステップS303に戻る。   If the Mth quoted portion is text data, after performing the above processing, it is determined in step S330 whether or not the processing has been completed up to the last quoted portion. 2 In order to determine whether or not the quotation is appropriate, the variable M is incremented in step S331, and the process returns to step S303.

第Mの引用箇所が画像データであってステップS320に進んだ場合は、ブログサーバ1は、生成されたブログ記事の総表示面に対する当該引用部分の画像データが占める比率を算出する。
そしてステップS321で、求められた比率が閾値thP以上であるか否かを判定する。適切な引用とするには、コンテンツの本体部分が支配的であり、引用された画像データが従たる位置づけであることが望ましいと考えられる。閾値thPはこのような関係を満たしているか否かを判定する閾値であり、適切な比率が設定される。
When the M-th quoted portion is image data and the process proceeds to step S320, the blog server 1 calculates the ratio of the image data of the quoted portion to the total display surface of the generated blog article.
Then, in step S321, it is determined whether the obtained ratio is equal to or more than the threshold value thP. For proper citation, it is considered desirable that the main body part of the content is dominant and the cited image data is in a subordinate position. The threshold value thP is a threshold value for determining whether or not such a relationship is satisfied, and an appropriate ratio is set.

ブログサーバ1は、求められた比率が閾値thP以上であれば、ステップS322に進みフラグF(M)2をオンとし、求められた比率が閾値thP以上でなければ、ステップS323に進みフラグF(M)2をオフとする。即ちテキストの場合と同じく、本文と引用部分の量的な関係で不適切な引用となっている可能性があることを示すフラグの制御を行う。   If the calculated ratio is greater than or equal to the threshold value thP, the blog server 1 proceeds to step S322 to turn on the flag F (M) 2. If the calculated ratio is not greater than or equal to the threshold value thP, proceeds to step S323 and proceeds to flag F ( M) Turn 2 off. That is, as in the case of text, a flag indicating that the text may be inappropriately quoted due to the quantitative relationship between the text and the quoted portion is controlled.

次にブログサーバ1はステップS324で、第Mの引用箇所について、出典情報の記載を確認する。
そしてブログサーバ1は、アップロードしようとするブログ記事に第Mの引用箇所について出典情報が記載されていなければ、ステップS325からS326に進んでフラグF(M)3をオンとし、出典情報が記載されていればステップS325からS327に進みフラグF(M)3をオフとする。
つまりテキストの場合と同様に、出典情報の記載の点で不適切な引用となっている可能性があることを示すフラグの制御を行う。
なおこの場合も、ブログサーバ1は第Mの引用箇所について出典情報が記載されている場合に、それが正しいか否かを判定し、誤った記載となっている場合はフラグF(M)3をオンとすることが考えられる。
Next, in step S324, the blog server 1 confirms the description of the source information for the Mth quoted portion.
If the blog article to be uploaded does not include the source information about the Mth quoted portion, the blog server 1 proceeds from step S325 to step S326, turns on the flag F (M) 3, and the source information is described. If so, the process proceeds from step S325 to S327, and the flag F (M) 3 is turned off.
That is, as in the case of the text, the flag indicating that the citation may be inappropriate in terms of the description of the source information is controlled.
Also in this case, the blog server 1 determines whether the citation information about the Mth quoted portion is correct or not, and if it is incorrect, the flag F (M) 3. It is possible to turn on.

第Mの引用箇所が画像データである場合は、以上の処理を行った後、ステップS330で、最後の引用箇所まで処理を終えたか否かを判定し、終えていなければ次の引用箇所について第2引用適否判定を行うためステップS331で変数MをインクリメントしてステップS303に戻る。   If the M-th quoted portion is image data, after performing the above processing, it is determined in step S330 whether or not the processing has been completed up to the last quoted portion. 2 In order to determine whether or not the quotation is appropriate, the variable M is incremented in step S331, and the process returns to step S303.

ブログサーバ1は、Mmax個の引用箇所について以上の処理を終えたら図9の処理、即ち図6のステップS110の第2引用適否判定を終える。   The blog server 1 finishes the processing of FIG. 9, that is, the second quotation adequacy determination in step S110 of FIG.

図6のステップS111ではブログサーバ1は、第1、第2引用適否判定の結果を用いて注意喚起の要否を判定する。
例えば以上の第1、第2引用適否判定によれば、コピーフラグF(M)1、引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4が設定されている。
特にアップロード時点では、コピーフラグF(M)1がオンとされた引用箇所について第2引用適否判定でフラグF(M)2、フラグF(M)3、フラグF(M)4が設定されるため、ステップS111の時点では、引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4を確認することが考えられる。
In step S111 of FIG. 6, the blog server 1 determines whether or not attention is required by using the results of the first and second citation appropriateness determinations.
For example, according to the first and second citation suitability determinations described above, the copy flag F (M) 1, the citation / reproduction flag F (M) it, the flag F (M) 2, the flag F (M) 3, the flag F ( M) 4 is set.
In particular, at the time of uploading, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4 are set in the second quotation adequacy determination for the quotation portion for which the copy flag F (M) 1 is turned on. Therefore, at the time of step S111, it is possible to confirm the citation / reprint flag F (M) it, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4.

例えば引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4のうちで1つでも“1”となっていたら、注意喚起要と判定する。
引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4が全て“0”となっていたら、注意喚起不要と判定する。
For example, if even one of the citation / reproduction flag F (M) it, flag F (M) 2, flag F (M) 3, and flag F (M) 4 is "1", it is determined that attention is required. To do.
If the quotation / reproduction flag F (M) it, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4 are all "0", it is determined that no attention is required.

注意喚起不要と判定した場合は、ブログサーバ1はステップS112からS113に進んでアップロード処理に移行する。つまりアップロード要求に応じて通常にブログ記事のアップロードを完了させる。
一方、注意喚起要と判定した場合は、ブログサーバ1はステップS112からS120に進み、注意喚起処理を行う。例えばユーザ端末5において図5に示したような注意喚起表示が実行されるように制御する。
When it is determined that attention is not required, the blog server 1 proceeds from step S112 to S113 and shifts to upload processing. That is, the upload of the blog article is normally completed in response to the upload request.
On the other hand, if it is determined that the reminder is required, the blog server 1 proceeds from step S112 to step S120 and performs the reminder process. For example, the user terminal 5 is controlled to execute the alerting display as shown in FIG.

注意喚起処理の具体例を図10に示す。
ブログサーバ1はステップS401で変数M=1とする。
ステップS402でブログサーバ1は第Mの引用箇所のフラグを確認する。例えば引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4を確認する。
FIG. 10 shows a specific example of the alerting process.
The blog server 1 sets the variable M = 1 in step S401.
In step S402, the blog server 1 confirms the flag of the Mth quoted portion. For example, the citation / reproduction flag F (M) it, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4 are confirmed.

ステップS403では、上記のフラグの判定から、第Mの引用箇所についての注意喚起が必要であるか否かを確認する。
引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4の全てが“0”であれば、その第Mの引用箇所についての注意喚起は不要である。
なお、第1引用適否判定で引用箇所とされたが、第2引用適否判定で存在していないとされた引用箇所については、図9のステップS329でフラグがクリアされるため、注意喚起の対象とはならない。
In step S403, it is confirmed from the above flag determination whether or not attention is required for the M-th quoted portion.
If all of the citation / reproduction flag F (M) it, flag F (M) 2, flag F (M) 3, and flag F (M) 4 are "0", a warning about the Mth quoted part is issued. Is unnecessary.
It should be noted that, for the citation portion that was determined to be the citation portion in the first citation appropriateness determination, but is not present in the second citation appropriateness determination, the flag is cleared in step S329 of FIG. Does not mean

一方、第Mの引用箇所について注意喚起不要とされなければ、ブログサーバ1はステップS404で、注意喚起内容を設定する。これは、“1”とされているフラグに応じて設定すればよい。
引用/転載フラグF(M)it=1である場合は、転載の可能性があることを示す内容を含む注意喚起を行うようにする。当該箇所の削除を薦めるメッセージを含むようにしてもよい。
フラグF(M)2=1であるときは、引用部分がコンテンツ内で従たる位置づけになっていないことを知らせる内容を含む注意喚起を行うようにする。引用部分の削除や文字数の削減を行うことを薦めるメッセージ、或いは本文を増加させることを薦めるメッセージを含むようにしてもよい。
フラグF(M)3=1であるときは、引用部分についての出典明示が無い(又は記載が誤っている可能性がある)ことを知らせる内容を含む注意喚起を行うようにする。
出典情報を提示するようにしてもよい。
フラグF(M)4=1であるときは、引用部分が本文と明確に区別されていないことを知らせる内容を含む注意喚起を行うようにする。区別のための手法、例えば文字属性の変更などを教える通知を含むようにしてもよい。
On the other hand, if the warning is not required for the M-th quoted portion, the blog server 1 sets the warning content in step S404. This may be set according to the flag set to "1".
When the quotation / reprint flag F (M) it = 1, the attention including the content indicating the possibility of reprint is issued. You may make it include the message which recommends deletion of the said part.
When the flag F (M) 2 = 1, the attention is included including the content notifying that the quoted portion is not subordinate in the content. A message recommending deletion of quoted parts or reduction of the number of characters, or a message recommending increasing the text may be included.
When the flag F (M) 3 = 1, the attention including the content notifying that the citation portion is not clearly stated (or the description may be incorrect) is issued.
Source information may be presented.
When the flag F (M) 4 = 1, the attention including the content notifying that the quoted portion is not clearly distinguished from the text is issued. A notification for teaching a method for distinction, for example, a change of character attribute may be included.

このようにフラグに応じて注意喚起内容を設定する。例えばメッセージ内容を設定する。もちろん複数のフラグにより複合的なメッセージを生成してもよい。   In this way, the attention content is set according to the flag. For example, message contents are set. Of course, a composite message may be generated by using a plurality of flags.

ステップS405でブログサーバ1はM≧Mmaxであるか否かを確認し、M≧MmaxでなければステップS406で変数MをインクリメントしてステップS402に戻る。つまり、次の引用箇所についての注意喚起の設定処理に移る。
ブログサーバ1は最後の引用箇所まで処理を終えたか時点でステップS405からS407に移り、注意喚起制御を行う。つまりユーザ端末5に対して、ステップS404で設定した内容の注意喚起が行われるように制御する。
In step S405, the blog server 1 confirms whether or not M ≧ Mmax. If M ≧ Mmax, the variable M is incremented in step S406 and the process returns to step S402. That is, the process moves to the setting process for calling attention to the next quoted part.
The blog server 1 moves from step S405 to step S407 at the time when the process has been completed up to the last quoted portion, and performs attention control. That is, the user terminal 5 is controlled so that the content set in step S404 is alerted.

このような注意喚起により、ユーザは著作権侵害の可能性がある箇所を認識でき、必要な修正を行って再度アップロード要求を行えばよいことになる。
ユーザにとっては、不注意、もしくは引用に関する知識の不足によって、知らないうちに著作権侵害となる可能性を生じさせることが未然に防止されることになる。
With such a reminder, the user can recognize the place where there is a possibility of copyright infringement, make the necessary corrections, and issue the upload request again.
For the user, carelessness or lack of knowledge about quoting prevents the possibility of copyright infringement without knowing it.

なお、以上の第1の実施の形態では、コピー元が発見できなかった場合は引用ではないと判定している、ペースト箇所については、「引用でしたら出典記載してください」等の注意喚起を行うことも考えられる。 In the first embodiment described above, if the copy source cannot be found, it is determined that it is not a quotation. However , regarding the pasted part, a caution such as "please enter the source if it is a quotation" It is also possible to do.

またアップロード要求の際には第2引用適否判定が行われるが、これは、既に見つけられている引用箇所についてのフラグ設定処理であり、さほど時間のかかる処理ではない。比較的時間のかかる第1引用適否判定はブログ作成中に行われている。従ってユーザがアップロード要求を行った後に、長い待ち時間を生じさせるようなものとはならない。従ってユーザの使用性を悪化させずに適切な注意喚起は可能となる。
また、第2引用適否判定は、最終的にアップロード時点のブログ記事に残されている引用箇所のみについて判定を行えば良く、無駄な判定は不要である。この点もアップロード要求時の迅速な処理の要請に適している。
また第1引用適否判定は、ブログ記事作成中に行われるため、さほどの迅速性は要求されない。これはコピー元の発見に有利であると共に、ブログサーバ1の処理負担を逼迫させないという点で好適となる。
In addition, when the upload request is made, the second quotation adequacy determination is performed, but this is a flag setting process for the already-quoted citation portion, and is not a process that takes much time. The first citation suitability determination, which takes a relatively long time, is performed during the creation of the blog. Therefore, it does not cause a long waiting time after the user makes an upload request. Therefore, it is possible to appropriately call the attention without deteriorating the usability of the user.
Further, the second quotation adequacy determination may be made only for the quotation part left in the blog article at the time of the final upload, and unnecessary determination is unnecessary. This point is also suitable for requesting prompt processing at the time of upload request.
Further, the first quotation adequacy determination is performed while the blog article is being created, so that it is not required to be so prompt. This is advantageous in that the copy source can be found and the processing load on the blog server 1 is not tightened.

<4.第2の実施の形態>
第2の実施の形態のブログサーバ1の処理を図11で説明する。なお図11において図6と同一の処理については同一符号を付し、重複説明を避ける。
図11において図6の処理と異なるのは、ブログサーバ1(判定機会検出部12)の処理としてステップS105、S130〜S134が行われる点である。
<4. Second Embodiment>
The processing of the blog server 1 according to the second embodiment will be described with reference to FIG. In FIG. 11, the same processes as those in FIG. 6 are designated by the same reference numerals to avoid redundant description.
11 is different from the process of FIG. 6 in that steps S105 and S130 to S134 are performed as the process of the blog server 1 (determination opportunity detection unit 12).

ますペースト操作が検出された場合、ブログサーバ1の処理はステップS130からS134に進み、ペーストされた部分がテキストデータであって所定文字数未満であるか否かが判定される。所定文字数とは、例えば10文字など、少ない文字数に設定されている。これは、通常、引用とは考えにくい場合の文字数の判断に用いるように設定される。
そして所定文字数以上の場合に、ステップS106に進むようにている。
つまり、もし、ペーストした部分が所定文字数未満のテキストデータの場合は、引用ではない(引用の可能性はきわめて小さい)として、ステップS106の第1引用適否判定の処理には進まないようにしている。
If more paste operations are detected, the process of the blog server 1 proceeds from step S130 to step S134, and it is determined whether the pasted part is text data and is less than the predetermined number of characters. The predetermined number of characters is set to a small number of characters such as 10 characters. This is usually set to be used for determining the number of characters when it is unlikely to be quoted.
When the number of characters is equal to or more than the predetermined number, the process proceeds to step S106.
In other words, if the pasted part is text data having less than the predetermined number of characters, it is determined that it is not a citation (the possibility of citation is very small), and the process of the first citation appropriateness determination in step S106 is not proceeded. .

このようにすることで、操作頻度が高いと考えられるコピー&ペーストの操作の全てに反応して第1引用適否判定が実行されることを防ぐ。即ち引用の可能性がきわめて低い場合に第1引用適否判定に進むことでブログサーバ1の処理負担が過剰にならないようにしている。
なお、以上の処理は、図7のステップS206と同じ趣旨の処理であり、そもそも第1引用適否判定に入る条件としてペーストした文字数を判定するか否かの違いである。このステップS134の処理を採用する場合、図7のステップS206は不要となる。
By doing so, it is possible to prevent the first citation appropriateness determination from being executed in response to all the copy and paste operations that are considered to be frequently performed. That is, when the possibility of citation is extremely low, the processing load of the blog server 1 is prevented from becoming excessive by proceeding to the first citation appropriateness determination.
Note that the above processing is the same as that of step S206 in FIG. 7, and the difference is whether or not to determine the number of pasted characters as a condition for entering the first quotation adequacy determination. When the process of step S134 is adopted, step S206 of FIG. 7 is unnecessary.

またこの図11では、ペースト操作の検出以外でも第1引用適否判定が行われる場合があるようにしている。
ステップS130でブログサーバ1は、ブログ作成としてユーザによって入力されているテキストデータが所定量進行したか否か判定している。これは、例えば前回のステップS132の判定後に、未判定のテキスト量が所定量以上入力されたか否かを判定する。
所定量とは、厳密に文字数のみで判定するのではなく、所定量の文字数以上であって、文章として1以上の段落、改行、行空けなどで区切られた範囲の入力があったか否かを判断すると良い。
Further, in FIG. 11, the first quotation adequacy determination may be performed in some cases other than the detection of the paste operation.
In step S130, the blog server 1 determines whether the text data input by the user for creating the blog has progressed by a predetermined amount. For example, it is determined whether or not the undetermined amount of text has been input by a predetermined amount or more after the determination of the previous step S132.
The predetermined amount is not strictly determined only by the number of characters, but it is determined whether or not the number of characters is equal to or more than a predetermined amount, and there is an input in a range delimited by one or more paragraphs, line breaks, line breaks, etc. as a sentence. Good to do.

このような条件が満たされた場合、ブログサーバ1はステップS131に進んで、その新たに入力された部分のテキストデータを判定用に取得し、ステップS132で自己文章判定を行う。
これは、当該入力されたテキストデータが、そのユーザ自身の文章と推定できるか否かを判定するものである。
例えば当該ユーザの他のブログ記事、或いは作成中の他の部分の文章について文体解析を行っておき、当該ユーザの文章の癖・傾向を把握しておく。これは各ブロガーについて予め行っておいても良い。そしてステップS132では、新たに入力された部分について、同様の解析を行い、文章の癖・傾向を判定する。そして、それらを比較することで、今回入力された部分が、当該ブロガーが自身で発した文章であるか否かを推定する。
When such a condition is satisfied, the blog server 1 proceeds to step S131, acquires the text data of the newly input portion for determination, and performs self-sentence determination in step S132.
This is to determine whether or not the input text data can be estimated as the user's own text.
For example, stylistic analysis is performed on another blog article of the user or the text of another portion being created, and the habit / propensity of the text of the user is grasped. This may be done in advance for each blogger. Then, in step S132, similar analysis is performed on the newly input portion to determine the habit / propensity of the sentence. Then, by comparing them, it is estimated whether or not the part input this time is a sentence that the blogger has uttered himself.

文章の癖や傾向を判定する要素としては、例えば多用するワード、句読点の癖(挿入頻度)、絵文字等の使用の傾向(使用の多寡)、特定の記号(「?」「!」等)の使用頻度、一文の長さ、体言止め等の特定の文体の使用頻度、改行の頻度、「です・ます」調と「である」調の使用傾向、外国語や外国文字の混入の頻度、などが考えられる。これらの点をそれぞれ数値化して比較し、類似性を判定する。そして類似性が確認できれば、ユーザ本人が創作した文章であると推定する。   As elements for determining a habit or tendency of a sentence, for example, frequently used words, punctuation habits (insertion frequency), tendency of using pictograms (frequency of use), specific symbols (“?” “!”, Etc.) Frequency of use, length of one sentence, frequency of use of specific styles such as stylization, frequency of line breaks, tendency to use "do-masu" and "is" key, frequency of mixing foreign languages and characters, etc. Can be considered. These points are digitized and compared to determine the similarity. If the similarity can be confirmed, it is estimated that the sentence is created by the user himself.

ブログ記事作成中のユーザ本人が考えた文章であると推定される場合は、ブログサーバ1はステップS133で自己文章と判定し、ステップS103に戻る。もしユーザ本人が考えた文章であると推定されない場合は、ブログサーバ1はステップS106に進み、当該箇所について第1引用適否判定を行う。
つまり、ブログ記事作成中のテキストデータについて、文体の特徴が異なる部分を検出した場合、当該部分の判定機会と検出して第1引用適否判定を行うものである。
When the blog server 1 is estimated to be a sentence thought by the user who is creating the blog article, the blog server 1 determines that the sentence is a self-sentence in step S133, and returns to step S103. If it is not estimated that the sentence was thought by the user himself, the blog server 1 proceeds to step S106 to make a first citation suitability determination for the portion.
That is, in the text data in which the blog article is being created, when a portion having different style characteristics is detected, it is detected as a determination opportunity of the portion, and the first citation appropriateness determination is performed.

以上のように第2の実施の形態では、第1引用適否判定の処理を行うための判定機会の検出手法が第1の実施の形態と異なる。
これにより、ペースト処理に過剰に反応しないようにできる。
また、ペースト以外で他人の文章を引用するような場合にも引用適否判定の処理を適用できることになる。
As described above, the second embodiment is different from the first embodiment in the method of detecting the determination opportunity for performing the processing of the first quotation adequacy determination.
As a result, it is possible to prevent the paste processing from excessively reacting.
Further, the quoting adequacy determination process can be applied to a case where a person's text is cited by means other than paste.

<5.第3の実施の形態>
第3の実施の形態の処理を図12で説明する。これは図3に示した引用通知部16の機能を加えた処理例である。
図12は、図4のアップロード(S14,S27)の後の処理として、ユーザ端末5、ブログサーバ1、及び引用元となったウェブページの管理者のユーザ端末(区別のため「ユーザ端末5A」と表記する)の処理及び通信を示している。
<5. Third Embodiment>
The processing of the third embodiment will be described with reference to FIG. This is an example of processing in which the function of the quotation notification unit 16 shown in FIG. 3 is added.
FIG. 12 shows the user terminal 5, the blog server 1, and the user terminal of the administrator of the web page that is the source of the quotation (“user terminal 5A” for distinction) as processing after the upload (S14, S27) of FIG. (Denoted as)) and communication.

ブログサーバ1はステップS27でアップロード処理を完了したら、ステップS28で、今回アップロードしたブログ記事に引用箇所があったか否かを確認する。
引用箇所がないブログ記事の場合は、ステップS35に進んで、当該ブログ記事を公開対象とする。
After completing the upload process in step S27, the blog server 1 confirms in step S28 whether or not the blog article uploaded this time includes a quoted portion.
If the blog article does not have a quoted portion, the process proceeds to step S35, and the blog article is made public.

引用箇所があった場合、ブログサーバ1はステップS29に進んで、通知条件を判定する。例えば第1,第2引用適否判定の処理の結果から、引用の適法性が高いか否かを通知条件として判定し、適法性が高いということに該当しない場合は引用元に通知を行うものとする。   If there is a quoted portion, the blog server 1 proceeds to step S29 to determine the notification condition. For example, from the results of the first and second citation appropriateness determination processing, it is determined whether or not the legality of the citation is high as a notification condition, and if it does not correspond to the high legality, the citation source is notified. To do.

例えば引用の適法性が高い場合は、通知不要とし、ブログサーバ1はステップS30からS35に進むが、それに該当しない場合、ステップS31に進んで、引用元のウェブページの管理者に対して通知処理を行う。例えばユーザ端末5Aにおいて引用箇所を明示して引用が行われたことを、引用元のユーザに提示する。またそれに対して許可/不許可の回答を求めるようにする。ユーザ端末5Aにおいては、ステップS51でこれらの内容が表示される。   For example, if the legality of the citation is high, the notification is unnecessary, and the blog server 1 proceeds from step S30 to S35. If not, the procedure proceeds to step S31 to notify the administrator of the web page of the citation source. I do. For example, the fact that the quotation is specified on the user terminal 5A is presented to the user who is the source of the quotation. Also, ask for a response of permission / non-permission. On the user terminal 5A, these contents are displayed in step S51.

引用元のユーザが回答を行った場合(S52)、ブログサーバ1はステップS32で回答を確認し、公開許可の回答が得られたか否かを判定する。
なお、引用元のユーザからの回答が得られない場合もある。ブログサーバ1はある程度の期間を経ても回答が得られない場合は、公開禁止がされなかったとみなしてもよい。なぜなら、そもそもアップロードしたブログ記事は、第1、第2引用適否判定を経て、また場合によっては注意喚起処理を経ており、これらをクリアして、ある程度の適法性が担保されたものと言えるためである。
なお、もちろん引用元のユーザからの回答が得られない限り、公開はされないような運用を行ってもよい。
When the quoting source user makes an answer (S52), the blog server 1 confirms the answer in step S32, and determines whether or not the disclosure permission is obtained.
In some cases, the reply from the quoting user may not be obtained. If the blog server 1 does not receive an answer after a certain period of time, it may be considered that the disclosure is not prohibited. This is because the blog article that was originally uploaded has undergone the first and second citation appropriateness determinations, and in some cases, has undergone a warning process, and it can be said that the legality to some extent has been secured by clearing these. is there.
It should be noted that, of course, the operation may not be made public unless an answer is obtained from the quoting user.

公開許可となった場合は、ブログサーバ1はステップS33からS35に進む。一方、公開許可とならなかった場合は、ブログサーバ1はステップS34に進み、ブログ記事作成を行ったユーザのユーザ端末5に対して、修正通知を送信する。この際、引用箇所の削除や適切なクレジット表示などを促すことができる。
ユーザ端末5では修正通知が表示される(S15)。その後、ユーザはそれに応じて例えば引用箇所の削除などの修正を行い(S16)、再度アップロードすればよい。
When the publication is permitted, the blog server 1 proceeds from step S33 to S35. On the other hand, when the publication is not permitted, the blog server 1 proceeds to step S34, and sends a correction notice to the user terminal 5 of the user who created the blog article. At this time, it is possible to urge the deletion of quoted parts and the appropriate display of credits.
A correction notice is displayed on the user terminal 5 (S15). After that, the user may make corrections such as deletion of quoted portions accordingly (S16) and upload again.

このように引用箇所の出典元が他のブログ記事等のウェブページであった場合に、引用元のユーザに引用が行われた旨を通知することで、引用元のユーザは引用状況を確認できる。
また引用元ユーザに引用箇所の使用可否を問い合わせ、不許可の場合はブログ記事作成を行ったユーザに通知し修正を求めることで、ユーザ間のトラブルも未然に防ぐことができる。
In this way, when the source of the quoted portion is a web page such as another blog article, by notifying the quoting user that the citation has been made, the quoting source user can confirm the citation status. .
Further, by asking the quoting source user whether or not the quoted portion can be used, and if the quoting portion is not permitted, the user who created the blog article is notified and correction is requested, whereby troubles between users can be prevented.

<7.まとめ及び変形例>
以上の実施の形態では次のような効果が得られる。
ブログサーバ1は、ユーザ端末5におけるブログ記事(コンテンツ)作成中に引用に関する判定機会が発生したことを検出する判定機会検出部12と、判定機会検出部12により判定機会が検出されたことに応じて、ブログ記事作成中に、ユーザ端末5における閲覧履歴情報を用いた引用適否判定を行う第1引用適否判定部13と、ユーザ端末5からのブログ記事のアップロード要求のタイミングで、設定された判定基準を用いて引用適否判定を行う第2引用適否判定部14と、第1引用適否判定と第2引用適否判定の結果に応じて、ユーザ端末5において注意喚起表示を実行させる処理を行う注意喚起部15を備える。
例えば作成中のブログ記事内に他のコンテンツのテキストデータや画像データをペーストしたような場合、ユーザは、それを適切な引用として信じて行う場合もあれば、著作権等に無関心で何も気にせずに行う場合もある。また、実際に合法的な引用となっているか否かは判断が難しく、或いは判定できないことも多い。そのような場合、アップロードされて公開されたブログ記事は著作権侵害リスクを負うことになる。
本実施の形態の処理によれば、このようなリスクが生じる場合に、アップロードの段階でユーザ(ブロガー)に警告、注意喚起でき、リスクのあるブログ記事の公開を未然に防ぐことができる。
またこのような注意喚起が行われることで、善意のユーザがある程度自由かつ安心してブログ作成を行う環境が提供できることにもなる。
そして特に第1引用適否判定は、ユーザのブログ作成中に行うようにしている。第1引用適否判定では、閲覧履歴を用いて、ユーザが閲覧したウェブページにおいて、同内容のテキストデータや画像データが存在するかを確認していく処理を行い、コピー元(出典元)を探索する。この探索はある程度処理時間がかかる可能性があるが、ブログ作成中に行うことで、その時間をユーザに感じさせないようにすることができる。換言すれば、アップロード時にこのような処理を行うと、当該判定を含むアップロード時間が長時間化し、ユーザにとって利便性の悪いものとなるが、そのような事態を生じさせないことになる。
また、第1引用適否判定では、膨大なウェブサイトをクローリングするのではなく、ユーザの操作履歴/履歴情報を用いて特定のウェブサイトを対象とすることで、処理負担は著しく低減されつつ、引用元を発見できる可能性は高いものとなる。
また第2引用適否判定は、アップロード操作時点(ユーザがブログ完成と認識した時点)で行うことで、適法な引用の要件の1つである、当該ブログ記事内での本文と引用部分の量的な関係を正しく判断できる。換言すれば、ユーザが本文を書き進めること等に応じて何度も量的な関係を判断し直す必要はないため無駄な処理が起こらないことになる。
また注意喚起は、アップロード操作時点(ユーザがブログ完成と認識した時点)で行うことで、作成中にむやみな指示が行われない。例えばユーザは一旦ペーストしたとしても、それをそのまま用いずに、削除したり、編集して全く異なる文章にしたりして、引用とは無関係になる場合も多い。そのため都度注意喚起していくと、ユーザが「これから直そうと思っていたのに・・・」等の気持ちをおこさせる状況にもなり、快適なブログ作成環境ではなくなってしまう恐れがある。このような過度あるいは無用の注意喚起を行わないことで、ユーザに使用性のよいブログ作成環境を提供できる。
以上により実施の形態では、ユーザに快適なブログ作成環境を提供しながら、不適切な引用がされたブログが公開されないようにアシストすることができる。
<7. Summary and Modifications>
In the above embodiment, the following effects can be obtained.
The blog server 1 responds to the determination opportunity detection unit 12 that detects that a determination opportunity regarding citation has occurred during the creation of a blog article (content) in the user terminal 5, and that the determination opportunity detection unit 12 detects the determination opportunity. While the blog article is being created, the first citation appropriateness determination unit 13 that determines whether or not the citation is appropriate using the browsing history information in the user terminal 5, and the determination set at the timing of the blog article upload request from the user terminal 5. A second citation appropriateness determination unit 14 that makes a citation appropriateness determination using a criterion, and an alert that performs a process of executing an alert display in the user terminal 5 according to the results of the first citation appropriateness determination and the second citation appropriateness determination The unit 15 is provided.
For example, when text data or image data of other content is pasted into the blog article being created, the user may believe it as a proper citation, or may be indifferent to copyright etc. It may be done without doing it. Moreover, it is often difficult or impossible to judge whether or not the quote is actually legal. In such cases, the uploaded and published blog posts carry the risk of copyright infringement.
According to the processing of the present embodiment, when such a risk occurs, it is possible to warn the user (blogger) at the stage of uploading and warn the user, and it is possible to prevent the publication of a risky blog article.
In addition, such an alert can provide an environment in which a well-meaning user can create a blog with some freedom and peace of mind.
Then, in particular, the first quotation propriety determination is performed while the user's blog is being created. In the first citation suitability determination, a process of checking whether or not text data or image data having the same content exists in the web page browsed by the user by using the browsing history, and searches for the copy source (source). To do. This search may take a certain amount of processing time, but by performing it while the blog is being created, it is possible to prevent the user from feeling the time. In other words, if such a process is performed at the time of uploading, the uploading time including the determination becomes long and inconvenient for the user, but such a situation will not occur.
Further, in the first quotation propriety judgment, rather than crawling a huge website, by targeting a specific website by using the operation history / history information of the user, the processing load is significantly reduced, and the quotation is performed. The chance of discovering the origin is high.
The second quotation propriety determination is performed at the time of the upload operation (at the time when the user recognizes that the blog is completed), and is one of the requirements for legal quotation. Can correctly judge the relationship. In other words, since the user does not need to repeatedly judge the quantitative relationship in response to the text being written, the wasteful processing will not occur.
Also, the alert is issued at the time of the upload operation (when the user recognizes that the blog is completed), so that no unnecessary instruction is given during the creation. For example, even if the user once pastes it, he or she does not use it as it is, but deletes it or edits it into a completely different sentence, so that it is often unrelated to the citation. Therefore, if the user is alerted each time, the situation may cause the user to feel "I thought I should fix it ...", but the blog creation environment may not be comfortable. It is possible to provide the user with a blog creation environment with good usability by avoiding such excessive or unnecessary alerting.
As described above, in the embodiment, it is possible to provide a comfortable blog creation environment to the user and assist the blog with inappropriate quoting from being published.

第1の実施の形態では、ユーザ端末5において、適正な引用とするためのガイド情報を含む注意喚起表示を実行させる例を述べた。例えば出典記載のアシストのための情報、ペースト部分の一部削除やブログ本文の追加等を薦めるメッセージ、出典記載や記載態様などのモデルの提示などである。
ユーザにとっては、例えば適正な引用を意図していたとしても、実際には引用部分の記載態様をどのようにすれば適正なのかどうかはわかりにくいことが多い。そこで、注意喚起の際に、どのようにすれば良いかをガイドすることで、ユーザは容易に必要な修正を施すことができる。これによって、ユーザの作成したブログ記事を無駄にすることなく、引用態様の修正によりアップロードを受け付けることも可能となる。
なお、ユーザが修正しなくとも、例えばユーザの同意を要求したうえで、引用部分の記載態様を自動修正することも考えられる。例えば文字サイズやフォントを変更したり、出店情報を追加したりする。これによってユーザの修正の手間を省くこともできる。
In the first embodiment, the example has been described in which the user terminal 5 executes the alert display including the guide information for making a proper quotation. For example, information for assisting in writing the source, a message recommending deletion of a part of the paste portion, addition of the blog text, etc., and presentation of a model such as the source writing or the writing mode.
For example, even if the user intends to properly quote, it is often difficult to know how to actually describe the quoted part. Therefore, the user can easily make necessary corrections by guiding what to do when calling attention. This makes it possible to accept uploads by modifying the quotation mode without wasting the blog articles created by the user.
It should be noted that even if the user does not revise, it is possible to automatically correct the description mode of the quoted portion after requesting the user's consent. For example, the font size and font are changed, and store opening information is added. This can save the user the trouble of correction.

第1,第2の実施の形態では、作成中のブログ記事においてペースト操作が検出されることで、ペースト部分についての判定機会と検出する例を述べた。
引用部分は通常、テキストデータ又は画像データのコピー&ペースト操作により作成中のコンテンツ内に挿入される。従って、ペースト操作があった場合は、仮に引用が行われたとして第1引用適否判定が行われるようにする。
ペースト操作を検知することで、引用の可能性のある部分について引用判定処理を実行することができ、判定漏れを少なくすることができる。またペースト操作を検知するという容易な処理で、引用の可能性を推定でき、判定機会の検出が容易となる。
なお、一般的な操作として、コピー&ペーストを行った直後に、ペーストされた文章を編集するということも行われる。例えば参考になる文章をコピーしたうえで、それを編集して自分の望みの文章を記述するような場合である。そのような場合には第1引用適否判定は無駄な処理となる可能性がある。そこで、ペースト操作を検出した後、そのペースト部分の編集が行われずに、所定時間経過したり、他の文章の入力に進んだ場合に、例えば図6のステップS105のペースト検出と判定してもよい。これにより無用な処理が発生することを防止できる。
In the first and second embodiments, an example has been described in which the paste operation is detected in the blog article being created, so that the paste operation is detected as a determination opportunity.
The quoted portion is usually inserted into the content being created by a copy and paste operation of text data or image data. Therefore, if there is a paste operation, it is determined that the quotation has been performed and the first quotation adequacy determination is performed.
By detecting the paste operation, the citation determination process can be executed for a portion that may be cited, and omission of the determination can be reduced. In addition, the possibility of citation can be estimated by the simple process of detecting the paste operation, and the determination opportunity can be easily detected.
As a general operation, the pasted sentence may be edited immediately after the copy and paste. For example, you may want to copy a reference text and edit it to describe your desired text. In such a case, the first quotation adequacy determination may be a useless process. Therefore, after the paste operation is detected, if the paste portion is not edited and a predetermined time elapses or input of another sentence is made, even if it is determined that the paste is detected in step S105 of FIG. 6, for example. Good. As a result, it is possible to prevent unnecessary processing from occurring.

第2の実施の形態では、作成中のブログ記事において所定文字数以上のペースト操作が検出されることで、ペースト部分についての判定機会と検出する例を述べた。
コピー&ペーストの操作はユーザによっては文書作成中に頻繁に行われる操作であり、また少数の文字のペースト操作も良く行われる。するとペースト操作に応じて第1引用適否判定が行われるのは処理負担を過度に増すことになってしまう。そこで引用とは通常考えにくい少数の文字のペースト操作の場合は、引用と推定せず、無駄な第1引用適否判定が行われないようにする(図11のS134参照)。これによりブログサーバ1の処理負担を軽減することができる。
In the second embodiment, an example has been described in which the paste operation of a predetermined number of characters or more is detected in the blog article being created, and the paste operation is detected as the determination opportunity.
The copy and paste operation is an operation that is frequently performed by a user during document creation, and a paste operation of a small number of characters is often performed. Then, the first quotation adequacy determination is made in accordance with the paste operation, which unnecessarily increases the processing load. Therefore, in the case of a paste operation of a small number of characters, which is normally difficult to think of as a citation, it is not estimated as a citation and the useless first citation appropriateness determination is not performed (see S134 in FIG. 11). This can reduce the processing load on the blog server 1.

第2の実施の形態では、作成中のブログ記事におけるテキストデータについて、文体の特徴が異なる部分を検出した場合、当該部分の判定機会と検出する例を述べた。
つまり言葉遣いの相違などから引用箇所を推定する。例えば、ユーザの過去投稿を参照して、形態素解析によってユーザ文体の特徴を特定し、記事内においてユーザ文体でない箇所を引用箇所とする。
ブログ記事を作成するユーザの文体は、ブログ内である程度統一されている。文章中に、通常とは異なる文体の部分が存在したら、その部分は他人の文章である可能性があると推定できる。そこでこのような場合を引用に関する判定機会とすることで、コピー&ペーストの操作によらない引用部分についても引用適否判定の対象とすることができる(図11のS131からS133参照)。
特に図11の処理のようにコピー&ペーストの操作検知による推定と併用することで、引用の可能性のある部分を高い確率で判定できる。
In the second embodiment, an example has been described in which, in the text data of the blog article that is being created, when a portion having different style characteristics is detected, the portion is detected as a determination opportunity.
In other words, the quoted part is estimated from the difference in wording. For example, referring to the user's past post, the characteristics of the user writing style are specified by morphological analysis, and the portion other than the user writing style in the article is set as the quoted portion.
The style of users who create blog articles is unified to some extent within the blog. If there is a part of the writing style that is different from the usual style in the sentence, it can be inferred that the part may be another person's writing. Therefore, by using such a case as a judgment opportunity regarding citation, it is possible to make a citation appropriateness judgment target even for a citation portion that is not operated by copy and paste (see S131 to S133 in FIG. 11).
In particular, by using together with the estimation based on the operation detection of copy and paste as in the processing of FIG. 11, it is possible to determine a portion having a possibility of being quoted with high probability.

第1の実施の形態では、第1引用適否判定において閲覧履歴情報で示されるウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行う例を述べた。
ブログ記事を執筆するユーザは、作成中、又は作成前に直近まで閲覧していたウェブページから引用を行うことがあると考えられる。そこで引用元の探索のためのクローリングを行う範囲を閲覧履歴に基づいて絞る(図7のS207〜S210参照)。これによりコピー元の探索処理負担が低減される。
In the first embodiment, an example of performing a process of searching the web page data indicated by the browsing history information in the first citation suitability determination and confirming whether or not the same data as the portion estimated as the citation exists Said.
It is considered that a user who writes a blog article may quote from a web page that was being viewed or was being viewed before creation. Therefore, the range of crawling for searching the citation source is narrowed down based on the browsing history (see S207 to S210 in FIG. 7). As a result, the processing load for searching the copy source is reduced.

第1の実施の形態では、第1引用適否判定は、閲覧履歴情報で示されるウェブページデータのうちで、閲覧時刻条件により抽出したウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行う例を述べた。
即ち閲覧履歴情報の全てではなく、例えば直近の所定時間内であるとか、ブログ作成開始後であるとかの閲覧時刻条件に該当するウェブページデータからテキストデータ又は画像データのコピー元を探索する。
ブログ記事に対してコピー&ペーストの操作を行うユーザは、近い時間に閲覧した他のウェブページからテキストデータや画像データをコピーすることが通常である。
特にコピー&ペーストの操作により引用部分を貼り付ける場合、そのコピー操作はブログ記事の作成中に行われることが多いと想定される。
そこで閲覧時刻の条件により、探索するウェブページを選択する(図7のS208参照)。これによりコピー元の探索処理負担をさらに低減しつつ、探索範囲の精度が低下しないようにすることができる。
In the first embodiment, the first citation suitability determination is the same as the location estimated to be a citation by searching the web page data extracted by the browsing time condition in the web page data indicated by the browsing history information. The example of performing the process to confirm whether or not the data exists has been described.
That is, not all of the browsing history information, but the copy source of the text data or the image data is searched for from the web page data corresponding to the browsing time condition such as within the latest predetermined time or after the start of blog creation.
A user who performs a copy & paste operation on a blog article usually copies text data or image data from another web page viewed in a short time.
In particular, when a quoted portion is pasted by a copy and paste operation, it is assumed that the copy operation is often performed during the creation of a blog article.
Therefore, the web page to be searched is selected according to the condition of the browsing time (see S208 in FIG. 7). As a result, it is possible to prevent the accuracy of the search range from lowering while further reducing the load of the search processing of the copy source.

第1の実施の形態では、第2引用適否判定において、判定基準の1つとして、引用箇所の出典を示す情報の有無を判定する例を挙げた。
即ち引用と推定された部分に対して、出典(引用元)が記載されているか否かを確認する。
出典明記は適正な引用の一要素と考えられるため、その有無を判定することで、適正性の要件の1つを担保できる。これによりユーザに適切なガイドを行うことが可能となる(図9のS314,S324参照)。
具体的には、例えば他のウェブページのURL、タイトル等の有無を判定する。
なお、元々ユーザが作成した段階で引用部分に対してURL等が記載されていた場合、出典記載が妥当か否かも判定できる。例えば、記事内に引用箇所とURLとが組み合わせて配置されているが、URLから参照したウェブページに当該引用箇所がなかった場合、出典は妥当ではないと判定することも可能であり、その場合に注意喚起とともに「記載された出典が間違っている可能性があります」等のメッセージ表示を行うことも考えられる。
In the first embodiment, an example of determining the presence or absence of the information indicating the source of the quoted portion is given as one of the determination criteria in the second quotation adequacy determination.
That is, it is confirmed whether or not the source (citation source) is described for the portion estimated to be cited.
Since it is considered that the citation of the source is one element of proper citation, it is possible to guarantee one of the requirements for appropriateness by determining the presence or absence of it. As a result, it is possible to properly guide the user (see S314 and S324 in FIG. 9).
Specifically, for example, it is determined whether or not there is a URL of another web page, a title, or the like.
In addition, when the URL or the like is described for the quoted portion at the stage of the original creation by the user, it can be determined whether or not the citation is valid. For example, if a quoted part and a URL are arranged in combination in an article, but the quoted part is not found in the web page referenced from the URL, it is possible to determine that the source is not valid. In that case It is also possible to display a message such as "The written source may be incorrect" together with the warning.

第1の実施の形態では、第2引用適否判定において、判定基準の1つとして、引用箇所とコンテンツ本文の分量の比率について判定する例を挙げた。
即ち引用と推定された部分と本文の分量を比較する。
引用箇所と本文(当該引用箇所を除いた箇所)の分量の比率(コンテンツ内の主従関係)は適正な引用の判定基準の1つとなると考えられるため、これを判定する(図9のS310、S320参照)。これにより引用が適切か否かの1要素を確認し、ユーザに通知できるようにすることで、ユーザに適切なガイドを行うことが可能となる。
In the first embodiment, an example in which the ratio of the amount of the quoted portion and the content body is determined as one of the determination criteria in the second quotation propriety determination has been described.
That is, the amount of the quoted part and the amount of the text are compared.
It is considered that the ratio (the master-slave relationship in the content) of the amount of the quoted part and the text (the part excluding the quoted part) is one of the appropriate judgment criteria for the quote, and therefore this is judged (S310 and S320 in FIG. 9). reference). Thus, by confirming one element of whether the citation is appropriate and notifying the user, it is possible to provide the user with an appropriate guide.

第1の実施の形態では、第2引用適否判定において、判定基準の1つとして、引用箇所の文字態様とコンテンツ本文の文字態様との異同について判定する例を挙げた。
即ち引用と推定された部分が本文と明確に異なる態様で記載されているかを判定する。
引用箇所が本文(当該引用箇所を除いた箇所)内において明確であることは、適正な引用の判定基準の1つとなると考えられるため、これを判定する(図9のS318参照)。これにより引用が適切か否かの1要素を確認し、ユーザに通知できるようにすることで、ユーザに適切なガイドを行うことが可能となる。
In the first embodiment, an example of determining the difference between the character aspect of the quoted portion and the character aspect of the content body as one of the determination criteria in the second quotation propriety determination has been described.
That is, it is determined whether or not the portion estimated to be cited is described in a manner that is clearly different from the text.
It is considered that one of the appropriate citation determination criteria is that the quoted portion is clear in the text (excluding the quoted portion), so this is determined (see S318 in FIG. 9). Thus, by confirming one element of whether the citation is appropriate and notifying the user, it is possible to provide the user with an appropriate guide.

第3の実施の形態では、引用が行われたことを出典元に通知する処理を行う引用通知部16を備えた場合を述べた。
これにより出典元のユーザは引用状況を確認できる。また出典元のユーザの考えをブログ作成者にフィードバックすることができる。例えば引用元からの許可の回答があった場合は、ブロガーは安心してブログ記事を公表できることになる。また、引用元からの不許可の回答があった場合は、ブロガーはそれに応じた対処(ブログ記事内容の修正など)を行うことができる。
なお出典元のユーザが引用箇所の使用を拒否した場合には、引用を行ったユーザにその旨が通知するとともに引用箇所の削除、適切なクレジット表示などを促すことも可能である。これらの対処により、ユーザ間でのトラブルを未然に防止する機能も果たすことができる。
In the third embodiment, the case has been described in which the citation notifying unit 16 that performs processing for notifying the source that the citation is performed is provided.
This allows the source user to confirm the citation status. In addition, the idea of the source user can be fed back to the blog creator. For example, bloggers can publish their blog posts with peace of mind if they get permission from the source. Also, if there is a disapproval response from the quoting source, the blogger can take appropriate measures (such as correction of blog article contents).
If the source user refuses to use the quoted portion, it is possible to notify the quoting user of the fact and to prompt the user to delete the quoted portion or display an appropriate credit. By these measures, the function of preventing troubles between users can be fulfilled.

実施の形態の処理例は一例であり、他にも各種の変形例が想定される。
第1引用適否判定を行う判定機会の検出や、第2引用適否判定での判定項目は他にも考えられる。
また実施の形態の技術はブログに限らず、テキストや画像(静止画・動画)による各種のコンテンツに適用できる。
The processing example of the embodiment is an example, and various other modified examples are possible.
There are other possible detection items such as the detection of the determination opportunity for the first citation appropriateness determination and the determination items for the second citation appropriateness determination.
Further, the technology of the embodiment is applicable not only to blogs but also to various contents such as texts and images (still images / moving images).

<8.プログラム及び記憶媒体>
実施の形態のプログラムは、ブログサーバ1における少なくとも判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15の処理を情報処理装置(CPU等)に実行させるプログラムである。
<8. Program and storage medium>
The program of the embodiment executes at least the processing of the determination opportunity detection unit 12, the first citation appropriateness determination unit 13, the second citation appropriateness determination unit 14, and the alerting unit 15 in the blog server 1 to the information processing device (CPU or the like). It is a program to let.

実施の形態のプログラムは、端末装置におけるコンテンツ作成中に引用に関する判定機会が発生したことを検出する判定機会検出機能(S105,S130〜S134)と、判定機会検出機能により判定機会が検出されたことに応じて、コンテンツ作成中に端末装置における閲覧履歴情報を用いた引用適否判定を行う第1引用適否判定機能(S106、及び図7,図8)と、端末装置からのコンテンツのアップロード要求のタイミングで設定された判定基準を用いて引用適否判定を行う第2引用適否判定機能(S110、及び図9)と、第1引用適否判定機能による判定結果と第2引用適否判定機能による判定結果に応じて、前記装置において注意喚起表示を実行させる処理を行う注意喚起機能(S120、及び図10)とを情報処理装置に実行させるプログラムである。   The program according to the embodiment includes a determination opportunity detection function (S105, S130 to S134) for detecting that a determination opportunity for citation has occurred during content creation in the terminal device, and a determination opportunity detected by the determination opportunity detection function. According to the first quotation propriety determination function (S106 and FIG. 7, FIG. 8) that determines the quotation propriety using the browsing history information in the terminal device during content creation, and the timing of the content upload request from the terminal device. According to the second quotation propriety determination function (S110 and FIG. 9) for performing the quotation propriety determination using the criterion set in step 1, and the determination result by the first quotation propriety determination function and the second quotation propriety determination function. And a warning function (S120 and FIG. 10) for performing a process of displaying a warning display in the device. Is a program for row.

このようなプログラムにより、上述したブログサーバ1としての1又は複数の情報処理装置を実現できる。
そしてこのようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。あるいはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
With such a program, one or more information processing devices as the blog server 1 described above can be realized.
Then, such a program can be stored in advance in a HDD as a storage medium built in a device such as a computer or a ROM in a microcomputer having a CPU. Alternatively, it can be stored (stored) temporarily or permanently in a removable storage medium such as a semiconductor memory, a memory card, an optical disk, a magneto-optical disk, or a magnetic disk. Further, such a removable storage medium can be provided as so-called package software.
Further, such a program can be installed from a removable storage medium to a personal computer or the like, or can be downloaded from a download site via a network such as a LAN or the Internet.

また、このようなプログラムをアプリケーションプログラムとしてユーザ端末5にインストールされるようにし、ユーザ端末5において上述の処理が実行されるようにしてもよい。即ち実施の形態のブログサーバ1による例えば判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15の処理を、ユーザ端末5にインストールされたアプリケーションプログラムにより実行するようにする。これによりブログ作成中にブログサーバ1との通信を介さずに、使用性のよいブログ作成環境を提供しつつ、不適切な引用がされたブログがアップロードされないようにアシストすることができる。その場合、ユーザ端末5が請求項でいう情報処理装置に該当することにもなる。   Further, such a program may be installed in the user terminal 5 as an application program, and the above-described processing may be executed in the user terminal 5. That is, for example, the processing of the determination opportunity detection unit 12, the first citation appropriateness determination unit 13, the second citation appropriateness determination unit 14, and the alerting unit 15 by the blog server 1 of the embodiment is performed by an application program installed in the user terminal 5. Try to run. This makes it possible to provide a blog creation environment with good usability without intervening with the blog server 1 during blog creation, and to assist in preventing uploading of a blog that is inappropriately quoted. In that case, the user terminal 5 also corresponds to the information processing device in the claims.

1…ブログサーバ、2…ネットワーク、5…ユーザ端末、11…ブログ管理部、12…判定機会検出部、13…第1引用適否判定部、14…第2引用適否判定部、15…注意喚起部、16…引用通知部、51…ブログDB、52…画像DB、53…管理DB   DESCRIPTION OF SYMBOLS 1 ... Blog server, 2 ... Network, 5 ... User terminal, 11 ... Blog management part, 12 ... Judgment opportunity detection part, 13 ... 1st quotation propriety judgment part, 14 ... 2nd quotation propriety judgment part, 15 ... Reminder part , 16 ... Quote notification section, 51 ... Blog DB, 52 ... Image DB, 53 ... Management DB

Claims (9)

端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する判定機会検出部と、
前記判定機会検出部により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定部と、
前記第1引用適否判定部が取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定部と、
前記第1引用適否判定部の判定結果と前記第2引用適否判定部の判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起部と、を備えた
情報処理装置。
By paste operation is detected during content creation in the terminal device, a determination chance detector for detecting a determination opportunities for citing paste portions as determination target has occurred,
In response to detection of the determination opportunity by the determination opportunity detection unit, during the creation of the content , the web page data indicated by the browsing history information in the terminal device is searched and the same as the determination target portion is searched. A first quotation adequacy determining unit that performs, as a source information, information of a web page in which the same data as the determination target portion is present, while performing processing for confirming whether data exists
A process of determining whether or not the source information acquired by the first quotation adequacy determining unit is described in the content; and a ratio of the determination target text amount to the total text amount of the content or a total display surface of the content. A process of determining whether the ratio of the image data of the determination target is equal to or more than a predetermined threshold value, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. A second quotation adequacy determining unit that performs, at the timing of the content upload request from the terminal device ,
An information processing apparatus, comprising: a cautioning unit that performs a process of causing a caution display in the terminal device according to the determination result of the first quotation propriety determination unit and the determination result of the second quotation propriety determination unit.
前記注意喚起部は、
前記第1引用適否判定部によりペースト操作に係るデータ部分が、前記判定対象とされた部分と同一データが存在したウェブページ内のデータの一部とはいえない量であると判定された場合、
前記第2引用適否判定部により、前記出典情報が前記コンテンツに記載されていないと判定された場合、
前記第2引用適否判定部により、前記判定対象とされた部分の割合が前記閾値以上であると判定された場合、又は、
前記第2引用適否判定部により、前記判定対象とされた部分の文字属性が前記コンテンツの前記判定対象以外の本文と異なっていないと判定された場合、
のいずれかに該当することに応じて、それぞれの判定ごとに設定された適正な引用とするためのガイド情報を含む注意喚起のメッセージを作成し前記端末装置に表示させる処理を行う
請求項1に記載の情報処理装置。
The alert part is
When the first quotation adequacy determining unit determines that the data portion related to the paste operation is an amount that cannot be said to be a part of the data in the web page in which the same data as the determination target portion exists,
When the second citation suitability determination unit determines that the source information is not described in the content,
When the second quotation adequacy determining unit determines that the proportion of the determination target portion is equal to or more than the threshold value, or
When the second quotation adequacy determining unit determines that the character attribute of the portion to be determined is not different from the text of the content other than the determination target,
In response to any of the above conditions, a process of creating a caution message including guide information for setting appropriate citations set for each determination and displaying the message on the terminal device is performed. The information processing device described.
前記判定機会検出部は、作成中のコンテンツにおいて所定文字数以上の前記ペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する
請求項1又は請求項2に記載の情報処理装置。
The determining opportunity detecting unit, by a predetermined number or more of the paste operation is detected in the content being created, to claim 1 or claim 2 for detecting that the judgment opportunities for citing paste portions as determination target has occurred The information processing device described.
前記判定機会検出部は、作成中のコンテンツにおいて入力されたテキストデータについての文体解析結果と、前記コンテンツ作成者により作成された他の文章についての文体解析結果とを比較して類似性を判定し、類似性が確認できない場合に、前記入力されたテキストデータの部分を判定対象として引用に関する判定機会が発生したと検出するThe determination opportunity detection unit compares the stylistic analysis results for the text data input in the content being created with the stylistic analysis results for other sentences created by the content creator to determine similarity. When the similarity cannot be confirmed, it is detected that a judgment opportunity regarding citation has occurred by using the input text data portion as a judgment target.
請求項1から請求項3のいずれかに記載の情報処理装置。The information processing apparatus according to any one of claims 1 to 3.
前記第1引用適否判定部は、前記閲覧履歴情報で示されるウェブページデータのうちで、閲覧時刻条件により抽出したウェブページデータを探索して、判定対象とされた部分と同一のデータが存在するか否かを確認する処理を行う
請求項1から請求項4のいずれかに記載の情報処理装置。
The first quotation adequacy determining unit searches the web page data indicated by the browsing history information for the web page data extracted according to the browsing time condition, and the same data as the determination target portion exists. Perform processing to confirm whether or not
The information processing device according to any one of claims 1 to 4 .
前記第1引用適否判定部が取得した前記出典情報を基に、引用が行われたことを出典元に通知する処理を行う引用通知部を備えた
請求項1から請求項5のいずれかに記載の情報処理装置。
Based on the source information acquired by the first quotation adequacy determining unit , a quotation notifying unit is provided for performing a process of notifying the source that the quotation has been performed.
The information processing device according to any one of claims 1 to 5 .
情報処理装置が行う情報処理方法として、
端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する判定機会検出ステップと、
前記判定機会検出ステップにより判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定ステップと、
前記第1引用適否判定ステップにおいて取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定ステップと、
前記第1引用適否判定ステップの判定結果と前記第2引用適否判定ステップの判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起ステップと、
を行う情報処理方法。
As an information processing method performed by the information processing device,
A decision opportunity detecting step of detecting that a paste opportunity is detected during content creation in the terminal device, and that a decision opportunity regarding citation is generated with the paste portion as a determination target ,
In response to the determination opportunity being detected by the determination opportunity detection step , the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content to identify the same as the portion to be determined. A first citation appropriateness determination step of performing, as a source information, information of a web page in which the same data as the determination target portion is present, while performing a process of confirming whether data exists
A process of determining whether or not the source information acquired in the first citation appropriateness determination step is described in the content, and a ratio of the determination target text amount to the total text amount of the content or the total display surface A process of determining whether the ratio of the image data of the determination target is equal to or more than a predetermined threshold value, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. And a second quotation adequacy determination step for performing at the timing of an upload request for the content from the terminal device ,
An alerting step of performing a process of performing an alerting display in the terminal device according to the determination result of the first quotation adequacy determining step and the determination result of the second quotation adequacy determining step;
Information processing method to perform.
端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する判定機会検出機能と、
前記判定機会検出機能により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定機能と、
前記第1引用適否判定機能により取得された前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定機能と、
前記第1引用適否判定機能による判定結果と前記第2引用適否判定機能による判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起機能と、
を情報処理装置に実行させるプログラム。
A decision opportunity detection function that detects that a paste opportunity is detected during content creation in the terminal device and that a decision opportunity regarding citation has occurred with the paste portion as the determination target ,
When the determination opportunity is detected by the determination opportunity detection function , the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content, and the same as the determination target portion is searched. A first citation suitability determination function for performing, as a source information, information of a web page in which the same data as the determination target portion is present, while performing processing for confirming whether data exists
A process of determining whether or not the source information acquired by the first quotation adequacy determining function is described in the content, and a ratio of the text amount of the determination target to the total text amount of the content or a total display surface A process of determining whether the ratio of the image data of the determination target is equal to or greater than a predetermined threshold, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. And a second quotation adequacy determining function for performing at the timing of an upload request for the content from the terminal device ,
An alert function that performs a process of causing an alert display in the terminal device according to the determination result by the first quotation propriety determination function and the determination result by the second quotation propriety determination function;
A program that causes an information processing device to execute.
端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生した検出する判定機会検出機能と、
前記判定機会検出機能により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定機能と、
前記第1引用適否判定機能により取得された前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定機能と、
前記第1引用適否判定機能による判定結果と前記第2引用適否判定機能による判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起機能と、
を情報処理装置に実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
A decision opportunity detection function that detects that a paste opportunity is detected during content creation in the terminal device and that a decision opportunity regarding citation has occurred with the paste portion as the determination target ,
When the determination opportunity is detected by the determination opportunity detection function , the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content, and the same as the determination target portion is searched. A first citation suitability determination function for performing, as a source information, information of a web page in which the same data as the determination target portion is present, while performing processing for confirming whether data exists
A process of determining whether or not the source information acquired by the first quotation adequacy determining function is described in the content, and a ratio of the text amount of the determination target to the total text amount of the content or a total display surface A process of determining whether the ratio of the image data of the determination target is equal to or greater than a predetermined threshold, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. And a second quotation adequacy determining function for performing at the timing of an upload request for the content from the terminal device ,
An alert function that performs a process of causing an alert display in the terminal device according to the determination result by the first quotation propriety determination function and the determination result by the second quotation propriety determination function;
A computer-readable storage medium that stores a program that causes an information processing apparatus to execute.
JP2018140031A 2018-07-26 2018-07-26 Information processing apparatus, information processing method, program, storage medium Active JP6691581B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018140031A JP6691581B2 (en) 2018-07-26 2018-07-26 Information processing apparatus, information processing method, program, storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018140031A JP6691581B2 (en) 2018-07-26 2018-07-26 Information processing apparatus, information processing method, program, storage medium

Publications (2)

Publication Number Publication Date
JP2020017098A JP2020017098A (en) 2020-01-30
JP6691581B2 true JP6691581B2 (en) 2020-04-28

Family

ID=69581513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018140031A Active JP6691581B2 (en) 2018-07-26 2018-07-26 Information processing apparatus, information processing method, program, storage medium

Country Status (1)

Country Link
JP (1) JP6691581B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009096190A1 (en) * 2008-02-01 2009-08-06 Kanazawa Institute Of Technology Quotation judgment supporting device

Also Published As

Publication number Publication date
JP2020017098A (en) 2020-01-30

Similar Documents

Publication Publication Date Title
US10938936B2 (en) Intelligent download of application programs
US10607235B2 (en) Systems and methods for curating content
US8756228B2 (en) Method and apparatus for creating contextualized feeds
US8527905B2 (en) Providing archived web page content in place of current web page content
US8533238B2 (en) Sharing information about a document across a private computer network
US7840648B1 (en) Web-page authoring tool for automatic enrollment in advertising program
JP6238331B2 (en) Providing executable content to computing devices based on user actions
US8290941B2 (en) System and method for detecting changes within search results
US20160275127A1 (en) Systems and methods for presenting content
US11500655B2 (en) Inline and contextual delivery of database content
TW200841244A (en) Managing web page links using structured data
US20160117335A1 (en) Systems and methods for archiving media assets
US10417317B2 (en) Web page profiler
KR101542592B1 (en) Method of Managing Toolbar Button Specialized for Each Domain
JP6691581B2 (en) Information processing apparatus, information processing method, program, storage medium
US20140304583A1 (en) Systems and Methods for Creating Web Pages Based on User Modification of Rich Internet Application Content
US10218673B2 (en) Web content display system and method
JP2006048327A (en) System and method for reporting web page renewal
JP6568282B1 (en) Information display program, information display device, information display method, and distribution device
JP6914898B2 (en) Information display program, information display device, information display method and distribution device
US11531449B2 (en) Information processing device, information processing method, program and storage medium for efficiently managing a browsing time of a window on a browser by another window
WO2014192067A1 (en) Information processing system and information processing method
US20110197137A1 (en) Systems and Methods for Rating Content
CN117171463A (en) Method, apparatus, device and computer readable medium for displaying digital newspaper
KR20060028005A (en) Method for providing bulletin service and system of enabling the method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200410

R150 Certificate of patent or registration of utility model

Ref document number: 6691581

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250