JP6691581B2 - Information processing apparatus, information processing method, program, storage medium - Google Patents
Information processing apparatus, information processing method, program, storage medium Download PDFInfo
- Publication number
- JP6691581B2 JP6691581B2 JP2018140031A JP2018140031A JP6691581B2 JP 6691581 B2 JP6691581 B2 JP 6691581B2 JP 2018140031 A JP2018140031 A JP 2018140031A JP 2018140031 A JP2018140031 A JP 2018140031A JP 6691581 B2 JP6691581 B2 JP 6691581B2
- Authority
- JP
- Japan
- Prior art keywords
- determination
- quotation
- content
- blog
- citation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は情報処理装置、情報処理方法、プログラム、記憶媒体に関し、特にブログを管理するサーバ装置への適用に好適な技術に関する。 The present invention relates to an information processing device, an information processing method, a program, and a storage medium, and particularly to a technique suitable for application to a server device that manages a blog.
インターネットを利用したサービスの1つとしてブログ環境を提供するサービスが知られている。ユーザはブログとしての任意の文章や画像による記事をサーバにアップロードし、当該ユーザの書き込み記事として保存してもらう。保存されたブログは、例えばウェブページの形式で一般に公開される。
多くのユーザは、自己発信のツールとしたり、或いは個人的な日記代わりなどとして、このようなブログサービスを利用している。
A service that provides a blog environment is known as one of services using the Internet. The user uploads an article with an arbitrary text or image as a blog to the server and asks the user to save the article as a written article. Saved blogs are made publicly available, for example in the form of web pages.
Many users use such a blog service as a tool for self-sending or as a personal diary substitute.
なお下記特許文献1,2,3には引用に関する技術が開示されている。
例えば特許文献1には、コピー元の電子文書からコピーしたテキスト列と共に、コピー元の電子文書を特定可能な文献情報を、コピー先の電子文書にペーストすることで引用した場合に引用元を容易に明示できることが示されている。
特許文献2には、操作履歴やコピー元文献情報を記憶し、引用量(率)を算出し、該引用量が所定値以上の場合、コピー文書と判定する技術が記載されている。
特許文献3にはURL(Uniform Resource Locator)を辿り、引用元が正しいか判定することが記載されている。
In addition, the following
For example, in
Patent Document 3 describes that a URL (Uniform Resource Locator) is traced to determine whether the citation source is correct.
ところでブログ等、サービス運営団体以外の一般ユーザが作成し、投稿するようなコンテンツの場合、他のウェブページ等からテキストデータや画像データを引用する場合がある。もちろん適法性のある引用であれば問題ないが、引用としての適法性や著作権侵害に関する判断は一般ユーザには難しいことが多い。このため、特に悪意がないユーザであったとしても、結果として不適切な引用を行ってしまうようなことも起こりえる。
そのためには、厳密に適法な引用であるか否かの判定とまではいかなくとも、著作権侵害リスクを未然に防止するために、コンテンツ作成時に自動的に引用の判定を行うようにすることが望ましい。しかしながら、引用の判定のために、膨大なウェブサイトのデータとの照合や、判定のための処理時間の増大等が生ずることは、ブログサービスシステムとしても、またユーザの使用性としても望ましくない。
By the way, in the case of content created and posted by general users other than service management organizations such as blogs, text data and image data may be quoted from other web pages. Of course, there is no problem if the quotation has legality, but it is often difficult for general users to judge the legality of the quotation and the copyright infringement. Therefore, even if the user has no malicious intent, as a result, inappropriate quoting may occur.
For that purpose, if it is not strictly determined whether it is a legal citation, in order to prevent the risk of copyright infringement, it is necessary to automatically determine the citation when creating the content. Is desirable. However, it is not desirable for the blog service system and the usability for the blog service system and the user to check the quotation with a huge amount of website data and increase the processing time for the determination.
そこで本発明では、ユーザに対して引用に関する適切なガイドを行う場合に、ユーザに判定のための待ち時間の増大等の不便を感じさせず、またシステムの処理負担の著しい増大を伴わないようにすることを目的とする。 Therefore, in the present invention, when the user is properly guided about quoting, the user does not feel inconvenience such as an increase in waiting time for determination, and the processing load of the system is not significantly increased. The purpose is to do.
本発明に係る情報処理装置は、端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生したと検出する判定機会検出部と、前記判定機会検出部により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定部と、前記第1引用適否判定部が取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定部と、前記第1引用適否判定部の判定結果と前記第2引用適否判定部の判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起部とを備える。
コンテンツとは例えばブログ記事などを想定する。このようなコンテンツはユーザが作成してアップロードするものであるが、その作成中に、他のコンテンツのテキストデータや画像データがそのまま含まれることがある。これが引用として適切かどうかの判定はユーザには困難なことが多い。そこで判定機会が検出されたら、第1引用判定として、閲覧履歴情報を用いた判定を行う。またアップロード要求の際に第2引用適否判定として所定の判定基準を用いた判定を行う。これにより引用の適否を判定し、必要に応じてユーザに注意喚起する。
The information processing apparatus according to the present invention includes a determination opportunity detection unit that detects that a paste operation is detected during content creation in a terminal device and that a determination opportunity regarding citation is generated with the paste portion as a determination target; In response to the detection opportunity being detected by the detection unit, the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content, and the same data as the determination target portion exists. A first citation appropriateness determination unit that performs processing for confirming whether or not to perform, and acquires information of a web page in which the same data as the determination target portion exists as source information, and the first citation appropriateness determination A process for determining whether or not the source information acquired by the department is described in the content, and the total text amount of the content A process of determining whether the ratio of the amount of text of the determination target or the ratio of the image data of the determination target to the total display surface is equal to or more than a predetermined threshold, and the character attribute of the text of the determination target is the content of the content. A second quotation propriety determination unit that performs processing for determining whether the text is different from the text other than the determination target at the timing of the upload request for the content from the terminal device , the determination result of the first quotation propriety determination unit, and the The terminal device further includes a caution unit that performs a process of displaying a caution display in the terminal device according to the determination result of the second quotation adequacy determination unit.
The content is assumed to be a blog article, for example. Although such content is created and uploaded by the user, text data and image data of other content may be included as it is during the creation. It is often difficult for the user to determine whether this is appropriate as a citation. If a determination opportunity is detected, a determination using the browsing history information is performed as the first citation determination. In addition, when the upload request is made, a determination using a predetermined determination criterion is performed as the second quotation adequacy determination. In this way, the suitability of citation is determined, and the user is alerted if necessary.
上記した情報処理装置においては、前記注意喚起部は、前記第1引用適否判定部によりペースト操作に係るデータ部分が、前記判定対象とされた部分と同一データが存在したウェブページ内のデータの一部とはいえない量であると判定された場合、前記第2引用適否判定部により、前記出典情報が前記コンテンツに記載されていないと判定された場合、前記第2引用適否判定部により、前記判定対象とされた部分の割合が前記閾値以上であると判定された場合、又は、前記第2引用適否判定部により、前記判定対象とされた部分の文字属性が前記コンテンツの前記判定対象以外の本文と異なっていないと判定された場合、のいずれかに該当することに応じて、それぞれの判定ごとに設定された適正な引用とするためのガイド情報を含む注意喚起のメッセージを作成し前記端末装置に表示させる処理を行う。
適正な引用とするためのガイド情報とは、例えば出典記載のアシストのための情報、ペースト部分の一部削除やブログ本文の追加等を薦めるメッセージ、出典記載や記載態様などのモデルの提示などである。
In the above-described information processing device, the alerting unit is a part of the data in the web page in which the data portion related to the paste operation by the first quotation adequacy determining unit has the same data as the determination target portion. When it is determined that the amount is not equal to a part, when the second citation appropriateness determination unit determines that the source information is not described in the content, the second citation appropriateness determination unit When it is determined that the proportion of the portion to be determined is equal to or more than the threshold value, or by the second quotation adequacy determining unit, the character attribute of the portion to be determined is other than the determination target of the content. If it is determined not be different from the body, in response to fall under any Note 喚 including guide information to a proper citation is set for each determination Create a message performs a process of displaying on the terminal device.
Guide information for proper citation is, for example, information for assisting in citations, a message recommending deletion of a part of the paste part or addition of blog text, presentation of models such as citations and description modes, etc. is there.
上記した情報処理装置においては、前記判定機会検出部は、作成中のコンテンツにおいてペースト操作が検出されることで、ペースト部分についての判定機会と検出する。
引用部分は通常、テキストデータ又は画像データのコピー&ペースト操作により作成中のコンテンツ内に挿入される。従って、ペースト操作があった場合は、仮に引用が行われた可能性があるとして第1引用適否判定が行われるようにする。
In the above-described information processing device, the determination opportunity detection unit detects a paste operation in the content being created, thereby detecting the determination opportunity for the paste portion .
The quoted portion is usually inserted into the content being created by a copy and paste operation of text data or image data. Therefore, when there is a paste operation, the first citation appropriateness determination is made on the assumption that the citation may have been made.
上記した情報処理装置においては、前記判定機会検出部は、作成中のコンテンツにおいて所定文字数以上のペースト操作が検出されることで、ペースト部分についての判定機会と検出することが考えられる。
つまり文字データについて少ない文字数の場合、例えば10文字未満などの少数の文字のコピー&ペーストの操作の場合は、引用部分とは推定しないようにする。
In the above-described information processing device, it is conceivable that the determination opportunity detection unit detects a paste operation with a predetermined number of characters or more in the content being created, and thus detects the determination operation as to the paste portion.
That is, in the case of a small number of characters in the character data, for example, in the case of an operation of copying and pasting a small number of characters such as less than 10 characters, the quoted portion is not estimated.
上記した情報処理装置においては、前記判定機会検出部は、作成中のコンテンツにおいて入力されたテキストデータについての文体解析結果と、前記コンテンツ作成者により作成された他の文章についての文体解析結果とを比較して類似性を判定し、類似性が確認できない場合に、前記入力されたテキストデータの部分を判定対象として引用に関する判定機会が発生したと検出することが考えられる。
つまり言葉遣いの相違などから引用箇所を推定する。例えば、ユーザの過去投稿を参照して、形態素解析によってユーザ文体の特徴を特定し、記事内においてユーザ文体でない箇所を引用箇所とする。
In the above-described information processing device, the determination opportunity detection unit displays a stylistic analysis result for the text data input in the content being created, and a stylistic analysis result for another sentence created by the content creator. It is conceivable that the similarity is determined by comparison, and if the similarity cannot be confirmed, it is possible to detect that a determination opportunity regarding citation has occurred with the portion of the input text data as the determination target .
In other words, the quoted part is estimated from the difference in wording. For example, referring to the user's past post, the characteristics of the user writing style are specified by morphological analysis, and the portion other than the user writing style in the article is set as the quoted portion.
上記した情報処理装置においては、前記第1引用適否判定部は、閲覧履歴情報で示されるウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行うとともに、同一データが存在したウェブページの情報を出典情報として取得する。
即ち閲覧履歴情報で示されたウェブページデータからテキストデータ又は画像データのコピー元を探索し、同一データが存在したウェブページについて、例えばウェブページのURLやウェブサイト名称、ウェブページ管理者等の情報を出典情報として取得する。
In the above-described information processing device, the first quotation adequacy determining unit searches the web page data indicated by the browsing history information and confirms whether or not the same data as the portion estimated to be the quotation exists. At the same time, the information of the web page in which the same data exists is acquired as the source information .
That is, the copy source of the text data or the image data is searched from the web page data indicated by the browsing history information, and for the web page in which the same data exists, for example, the URL of the web page, the website name, the information of the web page manager, etc. As source information .
上記した情報処理装置においては、前記第1引用適否判定部は、閲覧履歴情報で示されるウェブページデータのうちで、閲覧時刻条件により抽出したウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行うことが考えられる。
即ち閲覧履歴情報の全てではなく、例えば直近の所定時間内であるとか、ブログ作成開始後であるとかの閲覧時刻条件に該当するウェブページデータからテキストデータ又は画像データのコピー元を探索する。
In the information processing apparatus described above, the first quotation propriety determination unit searches the web page data extracted by the browsing time condition from the web page data indicated by the browsing history information, and finds the portion estimated to be a quotation. It is conceivable to perform a process of confirming whether the same data as above exists.
That is, not all of the browsing history information, but the copy source of the text data or the image data is searched for from the web page data corresponding to the browsing time condition such as within the latest predetermined time or after the start of blog creation.
上記した情報処理装置においては、前記第2引用適否判定部は、前記第1引用適否判定部が取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理を行う。
即ち引用と推定された部分に対して、出典(引用元)が記載されているか否かを確認する。
In the above-described information processing device, the second quotation appropriateness determination unit performs a process of determining whether or not the source information acquired by the first quotation appropriateness determination unit is described in the content .
That is, it is confirmed whether or not the source (citation source) is described for the portion estimated to be cited.
上記した情報処理装置においては、前記第2引用適否判定部は、前記コンテンツの総テキスト量に対する判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理を行う。
即ち引用と推定された部分と本文の分量を比較する。
In the information processing apparatus described above, the second quotation adequacy determining unit determines whether the ratio of the determination target text amount to the total text amount of the content or the ratio of the determination target image data to the total display surface is equal to or greater than a predetermined threshold. Processing for determining whether or not there is is performed .
That is, the amount of the quoted part and the amount of the text are compared.
上記した情報処理装置においては、前記第2引用適否判定部は、判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理を行う。
即ち引用と推定された部分が本文と明確に異なる態様で記載されているかを判定する
In the above-described information processing device, the second quotation adequacy determining unit performs a process of determining whether or not the character attribute of the text to be determined is different from the body of the content other than the determination target .
That is, it is judged whether the portion estimated to be quoted is described in a manner clearly different from the text.
上記した情報処理装置においては、前記第1引用適否判定部が取得した前記出典情報を基に、引用が行われたことを出典元に通知する処理を行う引用通知部を備えることが考えられる。
例えば引用と推定された部分が存在する場合に、その引用元に対して、引用が行われた旨の通知を行う。
It is conceivable that the information processing apparatus described above includes a citation notifying unit that performs a process of notifying the citation source that the citation has been performed , based on the citation information acquired by the first citation appropriateness determination unit .
For example, when there is a portion estimated to be a citation, the citation source is notified that the citation is performed.
本発明に係る情報処理装置が行う情報処理方法は、端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生したと検出する判定機会検出ステップと、前記判定機会検出ステップにより判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定ステップと、前記第1引用適否判定ステップにおいて取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定ステップと、前記第1引用適否判定ステップの判定結果と前記第2引用適否判定ステップの判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起ステップとを行う。
これによりコンテンツの引用について、作成中とアップロード時に分散して行うようにする。
本発明に係るプログラムは、この情報処理方法の処理を情報処理装置に実行させるプログラムである。
本発明に係る記憶媒体は、上記プログラムを記憶した記憶媒体である。
このプログラムや記憶媒体により本発明の情報処理装置の実現及び提供を容易とする。
An information processing method of the information processing apparatus according to the present invention is carried out, by the detected paste operation is in content creation in the terminal device, the determination chance detection step of detecting a determination opportunities for citing paste portions as determination target has occurred And, in response to the determination opportunity being detected by the determination opportunity detection step, while the content is being created, the web page data indicated by the browsing history information in the terminal device is searched, and the portion that is the determination target is searched. a first reference appropriateness determination step of acquiring and executes a process of confirming whether the same data is present, the information of the web page that the determination target portion in the same data exists as the source information and the It is determined whether the source information acquired in the first citation appropriateness determination step is described in the content. And a process of determining whether the ratio of the determination target text amount to the total text amount of the content or the ratio of the determination target image data to the total display surface is a predetermined threshold value or more, A second citation suitability determination step of performing a process of determining whether or not a character attribute of the target text is different from a body of the content other than the determination target at a timing of an upload request of the content from the terminal device ; According to the determination result of the first quotation propriety determination step and the determination result of the second quotation propriety determination step, a caution calling step for performing a process of causing the terminal device to perform the caution display is performed.
As a result, content quoting is distributed and performed during creation and upload.
A program according to the present invention is a program that causes an information processing apparatus to execute the processing of this information processing method.
A storage medium according to the present invention is a storage medium storing the above program.
This program and storage medium facilitate the implementation and provision of the information processing apparatus of the present invention.
本発明によれば、第1引用適否判定では、ブログ記事等のコンテンツ作成中に行ってしまうことで、ユーザにこれらの処理時間を感じさせないようにすることができる。例えば処理時間がかかることが想定される閲覧履歴を用いたコピー元の探索や、コピー部分がそのコピー元の一部である以下否か等の処理を第1引用適否判定で、時間的な負担をユーザにかけずに実行できる。また第2引用適否判定では、コンテンツ完成の状態で引用適格性の判定を行うことで、無駄な判定が生じない。これらにより、引用に関する適切な注意喚起を、ユーザへの時間的な負担を感じさせず、またシステムの処理負担増もさほど生じさせずに実行できることになる。 According to the present invention, the first quotation adequacy determination is performed during the creation of content such as a blog article, so that it is possible to prevent the user from feeling these processing times. For example, the process of searching for a copy source using a browsing history, which is expected to take a long time, and whether or not the copy part is a part of the copy source, is the first quotation adequacy determination, and is a time burden. Can be executed without calling the user. Further, in the second quotation adequacy determination, useless determination does not occur because the quotation eligibility is determined in the state where the content is completed. As a result, an appropriate reminder regarding citation can be executed without causing a user to feel a time burden and without causing a significant increase in processing load on the system.
以下、実施の形態を説明するが、以下の説明において、端末装置で作成するコンテンツの例としてブログ記事を挙げる。“ブログ”とは、ウェブログあるいは単にブログと呼ばれる日記形式のウェブページのことである。より具体的には、ブログサーバはユーザに対してブログを形成する環境(記憶容量やウェブページ)を提供し、ユーザは投稿等の形式で文章や画像による記事を自分のブログにアップロードする。ブログサーバは通常、当該記事を一般(又は限定した範囲)の閲覧に供する。
記事の内容については特に限定されない。ユーザが情報発信に用いる内容でも、個人的な日記等の内容でもよい。また「ブログ」と呼ばれていないものであっても、同等のものを含む。
Hereinafter, an embodiment will be described. In the following description, a blog article will be taken as an example of content created by a terminal device. A "blog" is a diary-style web page called a weblog or simply a blog. More specifically, the blog server provides the user with an environment (storage capacity or web page) for forming a blog, and the user uploads articles in the form of posts or the like in sentences and images to his or her blog. The blog server generally provides the article for general (or limited range) viewing.
The content of the article is not particularly limited. The contents may be contents used by the user for transmitting information or contents such as a personal diary. Even if it is not called "blog", it includes the equivalent.
“ブログ記事”(単に“記事”とも表記する)とは、ブログを構成する要素であって、文章や画像によって構成された1つの単位(例えば投稿単位)のことを指す。内容には関わらない。なお、必ずしも1つの話題としての記事ではなく、1又は複数の話題について1つのURLで閲覧される記事群を指すものと考えても良い。 “Blog article” (also simply referred to as “article”) is an element that constitutes a blog, and refers to one unit (for example, a posting unit) composed of sentences and images. It is not related to the content. It should be noted that it is not necessarily an article as one topic, and may be considered to refer to an article group browsed by one URL for one or a plurality of topics.
“ユーザ”とは、自己のブログに記事を書き込むブロガーとしてのユーザ(いわゆるブロガー)と、他人又は自己のブログを閲覧する閲覧者としてのユーザが想定される。これらを区別する場合、記事を書くユーザを「ブロガー」と表記し、ブログ閲覧者としてのユーザについては「閲覧者」と表記する。
もちろん一人のユーザがある時点ではブロガーとなり、ある時点では閲覧者となることが通常に想定される。
The “user” is assumed to be a user as a blogger who writes articles on his own blog (a so-called blogger) and a user as a viewer who browses other people's or own blog. To distinguish them, the user who writes the article is referred to as a "blogger", and the user as a blog reader is referred to as a "browser".
Of course, it is usually assumed that one user will be a blogger at some point and a viewer at some point.
<1.システム構成>
図1に実施の形態のブログサーバ1を含むネットワークシステムの構成例を示す。
本実施の形態に係るネットワークシステムは、ブログサーバ1と複数のユーザ端末5がネットワーク2により相互に通信可能に接続されている。
またブログサーバ1は各種データベースにアクセス可能とされている。なお、以下「データベース」については「DB」と表記する。図ではブログサーバ1がアクセス可能なDBとしてブログDB51、画像DB52、管理DB53を例示している。
<1. System configuration>
FIG. 1 shows a configuration example of a network system including the
In the network system according to this embodiment, a
The
ネットワーク2の構成は多様な例が想定される。例えば、インターネット、イントラネット、エキストラネット、LAN(Local Area Network)、CATV(Community Antenna TeleVision)通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が想定される。
またネットワーク2の全部又は一部を構成する伝送媒体についても多様な例が想定される。例えばIEEE(Institute of Electrical and Electronics Engineers)1394、USB(Universal Serial Bus)、電力線搬送、電話線等の有線でも、IrDA(Infrared Data Association)のような赤外線、ブルートゥース(登録商標)、802.11無線、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
Various examples of the configuration of the
Also, various examples of transmission media forming all or part of the
ブログサーバ1は、ユーザに対するブログサービスの管理運営を行う組織によって用いられる情報処理装置である。ブログサーバ1は、ユーザ(ブロガー)へのブログ環境の提供やユーザ(閲覧者)のアクセス要求に応じたブログ記事ページ等のウェブページデータの配信を行う。
具体的にはブログを開設したいブロガーに対しては、そのブロガーのブログとしてのウェブページの設定やユーザ情報の登録などを行う。既にブログ開設済のブロガーに対しては、ブロガーが投稿する記事の保存を行う。
また一般の閲覧者となるユーザからのアクセス要求に応じて、該当のウェブページに係るウェブページデータを配信する。
このブログサーバ1が、本発明請求項の情報処理装置の実施の形態に相当する。
The
Specifically, for a blogger who wants to open a blog, the web page is set as the blog of the blogger and user information is registered. For bloggers who have already opened a blog, save the articles posted by bloggers.
Also, in response to an access request from a user who is a general viewer, the web page data relating to the corresponding web page is distributed.
The
ユーザ端末5は、ブロガーや閲覧者としてのユーザが使用する端末である。このユーザ端末5は、例えば、通信機能を備えたPC(Personal Computer)やフィーチャーフォンやPDA(Personal Digital Assistant)、或いは、スマートフォンやタブレット端末などのスマートデバイスなどが想定される。
ユーザ端末5では、必要に応じて各種の送受信処理や表示処理などが実行される。
閲覧者は、ユーザ端末5においてウェブブラウザを介して、関心のあるブログの閲覧を任意に行うことができる。
ブロガーは、ユーザ端末5により自分のブログページにアクセスし、閲覧したり、新規に記事を投稿することができる。
ユーザ端末5ではこれらの動作のための通信処理や表示処理等を行うことになる。
The
The
The viewer can arbitrarily browse the blog of interest via the web browser on the
The blogger can access his / her blog page through the
The
図1に示したブログサーバ1やユーザ端末5を構成する情報処理装置のハードウエア構成を図2に示す。ブログサーバ1やユーザ端末5として示した各装置は、情報処理および情報通信が可能な図2に示すようなコンピュータ装置によって実現される。
FIG. 2 shows the hardware configuration of the information processing apparatus that constitutes the
図2において、コンピュータ装置のCPU(Central Processing Unit)101は、ROM( Read Only Memory)102に記憶されているプログラム、または記憶部108からRAM( Random Access Memory )103にロードされたプログラムに従って各種の処理を実行する。RAM103にはまた、CPU101が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU101、ROM102、およびRAM103は、バス104を介して相互に接続されている。このバス104には、入出力インタフェース105も接続されている。
入出力インタフェース105には、入力部106、出力部107、記憶部108、通信部109が接続されている。
入力部106はキーボード、マウス、タッチパネルなどにより構成される。
出力部107はLCD(Liquid Crystal Display)、CRT(Cathode Ray Tube)、有機EL(Electroluminescence)パネルなどよりなるディスプレイ、並びにスピーカなどにより構成される。
記憶部108はHDD(Hard Disk Drive)やフラッシュメモリ装置などにより構成される。
通信部109はネットワーク2を介しての通信処理や機器間通信を行う。
入出力インタフェース105にはまた、必要に応じてメディアドライブ110が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア111が適宜装着され、リムーバブルメディア111に対する情報の書込や読出が行われる。
In FIG. 2, a CPU (Central Processing Unit) 101 of a computer device is provided with various types of programs according to a program stored in a ROM (Read Only Memory) 102 or a program loaded from a
The
An
The
The
The
The
A media drive 110 is also connected to the input /
このようなコンピュータ装置では、通信部109による通信によりデータやプログラムのアップロード、ダウンロードが行われる。またリムーバブルメディア111を介したデータやプログラムの受け渡しが可能である。
CPU101が各種のプログラムに基づいて処理動作を行うことで、ブログサーバ1やユーザ端末5としての必要な情報処理や通信が実行される。
なお、ブログサーバ1やユーザ端末5を構成する情報処理装置は、図2のようなコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、LAN等によりシステム化されていてもよいし、インターネット等を利用したVPN等により遠隔地に配置されたものでもよい。複数の情報処理装置には、クラウドコンピューティングサービスによって利用可能なサーバ群(クラウド)としての情報処理装置が含まれてもよい。
In such a computer device, data and programs are uploaded and downloaded by communication by the
By the
It should be noted that the information processing device configuring the
<2.ブログサーバ及びデータベース>
図3に1又は複数の情報処理装置で構成されるブログサーバ1としての機能構成および各種のDBを示す。
ブログサーバ1としての各機能は、情報処理装置においてCPU101でプログラムに応じて実行される処理により実現される機能である。但し以下説明する全部又は一部の各構成の処理をハードウエアにより実現してもよい。
また各機能をソフトウエアで実現する場合に、各機能がそれぞれ独立したプログラムで実現される必要はない。1つのプログラムにより複数の機能の処理が実行されてもよいし、1つの機能が複数のプログラムモジュールの連携で実現されてもよい。
また各機能は複数の情報処理装置に分散されていてもよい。さらに機能の1つが、複数の情報処理装置によって実現されてもよい。
<2. Blog server and database>
FIG. 3 shows a functional configuration of the
Each function as the
Further, when each function is realized by software, each function does not need to be realized by an independent program. Processing of a plurality of functions may be executed by one program, or one function may be realized by cooperation of a plurality of program modules.
Further, each function may be distributed to a plurality of information processing devices. Further, one of the functions may be realized by a plurality of information processing devices.
ブログサーバ1は、図示するようにブログ管理部11、判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15、引用通知部16としての機能を備える。
The
ブログ管理部11は、ブログサービスを提供するサーバとして必要な処理を実行する。例えばユーザへのブログ環境の提供、ブロガーとしてのユーザの情報の管理、作成されたブログの記憶管理、各ブログに関する情報管理、アクセス要求に応じたブログ(記事)のウェブページの配信などを行う。
またブログ管理部11は管理DB53の情報の更新や読み出しを逐次行う。
The
In addition, the
判定機会検出部12は、ユーザ装置5におけるブログ記事の作成中に引用についての判定する機会が発生したことを検出する。即ち何らかの手法により、引用の可能性があると推定される部分が生じたことを検出する。
なお、引用について判定する機会の発生を検出するということは、実際に厳密に引用であるか否かを判定することではない。このため、例えばユーザ端末5においてペースト操作があったことにより判定機会が生じたと検出するなどの簡易な処理とすることができる。
The determination
It should be noted that detecting the occurrence of an opportunity to make a decision regarding citation does not mean determining whether or not it is actually a citation. Therefore, it is possible to perform a simple process such as detecting that a determination opportunity has occurred due to a paste operation on the
なお、ユーザ端末5における操作をブログサーバ1において検出するために、例えばユーザ端末5に提供するブログ作成用のウェブページに、ユーザ操作を検出し送信するプログラムが含まれるようにすることが考えられる。
ブログ記事ページやブログ作成ページを形成するウェブページのデータは、例えば、HTML(HyperText Markup Language)やXHTML(Extensible HyperText Markup Language)などの構造化文書ファイルである。そしてこの構造化文書ファイルにおいて、ブロガーが作成する記事のテキストデータや画像の指定情報、さらにはそれらの配置や表示態様(文字色やフォントや大きさや装飾など)が記述される。
このようなウェブページデータには、例えばブラウザベースで動作可能なJava(登録商標)などのプログラミング言語やJavaScript(登録商標)などのスクリプト言語で生成されたプログラムを埋め込むことで、各種の処理をユーザ端末5(ブラウザ)に実行させることが可能である。これにより例えばユーザがブログ記事作成を行っている場合に、ユーザの操作や、編集中のデータ等をブログサーバ1側でモニタリングできるようにすることができ、例えばユーザの操作等に応じた判定機会検出を行うことができる。
In order to detect the operation on the
The data of a web page forming a blog article page or a blog creation page is a structured document file such as HTML (HyperText Markup Language) or XHTML (Extensible HyperText Markup Language). Then, in this structured document file, the text data of the article created by the blogger and the designation information of the image, as well as the layout and display mode (character color, font, size, decoration, etc.) of them are described.
By embedding a program generated in a programming language such as Java (registered trademark) or a script language such as JavaScript (registered trademark) that can operate on a browser basis in such web page data, various processes can be performed by the user. It can be executed by the terminal 5 (browser). As a result, for example, when the user is creating a blog article, it is possible to monitor the user's operation, the data being edited, etc. on the
第1引用適否判定部13は、ユーザ端末5においてブログ記事が作成されているときに、判定機会検出部12により引用についての判定機会が検出されたことに応じて、そのユーザ端末5における閲覧履歴情報を用いた引用適否判定(第1引用適否判定)を行う。
この第1引用適否判定としては、例えばユーザの閲覧履歴に沿って過去にさかのぼって、ペースト箇所と同一内容(コピー箇所)を探索する。またコピー箇所の、そのコピー元のウェブページのコンテンツ等における割合を算出するなどを行う。
When the blog article is being created in the
As the first quotation adequacy determination, for example, the same content as the paste location (copy location) is searched retroactively along the browsing history of the user. Also, the ratio of the copy location in the content of the web page of the copy source is calculated.
第2引用適否判定部14は、ユーザ端末5からのブログ記事のアップロード要求のタイミングで、設定された判定基準を用いて引用適否判定(第2引用適否判定)を行う。
この第2引用適否判定としては、例えばペースト部分が主記事部分に対して「従たる範囲」となっているか否かを判定や、引用元の提示有無の確認などを行う。
The second quotation
As the second quotation adequacy determination, for example, it is determined whether or not the paste portion is in a “subordinate range” with respect to the main article portion, and whether or not the quotation source is presented is confirmed.
注意喚起部15は、第1引用適否判定部13の判定結果と第2引用適否判定部14の判定結果に応じて、ユーザ端末5において注意喚起表示を実行させる処理を行う。
例えば第1、第2引用適否判定部のいずれかで不適切な引用や無断転載の可能性があると判定された際に、記事のアップロードを開始させずに、不適切引用の警告を行うことなどが想定される。
The alerting
For example, when either the first or second citation appropriateness determination unit determines that there is a possibility of inappropriate citation or unauthorized reprinting, warning of inappropriate citation is issued without starting uploading of article. Is assumed.
引用通知部16は、引用が行われたことを出典元に通知する処理を行う。また出典元のユーザからの通知を受け取って必要な対応処理を行う場合もある。
The
図3ではブログサーバ1がアクセスするDBとしてブログDB51、画像DB52、管理DB53を示している。
ブログDB51は、各ブロガーについてのブログデータを保存するDBである。各ブログのウェブページデータが保存され、また各ブログについては、ブロガーの投稿に応じて記事が追加されていく。
またブログに対しては閲覧者がコメントを投稿することもできる。そのような閲覧者からのコメントデータもブログやブログ内の個々の記事に紐づけてブログDB51に保存される。
ブログサーバ1は、ユーザ端末5から或るブログについてのアクセス要求があった場合は、要求されたブログページをブログDB51から読み出してユーザ端末5に配信することになる。
In FIG. 3, a
The
Viewers can also post comments on the blog. The comment data from such a viewer is also stored in the
When there is an access request for a certain blog from the
画像DB52は、ブログに添付された画像データ(静止画データや動画データ)を保存するDBである。
ブログ内の記事には、画像を添付することができるが、例えばブログDB51には記事データ及び記事データに対応した画像の指定情報(リンク情報)が記憶される。そして画像データ自体は画像DB52に保存される。
画像が添付されたブログ記事へのアクセス要求の場合、そのウェブページデータがユーザ端末5においてブラウザにより表示されるが、その際、ユーザ端末5はウェブページ上のリンク設定により画像データをブログサーバ1に要求する。ブログサーバ1は当該要求に応じて画像データを画像DB52から読み出し、ユーザ端末5に配信する。これによりユーザ端末5上で、画像付きのブログ記事が表示される。
なおこれは一例であり、予め画像データを含むウェブページデータをブログDB51に格納するようにしてもよい。
The
Images can be attached to the articles in the blog. For example, the
In the case of a request for access to a blog article to which an image is attached, the web page data is displayed by the browser on the
Note that this is an example, and web page data including image data may be stored in advance in the
管理DB53は、各ブログの管理のための情報を格納するDBである。
例えば1つのブログについてはブログID(Identification)が設定され、ブログIDにより付随する情報が管理される。例えば各ブログ(ブログID)毎に、ユーザ情報、ブログ管理情報、ブログ実績情報、サイズ情報などが、逐次更新されながら管理される。
The
For example, a blog ID (Identification) is set for one blog, and accompanying information is managed by the blog ID. For example, for each blog (blog ID), user information, blog management information, blog performance information, size information, etc. are managed while being sequentially updated.
ユーザ情報は、ブログを開設したブロガーとしてのユーザ(ブログ管理者)の情報である。例えばユーザ情報としては、ユーザID、管理者としてのログインパスワード、ユーザの住所、氏名、年齢等の属性情報、管理者としてのログイン日時、などの情報が含まれる。
ブログ管理情報は、ブログ自体の属性情報である。例えばブログのURL、ブログのジャンル情報、ブログの開設日時、ブログに含まれる記事数、更新日時情報、ブログのレイアウト情報、リンク設定情報等が含まれる。
ブログ実績情報としては、総ページビュー数、アクセスしたユニークユーザ数、総被リンク数、総コメント数、ブログのページランク、広告クリック数などがあり、これらは逐次更新されていく。
サイズ情報は、そのブログ全体のデータサイズの情報である。また各記事のサイズ情報を記憶しても良い。サイズ情報は、ブログの更新に応じて更新される。
The user information is information on a user (blog administrator) as a blogger who has opened a blog. For example, the user information includes a user ID, a login password as an administrator, attribute information such as a user's address, name, and age, login date and time as an administrator, and the like.
The blog management information is attribute information of the blog itself. For example, the URL of the blog, the genre information of the blog, the opening date and time of the blog, the number of articles included in the blog, the update date and time information, the layout information of the blog, the link setting information and the like are included.
The blog performance information includes the total number of page views, the number of unique users who have accessed, the total number of backlinks, the total number of comments, the page rank of the blog, the number of clicks on advertisements, etc. These are sequentially updated.
The size information is information on the data size of the entire blog. Further, the size information of each article may be stored. The size information is updated as the blog is updated.
以上の各DB(ブログDB51、画像DB52、管理DB53)は、ブログサーバ1がアクセス可能とされていればどのような形態で実現されていてもよい。例えばブログサーバ1と同一システム内の記憶部に各DBのすべてが形成されていてもよいし、各DBの一部又は全部が別体、遠隔地等のコンピュータシステムに設けられていてもよい。もちろん各DBが一つの装置(例えば一つのHDD等)内に形成されている必要はない。また各DBのそれぞれが、それぞれ1つのDBとして構成される必要もない。例えば管理DB53として記憶される情報が、複数のDB(例えばブログに関するユーザ管理用のDBとブログ管理用のDBなど)により記憶管理されてもよい。以上の各DBは、実施の形態の処理に関連する情報の記憶部を、それぞれ1つのDBの形態で例示したものに過ぎない。
Each of the above DBs (
<3.第1の実施の形態>
第1の実施の形態としてのブログサーバ1の処理を説明する。
ブログサーバ1は、ユーザ端末5にブログ作成用のウェブページを送信し、ユーザがブログ作成を行っている場合において、引用の可能性が検出されることに応じて適切な引用であるか否かの判定を行うとともに、アップロード要求の際にも引用適否判定を行い、必要に応じて注意喚起処理を行うものである。
<3. First Embodiment>
The processing of the
The
図4によりブログ作成の際のユーザ端末5とブログサーバ1の処理の流れを説明する。
ブログ記事を作成しようとするユーザは、ユーザ端末5上でブログサーバ1にブログ作成ページを要求する操作を行う。これによりステップS10としてユーザ端末5からブログサーバ1にブログ作成ページの要求が行われる。
ブログサーバ1はこの要求に応じて、ステップS20でブログ作成ページをユーザ端末5に送信する。これによりユーザ端末5では、ウェブブラウザ機能により、ブログ作成ページが表示される。ユーザは、ブログ作成ページを用いて記事としてのテキストデータ入力や画像データの指定等を行っていく。
ステップS11のブログ作成とは、ブログ作成ページに対するユーザ操作により、画面上でブログ記事の作成編集が行われている際のユーザ端末5の処理を総括的に示している。
The process flow of the
A user who wants to create a blog article performs an operation of requesting a blog creation page from the
In response to this request, the
The blog creation in step S11 generally indicates the processing of the
このブログ作成中においては、例えばユーザがコピー&ペーストの操作を行うことがある。例えばブログサーバ1は、作成中のブログ記事へのペースト操作を検出したら(S21)、これを引用に関する判定機会の発生として、ステップS22の第1引用適否判定の処理を行う。
この第1引用適否判定は、ペースト操作でペーストされたテキストデータや画像データについて、他のウェブページなどにおけるコピー元を探索する等の処理を行う。
この第1引用適否判定は、例えばペースト操作が検出される毎に実行される。
During the creation of this blog, for example, the user may perform copy and paste operations. For example, when the
The first quotation adequacy determination performs a process such as searching for a copy source in another web page or the like for the text data or the image data pasted by the paste operation.
This first quotation adequacy determination is executed, for example, every time a paste operation is detected.
ユーザは、ブログ記事を完成させると、それをアップロードする操作を行う。ユーザ端末5はこの操作に応じてステップS12でブログサーバ1に対してブログ記事のアップロードを要求する。
このときブログサーバ1は、ステップS23として第2引用適否判定を行い、所定の条件により適切な引用が行われているか否かを判定する。ただし、厳密な判定でなくてよく、例えば、「著作権侵害の可能性がある」又は「著作権侵害の可能性がないとはいえない」という程度の判定であればよい。
After completing the blog article, the user uploads it. In response to this operation, the
At this time, the
ステップS24でブログサーバ1は、注意喚起が必要であるか否かを判定する。
引用と推定される部分が存在しない場合や、引用が適切に行われていると判定される場合は、注意喚起が不要であるとして、ブログサーバ1はステップS25からS27に進み、アップロードを受け付け、ユーザ端末5のアップロード処理(送信)を受信してブログ記事のデータをブログDB51に格納するアップロード処理を行う。
In step S24, the
If there is no part that is estimated to be a citation, or if it is determined that the citation is properly performed, it is determined that the reminder is not necessary, and the
一方、注意喚起が必要と判定した場合は、ブログサーバ1はステップS25からS26に進み、注意喚起処理を行う。この場合、例えばアップロードを開始させず、ユーザ端末5においてブログ作成ページとともに、注意喚起のメッセージが表示されるように制御を行う。ユーザ端末5側ではステップS13で注意喚起表示が行われる。
On the other hand, if the
図5に注意喚起表示が行われている状態の例を示している。
例えばユーザが作成し、アップロードをしようとしたブログ記事60において、例えば枠表示61により不適切な引用と判定された箇所が明示される。もちろん枠表示61以外にも、ハイライト表示、特定色表示、拡大表示その他の手法で、引用箇所が示されるようにしてもよい。
さらにメッセージ表示62により、必要なメッセージが表示される。ここでは無断転載の指摘や、出典元を明記することを薦める表示の例としている。
もちろんメッセージ内容は多様に考えられる。例えば対象法として、テキストの削除や文字数の削減、引用箇所の明示、文字等の態様(サイズやフォント等)の変更などのアドバイスを示すものでもよい。
FIG. 5 shows an example of a state in which the alert display is being performed.
For example, in the
Further, the
Of course, various message contents are possible. For example, as the applicable law, advice such as deletion of text, reduction of the number of characters, clarification of a quoted portion, change of a mode (size, font, etc.) of characters and the like may be shown.
このような注意喚起表示を行った場合、例えばユーザ端末側はブログ作成の処理(S11)に戻してユーザの編集を受け付けるようにするとよい。ユーザは、不適切な引用の指摘がされないように所要の編集を行って、再度アップロードを要求すればよい。 When such a reminder display is performed, for example, the user terminal side may return to the blog creation process (S11) to accept the user's edit. The user may make necessary edits and request uploading again so that inappropriate citations are not pointed out.
以上は、ブログサーバ1とユーザ端末5の処理の流れの概要を示したが、このような処理を実現するためのブログサーバ1の具体的な処理例を説明していく。
図6はブログサーバ1が図3に示した機能、特に判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15としての機能により実行する処理例を示している。
The outline of the processing flow of the
FIG. 6 shows an example of processing executed by the
ステップS100としてユーザ端末からブログ作成ページの要求が検知された場合、ブログサーバ1はステップS101に進み、ブログ作成ページを要求元のユーザ端末5に送信する。
そしてブログサーバ1はステップS102で変数Mを初期設定としてM=0とする。変数Mは作成されているブログ記事内で、引用元が発見された数を管理する変数である。
When a request for a blog creation page is detected from the user terminal in step S100, the
Then, in step S102, the
ユーザ端末5においてユーザの操作によりブログ記事の作成・編集が行われている期間は、ブログサーバ1はステップS103,S104,S105の監視処理を継続的に行っている。
ステップS103でブログサーバ1は、ユーザ端末5においてブログ作成ページが終了されたか否かを監視する。例えばユーザがブログ記事作成を中止して当該ウェブページを閉じたような場合である。
ブログ作成ページの終了が検出された場合、ブログサーバ1はステップS103から図6の処理を終える。
While the blog article is created / edited by the user's operation on the
In step S103, the
When the end of the blog creation page is detected, the
ステップS104でブログサーバ1は、ユーザ端末5からのアップロード要求を監視する。
ステップS105でブログサーバ1は、ユーザ端末5においてペースト処理が行われることを監視する。即ち作成中のブログ記事として、コピー&ペーストの操作によりテキストデータ又は画像データが貼り付けられたことを検知する。
In step S104, the
In step S105, the
ブログ記事作成中のある時点でペースト操作が検知されると、ブログサーバ1は処理をステップS105からS106に進め、第1引用適否判定を行う。この第1引用適否判定の処理例を図7に示す。
When a paste operation is detected at some point during the creation of a blog article, the
図7のステップS201でブログサーバ1は、ブログ記事内においてペーストされた部分を特定する。
ステップS202でブログサーバ1は、このコピー&ペーストの操作が、当該ブログ記事内(もしくはブログ内)で行われたものであるか否かを判定する。例えばペーストされた部分のデータが当該作成中のブログ記事内の他の部分からコピーされたものであるか、或いは当該ブログ(現在記事を作成中のブログ)の他の記事からコピーされたものであるかを確認する。このような場合は、コピー元がユーザ本人が作成した文章等と考えられるため、今回のペースト操作は、単なる文の移動、自己文章の転記、入力効率化のための操作などである可能性がある。またこの場合はユーザ自身の文章のコピー&ペースト操作であり著作権侵害の問題は生じないと考えられる。そこで不適切な引用の可能性があるとはしないで、ステップS202から図7の第1引用適否判定を終える。
In step S201 of FIG. 7, the
In step S202, the
ブログ内又は記事内からのコピー&ペーストではない場合は、ブログサーバ1はステップS203で、ペーストされたデータがテキストデータか画像データかにより処理を分岐する。
テキストデータであった場合はブログサーバ1はステップS204に進み、引用適否判定の対象のテキストデータをコピー元探索するデータとして取得する。
そしてステップS206でブログサーバ1は、当該テキストデータの文字数を、所定の閾値thTNと比較する。文字数が閾値thTN以上であればステップS207に進み、閾値thTN未満であれば図7の処理を終える。
これは、引用とは考えにくい、少ない文字数の場合を排除するためであり、閾値thTNは、例えば「10」などとされる。つまりペーストされた文字数が10文字未満であれば、それは引用ではないとみなして第1引用適否判定を行わないようにするものである。もちろんこの判定の閾値は10文字に限られない。
If it is not the copy and paste from the blog or the article, the
If the data is text data, the
Then, in step S206, the
This is to exclude a case where the number of characters is small, which is unlikely to be quoted, and the threshold thTN is set to, for example, “10”. That is, if the number of pasted characters is less than 10 characters, it is regarded as not a citation and the first citation appropriateness determination is not performed. Of course, the threshold for this determination is not limited to 10 characters.
ペーストされたのが画像データであった場合、ブログサーバ1はステップS203からS205に進み、引用適否判定の対象の画像データをコピー元探索するデータとして取得する。そしてステップS207に進む。
If the pasted is image data, the
ステップS207でブログサーバ1は、ユーザ端末5から閲覧履歴データを取得する。
例えばユーザ端末5からブラウザが管理するウェブページの閲覧履歴を送信させ、これを取得する。
ステップS208でブログサーバ1は、閲覧履歴で示されるウェブページのうちで、調査対象のページを選択する。
取得した閲覧履歴で示される全てのウェブページを調査対象としてもよい。
また例えば閲覧履歴情報で示される閲覧日時の情報を用いて、現在より所定時間以内にユーザが閲覧したウェブページを調査対象としてもよい。
またブログサーバ1はブログ作成ページを送信した日時を把握しているため、その日時以降に閲覧したウェブページ、つまりブログ記事作成中に閲覧したウェブページを調査対象として選択してもよい。
In step S207, the
For example, the browsing history of the web page managed by the browser is transmitted from the
In step S208, the
All the web pages indicated by the acquired browsing history may be the survey targets.
Further, for example, by using the information of the browsing date and time indicated by the browsing history information, the web page browsed by the user within a predetermined time from the present may be the survey target.
Further, since the
ステップS209でブログサーバ1は、変数N=1、変数Nmax=調査対象のウェブページ数とする。変数NはステップS208で調査対象として選択したウェブページを区別するための変数である。選択されたウェブページを第1のウェブページから第(Nmax)のウェブページとする。
そしてステップS210でブログサーバ1は、第Nのウェブページの調査を行う。この処理を図8に示す。
In step S209, the
Then, in step S210, the
図8のステップS220でブログサーバ1は、まず調査するデータ(ペーストされたデータ)がテキストデータか画像データかで処理を分岐する。
テキストデータの場合は、ブログサーバ1はステップS221で、第Nのウェブページにアクセスしてそのページデータを取得する。
ステップS222でブログサーバ1は、当該ウェブページにテキストデータが存在するか否かを確認する。テキストデータが存在しなければ、そのウェブページはコピー元ではあり得ないため、当該第Nの(例えば第1の)ウェブページの調査を終了する。
この場合、ブログサーバ1は図7のステップS211に進み、変数N≧Nmaxでなければ、つまりまだ選択した全てのウェブページの調査が終了していなければ、ステップS212で変数NをインクリメントしてステップS210に戻る。そして第Nのウェブページ、つまり次のウェブページについて図8の処理を行うことになる。
In step S220 of FIG. 8, the
In the case of text data, the
In step S222, the
In this case, the
調査中のウェブページにおいてステップS222でテキストデータが存在すると判定した場合、ブログサーバ1はステップS223で、そのウェブページ内でコピー元のテキストを検索する。つまりペーストされたテキストデータと同一のテキストデータが、そのウェブページ内に有るか否かを調べる。
無ければ、ステップS224から当該第Nのウェブページについての図8の処理を終える。
When it is determined in step S222 that the text data exists in the web page under investigation, the
If not, the process of FIG. 8 for the Nth web page is ended from step S224.
ペーストされたテキストデータと同一のテキストデータが、そのウェブページ内に発見された場合は、ブログサーバ1はステップS224からS225に進み、引用といえるか、或いは転載であるか否かを判定する。
適正な引用としては、出典元(コピー元)の文章等の一部であることが必要と考えることができる。逆に出典元のテキストデータの全部又は大部分が丸ごとコピー&ペーストされているのは、引用とはいえず、転載と考えられ、場合によっては無断転載と考えることもできる。
そこでステップS225では、コピー&ペースト操作に係るテキストデータ部分が、コピー元のウェブページ内のテキストデータの一部とはいえない量であるか否かを判定し、これによって引用か転載かを判定する。
If the same text data as the pasted text data is found in the web page, the
It can be considered that a proper citation needs to be a part of the text or the like of the source (copy source). On the contrary, the whole or most part of the text data of the source is copied and pasted as a whole, which is not a citation but is considered to be a reprint, and in some cases, it may be reprinted without permission.
Therefore, in step S225, it is determined whether the text data portion related to the copy & paste operation is an amount that cannot be said to be a part of the text data in the copy source web page, and it is determined whether the text data is quoted or reprinted. To do.
続いてブログサーバ1はステップS226で変数Mをインクリメントする。そしてステップS227で、今回コピー元が発見されたペースト部分について「第Mの引用箇所」に関する情報を生成する。
具体的にはコピーフラグF(M)1をオンとする。“(M)”は、作成中のブログ記事内で発見された第Mの引用箇所に対応するフラグであることを示すものとして、現時点の変数Mの値が挿入される。
このコピーフラグF(M)1=1とされるということは、現在調査対象としているテキストデータのコピー元として他のウェブサイトが発見されたことを示すことになり、ブログサーバ1はコピーフラグF(M)1をペースト部分のデータと対応づけて記憶する。
またブログサーバ1は、引用/転載フラグF(M)itも設定する。例えばステップS225で「引用」と判定されたらF(M)it=0、「転載」と判定されたらF(M)it=1とし、ペースト部分のデータと対応づけて記憶する。
Subsequently, the
Specifically, the copy flag F (M) 1 is turned on. "(M)" indicates that the flag corresponds to the M-th quoted portion found in the blog article being created, and the current value of the variable M is inserted.
The fact that the copy flag F (M) 1 = 1 means that another website has been found as the copy source of the text data currently under investigation, and the
The
ステップS228でブログサーバ1は、今回発見した第Mの引用箇所(ペースト箇所)についての出典情報を取得する。例えば現在調査していた第NのウェブページのURLやウェブサイト名称、ウェブページ管理者等の情報を取得する。
ブログサーバ1はこの出典情報を、ペースト箇所のデータ、コピーフラグF(M)1、引用/転載フラグF(M)itとともに、第1引用適否判定の結果として記憶する。例えば図2のRAM103又は記憶部108に記憶する。
In step S228, the
The
ステップS229では変数Nを強制的にNmaxとする。これは、コピー元が発見された段階で、他のウェブページを調査する必要がなくなるため、第1引用適否判定を終了させるためである。
即ちこの場合、図7のステップS211でN≧Nmaxとなり、図7の処理が終了される。
例えば閲覧履歴情報から5個の閲覧履歴が調査対象とされた場合、コピー元が見つかるまでは、5個のウェブページが順次図8の処理で調査対象とされるが、コピー元が見つかり次第、未調査のウェブページが残っていても、第1引用適否判定が終了されることになる。これにより冗長な調査処理が行われないようにする。
In step S229, the variable N is forcibly set to Nmax. This is because it is not necessary to investigate other web pages at the stage when the copy source is discovered, and thus the first quotation adequacy determination is ended.
That is, in this case, N ≧ Nmax in step S211 of FIG. 7, and the process of FIG. 7 is terminated.
For example, when five browsing histories are targeted for investigation from the browsing history information, five web pages are sequentially targeted for investigation by the processing of FIG. 8 until the copy source is found. Even if there is an unsearched web page, the first citation suitability determination will be completed. This prevents redundant investigation processing.
なお、例えばこの場合に5個のウェブページのいずれからもコピー元が発見されない場合もある。その場合は、ステップS226、S227、S228の処理が行われないため、当該ペースト部分は引用されたものではないとみなされることになる。
例えばユーザが他のアプリケーションソフトウエアを使用して自分で作成したデータをコピー&ペーストにより貼り付けたとする。そのような場合のペースト部分は引用ではなく、閲覧履歴にあるウェブページからは発見できない。このような場合、ペースト部分は第Mの引用箇所として記憶されないことになる。
但し、もちろん他人のテキストや画像からのコピー&ペーストはウェブページからとは限らない。例えば電子書籍その他の電子コンテンツであって、ユーザ端末5においてローカルに保存されているものもコピー元になり得る。
そこで、ローカルコンテンツを含めて閲覧履歴、再生履歴を取得できるようにし、それらについてもコピー元の調査を行うようにしてもよい。
In this case, for example, the copy source may not be found in any of the five web pages. In that case, since the processes of steps S226, S227, and S228 are not performed, it is considered that the paste portion is not quoted.
For example, suppose that the user pastes the data created by himself / herself using another application software by copy and paste. In such a case, the paste part is not a quote and cannot be found from the web page in the browsing history. In such a case, the paste portion is not stored as the Mth quoted portion.
However, of course copy and paste from other people's text or images is not always from the web page. For example, an electronic book or other electronic content that is locally stored in the
Therefore, the browsing history and the reproduction history including the local content may be acquired, and the copy source may be investigated for these.
図8の処理においてペースト部分が画像データであった場合は、ブログサーバ1はステップS220からS231に進み、第Nのウェブページにアクセスしてそのページデータを取得する。
ステップS232でブログサーバ1は、当該ウェブページに画像データが存在するか否かを確認する。画像データが存在しなければ、そのウェブページはコピー元ではあり得ないため、当該第Nのウェブページの調査を終了する。
調査中のウェブページにおいてステップS232で画像データが存在すると判定した場合、ブログサーバ1はステップS233で、そのウェブページ内でコピー元の画像データを検索する。つまりペーストされた画像データと同一の画像データが、そのウェブページ内に有るか否かを調べる。
無ければ、ステップS234から、当該第Nのウェブページについての図8の処理を終える。
If the paste portion is image data in the process of FIG. 8, the
In step S232, the
When it is determined in step S232 that image data exists in the web page under investigation, the
If not, the process of FIG. 8 for the Nth web page is ended from step S234.
ペーストされた画像データと同一の画像データが、そのウェブページ内に発見された場合は、ブログサーバ1はステップS234からS226、S227、S228、S229の処理を上記のテキストデータの場合と同様に行う。この場合、第Mのペースト箇所のデータとして、画像データと、コピーフラグF(M)1、引用/転載フラグF(M)it、出典情報が、第1引用適否判定の結果として記憶される。
なお画像データの場合は、通常は画像全体をコピー&ペーストすることから、引用/転載フラグF(M)itは、画像単位で考えて「転載」であることを示すようにすることが考えられる。
When the same image data as the pasted image data is found in the web page, the
In the case of image data, the entire image is usually copied and pasted, so the citation / reproduction flag F (M) it can be considered to indicate "reproduction" in consideration of each image. .
調査対象とされたウェブページのうちからコピー元が見つかって図8の処理が終わった時点、または調査対象とされた全てのウェブページの調査が完了してもコピー元が見つからなかった時点で、図7のステップS211でN=Nmaxとなり、図7の第1引用適否判定が終了する。
図6のステップS106の第1引用適否判定では、以上の図7,図8のように処理が行われ、ペーストされたデータについてのコピー元が見つかった場合に、その情報が第Mの引用箇所として管理される状態となる。
ステップS105のペースト検出は、複数回行われることも当然想定されるが、引用としての蓋然性が高い場合にのみ、そのペースト部分のデータについて第Mの引用箇所のデータが生成されることになる。
変数MはステップS102でM=0とされた後、コピー元が検出された図8のステップS226でインクリメントされるものであるため、ブログ記事が完成するまでに、多数回のコピー&ペーストの操作が行われたとすると、その都度第1引用適否判定が行われ、コピー元が見つかる毎に、第1の引用箇所、第2の引用箇所・・・第Mの引用箇所として、引用箇所であると判定された結果の情報が保存されることになる。つまりM個のペースト箇所が引用箇所(転載も含む)として検出される。例えばブログ記事完成までに一度もコピー元が見つからない場合は、変数M=0のままで、引用箇所はなかったということになる。
When the copy source is found from the surveyed web pages and the processing of FIG. 8 is finished, or when the copy source is not found even after the survey of all the surveyed web pages is completed, In step S211 of FIG. 7, N = Nmax, and the first citation suitability determination of FIG. 7 ends.
In the first quotation propriety determination of step S106 of FIG. 6, the processing is performed as shown in FIGS. 7 and 8 above, and when the copy source of the pasted data is found, the information is the Mth quotation point. Will be managed as.
It is naturally assumed that the paste detection in step S105 is performed a plurality of times, but only when the probability of citation is high, the data of the Mth quoted portion is generated for the data of the paste portion.
Since the variable M is set to M = 0 in step S102 and then incremented in step S226 in FIG. 8 in which the copy source is detected, a number of copy and paste operations are performed until the blog article is completed. Is performed, the first quotation propriety determination is performed each time, and each time the copy source is found, the first quotation portion, the second quotation portion, ... Information of the determined result will be saved. That is, M paste locations are detected as quoted locations (including reprints). For example, if the copy source is never found by the time the blog article is completed, it means that the variable M = 0 remains and there is no quoted part.
ユーザは、ブログ記事を完成させると、アップロード操作を行うことになる。ユーザ端末5はブログサーバ1にアップロード要求を送信する。この場合図6のブログサーバ1の処理はステップS104からS110に進み、第2引用適否判定を行うことになる。
第2引用適否判定の具体例を図9に示す。
When the user completes the blog article, he will perform the upload operation. The
FIG. 9 shows a specific example of the second quotation adequacy determination.
図9のステップS300でブログサーバ1は、変数M=0であるか否かを確認する。上記のように変数M=0であるということは、引用箇所と判定されたペースト部分が存在しなかったということになる。その場合は、第2引用適否判定を終了し、図6のステップS111に進む。
In step S300 of FIG. 9, the
一方、変数M=0でなければ、当該ブログ記事内に、第1引用適否判定で引用箇所と判定されたペースト部分が1箇所以上あったということである。
この場合ブログサーバ1はステップS302で変数Mmaxに変数Mの値を代入する。変数Mmaxは、第1引用適否判定で引用箇所と判定されたペースト部分の数となる。
そしてステップS303で変数M=1とする。これは引用箇所と判定された第1番目のペースト箇所から順に、第2引用適否判定を行っていくためである。
On the other hand, if the variable M is not 0, it means that there is at least one paste portion determined to be a quoted portion in the first citation appropriateness determination in the blog article.
In this case, the
Then, in step S303, the variable M = 1 is set. This is because the second quotation adequacy determination is performed in order from the first paste location determined to be the quotation location.
但し、第1引用適否判定で引用箇所と判定されたペースト部分は、このアップロード時点では、消去されている可能性もある。第1引用適否判定はペースト処理の都度行われており、ユーザがそのペースト後のブログ記事作成の過程で、ペースト部分を削除することも通常に考えられるためである。従って、アップロード要求の時点で、必ずしもM個のペースト箇所が全て残っているとは限らない。
そこでステップS303でブログサーバ1は、アップロードされようとしているブログ記事において、第Mの引用箇所が存在しているか否かを確認する。つまり第1引用適否判定で保存された第Mの引用箇所の情報と、アップロード要求時点のブログ記事を照合し、当該部分が残されているか否かを確認する。
もし残されていなければ、その部分は引用適否判定を行う必要がないため、ブログサーバ1はステップS329で、その第Mの引用箇所についてのフラグ(コピーフラグF(M)1、引用/転載フラグF(M)it、及び後述するフラグF(M)2、フラグF(M)3、フラグF(M)4)を全てリセット(=0)とし、ステップS330に進む。そしてステップS330でM≧Mmaxであるか否か(全ての引用箇所について第2引用適否判定を終えたか否か)を確認し、M≧MmaxでなければステップS331で変数MをインクリメントしてステップS303に戻る。つまり次の引用箇所について、存在判定を行う。
However, the paste portion determined to be the quoted portion in the first quotation adequacy determination may have been deleted at the time of this upload. This is because the first quotation adequacy determination is performed each time the paste processing is performed, and it is usually conceivable that the user deletes the paste portion in the process of creating the blog article after the paste processing. Therefore, at the time of an upload request, not all M paste locations remain.
Therefore, in step S303, the
If it is not left, it is not necessary to determine whether or not the portion is appropriate for citation. Therefore, in step S329, the
第Mの引用箇所について、ブログ記事内に存在すると判定した場合、ブログサーバ1はステップS304で、第Mの引用箇所の対象のデータがテキストデータであるか画像データであるかにより処理を分岐する。
テキストデータである場合、ブログサーバ1はステップS310に進み、生成されたブログ記事の総テキスト量に対する当該引用部分のテキスト量の比率を算出する。
そしてステップS311で、求められた比率が閾値thT以上であるか否かを判定する。適切な引用とするには、本文(引用以外)がコンテンツ内で支配的であり、本文と引用文に主従の関係が見つめられることが望ましいと考えられる。閾値thTはこのような関係を満たしているか否かを判定する閾値であり、適切な比率が設定される。
When it is determined that the Mth quoted portion is present in the blog article, the
If the data is text data, the
Then, in step S311, it is determined whether the obtained ratio is equal to or more than the threshold value thT. For proper citation, it is considered desirable that the text (other than citation) is dominant in the content, and that the relationship between the text and the quote is master-slave. The threshold thT is a threshold for determining whether or not such a relationship is satisfied, and an appropriate ratio is set.
ブログサーバ1は、求められた比率が閾値thT以上であれば、ステップS312に進みフラグF(M)2をオンとし、求められた比率が閾値thT以上でなければ、ステップS313に進みフラグF(M)2をオフとする。
フラグF(M)2は、第Mの引用箇所について、引用部分が本文中で従たる記載になっていない場合にオンとされるものとする。つまり本文と引用部分の量的な関係で不適切な引用となっている可能性があることを示すフラグである。
If the calculated ratio is greater than or equal to the threshold value thT, the
The flag F (M) 2 is turned on when the quoted portion of the Mth quoted portion is not a subordinate description in the text. In other words, it is a flag indicating that there is a possibility that the citation is inappropriate due to the quantitative relationship between the text and the quoted portion.
次にブログサーバ1はステップS314で、第Mの引用箇所について、出典情報の記載を確認する。
そしてブログサーバ1は、アップロードしようとするブログ記事に第Mの引用箇所について出典情報が記載されていなければ、ステップS315からS316に進んでフラグF(M)3をオンとし、出典情報が記載されていればステップS315からS317に進みフラグF(M)3をオフとする。
つまりフラグF(M)3は、第Mの引用箇所について、引用部分ついての出典情報が記載されておらず、不適切な引用となっている可能性があることを示すフラグとされる。
なお、ブログサーバ1は第Mの引用箇所について出典情報を記憶しているため、ブログ記事内に出典情報が記載されているときに、それが正しい記載であるか否かも判定できる。そこで、出典情報が記載されている場合でも、それが正しいか否かを判定し、誤った記載となっている場合はフラグF(M)3をオンとすることが考えられる。
Next, in step S314, the
If the blog article to be uploaded does not include the source information about the M-th quoted portion, the
That is, the flag F (M) 3 is a flag indicating that the citation information for the Mth quoted portion is not described and there is a possibility that the quoted portion is inappropriate.
Since the
次にブログサーバ1はステップS318で、第Mの引用箇所について、文字属性を判定する。これは引用箇所が、本文と明確に区別されて記載されているか否かの判定である。例えば文字サイズやフォント、色等の文字属性が、引用箇所と本文とで明確に区別されて異なっているか否かを確認する。
そしてブログサーバ1は、明確な区別が認められなければステップS319からS320に進んでフラグF(M)4をオンとし、明確な区別が認められればステップS319からS321に進みフラグF(M)4をオフとする。
つまりフラグF(M)4は、第Mの引用箇所について、引用部分の明確性の点で不適切な引用となっている可能性があることを示すフラグとされる。
Next, in step S318, the
If the distinction is not recognized, the
That is, the flag F (M) 4 is a flag that indicates that the M-th quoted portion may be inappropriately quoted in terms of clarity of the quoted portion.
なお、本文と引用箇所の明確な区別は、文字サイズ、フォント、色のいずれかで行われることを要するものではない。例えば引用部分が枠で囲われているようにしたり、インデントによる文字の配置の違い、レイアウトなどによっても明確な区別は可能である。そこで文字属性に限らず、他の表示態様も考慮して判定するとよい。 It should be noted that the clear distinction between the text and the quoted part does not need to be made in any of the character size, font, and color. For example, it is possible to make a clear distinction by enclosing the quoted portion in a frame, different arrangement of characters by indentation, and layout. Therefore, not only the character attribute but also other display modes may be considered for the determination.
第Mの引用箇所がテキストデータである場合は、以上の処理を行った後、ステップS330で、最後の引用箇所まで処理を終えたか否かを判定し、終えていなければ次の引用箇所について第2引用適否判定を行うためステップS331で変数MをインクリメントしてステップS303に戻る。 If the Mth quoted portion is text data, after performing the above processing, it is determined in step S330 whether or not the processing has been completed up to the last quoted portion. 2 In order to determine whether or not the quotation is appropriate, the variable M is incremented in step S331, and the process returns to step S303.
第Mの引用箇所が画像データであってステップS320に進んだ場合は、ブログサーバ1は、生成されたブログ記事の総表示面に対する当該引用部分の画像データが占める比率を算出する。
そしてステップS321で、求められた比率が閾値thP以上であるか否かを判定する。適切な引用とするには、コンテンツの本体部分が支配的であり、引用された画像データが従たる位置づけであることが望ましいと考えられる。閾値thPはこのような関係を満たしているか否かを判定する閾値であり、適切な比率が設定される。
When the M-th quoted portion is image data and the process proceeds to step S320, the
Then, in step S321, it is determined whether the obtained ratio is equal to or more than the threshold value thP. For proper citation, it is considered desirable that the main body part of the content is dominant and the cited image data is in a subordinate position. The threshold value thP is a threshold value for determining whether or not such a relationship is satisfied, and an appropriate ratio is set.
ブログサーバ1は、求められた比率が閾値thP以上であれば、ステップS322に進みフラグF(M)2をオンとし、求められた比率が閾値thP以上でなければ、ステップS323に進みフラグF(M)2をオフとする。即ちテキストの場合と同じく、本文と引用部分の量的な関係で不適切な引用となっている可能性があることを示すフラグの制御を行う。
If the calculated ratio is greater than or equal to the threshold value thP, the
次にブログサーバ1はステップS324で、第Mの引用箇所について、出典情報の記載を確認する。
そしてブログサーバ1は、アップロードしようとするブログ記事に第Mの引用箇所について出典情報が記載されていなければ、ステップS325からS326に進んでフラグF(M)3をオンとし、出典情報が記載されていればステップS325からS327に進みフラグF(M)3をオフとする。
つまりテキストの場合と同様に、出典情報の記載の点で不適切な引用となっている可能性があることを示すフラグの制御を行う。
なおこの場合も、ブログサーバ1は第Mの引用箇所について出典情報が記載されている場合に、それが正しいか否かを判定し、誤った記載となっている場合はフラグF(M)3をオンとすることが考えられる。
Next, in step S324, the
If the blog article to be uploaded does not include the source information about the Mth quoted portion, the
That is, as in the case of the text, the flag indicating that the citation may be inappropriate in terms of the description of the source information is controlled.
Also in this case, the
第Mの引用箇所が画像データである場合は、以上の処理を行った後、ステップS330で、最後の引用箇所まで処理を終えたか否かを判定し、終えていなければ次の引用箇所について第2引用適否判定を行うためステップS331で変数MをインクリメントしてステップS303に戻る。 If the M-th quoted portion is image data, after performing the above processing, it is determined in step S330 whether or not the processing has been completed up to the last quoted portion. 2 In order to determine whether or not the quotation is appropriate, the variable M is incremented in step S331, and the process returns to step S303.
ブログサーバ1は、Mmax個の引用箇所について以上の処理を終えたら図9の処理、即ち図6のステップS110の第2引用適否判定を終える。
The
図6のステップS111ではブログサーバ1は、第1、第2引用適否判定の結果を用いて注意喚起の要否を判定する。
例えば以上の第1、第2引用適否判定によれば、コピーフラグF(M)1、引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4が設定されている。
特にアップロード時点では、コピーフラグF(M)1がオンとされた引用箇所について第2引用適否判定でフラグF(M)2、フラグF(M)3、フラグF(M)4が設定されるため、ステップS111の時点では、引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4を確認することが考えられる。
In step S111 of FIG. 6, the
For example, according to the first and second citation suitability determinations described above, the copy flag F (M) 1, the citation / reproduction flag F (M) it, the flag F (M) 2, the flag F (M) 3, the flag F ( M) 4 is set.
In particular, at the time of uploading, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4 are set in the second quotation adequacy determination for the quotation portion for which the copy flag F (M) 1 is turned on. Therefore, at the time of step S111, it is possible to confirm the citation / reprint flag F (M) it, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4.
例えば引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4のうちで1つでも“1”となっていたら、注意喚起要と判定する。
引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4が全て“0”となっていたら、注意喚起不要と判定する。
For example, if even one of the citation / reproduction flag F (M) it, flag F (M) 2, flag F (M) 3, and flag F (M) 4 is "1", it is determined that attention is required. To do.
If the quotation / reproduction flag F (M) it, the flag F (M) 2, the flag F (M) 3, and the flag F (M) 4 are all "0", it is determined that no attention is required.
注意喚起不要と判定した場合は、ブログサーバ1はステップS112からS113に進んでアップロード処理に移行する。つまりアップロード要求に応じて通常にブログ記事のアップロードを完了させる。
一方、注意喚起要と判定した場合は、ブログサーバ1はステップS112からS120に進み、注意喚起処理を行う。例えばユーザ端末5において図5に示したような注意喚起表示が実行されるように制御する。
When it is determined that attention is not required, the
On the other hand, if it is determined that the reminder is required, the
注意喚起処理の具体例を図10に示す。
ブログサーバ1はステップS401で変数M=1とする。
ステップS402でブログサーバ1は第Mの引用箇所のフラグを確認する。例えば引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4を確認する。
FIG. 10 shows a specific example of the alerting process.
The
In step S402, the
ステップS403では、上記のフラグの判定から、第Mの引用箇所についての注意喚起が必要であるか否かを確認する。
引用/転載フラグF(M)it、フラグF(M)2、フラグF(M)3、フラグF(M)4の全てが“0”であれば、その第Mの引用箇所についての注意喚起は不要である。
なお、第1引用適否判定で引用箇所とされたが、第2引用適否判定で存在していないとされた引用箇所については、図9のステップS329でフラグがクリアされるため、注意喚起の対象とはならない。
In step S403, it is confirmed from the above flag determination whether or not attention is required for the M-th quoted portion.
If all of the citation / reproduction flag F (M) it, flag F (M) 2, flag F (M) 3, and flag F (M) 4 are "0", a warning about the Mth quoted part is issued. Is unnecessary.
It should be noted that, for the citation portion that was determined to be the citation portion in the first citation appropriateness determination, but is not present in the second citation appropriateness determination, the flag is cleared in step S329 of FIG. Does not mean
一方、第Mの引用箇所について注意喚起不要とされなければ、ブログサーバ1はステップS404で、注意喚起内容を設定する。これは、“1”とされているフラグに応じて設定すればよい。
引用/転載フラグF(M)it=1である場合は、転載の可能性があることを示す内容を含む注意喚起を行うようにする。当該箇所の削除を薦めるメッセージを含むようにしてもよい。
フラグF(M)2=1であるときは、引用部分がコンテンツ内で従たる位置づけになっていないことを知らせる内容を含む注意喚起を行うようにする。引用部分の削除や文字数の削減を行うことを薦めるメッセージ、或いは本文を増加させることを薦めるメッセージを含むようにしてもよい。
フラグF(M)3=1であるときは、引用部分についての出典明示が無い(又は記載が誤っている可能性がある)ことを知らせる内容を含む注意喚起を行うようにする。
出典情報を提示するようにしてもよい。
フラグF(M)4=1であるときは、引用部分が本文と明確に区別されていないことを知らせる内容を含む注意喚起を行うようにする。区別のための手法、例えば文字属性の変更などを教える通知を含むようにしてもよい。
On the other hand, if the warning is not required for the M-th quoted portion, the
When the quotation / reprint flag F (M) it = 1, the attention including the content indicating the possibility of reprint is issued. You may make it include the message which recommends deletion of the said part.
When the flag F (M) 2 = 1, the attention is included including the content notifying that the quoted portion is not subordinate in the content. A message recommending deletion of quoted parts or reduction of the number of characters, or a message recommending increasing the text may be included.
When the flag F (M) 3 = 1, the attention including the content notifying that the citation portion is not clearly stated (or the description may be incorrect) is issued.
Source information may be presented.
When the flag F (M) 4 = 1, the attention including the content notifying that the quoted portion is not clearly distinguished from the text is issued. A notification for teaching a method for distinction, for example, a change of character attribute may be included.
このようにフラグに応じて注意喚起内容を設定する。例えばメッセージ内容を設定する。もちろん複数のフラグにより複合的なメッセージを生成してもよい。 In this way, the attention content is set according to the flag. For example, message contents are set. Of course, a composite message may be generated by using a plurality of flags.
ステップS405でブログサーバ1はM≧Mmaxであるか否かを確認し、M≧MmaxでなければステップS406で変数MをインクリメントしてステップS402に戻る。つまり、次の引用箇所についての注意喚起の設定処理に移る。
ブログサーバ1は最後の引用箇所まで処理を終えたか時点でステップS405からS407に移り、注意喚起制御を行う。つまりユーザ端末5に対して、ステップS404で設定した内容の注意喚起が行われるように制御する。
In step S405, the
The
このような注意喚起により、ユーザは著作権侵害の可能性がある箇所を認識でき、必要な修正を行って再度アップロード要求を行えばよいことになる。
ユーザにとっては、不注意、もしくは引用に関する知識の不足によって、知らないうちに著作権侵害となる可能性を生じさせることが未然に防止されることになる。
With such a reminder, the user can recognize the place where there is a possibility of copyright infringement, make the necessary corrections, and issue the upload request again.
For the user, carelessness or lack of knowledge about quoting prevents the possibility of copyright infringement without knowing it.
なお、以上の第1の実施の形態では、コピー元が発見できなかった場合は引用ではないと判定しているが、ペースト箇所については、「引用でしたら出典記載してください」等の注意喚起を行うことも考えられる。 In the first embodiment described above, if the copy source cannot be found, it is determined that it is not a quotation. However , regarding the pasted part, a caution such as "please enter the source if it is a quotation" It is also possible to do.
またアップロード要求の際には第2引用適否判定が行われるが、これは、既に見つけられている引用箇所についてのフラグ設定処理であり、さほど時間のかかる処理ではない。比較的時間のかかる第1引用適否判定はブログ作成中に行われている。従ってユーザがアップロード要求を行った後に、長い待ち時間を生じさせるようなものとはならない。従ってユーザの使用性を悪化させずに適切な注意喚起は可能となる。
また、第2引用適否判定は、最終的にアップロード時点のブログ記事に残されている引用箇所のみについて判定を行えば良く、無駄な判定は不要である。この点もアップロード要求時の迅速な処理の要請に適している。
また第1引用適否判定は、ブログ記事作成中に行われるため、さほどの迅速性は要求されない。これはコピー元の発見に有利であると共に、ブログサーバ1の処理負担を逼迫させないという点で好適となる。
In addition, when the upload request is made, the second quotation adequacy determination is performed, but this is a flag setting process for the already-quoted citation portion, and is not a process that takes much time. The first citation suitability determination, which takes a relatively long time, is performed during the creation of the blog. Therefore, it does not cause a long waiting time after the user makes an upload request. Therefore, it is possible to appropriately call the attention without deteriorating the usability of the user.
Further, the second quotation adequacy determination may be made only for the quotation part left in the blog article at the time of the final upload, and unnecessary determination is unnecessary. This point is also suitable for requesting prompt processing at the time of upload request.
Further, the first quotation adequacy determination is performed while the blog article is being created, so that it is not required to be so prompt. This is advantageous in that the copy source can be found and the processing load on the
<4.第2の実施の形態>
第2の実施の形態のブログサーバ1の処理を図11で説明する。なお図11において図6と同一の処理については同一符号を付し、重複説明を避ける。
図11において図6の処理と異なるのは、ブログサーバ1(判定機会検出部12)の処理としてステップS105、S130〜S134が行われる点である。
<4. Second Embodiment>
The processing of the
11 is different from the process of FIG. 6 in that steps S105 and S130 to S134 are performed as the process of the blog server 1 (determination opportunity detection unit 12).
ますペースト操作が検出された場合、ブログサーバ1の処理はステップS130からS134に進み、ペーストされた部分がテキストデータであって所定文字数未満であるか否かが判定される。所定文字数とは、例えば10文字など、少ない文字数に設定されている。これは、通常、引用とは考えにくい場合の文字数の判断に用いるように設定される。
そして所定文字数以上の場合に、ステップS106に進むようにている。
つまり、もし、ペーストした部分が所定文字数未満のテキストデータの場合は、引用ではない(引用の可能性はきわめて小さい)として、ステップS106の第1引用適否判定の処理には進まないようにしている。
If more paste operations are detected, the process of the
When the number of characters is equal to or more than the predetermined number, the process proceeds to step S106.
In other words, if the pasted part is text data having less than the predetermined number of characters, it is determined that it is not a citation (the possibility of citation is very small), and the process of the first citation appropriateness determination in step S106 is not proceeded. .
このようにすることで、操作頻度が高いと考えられるコピー&ペーストの操作の全てに反応して第1引用適否判定が実行されることを防ぐ。即ち引用の可能性がきわめて低い場合に第1引用適否判定に進むことでブログサーバ1の処理負担が過剰にならないようにしている。
なお、以上の処理は、図7のステップS206と同じ趣旨の処理であり、そもそも第1引用適否判定に入る条件としてペーストした文字数を判定するか否かの違いである。このステップS134の処理を採用する場合、図7のステップS206は不要となる。
By doing so, it is possible to prevent the first citation appropriateness determination from being executed in response to all the copy and paste operations that are considered to be frequently performed. That is, when the possibility of citation is extremely low, the processing load of the
Note that the above processing is the same as that of step S206 in FIG. 7, and the difference is whether or not to determine the number of pasted characters as a condition for entering the first quotation adequacy determination. When the process of step S134 is adopted, step S206 of FIG. 7 is unnecessary.
またこの図11では、ペースト操作の検出以外でも第1引用適否判定が行われる場合があるようにしている。
ステップS130でブログサーバ1は、ブログ作成としてユーザによって入力されているテキストデータが所定量進行したか否か判定している。これは、例えば前回のステップS132の判定後に、未判定のテキスト量が所定量以上入力されたか否かを判定する。
所定量とは、厳密に文字数のみで判定するのではなく、所定量の文字数以上であって、文章として1以上の段落、改行、行空けなどで区切られた範囲の入力があったか否かを判断すると良い。
Further, in FIG. 11, the first quotation adequacy determination may be performed in some cases other than the detection of the paste operation.
In step S130, the
The predetermined amount is not strictly determined only by the number of characters, but it is determined whether or not the number of characters is equal to or more than a predetermined amount, and there is an input in a range delimited by one or more paragraphs, line breaks, line breaks, etc. as a sentence. Good to do.
このような条件が満たされた場合、ブログサーバ1はステップS131に進んで、その新たに入力された部分のテキストデータを判定用に取得し、ステップS132で自己文章判定を行う。
これは、当該入力されたテキストデータが、そのユーザ自身の文章と推定できるか否かを判定するものである。
例えば当該ユーザの他のブログ記事、或いは作成中の他の部分の文章について文体解析を行っておき、当該ユーザの文章の癖・傾向を把握しておく。これは各ブロガーについて予め行っておいても良い。そしてステップS132では、新たに入力された部分について、同様の解析を行い、文章の癖・傾向を判定する。そして、それらを比較することで、今回入力された部分が、当該ブロガーが自身で発した文章であるか否かを推定する。
When such a condition is satisfied, the
This is to determine whether or not the input text data can be estimated as the user's own text.
For example, stylistic analysis is performed on another blog article of the user or the text of another portion being created, and the habit / propensity of the text of the user is grasped. This may be done in advance for each blogger. Then, in step S132, similar analysis is performed on the newly input portion to determine the habit / propensity of the sentence. Then, by comparing them, it is estimated whether or not the part input this time is a sentence that the blogger has uttered himself.
文章の癖や傾向を判定する要素としては、例えば多用するワード、句読点の癖(挿入頻度)、絵文字等の使用の傾向(使用の多寡)、特定の記号(「?」「!」等)の使用頻度、一文の長さ、体言止め等の特定の文体の使用頻度、改行の頻度、「です・ます」調と「である」調の使用傾向、外国語や外国文字の混入の頻度、などが考えられる。これらの点をそれぞれ数値化して比較し、類似性を判定する。そして類似性が確認できれば、ユーザ本人が創作した文章であると推定する。 As elements for determining a habit or tendency of a sentence, for example, frequently used words, punctuation habits (insertion frequency), tendency of using pictograms (frequency of use), specific symbols (“?” “!”, Etc.) Frequency of use, length of one sentence, frequency of use of specific styles such as stylization, frequency of line breaks, tendency to use "do-masu" and "is" key, frequency of mixing foreign languages and characters, etc. Can be considered. These points are digitized and compared to determine the similarity. If the similarity can be confirmed, it is estimated that the sentence is created by the user himself.
ブログ記事作成中のユーザ本人が考えた文章であると推定される場合は、ブログサーバ1はステップS133で自己文章と判定し、ステップS103に戻る。もしユーザ本人が考えた文章であると推定されない場合は、ブログサーバ1はステップS106に進み、当該箇所について第1引用適否判定を行う。
つまり、ブログ記事作成中のテキストデータについて、文体の特徴が異なる部分を検出した場合、当該部分の判定機会と検出して第1引用適否判定を行うものである。
When the
That is, in the text data in which the blog article is being created, when a portion having different style characteristics is detected, it is detected as a determination opportunity of the portion, and the first citation appropriateness determination is performed.
以上のように第2の実施の形態では、第1引用適否判定の処理を行うための判定機会の検出手法が第1の実施の形態と異なる。
これにより、ペースト処理に過剰に反応しないようにできる。
また、ペースト以外で他人の文章を引用するような場合にも引用適否判定の処理を適用できることになる。
As described above, the second embodiment is different from the first embodiment in the method of detecting the determination opportunity for performing the processing of the first quotation adequacy determination.
As a result, it is possible to prevent the paste processing from excessively reacting.
Further, the quoting adequacy determination process can be applied to a case where a person's text is cited by means other than paste.
<5.第3の実施の形態>
第3の実施の形態の処理を図12で説明する。これは図3に示した引用通知部16の機能を加えた処理例である。
図12は、図4のアップロード(S14,S27)の後の処理として、ユーザ端末5、ブログサーバ1、及び引用元となったウェブページの管理者のユーザ端末(区別のため「ユーザ端末5A」と表記する)の処理及び通信を示している。
<5. Third Embodiment>
The processing of the third embodiment will be described with reference to FIG. This is an example of processing in which the function of the
FIG. 12 shows the
ブログサーバ1はステップS27でアップロード処理を完了したら、ステップS28で、今回アップロードしたブログ記事に引用箇所があったか否かを確認する。
引用箇所がないブログ記事の場合は、ステップS35に進んで、当該ブログ記事を公開対象とする。
After completing the upload process in step S27, the
If the blog article does not have a quoted portion, the process proceeds to step S35, and the blog article is made public.
引用箇所があった場合、ブログサーバ1はステップS29に進んで、通知条件を判定する。例えば第1,第2引用適否判定の処理の結果から、引用の適法性が高いか否かを通知条件として判定し、適法性が高いということに該当しない場合は引用元に通知を行うものとする。
If there is a quoted portion, the
例えば引用の適法性が高い場合は、通知不要とし、ブログサーバ1はステップS30からS35に進むが、それに該当しない場合、ステップS31に進んで、引用元のウェブページの管理者に対して通知処理を行う。例えばユーザ端末5Aにおいて引用箇所を明示して引用が行われたことを、引用元のユーザに提示する。またそれに対して許可/不許可の回答を求めるようにする。ユーザ端末5Aにおいては、ステップS51でこれらの内容が表示される。
For example, if the legality of the citation is high, the notification is unnecessary, and the
引用元のユーザが回答を行った場合(S52)、ブログサーバ1はステップS32で回答を確認し、公開許可の回答が得られたか否かを判定する。
なお、引用元のユーザからの回答が得られない場合もある。ブログサーバ1はある程度の期間を経ても回答が得られない場合は、公開禁止がされなかったとみなしてもよい。なぜなら、そもそもアップロードしたブログ記事は、第1、第2引用適否判定を経て、また場合によっては注意喚起処理を経ており、これらをクリアして、ある程度の適法性が担保されたものと言えるためである。
なお、もちろん引用元のユーザからの回答が得られない限り、公開はされないような運用を行ってもよい。
When the quoting source user makes an answer (S52), the
In some cases, the reply from the quoting user may not be obtained. If the
It should be noted that, of course, the operation may not be made public unless an answer is obtained from the quoting user.
公開許可となった場合は、ブログサーバ1はステップS33からS35に進む。一方、公開許可とならなかった場合は、ブログサーバ1はステップS34に進み、ブログ記事作成を行ったユーザのユーザ端末5に対して、修正通知を送信する。この際、引用箇所の削除や適切なクレジット表示などを促すことができる。
ユーザ端末5では修正通知が表示される(S15)。その後、ユーザはそれに応じて例えば引用箇所の削除などの修正を行い(S16)、再度アップロードすればよい。
When the publication is permitted, the
A correction notice is displayed on the user terminal 5 (S15). After that, the user may make corrections such as deletion of quoted portions accordingly (S16) and upload again.
このように引用箇所の出典元が他のブログ記事等のウェブページであった場合に、引用元のユーザに引用が行われた旨を通知することで、引用元のユーザは引用状況を確認できる。
また引用元ユーザに引用箇所の使用可否を問い合わせ、不許可の場合はブログ記事作成を行ったユーザに通知し修正を求めることで、ユーザ間のトラブルも未然に防ぐことができる。
In this way, when the source of the quoted portion is a web page such as another blog article, by notifying the quoting user that the citation has been made, the quoting source user can confirm the citation status. .
Further, by asking the quoting source user whether or not the quoted portion can be used, and if the quoting portion is not permitted, the user who created the blog article is notified and correction is requested, whereby troubles between users can be prevented.
<7.まとめ及び変形例>
以上の実施の形態では次のような効果が得られる。
ブログサーバ1は、ユーザ端末5におけるブログ記事(コンテンツ)作成中に引用に関する判定機会が発生したことを検出する判定機会検出部12と、判定機会検出部12により判定機会が検出されたことに応じて、ブログ記事作成中に、ユーザ端末5における閲覧履歴情報を用いた引用適否判定を行う第1引用適否判定部13と、ユーザ端末5からのブログ記事のアップロード要求のタイミングで、設定された判定基準を用いて引用適否判定を行う第2引用適否判定部14と、第1引用適否判定と第2引用適否判定の結果に応じて、ユーザ端末5において注意喚起表示を実行させる処理を行う注意喚起部15を備える。
例えば作成中のブログ記事内に他のコンテンツのテキストデータや画像データをペーストしたような場合、ユーザは、それを適切な引用として信じて行う場合もあれば、著作権等に無関心で何も気にせずに行う場合もある。また、実際に合法的な引用となっているか否かは判断が難しく、或いは判定できないことも多い。そのような場合、アップロードされて公開されたブログ記事は著作権侵害リスクを負うことになる。
本実施の形態の処理によれば、このようなリスクが生じる場合に、アップロードの段階でユーザ(ブロガー)に警告、注意喚起でき、リスクのあるブログ記事の公開を未然に防ぐことができる。
またこのような注意喚起が行われることで、善意のユーザがある程度自由かつ安心してブログ作成を行う環境が提供できることにもなる。
そして特に第1引用適否判定は、ユーザのブログ作成中に行うようにしている。第1引用適否判定では、閲覧履歴を用いて、ユーザが閲覧したウェブページにおいて、同内容のテキストデータや画像データが存在するかを確認していく処理を行い、コピー元(出典元)を探索する。この探索はある程度処理時間がかかる可能性があるが、ブログ作成中に行うことで、その時間をユーザに感じさせないようにすることができる。換言すれば、アップロード時にこのような処理を行うと、当該判定を含むアップロード時間が長時間化し、ユーザにとって利便性の悪いものとなるが、そのような事態を生じさせないことになる。
また、第1引用適否判定では、膨大なウェブサイトをクローリングするのではなく、ユーザの操作履歴/履歴情報を用いて特定のウェブサイトを対象とすることで、処理負担は著しく低減されつつ、引用元を発見できる可能性は高いものとなる。
また第2引用適否判定は、アップロード操作時点(ユーザがブログ完成と認識した時点)で行うことで、適法な引用の要件の1つである、当該ブログ記事内での本文と引用部分の量的な関係を正しく判断できる。換言すれば、ユーザが本文を書き進めること等に応じて何度も量的な関係を判断し直す必要はないため無駄な処理が起こらないことになる。
また注意喚起は、アップロード操作時点(ユーザがブログ完成と認識した時点)で行うことで、作成中にむやみな指示が行われない。例えばユーザは一旦ペーストしたとしても、それをそのまま用いずに、削除したり、編集して全く異なる文章にしたりして、引用とは無関係になる場合も多い。そのため都度注意喚起していくと、ユーザが「これから直そうと思っていたのに・・・」等の気持ちをおこさせる状況にもなり、快適なブログ作成環境ではなくなってしまう恐れがある。このような過度あるいは無用の注意喚起を行わないことで、ユーザに使用性のよいブログ作成環境を提供できる。
以上により実施の形態では、ユーザに快適なブログ作成環境を提供しながら、不適切な引用がされたブログが公開されないようにアシストすることができる。
<7. Summary and Modifications>
In the above embodiment, the following effects can be obtained.
The
For example, when text data or image data of other content is pasted into the blog article being created, the user may believe it as a proper citation, or may be indifferent to copyright etc. It may be done without doing it. Moreover, it is often difficult or impossible to judge whether or not the quote is actually legal. In such cases, the uploaded and published blog posts carry the risk of copyright infringement.
According to the processing of the present embodiment, when such a risk occurs, it is possible to warn the user (blogger) at the stage of uploading and warn the user, and it is possible to prevent the publication of a risky blog article.
In addition, such an alert can provide an environment in which a well-meaning user can create a blog with some freedom and peace of mind.
Then, in particular, the first quotation propriety determination is performed while the user's blog is being created. In the first citation suitability determination, a process of checking whether or not text data or image data having the same content exists in the web page browsed by the user by using the browsing history, and searches for the copy source (source). To do. This search may take a certain amount of processing time, but by performing it while the blog is being created, it is possible to prevent the user from feeling the time. In other words, if such a process is performed at the time of uploading, the uploading time including the determination becomes long and inconvenient for the user, but such a situation will not occur.
Further, in the first quotation propriety judgment, rather than crawling a huge website, by targeting a specific website by using the operation history / history information of the user, the processing load is significantly reduced, and the quotation is performed. The chance of discovering the origin is high.
The second quotation propriety determination is performed at the time of the upload operation (at the time when the user recognizes that the blog is completed), and is one of the requirements for legal quotation. Can correctly judge the relationship. In other words, since the user does not need to repeatedly judge the quantitative relationship in response to the text being written, the wasteful processing will not occur.
Also, the alert is issued at the time of the upload operation (when the user recognizes that the blog is completed), so that no unnecessary instruction is given during the creation. For example, even if the user once pastes it, he or she does not use it as it is, but deletes it or edits it into a completely different sentence, so that it is often unrelated to the citation. Therefore, if the user is alerted each time, the situation may cause the user to feel "I thought I should fix it ...", but the blog creation environment may not be comfortable. It is possible to provide the user with a blog creation environment with good usability by avoiding such excessive or unnecessary alerting.
As described above, in the embodiment, it is possible to provide a comfortable blog creation environment to the user and assist the blog with inappropriate quoting from being published.
第1の実施の形態では、ユーザ端末5において、適正な引用とするためのガイド情報を含む注意喚起表示を実行させる例を述べた。例えば出典記載のアシストのための情報、ペースト部分の一部削除やブログ本文の追加等を薦めるメッセージ、出典記載や記載態様などのモデルの提示などである。
ユーザにとっては、例えば適正な引用を意図していたとしても、実際には引用部分の記載態様をどのようにすれば適正なのかどうかはわかりにくいことが多い。そこで、注意喚起の際に、どのようにすれば良いかをガイドすることで、ユーザは容易に必要な修正を施すことができる。これによって、ユーザの作成したブログ記事を無駄にすることなく、引用態様の修正によりアップロードを受け付けることも可能となる。
なお、ユーザが修正しなくとも、例えばユーザの同意を要求したうえで、引用部分の記載態様を自動修正することも考えられる。例えば文字サイズやフォントを変更したり、出店情報を追加したりする。これによってユーザの修正の手間を省くこともできる。
In the first embodiment, the example has been described in which the
For example, even if the user intends to properly quote, it is often difficult to know how to actually describe the quoted part. Therefore, the user can easily make necessary corrections by guiding what to do when calling attention. This makes it possible to accept uploads by modifying the quotation mode without wasting the blog articles created by the user.
It should be noted that even if the user does not revise, it is possible to automatically correct the description mode of the quoted portion after requesting the user's consent. For example, the font size and font are changed, and store opening information is added. This can save the user the trouble of correction.
第1,第2の実施の形態では、作成中のブログ記事においてペースト操作が検出されることで、ペースト部分についての判定機会と検出する例を述べた。
引用部分は通常、テキストデータ又は画像データのコピー&ペースト操作により作成中のコンテンツ内に挿入される。従って、ペースト操作があった場合は、仮に引用が行われたとして第1引用適否判定が行われるようにする。
ペースト操作を検知することで、引用の可能性のある部分について引用判定処理を実行することができ、判定漏れを少なくすることができる。またペースト操作を検知するという容易な処理で、引用の可能性を推定でき、判定機会の検出が容易となる。
なお、一般的な操作として、コピー&ペーストを行った直後に、ペーストされた文章を編集するということも行われる。例えば参考になる文章をコピーしたうえで、それを編集して自分の望みの文章を記述するような場合である。そのような場合には第1引用適否判定は無駄な処理となる可能性がある。そこで、ペースト操作を検出した後、そのペースト部分の編集が行われずに、所定時間経過したり、他の文章の入力に進んだ場合に、例えば図6のステップS105のペースト検出と判定してもよい。これにより無用な処理が発生することを防止できる。
In the first and second embodiments, an example has been described in which the paste operation is detected in the blog article being created, so that the paste operation is detected as a determination opportunity.
The quoted portion is usually inserted into the content being created by a copy and paste operation of text data or image data. Therefore, if there is a paste operation, it is determined that the quotation has been performed and the first quotation adequacy determination is performed.
By detecting the paste operation, the citation determination process can be executed for a portion that may be cited, and omission of the determination can be reduced. In addition, the possibility of citation can be estimated by the simple process of detecting the paste operation, and the determination opportunity can be easily detected.
As a general operation, the pasted sentence may be edited immediately after the copy and paste. For example, you may want to copy a reference text and edit it to describe your desired text. In such a case, the first quotation adequacy determination may be a useless process. Therefore, after the paste operation is detected, if the paste portion is not edited and a predetermined time elapses or input of another sentence is made, even if it is determined that the paste is detected in step S105 of FIG. 6, for example. Good. As a result, it is possible to prevent unnecessary processing from occurring.
第2の実施の形態では、作成中のブログ記事において所定文字数以上のペースト操作が検出されることで、ペースト部分についての判定機会と検出する例を述べた。
コピー&ペーストの操作はユーザによっては文書作成中に頻繁に行われる操作であり、また少数の文字のペースト操作も良く行われる。するとペースト操作に応じて第1引用適否判定が行われるのは処理負担を過度に増すことになってしまう。そこで引用とは通常考えにくい少数の文字のペースト操作の場合は、引用と推定せず、無駄な第1引用適否判定が行われないようにする(図11のS134参照)。これによりブログサーバ1の処理負担を軽減することができる。
In the second embodiment, an example has been described in which the paste operation of a predetermined number of characters or more is detected in the blog article being created, and the paste operation is detected as the determination opportunity.
The copy and paste operation is an operation that is frequently performed by a user during document creation, and a paste operation of a small number of characters is often performed. Then, the first quotation adequacy determination is made in accordance with the paste operation, which unnecessarily increases the processing load. Therefore, in the case of a paste operation of a small number of characters, which is normally difficult to think of as a citation, it is not estimated as a citation and the useless first citation appropriateness determination is not performed (see S134 in FIG. 11). This can reduce the processing load on the
第2の実施の形態では、作成中のブログ記事におけるテキストデータについて、文体の特徴が異なる部分を検出した場合、当該部分の判定機会と検出する例を述べた。
つまり言葉遣いの相違などから引用箇所を推定する。例えば、ユーザの過去投稿を参照して、形態素解析によってユーザ文体の特徴を特定し、記事内においてユーザ文体でない箇所を引用箇所とする。
ブログ記事を作成するユーザの文体は、ブログ内である程度統一されている。文章中に、通常とは異なる文体の部分が存在したら、その部分は他人の文章である可能性があると推定できる。そこでこのような場合を引用に関する判定機会とすることで、コピー&ペーストの操作によらない引用部分についても引用適否判定の対象とすることができる(図11のS131からS133参照)。
特に図11の処理のようにコピー&ペーストの操作検知による推定と併用することで、引用の可能性のある部分を高い確率で判定できる。
In the second embodiment, an example has been described in which, in the text data of the blog article that is being created, when a portion having different style characteristics is detected, the portion is detected as a determination opportunity.
In other words, the quoted part is estimated from the difference in wording. For example, referring to the user's past post, the characteristics of the user writing style are specified by morphological analysis, and the portion other than the user writing style in the article is set as the quoted portion.
The style of users who create blog articles is unified to some extent within the blog. If there is a part of the writing style that is different from the usual style in the sentence, it can be inferred that the part may be another person's writing. Therefore, by using such a case as a judgment opportunity regarding citation, it is possible to make a citation appropriateness judgment target even for a citation portion that is not operated by copy and paste (see S131 to S133 in FIG. 11).
In particular, by using together with the estimation based on the operation detection of copy and paste as in the processing of FIG. 11, it is possible to determine a portion having a possibility of being quoted with high probability.
第1の実施の形態では、第1引用適否判定において閲覧履歴情報で示されるウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行う例を述べた。
ブログ記事を執筆するユーザは、作成中、又は作成前に直近まで閲覧していたウェブページから引用を行うことがあると考えられる。そこで引用元の探索のためのクローリングを行う範囲を閲覧履歴に基づいて絞る(図7のS207〜S210参照)。これによりコピー元の探索処理負担が低減される。
In the first embodiment, an example of performing a process of searching the web page data indicated by the browsing history information in the first citation suitability determination and confirming whether or not the same data as the portion estimated as the citation exists Said.
It is considered that a user who writes a blog article may quote from a web page that was being viewed or was being viewed before creation. Therefore, the range of crawling for searching the citation source is narrowed down based on the browsing history (see S207 to S210 in FIG. 7). As a result, the processing load for searching the copy source is reduced.
第1の実施の形態では、第1引用適否判定は、閲覧履歴情報で示されるウェブページデータのうちで、閲覧時刻条件により抽出したウェブページデータを探索して、引用と推定された箇所と同一データが存在するか否かを確認する処理を行う例を述べた。
即ち閲覧履歴情報の全てではなく、例えば直近の所定時間内であるとか、ブログ作成開始後であるとかの閲覧時刻条件に該当するウェブページデータからテキストデータ又は画像データのコピー元を探索する。
ブログ記事に対してコピー&ペーストの操作を行うユーザは、近い時間に閲覧した他のウェブページからテキストデータや画像データをコピーすることが通常である。
特にコピー&ペーストの操作により引用部分を貼り付ける場合、そのコピー操作はブログ記事の作成中に行われることが多いと想定される。
そこで閲覧時刻の条件により、探索するウェブページを選択する(図7のS208参照)。これによりコピー元の探索処理負担をさらに低減しつつ、探索範囲の精度が低下しないようにすることができる。
In the first embodiment, the first citation suitability determination is the same as the location estimated to be a citation by searching the web page data extracted by the browsing time condition in the web page data indicated by the browsing history information. The example of performing the process to confirm whether or not the data exists has been described.
That is, not all of the browsing history information, but the copy source of the text data or the image data is searched for from the web page data corresponding to the browsing time condition such as within the latest predetermined time or after the start of blog creation.
A user who performs a copy & paste operation on a blog article usually copies text data or image data from another web page viewed in a short time.
In particular, when a quoted portion is pasted by a copy and paste operation, it is assumed that the copy operation is often performed during the creation of a blog article.
Therefore, the web page to be searched is selected according to the condition of the browsing time (see S208 in FIG. 7). As a result, it is possible to prevent the accuracy of the search range from lowering while further reducing the load of the search processing of the copy source.
第1の実施の形態では、第2引用適否判定において、判定基準の1つとして、引用箇所の出典を示す情報の有無を判定する例を挙げた。
即ち引用と推定された部分に対して、出典(引用元)が記載されているか否かを確認する。
出典明記は適正な引用の一要素と考えられるため、その有無を判定することで、適正性の要件の1つを担保できる。これによりユーザに適切なガイドを行うことが可能となる(図9のS314,S324参照)。
具体的には、例えば他のウェブページのURL、タイトル等の有無を判定する。
なお、元々ユーザが作成した段階で引用部分に対してURL等が記載されていた場合、出典記載が妥当か否かも判定できる。例えば、記事内に引用箇所とURLとが組み合わせて配置されているが、URLから参照したウェブページに当該引用箇所がなかった場合、出典は妥当ではないと判定することも可能であり、その場合に注意喚起とともに「記載された出典が間違っている可能性があります」等のメッセージ表示を行うことも考えられる。
In the first embodiment, an example of determining the presence or absence of the information indicating the source of the quoted portion is given as one of the determination criteria in the second quotation adequacy determination.
That is, it is confirmed whether or not the source (citation source) is described for the portion estimated to be cited.
Since it is considered that the citation of the source is one element of proper citation, it is possible to guarantee one of the requirements for appropriateness by determining the presence or absence of it. As a result, it is possible to properly guide the user (see S314 and S324 in FIG. 9).
Specifically, for example, it is determined whether or not there is a URL of another web page, a title, or the like.
In addition, when the URL or the like is described for the quoted portion at the stage of the original creation by the user, it can be determined whether or not the citation is valid. For example, if a quoted part and a URL are arranged in combination in an article, but the quoted part is not found in the web page referenced from the URL, it is possible to determine that the source is not valid. In that case It is also possible to display a message such as "The written source may be incorrect" together with the warning.
第1の実施の形態では、第2引用適否判定において、判定基準の1つとして、引用箇所とコンテンツ本文の分量の比率について判定する例を挙げた。
即ち引用と推定された部分と本文の分量を比較する。
引用箇所と本文(当該引用箇所を除いた箇所)の分量の比率(コンテンツ内の主従関係)は適正な引用の判定基準の1つとなると考えられるため、これを判定する(図9のS310、S320参照)。これにより引用が適切か否かの1要素を確認し、ユーザに通知できるようにすることで、ユーザに適切なガイドを行うことが可能となる。
In the first embodiment, an example in which the ratio of the amount of the quoted portion and the content body is determined as one of the determination criteria in the second quotation propriety determination has been described.
That is, the amount of the quoted part and the amount of the text are compared.
It is considered that the ratio (the master-slave relationship in the content) of the amount of the quoted part and the text (the part excluding the quoted part) is one of the appropriate judgment criteria for the quote, and therefore this is judged (S310 and S320 in FIG. 9). reference). Thus, by confirming one element of whether the citation is appropriate and notifying the user, it is possible to provide the user with an appropriate guide.
第1の実施の形態では、第2引用適否判定において、判定基準の1つとして、引用箇所の文字態様とコンテンツ本文の文字態様との異同について判定する例を挙げた。
即ち引用と推定された部分が本文と明確に異なる態様で記載されているかを判定する。
引用箇所が本文(当該引用箇所を除いた箇所)内において明確であることは、適正な引用の判定基準の1つとなると考えられるため、これを判定する(図9のS318参照)。これにより引用が適切か否かの1要素を確認し、ユーザに通知できるようにすることで、ユーザに適切なガイドを行うことが可能となる。
In the first embodiment, an example of determining the difference between the character aspect of the quoted portion and the character aspect of the content body as one of the determination criteria in the second quotation propriety determination has been described.
That is, it is determined whether or not the portion estimated to be cited is described in a manner that is clearly different from the text.
It is considered that one of the appropriate citation determination criteria is that the quoted portion is clear in the text (excluding the quoted portion), so this is determined (see S318 in FIG. 9). Thus, by confirming one element of whether the citation is appropriate and notifying the user, it is possible to provide the user with an appropriate guide.
第3の実施の形態では、引用が行われたことを出典元に通知する処理を行う引用通知部16を備えた場合を述べた。
これにより出典元のユーザは引用状況を確認できる。また出典元のユーザの考えをブログ作成者にフィードバックすることができる。例えば引用元からの許可の回答があった場合は、ブロガーは安心してブログ記事を公表できることになる。また、引用元からの不許可の回答があった場合は、ブロガーはそれに応じた対処(ブログ記事内容の修正など)を行うことができる。
なお出典元のユーザが引用箇所の使用を拒否した場合には、引用を行ったユーザにその旨が通知するとともに引用箇所の削除、適切なクレジット表示などを促すことも可能である。これらの対処により、ユーザ間でのトラブルを未然に防止する機能も果たすことができる。
In the third embodiment, the case has been described in which the
This allows the source user to confirm the citation status. In addition, the idea of the source user can be fed back to the blog creator. For example, bloggers can publish their blog posts with peace of mind if they get permission from the source. Also, if there is a disapproval response from the quoting source, the blogger can take appropriate measures (such as correction of blog article contents).
If the source user refuses to use the quoted portion, it is possible to notify the quoting user of the fact and to prompt the user to delete the quoted portion or display an appropriate credit. By these measures, the function of preventing troubles between users can be fulfilled.
実施の形態の処理例は一例であり、他にも各種の変形例が想定される。
第1引用適否判定を行う判定機会の検出や、第2引用適否判定での判定項目は他にも考えられる。
また実施の形態の技術はブログに限らず、テキストや画像(静止画・動画)による各種のコンテンツに適用できる。
The processing example of the embodiment is an example, and various other modified examples are possible.
There are other possible detection items such as the detection of the determination opportunity for the first citation appropriateness determination and the determination items for the second citation appropriateness determination.
Further, the technology of the embodiment is applicable not only to blogs but also to various contents such as texts and images (still images / moving images).
<8.プログラム及び記憶媒体>
実施の形態のプログラムは、ブログサーバ1における少なくとも判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15の処理を情報処理装置(CPU等)に実行させるプログラムである。
<8. Program and storage medium>
The program of the embodiment executes at least the processing of the determination
実施の形態のプログラムは、端末装置におけるコンテンツ作成中に引用に関する判定機会が発生したことを検出する判定機会検出機能(S105,S130〜S134)と、判定機会検出機能により判定機会が検出されたことに応じて、コンテンツ作成中に端末装置における閲覧履歴情報を用いた引用適否判定を行う第1引用適否判定機能(S106、及び図7,図8)と、端末装置からのコンテンツのアップロード要求のタイミングで設定された判定基準を用いて引用適否判定を行う第2引用適否判定機能(S110、及び図9)と、第1引用適否判定機能による判定結果と第2引用適否判定機能による判定結果に応じて、前記装置において注意喚起表示を実行させる処理を行う注意喚起機能(S120、及び図10)とを情報処理装置に実行させるプログラムである。
The program according to the embodiment includes a determination opportunity detection function (S105, S130 to S134) for detecting that a determination opportunity for citation has occurred during content creation in the terminal device, and a determination opportunity detected by the determination opportunity detection function. According to the first quotation propriety determination function (S106 and FIG. 7, FIG. 8) that determines the quotation propriety using the browsing history information in the terminal device during content creation, and the timing of the content upload request from the terminal device. According to the second quotation propriety determination function (S110 and FIG. 9) for performing the quotation propriety determination using the criterion set in
このようなプログラムにより、上述したブログサーバ1としての1又は複数の情報処理装置を実現できる。
そしてこのようなプログラムはコンピュータ装置等の機器に内蔵されている記憶媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記憶しておくことができる。あるいはまた、半導体メモリ、メモリカード、光ディスク、光磁気ディスク、磁気ディスクなどのリムーバブル記憶媒体に、一時的あるいは永続的に格納(記憶)しておくことができる。またこのようなリムーバブル記憶媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記憶媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN、インターネットなどのネットワークを介してダウンロードすることもできる。
With such a program, one or more information processing devices as the
Then, such a program can be stored in advance in a HDD as a storage medium built in a device such as a computer or a ROM in a microcomputer having a CPU. Alternatively, it can be stored (stored) temporarily or permanently in a removable storage medium such as a semiconductor memory, a memory card, an optical disk, a magneto-optical disk, or a magnetic disk. Further, such a removable storage medium can be provided as so-called package software.
Further, such a program can be installed from a removable storage medium to a personal computer or the like, or can be downloaded from a download site via a network such as a LAN or the Internet.
また、このようなプログラムをアプリケーションプログラムとしてユーザ端末5にインストールされるようにし、ユーザ端末5において上述の処理が実行されるようにしてもよい。即ち実施の形態のブログサーバ1による例えば判定機会検出部12、第1引用適否判定部13、第2引用適否判定部14、注意喚起部15の処理を、ユーザ端末5にインストールされたアプリケーションプログラムにより実行するようにする。これによりブログ作成中にブログサーバ1との通信を介さずに、使用性のよいブログ作成環境を提供しつつ、不適切な引用がされたブログがアップロードされないようにアシストすることができる。その場合、ユーザ端末5が請求項でいう情報処理装置に該当することにもなる。
Further, such a program may be installed in the
1…ブログサーバ、2…ネットワーク、5…ユーザ端末、11…ブログ管理部、12…判定機会検出部、13…第1引用適否判定部、14…第2引用適否判定部、15…注意喚起部、16…引用通知部、51…ブログDB、52…画像DB、53…管理DB
DESCRIPTION OF
Claims (9)
前記判定機会検出部により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定部と、
前記第1引用適否判定部が取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定部と、
前記第1引用適否判定部の判定結果と前記第2引用適否判定部の判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起部と、を備えた
情報処理装置。 By paste operation is detected during content creation in the terminal device, a determination chance detector for detecting a determination opportunities for citing paste portions as determination target has occurred,
In response to detection of the determination opportunity by the determination opportunity detection unit, during the creation of the content , the web page data indicated by the browsing history information in the terminal device is searched and the same as the determination target portion is searched. A first quotation adequacy determining unit that performs, as a source information, information of a web page in which the same data as the determination target portion is present, while performing processing for confirming whether data exists
A process of determining whether or not the source information acquired by the first quotation adequacy determining unit is described in the content; and a ratio of the determination target text amount to the total text amount of the content or a total display surface of the content. A process of determining whether the ratio of the image data of the determination target is equal to or more than a predetermined threshold value, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. A second quotation adequacy determining unit that performs, at the timing of the content upload request from the terminal device ,
An information processing apparatus, comprising: a cautioning unit that performs a process of causing a caution display in the terminal device according to the determination result of the first quotation propriety determination unit and the determination result of the second quotation propriety determination unit.
前記第1引用適否判定部によりペースト操作に係るデータ部分が、前記判定対象とされた部分と同一データが存在したウェブページ内のデータの一部とはいえない量であると判定された場合、
前記第2引用適否判定部により、前記出典情報が前記コンテンツに記載されていないと判定された場合、
前記第2引用適否判定部により、前記判定対象とされた部分の割合が前記閾値以上であると判定された場合、又は、
前記第2引用適否判定部により、前記判定対象とされた部分の文字属性が前記コンテンツの前記判定対象以外の本文と異なっていないと判定された場合、
のいずれかに該当することに応じて、それぞれの判定ごとに設定された適正な引用とするためのガイド情報を含む注意喚起のメッセージを作成し前記端末装置に表示させる処理を行う
請求項1に記載の情報処理装置。 The alert part is
When the first quotation adequacy determining unit determines that the data portion related to the paste operation is an amount that cannot be said to be a part of the data in the web page in which the same data as the determination target portion exists,
When the second citation suitability determination unit determines that the source information is not described in the content,
When the second quotation adequacy determining unit determines that the proportion of the determination target portion is equal to or more than the threshold value, or
When the second quotation adequacy determining unit determines that the character attribute of the portion to be determined is not different from the text of the content other than the determination target,
In response to any of the above conditions, a process of creating a caution message including guide information for setting appropriate citations set for each determination and displaying the message on the terminal device is performed. The information processing device described.
請求項1又は請求項2に記載の情報処理装置。 The determining opportunity detecting unit, by a predetermined number or more of the paste operation is detected in the content being created, to claim 1 or claim 2 for detecting that the judgment opportunities for citing paste portions as determination target has occurred The information processing device described.
請求項1から請求項3のいずれかに記載の情報処理装置。The information processing apparatus according to any one of claims 1 to 3.
請求項1から請求項4のいずれかに記載の情報処理装置。 The first quotation adequacy determining unit searches the web page data indicated by the browsing history information for the web page data extracted according to the browsing time condition, and the same data as the determination target portion exists. Perform processing to confirm whether or not
The information processing device according to any one of claims 1 to 4 .
請求項1から請求項5のいずれかに記載の情報処理装置。 Based on the source information acquired by the first quotation adequacy determining unit , a quotation notifying unit is provided for performing a process of notifying the source that the quotation has been performed.
The information processing device according to any one of claims 1 to 5 .
端末装置におけるコンテンツ作成中にペースト操作が検出されることで、ペースト部分を判定対象として引用に関する判定機会が発生したと検出する判定機会検出ステップと、
前記判定機会検出ステップにより判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定ステップと、
前記第1引用適否判定ステップにおいて取得した前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定ステップと、
前記第1引用適否判定ステップの判定結果と前記第2引用適否判定ステップの判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起ステップと、
を行う情報処理方法。 As an information processing method performed by the information processing device,
A decision opportunity detecting step of detecting that a paste opportunity is detected during content creation in the terminal device, and that a decision opportunity regarding citation is generated with the paste portion as a determination target ,
In response to the determination opportunity being detected by the determination opportunity detection step , the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content to identify the same as the portion to be determined. A first citation appropriateness determination step of performing, as a source information, information of a web page in which the same data as the determination target portion is present, while performing a process of confirming whether data exists
A process of determining whether or not the source information acquired in the first citation appropriateness determination step is described in the content, and a ratio of the determination target text amount to the total text amount of the content or the total display surface A process of determining whether the ratio of the image data of the determination target is equal to or more than a predetermined threshold value, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. And a second quotation adequacy determination step for performing at the timing of an upload request for the content from the terminal device ,
An alerting step of performing a process of performing an alerting display in the terminal device according to the determination result of the first quotation adequacy determining step and the determination result of the second quotation adequacy determining step;
Information processing method to perform.
前記判定機会検出機能により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定機能と、
前記第1引用適否判定機能により取得された前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定機能と、
前記第1引用適否判定機能による判定結果と前記第2引用適否判定機能による判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起機能と、
を情報処理装置に実行させるプログラム。 A decision opportunity detection function that detects that a paste opportunity is detected during content creation in the terminal device and that a decision opportunity regarding citation has occurred with the paste portion as the determination target ,
When the determination opportunity is detected by the determination opportunity detection function , the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content, and the same as the determination target portion is searched. A first citation suitability determination function for performing, as a source information, information of a web page in which the same data as the determination target portion is present, while performing processing for confirming whether data exists
A process of determining whether or not the source information acquired by the first quotation adequacy determining function is described in the content, and a ratio of the text amount of the determination target to the total text amount of the content or a total display surface A process of determining whether the ratio of the image data of the determination target is equal to or greater than a predetermined threshold, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. And a second quotation adequacy determining function for performing at the timing of an upload request for the content from the terminal device ,
An alert function that performs a process of causing an alert display in the terminal device according to the determination result by the first quotation propriety determination function and the determination result by the second quotation propriety determination function;
A program that causes an information processing device to execute.
前記判定機会検出機能により判定機会が検出されたことに応じて、前記コンテンツ作成中に、前記端末装置における閲覧履歴情報で示されるウェブページデータを探索して、前記判定対象とされた部分と同一データが存在するか否かを確認する処理を実行するとともに、前記判定対象とされた部分と同一データが存在したウェブページの情報を出典情報として取得する第1引用適否判定機能と、
前記第1引用適否判定機能により取得された前記出典情報が前記コンテンツに記載されているか否かを判定する処理と、前記コンテンツの総テキスト量に対する前記判定対象のテキスト量の割合または総表示面に対する前記判定対象の画像データの割合が所定の閾値以上であるか否かを判定する処理と、前記判定対象のテキストにおいて文字属性が前記コンテンツの前記判定対象以外の本文と異なっているかについて判定する処理と、を前記端末装置からの前記コンテンツのアップロード要求のタイミングで行う第2引用適否判定機能と、
前記第1引用適否判定機能による判定結果と前記第2引用適否判定機能による判定結果に応じて、前記端末装置において注意喚起表示を実行させる処理を行う注意喚起機能と、
を情報処理装置に実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体。 A decision opportunity detection function that detects that a paste opportunity is detected during content creation in the terminal device and that a decision opportunity regarding citation has occurred with the paste portion as the determination target ,
When the determination opportunity is detected by the determination opportunity detection function , the web page data indicated by the browsing history information in the terminal device is searched during the creation of the content, and the same as the determination target portion is searched. A first citation suitability determination function for performing, as a source information, information of a web page in which the same data as the determination target portion is present, while performing processing for confirming whether data exists
A process of determining whether or not the source information acquired by the first quotation adequacy determining function is described in the content, and a ratio of the text amount of the determination target to the total text amount of the content or a total display surface A process of determining whether the ratio of the image data of the determination target is equal to or greater than a predetermined threshold, and a process of determining whether the character attribute of the text of the determination target is different from the body of the content other than the determination target. And a second quotation adequacy determining function for performing at the timing of an upload request for the content from the terminal device ,
An alert function that performs a process of causing an alert display in the terminal device according to the determination result by the first quotation propriety determination function and the determination result by the second quotation propriety determination function;
A computer-readable storage medium that stores a program that causes an information processing apparatus to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018140031A JP6691581B2 (en) | 2018-07-26 | 2018-07-26 | Information processing apparatus, information processing method, program, storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018140031A JP6691581B2 (en) | 2018-07-26 | 2018-07-26 | Information processing apparatus, information processing method, program, storage medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020017098A JP2020017098A (en) | 2020-01-30 |
JP6691581B2 true JP6691581B2 (en) | 2020-04-28 |
Family
ID=69581513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018140031A Active JP6691581B2 (en) | 2018-07-26 | 2018-07-26 | Information processing apparatus, information processing method, program, storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6691581B2 (en) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009096190A1 (en) * | 2008-02-01 | 2009-08-06 | Kanazawa Institute Of Technology | Quotation judgment supporting device |
-
2018
- 2018-07-26 JP JP2018140031A patent/JP6691581B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020017098A (en) | 2020-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10938936B2 (en) | Intelligent download of application programs | |
US10607235B2 (en) | Systems and methods for curating content | |
US8756228B2 (en) | Method and apparatus for creating contextualized feeds | |
US8527905B2 (en) | Providing archived web page content in place of current web page content | |
US8533238B2 (en) | Sharing information about a document across a private computer network | |
US7840648B1 (en) | Web-page authoring tool for automatic enrollment in advertising program | |
JP6238331B2 (en) | Providing executable content to computing devices based on user actions | |
US8290941B2 (en) | System and method for detecting changes within search results | |
US20160275127A1 (en) | Systems and methods for presenting content | |
US11500655B2 (en) | Inline and contextual delivery of database content | |
TW200841244A (en) | Managing web page links using structured data | |
US20160117335A1 (en) | Systems and methods for archiving media assets | |
US10417317B2 (en) | Web page profiler | |
KR101542592B1 (en) | Method of Managing Toolbar Button Specialized for Each Domain | |
JP6691581B2 (en) | Information processing apparatus, information processing method, program, storage medium | |
US20140304583A1 (en) | Systems and Methods for Creating Web Pages Based on User Modification of Rich Internet Application Content | |
US10218673B2 (en) | Web content display system and method | |
JP2006048327A (en) | System and method for reporting web page renewal | |
JP6568282B1 (en) | Information display program, information display device, information display method, and distribution device | |
JP6914898B2 (en) | Information display program, information display device, information display method and distribution device | |
US11531449B2 (en) | Information processing device, information processing method, program and storage medium for efficiently managing a browsing time of a window on a browser by another window | |
WO2014192067A1 (en) | Information processing system and information processing method | |
US20110197137A1 (en) | Systems and Methods for Rating Content | |
CN117171463A (en) | Method, apparatus, device and computer readable medium for displaying digital newspaper | |
KR20060028005A (en) | Method for providing bulletin service and system of enabling the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190917 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200331 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6691581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |