JP2006293455A - Invalid data confirmation system - Google Patents
Invalid data confirmation system Download PDFInfo
- Publication number
- JP2006293455A JP2006293455A JP2005109422A JP2005109422A JP2006293455A JP 2006293455 A JP2006293455 A JP 2006293455A JP 2005109422 A JP2005109422 A JP 2005109422A JP 2005109422 A JP2005109422 A JP 2005109422A JP 2006293455 A JP2006293455 A JP 2006293455A
- Authority
- JP
- Japan
- Prior art keywords
- data
- posted
- inappropriate
- sample
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、画像データ、音声データ、テキストデータ(文字データ)等について、不適切なものを確認するための技術に関する。 The present invention relates to a technique for confirming inappropriate image data, audio data, text data (character data), and the like.
近年、コンピュータおよびネットワーク技術の発展により、インターネットに代表されるコンピュータ通信の世界で、様々なサービスが提供されるようになってきている。特に、いわゆる「掲示板」と呼ばれるサービスでは、不特定多数のユーザが、自由に情報の読み書きが可能となっており、人気が高いものとなっている。 In recent years, with the development of computer and network technologies, various services have been provided in the world of computer communication represented by the Internet. In particular, a service called a “bulletin board” has become very popular because an unspecified number of users can freely read and write information.
掲示板のサービスでは、不特定多数の人間が、画像、音声、テキスト等のデータをアップロードして掲示板に掲載することができるが、これを投稿する人間の自由に任せると、反社会的なものや他人に不快な感じを与えるデータ等の不適切なデータが公開されてしまうという問題がある。そこで、現状では、投稿されたデータをシステム管理者が確認し、不適切なものが確認された場合には、そのデータを削除することにより対応している。 In the bulletin board service, an unspecified number of people can upload images, sounds, texts, and other data and post them on the bulletin board. There is a problem that inappropriate data such as data that gives an unpleasant feeling to others is disclosed. Therefore, at present, the system administrator confirms the posted data, and if inappropriate data is confirmed, the data is deleted.
しかしながら、従来のチェック手法では、システム管理者が目視等により、不適切なデータを逐一確認しているため、膨大なデータを全て確認することは困難であるという問題がある。 However, the conventional check method has a problem that it is difficult to confirm all of the enormous data because the system administrator visually confirms inappropriate data one by one.
上記のような点に鑑み、本発明は、人手によることなく、類似データの判定手法を用いて、不適切なデータを確認することが可能な不適正データ確認システムを提供することを課題とする。 In view of the above points, it is an object of the present invention to provide an inappropriate data confirmation system capable of confirming inappropriate data by using a similar data determination method without manual intervention. .
上記課題を解決するため、本発明では、不適切な画像データのサンプルである不適切サンプル画像データを記録した不適切サンプル記憶手段と、ネットワークを介した送信により投稿された画像データである投稿画像データを格納する投稿データ記憶手段と、前記投稿画像データから特徴点を抽出し、前記不適切サンプル画像データから抽出された特徴点と類似するかどうかを判断する類似度判断手段と、前記類似度判断手段により類似していると判断された場合に、当該投稿画像データを削除し、類似していないと判断される場合に、ネットワークを介してアクセス可能な公開データ記憶手段に、前記投稿画像データを格納する投稿データ登録手段を有する不適切データ確認システムを提供する。 In order to solve the above problems, in the present invention, inappropriate sample storage means that records inappropriate sample image data that is a sample of inappropriate image data, and posted images that are image data posted by transmission via a network Post data storage means for storing data; similarity score extracting means for extracting feature points from the posted image data and determining whether the feature points are similar to the feature points extracted from the inappropriate sample image data; and the similarity When it is determined by the determination means that the post image data is similar, the post image data is deleted. When it is determined that the post image data is not similar, the post image data is stored in the public data storage means accessible via the network. An unsuitable data confirmation system having post data registration means for storing.
本発明によれば、投稿されたデータをあらかじめ準備された不適切なサンプルデータと比較し、この不適切なサンプルデータに類似する場合には、投稿されたデータを削除するようにしたので、不適切なデータが公開されることがなくなり、人手によることなく、類似データの判定手法を用いて、不適切なデータを確認することが可能となる。 According to the present invention, the posted data is compared with the inappropriate sample data prepared in advance, and if it is similar to the inappropriate sample data, the posted data is deleted. Appropriate data is not disclosed, and it is possible to check inappropriate data by using a similar data determination method without human intervention.
(1.システム構成)
以下、本発明の実施形態について図面を参照して詳細に説明する。図1は、本発明に係る不適切データ確認システムの構成図である。図1において、10は端末装置、20はネットワーク、30は確認サーバ、40は公開サーバ、50は不適切サンプル記憶手段、60は投稿データ記憶手段、70は公開データ記憶手段である。
(1. System configuration)
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a configuration diagram of an inappropriate data confirmation system according to the present invention. In FIG. 1, 10 is a terminal device, 20 is a network, 30 is a confirmation server, 40 is a public server, 50 is an inappropriate sample storage unit, 60 is a posted data storage unit, and 70 is a public data storage unit.
端末装置10は、ネットワーク20へのアクセス機能を有する端末装置であり、汎用のコンピュータで実現可能である。ネットワーク20は、データの送受信が可能なインターネット等の通信網である。確認サーバ30は、ネットワーク20を介して端末装置10から送信された投稿データを受け付けて、投稿データ記憶手段60に格納する機能を有すると共に、投稿データ記憶手段60に格納された投稿データのうち、不適切なものを検出し、削除する機能を有するサーバコンピュータである。公開サーバ40は、公開データ記憶手段70に格納されているデータをネットワークを通じて公開する機能を有するサーバコンピュータであり、通常のWWWサーバとしての機能を有するコンピュータにより実現可能である。
The
確認サーバ30は、投稿データとして受信した画像データ、音声データ、テキストデータについて確認処理を行う。具体的には、不適切サンプル記憶手段50に格納された不適切サンプルデータと、投稿データを比較し、類似度が高い場合には、投稿データを不適切なものであるとして削除する。類似度の判定については、画像データの場合は、投稿データから特徴点を抽出し、不適切サンプル記憶手段50に格納された不適切サンプルデータから抽出した特徴点との誤差を算出し、その誤差が所定の比率以下である場合には、類似するものと判定することにより行う。ここで、特徴点とは、画像の特徴を表現する情報であり、種々の手法で作成することが可能である。本実施形態では、投稿データである画像内の所定の箇所に基準点を定め、この基準点からのベクトルデータの集合体として、特徴点を作成する。特徴点は、画像の特徴を表現したデータであるため、特徴点が互いに類似する場合は、その特徴点の抽出元である画像が互いに類似していることになるため、不適切なサンプル画像に類似している不適切画像の検出が可能となる。なお、このような特徴点の抽出手法は公知の技術により実現可能である。
The
音声データについては、時系列に変化するレベルを波形画像に変換し、この波形画像から特徴点を抽出する。そして、不適切サンプル記憶手段50に格納された音声データ用の不適切サンプルデータから抽出した特徴点との誤差を算出し、その誤差が所定の比率以下である場合には、類似するものと判定することにより行う。すなわち、音声データである投稿データを一旦波形画像に変換した後は、投稿データが画像データである場合と同様に、処理が行われることになる。テキストデータについては、文字コードの一致・不一致を確認することにより、不適切サンプルデータとして不適切サンプル記憶手段50に格納された文字列と一致する場合には削除する処理を行う。したがって、投稿データ中に、不適切サンプルデータである文字列が存在した場合には、その投稿データは削除されることになる。確認サーバ30における上記各機能は、専用のソフトウェアを、サーバコンピュータに搭載することにより実現される。
For audio data, the time-varying level is converted into a waveform image, and feature points are extracted from this waveform image. Then, an error with the feature point extracted from the inappropriate sample data for the sound data stored in the inappropriate sample storage means 50 is calculated, and when the error is equal to or less than a predetermined ratio, it is determined that they are similar. To do. That is, after the post data, which is audio data, is once converted into a waveform image, processing is performed in the same manner as when the post data is image data. For the text data, by confirming the match / mismatch of the character codes, a process is performed to delete the text data if it matches the character string stored in the inappropriate sample storage means 50 as inappropriate sample data. Therefore, when there is a character string that is inappropriate sample data in the posted data, the posted data is deleted. Each of the above functions in the
(2.不適切サンプルデータの準備)
確認サーバ30は、本発明を実施するため、不適切サンプルデータを蓄積する。具体的には、システム管理者が、不適切と考える画像データ、音声データ、テキストデータ等のサンプルデータを確認サーバ30に入力し、確認サーバ30は、不適切サンプル記憶手段50にこれらを格納する処理を行う。さらに、確認サーバ30は、画像データから特徴点を抽出する処理、および音声データを波形画像データに変換して特徴点を抽出する処理を行い、抽出した特徴点を不適切サンプル記憶手段50に格納する処理を行う。
(2. Preparation of inappropriate sample data)
The
(3.確認処理)
続いて、図1に示したシステムにおける不適切データの確認処理について説明する。まず、投稿者は、端末装置10から投稿データを確認サーバ30に送信する。確認サーバ30では、投稿データを受信すると、投稿データ記憶手段60に格納する。また、確認サーバ30は、上述の手法により、投稿データ記憶手段60に格納された投稿データと、不適切サンプル記憶手段50に格納された不適切サンプルデータの類似度を判断し、両者が類似する場合には、その投稿データを削除する処理を行う。そして、不適切サンプルデータと類似しないと判断された投稿データについては、公開データ記憶手段70に格納する処理を行う。このように、確認サーバ30において、不適切データの確認処理を行うことにより、不適切なデータを削除し、適切なデータのみが公開データ記憶手段70に格納されることになる。
(3. Confirmation process)
Next, the inappropriate data confirmation process in the system shown in FIG. 1 will be described. First, the contributor transmits post data from the
公開データ記憶手段70に格納された投稿データは、公開サーバ40がネットワーク20を介して公開可能な状態となる。ネットワーク20を介して外部の端末装置10からデータの送信要求があった場合には、公開サーバ40は、公開データ記憶手段70に格納された投稿データを、要求元の端末装置10に送信することになる。
Post data stored in the public data storage means 70 is in a state where the
以上のような処理を行うことにより、ネットワーク20を介してアクセスしてきた閲覧者は、不適切なデータが排除された公開データ記憶手段70に格納されたデータのみ入手可能となるので、不適切なデータが一般に公開されることはない。
By performing the processing as described above, a viewer who has accessed through the
10・・・端末装置
20・・・ネットワーク
30・・・確認サーバ
40・・・公開サーバ
50・・・不適切サンプル記憶手段
60・・・投稿データ記憶手段
70・・・公開データ記憶手段
DESCRIPTION OF
Claims (3)
ネットワークを介した送信により投稿された画像データである投稿画像データを格納する投稿データ記憶手段と、
前記投稿画像データから特徴点を抽出し、前記不適切サンプル画像データから抽出された特徴点と類似するかどうかを判断する類似度判断手段と、
前記類似度判断手段により類似していると判断された場合に、当該投稿画像データを削除し、類似していないと判断される場合に、ネットワークを介してアクセス可能な公開データ記憶手段に、前記投稿画像データを格納する投稿データ登録手段と、
を有することを特徴とする不適切データ確認システム。 Inappropriate sample storage means for recording inappropriate sample image data that is a sample of inappropriate image data; and
Posted data storage means for storing posted image data that is image data posted by transmission via a network;
Similarity determination means for extracting feature points from the posted image data and determining whether the feature points are extracted from the inappropriate sample image data;
When it is determined that the similarity is determined by the similarity determination unit, the posted image data is deleted, and when it is determined that the similarity is not similar, the public data storage unit accessible via a network is Post data registration means for storing post image data;
The inappropriate data confirmation system characterized by having.
前記投稿データ記憶手段は、ネットワークを介した送信により投稿された音声データである投稿音声データを格納するものであり、
前記類似度判断手段は、前記投稿音声データを波形画像に変換した後、当該波形画像から特徴点を抽出し、前記不適切サンプル音声データから抽出された特徴点と類似するかどうかを判断するものであり、
前記投稿データ登録手段は、前記類似度判断手段により類似していると判断された場合に、当該投稿音声データを削除し、類似していないと判断される場合に、ネットワークを介して外部からアクセス可能な公開データ記憶手段に、前記投稿音声データを格納するものであることを特徴とする請求項1に記載の不適切データ確認システム。 The inappropriate sample storage means further records inappropriate sample audio data that is a sample of inappropriate audio data,
The posted data storage means stores posted voice data that is voice data posted by transmission through a network,
The similarity determination means extracts the feature points from the waveform image after converting the posted audio data into a waveform image, and determines whether the feature points are similar to the feature points extracted from the inappropriate sample audio data And
The posted data registration unit deletes the posted audio data when it is determined that the similarity is determined to be similar by the similarity determination unit, and accesses from the outside via the network when it is determined that they are not similar 2. The inappropriate data confirmation system according to claim 1, wherein the posted voice data is stored in a possible public data storage means.
前記投稿データ記憶手段は、ネットワークを介した送信により投稿されたテキストデータである投稿テキストデータを格納するものであり、
前記類似度判断手段は、前記投稿テキストデータに、前記不適切サンプルテキストデータが含まれるかどうかを判断するものであり、
前記投稿データ登録手段は、前記類似度判断手段により、不適切サンプルテキストデータが含まれると判断された場合に、当該投稿テキストデータを削除し、不適切サンプルテキストデータが含まれないと判断された場合に、ネットワークを介して外部からアクセス可能な公開データ記憶手段に、前記投稿テキストデータを格納するものであることを特徴とする請求項1または請求項2に記載の不適切データ確認システム。
The inappropriate sample storage means further records inappropriate sample text data which is a sample of inappropriate text data,
The posted data storage means stores posted text data that is text data posted by transmission via a network,
The similarity determination means determines whether or not the inappropriate sample text data is included in the post text data,
The posted data registration means deletes the posted text data when the similarity determination means determines that the inappropriate sample text data is included, and determines that the inappropriate sample text data is not included. 3. The inappropriate data confirmation system according to claim 1, wherein the posted text data is stored in a public data storage means accessible from outside via a network.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005109422A JP2006293455A (en) | 2005-04-06 | 2005-04-06 | Invalid data confirmation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005109422A JP2006293455A (en) | 2005-04-06 | 2005-04-06 | Invalid data confirmation system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006293455A true JP2006293455A (en) | 2006-10-26 |
Family
ID=37414000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005109422A Pending JP2006293455A (en) | 2005-04-06 | 2005-04-06 | Invalid data confirmation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006293455A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009050877A1 (en) * | 2007-10-19 | 2009-04-23 | Nec Corporation | Method and apparatus for detecting inappropriate content, their computer program, and content publishing system |
JP2009258918A (en) * | 2008-04-15 | 2009-11-05 | Nhn Corp | Image display program, image display device, and avatar providing system |
JP2010224599A (en) * | 2009-03-19 | 2010-10-07 | Canon Inc | Information processor, method for controlling information processor, and program |
US8045751B2 (en) | 2007-03-30 | 2011-10-25 | Fuji Xerox Co., Ltd. | Information outputting device, information outputting method, computer readable recording medium, and image projecting system |
WO2013084563A1 (en) * | 2011-12-05 | 2013-06-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Privacy information management device, method and program |
JP2017084049A (en) * | 2015-10-27 | 2017-05-18 | 株式会社フィール | Information provision device and information provision program |
JP2021060833A (en) * | 2019-10-08 | 2021-04-15 | Necプラットフォームズ株式会社 | Information processor, information processing method, and computer readable medium |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869533A (en) * | 1994-06-14 | 1996-03-12 | Nippon Telegr & Teleph Corp <Ntt> | Image inspection and recognition method, and reference data generating method used for same and device for them |
JPH11203298A (en) * | 1998-01-08 | 1999-07-30 | Nippon Telegr & Teleph Corp <Ntt> | Contributed character information pre-check method and its device, and storage medium storing contributed character information pre-check program |
JPH11306100A (en) * | 1998-04-17 | 1999-11-05 | Recruit Co Ltd | Contribution reading system on communication network having characteristics in examination support system |
JP2002108392A (en) * | 2000-09-29 | 2002-04-10 | Casio Comput Co Ltd | Speech authentication system and method, and storage medium stored with speech authentication processing program |
JP2002216065A (en) * | 2001-01-16 | 2002-08-02 | Namco Ltd | Picture processor, picture processing method, picture processing program, and recording medium having the program recorded thereon |
JP2002342146A (en) * | 2001-05-18 | 2002-11-29 | System Engineering Center Co Ltd | Method and device for monitoring electronic bulletin board information on homepage, method and device for monitoring alteration inhibition information, method and device for monitoring particular term or particular sentence |
JP2003280676A (en) * | 2002-03-22 | 2003-10-02 | Actlas:Kk | Method for generating database of speech sample |
JP2004310606A (en) * | 2003-04-09 | 2004-11-04 | Toyota Motor Corp | Variation information recognizing device, and variation information recognizing method |
-
2005
- 2005-04-06 JP JP2005109422A patent/JP2006293455A/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0869533A (en) * | 1994-06-14 | 1996-03-12 | Nippon Telegr & Teleph Corp <Ntt> | Image inspection and recognition method, and reference data generating method used for same and device for them |
JPH11203298A (en) * | 1998-01-08 | 1999-07-30 | Nippon Telegr & Teleph Corp <Ntt> | Contributed character information pre-check method and its device, and storage medium storing contributed character information pre-check program |
JPH11306100A (en) * | 1998-04-17 | 1999-11-05 | Recruit Co Ltd | Contribution reading system on communication network having characteristics in examination support system |
JP2002108392A (en) * | 2000-09-29 | 2002-04-10 | Casio Comput Co Ltd | Speech authentication system and method, and storage medium stored with speech authentication processing program |
JP2002216065A (en) * | 2001-01-16 | 2002-08-02 | Namco Ltd | Picture processor, picture processing method, picture processing program, and recording medium having the program recorded thereon |
JP2002342146A (en) * | 2001-05-18 | 2002-11-29 | System Engineering Center Co Ltd | Method and device for monitoring electronic bulletin board information on homepage, method and device for monitoring alteration inhibition information, method and device for monitoring particular term or particular sentence |
JP2003280676A (en) * | 2002-03-22 | 2003-10-02 | Actlas:Kk | Method for generating database of speech sample |
JP2004310606A (en) * | 2003-04-09 | 2004-11-04 | Toyota Motor Corp | Variation information recognizing device, and variation information recognizing method |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8045751B2 (en) | 2007-03-30 | 2011-10-25 | Fuji Xerox Co., Ltd. | Information outputting device, information outputting method, computer readable recording medium, and image projecting system |
WO2009050877A1 (en) * | 2007-10-19 | 2009-04-23 | Nec Corporation | Method and apparatus for detecting inappropriate content, their computer program, and content publishing system |
JP5051237B2 (en) * | 2007-10-19 | 2012-10-17 | 日本電気株式会社 | Inappropriate content detection method and apparatus, computer program thereof, and content publishing system |
JP2009258918A (en) * | 2008-04-15 | 2009-11-05 | Nhn Corp | Image display program, image display device, and avatar providing system |
JP2010224599A (en) * | 2009-03-19 | 2010-10-07 | Canon Inc | Information processor, method for controlling information processor, and program |
WO2013084563A1 (en) * | 2011-12-05 | 2013-06-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Privacy information management device, method and program |
CN103975339A (en) * | 2011-12-05 | 2014-08-06 | 国际商业机器公司 | Privacy information management device, method and program |
JP5588074B2 (en) * | 2011-12-05 | 2014-09-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Privacy information management apparatus, method and program |
US9280682B2 (en) | 2011-12-05 | 2016-03-08 | Globalfoundries Inc. | Automated management of private information |
CN103975339B (en) * | 2011-12-05 | 2016-08-24 | 国际商业机器公司 | Privacy information managing device and method |
JP2017084049A (en) * | 2015-10-27 | 2017-05-18 | 株式会社フィール | Information provision device and information provision program |
JP2021060833A (en) * | 2019-10-08 | 2021-04-15 | Necプラットフォームズ株式会社 | Information processor, information processing method, and computer readable medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8983836B2 (en) | Captioning using socially derived acoustic profiles | |
US9530415B2 (en) | System and method of providing speech processing in user interface | |
US8973153B2 (en) | Creating audio-based annotations for audiobooks | |
JP2006293455A (en) | Invalid data confirmation system | |
EP2896162B1 (en) | Determining additional information associated with geographic location information | |
KR20090116750A (en) | Controlling access to computer systems and for annotating media files | |
JP2014516189A (en) | Method and system for performing a comparison of received data and providing subsequent services based on the comparison | |
KR20030006734A (en) | Method and system for managing image data via network | |
AU2017265064B2 (en) | Access to data on a remote device | |
CN101998107A (en) | Information processing apparatus, conference system and information processing method | |
US9043885B2 (en) | System for providing content or application and control method therefor, terminal and control method therefor, authentication device and control method therefor, program, and information storage medium | |
US20190197165A1 (en) | Method and computer device for determining an intent associated with a query for generating an intent-specific response | |
CN106549947A (en) | A kind of voiceprint authentication method and system of immediate updating | |
WO2021159669A1 (en) | Secure system login method and apparatus, computer device, and storage medium | |
CN108040045A (en) | Generation method, device, server and the storage medium of flowing of access file | |
CN112860642A (en) | Court trial data processing method, server and terminal | |
US20090172018A1 (en) | Electronic document management method | |
CN110781417A (en) | Method and system for spreading speakable works based on two-dimension code | |
CN113571048B (en) | Audio data detection method, device, equipment and readable storage medium | |
Pawlaszczyk et al. | Alexa, tell me-a forensic examination of the amazon echo dot 3 rd generation | |
JP4571158B2 (en) | Authentication system | |
GB2519571A (en) | Audiovisual associative authentication method and related system | |
US20070027918A1 (en) | Mail processing server, mail processing method, and mail processing program | |
JP2010282612A (en) | Web reader system using tts server and method thereof | |
CN110275860B (en) | System and method for recording teaching process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100407 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100810 |