JP3814618B2 - 文章処理装置、及び制御方法 - Google Patents
文章処理装置、及び制御方法 Download PDFInfo
- Publication number
- JP3814618B2 JP3814618B2 JP2004185238A JP2004185238A JP3814618B2 JP 3814618 B2 JP3814618 B2 JP 3814618B2 JP 2004185238 A JP2004185238 A JP 2004185238A JP 2004185238 A JP2004185238 A JP 2004185238A JP 3814618 B2 JP3814618 B2 JP 3814618B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- text data
- normalization
- embedded
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Storage Device Security (AREA)
- Image Processing (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
Description
さらにレイアウト情報を操作するために一見しただけで不自然さが残るという問題点もある。また。辞書変換法による電子透かし手法では、単語変換による文脈の乱れが生じ、同様に不自然さが残る問題点が生じる。
前記テキストデータを所定の正規化方式を用いて正規化する正規化手段と、
前記正規化されたデータに基づいて、埋め込みデータを生成する埋め込みデータ生成手段と、
前記埋め込みデータを前記テキストデータに対して埋め込む埋め込み手段と
を備えることを特徴とする。
前記入力されたテキストデータを、所定の正規化方式を用いて正規化する正規化手段と、
前記正規化手段により正規化されたテキストデータと、前記入力手段により入力されたテキストデータとを比較することによって、前記透かし情報を抽出する抽出手段と
を備えることを特徴とする。
前記テキストデータを所定の正規化方式を用いて正規化する正規化工程と、
前記正規化されたデータに基づいて、埋め込みデータを生成する埋め込みデータ生成工程と、
前記埋め込みデータを前記テキストデータに対して埋め込む埋め込み工程と
を備えることを特徴とする。
前記入力されたテキストデータを、所定の正規化方式を用いて正規化する正規化工程と、
前記正規化工程で正規化されたテキストデータと、前記入力工程で入力されたテキストデータとを比較することによって、前記透かし情報を抽出する抽出工程と
を備えることを特徴とする。
図1は本実施形態における、文章(テキストデータ)に透かし情報を埋め込む方法を説明するブロック図である。
テキストデータ内のすべての濁音文字、半濁音文字ごとに1ビットの透かし情報を対応させる。ビット0を埋め込む場合には1文字表現(つまり結合文字を利用しない)のまま、ビット1を埋め込む場合には結合文字を利用するように、透かし情報埋め込み処理103を行う。例えば、正規化後の「が」に対し、ビット0を埋め込む場合には「が」、ビット1を埋め込む場合には「か゛」(「か」+「゛」)と変換することで透かし情報を埋め込む。
図2は本実施形態における、透かし情報が埋め込まれた文章(テキストデータ)から透かし情報を抽出する方法を説明するブロック図である。
第1の実施形態では、正規化を行うことにより生じる正規化前データとの差分から透かし情報を抽出する方法を説明した。しかし、第1の実施形態では、画像に対する電子透かしとは異なり、耐性が弱く、透かし情報が容易に除去可能であるため、透かし情報を消去されてしまうと困る用途には利用できない。たとえば作者の著作権情報や購入者のIDを埋め込むことで、著作権保護を行う場合などである。しかしテキストデータの真正性を保証し、改ざん検出に利用することができる。
ハッシュ値とは1変数関数であるハッシュ関数hの出力値であり、ハッシュ関数とは衝突を起こしにくい圧縮関数をいう。ここで衝突とは、異なる入力値x1,x2に対して、h(x1)=h(x2)となることである。また圧縮関数とは、任意のビット長のビット列をある固定長さのビット列に変換する関数である。
署名データの作成方法としては公開鍵暗号方式を用いた方式などがあるが、本実施形態では特に限定しない。以下、公開鍵暗号方式を用いた署名方式について説明する。
第2の実施形態の特別な場合として、本実施形態ではXML文書に対する署名情報の埋め込みを説明する。
<Signature>
...
<SignatureValue>
ABCDEF...
</SignatureValue>
</Signature>
xml−c14nでは改行文字をLFにすること、文字符号化方式はつねにUTF−8であることなどが規定されている。しかし文字コードレベルでの正規化については策定文書の範囲外であり、ベンダー間の取り決めが行われたり、アプリケーションに依存することになる。そこで署名を施す前の正規化として,以下の手順で正規化処理を行う。
したフローチャートである。
<Signature>
...
<SignatureValueoption=”WaterMarked”/>
</Signature>
”WaterMarked”というプロパティ値から、署名データが埋め込まれていることがわかる。
前述の実施形態では、正規化処理には正規化方式が必要であった。本実施形態は、この正規化方式を秘匿にし、特定のユーザだけが埋め込みデータを抽出する方法について説明する。なお、埋め込み処理者は正規化方式を秘匿にして文字コードレベルでの正規化を行うと共に、埋め込み処理者は透かし情報の抽出を許可する抽出者にのみ暗号通信路などを用いて正規化方式を安全に共有する。又、本実施形態では暗号方式については特には限定しない。
本実施形態は、透かし情報としてメタデータを扱う例を説明する。メタデータ(meta−data)とは、「データに関するデータ」であり、あるデータDを説明するデータMのことである。しかし、データDとメタデータMが別々のファイルで存在した場合、ファイルの移動やコピーの際に、ユーザが同時に管理しなければならない問題点がある。そこで、本実施形態では透かし情報としてメタデータを適用させることにより、複数のファイルで管理する煩わしさを解消することが可能である。
本発明は上記実施の形態を実現するための装置及び方法及び実施の形態で説明した方法を組み合わせて行う方法のみに限定されるものではなく、上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施の形態を実現するためのソフトウエアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させることにより上記実施の形態を実現する場合も本発明の範疇に含まれる。
Claims (9)
- テキストデータを入力する入力手段と、
前記テキストデータを所定の正規化方式を用いて正規化する正規化手段と、
前記正規化されたデータに基づいて、埋め込みデータを生成する埋め込みデータ生成手段と、
前記埋め込みデータを前記テキストデータに対して埋め込む埋め込み手段と
を備えることを特徴とする文章処理装置。 - 前記埋め込みデータ生成手段は、前記正規化されたデータに対して一方向性ハッシュ関数によりハッシュ値を算出し、前記ハッシュ値より得られた署名情報を埋め込みデータとして生成することを特徴とする請求項1に記載の文章処理装置。
- 前記入力手段が入力するテキストデータは、透かし情報が埋め込まれたデータであることを特徴とする請求項1又は2に記載の文章処理装置。
- 前記正規化方式は、前記埋め込み手段の埋め込み方法に応じた正規化方式であることを特徴とする請求項1乃至3の何れか1項に記載の文章処理装置。
- 透かし情報が埋め込まれているテキストデータを入力する入力手段と、
前記入力されたテキストデータを、所定の正規化方式を用いて正規化する正規化手段と、
前記正規化手段により正規化されたテキストデータと、前記入力手段により入力されたテキストデータとを比較することによって、前記透かし情報を抽出する抽出手段と
を備えることを特徴とする文章処理装置。 - 前記入力手段により入力されたテキストデータは、正規化された後に、前記透かし情報が埋め込まれているデータであることを特徴とする請求項5に記載の文章処理装置。
- テキストデータを入力する入力工程と、
前記テキストデータを所定の正規化方式を用いて正規化する正規化工程と、
前記正規化されたデータに基づいて、埋め込みデータを生成する埋め込みデータ生成工程と、
前記埋め込みデータを前記テキストデータに対して埋め込む埋め込み工程と
を備えることを特徴とする装置の制御方法。 - 透かし情報が埋め込まれているテキストデータを入力する入力工程と、
前記入力されたテキストデータを、所定の正規化方式を用いて正規化する正規化工程と、
前記正規化工程で正規化されたテキストデータと、前記入力工程で入力されたテキストデータとを比較することによって、前記透かし情報を抽出する抽出工程と
を備えることを特徴とする装置の制御方法。 - コンピュータに請求項7又は8に記載の制御方法を実行させるためのプログラムを格納することを特徴とする、コンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004185238A JP3814618B2 (ja) | 2004-06-23 | 2004-06-23 | 文章処理装置、及び制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004185238A JP3814618B2 (ja) | 2004-06-23 | 2004-06-23 | 文章処理装置、及び制御方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000295014A Division JP2002108851A (ja) | 2000-09-27 | 2000-09-27 | 文章処理装置及びその方法並びに記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005124137A JP2005124137A (ja) | 2005-05-12 |
JP3814618B2 true JP3814618B2 (ja) | 2006-08-30 |
Family
ID=34616968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004185238A Expired - Fee Related JP3814618B2 (ja) | 2004-06-23 | 2004-06-23 | 文章処理装置、及び制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3814618B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6031729B1 (ja) * | 2015-04-30 | 2016-11-24 | 合同会社Qrテクノロジー | Rfidタグコード生成装置およびその方法、認証装置およびその方法、ならびにプログラム |
CN110008663B (zh) * | 2018-12-27 | 2020-12-08 | 杭州基尔区块链科技有限公司 | 一种用于pdf文档保护和分发跟踪的信息快速嵌入和提取的方法 |
-
2004
- 2004-06-23 JP JP2004185238A patent/JP3814618B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005124137A (ja) | 2005-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4921065B2 (ja) | 情報処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 | |
CN1897522B (zh) | 水印嵌入和/或检测的方法、装置及系统 | |
US6912294B2 (en) | Multi-stage watermarking process and system | |
Jalil et al. | A review of digital watermarking techniques for text documents | |
Mali et al. | Implementation of text watermarking technique using natural language watermarks | |
Kaur et al. | An existential review on text watermarking techniques | |
Khadam et al. | Text data security and privacy in the internet of things: threats, challenges, and future directions | |
US20070047758A1 (en) | Tamper-resistant text stream watermarking | |
Chiang et al. | Natural language watermarking using semantic substitution for Chinese text | |
CN104517045A (zh) | 数字文档保护方法及系统 | |
US8976003B2 (en) | Large-scale document authentication and identification system | |
Wen et al. | Two Zero-Watermark methods for XML documents | |
JP4541473B2 (ja) | データ処理方法及び装置、及び記憶媒体 | |
CN111382398B (zh) | 信息处理、隐藏信息解析和嵌入的方法、装置及设备 | |
CN109800547B (zh) | 一种用于word文档保护和分发跟踪的信息快速嵌入和提取的方法 | |
JP3814618B2 (ja) | 文章処理装置、及び制御方法 | |
JP2004185312A (ja) | 文書管理装置 | |
Jaiswal et al. | Implementation of a new technique for web document protection using unicode | |
JP2002108851A (ja) | 文章処理装置及びその方法並びに記憶媒体 | |
Khadam et al. | A watermarking technique based on file page objects for PDF | |
Xin et al. | An improved tamper detection and location scheme for DOCX format documents | |
JP5511270B2 (ja) | 情報処理装置、及び情報処理方法 | |
Rameshbabu et al. | Text watermarking using combined image & text | |
KR100773854B1 (ko) | 정보 처리 장치, 정보 처리 방법, 및 컴퓨터 판독가능한기억 매체 | |
CN110197054B (zh) | MusicXML格式文件水印嵌入及提取方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060515 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060605 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090609 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100609 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110609 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130609 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |