JP2009130398A - Information processing apparatus and method - Google Patents
Information processing apparatus and method Download PDFInfo
- Publication number
- JP2009130398A JP2009130398A JP2007299836A JP2007299836A JP2009130398A JP 2009130398 A JP2009130398 A JP 2009130398A JP 2007299836 A JP2007299836 A JP 2007299836A JP 2007299836 A JP2007299836 A JP 2007299836A JP 2009130398 A JP2009130398 A JP 2009130398A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- unit
- processing apparatus
- document
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Abstract
Description
本発明は、視覚障害者に対する情報保障を実現するための技術に関する。 The present invention relates to a technique for realizing information security for a visually impaired person.
インターネットや携帯電話など通信インフラの普及により、WEBや電子メール等の電子文書を利用した情報交換・サービスが広く用いられるようになった。流通している電子文書の多くが文字情報と画像情報であるため、視覚障害者が利用するのは容易ではない。視覚障害者が支障なく情報サービスを利用できるように、情報保障に関してさまざまな取り組みが行われている。 With the spread of communication infrastructure such as the Internet and mobile phones, information exchange and services using electronic documents such as WEB and e-mail have become widely used. Since many electronic documents in circulation are character information and image information, it is not easy for visually impaired people to use. Various efforts have been made to guarantee information so that visually impaired people can use information services without any problems.
例えば、画面に表示されている文字情報を音声に変換する技術を用いて音声で読み上げるスクリーンリーダと呼ばれるソフトウェアが市販されている。代表的なものではFreedom Scientific社のJaws、IBM社のHome Page Readerという製品が広く知られている。また、文字情報を点字に変換して触読を実現した点字表示ディスプレイの一例が特許文献1に開示されている。スクリーンリーダや特許文献1のような装置を用いることにより、文字情報に関しては音声に変換して情報を得ることができる。 For example, software called a screen reader that reads aloud by using a technology for converting character information displayed on the screen into speech is commercially available. Representative products such as Freedom Scientific's Jaws and IBM's Home Page Reader are widely known. Further, Patent Document 1 discloses an example of a braille display that realizes tactile reading by converting character information into braille. By using a screen reader or a device such as Patent Document 1, character information can be converted into speech and information can be obtained.
このような、スクリーンリーダの使用を前提として、画像データについても情報が得られるように、日本工業規格のJIS X8341−3では、WEBコンテンツ作成のガイドラインが示されている。画像データへの参照を記述するタグに、画像の内容を説明する代替文字列をALT属性として付与するよう推奨している。 Assuming the use of such a screen reader, JIS X8341-3 of Japanese Industrial Standards provides guidelines for creating web contents so that information can be obtained also about image data. It is recommended that an alternative character string that describes the content of an image be assigned as an ALT attribute to a tag that describes a reference to image data.
この他、特許文献2には、画像データ中に含まれるヘッダ情報から画像の作者名、作成日、タイトル等画像に関連する情報を抽出して音声で読み上げる情報提示装置が開示されている。 In addition, Patent Document 2 discloses an information presentation device that extracts information related to an image such as an image author's name, creation date, and title from header information included in the image data and reads it out by voice.
JIS X8341−3のガイドラインに従った電子文書であっても、印刷時にALT属性に付与された文字列は印字されない。つまり、視覚障害者に配慮して記述された電子文書であっても、印刷すると画像に関する情報が消失するという課題があった。特許文献2に開示された情報提示装置でも、印刷すると画像のヘッダ部分の情報は印字されないため、視覚障害者が画像に関する情報を得ることはできない。 Even for an electronic document that complies with the guidelines of JIS X8341-3, the character string assigned to the ALT attribute at the time of printing is not printed. That is, there is a problem that even if an electronic document is described with consideration for the visually impaired, information about the image is lost when the electronic document is printed. Even in the information presentation device disclosed in Patent Document 2, when the information is printed, the information in the header portion of the image is not printed, so that the visually impaired cannot obtain information on the image.
これに対して、印刷時にALT属性に付与された代替文字列を合わせて印字するという方法が考えられるが、一方で、印刷された文書のレイアウトを変更したくない場合もある。 On the other hand, a method is conceivable in which an alternative character string assigned to the ALT attribute is printed at the time of printing. However, there is a case where it is not desired to change the layout of the printed document.
本発明は、上記の課題を解決するため、画像に付与された代替文字列を電子透かしとして画像に埋め込んで印刷する情報処理装置を提供することを目的とする。さらに、印刷された文書の画像から代替文字列を抽出し、抽出した代替文字列を音声で提示する情報処理装置を提供することを目的とする。 In order to solve the above-described problems, an object of the present invention is to provide an information processing apparatus that embeds and prints an alternative character string added to an image as a digital watermark. It is another object of the present invention to provide an information processing apparatus that extracts a substitute character string from an image of a printed document and presents the extracted substitute character string by voice.
本発明の一側面によれば、構造化文書を解析する解析手段と、前記解析手段が画像データへのリンクを検出した場合、前記画像データを取得する取得手段と、前記解析手段が前記画像データを説明する文字列を検出した場合、前記取得手段が取得した前記画像データに、前記文字列を電子透かしとして埋め込む埋め込み手段とを備えることを特徴とする情報処理装置が提供される。 According to one aspect of the present invention, an analysis unit that analyzes a structured document, an acquisition unit that acquires the image data when the analysis unit detects a link to image data, and the analysis unit that includes the image data An information processing apparatus is provided that includes an embedding unit that embeds the character string as a digital watermark in the image data acquired by the acquiring unit.
本発明によれば、電子文書の印刷、スキャンの過程を通して、元の電子文書に記述された画像の代替文字列を保持することができる。したがって、視覚障害者が電子文書の印刷物をスキャンして音声で内容を確認する場合に、画像の代替文字列の情報を失うことがないので、元の電子文書から得られる情報と同一の情報を得ることができ、利便性が向上する。さらに、代替文字列を直接印刷する必要がないので、電子文書の表示と印刷物で同一の文書レイアウトを保つことができる。 According to the present invention, an alternative character string of an image described in an original electronic document can be held through the process of printing and scanning the electronic document. Therefore, when a visually handicapped person scans a printed matter of an electronic document and confirms the contents by voice, the information of the substitute character string of the image is not lost, so the same information as the information obtained from the original electronic document is used. It can be obtained and convenience is improved. Furthermore, since it is not necessary to print the substitute character string directly, the same document layout can be maintained between the electronic document display and the printed matter.
以下、図面を参照して本発明の好適な実施形態について詳細に説明する。なお、本発明は以下の実施形態に限定されるものではなく、本発明の実施に有利な具体例を示すにすぎない。また、以下の実施形態の中で説明されている特徴の組み合わせの全てが本発明の課題解決手段として必須のものであるとは限らない。 DESCRIPTION OF EMBODIMENTS Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the drawings. In addition, this invention is not limited to the following embodiment, It shows only the specific example advantageous for implementation of this invention. In addition, not all combinations of features described in the following embodiments are indispensable as means for solving the problems of the present invention.
<実施形態1>
本実施形態では、代表的なマークアップ言語であるHTML(Hyper Text Markup Language)で記述された電子文書を処理する場合を例に説明するが、これに限るものではない。本実施形態は、HTMLのように所定の書式に従って、文書の構造やレイアウトを制御する記述言語で記述された構造化文書であれば、HTMLに限らず適用することができる。
<Embodiment 1>
In the present embodiment, a case where an electronic document described in HTML (Hyper Text Markup Language), which is a representative markup language, is described as an example, but the present invention is not limited to this. The present embodiment can be applied to any structured document described in a description language that controls the structure and layout of a document according to a predetermined format such as HTML.
また、以下では、文書のレイアウトを制御するのに用いる記述子をタグと表記する。 Hereinafter, a descriptor used for controlling the layout of a document is referred to as a tag.
(情報処理装置の構成)
図1は、本実施形態における情報処理装置の機能構成を示す図である。
(Configuration of information processing device)
FIG. 1 is a diagram illustrating a functional configuration of the information processing apparatus according to the present embodiment.
図1において、情報処理装置100は表示部101、印刷部102、スキャン部103、音声出力部104、電子文書処理部110、印刷文書処理部120から構成される。
In FIG. 1, the
表示部101は、液晶ディスプレイ等の表示装置から構成され、画像や文字等により構成される各種の情報を表示する。印刷部102は、プリンタ、複写機等の印刷装置から構成され、文字や画像を印刷する。スキャン部103は、スキャナや複写機等のスキャナ装置で構成され、印刷物の紙面上の文字や画像をデジタルデータに変換して読み取る。音声出力部104は、D/A変換回路及びスピーカから構成され、デジタル音声信号をアナログ音声信号に変換してスピーカから出力する。電子文書処理部110は電子文書を取得し、取得した電子文書191の表示あるいは印刷に伴う処理を行う。印刷文書処理部120は、スキャン部103を介して印刷文書192を取得し、文書の内容を読み上げた音声を音声出力部104から出力する。
The
191はHTMLで記述された電子文書である。電子文書191は、インターネットやLANを介して接続された図示しない外部のサーバに記憶されている。また、情報処理装置100が備える図示しないHDDなどの記憶装置に記憶されていてもよい。192は電子文書を印刷した印刷文書である。
図2にHTMLで記述した電子文書191の一例を示す。文書の内容は会議場へのアクセス案内である。図2の電子文書を電子文書処理部110で処理して表示又は印刷した結果の一例を図3に示す。
FIG. 2 shows an example of an
続いて、電子文書処理部110、印刷文書処理部120の詳細を説明する。
Next, details of the electronic
図1に示すように、電子文書処理部110は、電子文書取得部111、文書構造解析部112、代替文字列抽出部113、文書表示制御部114、文書印刷制御部115、透かし情報埋め込み部116から構成される。
As shown in FIG. 1, the electronic
電子文書取得部111は電子文書191を取得する。
The electronic
文書構造解析部112は、取得した電子文書を解析し、タグで記述された文書の各要素の属性に従って文書の構造を取得する。また、取得した電子文書に画像のリンク情報が含まれる場合は、電子文書取得部111を介してリンク先の画像を取得する。さらに、タグによって画像に対して代替文字列が記述されている場合は、代替文字列抽出部113が代替文字列を抽出する。図2において破線の枠で囲った201の部分が画像データに関する情報の記述である。HTMLでは、行頭の“<img src =” に続く部分で画像へのリンク情報、続く“alt =”に続く部分で代替文字列を記述する。図2の201の部分には、画像は“map1.jpg”であり、この画像の代替文字列は「Access Map Shin-Yokohama」であることが記述されている。したがって、情報処理装置100がHTMLで記述した電子文書を対象にする場合は、代替文字列抽出部113は“alt=”に続く文字列を抽出する。文書構造解析部112及び代替文字列抽出部113で取得した文書構造の情報、画像データ、画像、代替文字列などは、RAM等の情報処理装置100が備える図示しない記憶装置に一時的に記憶する。
The document
文書表示制御部114は、文書構造解析部112で解析した文書構造に従って、表示部101に表示する内容を制御する。
The document
文書印刷制御部115は、文書構造解析部112で解析した文書構造に従って、印刷部102で受理可能な印刷データを生成する。この時、対応する代替文字列がある画像については、透かし情報埋め込み部116が画像データ中に代替文字列を電子透かしとして埋め込む。図2に示した電子文書の場合、「Access Map Shin-Yokohama」という代替文字列が印刷時に図3の302に示す対応する画像内に埋め込まれる。電子透かしの埋め込みには例えば特開2000−106624号公報に開示されている方法などの、公知の電子透かし技術を用いることができる。
The document
続いて、印刷文書処理部120について詳細に説明する。
Next, the print
図1に示すように、印刷文書処理部120は、スキャン画像取得部121、スキャン画像処理部122、音声生成部123、透かし情報抽出部124から構成される。
As shown in FIG. 1, the print
スキャン画像取得部121は、印刷文書192をスキャン部103でスキャンして得られる画像イメージであるスキャン画像を取得する。
The scan image acquisition unit 121 acquires a scan image that is an image image obtained by scanning the
スキャン画像処理部122は取得したスキャン画像を、公知のOCR(Optical Character Recognition)技術を用いて画像処理を行う。まず、スキャン画像を、画像の領域とテキストの領域に分離し、画像領域については画像のまま、テキストの領域については文字認識を行ってテキスト化する。
The scan
音声生成部123はスキャン画像処理部122で構成された電子文書をもとに、文書の内容を読み上げる音声データを生成する。電子文書に画像が含まれる場合は、透かし情報抽出部124が画像に含まれるテキスト情報を抽出し、抽出したテキスト情報に基づいて読み上げる音声データを生成する。画像からテキスト情報が抽出できなかった場合は、画像部分については読み上げデータを生成しないか、例えば「画像です」など文書中に画像がある旨の読み上げデータを生成してもよい。なお、画像に透かされたテキストを抽出する方法は、透かし情報埋め込み部116でテキスト情報の埋め込みに用いた技術と同様に既存の電子透かし技術を用いる。
The
続いて、情報処理装置100の動作を説明する。
Subsequently, the operation of the
(透かし埋め込みのフローの説明)
まず、電子文書処理部110による、電子文書の取得から印刷までの動作を図4のフローチャートに基づき説明する。
(Explanation of watermark embedding flow)
First, the operation from electronic document acquisition to printing by the electronic
ステップS401で、電子文書取得部111が電子文書を取得する。この際、取得する電子文書の保持場所については限定しない。同じ情報処理装置100内に保持している電子文書、ネットワークを経由して接続されている他装置やサーバに保持している電子文書の取得が可能である。
In step S401, the electronic
次に、ステップS402〜S411の処理において、文書構造解析部112は、取得した電子文書を解析して電子文書の構造を取得する。文書印刷制御部115は、解析結果に基づき電子文書を印刷するための印刷データを生成する。電子文書の解析は、取得した電子文書の記述について所定の処理単位ごとに行われる。処理単位としては、例えば、行ごと、タグごとなどが考えられる。
Next, in the processes of steps S402 to S411, the document
文書構造解析部112が図2の201に示したような画像データへのリンクを検出した場合(S402においてYES)、電子文書取得部111は、その画像データを取得する(S403)。取得した画像データは一時的に情報処理装置100内に保持される。また、その画像データに対応する代替文字列が記述されている場合(S405においてYES)、すなわち文書構造解析部112がその画像データを説明する文字列を検出した場合、代替文字列抽出部113は代替文字列を抽出する(S406)。HTML文書においては、画像データを説明する文字列は、alt属性により与えられている。
When the document
S407において、透かし情報埋め込み部116は、抽出した代替文字列を対応する画像データに電子透かしとして埋め込む処理を行う。S408では、文書印刷制御部115が、S407で電子透かしを埋め込んだ画像データの印刷用データを生成する(S408)。
In step S407, the watermark
以上の処理を図2に示した電子文書に適用した場合は、201に記述されている画像データmap1.jpgに代替文字列“Access Map Shin-Yokohama”を電子透かしとして埋め込んだ画像の印刷用データが生成される。すなわち、図3に示した印刷例では、302の領域に代替文字列が透かしこまれていることになる。
When the above processing is applied to the electronic document shown in FIG. 2, the print data of the image in which the substitute character string “Access Map Shin-Yokohama” is embedded as a digital watermark in the image data map1.jpg described in 201 Is generated. That is, in the printing example shown in FIG. 3, the alternative character string is watermarked in the
処理対象の記述が画像以外であった場合は(S402においてNO)、文書構造解析部112は、電子文書の記述に従って一般的なHTML文書の解析と同様に文書の解析を適宜処理する(S404)。S404の解析結果に基づき、文書印刷制御部115は印刷用のデータを生成する(S410)。
If the description to be processed is other than an image (NO in S402), the document
S405において画像に対応する代替文字列を指定する記述がない場合(S405においてNO)は、S409で文書印刷制御部115がS403で取得した画像データの印刷用データを生成する。
If there is no description designating an alternative character string corresponding to the image in S405 (NO in S405), the document
S401で取得した電子文書について、全ての処理が終了すると(S411においてYES)、文書印刷制御部115が生成した印刷用データを印刷部102に転送し、印刷を行って(S412)処理を終了する。
When all the processes are completed for the electronic document acquired in S401 (YES in S411), the print data generated by the document
(印刷文書のスキャン・読み上げのフローの説明)
次に、印刷文書をスキャンして取得し、スキャンした文書の内容を音声生成で読み上げる印刷文書処理部120の動作について図5のフローチャートを用いて説明する。
(Explanation of print document scanning / reading flow)
Next, the operation of the print
まずS501において、スキャン画像取得部121は、スキャン部103が印刷文書をスキャンしたスキャン画像を取得する。次に、スキャン画像処理部122が、取得したスキャン画像に画像処理を行い、画像領域とテキスト領域の分割を行う(S502)。
First, in step S501, the scan image acquisition unit 121 acquires a scan image obtained by scanning the print document by the
続くS503〜S510で分割された領域ごとに音声生成部123により音声データを生成する。
The
S503においてスキャン画像処理部122の処理の対象が画像の領域の場合(S503においてYES)、透かし情報抽出部124は対象とする画像から透かし情報を抽出する(S504)。抽出した情報が代替文字列であった場合(S506においてYES)は、音声生成部123は、抽出した代替文字列を読み上げる音声データを生成する(S507)。S506において透かし情報が抽出できない場合あるいは抽出した透かし情報が代替文字列でない場合はS508において、所定のメッセージの音声データを生成する。所定のメッセージは、例えば、「画像です」などの画像があることを通知する内容が望ましい。
If the processing target of the scan
S503において、スキャン画像処理部122の処理の対象がテキスト領域の場合(S503においてNO)、スキャン画像処理部122はスキャン画像の対象領域に対して文字認識を行う(S505)。その後、音声生成部123は、認識した文字列の音声データを生成する(S509)。
In S503, when the processing target of the scan
以上のS503〜S509の処理を、全ての領域について終了するまで行う。全ての領域について処理が終了したら(S510においてYES)、音声生成部123が生成した音声データを音声出力部104から出力して処理を終了する。
The above-described processing of S503 to S509 is performed for all regions. When the process is completed for all regions (YES in S510), the audio data generated by the
なお、以上の実施形態では、1つの情報処理装置に電子文書処理部110及び印刷文書処理部120が含まれる構成を説明した。ただし、電子文書処理部110及び印刷文書処理部120が互いに別の情報処理装置に分散して構成する場合にも本発明は適用可能である。
In the above embodiment, the configuration in which the electronic
また、図5のS507において音声生成部123が代替文字列の音声を生成する際に、単に代替文字列を読み上げた音声を生成するだけでは、聞いている側は他のテキストの部分との差異がわかりにくい場合がある。そこで、音声生成部123は、「XXの画像があります」(XXは代替文字列)のように、画像があることを通知するメッセージを付加してもよい。
In addition, when the
また、図4のS411及び図5のS511において、印刷及び音声出力を文書全ての処理を終えてから行うように説明したが、一定の処理を終えるごとに逐次印刷あるいは音声出力を行ってもよい。 Further, in S411 of FIG. 4 and S511 of FIG. 5, it has been described that the printing and the voice output are performed after the processing of all the documents is completed. .
以上のように、本実施形態の情報処理装置によれば、電子文書の印刷、スキャンの過程を通して、元の電子文書に記述された画像の代替文字列を保持することができる。したがって、視覚障害者が電子文書の印刷物をスキャンして音声で内容を確認する場合に、画像の代替文字列の情報を失うことがないので、元の電子文書をから得られる情報と同等の情報を得ることができ、利便性が向上する。さらに、代替文字列を直接印刷する必要がないので、電子文書の表示と印刷物で同一の文書レイアウトを保つことができるという効果がある。 As described above, according to the information processing apparatus of the present embodiment, an alternative character string of an image described in an original electronic document can be held through the process of printing and scanning the electronic document. Therefore, when a visually handicapped person scans a printed matter of an electronic document and confirms the contents by voice, the information of the substitute character string of the image is not lost, so information equivalent to the information obtained from the original electronic document The convenience can be improved. Furthermore, since it is not necessary to print the substitute character string directly, there is an effect that the same document layout can be maintained between the display of the electronic document and the printed matter.
<実施形態2>
上述の実施形態1では、電子文書取得部111が取得した電子文書を解析しながら印刷データを生成する場合を説明した。このかわりに、同様の処理に従って表示部101に電子文書の内容を表示し、表示部101に表示された内容を一括して印刷するように構成してもよい。この場合の情報処理装置の動作を図6のフローチャートを用いて説明する。
<Embodiment 2>
In the first embodiment described above, the case where print data is generated while analyzing an electronic document acquired by the electronic
(透かし埋め込みのフローの説明)
まず、S601で電子文書取得部111が電子文書を取得する。次にS602〜S611の処理において、文書構造解析部112は、取得した電子文書を解析して電子文書の構造を取得し、文書表示制御部114は、解析結果に基づき電子文書を表示するための表示用データを生成する。実施形態1と同様に、取得した電子文書の記述について所定の処理単位ごとに解析処理を行う。
(Explanation of watermark embedding flow)
First, in step S601, the electronic
S602において、処理対象が画像を表示する記述である場合(S602においてYES)は、電子文書取得部111は、記述されている画像データを取得する(S603)。取得した画像データは一時的に情報処理装置100内に保持される。画像に対応する代替文字列が記述されている場合(S605においてYES)は、代替文字列抽出部113が代替文字列を抽出する(S606)。続いてS607で、透かし情報埋め込み部116は、抽出した代替文字列を対応する画像データに電子透かしとして埋め込む処理を行う。続くS608では、文書表示制御部114は、S607で電子透かしを埋め込んだ画像データの表示用データを生成する(S608)。
In S602, when the processing target is a description for displaying an image (YES in S602), the electronic
S602において、処理対象の記述が画像以外であった場合(S602においてNO)、S604において、文書構造解析部112は電子文書記述に従って一般的なHTML文書の解析と同様に文書の解析を適宜処理する(S604)。文書表示制御部114は、S604の解析結果に基づき表示用のデータを生成する(S610)。
In S602, when the description to be processed is other than an image (NO in S602), in S604, the document
S605において画像に対応する代替文字列を指定する記述がない場合(S605においてNO)は、S609で文書表示制御部114は、S603で取得した画像データの表示用データを生成する。
If there is no description designating an alternative character string corresponding to the image in S605 (NO in S605), the document
S601で取得した電子文書について、全ての処理が終了すると(S611においてYES)、文書表示制御部114は、生成した表示用データを表示部101に転送して表示する。さらにS613において、文書印刷制御部115は、表示部101の表示内容に基づいて印刷用データを生成し、S614で印刷部102が印刷を行って処理を終了する。
When all the processes are completed for the electronic document acquired in S601 (YES in S611), the document
以上のように、実施形態2の情報処理装置によれば、画面やウィンドウのスクリーンショットを印刷した場合でも、画像の代替文字列の情報を失うことがなく印刷でき、利便性が向上する As described above, according to the information processing apparatus of the second embodiment, even when a screen shot of a screen or a window is printed, the information can be printed without losing information on an alternative character string of the image, and convenience is improved.
<実施形態3>
上述の実施形態1及び実施形態2では、画像に代替文字列を電子透かしとして埋め込む場合を説明した。しかしながら、電子文書中で使用されている画像が小さく電子透かしとして埋め込める情報量が少ない場合や、代替文字列の情報量が多い場合などは、画像に代替文字列を埋め込めないことも考えられる。こうしたことに対処するため、実施形態3では、文書全体に代替文字列の情報を埋め込む構成をとる。本実施形態の情報処理装置は、実施形態1及び実施形態2の情報処理装置100と同じ構成で実現できる。以下、本実施形態における情報処理装置の動作を図7のフローチャートを用いて説明する。
<
In the first embodiment and the second embodiment described above, the case where an alternative character string is embedded as an electronic watermark in an image has been described. However, when the image used in the electronic document is small and the amount of information that can be embedded as a digital watermark is small, or when the amount of information of the alternative character string is large, the alternative character string may not be embedded in the image. In order to cope with such a situation, the third embodiment adopts a configuration in which the information of the alternative character string is embedded in the entire document. The information processing apparatus according to the present embodiment can be realized with the same configuration as the
(透かし埋め込みのフローの説明)
まず、S701で電子文書取得部111が電子文書を取得する。次にS702〜S712の処理において、文書構造解析部112は、取得した電子文書を文書構造解析部112が解析して電子文書の構造を取得し、文書印刷制御部115は、解析結果に基づき電子文書を印刷するための印刷データを生成する。S702において、処理対象が図2の201に示したような画像を表示する記述である場合(S702においてYES)は、電子文書取得部111は記述されている画像データを取得する(S703)。画像に対応する代替文字列が記述されている場合(S705においてYES)、代替文字列抽出部113は代替文字列を抽出し(S706)、画像と代替文字列の対応関係を情報処理装置内に記憶する(S707)。画像と代替文字列の対応関係は、画像に固有の識別情報を付与し、この識別情報と代替文字列の対応関係を記憶しておく。識別情報は例えば、電子文書の解析中に取得した順に付与した番号、画像ファイル名などが考えられる。続いてS708で、透かし情報埋め込み部116は、画像に固有の識別情報を電子透かしとして埋め込む処理を行う。続くS709では、S708で文書印刷制御部115が電子透かしを埋め込んだ画像データの印刷用データを生成する。
(Explanation of watermark embedding flow)
First, in step S701, the electronic
S702において処理対象の記述が画像以外であった場合(S702においてNO)、S704において、文書構造解析部112は、電子文書の記述に従って一般的なHTML文書の解析と同様に文書の解析を適宜処理する。文書印刷制御部115は、S704の解析結果に基づき印刷用のデータを生成する(S711)。
If the description of the processing target is other than an image in S702 (NO in S702), in S704, the document
S705において画像に対応する代替文字列を指定する記述がない場合(S705においてNO)は、文書印刷制御部115は、S703で取得した画像データの印刷用データを生成する(S710)。
If there is no description designating the substitute character string corresponding to the image in S705 (NO in S705), the document
S701で取得した電子文書について、全ての処理を終了すると(S712においてYES)、透かし情報埋め込み部116は、記憶している画像と代替文字列の対応関係を文書に電子透かしとして埋め込む。その後、文書印刷制御部115は、文書の印刷用データを生成し(S713)、その印刷用データを印刷部102に転送し、印刷を行って(S714)処理を終了する。
When all the processes are completed for the electronic document acquired in S701 (YES in S712), the watermark
(代替文字列の抽出・音声出力)
次に、文書全体に代替文字列を埋め込んだ文書をスキャンして、音声で内容を通知する動作を、図8のフローチャートを用いて説明する。
(Extraction of alternative character string / voice output)
Next, an operation of scanning a document in which an alternative character string is embedded in the entire document and notifying the contents by voice will be described with reference to the flowchart of FIG.
まずS801において、スキャン画像取得部121は、スキャン部103が印刷文書をスキャンして得られたスキャン画像を取得する。
In step S <b> 801, the scan image acquisition unit 121 acquires a scan image obtained by the
次にS802において、透かし情報抽出部124は、文書に埋め込まれた透かし情報を抽出する。抽出した透かし情報に画像の識別情報と代替文字列の対応関係が含まれる場合(S803においてYES)、これを記憶する(S804)。S803において透かし情報が抽出できなかった場合、あるいは抽出した透かし情報に識別情報と代替文字列の対応関係が含まれない場合(S803においてNO)はS805に進む。
In step S802, the watermark
S805において、スキャン画像処理部122は、取得したスキャン画像に画像処理を行い、画像領域とテキスト領域の分割を行う。
In step S805, the scan
続くS806〜S813では、分割された領域ごとに音声生成部123により音声データを生成する。
In subsequent S806 to S813, the
S806において、スキャン画像処理部122の処理の対象が画像の領域の場合(S806においてYES)、透かし情報抽出部124は対象とする画像から透かし情報を抽出する(S807)。抽出した情報が画像の識別情報であった場合(S809においてYES)は、音声生成部123は、記憶している対応関係に従って抽出した識別情報に対応する代替文字列の音声データを生成する(S810)。
In S806, when the processing target of the scanned
S809において透かし情報が抽出できない場合あるいは抽出した透かし情報が画像の識別情報でない場合はS811において、画像があることを通知する所定のメッセージの音声データを生成する。 If the watermark information cannot be extracted in S809, or if the extracted watermark information is not the image identification information, voice data of a predetermined message notifying that there is an image is generated in S811.
S806において、スキャン画像処理部122の処理の対象がテキスト領域の場合(S806においてNO)、スキャン画像処理部122はスキャン画像の対象領域に対して文字認識を行う(S808)。その後、音声生成部123が認識した文字列の音声データを生成する(S812)。
In S806, when the processing target of the scan
以上のS806〜S812で説明したスキャン画像の処理を全ての領域について終了するまで行う。全ての領域について処理が終了したら(S813においてYES)、音声生成部123が生成した音声データを音声出力部104から出力して処理を終了する。
The scan image processing described in steps S806 to S812 is performed for all regions. When the process is completed for all the regions (YES in S813), the sound data generated by the
以上の説明したように実施形態3の情報処理装置では、代替文字列に関する情報を画像ではなく文書中に電子透かしとして埋め込むことができる。画像に埋め込む場合に比べ、画像サイズが小さい場合や、埋め込む代替文字列の情報量が多い場合などに効果的に代替文字列を埋め込むことが可能となる。 As described above, the information processing apparatus according to the third embodiment can embed information on an alternative character string as a digital watermark in a document instead of an image. Compared to the case of embedding in an image, it is possible to embed an alternative character string effectively when the image size is small or the information amount of the alternative character string to be embedded is large.
また、図8のフローチャートで説明した動作により、代替文字列の情報が文書に埋め込まれた場合であっても、文書をスキャンして音声で通知することが可能となる。 In addition, the operation described with reference to the flowchart of FIG. 8 makes it possible to scan and notify a document by voice even when information on an alternative character string is embedded in the document.
<実施形態4>
実施形態1乃至実施形態3では、透かし情報埋め込み部116は画像に代替文字列抽出部113が抽出した代替文字列を埋め込む処理を行った。しかし、これに限らず、文書構造解析部112が解析した結果に基づき、例えば、画像のファイル名、画像のサイズなど画像に付与された他の情報を合わせて埋め込んでも良い。
<Embodiment 4>
In the first to third embodiments, the watermark
また、代替文字列を埋め込む際に、代替文字列を読み上げる際に抽出した代替文字列をそのまま埋め込むのではなく、代替文字列と等価な別の情報を埋め込んでも良い。以下に、代替文字列の等価な情報の例を説明する。 Further, when embedding the substitute character string, instead of embedding the substitute character string extracted when reading the substitute character string as it is, another information equivalent to the substitute character string may be embedded. Hereinafter, an example of equivalent information of an alternative character string will be described.
(1)Shin-Yokohama → シンヨコハマ
(2)Shin-Yokohama → 新横浜
(3)Shin-Yokohama → /SH, I, X, Y, O, K, O, H, A, M, A/
(1) Shin-Yokohama → Shin-Yokohama (2) Shin-Yokohama → Shin-Yokohama (3) Shin-Yokohama → / SH, I, X, Y, O, K, O, H, A, M, A /
(1)はローマ字表記の代替文字列をカナ文字列に変換した例である。ここではカタカナ表記にしているが、平仮名表記であっても良い。(2)は漢字表記に変換した例である。(3)は、音声生成部123が受理可能な情報に変換する場合の一例で、音を表す記号列に変換した例である。このとき、さらにアクセント情報など音声を生成する際に必要な制御情報などをさらに付与した情報を用いても良い。上記例では、ローマ字表記から仮名、漢字、音を表す記号列への変換を説明したが、これとは逆に、元の代替文字列が、仮名、漢字の場合はローマ字表記に変換した情報を用いても良い。
(1) is an example in which an alternative character string written in Roman letters is converted into a kana character string. Although katakana notation is used here, hiragana notation may be used. (2) is an example converted to Kanji notation. (3) is an example of conversion into information acceptable by the
また、透かし情報埋め込み部116が代替文字列の情報を埋め込む際に、画像の大きさによる制約により、代替文字列に関する情報を全て埋め込めない場合は、圧縮した情報を埋め込むようにしても良い。以下に、情報を圧縮する例を説明する。
In addition, when the watermark
(1)代替文字列の一部省略
"Access Map Shin-Yokohama"を"Access Map"のように埋め込める情報量に応じて代替文字列の一部を省略する。この例のように単語単位で先頭から埋め込める単語のみを埋め込んでも良いし、文書を要約したり、重要語を抽出したりする言語処理技術を用いて、代替文字列の要約文や重要語のみを埋め込むようにしてもよい。
(1) Partial omission of substitution character string
Depending on the amount of information that can embed "Access Map Shin-Yokohama" as in "Access Map", a part of the substitute character string is omitted. You can embed only the words that can be embedded from the beginning as shown in this example, or use a language processing technology that summarizes the document or extracts the important words, and only the summary text of the alternative character string or the important words May be embedded.
(2)情報量の少ない他の表現形式に変換
例えば、"Shin-Yokohama"を「シンヨコハマ」のように、後に抽出して音声で読み上げる際に、読み上げ内容が等価になるような別の表現形式に変換する。この例ではローマ字13文字をカタカナ6文字に変換することで埋め込む情報量を圧縮している。
(2) Convert to another expression format with a small amount of information. For example, when “Shin-Yokohama” is extracted as “Shin-Yokohama” and is read out later in speech, another expression that makes the reading content equivalent. Convert to format. In this example, the amount of information to be embedded is compressed by converting 13 Roman characters into 6 katakana characters.
<他の実施形態>
以上、本発明の実施形態を詳述したが、本発明は、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
<Other embodiments>
As mentioned above, although embodiment of this invention was explained in full detail, this invention may be applied to the system comprised from several apparatuses, and may be applied to the apparatus which consists of one apparatus.
なお、本発明は、前述した実施形態の各機能を実現するプログラムを、システム又は装置に直接又は遠隔から供給し、そのシステム又は装置に含まれるコンピュータがその供給されたプログラムコードを読み出して実行することによっても達成される。 In the present invention, a program for realizing each function of the above-described embodiments is supplied directly or remotely to a system or apparatus, and a computer included in the system or apparatus reads and executes the supplied program code. Can also be achieved.
したがって、本発明の機能・処理をコンピュータで実現するために、そのコンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、上記機能・処理を実現するためのコンピュータプログラム自体も本発明の一つである。 Accordingly, since the functions and processes of the present invention are implemented by a computer, the program code itself installed in the computer also implements the present invention. That is, the computer program itself for realizing the functions and processes is also one aspect of the present invention.
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。 In this case, the program may be in any form as long as it has a program function, such as an object code, a program executed by an interpreter, or script data supplied to the OS.
プログラムを供給するためのコンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RWなどがある。また、記録媒体としては、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などもある。 Examples of the computer-readable recording medium for supplying the program include a flexible disk, a hard disk, an optical disk, a magneto-optical disk, an MO, a CD-ROM, a CD-R, and a CD-RW. Examples of the recording medium include a magnetic tape, a non-volatile memory card, a ROM, a DVD (DVD-ROM, DVD-R), and the like.
また、プログラムは、クライアントコンピュータのブラウザを用いてインターネットのホームページからダウンロードしてもよい。すなわち、ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードしてもよい。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードする形態も考えられる。つまり、本発明の機能・処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明の構成要件となる場合がある。 The program may be downloaded from a homepage on the Internet using a browser on a client computer. That is, the computer program itself of the present invention or a compressed file including an automatic installation function may be downloaded from a home page to a recording medium such as a hard disk. Further, it is also possible to divide the program code constituting the program of the present invention into a plurality of files and download each file from a different home page. That is, a WWW server that allows a plurality of users to download a program file for realizing the functions and processing of the present invention on a computer may be a constituent requirement of the present invention.
また、本発明のプログラムを暗号化してコンピュータ読み取り可能なCD−ROM等のコンピュータ読み取り可能な記憶媒体に格納してユーザに配布してもよい。この場合、所定条件をクリアしたユーザにのみ、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報で暗号化されたプログラムを復号して実行し、プログラムをコンピュータにインストールしてもよい。 The program of the present invention may be encrypted and stored in a computer-readable storage medium such as a computer-readable CD-ROM and distributed to users. In this case, only the user who cleared the predetermined condition is allowed to download the key information to be decrypted from the homepage via the Internet, decrypt the program encrypted with the key information, execute it, and install the program on the computer May be.
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現されてもよい。なお、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部又は全部を行ってもよい。もちろん、この場合も、前述した実施形態の機能が実現され得る。 Further, the functions of the above-described embodiments may be realized by the computer executing the read program. Note that an OS or the like running on the computer may perform part or all of the actual processing based on the instructions of the program. Of course, also in this case, the functions of the above-described embodiments can be realized.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれてもよい。そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部又は全部を行ってもよい。このようにして、前述した実施形態の機能が実現されることもある。 Furthermore, the program read from the recording medium may be written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer. Based on the instructions of the program, a CPU or the like provided in the function expansion board or function expansion unit may perform part or all of the actual processing. In this way, the functions of the above-described embodiments may be realized.
100 情報処理装置
101 表示部
102 印刷部
103 スキャン部
104 音声出力部
110 電子文書処理部
111 電子文書取得部
112 文書構造解析部
113 代替文字列抽出部
114 文書表示制御部
115 文書印刷制御部
116 透かし情報埋め込み部
120 印刷文書処理部
121 スキャン画像取得部
122 スキャン画像処理部
123 音声生成部
124 透かし情報抽出部
191 電子文書
192 印刷文書
DESCRIPTION OF
Claims (14)
前記解析手段が画像データへのリンクを検出した場合、前記画像データを取得する取得手段と、
前記解析手段が前記画像データを説明する文字列を検出した場合、前記取得手段が取得した前記画像データに、前記文字列を電子透かしとして埋め込む埋め込み手段と、
を備えることを特徴とする情報処理装置。 An analysis means for analyzing the structured document;
An acquisition means for acquiring the image data when the analysis means detects a link to the image data;
An embedding unit that embeds the character string as a digital watermark in the image data acquired by the acquiring unit when the analyzing unit detects a character string describing the image data;
An information processing apparatus comprising:
前記読み取り手段による読み取り結果から電子透かしとして埋め込まれた文字列を抽出する抽出手段と、
を備えることを特徴とする情報処理装置。 Reading means for reading a print document of the print data generated by the information processing apparatus according to claim 2,
Extraction means for extracting a character string embedded as a digital watermark from a reading result by the reading means;
An information processing apparatus comprising:
前記解析工程で画像データへのリンクが検出された場合、取得手段が前記画像データを取得する取得工程と、
前記解析工程で前記画像データを説明する文字列が検出された場合、埋め込み手段が、前記取得手段により取得された前記画像データに、前記文字列を電子透かしとして埋め込む埋め込み工程と、
を有することを特徴とする情報処理方法。 An analysis process in which the analysis means analyzes the structured document;
When a link to image data is detected in the analysis step, an acquisition step in which an acquisition unit acquires the image data;
When a character string describing the image data is detected in the analyzing step, an embedding unit embeds the character string as an electronic watermark in the image data acquired by the acquiring unit;
An information processing method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007299836A JP2009130398A (en) | 2007-11-19 | 2007-11-19 | Information processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007299836A JP2009130398A (en) | 2007-11-19 | 2007-11-19 | Information processing apparatus and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009130398A true JP2009130398A (en) | 2009-06-11 |
Family
ID=40820934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007299836A Withdrawn JP2009130398A (en) | 2007-11-19 | 2007-11-19 | Information processing apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009130398A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020067695A (en) * | 2018-10-22 | 2020-04-30 | コニカミノルタ株式会社 | Image forming device, image forming system, control method, and control program |
-
2007
- 2007-11-19 JP JP2007299836A patent/JP2009130398A/en not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020067695A (en) * | 2018-10-22 | 2020-04-30 | コニカミノルタ株式会社 | Image forming device, image forming system, control method, and control program |
JP7172436B2 (en) | 2018-10-22 | 2022-11-16 | コニカミノルタ株式会社 | IMAGE FORMING APPARATUS, IMAGE FORMING SYSTEM, CONTROL METHOD AND CONTROL PROGRAM |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2264995B1 (en) | Image processing apparatus, image processing method, and computer program | |
JP4903034B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP4785625B2 (en) | Image processing apparatus, image processing method, program, recording medium, and system | |
JP2006023945A (en) | Image processing system and image processing method | |
JP2008146605A (en) | Image processor and its control method | |
JP2008236200A (en) | Image processor, image processing method, and program | |
JP4673200B2 (en) | Print processing system and print processing method | |
JP4754236B2 (en) | Information processing apparatus, acquisition method, and acquisition program | |
JP2009130398A (en) | Information processing apparatus and method | |
JP4978416B2 (en) | Code information processing apparatus and code information processing program | |
JP2006345049A (en) | Image processing apparatus, image processing method, and image processing program | |
JP4164458B2 (en) | Information processing apparatus and method, computer program, and computer-readable storage medium | |
JP2006085234A (en) | Electronic document forming device, electronic document forming method, and electronic document forming program | |
JP4111202B2 (en) | Image forming apparatus | |
JP2006279090A (en) | Image processor, image processing method, and image processing system | |
JP2007081472A (en) | Image processing apparatus, image forming apparatus and image forming system | |
JP2008287440A (en) | Image processor and program | |
JP2011146852A (en) | Control apparatus and control method | |
US20230343322A1 (en) | Provision of voice information by using printout on which attribute information of document is recorded | |
JP2005196481A (en) | Image forming apparatus, image forming method, and program | |
JP2007142986A (en) | Image processor and image processing method | |
JP2007299321A (en) | Information processor, information processing method, information processing program and information storage medium | |
JP4341518B2 (en) | Image processing apparatus and image processing program | |
JP2004248245A (en) | Document processing apparatus | |
JP2006033756A (en) | Image processing apparatus, control method of image processing apparatus, program, and printed matter |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110201 |