JP4113145B2 - 文書処理装置及び文書処理方法 - Google Patents

文書処理装置及び文書処理方法 Download PDF

Info

Publication number
JP4113145B2
JP4113145B2 JP2004074458A JP2004074458A JP4113145B2 JP 4113145 B2 JP4113145 B2 JP 4113145B2 JP 2004074458 A JP2004074458 A JP 2004074458A JP 2004074458 A JP2004074458 A JP 2004074458A JP 4113145 B2 JP4113145 B2 JP 4113145B2
Authority
JP
Japan
Prior art keywords
partial document
content
document
semantic role
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004074458A
Other languages
English (en)
Other versions
JP2005266903A (ja
Inventor
寛子 羽山
美佳 福井
優 鈴木
耕二 浦田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004074458A priority Critical patent/JP4113145B2/ja
Publication of JP2005266903A publication Critical patent/JP2005266903A/ja
Application granted granted Critical
Publication of JP4113145B2 publication Critical patent/JP4113145B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、取扱説明文書を再構成して所望する新たな電子化取扱説明文書を生成する文書処理装置及び文書処理方法に関する。
家電機器やAV機器などの製品を購入すると、通常は取扱説明書がその製品に同梱されている。そして、利用者が製品の使用方法などに関して疑問を持つなどした場合は、その製品の取扱説明書を読むのが、現在最も現実的な問題解決の手段である。それでも解決できない場合は、その製品のサポート窓口に問い合わせたり、インターネット上の情報を検索したりする。ネットワークの普及に伴い、紙媒体の取扱説明書に加え、PDF(Portable Document Format)形式などの電子ファイル版の取扱説明書がダウンロード可能な場合も増えてきた。これらは基本的には製品に同梱されている紙媒体の取扱説明書と同じ内容、デザインである。電子ファイル版の取扱説明書であれば、紙媒体の取扱説明書のように、必要なときにどこにあるのか分からない、といようなことはない。
しかし、紙媒体にしろ電子ファイル版にしろ、従来の取扱説明書では、利用者の知りたいことを説明しているページを見つけるのに苦労することがあった。その理由の一つに、目次に記載されている項目の中に、利用者の知りたい内容を示す単語が含まれているとは限らない点がある。取扱説明書には、たいていの疑問を解決するのに十分な情報が記載されているはずであるが、どのページを読めば問題が解決するのかわからず、結局見当をつけたページの周辺にざっと目を通すなどの手間をかける必要があった。
各家庭にパーソナルコンピュータ等の情報処理装置が普及し、またブロードバンド化も進んでいる現在、製品の利用者のうちには、所望の情報をWeb等を利用して検索することに慣れている人も多い。そこで、取扱説明書の他にも、検索利用を前提とした電子化取扱説明コンテンツを利用者に提供することは、利用者の利便性を高めることとなる。
しかし、この際、単に取扱説明書をXMLなどの形式で電子化しただけでは十分とはいえない。取扱説明書において、複数ページの内容を見なければ目的の回答を得られない構成になっている場合は、これを単に電子化しても利便性は向上しない。
例えば、デジタルカメラを使用していて、「赤目軽減」の機能を有効にするにはどうしたらよいか知りたいとする。通常、取扱説明書は操作説明を中心に記述してあるため、目次には利用者にとっての目的である「赤目軽減」の文字はない。しかし、「フラッシュの設定」という項目はあるかもしれない。「赤目軽減」はフラッシュ使用時の機能なので、利用者は、例えば「フラッシュの設定」のページのあたりに説明があるだろうと見当をつける。ところが、「フラッシュの設定」で設定できる機能は複数あり、そのすべてが同じ操作で設定可能なため、「フラッシュの設定」のページには「赤目軽減」の語句はでておらず、例えば「設定したい機能アイコンをタップする」などというあいまいな表現で記述されている。そして、この記述の近くに設定可能な機能の一覧が記載されている参照ページが示されている。このような場合、一覧が記載されている参照ページを見てはじめて、「フラッシュの設定」で「赤目軽減」機能が設定できるということを知ることができる。
このように取扱説明書を電子化したからといって、必ずしも「赤目軽減機能の設定をするには?」というような問いに対して、「フラッシュの設定」のページに相当するコンテンツが検索されるわけではない。
また、製品の使用方法を知りたい場合は、写真や図などの静止画像よりも、実際に製品を操作している動画像を表示するほうがよい。しかし、当然のことながら、紙媒体の取扱説明書を電子化しただけの場合は、コンテンツに含まれるのはテキストおよび静止画のみである。
取扱説明コンテンツの生成に関しては、例えば特許文献1があるが、これは、あらかじめ蓄積されている取扱説明コンテンツを、ユーザの嗜好に応じた情報の提示形態を記述したプロファイルに応じた構成にして表示する手法に関するものである。
特開2003−223463
以上説明したように、従来、取扱説明文書をユーザがより使いやすいように再構成する手段がなかった。
本発明は、上記事情を考慮してなされたもので、取扱説明文書をユーザがより使いやすいように再構成することのできる文書処理装置及び文書処理方法を提供することを目的とする。
本発明に係る文書処理装置は、第1の取扱説明文書を構成する複数の部分文書の各々に対して、当該部分文書に含まれるテキストを、各意味役割の定義データが登録された意味役割解析用辞書に基づいて解析することによって、該テキストの意味役割を求め、操作説明を内容とする意味役割が求められた部分文書については、当該部分文書が取扱説明において有する意味役割が、操作説明を内容とするものであることを示す第1の意味役割情報を割り当て、参照先に関する情報を内容とする意味役割が求められた部分文書については、当該部分文書が取扱説明において有する意味役割が、参照先に関する情報を内容とするものであることを示す第2の意味役割情報を割り当てる割当手段と、前記第1の取扱説明文書を、タイトルの付加されている単位に分割して、複数の部分文書を含む複数の単位コンテンツとする分割手段と、前記単位コンテンツ中に前記第2の意味役割情報が割り当てられた部分文書が含まれている場合に、該単位コンテンツと、該部分文書から特定される参照先となる他の単位コンテンツとを関連付ける関連付手段と、前記単位コンテンツに、前記第1の意味役割情報が割り当てられた第1の部分文書が存在し、かつ、前記第2の意味役割情報が割り当てられた部分文書が、該単位コンテンツ中における該第1の部分文書の存在する箇所より後に存在する場合に、該第1の部分文書を抽出するとともに、該単位コンテンツ中で該第1の部分文書より後にありかつ最初に出現する、前記第2の意味役割情報が割り当てられた部分文書を、該第1の部分文書に関連する第2の部分文書として抽出する抽出手段と、前記抽出手段により前記第1の部分文書及び前記第2の部分文書が抽出された場合に、前記単位コンテンツが、該第1の部分文書の示す操作説明の内容について、該第2の部分文書をもとに前記関連付手段により関連付けられた前記他の単位コンテンツに含まれる内容を含むものになるように、該単位コンテンツを編集することによって、前記第1の取扱説明文書とは異なる構成を有する第2の取扱説明文書を生成する生成手段とを備えたことを特徴とする。
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読み取り可能な記録媒体としても成立する。
本発明によれば、取扱説明文書をユーザがより使いやすいように再構成することができる。
以下、図面を参照しながら本発明の実施形態について説明する。
図1に、本発明の一実施形態に係るコンテンツ処理システムの構成例を示す。
図1に示す通り、本コンテンツ処理システムは、計算機100と、この計算機100に接続された光学式文字読み取り装置(OCR)101と、記憶装置103とを備えている。
計算機100は、機能的には、意味役割解析部108と関連抽出部109とコンテンツ生成部110とを備えている。これら各部は、電子取扱説明コンテンツ生成支援プログラム107を計算機100上で実行することによって実現される。
記憶装置103には、構造化電子テキストファイル104、イメージファイル105、電子取扱説明コンテンツ106、意味役割解析用辞書111が記憶される。なお、記憶装置103には、必要に応じて映像ファイル112が記憶されてもよい。また、記憶装置103には、必要に応じて基本部品定義120が記憶されてもよい。
本コンテンツ処理システムでは、OCR101を使って紙媒体の製品取扱説明書102を読み取って解析し、レイアウトなどの構造情報を反映した構造化電子テキストファイル104と、製品取扱説明書102に載っていた各図に対応する複数のイメージファイル105とを生成する。生成された構造化電子テキストファイル104及びイメージファイル105は、記憶装置103に保存される。
印刷された文書から、タグ付きのテキストを抽出する技術としては、例えば特開2001−344562公報「文書読み取り装置および文書読取方法」等の技術を用いればよい。
なお、図1の構成例において、OCR101に加えて又はOCR101の替わりに、上記の解析結果に相当する、例えば電子ファイル版の取扱説明書から作成したデータを外部から入力して記憶装置103に保存するための入力手段を備えてもよい。
構造化電子テキストファイル104は、製品取扱説明書102の解析結果を記述した電子テキストファイルである。この解析結果は、例えばXML形式で記述されていてもよい。構造化テキストファイル104は、ページ単位に独立したファイルでもよいし、製品取扱説明書全体がひとつのファイルになっていてもよい。
イメージファイル105は、異なる複数のイメージファイル全体を示している。
映像ファイル112は、取扱説明手順を撮影した動画像のファイルである。この映像は、音声を伴うものであってよい。
本実施形態では、この映像ファイル112にメタ情報を付加した構造化ファイルも、構造化電子テキストファイル104として保存されるものとする。付加されるメタ情報は、例えば、映像コンテンツに含まれる発話部分に対する音声認識結果などである。
本コンテンツ処理システムでは、この構造化電子テキストファイル104を電子取扱説明コンテンツ生成支援プログラム107により解析して、新たな電子取扱説明コンテンツ106を生成する。
電子取扱説明コンテンツ106は、必要に応じてオーサリングツール等を利用して修正が加えられ、最終的なコンテンツ(検索用コンテンツ)となる。
このようにして製作された検索用コンテンツは、例えば製品購入者に提供される。この検索用コンテンツを検索するための検索用プログラムを、該検索用コンテンツとともに、あるいは該検索用コンテンツとは別に、製品購入者に提供してもよい。それらの提供方法については、例えば、検索用プログラムと検索用コンテンツとを収録したCD等の記録媒体を製品に同梱してもよいし、製品の製造番号などを入力してもらうことによりネットワーク経由でダウンロードできるようにしてもよい。例えば、提供された検索用プログラムと検索用コンテンツを購入者が所有する計算機にインストールすることにより、製品購入者は、製品の使い方が分からない場合に、検索用プログラムを利用して、所望の回答を計算機のディスプレイに表示させることができる。
さて、以下では、本コンテンツ処理システムの各機能部について説明する。
ここでは、既に構造化電子テキストファイル104及びイメージファイル105が記憶装置103に保存されているものとする。
本コンテンツ処理システムでは、まず、意味役割解析部108により構造化電子テキストファイル104を意味役割解析する。
ここで、意味役割解析用辞書111には、予め意味役割の定義データが登録されている。意味役割は、具体的には、例えば、「操作」、「状態」、「注意」、「参照」などである。意味役割解析部108では、構造化電子テキストファイル104のテキスト部分に対し、意味役割解析用辞書111に定義されている意味役割のうち、適当なものを割り当てる。具体的には、例えば、構造化電子テキストファイル104のテキスト部分を形態素解析し、この形態素解析結果と記憶装置103に保存されている意味役割解析用辞書111とのパターンマッチングによって、各テキスト部分の意味役割を推定し、この推定した意味役割を各テキスト部分に割り当てる。なお、意味役割が特定できなかった場合には意味役割を割り当てない。
さらに、例えば、意味役割間の遷移確率をもとにして、上記のパターンマッチングにより推定された意味役割を補正してもよい。意味役割間の遷移確率は、具体的には、例えば、「操作」という意味役割を与えられたテキストの後に、「状態」という意味役割を与えられたテキストが現れる確率などである。
次に、関連抽出部109では、意味役割解析部108で構造化電子テキストファイルのテキスト部分に意味役割を割り当てられた意味役割付き構造化電子テキストファイルを解析して、意味役割付き構造化電子テキストファイルに含まれる記述のうち、互いに関連のある記述を抽出する。例えば、取扱説明書に対応する電子テキストファイル中の操作手順の記述と、映像ファイル112に対応する電子テキストファイル中の記述とを比較し、関連があると判断されれば、この関連を示す関連情報を記憶しておく。
そして、コンテンツ生成部110では、関連抽出部109で抽出した関連情報や、構造化電子テキストファイル104の構造情報などを利用して、電子取扱説明コンテンツ106を生成する。生成された電子取扱説明コンテンツ106は、記憶装置103に保存される。コンテンツ生成部110で生成されるコンテンツは、例えばXMLなどの構造化テキストファイルである。
以下では、具体例を用いて本実施形態をより詳しく説明する。
図2に、紙媒体の製品取扱説明書102の一例を示し、図3〜図6に、図2の取扱説明書102に対する解析結果例を示す。
図2の取扱説明書102は、デジタルカメラのストロボ設定について説明しているページ(YYページ)の例である。
図3は、図2の取扱説明書102から得られた構造化電子テキストファイル104の一例である。
図4〜図6は、図2の取扱説明書102から得られたイメージファイル105の一例である。
図2の取扱説明書記述例のタイトル部分301は、図3の構造化電子テキスト例の記述部分401に対応している。
本具体例では、テキスト部分の性質は、構造化電子テキストファイルでは、“<text>”タグの“type”という要素に反映されている。例えば、図2のテキスト301がタイトルを表すことは、図3の記述部分401における“<text type=“h1”>”で表現されている。
同様に、図2のタイトル補足説明部分302は図3の記述部分402に、図2の操作説明(小見出し)部分303,306は図3の記述部分403,406に、図2の画面イメージ部分304は図3の記述部分404に、図2の解説部分305,307は図3の記述部分405,407にそれぞれ対応している。
図3の記述部分403では、図2の操作説明(小見出し)部分303におけるイメージはアイコンであることが認識されており、“image”タグの“type”及び“name”という要素でそれぞれそのイメージが「アイコン」を表し、アイコン名は「ストロボ」ということが示されている。これは、例えば、取扱説明書解析時に取扱説明書中で使用される基本部品名とそのイメージファイルとをあらかじめ定義した基本部品定義120を利用することによって可能であるが、他の方法によっても構わない。
また、図4のイメージファイルは図2の303及び図3の403のストロボアイコンイメージに、図5のイメージファイルは図2の307及び図3の407の参照矢印イメージに、図6のイメージファイルは図2の304及び図3の404の画面イメージにそれぞれ対応している(なお、図3の304では、図6のイメージは省略し、枠のみ示している)。
図7に、図3の構造化電子テキストファイルに対して意味役割解析部108により意味役割解析を行うことによって意味役割を割り当てられた意味役割付き構造化電子テキストファイルの一例を示す。
ここで、本具体例では、意味役割解析辞書111に、「操作」、「状態」、「注意」、「参照」という意味役割が定義されているとする。
図7の意味役割付き構造化電子テキストファイルには、意味役割タグ801〜805が付与されている。図7の例では、意味役割解析部108により、意味役割タグ801,803のテキスト部分が「操作」の意味役割を持つテキストであり、意味役割タグ802のテキスト部分が「状態」の意味役割を持つテキストであり、意味役割タグ804,805のテキスト部分が「参照」の意味役割を持つテキストであると判断されている。意味役割が付与されていないテキスト部分806,807は、意味役割が特定できなかったことを表す。
図8及び図9に、それぞれ、紙媒体の取扱説明書および対応する構造化電子テキストの図2及び図3とは異なる記述例を示す。
なお、ここでは、図8の取扱説明書記述例は、図2の取扱説明書記述例における307の記述で参照されているページ(XXページ)に相当するものであるとする。
図8の取扱説明書記述例のタイトル(大見出し)部分901は図9の構造化電子テキストファイルの記述部分1001に、図8のタイトル補足説明902は図9の記述部分1002に、図8のアイコン名称表示(小見出し)部分903,905は図9の記述部分1003,1005に、図8のアイコン説明部分904,906は図9の記述部分1004,1006にそれぞれ対応する。
以下、図1の関連抽出部109及びコンテンツ生成部110による処理の例について、図2及び図8の具体例を使用して説明する。なお、以下の説明では、図9の構造化電子テキストを意味役割解析部108で解析した結果も、図9の構造化電子テキストと同じであるものとし(すなわち、意味役割を特定できなかったものとし)、図9の構造化電子テキストを、図8の取扱説明書記述例に対応する意味役割付き構造化電子テキストの意味でも使用するものとする。
本具体例では、関連抽出の例として、操作説明中のあいまいな表現と、その具体的操作を示す部分を抽出する例を示す。
図10に、関連抽出部109の内部構成例を示す。
図10に示す通り、関連抽出部109は、テキスト分割部201と置換え可能箇所検出部202とを含む。また、置換え可能箇所検出部202は、参照関係抽出部203、操作手順検出部204、置換え可否判定部205を含む。
まず、テキスト分割部201において、(本コンテンツ処理システムを使用してコンテンツを生成しようとする)ユーザが、あらかじめ定義した単位に従って、意味役割付き構造化電子テキストファイル104を分割する。
例えば、構造化電子テキストファイル中で、タイトルの付加されている単位に分割する。本具体例では、タイトルが付与されている単位で分割するものとする。図3及び図9の例では、図3の構造化電子テキストファイルおよび図9の構造化電子テキストの内容が、それぞれ分割された一単位の内容となっている。
次に、参照関係抽出部203において、意味役割付き構造化電子テキストファイルから、参照関係を抽出する。
参照関係の有無は、例えば、意味役割解析部108で、「参照」であるとされたか否かで判断することができる。また、どの部分への参照であるかは、「参照」であると判断した部分のテキストを解析することにより特定する。例えば、ページ数が記載されている場合は、そのページに対応する分割テキストと関連付ける。本具体例では、図7の意味役割付き構造化電子テキストのテキスト部分804,805に、「参照」の意味役割が割り当てられている。そこで、これらテキスト部分804,805から、参照先を表している表現を探す。図7の例では、テキスト部分805に「XXページ」という記述があるため、これが参照先であると判定する。この後、「XXページ」に相当する分割テキストを検索し、図7の意味役割付き構造化電子テキストは、図9の意味役割付き構造化電子テキストを参照していることを記憶しておく。例えば、参照元のページ番号と、参照先のページ番号のテーブルを、メモリあるいは記憶装置上に保持する。
次に、操作手順検出部204において、意味役割解析部108で「操作」であると判定されたテキスト部分を検出する。
図7の意味役割付き構造化電子テキストでは、テキスト部分801,803に「操作」の意味役割が割り当てられている。従って、操作手順検出部204では、これらテキスト部分801,803が該当部分であることが検出される。
次に、置換え可否判定部205において、操作手順検出部204で検出された操作手順が、他の操作で置換え可能か否かを判定する。
図7の例では、「操作」であると判定されたテキスト部分801の直前には、基本部品定義120で定義されているアイコンイメージを示す記述として、“<imege type=“icon” name=“ストロボ” image_file=“fig0002.jpg”/>”が存在する。従って、置換え可否判定部205では、図7のテキスト部分801の操作対象は、特定のアイコンであり、操作対象の置換えはできないと判定される。なお、本実施形態では、取扱説明書の操作説明の部分は、「XXXアイコンを押す」のように、操作対象をあらわす記述が、意味役割解析で「操作」と推定されたテキスト部分の前にあると仮定している。取扱説明書の書式にあわせて置換え可否判定部205の判定ルールを変更すれば、これ以外の書式にも対応可能である。
テキスト部分803の直前にイメージを示す記述(“<image ..../>”)が存在しない。従って、「操作」の意味役割をもつテキスト部分803の操作対象であるアイコンイメージを示す記述は存在しないと判断される。
一方、テキスト部分803のテキストと、基本部品定義120の基本部品名とのマッチングを行っても、対応するものが存在しないことが分かる。さらに、テキスト部分803の後ろには、「参照」の意味役割を持つテキスト記述804,805が存在し、参照先の図9の意味役割付き構造化電子テキストには、基本部品であるアイコンイメージの記述があることが分かる。本実施形態では、「操作」の意味役割を持つテキスト部分のうち、操作対象の見つからなかったものに対して、これに対応する「参照」の意味役割をもつ記述を探す。「操作」の意味役割を持つテキスト部分に、どの「参照」の意味役割を持つテキストが対応するかは、置換え可否判定部205の判定ルールで変更できる。本実施例では、「操作」の意味役割を持つテキスト部分より後にあり、かつ最初に出現する「参照」の意味役割をもつテキスト部分を、その「操作」に関連するものであると判断している。
従って、図7のテキスト部分803は具体的操作対象を特定しておらず、図9の部分1003,1005のアイコンイメージで置換えが可能であると判定される。この例では、「操作」であると判定されたテキスト部分の直前に、基本部品定義120で定義されているアイコンイメージを示す記述として、“<imege type=“icon” name=“****” image_file=“***.jpg”/>”等が存在する場合、このアイコンを操作対象と判断し、これが無い場合には操作対象なしと判断している。
コンテンツ生成部110は、操作手順検出部204で検出された操作手順を、他の操作で置換える。また、操作対象のアイコンイメージの説明部分(<image/>タグの、“name”属性で与えられるアイコン名部分)を含めた「操作」部分のテキストと、(もしあれば)それに対応する「状態」部分のテキストとから、対応する動画像の検索を行う。例えば、前記テキストからキーワードを抽出し、これらキーワードを用いて、動画像ファイルに対応した構造化ファイル104のテキストを検索する。もし対応する動画像があれば、これを「操作」および「状態」を説明するための映像素材として、動画像ファイルの場所を示す情報(例えばURLなど)と、再生したい部分の時間情報をコンテンツに記述する。これらの情報は、構造化ファイル104に記述されている。なお、対応する動画像がなければ、取扱説明書の画面イメージを利用する。
図11に、上記解析結果をもとにコンテンツ生成部110により生成される、図2の取扱説明書例に対応する取扱説明コンテンツの記述例を示す。
図11の1101,1102の部分は、図2のタイトル301及びタイトル補足説明302に相当する部分である。また、1103の部分は、図2の画面イメージ304に対応する記述である。
本具体例では、テキスト部分の記述(“<textdata>…</textdata>の部分)と、映像やイメージなどの記述(“<visualdata>…</visualdata>”)とは別になっており、テキスト部分と映像やイメージの記述のそれぞれの対応は、“<start>…</start>”および“<duration>…</duration>”部分で行っている。“<start>…</start>”は、対応する記述部分の表示開始時間を、このコンテンツの表示開始からの相対時刻で表す。また、“<duration>…</duration>”は、同じく対応する記述部分を表示する間隔を表す。例えば、1103の画面イメージの記述は、この図11の取扱説明コンテンツの表示開始から5秒間、画面イメージを表示することを示している。同様に、1104の説明部分(“<explain>…</explain>”部分)も、1108部分に、この取扱説明コンテンツの表示開始から5秒間表示するように記述してある。1105の説明部分(“<explain>…</explain>”)は、1111部分に、この図11のコンテンツの表示開始から5秒目から6秒間、1105の部分を表示するよう記述してある。本具体例では、1103の画面イメージと1104の説明部分は、表示開始時刻と表示間隔が重なっているため、同時に表示される。なお、コンテンツ生成部110で、この部分に対応する動画像が検索された場合は、画面イメージの記述1103の部分は、動画像の記述になる。その場合、画面イメージの記述1103の“<image.../>”の部分が、動画像ファイルを表す記述となる。動画像ファイルを表す記述には、動画像ファイルのありかを示す記述(URLなど)と、動画像ファイルの再生開始時間、および再生時間(再生開始から再生終了までの時間)に関する記述が含まれる。
1104および1105(“<explain>…</explain>”)は、テキスト部分(“<textdata>…</textdata>”)に含まれており、それぞれが説明のひとまとまりを記述している。1104は、図2の操作手順の[1](303および305)に相当する記述であり、1105は、図2の操作手順の[2](306および307)に相当する記述である。説明テキスト部分1104には、操作手順を記述した部分1106(“<operation>….</operation>”)と、操作後の状態を記述した部分(“<state>…</state>”)1107、および説明テキスト1104の表示時間に関する記述1108が含まれている。
操作手順の記述1106および状態の記述1107の範囲は、図7の意味役割付き構造化電子テキストの構造情報と、意味役割より決定される。説明テキスト部分1105には、操作手順を記述した部分(“<operation>…</operation>”)1109、操作手順に関わる事項を記述した部分(“<note>…</note>”)1110、および説明テキスト1105の表示時間に関する記述1111が含まれている。操作手順の記述1109には、さらに、置換え可否判定部205の判定結果を反映した記述(“<candidate>….</candidate>”)1112が含まれている。
本具体例では、関連抽出部109において、操作手順を示す部分803の記述(図2の306に相当)が、1003および1005のイメージ記述(図8の903および905に相当)と置換え可能と判定した。
1112の部分は、この結果を反映した記述である。すなわち、1112の部分は、この図11のコンテンツが表示される際、“<candidate>….</candidate>”内にある“<item>”の部分のどれかひとつを選択して表示することを表したものである。
どれが選択されるかは、検索プログラムに入力された質問文の内容による。なお、検索プログラムは、本実施例で示したようなタグの解析ルールを備えているものとする。検索は、質問文中からキーワードを抽出して、キーワードによる検索を行ってもよいし、XQuery(URL:http//www.w3c.org/XML/Query)などを利用してもよい。検索結果のXML文書に、<candidate>...</candidate>の記述がある場合は、そのうちのどのアイテムを選択表示するかを決定する。どのアイテムを選択するかは、例えば、検索された文書の<candidate>...</candidate>内のテキストと、質問文から抽出したキーワードとのマッチングをとることで行える。例えば、利用者が「赤目軽減モードの設定方法は?」という質問を入力した場合は、3番目のアイテム(“<item id=“2”>…</item>”)が選択される。
質問文とうまくマッチしなかった場合は、元の記述(図2の306に相当)である、1番目のアイテム(“<item id=“0”>…</item>”)が選択される。
操作手順1112に関わる事項を記述した部分1110(“<note>…</note>”)は、さらに、置換え可否判定部205の判定結果を反映した記述部分(“<candidate>…</candidate>”)1113および他のコンテンツへのリンクを示す記述(“<link>…</link>”)1114を含む。
1113の記述は、1112の記述と対応しており、表示時に、1112で選択されたアイテムと同じidを持つアイテムが選択表示される。
また、1114の関連コンテンツの記述は、図2の307の記述に対応している。また、映像やイメージなどの記述1103の<image..../>の部分も、テキスト部分の記述と同様に、<candidate>...</candidate>タグを利用して、質問内容によって、異なる映像やイメージを選択するようにすることも可能である。
なお、図11は、コンテンツ生成の一例であり、この他にも種々の取扱説明コンテンツを生成することができる。もちろん、表示時間に関する記述を用いない構成も可能である。
図12に、図11のコンテンツの検索プログラムによる表示例を示す。
図12の検索結果表示例は、製品購入者が、検索プログラムから「赤目軽減モードの設定方法は?」と入力した際の、検索結果を表示した例である。
この検索結果表示例では、まず、(a)のように、図11のタイトル部分1101及びその補足説明1102が、それぞれ部分1201,1202に表示される。また、表示開始時には、(a)のように、部分1103に相当する画面イメージが部分1203に、対応する説明1104が部分1204にそれぞれ表示される。
また、表示開始から5秒後には、(b)のように、画面表示が変わり、部分1203及び1204に代わって部分1105の説明が部分1205に表示される。
なお、コンテンツの表示方法は、検索プログラムのコンテンツ解析、表示の方法に依存しており、これ以外の方法でもかまわない。
このように、従来の製品取扱説明書からの、検索用電子コンテンツの自動生成を支援することができ、電子コンテンツ作成にかかる人的コストを軽減することができる。また、製品取扱説明の記述中の関連を解析し、解析結果を基に説明内容を補うことにより、利用者の利便性を向上させることができる。
なお、以上の各機能は、ソフトウェアとして記述し適当な機構をもったコンピュータに処理させても実現可能である。
また、本実施形態は、コンピュータに所定の手順を実行させるための、あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるためのプログラムとして実施することもできる。加えて該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の一実施形態に係るコンテンツ処理システムの構成例を示す図 取扱説明書の記述例を示す図 構造化電子テキストファイルの記述例を示す図 イメージファイルの記述例を示す図 イメージファイルの記述例を示す図 イメージファイルの記述例を示す図 意味役割付き構造化電子テキストファイルの記述例を示す図 取扱説明書の記述例を示す図 構造化電子テキストファイルの記述例を示す図 図1のコンテンツ処理システムの関連抽出部の内部構成例を示す図 生成された電子取扱説明コンテンツの記述例を示す図 検索結果表示画面の構成例を示す図
符号の説明
100…計算機、101…OCR、103…記憶装置、104…構造化電子テキストファイル、105…イメージファイル、112…映像ファイル、107…電子取扱説明コンテンツ生成支援プログラム、106…電子取扱説明コンテンツ、108…意味役割解析部、109…関連抽出部、110…コンテンツ生成部、111…意味役割解析用辞書、120…基本部品定義、201…テキスト分割部、202…置換え可能箇所検出部、203…参照関係抽出部、204…操作手順検出部、205…置換え可否判定部

Claims (6)

  1. 第1の取扱説明文書を構成する複数の部分文書の各々に対して、当該部分文書に含まれるテキストを、各意味役割の定義データが登録された意味役割解析用辞書に基づいて解析することによって、該テキストの意味役割を求め、操作説明を内容とする意味役割が求められた部分文書については、当該部分文書が取扱説明において有する意味役割が、操作説明を内容とするものであることを示す第1の意味役割情報を割り当て、参照先に関する情報を内容とする意味役割が求められた部分文書については、当該部分文書が取扱説明において有する意味役割が、参照先に関する情報を内容とするものであることを示す第2の意味役割情報を割り当てる割当手段と、
    前記第1の取扱説明文書を、タイトルの付加されている単位に分割して、複数の部分文書を含む複数の単位コンテンツとする分割手段と、
    前記単位コンテンツ中に前記第2の意味役割情報が割り当てられた部分文書が含まれている場合に、該単位コンテンツと、該部分文書から特定される参照先となる他の単位コンテンツとを関連付ける関連付手段と、
    前記単位コンテンツに、前記第1の意味役割情報が割り当てられた第1の部分文書が存在し、かつ、前記第2の意味役割情報が割り当てられた部分文書が、該単位コンテンツ中における該第1の部分文書の存在する箇所より後に存在する場合に、該第1の部分文書を抽出するとともに、該単位コンテンツ中で該第1の部分文書より後にありかつ最初に出現する、前記第2の意味役割情報が割り当てられた部分文書を、該第1の部分文書に関連する第2の部分文書として抽出する抽出手段と、
    前記抽出手段により前記第1の部分文書及び前記第2の部分文書が抽出された場合に、前記単位コンテンツが、該第1の部分文書の示す操作説明の内容について、該第2の部分文書をもとに前記関連付手段により関連付けられた前記他の単位コンテンツに含まれる内容を含むものになるように、該単位コンテンツを編集することによって、前記第1の取扱説明文書とは異なる構成を有する第2の取扱説明文書を生成する生成手段とを備えたことを特徴とする文書処理装置。
  2. 前記抽出手段により抽出された前記第2の部分文書をもとに関連付けられた前記他の単位コンテンツは、前記抽出手段により該第2の部分文書とともに抽出された前記第1の部分文書では省かれている操作説明の内容を含むものであることを特徴とする請求項1に記載の文書処理装置。
  3. 前記第1の部分文書は、特定の機能に関する操作説明の内容を含むが、該特定の機能の有する複数種類の操作モードの説明に関する内容を含まないものであり、
    前記他の単位コンテンツは、前記第1の部分文書では省かれている前記特定の機能の有する複数種類の操作モードの説明に関する内容を含むものであり、
    前記生成手段は、前記第1の部分文書が抽出された前記単位コンテンツを編集するにあたって、該単位コンテンツに、前記他の単位コンテンツが含む前記特定の機能の有する複数種類の操作モードの説明に関する内容を含ませるとともに、該複数種類の操作モードの説明に関する内容に対して、いずれか一種類を選択して表示させるべき旨を示す情報を付加することを特徴とする請求項2に記載の文書処理装置。
  4. 割当手段、分割手段、関連付手段、抽出手段及び生成手段を備えた文書処理装置の文書処理方法であって、
    前記割当手段が、第1の取扱説明文書を構成する複数の部分文書の各々に対して、当該部分文書に含まれるテキストを、各意味役割の定義データが登録された意味役割解析用辞書に基づいて解析することによって、該テキストの意味役割を求め、操作説明を内容とする意味役割が求められた部分文書については、当該部分文書が取扱説明において有する意味役割が、操作説明を内容とするものであることを示す第1の意味役割情報を割り当て、参照先に関する情報を内容とする意味役割が求められた部分文書については、当該部分文書が取扱説明において有する意味役割が、参照先に関する情報を内容とするものであることを示す第2の意味役割情報を割り当てる割当ステップと、
    前記分割手段が、前記第1の取扱説明文書を、タイトルの付加されている単位に分割して、複数の部分文書を含む複数の単位コンテンツとする分割ステップと、
    前記関連付手段が、前記単位コンテンツ中に前記第2の意味役割情報が割り当てられた部分文書が含まれている場合に、該単位コンテンツと、該部分文書から特定される参照先となる他の単位コンテンツとを関連付ける関連付ステップと、
    前記抽出手段が、前記単位コンテンツに、前記第1の意味役割情報が割り当てられた第1の部分文書が存在し、かつ、前記第2の意味役割情報が割り当てられた部分文書が、該単位コンテンツ中における該第1の部分文書の存在する箇所より後に存在する場合に、該第1の部分文書を抽出するとともに、該単位コンテンツ中で該第1の部分文書より後にありかつ最初に出現する、前記第2の意味役割情報が割り当てられた部分文書を、該第1の部分文書に関連する第2の部分文書として抽出する抽出ステップと、
    前記生成手段が、前記抽出ステップにおいて前記抽出手段により前記第1の部分文書及び前記第2の部分文書が抽出された場合に、前記単位コンテンツが、該第1の部分文書の示す操作説明の内容について、該第2の部分文書をもとに前記関連付手段により関連付けられた前記他の単位コンテンツに含まれる内容を含むものになるように、該単位コンテンツを編集することによって、前記第1の取扱説明文書とは異なる構成を有する第2の取扱説明文書を生成する生成ステップとを有することを特徴とする文書処理方法。
  5. 前記抽出手段により抽出された前記第2の部分文書をもとに関連付けられた前記他の単位コンテンツは、前記抽出手段により該第2の部分文書とともに抽出された前記第1の部分文書では省かれている操作説明の内容を含むものであることを特徴とする請求項4に記載の文書処理方法。
  6. 前記第1の部分文書は、特定の機能に関する操作説明の内容を含むが、該特定の機能の有する複数種類の操作モードの説明に関する内容を含まないものであり、
    前記他の単位コンテンツは、前記第1の部分文書では省かれている前記特定の機能の有する複数種類の操作モードの説明に関する内容を含むものであり、
    前記生成手段は、前記第1の部分文書が抽出された前記単位コンテンツを編集するにあたって、該単位コンテンツに、前記他の単位コンテンツが含む前記特定の機能の有する複数種類の操作モードの説明に関する内容を含ませるとともに、該複数種類の操作モードの説明に関する内容に対して、いずれか一種類を選択して表示させるべき旨を示す情報を付加することを特徴とする請求項5に記載の文書処理方法。
JP2004074458A 2004-03-16 2004-03-16 文書処理装置及び文書処理方法 Expired - Fee Related JP4113145B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004074458A JP4113145B2 (ja) 2004-03-16 2004-03-16 文書処理装置及び文書処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004074458A JP4113145B2 (ja) 2004-03-16 2004-03-16 文書処理装置及び文書処理方法

Publications (2)

Publication Number Publication Date
JP2005266903A JP2005266903A (ja) 2005-09-29
JP4113145B2 true JP4113145B2 (ja) 2008-07-09

Family

ID=35091428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004074458A Expired - Fee Related JP4113145B2 (ja) 2004-03-16 2004-03-16 文書処理装置及び文書処理方法

Country Status (1)

Country Link
JP (1) JP4113145B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150253031A1 (en) * 2014-03-07 2015-09-10 Mitsubishi Electric Corporation Air-conditioning apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150253031A1 (en) * 2014-03-07 2015-09-10 Mitsubishi Electric Corporation Air-conditioning apparatus

Also Published As

Publication number Publication date
JP2005266903A (ja) 2005-09-29

Similar Documents

Publication Publication Date Title
JP5996734B2 (ja) 動画を自動的にアセンブリする方法およびシステム
US7992085B2 (en) Lightweight reference user interface
US20080079693A1 (en) Apparatus for displaying presentation information
US20140281855A1 (en) Displaying information in a presentation mode
US8612845B2 (en) Method and apparatus for facilitating directed reading of document portions based on information-sharing relevance
GB2556174A (en) Methods and systems for generating virtual reality environments from electronic documents
JP5676167B2 (ja) サーチ結果を生成するシステムと方法
US9372843B2 (en) Document association device, document association method, and non-transitory computer readable medium
US20120173578A1 (en) Method and apparatus for managing e-book contents
US7085767B2 (en) Data storage method and device and storage medium therefor
JP2011076566A (ja) 情報処理装置、端末装置、サーバ装置、通信システム、表示制御方法、プログラム、およびコンピュータ読取り可能な記録媒体
US7921127B2 (en) File management apparatus, control method therefor, computer program, and computer-readable storage medium
JPH02249023A (ja) オンライン情報の表示方法
JP2006119915A (ja) 電子ファイリングシステム、電子ファイリング方法
JP2012068982A (ja) 検索結果出力装置、検索結果出力方法及び検索結果出力プログラム
JP4542033B2 (ja) 文書コンテンツの複数のレンディションを提供するためのシステムおよび方法
JP2004086845A (ja) 電子文書情報拡充装置、方法及びプログラム、並びに、電子文書情報拡充プログラムを記録した記録媒体
JP4113145B2 (ja) 文書処理装置及び文書処理方法
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
US20140156593A1 (en) Information processing apparatus, information processing method, and program
JP3543726B2 (ja) 書籍などの検索を支援する知識検索サービス方法および装置
JP2006195900A (ja) マルチメディアコンテンツ生成装置及び方法
US10606940B2 (en) Annotation sharing method, annotation sharing apparatus, and computer program product
JP2008269085A (ja) 情報推薦装置及び情報推薦システム
KR20110042626A (ko) 전자액자의 이미지 표시 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees