JP2017068307A - Information retrieval device, control method thereof, and information retrieval program - Google Patents

Information retrieval device, control method thereof, and information retrieval program Download PDF

Info

Publication number
JP2017068307A
JP2017068307A JP2015189270A JP2015189270A JP2017068307A JP 2017068307 A JP2017068307 A JP 2017068307A JP 2015189270 A JP2015189270 A JP 2015189270A JP 2015189270 A JP2015189270 A JP 2015189270A JP 2017068307 A JP2017068307 A JP 2017068307A
Authority
JP
Japan
Prior art keywords
search
information
style
font
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015189270A
Other languages
Japanese (ja)
Inventor
圭介 田宮
Keisuke Tamiya
圭介 田宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015189270A priority Critical patent/JP2017068307A/en
Publication of JP2017068307A publication Critical patent/JP2017068307A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To facilitate retrieval of indexes in a digital content such as an electronic manual in which font indexes (icons) are mixed.SOLUTION: A content 6 including indexes first formed into fonts so as to be usable as types of characters unique to the content is acquired. In the content 6, retrieval style identifiers defining the indexes usable as retrieval queries and font information associated with the retrieval style identifiers are described. During retrieval in which the indexes in the content 6 as queries, a font information list is generated for each of the described retrieval style identifiers, and the position of an index present in the content can be specified with an index selected among the indexes presented as selection candidates on the basis of the list. The specified index is reverse-displayed on a viewer.SELECTED DRAWING: Figure 1

Description

本発明は、デジタルコンテンツに含まれる情報の検索技術に関する。   The present invention relates to a search technique for information contained in digital content.

近年、プリンタやデジタルカメラなどの電子機器の製品マニュアルが電子化され、電子マニュアルとして電子機器の利用者に配布されることが一般的になっている。例えば、特許文献1には、複数種類の電子機器の製品マニュアルを蓄積しておき、利用者が参照したい製品マニュアルを自動的に検索して提示するシステムが提供されている。このシステムでは、利用者が操作する端末から要求された電子マニュアルを検索し、検索により特定した電子マニュアルを、通信ネットワークを介してその端末に提供する。利用者は、提供された電子マニュアルを端末に格納した後、文書形式に対応したビューアでそれを表示する。ビューアとしては、Webブラウザ、PDFリーダ、EPUBビューア等がある。   In recent years, product manuals for electronic devices such as printers and digital cameras have been digitized and distributed as electronic manuals to users of electronic devices. For example, Patent Document 1 provides a system in which product manuals for a plurality of types of electronic devices are accumulated and a product manual that a user wants to refer to is automatically searched and presented. In this system, an electronic manual requested from a terminal operated by a user is searched, and the electronic manual specified by the search is provided to the terminal via a communication network. The user stores the provided electronic manual in the terminal and then displays it with a viewer corresponding to the document format. Examples of the viewer include a web browser, a PDF reader, and an EPUB viewer.

特開2002−149874号公報JP 2002-149874 A

電子マニュアルなどはコンテンツを構造化文書として作成する場合、コンテンツの作成者は、コンテンツに含まれる文字がビューアに表示される際に適用されるフォントを任意に設定可能である。フォントとは、描画の文字の書体デザインを揃えるために利用される情報である。コンテンツの作成者は、コンテンツのうちタイトル部分にはゴシック体のフォントを指定し、本文には明朝体のフォントを指定するといった方法で、文章の見た目をデザインすることができる。また近年では、携帯電話などで使用される絵文字のように、アルファベットやかな文字など筆記で従来用いられてきた文字だけでなく画像に文字コードを対応させて文字の一種として扱う場合もある。フォントは、文字の識別子である文字コードと、見た目を再現するための形状情報であるグリフとを対応付けたフォントファイルとして電子機器に記憶される。あるフォントで描画することが指定された文字を描画するためには、構造化文書の規程に沿って指定されたフォントのフォントファイルを参照し、当該文字の文字コードに基づいてグリフを読み出して描画を行う。電子機器の電子マニュアルの中には、その電子機器の画面で使用されるアイコンをフォント化し、これを絵文字ように文章中で使用したものがある。ここでアイコンのフォント化とは、そのアイコンに文字としての識別子である文字コードを割り当て、グリフと対応付けて、生成したフォントファイルに格納することを指す。フォント化により、各電子機器に固有のアイコンのフォントを生成する場合には、各アイコンの画像情報がグリフとして用いられる。フォント化されたアイコンは「アイコンフォント」などと呼ばれる。
携帯電話の絵文字であれば、製造元が異なる多種の端末において同一の絵文字が入力・閲覧できるように、標準化された文字コードが割り当てられている。それに対し、電子機器固有のアイコンフォントは、他の電子機器では使用されることがない。そのため、標準化された文字コードが割り当てられていないことが多い。また、見た目では類似していたり同じ役割を持つアイコンであっても、製造元や機種によって異なる名称が設定されるなど、その呼び方も統一されていないことが多い。さらに、アイコン自体が任意の画像によって表現されるため、漢字などの筆記で使用する文字を検索するときに従来使用される、部首や画数といった要素を持たない。そのため、電子機器の利用者が、ビューアで電子マニュアルを表示し、アイコンフォントをクエリとして、関連する文章(アイコンフォントを含む文字列)を検索することが難しかった。
このような問題は、アイコンフォントに限らず、コンテンツ作成者が独自の指標をフォント化し、コンテンツ固有の文字(絵文字)として文章中に使用するデジタルコンテンツにおいて、当該指標を検索する場合に共通に生じる。
When content such as an electronic manual is created as a structured document, the creator of the content can arbitrarily set a font to be applied when characters included in the content are displayed on the viewer. The font is information used to align the font design of the drawn characters. The content creator can design the appearance of the text by specifying a Gothic font for the title portion of the content and a Mincho font for the body. In recent years, there are cases in which not only characters that have been conventionally used in writing, such as alphabetic characters, such as pictographs used in mobile phones, but also characters are associated with images and handled as a kind of characters. The font is stored in the electronic device as a font file in which a character code that is a character identifier and a glyph that is shape information for reproducing the appearance are associated with each other. To draw a character specified to be drawn in a certain font, refer to the font file of the font specified according to the rules of the structured document, read the glyph based on the character code of the character and draw I do. In some electronic manuals of electronic devices, icons used on the screen of the electronic device are converted into fonts and used as text in the text. Here, icon fontification means assigning a character code, which is an identifier as a character, to the icon, associating it with a glyph, and storing it in the generated font file. When generating a font of an icon unique to each electronic device by fontification, the image information of each icon is used as a glyph. Font icons are called “icon fonts”.
For mobile phone pictograms, standardized character codes are assigned so that the same pictograms can be input and viewed on various terminals from different manufacturers. On the other hand, the icon font unique to the electronic device is not used in other electronic devices. For this reason, standardized character codes are often not assigned. In addition, even icons that are similar in appearance or have the same role are often named differently, for example, different names are set depending on the manufacturer and model. Furthermore, since the icon itself is represented by an arbitrary image, it does not have elements such as radicals and strokes that are conventionally used when searching for characters used in writing such as kanji. Therefore, it is difficult for a user of an electronic device to display an electronic manual with a viewer and search for related sentences (a character string including an icon font) using an icon font as a query.
Such a problem occurs not only in the icon font but also in the case where the content creator searches for the index in the digital content used in the text as a unique character (pictogram) by converting the original index into a font. .

本発明は、ビューアでデジタルコンテンツを表示した際に、デジタルコンテンツに含まれている指標の検索を容易にする情報検索装置を提供することを主たる課題とする。   It is a main object of the present invention to provide an information search apparatus that facilitates searching for an index included in digital content when the digital content is displayed by a viewer.

本発明の情報検索装置は、フォント化された指標が混在し、所定のビューアに表示する際の前記指標のスタイルが記述されたスタイル定義を有するデジタルコンテンツの入力を受け付ける入力制御手段と、入力された前記デジタルコンテンツの前記スタイル定義を解析する解析手段と、前記スタイル定義の解析結果と検索クエリとして入力される情報とに基づいて前記デジタルコンテンツに対する検索を行う検索手段とを備え、前記スタイル定義には、検索可能とされた前記指標を表す検索スタイル識別子と、この検索スタイル識別子に関連付けられたフォント情報とが記述されており、前記解析手段は、前記スタイル定義に記述された前記検索スタイル識別子毎に前記フォント情報のリストを生成してバッファに保存し、前記検索手段は、保存されている前記リストに基づいて、前記検索するクエリとなる指標の候補を提示し、前記提示された候補の中で前記検索クエリとして選択された指標の情報を用いて前記デジタルコンテンツにおいて前記指標が存在する部分を特定することを特徴とする。   The information search apparatus according to the present invention includes input control means for receiving input of digital content having style definitions in which font-like indicators are mixed and displayed in a predetermined viewer. Analysis means for analyzing the style definition of the digital content, and search means for searching the digital content based on the analysis result of the style definition and information input as a search query. Describes a search style identifier representing the index that can be searched, and font information associated with the search style identifier, and the analysis means includes each search style identifier described in the style definition. The font information list is generated and stored in a buffer, and the search means includes: Based on the existing list, a candidate for an index to be the query to be searched is presented, and the index in the digital content is used using information on the index selected as the search query among the presented candidates. It is characterized by specifying a part where the sigma exists.

本発明によれば、ビューアでデジタルコンテンツを表示した際に、デジタルコンテンツに含まれている指標の検索を容易にする情報検索装置を提供することができる。   ADVANTAGE OF THE INVENTION According to this invention, when displaying digital content with a viewer, the information search device which makes it easy to search the parameter | index contained in digital content can be provided.

第1実施形態に係る情報検索装置の構成図。The lineblock diagram of the information search device concerning a 1st embodiment. 第1実施形態によるコンテンツ検索工程の処理手順説明図。Process procedure explanatory drawing of the content search process by 1st Embodiment. 検索スタイル一覧生成処理の詳細手順説明図。Explanatory drawing of a detailed procedure of search style list generation processing. 検索結果取得処理の詳細手順説明図。Explanatory drawing of a detailed procedure of a search result acquisition process. 検索スタイル一覧表の記述例を示す図。The figure which shows the example of a description of a search style table. 検索要求入力画面の表示例を示す図。The figure which shows the example of a display of a search request input screen. (a)は検索文字列入力画面、(b)は検索結果の表示例を示す図。(A) is a search character string input screen, (b) is a figure which shows the example of a display of a search result. コンテンツのHTMLによる記述例を示す図。The figure which shows the example of description by HTML of content. 第2実施形態に係る情報検索装置の構成図。The block diagram of the information search device which concerns on 2nd Embodiment. 第2実施形態によるコンテンツ検索工程の処理手順説明図。Processing procedure explanatory drawing of the content search process by 2nd Embodiment. (a),(c)はフォントの記述例、(b)は一覧表の記述例を示す図。(A), (c) is a description example of a font, (b) is a figure which shows the description example of a list. 第3実施形態に係る情報検索装置の構成図。The block diagram of the information search device which concerns on 3rd Embodiment. 第3実施形態によるコンテンツ検索工程の処理手順説明図。Explanatory drawing of the process sequence of the content search process by 3rd Embodiment.

[第1実施形態]
<装置構成>
図1は、本発明の第1実施形態に係る情報検索装置の構成図である。この情報検索装置100は、CPU,RAM,ROMを有するコンピュータを搭載したタブレット端末である。但し、携帯電話機、スマートフォン、電子書籍リーダ機器、パーソナルコンピュータなどを情報検索装置100として用いることもできる。CPU(Central Processing Unit)は、RAM(Random Access Memory)にインストールされた所定の情報検索用プログラムを実行する。RAMは、また、CPUにワークエリアを提供する。ROM(Read Only Memory)は基本制御プログラムや書き換える必要のないデータなどが格納される。
[First Embodiment]
<Device configuration>
FIG. 1 is a configuration diagram of an information search apparatus according to the first embodiment of the present invention. The information retrieval apparatus 100 is a tablet terminal equipped with a computer having a CPU, RAM, and ROM. However, a mobile phone, a smart phone, an electronic book reader device, a personal computer, or the like can be used as the information search device 100. A CPU (Central Processing Unit) executes a predetermined information retrieval program installed in a RAM (Random Access Memory). The RAM also provides a work area for the CPU. A ROM (Read Only Memory) stores basic control programs and data that does not need to be rewritten.

情報検索装置100は、CPUが上記の情報検索用プログラムを実行することにより、コンピュータを主制御部10として動作させる。主制御部10は、入力制御部11、解析部12、スタイル操作部13、検索部14、表示制御部15などの機能を有する。また、RAMにバッファ16を形成する。主制御部10は、制御バス1を介して、通信部2、表示部3、操作部4及びコンテンツ記憶部5と機能的に接続されている。   The information search apparatus 100 causes the computer to operate as the main control unit 10 when the CPU executes the information search program. The main control unit 10 has functions such as an input control unit 11, an analysis unit 12, a style operation unit 13, a search unit 14, and a display control unit 15. Further, the buffer 16 is formed in the RAM. The main control unit 10 is functionally connected to the communication unit 2, the display unit 3, the operation unit 4, and the content storage unit 5 via the control bus 1.

通信部2は、インターネットなどのネットワークを介して外部の電子機器と通信するためのものである。表示部3は、ディスプレイを含み、このディスプレイをビューアその他の表示画面とするためのインタフェースを提供する。操作部4は、表示部3に表示された表示画面などを通じて利用者が入力した操作内容を受け付ける。なお、表示部3と操作部4はタッチパネルとして一体化されていても良い。コンテンツ記憶部5は、ハードディスクや半導体メモリ等であり、検索対象となるデジタルコンテンツ6を格納している。以下、デジタルコンテンツ6を単にコンテンツ6と称する。   The communication unit 2 is for communicating with an external electronic device via a network such as the Internet. The display unit 3 includes a display, and provides an interface for using the display as a viewer or other display screen. The operation unit 4 receives the operation content input by the user through the display screen displayed on the display unit 3 or the like. The display unit 3 and the operation unit 4 may be integrated as a touch panel. The content storage unit 5 is a hard disk, a semiconductor memory, or the like, and stores digital content 6 to be searched. Hereinafter, the digital content 6 is simply referred to as content 6.

コンテンツ6は、本例では、HTML(HyperText Markup Language)形式の電子マニュアルとする。コンテンツ6は、コンテンツ本体とスタイル定義とを有し、フォント化された指標がそうでない文字と混在している。「フォント化された指標」は、標準化された文字コードを持たない指標であって、フォント化されたことで、そのコンテンツにおいて文字の1つとして認識可能となるもの(指標)をいう。例えば、アイコンやトレードマークを表すのに使用されるベクター形式で表現される図形又は画像などが「フォント化された指標」となり得る。つまり、フォント化された指標もそうでない文字と同様、独立したフォント情報として認識し得る。フォント情報はフォントファイルとして扱われる。本実施形態では、以下の2つのフォントファイルが予め生成され、コンテンツ6と同様に記憶部5に記憶されているとする。1つは、コンテンツ6である電子マニュアルによって説明される電子機器(一例としてプリンタとする)固有のアイコンのそれぞれに文字コードを割り当て、各アイコンの画像をグリフとして対応付けたアイコン描画用フォントである。もう1つは、コンテンツ6である電子マニュアルに記載されるトレードマーク(商標)のそれぞれに文字コードを割り当て、各トレードマークの画像をグリフとして対応付けたトレードマーク描画用フォントである。なお、各フォントファイルが記憶されるのは、情報検索装置100内部の記憶部に限らず、例えばネットワーク上のフォントサーバであっても構わない。   In this example, the content 6 is an electronic manual in HTML (HyperText Markup Language) format. The content 6 has a content main body and a style definition, and fontified indexes are mixed with characters that are not. The “fontized index” refers to an index (index) that does not have a standardized character code and that can be recognized as one of the characters in the content by being converted into a font. For example, a graphic or image expressed in a vector format used to represent an icon or a trademark can be a “font index”. In other words, the fontized index can be recognized as independent font information in the same manner as other characters. Font information is handled as a font file. In the present embodiment, it is assumed that the following two font files are generated in advance and stored in the storage unit 5 in the same manner as the content 6. One is an icon drawing font in which a character code is assigned to each icon unique to an electronic device (for example, a printer) described by the electronic manual that is the content 6, and an image of each icon is associated as a glyph. . The other is a trademark drawing font in which a character code is assigned to each trademark (trademark) described in the electronic manual which is the content 6 and an image of each trademark is associated as a glyph. Note that each font file is stored not only in the storage unit in the information search apparatus 100, but may be a font server on a network, for example.

一般的に、1つのフォントは複数の文字の文字コードとグリフを備える。そして複数のフォントのそれぞれが、同一の文字(例えばアルファベットのそれぞれ)について、デザインが異なるグリフを備えることが多い。一方で、1つのフォントだけであらゆる文字の文字コードを網羅するグリフを備えることは少ない。例えば多くの場合、日本語の文章を描画するのに用いられるフォントは、かな文字や漢字のグリフを備えるが、英語の文章を描画することに最適化されたフォントは、かな文字や漢字のグリフは備えない。指定されたフォントが描画すべき文字の文字コードに対応するグリフを備えない場合は、他のフォントで当該文字の描画が補われるか、あるいは、ミッシンググリフと呼ばれる代替文字で当該文字が置き換えられる。従って、フォント化によって生成されたフォントに限らず、コンテンツ全体の文章を描画するためには、複数のフォントを使ってグリフを持たない文字が補完されるように使用されることが多い。本実施形態において生成される上記2つのフォントも、それぞれアイコンとトレードマークを描画するためのフォントであるため、アルファベットやかな文字のグリフは備えない。コンテンツ6において、アルファベットやかな文字が描画される際には、別途それらの描画用に指定されたフォントが用いられる。しかしながら、フォントを用いる一般的な文字の描画や検索は従来慣用されてきた方法で実現可能であるため、以下、本実施形態の説明では詳細な説明は省略する。   In general, one font includes character codes and glyphs of a plurality of characters. In many cases, each of the plurality of fonts includes glyphs having different designs for the same character (for example, each alphabet). On the other hand, it is rare to have glyphs that cover the character codes of all characters with only one font. For example, in many cases, fonts used to draw Japanese sentences have kana and kanji glyphs, but fonts optimized for drawing English sentences are kana and kanji glyphs. Will not prepare. If the designated font does not have a glyph corresponding to the character code of the character to be drawn, the drawing of the character is supplemented with another font, or the character is replaced with an alternative character called a missing glyph. Therefore, in order to draw the text of the entire content, not limited to fonts generated by fontification, a plurality of fonts are often used so that characters without glyphs are complemented. The two fonts generated in the present embodiment are also fonts for drawing icons and trademarks, respectively, and therefore do not include alphabetic character glyphs. In the content 6, when alphabetic characters are drawn, a font separately designated for the drawing is used. However, since drawing and searching of general characters using fonts can be realized by a conventionally used method, detailed description will be omitted in the description of the present embodiment.

また、フォント化によって生成されたフォントに限らず、文字描画に用いられるフォントの全ては、それを一意に識別するための固有の名称を有する。ただし、フォントの名称には、人がそのフォントを特定するための呼称としての名称と、情報検索装置100の処理の中で1以上のフォントを呼び出すための識別子や記号として定義される名称とがある。スタイル定義の中で、描画や検索に用いるフォントファイルを指定するために記述されるのは後者である。ただし、フォントによっては、両者が一致する場合もある。本実施形態では、後述するように、アイコンやトレードマークをクエリとする電子マニュアル内の検索が行われる場合、スタイル定義の中に定義されたフォント名に基づいて、検索クエリとして選択可能となる候補を抽出する。一例として本実施形態では、上述したアイコン描画用フォントのフォント名は“font_icon_camera_DSC2001”として定義される。また、トレードマーク描画用フォントのフォント名は“font_trademark_maker_XYZ”と定義される。   Moreover, not only the font generated by fontification but all the fonts used for character drawing have a unique name for uniquely identifying it. However, the name of the font includes a name as a name for a person to specify the font and a name defined as an identifier or symbol for calling one or more fonts in the processing of the information search apparatus 100. is there. In the style definition, the latter is described in order to specify a font file used for drawing and searching. However, depending on the font, both may match. In this embodiment, as will be described later, when a search in an electronic manual using an icon or trademark as a query is performed, candidates that can be selected as a search query based on the font name defined in the style definition To extract. As an example, in the present embodiment, the font name of the icon drawing font described above is defined as “font_icon_camera_DSC2001”. The font name of the trademark drawing font is defined as “font_trademark_maker_XYZ”.

「スタイル定義」は、コンテンツ6を所定のビューアに表示する際のコンテンツ本体の文字(フォント化により文字の1つとして扱われるようになった指標を含む)のスタイルなどが記述されたものである。「スタイル記述」あるいは「スタイルシート」とも呼ばれる。HTMLの場合、スタイル定義は、CSS(Cascading Style Sheets)が一般的に使用される。
スタイルは、文字毎の色、形、サイズ、デザイン、レイアウト、位置決めその他文字に加える効果などの内容である。スタイルは、コンテンツの文章の部分ごとに設定することが可能である。その際は、対象の文字と、他のスタイルが設定される文字との区別のためにスタイル識別子が設定される。本実施形態では、スタイル定義に、コンテンツ作成者により検索のクエリとして使用可能とされた指標を表す検索スタイル識別子と、この検索スタイル識別子に関連付けられた文字情報とが記述されているものとする。文字情報は、例えばフォントの名称、文字コードなどである。
The “style definition” describes the style of the content body characters (including indices that are now treated as one of the characters by fontification) when the content 6 is displayed on a predetermined viewer. . Also called “style description” or “style sheet”. In the case of HTML, CSS (Cascading Style Sheets) is generally used as the style definition.
The style includes contents such as color, shape, size, design, layout, positioning, and other effects to be added to characters. The style can be set for each sentence portion of the content. In that case, a style identifier is set to distinguish the target character from characters set with other styles. In the present embodiment, it is assumed that a search style identifier representing an index that can be used as a search query by the content creator and character information associated with the search style identifier are described in the style definition. The character information is, for example, a font name and a character code.

コンテンツ6の一例を図8に示す。コンテンツ6は、コンテンツ作成者により、本実施形態に係る情報検索装置100でWebブラウザによって表示されることを前提に作成されたものである。図示の例では、[style type="text/css"]と[/style]タグで囲まれた部分に、コンテンツ作成者によりスタイル定義が記述されている。スタイル定義には、文字情報定義部分801と検索スタイル定義部分802とがある。文字情報定義部分801では、“font-family”プロパティで指定されたフォント名に“src”プロパティで示されたフォントファイルが対応付けられている。検索スタイル定義部分802では、CSSのクラス名“SearchStyle_Icon”、“SearchStyle_TradeMark”と、フォント名とが対応付けられている。図8の例では、CSSのクラス名をスタイル識別子として使用している。また、CSSのクラス名にプレフィックス名“SearchStyle_”が付加されていた場合にこれを検索スタイル識別子として扱っている。ただし、検索スタイル識別子が識別可能であれば他の記法を使用しても良い。図8の例でいえば、クラス名“SearchStyle_Icon”とクラス名“SearchStyle_TradeMark”は、どちらも検索スタイル識別子として識別される。クラス名“SearchStyle_Icon”には、フォント名“font_icon_camera_DSC2001”が対応付けられる。クラス名“SearchStyle_TradeMark”には、フォント名“font_trademark_maker_XYZ”が対応付けられる。情報検索装置100は、後述するように、コンテンツ6に定義されたこれらの情報に基づく処理により、閲覧者が電子マニュアルの所望とされる部分を検索するために、アイコンやトレードマークを検索クエリとして指定することを可能とする。言いかえれば、本実施形態の情報り装置100が処理対象とするコンテンツは、コンテンツ6の例のように、検索スタイル識別子が定義されていることが必要となる。   An example of the content 6 is shown in FIG. The content 6 is created by the content creator on the assumption that it is displayed by the Web browser on the information search apparatus 100 according to the present embodiment. In the illustrated example, the style definition is described by the content creator in a portion surrounded by [style type = "text / css"] and [/ style] tags. The style definition includes a character information definition portion 801 and a search style definition portion 802. In the character information definition portion 801, the font file indicated by the “src” property is associated with the font name specified by the “font-family” property. In the search style definition part 802, CSS class names “SearchStyle_Icon” and “SearchStyle_TradeMark” are associated with font names. In the example of FIG. 8, the CSS class name is used as the style identifier. Further, when the prefix name “SearchStyle_” is added to the CSS class name, this is handled as a search style identifier. However, other notations may be used as long as the search style identifier can be identified. In the example of FIG. 8, the class name “SearchStyle_Icon” and the class name “SearchStyle_TradeMark” are both identified as search style identifiers. The class name “SearchStyle_Icon” is associated with the font name “font_icon_camera_DSC2001”. The class name “SearchStyle_TradeMark” is associated with the font name “font_trademark_maker_XYZ”. As will be described later, the information search apparatus 100 uses an icon or a trademark as a search query in order to search for a desired part of the electronic manual by a process based on the information defined in the content 6. It is possible to specify. In other words, the content to be processed by the information processing apparatus 100 according to the present embodiment needs to have a search style identifier defined as in the example of the content 6.

コンテンツ本体は、図8の[body]と[/body]タグで囲まれた部分803がそれに相当する。符号804は検索スタイル識別子であり、符号805、806は検索スタイル識別子に関連付けられた文字情報である。一例として文字コード“D”805は16進数の「44」であり、本実施形態で生成したアイコン描画用フォントのフォントファイルにおいては、太陽の形状をしたアイコン1文字のグリフと対応づけられている。同様に、文字コード“E”806は、丸印のアイコン1文字のグリフと対応づけられている。   The content body corresponds to a portion 803 surrounded by [body] and [/ body] tags in FIG. Reference numeral 804 is a search style identifier, and reference numerals 805 and 806 are character information associated with the search style identifier. For example, the character code “D” 805 is a hexadecimal number “44”, and is associated with a glyph of a single icon icon having a sun shape in the font file of the icon drawing font generated in this embodiment. . Similarly, the character code “E” 806 is associated with a glyph of a single circle icon.

図1に戻り、入力制御部11は、コンテンツ記憶部5に格納されている上記のコンテンツ6を受信し、バッファ16に格納する入力手段として機能する。スタイル操作部13は、スタイル定義に記述されたスタイル操作に従う操作処理(色,サイズを変えるなど)を行う。解析部12は、入力されたコンテンツ6のスタイル定義を解析する。具体的には、スタイル定義に記述された検索スタイル識別子毎に文字情報をリストアップした一覧表(検索スタイル一覧表)を生成してバッファ16に保存する。   Returning to FIG. 1, the input control unit 11 functions as an input unit that receives the content 6 stored in the content storage unit 5 and stores it in the buffer 16. The style operation unit 13 performs operation processing (changing color, size, etc.) according to the style operation described in the style definition. The analysis unit 12 analyzes the style definition of the input content 6. Specifically, a list (search style list) in which character information is listed for each search style identifier described in the style definition is generated and stored in the buffer 16.

検索スタイル一覧表の例を図5に示す。検索スタイル一覧表は、検索スタイル識別子欄501とフォント名欄502とを有するリストである。検索スタイル識別子欄501には検索スタイル識別子が格納される。フォント名欄502には、各検索スタイルに対して指定されたフォント名が格納される。図8に示したコンテンツ6の例では、一段目では、検索スタイル識別子「SearchStyle_Icon」と、指定されたフォント名「font_icon_camera_DSC2001」とが関連付けられる。二段目では、検索スタイル識別子「SearchStyle_Trademark」と、指定されたフォント名「font_trademark_maker_XYZ」とが関連付けられる。   An example of a search style list is shown in FIG. The search style list is a list having a search style identifier field 501 and a font name field 502. The search style identifier field 501 stores a search style identifier. The font name column 502 stores the font name designated for each search style. In the example of the content 6 shown in FIG. 8, the search style identifier “SearchStyle_Icon” and the designated font name “font_icon_camera_DSC2001” are associated with each other in the first row. In the second row, the search style identifier “SearchStyle_Trademark” and the specified font name “font_trademark_maker_XYZ” are associated with each other.

図5に示された検索スタイル一覧表では、コンテンツ6内で検索可能な指標としてコンテンツ作成者が意図したアイコン(「Icon」)とトレードマーク(Trademark)とが用意されている。これは、アイコン(「Icon」)を検索する場合は、フォント名が「camera_DSC2001」であるフォントのフォントファイルに、文字コードに対応付けたグリフが格納されているフォントのいずれが、検索クエリとなることを意味する。トレードマーク(Trademark)を検索する場合も同様である。すなわち、フォント名が「trademark_maker_XYZ 」であるフォントのフォントファイルに、文字コードに対応付けたグリフが格納されているトレードマークのいずれかが、検索クエリとして使用可能であることを意味する。   In the search style list shown in FIG. 5, an icon (“Icon”) and a trademark (Trademark) intended by the content creator are prepared as indexes that can be searched in the content 6. This means that when searching for an icon (“Icon”), the search query is any font in which the glyph associated with the character code is stored in the font file whose font name is “camera_DSC2001”. Means that. The same applies when searching for a trade mark. In other words, it means that any of the trademarks in which the glyph associated with the character code is stored in the font file of the font whose font name is “trademark_maker_XYZ” can be used as a search query.

なお、アイコンもトレードマークも、図8及び図5に示されている名称や内容は一例にすぎない。実際に電子マニュアルに記載され、検索クエリとして使用されるアイコンやトレードマークは、さらに様々なものがあってよい。その際例えば、「印刷機能に関するアイコン」と「スキャン機能に関するアイコン」などをフォント化する際に別々のフォントファイルとして生成してもよい。その場合、1つの検索スタイルに複数のフォント名及びフォントファイルが指定される場合もある。本実施形態では、そのようにアイコンやトレードマークにかかるフォントが1つに限定されない場合でも、解析部12によってそれらを「アイコン」及び「トレードマーク」という2つのグループにまとめて検索スタイルを設定する。そして、グループ毎に一覧表を生成する処理を行う。ただし、図8、図5の例では、各グループについて設定されるフォントはそれぞれ1つずつであるとしている。本実施形態では、解析部12によるスタイル定義の解析結果に基づいて、アイコンあるいはトレードマークのいずれかの種類の指標を、検索クエリとして利用する指標とするために閲覧者に選択させる選択ウインドウが生成される。選択ウインドウは、検索部14の起動時に利用される。選択ウインドウの例を図6に示す。選択ウインドウには、テキストを検索クエリとするための選択肢601,アイコン(Icon)を検索クエリとするための選択肢602,トレードマーク(Trademark)を検索クエリとするための選択肢603が表示される。   The names and contents of icons and trademarks shown in FIGS. 8 and 5 are merely examples. There may be more various icons and trademarks that are actually described in an electronic manual and used as a search query. In this case, for example, when “icons related to printing function” and “icons related to scan function” are converted into fonts, they may be generated as separate font files. In that case, a plurality of font names and font files may be specified for one search style. In the present embodiment, even when the fonts for icons and trademarks are not limited to one, the analysis unit 12 collects them into two groups of “icons” and “trademarks” and sets search styles. . And the process which produces | generates a list for every group is performed. However, in the examples of FIGS. 8 and 5, it is assumed that one font is set for each group. In this embodiment, based on the analysis result of the style definition by the analysis unit 12, a selection window is generated that allows a viewer to select an index of either type of icon or trademark as an index to be used as a search query. Is done. The selection window is used when the search unit 14 is activated. An example of the selection window is shown in FIG. In the selection window, an option 601 for using text as a search query, an option 602 for using an icon (Icon) as a search query, and an option 603 for using a trademark (Trademark) as a search query are displayed.

選択肢601が選択された場合は、従来通り、テキストを検索クエリとしたコンテンツ6内の文章の検索が実行可能となる。一般的に、検索クエリとするために指定可能な文字は、キーボードで入力可能な文字の任意に組み合わせとなる。本実施形態では、アイコン(Icon)検索のための選択肢602及びトレードマーク(Trademark)検索グループの選択肢603は、検索スタイル識別子による検索要求の選択を可能にするものである。選択ウインドウは、図5に示した一覧表の検索スタイル識別子欄501に格納されている文字列から、プレフィックス名“SeachStyle_”を除いた文字列を抽出することで実現が可能である。但し、検索スタイル識別子と対応付け可能な文字列ならば、他の見やすい文字列を選択肢として用いることもできる。例えば、スタイル定義において、選択ウインドウにおいて選択肢となる項目の名称を別途指定してもよい。   When the option 601 is selected, it is possible to search for sentences in the content 6 using text as a search query, as in the past. In general, the characters that can be specified for a search query are any combination of characters that can be input with a keyboard. In the present embodiment, an option 602 for searching for an icon (Icon) and an option 603 for a trade mark (Trademark) search group enable selection of a search request based on a search style identifier. The selection window can be realized by extracting a character string excluding the prefix name “SeachStyle_” from the character string stored in the search style identifier field 501 of the list shown in FIG. However, as long as the character string can be associated with the search style identifier, another easy-to-read character string can be used as an option. For example, in the style definition, the names of items that are options in the selection window may be separately specified.

図1に戻り、検索部14は、スタイル定義の解析結果に基づいてコンテンツ6に対する情報検索を行う。具体的には、バッファ16に保存されている検索テキスト一覧表からいずれかの指標に対応する文字情報を選択し、選択した文字情報を用いてコンテンツ6に存在する指標を特定する。より詳しくは、検索部14は、検索スタイル一覧表のうち、図6に示した選択ウインドウを通じて選択されたグループに属する1又は複数の指標を検索候補指標として、表示部3の所定の表示領域に表示させる。また、これにより選択された指標をクエリとする検索要求を受け付ける。そして、検索要求と共に受け付けたクエリに対応する文字情報を検索スタイル一覧表より取得し、取得した文字情報がコンテンツ本体に記述されている文字情報と一致する範囲(文字列の範囲)を特定する。   Returning to FIG. 1, the search unit 14 searches for information on the content 6 based on the analysis result of the style definition. Specifically, character information corresponding to any index is selected from the search text list stored in the buffer 16, and the index existing in the content 6 is specified using the selected character information. More specifically, the search unit 14 uses one or more indexes belonging to the group selected through the selection window shown in FIG. 6 in the search style list as search candidate indexes in a predetermined display area of the display unit 3. Display. In addition, a search request using the selected index as a query is accepted. Then, character information corresponding to the query received together with the search request is acquired from the search style list, and a range (character string range) in which the acquired character information matches the character information described in the content body is specified.

表示制御部15は、コンテンツ6をレンダリングしてビューアに表示させる。また、コンテンツ6の閲覧者によって入力される操作に応じて選択ウインドウを表示させる。さらに、表示されたコンテンツ6のうち、検索部14で特定した範囲の文字情報に対応する指標をそれ以外の情報と異なる態様で表示させる。例えば、特定された範囲の文字(アイコンやトレードマーク等の指標を含む)が強調されるように、反転表示させる。本実施形態では、ビューアは、HTMLページを表示画面に表示させるWebブラウザである。但し、マニュアルコンテンツ専用のビューアなど、その他の形態でも構わない。   The display control unit 15 renders the content 6 and displays it on the viewer. Further, the selection window is displayed in accordance with an operation input by the viewer of the content 6. Furthermore, the index corresponding to the character information of the range specified by the search part 14 among the displayed contents 6 is displayed in a mode different from the other information. For example, the characters in the specified range (including indicators such as icons and trademarks) are highlighted so as to be emphasized. In the present embodiment, the viewer is a Web browser that displays an HTML page on the display screen. However, other forms such as a viewer dedicated to manual content may be used.

<コンテンツの提供方法>
次に、上記のように構成される情報検索装置100を用いたコンテンツ6の提供方法について説明する。この方法は、コンテンツ作成工程とコンテンツ検索工程とを有する。コンテンツ作成工程は、コンテンツ作成者が独自にフォント化し、コンテンツ固有のものにした指標を使用するコンテンツを作成する。その際、コンテンツ6において、検索クエリとして使用可能な指標であることを表す検索スタイル識別子と、この検索スタイル識別子に関連付けられた文字情報とを、スタイル定義に記述する。つまり、コンテンツ作成者の意図をスタイル定義に託す。
コンテンツ検索工程では、スタイル定義に記述された検索スタイル識別子毎に文字情報をリストアップした検索スタイル一覧表を生成してバッファ16に保存する。そして、保存されている検索スタイル一覧表からいずれかの指標に対応する文字情報を選択し、選択した文字情報を用いてコンテンツに存在する指標の特定を可能にする。これにより、コンテンツ作成者に意図に応じた情報検索が可能になる。
<Providing content>
Next, a method for providing the content 6 using the information search apparatus 100 configured as described above will be described. This method includes a content creation step and a content search step. In the content creation step, content creators create content that uses fonts uniquely created and uses indexes that are unique to the content. At this time, in the content 6, a search style identifier indicating that the index is usable as a search query and character information associated with the search style identifier are described in the style definition. In other words, entrust the content creator's intention to the style definition.
In the content search step, a search style list in which character information is listed for each search style identifier described in the style definition is generated and stored in the buffer 16. Then, the character information corresponding to any index is selected from the stored search style list, and the index existing in the content can be specified using the selected character information. As a result, the content creator can search for information according to the intention.

コンテンツ検索工程の概要を図2を参照して説明する。図2は、情報検索装置100の主制御部10が実行する処理の手順説明図である。
主制御部10は、コンテンツ6を読み込むと(S201)、検索スタイル一覧生成処理を実行し、図5に例示した検索スタイル一覧表を生成する(S202)。この処理の詳細については後述する。主制御部10は、コンテンツ6をレンダリングした後、表示部3のビューアにそれを表示する(S203)。また、利用者から操作部4の入力を通じて情報検索要求を受け付けるために、バッファ16に保存されている検索スタイル一覧表を参照し、図6に示した検索要求入力画面を表示部3に表示する(S204)。検索要求を受け付けると、主制御部10は、受け付けた検索要求がコンテンツ固有の指標に対する検索要求かどうかを判断する(S205、S206)。例えば、アイコン(図6の選択肢602)に該当する検索スタイル識別子が検索スタイル一覧表に存在する場合、コンテンツ固有の指標に対する検索要求と判断する(S206:Yes)。主制御部10は、検索スタイル識別子に関連付けられた文字情報として、フォント名を取得する(S207)。また、フォント名に対応付けられたフォントファイルからグリフを取得し、これを検索文字列入力画面を表示部3に表示する(S208)。
An outline of the content search process will be described with reference to FIG. FIG. 2 is a procedure explanatory diagram of processing executed by the main control unit 10 of the information search apparatus 100.
When the main control unit 10 reads the content 6 (S201), the main control unit 10 executes a search style list generation process and generates the search style list shown in FIG. 5 (S202). Details of this processing will be described later. The main control unit 10 renders the content 6 and then displays it on the viewer of the display unit 3 (S203). Further, in order to accept an information search request from the user through the input of the operation unit 4, the search request input screen shown in FIG. 6 is displayed on the display unit 3 with reference to the search style list stored in the buffer 16. (S204). When receiving the search request, the main control unit 10 determines whether the received search request is a search request for a content-specific index (S205, S206). For example, if a search style identifier corresponding to the icon (option 602 in FIG. 6) exists in the search style list, it is determined that the search request is for a content-specific index (S206: Yes). The main control unit 10 acquires a font name as character information associated with the search style identifier (S207). Further, the glyph is acquired from the font file associated with the font name, and the search character string input screen is displayed on the display unit 3 (S208).

検索文字列入力画面の表示例を図7(a)に示す。図示の例では、検索文字列入力画面に文字列入力領域701、候補選択領域702、決定ボタン703、キャンセルボタン704が表示されている。文字列入力領域701は、検索クエリとするために候補選択領域702から選択されたアイコンやトレードマークのグリフが表示される領域である。候補選択領域702は、検索スタイル一覧表にリストアップされている指標に対応するフォントファイルを参照し、格納されているグリフを並べ、これらを操作部4でクリック選択可能に表示する領域である。決定ボタン703は、選択された指標(グリフ)をクリックで検索クエリとして確定するものである。キャンセルボタン704は、情報検索をキャンセルするものである。なお、検索クエリとする指標を選択できるように表示すれば良いので、検索文字列入力画面は、コンボボックス、チェックボックスを使った表示でも良い。図7(a)の例では、候補選択領域702に一覧されたグリフの中から、太陽の形状をしたアイコンが選択され、候補選択領域702に表示されている。   A display example of the search character string input screen is shown in FIG. In the illustrated example, a character string input area 701, a candidate selection area 702, an enter button 703, and a cancel button 704 are displayed on the search character string input screen. The character string input area 701 is an area in which icons and trademark glyphs selected from the candidate selection area 702 are displayed for a search query. The candidate selection area 702 is an area in which font files corresponding to the indices listed in the search style list are referenced, the stored glyphs are arranged, and these are displayed so as to be click-selectable by the operation unit 4. The decision button 703 is to confirm the search query by clicking the selected index (glyph). A cancel button 704 is used to cancel the information search. Since it is only necessary to display the search query so that the index can be selected, the search character string input screen may be displayed using a combo box or a check box. In the example of FIG. 7A, the sun-shaped icon is selected from the glyphs listed in the candidate selection area 702 and displayed in the candidate selection area 702.

図2に戻り、検索文字列入力画面で指標(グリフ)が指定されると、主制御部10は、その指標を検索クエリとする文字の一種として扱い、検索を開始する(S209)。その後、後述する検索結果取得処理を実行し(S210)、処理を終了する。
一方、S206において、検索要求がコンテンツ固有の指標に係る要求でないと判断された場合(S206:No)、主制御部10は、図7(a)に示した検索文字列入力画面を表示する(S211)。その際、文字列はキーボードなど通常の入力デバイスで入力可能なので、候補選択領域702は表示せず、文字列入力領域701、決定ボタン703、キャンセルボタン704のみを表示させる。操作部4を通じて文字列が入力されると、その文字列を検索クエリとして検索を開始する(S212)。その際、文字列の文字コードを使用し、コンテンツ6内の文字列検索により発見した文字列を反転表示し(S213)、処理を終える。
なお、本実施形態では、検索結果を反転表示する例を示したが、色の変更やアンダーライン表示など検索結果の文字列が、表示されているコンテンツ6上のどこにあるのかの判別が容易になる形態であればどのような表示スタイルでも構わない。
Returning to FIG. 2, when an index (glyph) is designated on the search character string input screen, the main control unit 10 treats the index as a kind of character having a search query and starts a search (S209). Thereafter, a search result acquisition process described later is executed (S210), and the process ends.
On the other hand, if it is determined in S206 that the search request is not a request related to the content-specific index (S206: No), the main control unit 10 displays the search character string input screen shown in FIG. S211). At this time, since the character string can be input with a normal input device such as a keyboard, the candidate selection area 702 is not displayed, and only the character string input area 701, the determination button 703, and the cancel button 704 are displayed. When a character string is input through the operation unit 4, the search is started using the character string as a search query (S212). At that time, using the character code of the character string, the character string found by the character string search in the content 6 is displayed in reverse (S213), and the process is terminated.
In the present embodiment, an example is shown in which the search result is displayed in reverse video. However, it is easy to determine where the character string of the search result such as a color change or underline display is on the displayed content 6. Any display style may be used as long as it is a form.

次に、図3を参照して、S202の検索スタイル一覧生成処理の詳細手順を説明する。この処理は、主制御部10の解析部12が実行する。入力制御部11によるコンテンツ6の入力が済むと、解析部12は、検索スタイル一覧表を作成し、コンテンツ6のスタイル定義からスタイル識別子を取得する(S301)。そして、取得したスタイル識別子の数だけS303〜S306の処理を繰り返す(S302、S307)。すなわち、取得したスタイル識別子が、検索スタイル識別子であった場合(S303:Yes)、解析部12は、スタイル定義に記述されていたフォント名を取得する(S304)。そして、検索スタイル識別子と取得したフォント名とを対応付けて検索スタイル一覧表に追加する(S305)。一方、S303において、取得したスタイル識別子が、検索スタイル識別子でないと判断した場合(S303:No)、解析部12は、スタイル識別子に定義されたスタイルの操作をスタイル操作部13に実行させる(S306)。スタイル操作部13が実行する操作の例としては、文字のサイズや色の設定などがある。   Next, a detailed procedure of the search style list generation process in S202 will be described with reference to FIG. This processing is executed by the analysis unit 12 of the main control unit 10. After the input of the content 6 by the input control unit 11, the analysis unit 12 creates a search style list and acquires a style identifier from the style definition of the content 6 (S301). Then, the processes of S303 to S306 are repeated for the number of acquired style identifiers (S302, S307). That is, when the acquired style identifier is a search style identifier (S303: Yes), the analysis unit 12 acquires the font name described in the style definition (S304). Then, the search style identifier and the acquired font name are associated with each other and added to the search style list (S305). On the other hand, when it is determined in S303 that the acquired style identifier is not the search style identifier (S303: No), the analysis unit 12 causes the style operation unit 13 to perform the operation of the style defined in the style identifier (S306). . Examples of operations performed by the style operation unit 13 include character size and color settings.

次に、図4を参照して、S210の検索結果取得処理の詳細手順を説明する。この処理は、検索部14が実行する。検索部14は、図7(a)に示した検索文字列入力画面を通じて検索クエリとされた指標の指定を伴う検索要求を受け付けると、コンテンツ本体について、S402〜S406の処理を繰り返す(S401、S407)。
すなわち、検索部14は、コンテンツ本体からスタイル識別子が指定された文字列を検索する(S402)。そして、スタイル識別子が検索スタイル識別子(図8の符号804)であり、その検索スタイル識別子が指定された指標(図8の符号805)に対応する文字列を発見する(S403)。文字列を発見すると(S403:Yes)、検索部14は、検索クエリとして指定された指標に対応する文字コードと、発見した文字列内の文字の文字コードとを比較する(S404)。そして、発見した文字列内に検索クエリの指標に対応する文字コードと一致する部分が存在した場合(S405:Yes)、解析部12は、発見した文字を強調するために、表示制御部15に反転表示させる(S406)。一致する部分が存在しなかった場合(S405:No)、S402の処理に戻る。
一方、S403において、検索スタイル識別子が指定された指標に対応する文字列を発見しなかった場合(S403:No)、解析部12は、検索結果取得処理を終える。
Next, a detailed procedure of the search result acquisition process in S210 will be described with reference to FIG. This processing is executed by the search unit 14. When the search unit 14 receives a search request accompanied by the specification of an index that is a search query through the search character string input screen shown in FIG. 7A, the search unit 14 repeats the processes of S402 to S406 for the content body (S401, S407). ).
That is, the search unit 14 searches for a character string in which a style identifier is designated from the content body (S402). Then, the style identifier is the search style identifier (reference numeral 804 in FIG. 8), and a character string corresponding to the index (reference numeral 805 in FIG. 8) for which the search style identifier is specified is found (S403). When the character string is found (S403: Yes), the search unit 14 compares the character code corresponding to the index specified as the search query with the character code of the character in the found character string (S404). If a portion that matches the character code corresponding to the index of the search query exists in the found character string (S405: Yes), the analysis unit 12 causes the display control unit 15 to emphasize the found character. The display is reversed (S406). If there is no matching part (S405: No), the process returns to S402.
On the other hand, if no character string corresponding to the index for which the search style identifier is specified is found in S403 (S403: No), the analysis unit 12 ends the search result acquisition process.

ここで、前述した図8の例を用いて上記処理を説明すると、検索要求と共に指定された検索スタイル識別子が“SearchStyle_Icon”であった場合、S403で発見されるのは、検索スタイル識別子804が指定された文字列805である。また、検索要求と共に指定された検索クエリが太陽の形状をしたアイコン(文字コードが“D”と同じ16進数の44)1文字なので、S404では、文字列805の内、文字列805が発見される。その結果、S406では、当該文字列805のうち、文字コード“D”(16進数の44)を、太陽の形状をしたアイコンに置き換え、そのアイコンを反転表示させる。反転表示された例を図7(b)に示す。図示の例では、アイコン710が検索結果として反転表示されている。なお、反転表示のほか、色の変更やアンダーライン表示など検索結果の文字列が表示コンテンツ上のどこにあるのかが判別可能であれば、他の表示方法で強調表示するようにしても良い。   Here, the above process will be described using the example of FIG. 8 described above. When the search style identifier specified together with the search request is “SearchStyle_Icon”, the search style identifier 804 is specified in S403. Character string 805. In addition, since the search query specified together with the search request is a single icon in the shape of a sun (the character code is the same hexadecimal number 44 as “D”) 44, the character string 805 is found in the character string 805 in S404. The As a result, in S406, the character code “D” (hexadecimal number 44) in the character string 805 is replaced with an icon having a sun shape, and the icon is displayed in reverse video. An example of the reverse display is shown in FIG. In the illustrated example, the icon 710 is highlighted as a search result. In addition to the reverse display, if it is possible to determine where the character string of the search result is on the display content, such as a color change or an underline display, the display may be highlighted using another display method.

なお、検索結果取得処理において、HTMLで特定のクラス名が指定された要素(文書の一部)の発見と、要素内の文字列を取得・比較する処理は、DOMを使って実現することができる。DOM(Document Object Model )は、標準API(Application Programming Interface)の一種である。   In the search result acquisition process, the discovery of an element (part of a document) for which a specific class name is specified in HTML and the process of acquiring and comparing the character strings in the element can be realized using DOM. it can. DOM (Document Object Model) is a kind of standard API (Application Programming Interface).

[第2実施形態]
次に、本発明の第2実施形態について説明する。図9は、第2実施形態に係る情報検索装置の構成図である。この情報検索装置200は、図1に示した構成に加えて、検索候補ソート部17を備えている。
検索候補ソート部17は、検索候補指標が複数存在するときにこれらの検索候補指標を予め定めた優先度に応じてソートする検索候補ソート手段として機能する。この場合、検索部14はソートされた順番で検索候補指標を表示させる。優先度は、予めコンテンツ作成者によりスタイル定義に記述されている。但し、コンテンツ本体にのみ記述してあっても良い。いずれにしても、第2実施形態では、検索文字列入力画面を表示する際に、コンテンツ作成者の意図に合わせた優先度の順番で候補選択領域702(図7参照)を表示させる。これにより、コンテンツのビューア利用者による検索候補指標を探す手間を軽減することができる。検索候補ソート部17は、ソートされた検索候補指標を保存する。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. FIG. 9 is a configuration diagram of an information search apparatus according to the second embodiment. The information search apparatus 200 includes a search candidate sorting unit 17 in addition to the configuration shown in FIG.
The search candidate sorting unit 17 functions as search candidate sorting means for sorting these search candidate indices according to a predetermined priority when there are a plurality of search candidate indices. In this case, the search unit 14 displays the search candidate indices in the sorted order. The priority is described in advance in the style definition by the content creator. However, it may be described only in the content body. In any case, in the second embodiment, when the search character string input screen is displayed, the candidate selection areas 702 (see FIG. 7) are displayed in order of priority according to the intention of the content creator. As a result, it is possible to reduce the trouble of searching for the search candidate index by the content viewer user. The search candidate sorting unit 17 stores the sorted search candidate index.

図10を参照して、第2実施形態におけるコンテンツ検索工程について説明する。図10の処理は、S1001、S1002の処理以外は、図2と同様であるため、同一のステップ番号を付し、重複したステップについての説明は省略する。S201〜S206の処理を経て、検索スタイル識別子に対応するフォント名を取得すると(S207)、検索候補ソート部17は、コンテンツ6のスタイル定義から文字の検索候補指標の優先度を取得する(S1001)。   With reference to FIG. 10, the content search process in 2nd Embodiment is demonstrated. The processing in FIG. 10 is the same as that in FIG. 2 except for the processing in S1001 and S1002. Therefore, the same step numbers are assigned, and description of the duplicated steps is omitted. When the font name corresponding to the search style identifier is acquired through the processing of S201 to S206 (S207), the search candidate sorting unit 17 acquires the priority of the character search candidate index from the style definition of the content 6 (S1001). .

ここで、図11(a)にはコンテンツ6で使用するアイコンをSVG(Scalable Vector Graphics)言語で記述した定義例を示す。フォント定義は、コンテンツ6に埋め込まれていても、コンテンツからURL(Uniform Resource Locator)でリンク参照される別ファイルに格納されていてもよい。ここで記述部分1101は、検索スタイルが“SearchStyle_Icon”である場合の関連情報が、“icon”というプレフィックス名を使って記述されていることを示す。また、記述部分1102は、検索スタイル識別子が“SearchStyle_Icon”であるときの各文字の検索の優先度を示す。   Here, FIG. 11A shows a definition example in which icons used in the content 6 are described in the SVG (Scalable Vector Graphics) language. The font definition may be embedded in the content 6 or may be stored in another file that is linked and referenced from the content by a URL (Uniform Resource Locator). Here, the description portion 1101 indicates that the related information when the search style is “SearchStyle_Icon” is described using the prefix name “icon”. The description portion 1102 indicates the search priority of each character when the search style identifier is “SearchStyle_Icon”.

次に、検索候補ソート部17は、各文字の文字コードをフォント定義内の検索の優先度の順番に並び替え、検索スタイル識別子の種類毎に検索候補検索スタイル一覧表を作成する(S1002)。作成された検索候補検索スタイル一覧表の一例を図11(b)に示す。検索文字候補検索スタイル一覧表は、各文字の検索の優先度を格納する優先度欄1103、各文字に割り当てられた文字コードを格納する文字コード欄1104で構成される。この例では、優先度0、1、2について、各文字コード“0x43”、“0x42”、“0x41”が対応付けられて格納されている。   Next, the search candidate sorting unit 17 rearranges the character codes of each character in the order of search priority in the font definition, and creates a search candidate search style list for each type of search style identifier (S1002). An example of the created search candidate search style list is shown in FIG. The search character candidate search style list includes a priority column 1103 for storing search priority for each character, and a character code column 1104 for storing a character code assigned to each character. In this example, the character codes “0x43”, “0x42”, and “0x41” are stored in association with each other for the priorities 0, 1, and 2.

こうして、先に図7に示した候補選択領域702に検索候補検索スタイル一覧表の順に指標を並べた検索文字列入力画面を表示する(S208)。これ以降の処理の流れは、第1実施形態(図2)と同じであるため、重複した説明を省略する。   Thus, the search character string input screen in which the indexes are arranged in the order of the search candidate search style list in the candidate selection area 702 shown in FIG. 7 is displayed (S208). Since the subsequent processing flow is the same as that of the first embodiment (FIG. 2), a duplicate description is omitted.

[第3実施形態]
次に、本発明の第3実施形態について説明する。図12は、第3実施形態に係る情報検索装置の構成図である。この情報検索装置300は、図1の構成に加えて、検索状態管理部18を備えたものである。また、通信部2を介して外部の電子機器27が接続されている。電子機器27は、コンテンツ6にその操作要領が記述されている電子機器である。解析部12は、コンテンツ6のうち指標が表示されている状態を識別するための状態識別子を取得し、取得した状態識別子に対応した検索候補指標の検索を可能にする。状態識別子は、指標が表示されている電子機器27の表示画面の識別情報(例えば画面名)であり、スタイル定義又はコンテンツ本体に記述されている。そのため、解析部12は、状態識別子をコンテンツ6及び電子機器27より取得する。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. FIG. 12 is a configuration diagram of an information search apparatus according to the third embodiment. The information search apparatus 300 includes a search state management unit 18 in addition to the configuration of FIG. An external electronic device 27 is connected via the communication unit 2. The electronic device 27 is an electronic device in which operating instructions are described in the content 6. The analysis unit 12 acquires a state identifier for identifying the state in which the index is displayed in the content 6, and enables search for a search candidate index corresponding to the acquired state identifier. The state identifier is identification information (for example, a screen name) of the display screen of the electronic device 27 on which the index is displayed, and is described in the style definition or the content body. Therefore, the analysis unit 12 acquires the state identifier from the content 6 and the electronic device 27.

第3実施形態では、電子機器27が表示しているコンテンツ6のページに応じた検索候補指標を、図7(a)の候補選択領域702に表示させるようにしたものである。以下の説明では、電子機器27がデジタルカメラ、コンテンツ6としてデジタルカメラの操作内容を紹介するための電子マニュアルであることを想定する。   In the third embodiment, a search candidate index corresponding to the page of content 6 displayed on the electronic device 27 is displayed in the candidate selection area 702 in FIG. 7A. In the following description, it is assumed that the electronic device 27 is a digital camera and an electronic manual for introducing the operation contents of the digital camera as the content 6.

以下、図13を参照して、第3実施形態によるコンテンツ検索工程の処理手順を説明する。図13のS1301〜S1303の処理以外は、図2と同様であるため、同一のステップ番号を付し、重複したステップについての説明は省略する。
S201〜S206の処理を経て、検索スタイル識別子に対応するフォント名を取得すると(S207)、電子機器27から、ビューアの画面名を状態識別子として取得する(S1301)。次いで、コンテンツ6から状態識別子が一致する文字の文字コードを取得する(S1302)。
Hereinafter, with reference to FIG. 13, the processing procedure of the content search process according to the third embodiment will be described. Except for the processes of S1301 to S1303 in FIG. 13, the process is the same as in FIG. 2. Therefore, the same step numbers are assigned, and the description of the duplicated steps is omitted.
When the font name corresponding to the search style identifier is acquired through the processing of S201 to S206 (S207), the screen name of the viewer is acquired from the electronic device 27 as the state identifier (S1301). Next, the character code of the character whose state identifier matches is acquired from the content 6 (S1302).

図11(c)は、コンテンツ6で使用するアイコンのスタイル定義の中で、アイコン描画用フォントについて定義する部分の記述例を示した図である。但し、フォント定義は、コンテンツ6内に埋め込まれていても良いし、コンテンツ6からURLでリンク参照される別ファイルに格納されていても良い。記述部分1105は、検索スタイル識別子が“SearchStyle_Icon”である場合の関連情報が“icon”というプレフィックス名を使って記述されていることを示す。記述部分1106は、ビューアで表示されているコンテンツ6の状態を識別するための状態識別子であり、検索という操作が有効となるビューアの画面名が記述されている。第3実施形態では、S1301で取得した画面名が“screen2”である場合、図11(c)でicon:stateの値が“screen2”である文字の文字コード(16進数の41と43)が取得される。このように、コンテンツ6内に画面を使用した操作の記述があり、上記状態識別子が操作で使用する画面の識別子であって良い。   FIG. 11C is a diagram illustrating a description example of a part that defines an icon drawing font in the icon style definition used in the content 6. However, the font definition may be embedded in the content 6 or may be stored in a separate file that is linked from the content 6 with a URL. The description portion 1105 indicates that the related information when the search style identifier is “SearchStyle_Icon” is described using the prefix name “icon”. The description portion 1106 is a state identifier for identifying the state of the content 6 displayed on the viewer, and describes the screen name of the viewer that enables the search operation. In the third embodiment, when the screen name acquired in S1301 is “screen2”, the character code (hexadecimal 41 and 43) of the character whose icon: state value is “screen2” in FIG. To be acquired. As described above, there is a description of an operation using a screen in the content 6, and the state identifier may be an identifier of the screen used in the operation.

その後、検索文字列入力画面の候補選択領域702(図7参照)に取得した文字コードに対応する文字を並べて表示する(S1303)。これ以降の処理の流れは、前述した第1実施形態(図2)と同じであるため、重複した説明を省略する。   Thereafter, the characters corresponding to the acquired character code are displayed side by side in the candidate selection area 702 (see FIG. 7) of the search character string input screen (S1303). Since the subsequent processing flow is the same as that of the first embodiment (FIG. 2) described above, a duplicate description is omitted.

以上説明したように、第1乃至第3実施形態によれば、コンテンツ6に固有となる指標をスタイル定義を参照して検索することができる。そのため、コンテンツ作成者の意図に応じた検索スタイルでの情報検索が可能になる。例えばコンテンツ6が電子機器の電子マニュアルであり、それをビューアで表示した際、電子機器の利用者が、電子機器で使われている指標に関する説明箇所を簡単に検索することができる。   As described above, according to the first to third embodiments, an index unique to the content 6 can be searched with reference to the style definition. Therefore, it is possible to search for information in a search style according to the intention of the content creator. For example, when the content 6 is an electronic manual of an electronic device and is displayed on a viewer, the user of the electronic device can easily search for an explanation location regarding an index used in the electronic device.

なお、コンテンツ6は、電子マニュアルのほか、電子書籍、電子教科書、カタログ、仕様書などの電子文書であっても良い。また、各実施形態では、コンテンツ6をHTMLを用いて表現した場合の例を説明したが、コンテンツ6はHTML形式に限らない。例えば、1つ若しくは複数のHTML形式のファイルをアーカイブしたEPUB(Electronic PUBlication)形式のコンテンツ6であっても良い。あるいは、XML(Extensible Markup Language)形式のコンテンツ6であっても良い。   In addition to the electronic manual, the content 6 may be an electronic document such as an electronic book, an electronic textbook, a catalog, and a specification. Moreover, although each embodiment demonstrated the example at the time of expressing the content 6 using HTML, the content 6 is not restricted to an HTML format. For example, it may be an EPUB (Electronic PUBlication) format content 6 in which one or a plurality of HTML format files are archived. Alternatively, content 6 in XML (Extensible Markup Language) format may be used.

本発明は、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることも可能である。また、本発明の目的は、以下のようにすることによっても達成される。すなわち、前述した実施形態の機能を実現する情報検索用プログラムのプログラムコード(コンピュータプログラム)を記録した記録媒体(または記憶媒体)を、端末に供給する。かかる記憶媒体は、コンピュータ読み取り可能な記憶媒体である。そして、その端末のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成する。   The present invention can take an embodiment as a program or a recording medium (storage medium). The object of the present invention can also be achieved by the following. That is, a recording medium (or storage medium) in which the program code (computer program) of the information retrieval program that realizes the functions of the above-described embodiments is supplied to the terminal. Such a storage medium is a computer-readable storage medium. Then, the computer (or CPU or MPU) of the terminal reads out and executes the program code stored in the recording medium. In this case, the program code itself read from the recording medium realizes the functions of the above-described embodiment, and the recording medium on which the program code is recorded constitutes the present invention.

Claims (14)

フォント化された指標が混在し、所定のビューアに表示する際の前記指標のスタイルが記述されたスタイル定義を有するデジタルコンテンツの入力を受け付ける入力制御手段と、
入力された前記デジタルコンテンツの前記スタイル定義を解析する解析手段と、
前記スタイル定義の解析結果と検索クエリとして入力される情報とに基づいて前記デジタルコンテンツに対する検索を行う検索手段とを備え、
前記スタイル定義には、検索可能とされた前記指標を表す検索スタイル識別子と、この検索スタイル識別子に関連付けられたフォント情報とが記述されており、
前記解析手段は、前記スタイル定義に記述された前記検索スタイル識別子毎に前記フォント情報のリストを生成してバッファに保存し、
前記検索手段は、保存されている前記リストに基づいて、前記検索するクエリとなる指標の候補を提示し、前記提示された候補の中で前記検索クエリとして選択された指標の情報を用いて前記デジタルコンテンツにおいて前記指標が存在する部分を特定する、
情報検索装置。
Input control means for receiving input of digital content having a style definition in which font indicators are mixed and the style of the indicator is displayed when displayed on a predetermined viewer;
Analyzing means for analyzing the style definition of the input digital content;
Search means for performing a search on the digital content based on the analysis result of the style definition and information input as a search query;
In the style definition, a search style identifier representing the index that is made searchable and font information associated with the search style identifier are described.
The analysis unit generates a list of the font information for each search style identifier described in the style definition and stores it in a buffer.
The search means presents index candidates as the query to be searched based on the stored list, and uses the index information selected as the search query among the presented candidates. Identify the portion of the digital content where the indicator exists,
Information retrieval device.
前記指標がベクター形式で表現される図形又は画像である、
請求項1に記載の情報検索装置。
The index is a graphic or image expressed in a vector format,
The information search device according to claim 1.
前記指標は、それぞれ種類毎に独立したフォントファイルとして生成され、
前記解析手段は、前記スタイル定義に記述されたフォントファイルを一意に識別するために定義されたのフォント名に基づいて、前記種類毎に前記リストを生成する、
請求項1又は2に記載の情報検索装置。
The index is generated as an independent font file for each type,
The analysis unit generates the list for each type based on a font name defined to uniquely identify a font file described in the style definition.
The information search device according to claim 1 or 2.
前記指標の種類がアイコン又はトレードマークを含む、
請求項3に記載の情報検索装置。
The indicator type includes an icon or a trademark,
The information search device according to claim 3.
いずれかの種類の前記指標を、前記検索クエリの候補として利用するために選択可能にする選択ウインドウを生成する、
請求項4に記載の情報検索装置。
Generating a selection window that allows any type of the indicator to be selected for use as a candidate for the search query;
The information search device according to claim 4.
前記検索手段は、前記解析手段で生成された前記リストのうち、前記選択ウインドウを通じて選択された種類に属する1又は複数の指標を前記検索クエリの候補となる検索候補指標として所定の表示領域に表示させ、これにより選択された指標についての検索要求を受け付ける、
請求項5に記載の情報検索装置。
The search means displays one or a plurality of indices belonging to the type selected through the selection window in the list generated by the analysis means in a predetermined display area as a search candidate index that is a candidate for the search query. And accept a search request for the selected indicator.
The information search device according to claim 5.
前記検索候補指標が複数存在するときにこれらの検索候補指標を予め定めた優先度に応じてソートする検索候補ソート手段を備え、
前記検索手段は、ソートされた順番で前記検索候補指標を表示させる、
請求項6に記載の情報検索装置。
Search candidate sorting means for sorting these search candidate indices according to a predetermined priority when there are a plurality of the search candidate indices,
The search means displays the search candidate index in the sorted order.
The information search device according to claim 6.
前記解析手段は、前記デジタルコンテンツのうち前記指標が表示されている状態を識別するための状態識別子を取得し、取得した状態識別子に対応した検索候補指標の検索を可能にする、
請求項6に記載の情報検索装置。
The analysis means acquires a state identifier for identifying a state in which the index is displayed in the digital content, and enables a search for a search candidate index corresponding to the acquired state identifier.
The information search device according to claim 6.
前記解析手段は、前記状態識別子を前記デジタルコンテンツ及び前記デジタルコンテンツが表示されている外部の電子機器より取得する、
請求項8に記載の情報検索装置。
The analysis means acquires the state identifier from the digital content and an external electronic device on which the digital content is displayed.
The information search device according to claim 8.
前記状態識別子は、前記指標が表示されている前記電子機器の表示画面の識別情報である、
請求項9に記載の情報検索装置。
The state identifier is identification information of a display screen of the electronic device on which the indicator is displayed.
The information search device according to claim 9.
前記検索手段は、前記検索候補指標に対応する文字情報を前記スタイル定義より取得し、取得した文字情報が前記コンテンツ本体に記述されている文字情報と一致する範囲を特定する、
請求項6ないし10のいずれか一項に記載の情報検索装置。
The search means acquires character information corresponding to the search candidate index from the style definition, and specifies a range in which the acquired character information matches the character information described in the content body.
The information search device according to any one of claims 6 to 10.
前記デジタルコンテンツをレンダリングして前記ビューアに表示させるとともに、表示されたデジタルコンテンツのうち、前記検索手段により特定された部分とそうではない部分とを異なる態様で表示させる表示制御手段をさらに備えて成る、
請求項11に記載の情報検索装置。
The digital content is further rendered and displayed on the viewer, and further includes display control means for displaying a portion specified by the search means and a portion not included in the displayed digital content in different manners. ,
The information search device according to claim 11.
入力制御手段により、フォント化された指標が混在し、所定のビューアに表示する際の前記指標のスタイルが記述されたスタイル定義を有するデジタルコンテンツを取得し、解析手段により、入力された前記デジタルコンテンツの前記スタイル定義を解析し、検索手段により、前記スタイル定義の解析結果と検索クエリとして入力される情報とに基づいて前記デジタルコンテンツに対する検索を行う情報検索装置の制御方法であって、
前記スタイル定義には、検索可能とされた前記指標を表す検索スタイル識別子と、この検索スタイル識別子に関連付けられたフォント情報が記述されており、
前記解析においては、前記スタイル定義に記述された前記検索スタイル識別子毎に前記フォント情報のリストを生成してバッファに保存し、
前記検索では、保存されている前記リストに基づいて、前記検索するクエリとなる指標の候補を提示し、前記提示された候補の中で前記検索クエリとして選択された指標の情報を用いて前記デジタルコンテンツにおいて前記指標が存在する部分を特定する、
情報検索装置の制御方法。
The input control means obtains digital contents having style definitions in which font-like indices are mixed and the styles of the indices when displayed on a predetermined viewer are described, and the digital contents input by the analysis means A method for controlling an information search apparatus for performing a search on the digital content based on an analysis result of the style definition and information input as a search query by a search means,
In the style definition, a search style identifier representing the index that can be searched, and font information associated with the search style identifier are described.
In the analysis, a list of the font information is generated for each search style identifier described in the style definition and stored in a buffer.
In the search, based on the stored list, a candidate for an index serving as the query to be searched is presented, and the information on the index selected as the search query among the presented candidates is used for the digital. Identify the part of the content where the indicator exists,
Control method of information retrieval apparatus.
コンピュータを、請求項1ないし12のいずれか一項に記載された情報検索装置として動作させるための、前記コンピュータが読み取り可能な情報検索用プログラム。   An information search program readable by the computer for operating the computer as the information search apparatus according to any one of claims 1 to 12.
JP2015189270A 2015-09-28 2015-09-28 Information retrieval device, control method thereof, and information retrieval program Pending JP2017068307A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015189270A JP2017068307A (en) 2015-09-28 2015-09-28 Information retrieval device, control method thereof, and information retrieval program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015189270A JP2017068307A (en) 2015-09-28 2015-09-28 Information retrieval device, control method thereof, and information retrieval program

Publications (1)

Publication Number Publication Date
JP2017068307A true JP2017068307A (en) 2017-04-06

Family

ID=58495019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015189270A Pending JP2017068307A (en) 2015-09-28 2015-09-28 Information retrieval device, control method thereof, and information retrieval program

Country Status (1)

Country Link
JP (1) JP2017068307A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321470A (en) * 2019-05-23 2019-10-11 平安科技(深圳)有限公司 Document processing method, device, computer equipment and storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321470A (en) * 2019-05-23 2019-10-11 平安科技(深圳)有限公司 Document processing method, device, computer equipment and storage medium
CN110321470B (en) * 2019-05-23 2024-05-28 平安科技(深圳)有限公司 Document processing method, device, computer equipment and storage medium

Similar Documents

Publication Publication Date Title
JP4401292B2 (en) Glyphlet
KR102345001B1 (en) Patent document creation apparatus, method, computer program, computer-readable recording medium, server and system
US9870484B2 (en) Document redaction
US11386184B2 (en) Information processing apparatus, search server, web server, and non-transitory computer readable storage medium
JP4699148B2 (en) Keyword extraction device, keyword extraction program
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP2013501995A (en) Image element search
US20180018315A1 (en) Information processing device, program, and information processing method
KR101401250B1 (en) Method of providing keyword-map for electronic documents, and computer-readable recording medium with keyword-map program for the same
JP2008041003A (en) Document display processor and document display processing program
TW201416884A (en) Font distribution system and method of font distribution
CN113297856A (en) Document translation method and device and electronic equipment
JP2014219833A (en) Document reading comprehension support device, document reading comprehension support system, and program
JP2017068307A (en) Information retrieval device, control method thereof, and information retrieval program
KR20130021482A (en) Method of editing html tables by cell unit
US9946698B2 (en) Inserting text and graphics using hand markup
JP2004157668A (en) Retrieval system, retrieval method and retrieval program
US11010978B2 (en) Method and system for generating augmented reality interactive content
JP2017091024A (en) Input assistance device
JP5123350B2 (en) Test case creation system, method and program
CN110515618A (en) Page info typing optimization method, equipment, storage medium and device
JP4906044B2 (en) Information retrieval apparatus, control method therefor, computer program, and storage medium
JP7083473B2 (en) Input support device
JP2008065577A (en) Document retrieval system, document retrieval program and computer-readable recording medium recorded with document retrieval program
JP4566237B2 (en) Character code input support system, character code input support program