JP2013068667A - Information processing apparatus, information processing method and program - Google Patents

Information processing apparatus, information processing method and program Download PDF

Info

Publication number
JP2013068667A
JP2013068667A JP2011205175A JP2011205175A JP2013068667A JP 2013068667 A JP2013068667 A JP 2013068667A JP 2011205175 A JP2011205175 A JP 2011205175A JP 2011205175 A JP2011205175 A JP 2011205175A JP 2013068667 A JP2013068667 A JP 2013068667A
Authority
JP
Japan
Prior art keywords
headword
dictionary
word
phonetic symbol
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011205175A
Other languages
Japanese (ja)
Inventor
Yasuo Okuya
泰夫 奥谷
Toshiaki Fukada
俊明 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011205175A priority Critical patent/JP2013068667A/en
Publication of JP2013068667A publication Critical patent/JP2013068667A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an information processing apparatus, an information processing method and a program in which, with respect to an entry which has been selected by a user once, if the entry appears in an example sentence of another entry, it is read aloud according to a phonetic symbol in electronic dictionary content.SOLUTION: An information processing apparatus that reads electronic dictionary content aloud, includes: temporary inhibition means that temporarily prohibits a word in the same notation as an entry from being used in the dictionary; registration means that registers an entry, a phonetic symbol, and a speech synthesis phonetic symbol to the dictionary; and inhibition release means that allows a word unusable made temporarily by the temporary inhibition means to be used in the dictionary.

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and a program.

電子辞書において、電子辞書コンテンツ中の見出し語や見出し語を含む例文を読み上げる際に、電子辞書コンテンツ記載の発音記号通りに音声合成する技術として特許文献1に記載の技術が存在する。特許文献1の技術では、見出し語及び見出し語の説明情報が表示されると、見出し語の説明情報の中から発音記号や品詞情報を抽出する。ユーザによって読み上げる例文が指定されると、例文中に前記抽出した見出し語の発音記号や品詞情報が挿入されて音声合成手段に渡される。音声合成手段は、挿入された見出し語の発音記号や品詞情報を用いて指定された例文中の見出し語を電子辞書コンテンツの発音記号通りの読みで音声合成する。   In the electronic dictionary, there is a technique described in Patent Document 1 as a technique for synthesizing speech according to phonetic symbols described in the electronic dictionary content when reading an entry word or an example sentence including the entry word in the electronic dictionary content. In the technique of Patent Literature 1, when a headword and headword explanation information are displayed, phonetic symbols and part-of-speech information are extracted from the headword explanation information. When an example sentence to be read is designated by the user, the extracted phonetic symbol and part-of-speech information of the extracted headword are inserted into the example sentence and passed to the speech synthesis means. The voice synthesizing means synthesizes the headword in the example sentence specified by using the phonetic symbol and part-of-speech information of the inserted headword by reading according to the phonetic symbol of the electronic dictionary content.

特許第4677869号公報Japanese Patent No. 4767869

しかしながら特許文献1では、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることができない問題があった。
本発明はこのような問題点に鑑みなされたもので、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることを目的とする。
However, in Patent Document 1, there is a problem that, regarding the headword once selected by the user, when the headword appears in an example sentence of another headword, it cannot be read out as the phonetic symbol of the electronic dictionary content.
The present invention has been made in view of such a problem. When the headword appears in an example sentence of another headword with respect to the headword once selected by the user, it is read out as the phonetic symbol of the electronic dictionary content. For the purpose.

そこで、本発明は、電子辞書コンテンツの読み上げを行う情報処理装置であって、入力された見出し語に基づいて、電子辞書コンテンツを検索する検索手段と、前記検索手段での検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示手段と、前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定手段と、前記発音記号特定手段で特定された発音記号を音声合成用発音記号に変換する変換手段と、前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制手段と、前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録手段と、前記読み上げ箇所を音声合成する音声合成手段と、前記一時抑制手段で一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除手段と、を有する。   Therefore, the present invention provides an information processing apparatus that reads out electronic dictionary content, a search unit that searches for electronic dictionary content based on an input headword, and a headword that is a search result of the search unit. And display means for displaying the explanation information of the headword on a display device, phonetic symbol specifying means for specifying the phonetic symbol of the headword that is a part of the headword explanation information, and the phonetic symbol specifying means Conversion means for converting the specified phonetic symbol into a phonetic synthesis phonetic symbol; temporary suppression means for temporarily disabling a word having the same notation as the headword in the dictionary; the headword; and the phonetic symbol; , Temporarily registered by the registration means for registering the phonetic symbol for speech synthesis in the dictionary, the speech synthesis means for synthesizing the reading portion, and the temporary suppression means. The serial word having a derepression means available in the dictionary.

本発明によれば、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることができる。   According to the present invention, when an entry word appears in an example sentence of another entry word, the entry word once selected by the user can be read out according to the pronunciation symbol of the electronic dictionary content.

実施形態1の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。FIG. 3 is a diagram illustrating an example of a software configuration of the information processing apparatus (electronic dictionary apparatus) according to the first embodiment. 情報処理装置のハードウェア構成の一例を示す図である。It is a figure which shows an example of the hardware constitutions of information processing apparatus. 電子辞書コンテンツ112の見出し語の一例を示す図である。It is a figure which shows an example of the headword of the electronic dictionary content. 基本的な情報処理の流れを示すフローチャートである。It is a flowchart which shows the flow of basic information processing. 実施形態2の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。It is a figure which shows an example of the software configuration etc. of the information processing apparatus (electronic dictionary apparatus) of Embodiment 2. ユーザ辞書に登録できる単語数の上限を考慮した場合の情報処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the information processing when the upper limit of the number of words which can be registered into a user dictionary is considered. ステップS701における差異コスト算出の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the process of difference cost calculation in step S701. 実施形態3の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。It is a figure which shows an example of the software configuration etc. of the information processing apparatus (electronic dictionary apparatus) of Embodiment 3. 見出し語と同一表記の単語とを全てユーザ辞書に登録する場合の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process in the case of registering all the words of the same description with a headword in a user dictionary.

以下、本発明の実施形態について図面に基づいて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

<実施形態1>
図1は、実施形態1の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
見出し語指定部101は、見出し語を指定する。
見出し語検索部102は、見出し語指定部101が指定した見出し語を電子辞書コンテンツ112を対象に検索し、見出し語に該当する説明情報を検索結果として得る。
表示部103は、見出し語検索部102の検索結果を表示する。
読み上げ箇所選択部104は、前記説明情報の中から読み上げ箇所を選択する。
品詞抽出部105は、前記読み上げ箇所に含まれる見出し語に対応する品詞を前記説明情報から抽出する。
発音記号抽出部106は、前記読み上げ箇所に含まれる見出し語に対応する発音記号を前記説明情報から抽出する。
発音記号変換部107は、前記抽出した発音記号を音声合成用の読みに変換する。
<Embodiment 1>
FIG. 1 is a diagram illustrating an example of a software configuration of the information processing apparatus (electronic dictionary apparatus) according to the first embodiment.
The headword designation unit 101 designates a headword.
The headword search unit 102 searches the electronic dictionary content 112 for the headword specified by the headword specifying unit 101, and obtains the description information corresponding to the headword as a search result.
The display unit 103 displays the search result of the headword search unit 102.
The reading location selection unit 104 selects a reading location from the explanation information.
The part-of-speech extraction unit 105 extracts the part-of-speech corresponding to the headword included in the reading location from the explanation information.
The phonetic symbol extraction unit 106 extracts phonetic symbols corresponding to headwords included in the reading portion from the explanation information.
The phonetic symbol conversion unit 107 converts the extracted phonetic symbols into speech synthesis readings.

同一表記単語一時抑制部108は、見出し語と同一の表記を持つ単語がユーザ辞書109に登録されている場合、ユーザ辞書109から全ての同一表記単語を一時的に削除する。同一表記単語一時抑制部108は、ユーザ辞書から削除した単語は再度登録できるよう保持しておく。
ユーザ辞書109は、動的に単語を登録・削除できる音声合成用の辞書である。音声合成のための言語解析を行う際、合成用言語辞書113よりも優先してユーザ辞書に登録されている単語が選択される。
ユーザ辞書検索部110は、ユーザ辞書109を対象に単語を検索し、単語の表記、品詞、読み等、音声合成に必要な情報を検索結果として得る。
ユーザ辞書削除部111は、登録されている単語をユーザ辞書109から削除する。
電子辞書コンテンツ112は、電子辞書に搭載されている英和辞典、和英辞典、中日辞典、和独辞典等の電子化されたコンテンツである。
合成用言語辞書113は、事前に用意する静的な辞書で、単語の表記、品詞、読み等、音声合成に必要な情報を保持する。
When a word having the same notation as the headword is registered in the user dictionary 109, the same notation word temporary suppressing unit 108 temporarily deletes all the same notation words from the user dictionary 109. The same notation word temporary suppression unit 108 holds the word deleted from the user dictionary so that it can be registered again.
The user dictionary 109 is a speech synthesis dictionary that can dynamically register and delete words. When performing language analysis for speech synthesis, a word registered in the user dictionary is selected in preference to the synthesis language dictionary 113.
The user dictionary search unit 110 searches the user dictionary 109 for words, and obtains information necessary for speech synthesis such as word notation, part of speech, and reading as a search result.
The user dictionary deletion unit 111 deletes registered words from the user dictionary 109.
The electronic dictionary content 112 is an electronic content such as an English-Japanese dictionary, a Japanese-English dictionary, a Chunichi dictionary, or a Japanese-German dictionary installed in the electronic dictionary.
The synthesis language dictionary 113 is a static dictionary prepared in advance and holds information necessary for speech synthesis, such as word notation, parts of speech, and reading.

合成用言語辞書検索部114は、合成用言語辞書113を対象に単語を検索し、単語の表記、品詞、読み等、音声合成に必要な情報を検索結果として得る。
未知語読み付け部115は、ユーザ辞書109にも合成用言語辞書113に登録されていない単語に対して用いられ、表記を入力として読みを推定する。
見出し語登録部116は、見出し語指定部101が指定した見出し語、品詞抽出部105が抽出した品詞、発音記号変換部107が変換した読みをセットとして、ユーザ辞書登録部117を介してユーザ辞書109に登録する。
ユーザ辞書登録部117は、単語をユーザ辞書109に登録する。
音声合成部118は、合成用言語辞書113、ユーザ辞書109、未知語読み付け部115を用いて読み上げ箇所選択部104が選択した読み上げ箇所に対して読みを付け、前記読みにしたがって合成音声を生成し出力する。
同一表記単語抑制解除部119は、同一表記単語一時抑制部108が一時的に削除した同一表記の単語をユーザ辞書109に再度登録する。
The synthesizing language dictionary search unit 114 searches the synthesizing language dictionary 113 for a word, and obtains information necessary for speech synthesis such as word notation, part of speech, and reading as a search result.
The unknown word reading unit 115 is used for words that are not registered in the synthesis language dictionary 113 in the user dictionary 109, and estimates readings using the notation as input.
The headword registration unit 116 sets the headword specified by the headword specification unit 101, the part of speech extracted by the part of speech extraction unit 105, and the reading converted by the phonetic symbol conversion unit 107 as a set, through the user dictionary registration unit 117. 109 is registered.
The user dictionary registration unit 117 registers words in the user dictionary 109.
The speech synthesizer 118 reads the reading portion selected by the reading portion selection unit 104 using the synthesis language dictionary 113, the user dictionary 109, and the unknown word reading unit 115, and generates synthesized speech according to the reading. And output.
The same notation word suppression release unit 119 registers the same notation word temporarily deleted by the same notation word temporary suppression unit 108 in the user dictionary 109 again.

図2は、情報処理装置のハードウェア構成の一例を示す図である。
CPU202は、システムバス205を介して接続する各デバイスを総括的に制御する。CPU202は、読み出し専用メモリ(ROM)203若しくはフラッシュメモリ(FM)211に記憶された処理ステップやプログラムを読み出して実行する。ランダムアクセスメモリ(RAM)204は、高速にアクセス可能なCPU202の主メモリ、ワークエリア等の一時記憶領域として用いられる。
ここで、FM211は、オペレーティングシステム、アプリケーション等における、コンピュータによって実行可能な工程をプログラムとして格納し、CPU202によって実行されるデバイスドライバ等を格納する。
ROM203は、基本I/O、スタートアップ、或いはキーボード208からのキーストローク受け付けのような基本的なシステム機能のための、コンピュータによって実行可能な不変の処理ステップを格納する。
また、キーボードコントローラ(KBC)206は、キーボード(KB)208やマウス、タッチパネル、レーザポインタ等のようなポインティングデバイス207からの指示入力を制御する。
ディスプレイコントローラ(DSPC)209は、ディスプレイ(DSP)210の表示を制御する。
なお、電子辞書コンテンツ112、合成用言語辞書113、ユーザ辞書109は、FM211等に構成される。
CPU202が、プログラムに基づいて処理を実行することによって、情報所装置のソフトウェア構成、及び後述するフローチャートの各ステップの処理等が実現される。
FIG. 2 is a diagram illustrating an example of a hardware configuration of the information processing apparatus.
The CPU 202 generally controls each device connected via the system bus 205. The CPU 202 reads and executes processing steps and programs stored in the read-only memory (ROM) 203 or the flash memory (FM) 211. A random access memory (RAM) 204 is used as a temporary storage area such as a main memory and work area of the CPU 202 that can be accessed at high speed.
Here, the FM 211 stores, as programs, processes that can be executed by a computer in an operating system, applications, and the like, and stores device drivers and the like that are executed by the CPU 202.
ROM 203 stores invariant processing steps that can be executed by the computer for basic system functions such as basic I / O, startup, or keystroke acceptance from keyboard 208.
A keyboard controller (KBC) 206 controls an instruction input from a pointing device 207 such as a keyboard (KB) 208, a mouse, a touch panel, and a laser pointer.
A display controller (DSPC) 209 controls display on the display (DSP) 210.
The electronic dictionary content 112, the synthesis language dictionary 113, and the user dictionary 109 are configured in an FM 211 or the like.
When the CPU 202 executes processing based on a program, the software configuration of the information device, processing of each step of the flowchart described later, and the like are realized.

図3は、電子辞書コンテンツ112の見出し語の一例を示す図である。
501は、見出し語であり、この例ではtodayという単語である。
502は、見出し語の説明情報である。説明情報には、発音記号503や品詞504、505、及び、例文等が含まれる。
506は、ユーザが指定した読み上げ箇所を示している。この例では、読み上げ箇所が反転表示されている例を表している。
FIG. 3 is a diagram illustrating an example of a headword of the electronic dictionary content 112.
Reference numeral 501 denotes a headword, which in this example is the word today.
Reference numeral 502 denotes headword description information. The explanation information includes phonetic symbols 503, parts of speech 504 and 505, and example sentences.
Reference numeral 506 denotes a reading portion designated by the user. This example shows an example in which the reading-out part is highlighted.

図1及び図2に示した構成による本実施形態が読み上げ及び見出し語のユーザ辞書への登録、削除を行う基本的な処理内容を、図4のフローチャートを参照して説明する。
ステップS301では、見出し語指定部101が、ユーザが入力する見出し語を受理して、ステップS302に移る。
ステップS302では、見出し語検索部102が電子辞書コンテンツ112を対象に見出し語指定部101が保持する見出し語を検索する。表示部103は、見出し語検索部102の検索結果である見出し語及び見出し語の説明情報をディスプレイ210に表示してステップS303に移る。
ステップS303では、読み上げ箇所選択部104がユーザが入力する読み上げ箇所を受理してステップS304に移る。読み上げ箇所は見出し語の説明情報の一部であるとする。
ステップS304では、ユーザが音声合成ボタンを押下した場合はステップS305に移り、押下しない場合はステップS304に移る。
With reference to the flowchart of FIG. 4, basic processing contents in which the present embodiment having the configuration shown in FIGS. 1 and 2 performs reading, registration of a headword to the user dictionary, and deletion will be described.
In step S301, the headword designating unit 101 receives a headword input by the user, and proceeds to step S302.
In step S <b> 302, the headword search unit 102 searches for headwords held by the headword specification unit 101 for the electronic dictionary content 112. The display unit 103 displays the headword and the headword explanation information as a search result of the headword search unit 102 on the display 210, and proceeds to step S303.
In step S303, the reading part selection unit 104 accepts the reading part input by the user, and the process proceeds to step S304. It is assumed that the reading portion is a part of the description information of the headword.
In step S304, if the user presses the speech synthesis button, the process proceeds to step S305, and if not, the process proceeds to step S304.

ステップS305からステップS309までで、ユーザ辞書109に見出し語を登録する。
ステップS305では、読み上げ箇所選択部104が保持する読み上げ箇所中の見出し語について、品詞抽出部105が前記見出し語の品詞を特定する(品詞特定)。より具体的には、品詞抽出部105見出し語の説明情報の中から品詞に関する部分を抽出し品詞を特定する。1つの見出し語について複数の品詞がある場合は、見出し語の説明情報における読み上げ箇所の位置を基準に品詞を特定することができる。品詞を特定したらステップS306に移る。
ステップS306では、読み上げ箇所選択部104が保持する読み上げ箇所の中の見出し語について、発音記号抽出部106が前記見出し語の発音記号を特定する(発音記号特定)。より具体的には、発音記号抽出部106は、見出し語の説明情報の中から発音記号に関する部分を抽出し発音記号を特定する。1つの見出し語について複数の発音記号がある場合は、発音記号抽出部106は、ステップS305で特定された品詞に基づいて対応する発音記号を特定する。発音記号を特定したらステップS307に移る。
A headword is registered in the user dictionary 109 in steps S305 to S309.
In step S305, the part-of-speech extraction unit 105 identifies the part-of-speech of the headword (part-of-speech identification) for the headword in the reading-out part held by the reading-out part selection unit 104. More specifically, the part-of-speech extraction unit 105 extracts a part related to the part-of-speech from the description information of the headword and identifies the part-of-speech. When there are a plurality of parts of speech for one headword, the part of speech can be specified on the basis of the position of the reading portion in the explanation information of the headword. When the part of speech is specified, the process proceeds to step S306.
In step S306, the phonetic symbol extraction unit 106 specifies the phonetic symbol of the headword (phonetic symbol specification) for the headword in the reading portion held by the reading portion selection unit 104. More specifically, the phonetic symbol extraction unit 106 extracts a portion related to the phonetic symbol from the description information of the headword and identifies the phonetic symbol. If there is a plurality of phonetic symbols for one headword, the phonetic symbol extraction unit 106 specifies the corresponding phonetic symbol based on the part of speech specified in step S305. If a phonetic symbol is specified, it will move to step S307.

ステップS307では、発音記号変換部107が発音記号を音声合成用発音記号に変換する。発音記号抽出部106が抽出した発音記号は電子辞書コンテンツで定められた発音記号及び発音記号体系に基づいているため、これを音声合成用の発音記号に変換する必要がある。このため発音記号の変換テーブルを事前に用意しておくものとする。発音記号を変換したらステップS308に移る。
ステップS308では、同一表記単語一時抑制部108が見出し語と同一表記の単語をユーザ辞書109で一時的に使用不可とする。ここでは一時的な使用不可を実現するため、同一表記単語一時抑制部108は、ユーザ辞書から単語を削除する。もし表記が同じで発音記号が異なる単語が既にユーザ辞書に登録されている場合、単に見出し語をユーザ辞書に登録するだけでは、読み上げ箇所を言語解析した結果、所望の読み(つまり、見出し語の読み)が選択されない可能性がある。ここでは確実に見出し語の読みが選択されるように見出し語と同一表記の単語をユーザ辞書から一時的に削除する。より具体的には、ユーザ辞書検索部110がユーザ辞書109を対象に見出し語を検索する。ユーザ辞書削除部111は、検索にヒットした単語をユーザ辞書から削除する。ユーザ辞書削除部111は、検索にヒットした単語が複数ある場合は全て削除する。削除した単語はステップS310で音声合成した後のステップS312で再度ユーザ辞書に登録するので、同一表記単語一時抑制部108が保持しておく。同一表記の単語をユーザ辞書で一時的に使用不可にして、ステップS309に移る。
In step S307, the phonetic symbol converter 107 converts the phonetic symbols into phonetic symbols for speech synthesis. Since the phonetic symbols extracted by the phonetic symbol extraction unit 106 are based on the phonetic symbols and phonetic symbol system defined in the electronic dictionary content, it is necessary to convert them into phonetic symbols for speech synthesis. For this reason, a phonetic symbol conversion table is prepared in advance. If the phonetic symbol is converted, the process proceeds to step S308.
In step S <b> 308, the same notation word temporary suppression unit 108 temporarily disables the word having the same notation as the headword in the user dictionary 109. Here, in order to realize temporary disabling, the same notation word temporary suppression unit 108 deletes a word from the user dictionary. If words with the same notation but different phonetic symbols have already been registered in the user dictionary, simply registering the headword in the user dictionary will result in a linguistic analysis of the reading-out part, and the desired reading (that is, the headword (Reading) may not be selected. Here, a word having the same notation as the headword is temporarily deleted from the user dictionary so that reading of the headword is surely selected. More specifically, the user dictionary search unit 110 searches the user dictionary 109 for a headword. The user dictionary deletion unit 111 deletes words that have been found in the search from the user dictionary. The user dictionary deletion unit 111 deletes all the words that have been hit in the search. Since the deleted word is re-registered in the user dictionary in step S312 after the speech synthesis in step S310, the same notation word temporary suppression unit 108 holds it. The word having the same notation is temporarily disabled in the user dictionary, and the process proceeds to step S309.

ステップS309では、見出し語登録部116がユーザ辞書109に見出し語を登録する。より具体的には、見出し語検索部102が保持する見出し語の表記、品詞抽出部が保持する品詞、発音記号変換部107が保持する発音記号をユーザ辞書登録部117がユーザ辞書109に登録する。登録したらステップS310に移る。
ステップS310では、読み上げ箇所選択部104が保持する読み上げ箇所を音声合成部118が音声合成する。合成音声を出力したらステップS311に移る。
ステップS311では、ステップS308において同一表記単語を一時抑制した場合はステップS312に移り、一時抑制しなかった場合は処理を終了する。
ステップS312では、同一表記単語抑制解除部119が、ステップS308において一時抑制した同一表記単語の抑制を解除するため、再度、ユーザ辞書109に登録する。より具体的には、同一表記単語一時抑制部108が保持する一時削除した単語をユーザ辞書登録部117がユーザ辞書109に登録する。一時削除した単語が複数ある場合は、同一表記単語抑制解除部119は、全て登録する。登録後、処理を終了する。
In step S309, the headword registration unit 116 registers headwords in the user dictionary 109. More specifically, the user dictionary registration unit 117 registers the notation of the headwords held by the headword search unit 102, the part of speech held by the part of speech extraction unit, and the phonetic symbols held by the phonetic symbol conversion unit 107 in the user dictionary 109. . After registration, the process proceeds to step S310.
In step S310, the speech synthesizing unit 118 synthesizes the speech that is read out by the speech selection unit 104. When the synthesized speech is output, the process proceeds to step S311.
In step S311, if the same notation word is temporarily suppressed in step S308, the process proceeds to step S312, and if not temporarily suppressed, the process ends.
In step S312, the same written word suppression canceling unit 119 registers the same written word in the user dictionary 109 again to release the suppression of the same written word temporarily suppressed in step S308. More specifically, the user dictionary registration unit 117 registers the temporarily deleted words held by the same notation word temporary suppression unit 108 in the user dictionary 109. When there are a plurality of temporarily deleted words, the same written word suppression cancellation unit 119 registers all of them. After registration, the process ends.

本実施形態における音声読み上げにユーザ辞書を利用する効果をより具体的な例を用いて説明する。単語blog(発音 b l a: g)が電子辞書コンテンツ112に登録されており、一方、合成用言語辞書113には登録されていないものとする。また、未知語読み付け部115による読み付け処理を行うと単語blogには b l a: dz I という読みが付与されるものとする。
ユーザは、単語blogを電子辞書で検索、表示、音声合成した後、別の単語、例えばdeleteを検索、表示、音声合成するものとする。単語deleteで音声合成する際の読み上げ箇所に単語blogが含まれているものとする。
ユーザが単語blogを電子辞書で検索、表示、音声合成(ステップS301〜S310)すると、その過程でblogの見出し語の説明情報に記載されている発音記号や品詞と共に単語blogがユーザ辞書109に登録される。よって、音声合成時には、ユーザ辞書に登録されたblogが選択され、電子辞書コンテンツ通りの発音(b l a: g)で音声合成が行われる。例えば、読み上げ箇所を I read his blog every day. とすると、単語blogの部分が正しく b l a: gと発音される。
一時削除した単語の有無に応じて、同一表記単語の再登録を行い(ステップS312、S313)、処理を終了するものとする。その結果、単語blogがユーザ辞書に登録されたままとなる。
The effect of using a user dictionary for speech reading in this embodiment will be described using a more specific example. It is assumed that the word blog (pronunciation b 1 a: g) is registered in the electronic dictionary content 112, while not registered in the synthesis language dictionary 113. Further, when reading processing by the unknown word reading unit 115 is performed, the word blog is given a reading bla: dzI.
The user searches, displays, and synthesizes a word blog using an electronic dictionary, and then searches, displays, and synthesizes another word, for example, delete. It is assumed that the word blog is included in the reading-out part when speech synthesis is performed with the word delete.
When the user searches for the word blog in the electronic dictionary, displays it, and synthesizes the speech (steps S301 to S310), the word blog is registered in the user dictionary 109 along with the phonetic symbols and parts of speech described in the description information of the blog headword. Is done. Therefore, at the time of speech synthesis, blog registered in the user dictionary is selected, and speech synthesis is performed with pronunciation (b 1 a: g) according to the electronic dictionary content. For example, the read-out part is I read his blog everday. Then, the word blog is correctly pronounced as b l a: g.
The same notation word is re-registered according to the presence or absence of the temporarily deleted word (steps S312 and S313), and the process is terminated. As a result, the word blog remains registered in the user dictionary.

次に、ユーザが単語deleteを電子辞書で検索、表示、音声合成を行う。ユーザが指定する読み上げ箇所を I delete my blog. とする。見出し語はdeleteなので、単語deleteがユーザ辞書109に登録される。音声合成を行うと、単語deleteだけでなく、単語blogも電子辞書コンテンツ通りの発音で正しく音声合成される。これは、前回ユーザが単語blogを音声合成した際に、単語blogがユーザ辞書に登録されたからである。このように一度音声合成した見出し語が自動的にユーザ辞書に登録、保持されるため、別の見出し語の例文中に出現した場合にも電子辞書コンテンツの発音記号通りに音声合成することが可能になる。
なお、本実施形態では、同一表記単語一時抑制部108が同一表記の単語をユーザ辞書で一時的に使用不可とするためユーザ辞書から削除する場合について説明したが、これに限定されるものではない。例えば、ユーザ辞書の機能として、登録されている単語それぞれについて使用可能、使用不可の状態を制御できる場合もよいものとする。この場合、同一表記単語一時抑制部108は、ユーザ辞書の単語の状態を設定するユーザ辞書状態設定部(図示なし)を介して、ユーザ辞書に登録されている同一表記単語を使用不可の状態に設定する。使用不可に設定された単語は音声合成の言語解析では使用されないものとし、使用可能に設定された単語は音声合成の言語解析に使用されるものとする。同様に、同一表記単語抑制解除部119は、同一表記単語一時抑制部108が一時的に使用不可とした同一表記の単語をユーザ辞書で使用可能な状態に設定する。なお、使用可能、使用不可のように2値の状態だけに限らず、優先度を設定するように構成してもよいものとする。ユーザ辞書での使用を抑制したい場合は優先度を十分下げ、逆に抑制を解除したい場合は優先度を所定の値に戻すことで実現してもよいものとする。
Next, the user searches for the word delete in the electronic dictionary, displays it, and performs speech synthesis. I read my blog. And Since the headword is delete, the word delete is registered in the user dictionary 109. When speech synthesis is performed, not only the word delete but also the word blog are correctly synthesized with pronunciation according to the electronic dictionary content. This is because the word blog was registered in the user dictionary when the user synthesized the word blog last time. The headwords that have been speech-synthesized in this way are automatically registered and stored in the user dictionary, so that even if they appear in an example sentence of another headword, it is possible to synthesize voice according to the phonetic symbol of the electronic dictionary content. become.
In the present embodiment, the case where the same notation word temporary suppression unit 108 deletes the same notation word from the user dictionary in order to temporarily disable the word in the user dictionary has been described. However, the present invention is not limited to this. . For example, as a function of the user dictionary, it may be possible to control the usable / unusable state for each registered word. In this case, the same notation word temporary suppression unit 108 makes the same notation word registered in the user dictionary unusable via a user dictionary state setting unit (not shown) that sets the word state of the user dictionary. Set. It is assumed that the words set to be unusable are not used in the language analysis of speech synthesis, and the words set to be usable are used in the language analysis of speech synthesis. Similarly, the same notation word suppression release unit 119 sets the same notation word temporarily disabled by the same notation word temporary suppression unit 108 to be usable in the user dictionary. It should be noted that not only the binary state, such as usable or unusable, may be configured to set the priority. When it is desired to suppress the use in the user dictionary, the priority may be sufficiently lowered, and conversely, when it is desired to cancel the suppression, the priority may be returned to a predetermined value.

<実施形態2>
一般に、ユーザ辞書に登録できる単語の数には上限がある。即ち、上限まで単語を登録した後も本実施形態の前提である見出し語を電子辞書コンテンツの発音通りに読み上げるためには、新規に単語を登録するためには登録済みの単語を削除する必要がある。そのためにはどの単語を削除するのかを決定する必要がある。簡単な方法としては、登録日時の古い順や、使用頻度の少ない順等が有効である。
以下、別の有効な方法として、電子辞書コンテンツの発音記号と音声合成の発音記号の差異に着目した削除単語決定方法について説明する。
図5は、実施形態2の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
図5において、図1と同じモジュールには図1と同じ番号を振り説明を省略する。
差異コスト算出部601は、発音記号変換部107が変換した音声合成用の読みと合成用言語辞書113に登録されている読み又は未知語読み付け部115が推定する読みとの差異を算出する。
削除単語決定部602は、ユーザ辞書に空きが不足する場合に、差異コスト算出部601が算出した差異コストにしたがって削除する単語を決定する。
<Embodiment 2>
Generally, there is an upper limit on the number of words that can be registered in the user dictionary. That is, after registering a word up to the upper limit, in order to read out the headword that is the premise of the present embodiment as pronounced in the electronic dictionary content, it is necessary to delete the registered word in order to register a new word. is there. For that purpose, it is necessary to decide which word is deleted. As a simple method, the oldest registration date or the least frequently used order is effective.
Hereinafter, as another effective method, a deletion word determination method focusing on a difference between a phonetic symbol of electronic dictionary content and a phonetic symbol of speech synthesis will be described.
FIG. 5 is a diagram illustrating an example of a software configuration of the information processing apparatus (electronic dictionary apparatus) according to the second embodiment.
In FIG. 5, the same modules as those in FIG.
The difference cost calculation unit 601 calculates the difference between the speech synthesis reading converted by the phonetic symbol conversion unit 107 and the reading registered in the synthesis language dictionary 113 or the reading estimated by the unknown word reading unit 115.
The deletion word determination unit 602 determines a word to be deleted according to the difference cost calculated by the difference cost calculation unit 601 when there is not enough space in the user dictionary.

図6は、ユーザ辞書に登録できる単語数の上限を考慮した場合の処理の流れを示すフローチャートである。図6において、ステップS301〜S307、S309、S310は図4と処理が同じであるため説明を省略する。
ステップS308において、同一表記単語一時抑制部108が同一表記の単語をユーザ辞書から一時的に削除して、ステップS701に移る。
ステップS701では、差異コスト算出部601が見出し語の差異コストを算出する。差異コストは、ステップS703及びステップS906において、ユーザ辞書に登録する語数が上限に達した場合に削除する単語を決定するために用いる。差異コストは、電子辞書コンテンツにおける見出し語の読みと音声合成による見出し語の読みとの差異を数値化したものである。ここでは、電子辞書コンテンツの見出し語の発音記号と音声合成とが中間的に出力する発音記号との差で定義する。音声合成が中間的に出力する発音記号には2つの可能性がある。見出し語が合成用言語辞書113に登録されている場合とそうでない場合とである。合成用言語辞書に登録されている場合は合成用言語辞書の発音記号を用いる。一方、合成用言語辞書に登録されていない場合は、未知語読み付け部115が見出し語の表記から発音記号を推定したものを用いる。
FIG. 6 is a flowchart showing the flow of processing when the upper limit of the number of words that can be registered in the user dictionary is considered. In FIG. 6, steps S301 to S307, S309, and S310 are the same as those in FIG.
In step S308, the same notation word temporary suppression unit 108 temporarily deletes the same notation word from the user dictionary, and the process proceeds to step S701.
In step S701, the difference cost calculation unit 601 calculates the difference cost of the headword. The difference cost is used to determine a word to be deleted when the number of words registered in the user dictionary reaches the upper limit in steps S703 and S906. The difference cost is obtained by quantifying a difference between reading of a headword in electronic dictionary content and reading of a headword by speech synthesis. Here, it is defined by the difference between the phonetic symbol of the headword of the electronic dictionary content and the phonetic symbol output in the middle of speech synthesis. There are two possibilities for phonetic symbols output by speech synthesis in the middle. The case where the headword is registered in the synthesis language dictionary 113 and the case where it is not. If it is registered in the synthesis language dictionary, the phonetic symbols of the synthesis language dictionary are used. On the other hand, if it is not registered in the synthesis language dictionary, the unknown word reading unit 115 uses a phonetic symbol estimated from the entry word notation.

以下、図7を用いて差異コストの算出処理の流れを説明する。
図7は、ステップS701における差異コスト算出の処理の流れを示すフローチャートである。
ステップS401では、合成用言語辞書検索部114が合成用言語辞書113を対象に見出し語を検索し、ステップS402に移る。
ステップS402では、合成用言語辞書検索部114は、検索にヒットした場合、つまり合成用言語辞書113に見出し語が登録されていた場合、ステップS404に移る。合成用言語辞書検索部114は、登録されていない場合、ステップS403に移る。
ステップS403では、未知語読み付け部115が、見出し語の表記を入力として発音記号を推定する。発音記号を推定し、ステップS404に移る。
ステップS404では、差異コスト算出部601が、電子辞書コンテンツの見出し語の発音記号(発音記号変換部107が保持する音声合成用の発音記号)とステップS401からS403で求めた発音記号との差異コストを算出する。差異コストを算出したら終了する。
Hereinafter, the flow of the difference cost calculation process will be described with reference to FIG.
FIG. 7 is a flowchart showing the flow of the difference cost calculation process in step S701.
In step S401, the synthesis language dictionary search unit 114 searches for a headword in the synthesis language dictionary 113, and proceeds to step S402.
In step S402, the synthesis language dictionary search unit 114 proceeds to step S404 if the search is hit, that is, if the headword is registered in the synthesis language dictionary 113. If it is not registered, the synthesis language dictionary search unit 114 proceeds to step S403.
In step S403, the unknown word reading unit 115 estimates phonetic symbols using the notation of the headword as input. The phonetic symbol is estimated and the process proceeds to step S404.
In step S404, the difference cost calculation unit 601 calculates the difference cost between the phonetic symbol of the headword of the electronic dictionary content (the phonetic symbol for speech synthesis held by the phonetic symbol conversion unit 107) and the phonetic symbol obtained in steps S401 to S403. Is calculated. When the difference cost is calculated, the process ends.

ここで差異コストの算出方法について一例を説明する。電子辞書コンテンツの見出し語の発音記号とステップS401からS403までで求めた発音記号とに基づき、次のように定義することができる。
差異コスト=(挿入誤り数+脱落誤り数+置換誤り数)/ 辞書コンテンツの見出し語の発音記号数
より具体的な例を用いて差異コストの算出例を説明する。
電子辞書コンテンツの見出し語の発音記号 b l a: g
音声合成が中間的に出力する発音記号 b l a: dz I
2つの発音記号の間でDPマッチングを行い、各発音記号の対応関係を決定すると以下のようになる。
b l a: g
b l a: dz I
b, l, a: は一致、gとdzは置換誤り、Iは挿入誤りとなる。よって、差異コストは、
差異コスト=(1+0+1)/4 = 0.5
となる。
図6の説明に戻って、ステップS701で差異コストを算出したらステップS309に移る。
Here, an example of the method for calculating the difference cost will be described. Based on the phonetic symbol of the headword of the electronic dictionary content and the phonetic symbol obtained in steps S401 to S403, it can be defined as follows.
Difference cost = (number of insertion errors + number of omission errors + number of substitution errors) / number of phonetic symbols of entry words of dictionary content A difference cost calculation example will be described using a more specific example.
Phonetic symbol of electronic dictionary contents headword b l a: g
Phonetic symbols output by speech synthesis in the middle b l a: dz I
When DP matching is performed between two phonetic symbols and the correspondence of each phonetic symbol is determined, it is as follows.
b l a: g
b l a: dz I
b, l, a: match, g and dz are substitution errors, and I is an insertion error. Therefore, the difference cost is
Difference cost = (1 + 0 + 1) /4=0.5
It becomes.
Returning to the description of FIG. 6, when the difference cost is calculated in step S <b> 701, the process proceeds to step S <b> 309.

ステップS309では、見出し語登録部116が見出し語の表記、品詞、発音記号、及び、差異コストをユーザ辞書109に登録する。ユーザ辞書は、単語ごとに差異コストを保持できるものとする。登録したらステップS310に移る。
ステップS311では、ステップS308において同一表記単語を一時削除した場合はステップS312に移り、一時削除しなかった場合はステップS702に移る。
ステップS312では、同一表記単語抑制解除部119が、ステップS308において一時削除した同一表記単語を再度、ユーザ辞書109に登録し、ステップS702に移る。
ステップS702では、ユーザ辞書109に新たに単語を登録する空きがない場合はステップS703に移り、空きがある場合は終了する。
ステップS703では、削除単語決定部602がユーザ辞書109から削除する単語を決定する。削除する単語は、ユーザ辞書109に登録されている単語の差異コストが最小の単語とする。
In step S309, the headword registration unit 116 registers the headword notation, part of speech, phonetic symbol, and difference cost in the user dictionary 109. The user dictionary can hold a difference cost for each word. After registration, the process proceeds to step S310.
In step S311, if the same notation word is temporarily deleted in step S308, the process proceeds to step S312, and if not temporarily deleted, the process proceeds to step S702.
In step S312, the same notation word suppression release unit 119 registers the same notation word temporarily deleted in step S308 in the user dictionary 109 again, and the process proceeds to step S702.
In step S702, when there is no space for registering a new word in the user dictionary 109, the process proceeds to step S703, and when there is a space, the process ends.
In step S703, the deleted word determination unit 602 determines a word to be deleted from the user dictionary 109. The word to be deleted is the word with the smallest difference cost of words registered in the user dictionary 109.

ここで、差異コストが小さいということは、音声合成した場合に電子辞書コンテンツの単語の読みと合成音声の読みの差異が小さいことを意味する。つまり、ユーザ辞書登録しておく価値が小さいことになる。逆に、差異コストが大きいということは、音声合成した場合にその単語がユーザ辞書に登録されていないと音声合成の読みの差異が大きいことを意味する。よって、差異が小さい単語から削除することにより、電子辞書コンテンツの単語の読みとの差異が大きい単語を可能な限りユーザ辞書に残すことになる。これにより、ユーザ辞書に残される差異コストが大きい単語は電子辞書コンテンツの読み通りに音声合成で発音できるので、限られたユーザ辞書登録語数の中で可能な限り電子辞書コンテンツの読みに近い音声合成を実現することが期待できる。
削除する単語が決まったら、ユーザ辞書削除部111がその単語をユーザ辞書109から削除して、終了する。
Here, the fact that the difference cost is small means that the difference between reading of words in the electronic dictionary content and reading of the synthesized speech is small when speech synthesis is performed. That is, the value of registering the user dictionary is small. Conversely, a large difference cost means that when speech synthesis is performed, if the word is not registered in the user dictionary, the speech synthesis reading difference is large. Therefore, by deleting from a word having a small difference, a word having a large difference from the word reading of the electronic dictionary content is left in the user dictionary as much as possible. As a result, words with a large difference cost remaining in the user dictionary can be pronounced by speech synthesis as the electronic dictionary content is read, so speech synthesis that is as close to reading of the electronic dictionary content as possible within the limited number of registered words in the user dictionary. Can be expected to be realized.
When the word to be deleted is determined, the user dictionary deleting unit 111 deletes the word from the user dictionary 109, and the process ends.

なお、本実施形態では、ステップS309でユーザ辞書109の空き状況を確認することなくユーザ辞書109に見出し語を登録できるようにするため、ステップS702及びS703で少なくとも1つの空きを確保する処理を行っている。なお、ステップS309の前でユーザ辞書109の空き状況を確認し、空きがない場合は差異コストが最小の単語をユーザ辞書から削除するようにしてもよい。
これまでは、見出し語指定部101で指定された見出し語だけをユーザ辞書に登録する場合について説明したが、これに限定されることはなく、見出し語と同一表記の単語も併せて登録してもよいものとする。
In the present embodiment, in order to be able to register a headword in the user dictionary 109 without confirming the availability of the user dictionary 109 in step S309, a process of securing at least one vacancy is performed in steps S702 and S703. ing. Note that the availability of the user dictionary 109 is confirmed before step S309, and if there is no available space, the word with the smallest difference cost may be deleted from the user dictionary.
So far, the case where only the headword specified by the headword specifying unit 101 is registered in the user dictionary has been described. However, the present invention is not limited to this, and a word having the same notation as the headword is also registered. It shall be good.

<実施形態3>
ここで、同一表記で読みが異なる単語が存在する場合を考える。先に述べた通り、ユーザ辞書109に登録された単語は合成用言語辞書113に登録された単語より優先して選択される。どちらかの読みの単語だけがユーザ辞書に登録されていると常にその読みが採用されてしまうため、その単語が別の見出し語の例文中に現れる際に読み誤りの可能性が高くなる。そこで、ユーザ辞書に同一表記単語を全て登録することにする。これにより、読み上げ箇所を言語解析する際にユーザ辞書に登録されている同一表記単語の品詞に基づいて前後の接続可能性が高い単語が選択され、正しい読みで音声合成される可能性が高くなる。一方、削除する場合は同一表記単語をユーザ辞書から全て削除することにより、読み上げ箇所を言語解析する際に合成用言語辞書に登録されている単語の品詞に基づいて前後の接続可能性が高い単語が選択される。これにより、正しい読みで音声合成される可能性が高くなる。
以下、図8及び図9を参照して、見出し語と同一表記の単語も併せて登録する場合について説明する。
<Embodiment 3>
Here, consider a case where there are words with the same notation and different readings. As described above, the word registered in the user dictionary 109 is selected in preference to the word registered in the synthesis language dictionary 113. If only one of the reading words is registered in the user dictionary, the reading is always adopted. Therefore, when the word appears in an example sentence of another headword, the possibility of a reading error increases. Therefore, all the same notation words are registered in the user dictionary. As a result, when language analysis is performed on the read-out part, words having a high possibility of connection before and after are selected based on the part of speech of the same notation word registered in the user dictionary, and there is a high possibility that speech synthesis is performed with correct reading. . On the other hand, when deleting, the same notation word is deleted from the user dictionary, so that words that have a high possibility of connection before and after based on the part-of-speech of the word registered in the synthesis language dictionary when language analysis is performed on the reading portion Is selected. This increases the possibility of voice synthesis with correct reading.
Hereinafter, with reference to FIG. 8 and FIG. 9, a case where a word having the same notation as the headword is also registered will be described.

図8は、実施形態3の情報処理装置(電子辞書装置)のソフトウェア構成等の一例を示す図である。
図8において、図5と同じモジュールには同じ番号を振り説明を省略する。
見出し語内検索部801は、見出し語検索部102が検索して得た説明情報を対象として見出し語と同一表記の単語を検索する。
見出し語外検索部802は、電子辞書コンテンツ112を対象として、見出し語と同一表記の単語を検索する。
FIG. 8 is a diagram illustrating an example of a software configuration of the information processing apparatus (electronic dictionary apparatus) according to the third embodiment.
In FIG. 8, the same modules as those in FIG.
The headword search unit 801 searches the description information obtained by the headword search unit 102 for words having the same notation as the headword.
The headword non-search part 802 searches the electronic dictionary content 112 for a word having the same notation as the headword.

図9は、見出し語と同一表記の単語とを全てユーザ辞書に登録する場合の処理の流れを示すフローチャートである。
図9において、ステップS301〜310、S312、S70〜S703は、図6と同じ処理を行うステップには同じ番号を付与し説明を省略する。
ステップS311では、ステップS308において同一表記単語を一時削除した場合はステップS312に移り、一時削除しなかった場合はステップS901に移る。
ステップS901では、見出し語内検索部801が見出し語の説明情報を対象に見出し語と表記が同じで品詞や発音が異なる単語を検索する。見出し語内検索部801は、検索結果を保持してステップS902に移る。
ステップS902では、見出し語外検索部802が電子辞書コンテンツ112を対象に見出し語と表記が同じで品詞や発音が異なる単語を検索する。表記が同じ単語は同一の見出し語の説明情報に含まれることが多いが、辞書によって、或いは、単語によっては、別見出しとして記載される場合がある。ステップS902はそのための処理である。見出し語外検索部802は、検索結果を保持してステップS903に移る。
FIG. 9 is a flowchart showing the flow of processing when registering all the headwords and the same notation words in the user dictionary.
In FIG. 9, steps S301 to S310, S312 and S70 to S703 are given the same numbers to steps performing the same processing as in FIG.
In step S311, if the same notation word is temporarily deleted in step S308, the process proceeds to step S312, and if not temporarily deleted, the process proceeds to step S901.
In step S901, the headword search unit 801 searches the headword explanation information for words having the same notation as the headword but different parts of speech and pronunciation. The headword search unit 801 holds the search result and proceeds to step S902.
In step S <b> 902, the headword non-word search unit 802 searches the electronic dictionary content 112 for words having the same notation as the headword but different parts of speech and pronunciation. Words with the same notation are often included in the description information of the same headword, but may be described as a separate headline depending on a dictionary or depending on the word. Step S902 is a process for that purpose. The headword search unit 802 holds the search result and proceeds to step S903.

ステップS903では、ステップS901及びステップS902の結果、同一表記で品詞や発音記号が異なる単語が存在する場合は、ステップS904に移る。存在しない場合は、ステップS702に移る。
ステップS904では、検索にヒットした単語それぞれについて、差異コスト算出部601が差異コストを算出する。例えば、差異コスト算出部601は、3単語がヒットした場合、まず3単語それぞれの差異コストを求める。更に、差異コスト算出部601は、3単語の差異コストの平均値を求め、この値を3単語共通の差異コストとする。これは、ユーザ辞書から差異コストが小さい単語を削除する際に、3単語同時に削除するための工夫である。先に述べた通り、ユーザ辞書109に登録された単語は合成用言語辞書113に登録された単語より優先して選択される。そのため、ユーザ辞書に同一表記単語が部分的に残っていると常にその単語が採用されてしまうため、読み誤りの可能性が高くなる。ユーザ辞書から削除する場合は同一表記単語を全て削除することにより、読み上げ箇所を言語解析する際に、単語に関しては合成用言語辞書に登録されている単語の品詞に基づいて前後の接続可能性が高い単語が選択される。これにより、正しい読みで音声合成される可能性が高くなる。差異コスト算出部601は、差異コストを算出したらステップS905に移る。
In step S903, as a result of step S901 and step S902, if there are words with the same notation but different parts of speech or phonetic symbols, the process proceeds to step S904. If not, the process proceeds to step S702.
In step S904, the difference cost calculation unit 601 calculates a difference cost for each word hit in the search. For example, when three words are hit, the difference cost calculation unit 601 first obtains a difference cost for each of the three words. Further, the difference cost calculation unit 601 obtains an average value of the difference costs of the three words, and sets this value as the difference cost common to the three words. This is a device for deleting three words at the same time when deleting words having a small difference cost from the user dictionary. As described above, the word registered in the user dictionary 109 is selected in preference to the word registered in the synthesis language dictionary 113. Therefore, if the same notation word partially remains in the user dictionary, the word is always adopted, so that the possibility of reading errors increases. When deleting from the user dictionary, by deleting all the same notation words, when performing a linguistic analysis of the reading part, there is a possibility of connection before and after based on the part of speech of the word registered in the language dictionary for synthesis. A high word is selected. This increases the possibility of voice synthesis with correct reading. After calculating the difference cost, the difference cost calculation unit 601 proceeds to step S905.

ステップS905では、ユーザ辞書109に新たに単語を登録する空きが十分にない場合は、ステップS906に移り、十分な空きがある場合は、ステップS909に移る。
ここで、ユーザ辞書登録候補である同一表記単語の個数をNcとすると、十分な空きとは、Nc+1単語分である。+1の意味は、先に述べたようにステップS309においてユーザ辞書109に常に1単語分の空きを確保しておくためである。
ステップS906では、削除単語決定部602が削除する単語を決定するため、ユーザ辞書登録候補である同一表記単語の差異コストと、ユーザ辞書に登録されている単語の差異コストと、を比較する。ユーザ辞書の空きをNvとすると、ユーザ辞書から削除する単語の個数Ndは次のように表すことができる。
Nd=Nc+1−Nv
比較に際しては、ユーザ辞書に登録されている単語の差異コストの小さい順に並べてNd番目の値と比較すればよい。処理を高速化するため、予め差異コストの値でソートしておいてもよい。比較後、ステップS907に移る。
In step S905, if there is not enough room for registering a new word in the user dictionary 109, the process proceeds to step S906, and if there is sufficient room, the process proceeds to step S909.
Here, if the number of identical notation words that are user dictionary registration candidates is Nc, sufficient space is Nc + 1 words. The meaning of +1 is to always ensure an empty space for one word in the user dictionary 109 in step S309 as described above.
In step S906, in order to determine the word to be deleted by the deleted word determination unit 602, the difference cost of the same notation word that is a user dictionary registration candidate is compared with the difference cost of the word registered in the user dictionary. When the empty space of the user dictionary is Nv, the number Nd of words to be deleted from the user dictionary can be expressed as follows.
Nd = Nc + 1−Nv
For comparison, the words registered in the user dictionary may be arranged in ascending order of the difference cost and compared with the Nd-th value. In order to speed up the processing, it may be sorted in advance by the value of the difference cost. After the comparison, the process proceeds to step S907.

ステップS907では、比較の結果、ユーザ辞書登録候補である同一表記単語の差異コストの方がNd番目の値よりも小さい場合は処理を終了する。つまり、ユーザ辞書登録候補である同一表記単語の差異コストが小さいので登録しない。小さくない場合は、ステップS908に移る。
ステップS908では、削除単語決定部602が削除する単語を決定する。ステップS906で求めたNdに基づき、差異コストが小さい順に少なくともNd個の単語をユーザ辞書から削除する単語として決定する。ここで「少なくとも」と記載したのは、Nd番目の単語と同一表記単語も削除単語とするからである。ステップS904に記載した通り、Nd番目の単語と同一表記単語の差異コストは同一である。ユーザ辞書削除部111が削除単語をユーザ辞書109から削除して、ステップS909に移る。
ステップS909では、ユーザ辞書登録部117がユーザ辞書登録候補である同一表記単語をユーザ辞書109に登録して処理を終了する。
In step S907, if the comparison shows that the difference cost of the same notation word that is a user dictionary registration candidate is smaller than the Nd-th value, the process ends. That is, since the difference cost of the same notation word which is a user dictionary registration candidate is small, it is not registered. If not, the process moves to step S908.
In step S908, the deleted word determination unit 602 determines a word to be deleted. Based on Nd obtained in step S906, at least Nd words are determined as words to be deleted from the user dictionary in ascending order of difference cost. Here, “at least” is described because the same notation word as the Nd-th word is also a deletion word. As described in step S904, the difference cost of the Nd-th word and the same notation word is the same. The user dictionary deletion unit 111 deletes the deleted word from the user dictionary 109, and the process proceeds to step S909.
In step S909, the user dictionary registration unit 117 registers the same notation word as a user dictionary registration candidate in the user dictionary 109, and the process ends.

以上説明したように、見出し語と同一表記の単語を併せてユーザ辞書に登録し、また、削除する際は同一表記の単語を全て削除する。これにより、一度音声合成した見出し語及び同一表記単語が別の見出し語の例文中に現れた際にも、電子辞書コンテンツ112の発音記号通りに読まれる可能性が見出し語だけをユーザ辞書に登録する場合に比べて高くなる。   As described above, words having the same notation as the headword are also registered in the user dictionary, and when deleting, all the words having the same notation are deleted. As a result, even when a headword once synthesized by speech and the same notation word appear in an example sentence of another headword, only the headword is registered in the user dictionary so that it may be read as the phonetic symbol of the electronic dictionary content 112. It becomes higher than when you do.

<その他の実施形態>
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。
<Other embodiments>
The present invention can also be realized by executing the following processing. That is, software (program) that realizes the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, etc.) of the system or apparatus reads the program. It is a process to be executed.

以上、上述した各実施形態によれば、一度ユーザが選択した見出し語に関して、別の見出し語の例文中に前記見出し語が現れた場合には電子辞書コンテンツの発音記号通りに読み上げることができる。
なお、上述した実施形態では動的に単語を追加、削除、また、単語の状態を設定するための辞書として、ユーザ辞書を用いる場合について説明した。一般的にユーザ辞書はユーザが所望の単語を思い通りの読みで音声合成するために利用するものである。上述した実施形態ではこのユーザ辞書を電子辞書システムが利用する場合について説明した。但し、ユーザ辞書に限られるものではなく、動的に単語を追加、削除、また、単語の状態を設定することができ、合成用言語辞書よりも優先的に登録単語が選択される辞書であればよいものとする。
また、上述した実施形態では、見出し語の詳細説明中の読み上げ箇所をユーザが選択する場合について説明したが、これに限定されるものではない。例えば、見出し語の詳細説明が表示された時点で、詳細説明全てが読み上げ箇所と自動的に決定されてもよいものとする。また、表示するページが切り替わるタイミングで、ページ全体が読み上げ箇所と自動的に決定される場合等任意の方法でもよいものとする。
また、上述した実施形態では、KBC206を介して見出し語や読み上げ箇所をユーザが指定する場合について説明したが、これに限定されるものではない。視線入力、ジェスチャー入力等、任意の入力手段により実現する場合もよいものとする。
As described above, according to each of the above-described embodiments, when the headword appears in an example sentence of another headword with respect to the headword selected once by the user, it can be read out as the phonetic symbol of the electronic dictionary content.
In the above-described embodiment, a case has been described in which a user dictionary is used as a dictionary for dynamically adding and deleting words and setting the state of words. In general, a user dictionary is used by a user to synthesize a desired word by speech as desired. In the above-described embodiment, the case where the electronic dictionary system uses this user dictionary has been described. However, the dictionary is not limited to a user dictionary, and any dictionary that can dynamically add and delete words and set the state of words and that selects registered words preferentially over the synthesis language dictionary. I shall do it.
Moreover, although embodiment mentioned above demonstrated the case where a user selected the reading location in detailed description of a headword, it is not limited to this. For example, when the detailed description of the headword is displayed, all the detailed description may be automatically determined as a reading portion. In addition, any method may be used, such as when the entire page is automatically determined as a reading position at the timing when the page to be displayed is switched.
In the above-described embodiment, the case where the user designates a headword or a reading position via the KBC 206 has been described. However, the present invention is not limited to this. It may be realized by any input means such as line-of-sight input or gesture input.

以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
例えば、電子辞書コンテンツの読み上げを行う情報処理装置は、電子辞書コンテンツを画面に表示し操作することが可能な携帯端末装置やコンピュータによっても実現される。
The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims.・ Change is possible.
For example, an information processing apparatus that reads out electronic dictionary content is also realized by a mobile terminal device or a computer that can display and operate the electronic dictionary content on a screen.

202 CPU、203 ROM、204 RAM、211 FM 202 CPU, 203 ROM, 204 RAM, 211 FM

Claims (8)

電子辞書コンテンツの読み上げを行う情報処理装置であって、
入力された見出し語に基づいて、電子辞書コンテンツを検索する検索手段と、
前記検索手段での検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示手段と、
前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定手段と、
前記発音記号特定手段で特定された発音記号を音声合成用発音記号に変換する変換手段と、
前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制手段と、
前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録手段と、
前記読み上げ箇所を音声合成する音声合成手段と、
前記一時抑制手段で一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除手段と、
を有する情報処理装置。
An information processing apparatus that reads out electronic dictionary content,
Search means for searching electronic dictionary content based on the entered headword;
Display means for displaying a headword as a search result in the search means and description information of the headword on a display device;
Phonetic symbol specifying means for specifying the phonetic symbol of the headword of the reading portion that is a part of the description information of the headword;
Conversion means for converting the phonetic symbols specified by the phonetic symbol specifying means into phonetic synthesis phonetic symbols;
Temporary suppression means for temporarily disabling words in the same notation as the headword in the dictionary;
Registration means for registering the headword, the phonetic symbol, and the phonetic symbol for speech synthesis in the dictionary;
Speech synthesis means for synthesizing the reading location;
Suppression release means for enabling use of the word temporarily disabled by the temporary suppression means in the dictionary;
An information processing apparatus.
前記一時抑制手段は、前記見出し語と同一表記の単語を辞書から一時的に削除することで一時的に使用不可とする請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the temporary suppression unit is temporarily disabled by temporarily deleting a word having the same notation as the headword from the dictionary. 前記抑制解除手段は、前記一時抑制手段で一時的に削除した前記同一表記の単語を再度、前記辞書に登録することで前記単語を前記辞書で使用可能とする請求項2記載の情報処理装置。   The information processing apparatus according to claim 2, wherein the suppression release unit enables the word to be used in the dictionary by registering the same notation word temporarily deleted by the temporary suppression unit in the dictionary again. 前記電子辞書コンテンツにおける見出し語の読みと前記音声合成手段での音声合成による見出し語の読みとの差異を示す差異コストを算出する算出手段と、
前記辞書に新たに単語を登録する空きがない場合、前記算出手段で算出された差異コストが最小の単語を前記辞書から削除する削除手段と、
を更に有する請求項1乃至3何れか1項記載の情報処理装置。
Calculating means for calculating a difference cost indicating a difference between reading of a headword in the electronic dictionary content and reading of a headword by voice synthesis in the voice synthesizer;
When there is no space for registering a new word in the dictionary, a deletion unit that deletes a word having a minimum difference cost calculated by the calculation unit from the dictionary;
The information processing apparatus according to claim 1, further comprising:
前記削除手段は、前記算出手段で算出された差異コストが最小の単語と同一表記単語も前記辞書から削除する請求項4記載の情報処理装置。   The information processing apparatus according to claim 4, wherein the deletion unit also deletes from the dictionary the same notation word as the word having the smallest difference cost calculated by the calculation unit. 前記登録手段は、更に、前記見出し語と共に、前記見出し語と同一表記の単語を前記辞書に登録する請求項1乃至5何れか1項記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the registration unit further registers a word having the same notation as the headword together with the headword in the dictionary. 電子辞書コンテンツの読み上げを行う情報処理装置が実行する情報処理方法であって、
入力された見出し語に基づいて、電子辞書コンテンツを検索する検索ステップと、
前記検索ステップでの検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示ステップと、
前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定ステップと、
前記発音記号特定ステップで特定された発音記号を音声合成用発音記号に変換する変換ステップと、
前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制ステップと、
前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録ステップと、
前記読み上げ箇所を音声合成する音声合成ステップと、
前記一時抑制ステップで一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除ステップと、
を含む情報処理方法。
An information processing method executed by an information processing apparatus that reads out electronic dictionary content,
A search step for searching electronic dictionary content based on the entered headword;
A display step of displaying on the display device the headword and the headword explanation information as a search result in the search step;
A phonetic symbol specifying step for specifying a phonetic symbol of the headword of the reading portion that is a part of the explanation information of the headword;
A conversion step of converting the phonetic symbol specified in the phonetic symbol specifying step into a phonetic symbol for speech synthesis;
A temporary suppression step of temporarily disabling words in the same notation as the headword in the dictionary;
A registration step of registering the headword, the phonetic symbol, and the phonetic symbol for speech synthesis in the dictionary;
A speech synthesis step of performing speech synthesis of the reading location;
A suppression release step of making the word temporarily disabled in the temporary suppression step usable in the dictionary;
An information processing method including:
電子辞書コンテンツの読み上げを行うコンピュータに、
入力された見出し語に基づいて、電子辞書コンテンツを検索する検索ステップと、
前記検索ステップでの検索結果である見出し語及び見出し語の説明情報を表示装置に表示する表示ステップと、
前記見出し語の説明情報の一部である読み上げ箇所の見出し語の発音記号を特定する発音記号特定ステップと、
前記発音記号特定ステップで特定された発音記号を音声合成用発音記号に変換する変換ステップと、
前記見出し語と同一表記の単語を辞書で一時的に使用不可とする一時抑制ステップと、
前記見出し語と、前記発音記号と、前記音声合成用発音記号と、を前記辞書に登録する登録ステップと、
前記読み上げ箇所を音声合成する音声合成ステップと、
前記一時抑制ステップで一時的に使用不可とされた前記単語を前記辞書で使用可能とする抑制解除ステップと、
を実行させるためのプログラム。
To a computer that reads out electronic dictionary content,
A search step for searching electronic dictionary content based on the entered headword;
A display step of displaying on the display device the headword and the headword explanation information as a search result in the search step;
A phonetic symbol specifying step for specifying a phonetic symbol of the headword of the reading portion that is a part of the explanation information of the headword;
A conversion step of converting the phonetic symbol specified in the phonetic symbol specifying step into a phonetic symbol for speech synthesis;
A temporary suppression step of temporarily disabling words in the same notation as the headword in the dictionary;
A registration step of registering the headword, the phonetic symbol, and the phonetic symbol for speech synthesis in the dictionary;
A speech synthesis step of performing speech synthesis of the reading location;
A suppression release step of making the word temporarily disabled in the temporary suppression step usable in the dictionary;
A program for running
JP2011205175A 2011-09-20 2011-09-20 Information processing apparatus, information processing method and program Withdrawn JP2013068667A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011205175A JP2013068667A (en) 2011-09-20 2011-09-20 Information processing apparatus, information processing method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011205175A JP2013068667A (en) 2011-09-20 2011-09-20 Information processing apparatus, information processing method and program

Publications (1)

Publication Number Publication Date
JP2013068667A true JP2013068667A (en) 2013-04-18

Family

ID=48474463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011205175A Withdrawn JP2013068667A (en) 2011-09-20 2011-09-20 Information processing apparatus, information processing method and program

Country Status (1)

Country Link
JP (1) JP2013068667A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952121A (en) * 2017-03-31 2017-07-14 西南云海大数据产业投资有限公司 Big data internet electronic extension system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952121A (en) * 2017-03-31 2017-07-14 西南云海大数据产业投资有限公司 Big data internet electronic extension system

Similar Documents

Publication Publication Date Title
JP5997217B2 (en) A method to remove ambiguity of multiple readings in language conversion
JP4058071B2 (en) Example translation device, example translation method, and example translation program
CN103026318B (en) Input method editor
JP2003223437A (en) Method of displaying candidate for correct word, method of checking spelling, computer device, and program
JP2008083952A (en) Dictionary creation support system, method and program
JP2011076384A (en) Information output device and information output program
US8165879B2 (en) Voice output device and voice output program
CN113807094A (en) Entity identification method, device and computer readable storage medium
JP2013068667A (en) Information processing apparatus, information processing method and program
KR20120045906A (en) Apparatus and method for correcting error of corpus
JP5300576B2 (en) SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM
JP2019121075A (en) Method for creating summary from audio data in conference
JP2007121584A (en) Learning support device
JP5976255B2 (en) Information providing apparatus and information providing method
JP5398638B2 (en) Symbol input support device, symbol input support method, and program
JP5169602B2 (en) Morphological analyzer, morphological analyzing method, and computer program
JP2022511139A (en) Information processing methods, devices and storage media
JP2007334144A (en) Speech synthesis method, speech synthesizer, and speech synthesis program
JP2007171275A (en) Language processor and language processing method
JP2010211004A (en) Dictionary preparing device, dictionary preparing system, dictionary preparing method, and dictionary preparing program
JP5252209B2 (en) Reading generator
KR20210020980A (en) Method and Apparatus for Searching Keyword Using Keypad
JP2004264960A (en) Example-based sentence translation device and computer program
JPH09185629A (en) Machine translation method
JP4992210B2 (en) Translation device

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20141202