WO2016143420A1

WO2016143420A1 - 提示装置、提示装置の制御方法、および制御プログラム

Info

Publication number: WO2016143420A1
Application number: PCT/JP2016/053260
Authority: WO
Inventors: 康陽福山; 喬弘大川; 伸久中川; 義親飯田; 悟史江口
Original assignee: シャープ株式会社
Priority date: 2015-03-06
Filing date: 2016-02-03
Publication date: 2016-09-15

Abstract

　単語のアクセント型を容易に選択させる。端末装置（１）は、音声出力される単語の音節数または読みの文字数を特定する音節数特定部（１２）と、複数のアクセント型のうち、上記特定された音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示部（１１）と、を備えている

Description

提示装置、提示装置の制御方法、および制御プログラム

　本発明は、音声出力させる単語のアクセントを設定する装置等に関する。

　従来から、単語とそのアクセント位置を登録した辞書を用いて、所定の位置にアクセントを付けて単語を発話させる技術が知られている。また、単語の何れの音節にアクセントを付けるかをユーザに設定させる技術も知られている。例えば、下記の特許文献１には、単語を漢字表記したときの文字数と拍数の組み合わせに応じたアクセント型の候補を表示して、ユーザに所望のアクセント型を選択させる技術が開示されている。また、下記の特許文献２には、個人識別名のアクセント位置の候補をマークで表示してユーザに選択させる技術が開示されている。さらに、下記の特許文献３には、それぞれ異なる位置にアクセント記号を付けた文字列を複数表示させてユーザに選択させる技術が開示されている。

日本国公開特許公報「特開平８－３２０８６４号」（１９９６年１２月３日公開）日本国公開特許公報「特開平１１－１０９９９１号」（１９９９年４月２３日公開）日本国公開特許公報「特開２００６－９８５５２号」（２００６年４月１３日公開）

　しかしながら、特許文献１の技術では、アクセント型の候補を決めるために漢字の文字数と拍数の組み合わせを特定する必要があり、処理が煩雑である。また、漢字以外を構成要素に含む単語への適用が難しい。そして、特許文献２、３の技術では、文字数の増加につれて候補の数が際限なく増加するので、ユーザが候補を選び難いという問題がある。本発明は、上記の問題点に鑑みてなされたものであり、その目的は、単語のアクセント型を容易に選択させることができる提示装置等を提供することにある。

　上記の課題を解決するために、本発明の一態様に係る提示装置は、音声出力される単語に設定するアクセント型の候補をユーザに提示する提示装置であって、上記単語の音節数または読みの文字数を特定する特定部と、複数のアクセント型のうち、上記特定部が特定した音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示部と、を備えている。

　また、本発明の一態様に係る提示装置の制御方法は、上記の課題を解決するために、音声出力される単語に設定するアクセント型の候補をユーザに提示する提示装置の制御方法であって、上記単語の音節数または読みの文字数を特定する特定ステップと、複数のアクセント型のうち、上記特定ステップにて特定した音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示ステップと、を含む。

　本発明の上記各態様によれば、単語のアクセント型を容易に選択させることができるという効果を奏する。

本発明の一実施形態に係る端末装置の要部構成の一例を示すブロック図である。上記端末装置が表示する、単語登録の受け付け画面の一例を示す図である。音節数が２の場合、３の場合、および４以上の場合のそれぞれにおける選択候補の提示例を示す図である。アクセント型を設定する処理の一例を示すフローチャートである。本発明の他の実施形態に係るアクセント型設定システムの要部構成の一例を示すブロック図である。

　〔実施形態１〕
　以下、本発明の実施の形態について、詳細に説明する。まず、本実施形態に係る端末装置（提示装置）１の構成を図１に基づいて説明する。図１は、端末装置１の要部構成の一例を示すブロック図である。端末装置１は、音声発話（音声出力）する機能を備えていると共に、発話する単語のアクセントの型（パターン）をユーザに設定させる機能を備えている。端末装置１は、例えばスマートフォンやタブレット端末のような多機能端末であってもよいし、ユーザとの対話を主機能とする対話ロボットのような装置であってもよい。

　図示のように、端末装置１は、制御部１０、記憶部２０、表示部３０、入力部４０、および音声出力部５０を備えている。制御部１０は端末装置１の動作を統括して制御するものであり、記憶部２０は端末装置１が使用する各種データを格納するものである。また、表示部３０は制御部１０の制御に従って画像を表示するものであり、入力部４０は端末装置１のユーザの入力操作を受け付けて制御部１０に伝達するものである。そして、音声出力部５０は、制御部１０の制御に従って音声を出力するものである。この音声には、ユーザに対する発話も含まれており、つまり、端末装置１は音声発話装置としての機能も有している。なお、端末装置１は、これら以外のブロックを含んでいてもよい。例えば、ユーザの音声入力を受け付ける音声入力部や、他の装置と通信するための通信部等を備えていてもよい。また、これらのブロックの少なくとも一部（制御部１０を除く）を端末装置１の外部に設け、有線または無線で端末装置１と接続することによっても、図示の端末装置１と同様の機能を実現できる。

　また、図示のように、制御部１０には、候補提示部１１、音節数特定部（特定部）１２、単語登録部１３、単語分割部１４、および発話処理部１５が含まれている。そして、記憶部２０には、発話辞書２１が格納されている。

　候補提示部１１は、予め定められた複数のアクセント型のうち、音節数特定部１２が特定した音節数に応じたアクセント型をユーザの選択候補として提示する。また、ここでは、アクセント型を設定する対象となる単語がユーザの呼称（氏名、姓、名、ニックネーム等）であることを想定しているので、候補提示部１１は、ユーザの呼称という種別に応じたアクセント型をユーザの選択候補として提示する。なお、提示する選択候補については後述する。

　音節数特定部１２は、アクセント型を設定する対象となる単語の音節数を特定する。ここでは、単語が日本語であることを想定しており、端末装置１の処理の負荷を少なく抑えてユーザへの速やかなレスポンスを可能にする目的で、音節数を簡易的に判定してもよい。そのため、音節数特定部１２は、単語の文字数をカウントし、その文字数を音節数であると特定する。

　なお、ここで言う「文字数」は、その単語を発音したときの文字数（読みの文字数）であり、単語に漢字が含まれている場合には、ひらがなまたはカタカナに置換して文字数をカウントする。また、例外処理として、所定の種類の文字（撥音、促音、長音）については、１文字（１音節）としてカウントせず、直前の文字と合わせて１文字（１音節）とカウントしてもよい。つまり、上記所定の種類の文字を含む単語については、その所定の種類の文字を除いた文字数を特定する。なお、この例外処理は必須ではなく、撥音、促音、および長音についても、１文字（１音節）としてカウントしてもよい。無論、文字数以外の要素を考慮した解析にて音節を検出することによって音節数を特定してもよい。

　単語登録部１３は、端末装置１に発話させる単語を登録する処理を行う。具体的には、単語登録部１３は、ユーザの入力操作に応じて、単語登録の受け付け画面を表示部３０に表示させ、この画面にて入力された単語を、端末装置１に発話させる単語として取得する。単語登録の受け付け画面は、ユーザに単語の入力を促す画面であればよく、特に限定されないが、例えば図２のような画面であってもよい。図２は、単語登録の受け付け画面の一例を示す図である。

　図示の例では、ユーザの名前の入力を促す文字列（名前を教えよう）が表示されている。つまり、単語登録部１３は、端末装置１に発話させる単語として、端末装置１（より詳細には端末装置１で動作する所定のプログラム）が、ユーザに呼びかけるときの名前（呼称）の入力を受け付ける。このように、単語登録部１３は、ユーザの名前（呼称）という所定の種別の単語を入力させるので、端末装置１に発話させる単語として、所定の種別の単語を取得していると言える。

　また、図示の例では、名前の入力を受け付けて、受け付けた名前を表示する領域が表示されている。同図は、表示部３０がタッチパネルで構成されており、表示面が入力部４０を兼ねている場合の画面例を示しており、上記領域にタッチすることによって、文字列を入力することができることを想定している。図示の例では、この領域に「なおき」との名前が入力されている。なお、名前の下には入力可能な文字数の上限値（ひらがな１６文字）が示されているが、文字数の制限、および制限文字数の表示は必須ではない。

　さらに、図示の例では、入力された名前のアクセント型の設定を開始するための選択項目（名前の呼びかたを選ぶ）が表示されている。この項目が選択されると、単語登録部１３は、候補提示部１１に指示して、入力された名前のアクセント型の候補を提示させる。そして、入力された名前に候補から選択されたアクセント型を設定し、設定したアクセント型と共に発話辞書２１に登録する。これにより、登録した呼称が設定したアクセントで発話されるようになる。

　単語分割部１４は、単語登録部１３が入力を受け付けた単語が複数の単語を複合した単語である場合に、それらの個別の単語に分割する。例えば、「東京タワー」が入力された場合、単語分割部１４は、これを「東京」と「タワー」に分割する。分割によって得られた単語には、個別にアクセント型を設定することができる。

　発話処理部１５は、音声発話に関する各種処理を行う。具体的には、発話処理部１５は、発話内容を決定し、決定した発話内容の音声データを生成し、生成した音声データを音声出力部５０に送信して音声出力させる。この際、発話処理部１５は、発話辞書２１を参照して、これに規定されているアクセント型で音声出力を行わせる。

　発話辞書２１は、上述のように、発話処理部１５が音声発話の際に参照する辞書であり、単語登録部１３が登録した単語（ユーザの呼称）の他にも、様々な単語のアクセント型が規定されている。

　〔音節数に応じた選択候補の提示〕
　続いて、音節数に応じた選択候補の提示について、図３に基づいて説明する。図３は、音節数が２の場合、３の場合、および４以上の場合のそれぞれにおける選択候補の提示例を示す図である。なお、この画面は、図２の画面例において、アクセント型の設定を開始するための選択項目（名前の呼びかたを選ぶ）を選択したときに表示される。

　図３の（ａ）の例では、「みわ」という名前が入力されている。この名前（単語）は、２文字であるから２音節であると特定される。図示の例では、この２音節の単語について、おすすめ、呼びかた１、および呼びかた２の３つの選択候補が提示されている。このうち、「おすすめ」は、デフォルトのアクセント型を選択するための選択候補である。なお、デフォルトのアクセント型は、ユーザがアクセント型を選択していない場合に、発話処理部１５が使用するアクセント型である。なお、「おすすめ」としてどのようなアクセント型を設定するかは任意であり、また、「おすすめ」の提示は必須ではない。

　呼びかた１は、同図に音の強弱を示す波形で表されているように、先頭の音節にアクセントがあるアクセント型である。このため、以下では、呼びかた１のアクセント型を頭高型と呼ぶ。また、呼びかた２は、同図に波形で示されているように、末尾の音節にアクセントがあるアクセント型である。このアクセント型で発音した場合、一音節目が弱く発音され、２音節目から末尾までは平板な発音となるため、以下では、呼びかた２のアクセント型を平板型と呼ぶ。

　ユーザは、これらの選択候補の中から所望のものを選択し（チェックボックスにチェックを入れ）、選択を確定させる（「次へ」をタッチする）ことにより、自分の呼称（入力した単語）のアクセント型を、その選択候補のアクセント型に設定することができる。なお、この画面において所定の入力操作を行うことにより、各選択候補のアクセント型で発音した音声を試聴できるようにしてもよい。

　次に、図３の（ｂ）の例では、「なおき」という名前が入力されている。この名前（単語）は、３文字であるから３音節であると特定される。図示の例では、この３音節の単語について、おすすめ、呼びかた１、呼びかた２、および呼びかた３の４つの選択候補が提示されている。おすすめおよび呼びかた１は、同図の（ａ）の例と同様である。

　図３の（ｂ）の呼びかた２は、同図に音の強弱を示す波形で表されているように、中央の音節（文字）にアクセントがあるアクセント型である。このため、以下では、呼びかた２のアクセント型を中高型と呼ぶ。図３の（ｂ）の呼びかた３は、同図の（ａ）の呼びかた２と同じく平板型である。

　次に、図３の（ｃ）の例では、「こうたろう」という名前が入力されている。この名前（単語）は、５文字であり、５音節であるから、４音節以上であると特定される。図示の例では、この４音節以上の単語について、同図の（ｂ）の例と同じく、おすすめ、呼びかた１（頭高型）、呼びかた２（中高型）、および呼びかた３（平板型）の４つの選択候補が提示されている。ここで、４音節以上の単語には、先頭の音節および末尾の音節を除いた、中間部の音節が複数存在するので、単語登録部１３は、中高型が選択された場合、このような複数の中間部の音節のうち、中央に位置する音節にアクセントを設定する。つまり、中高型は、先頭および末尾の音節を除いた、中間部分の音節のうち何れか１つにアクセントがある各アクセント型に対応する１つの選択候補である。例えば、「こうたろう」の例では、「う」「た」「ろ」の３つの音節が存在するが、これらの中央に位置する「た」にアクセントを設定する。

　なお、この例のように音節数が奇数であれば中央の音節が１つに定まるが、偶数であれば中央の音節が２つとなる。このような場合には、単語登録部１３は、その中央の２つの音節のうち前寄りの音節にアクセントを設定する。つまり、中高型は、音節数が奇数であればその中央の音節にアクセントを設定し、偶数であればその中央の２つの音節のうち前寄りの音節にアクセントを設定するアクセント型である。ただし、中高型が選択された場合に、何れの音節（あるいは文字）にアクセントを設定するかは、アクセントの設定対象の単語の種別等に応じて決定すればよく、上記の例に限られない。例えば、中央の２つの音節のうち後寄りの音節にアクセントを設定してもよい。

　また、ここでは、音節数を示す数値として文字数を用いるから、頭高型では先頭の文字に、中高型では中央または中央前寄りの文字に、平板型では末尾の文字に、それぞれアクセントを設定する。そして、アクセントを設定する位置の文字が所定の文字（撥音、促音、長音）の場合、これらの文字にアクセントを設定してもよいし、これらの文字の直前の文字にアクセントを設定してもよい。

　また、図３には示していないが、一音節の名前（単語）が入力された場合、その音節にアクセントが設定されたアクセント型を選択候補として提示してもよい。このアクセント型は、頭高型、中高型、平板型の何れであるとも言える。また、上述のように、おすすめの選択項目の提示は任意であるから、この場合には、選択候補を１つ提示してもよい。

　このように、端末装置１の候補提示部１１は、予め定められた、頭高型、中高型、平板型、およびおすすめ（デフォルト）の４種類のアクセント型のうち、単語の音節数に応じた少なくとも１つのアクセント型を選択候補として提示する。これにより、文字数の多い単語のアクセント型を容易に設定させることができる。

　また、本例では、ユーザの名前（称呼）を入力させているので、人を称呼する際に適用される頻度の低いアクセント型である尾高型（末尾から２番目の音節にアクセントを設定した型）を選択候補から外している。言い換えれば、先頭、中央部、および末尾の何れかの音節にアクセントが設定されたアクセント型（頭高型、中高型、平板型）を、末尾から２番目の音節にアクセントを設定したアクセント型（尾高型）に優先して、上記選択候補として提示している。これにより、提示される選択候補が、人の称呼に適したものに絞られるので、ユーザは適切な選択候補を容易に選択することができる。なお、動物やキャラクター等の称呼も、人の称呼と同様であるから、動物やキャラクター等の称呼として入力された単語についても、同様の選択候補を提示すればよい。つまり、称呼（人の称呼と人以外の称呼とを含む）に分類される単語については、同じ基準で選択候補を決定し、提示すればよい。

　また、ここでは、優先度の低い尾高型を選択候補から外す例を説明したが、尾高型も選択候補に加えてもよい。ただし、この場合には、何れかの音節にアクセントが設定されたアクセント型の方をユーザが選択し易いように提示することが好ましい。例えば、頭高型、中高型、平板型を上側に、尾高型を下側に表示してもよい。また、例えば、頭高型、中高型、平板型を最初に表示し、尾高型は表示をスクロールする、あるいは切り替える、等の入力操作が行われたときに表示してもよい。この他、表示色や表示サイズ等の表示態様を変えることによって、適切な選択候補（この例では頭高型、中高型、平板型）を選択し易くしてもよい。また、アクセント型を設定する単語の種別によっては、尾高型以外の選択候補（頭高型、中高型、および平板型の少なくとも何れか）を選択候補から外す、あるいは尾高型を優先的に提示する選択候補に含める構成としてもよい。

　〔処理の流れ〕
　次に、端末装置１が単語のアクセント型を設定する処理（提示装置の制御方法）の流れを図４に基づいて説明する。図４は、アクセント型を設定する処理の一例を示すフローチャートである。まず、単語登録部１３は、アクセント型を設定する対象となる単語を取得する（Ｓ１）。そして、単語登録部１３は、取得した単語を音節数特定部１２に送信する。ここでは、例えば、図２の例のような画面を表示させることによってユーザに入力させた単語を取得してもよい。

　なお、取得した単語が複数の単語を複合している場合、単語登録部１３は、その単語を単語分割部１４に分割させ、分割によって生成された単語を取得してもよい。また、単語登録部１３は、取得した単語のアクセント型が発話辞書２１に登録されているか確認し、登録されていないことが確認された場合に、その単語を音節数特定部１２に送信してもよい。つまり、取得した単語に既にアクセント型が登録されている場合には、そのアクセント型を適用し、登録されていない場合には、以下説明するＳ２以降の処理で選択候補を提示してユーザに選択させてもよい。

　単語登録部１３から単語を受信した音節数特定部１２は、受信した単語の音節数を特定して（Ｓ２、特定ステップ）、特定した音節数を候補提示部１１に通知する。そして、候補提示部１１は、通知された音節数が１であるか判定する（Ｓ３）。Ｓ３において通知された音節数が１であると判定された場合（Ｓ３でＹＥＳ）、候補提示部１１は、その旨を単語登録部１３に通知し、この通知を受信した単語登録部１３は、その１つの音節にアクセントを設定して（Ｓ４）、発話辞書２１に登録し、処理を終了する。一方、通知された音節数が１ではなかった場合（Ｓ３でＮＯ）、候補提示部１１は、通知された音節数が２であるか判定する（Ｓ５）。

　Ｓ５において通知された音節数が２であると判定された場合（Ｓ５でＹＥＳ）、候補提示部１１は、頭高型と平板型を選択候補とすることを決定し、これらの選択候補を表示部３０に表示させてユーザに提示する（Ｓ６、候補提示ステップ）。なお、これらの選択候補に加えて、デフォルトのアクセント型を選択するための選択候補として「おすすめ」を提示してもよく、この場合、例えば図３の（ａ）のような画面が表示される。

　一方、Ｓ５において、通知された音節数が２ではないと判定された場合（Ｓ５でＮＯ）、すなわち音節数が３以上である場合には、候補提示部１１は、頭高型、中高型、および平板型を選択候補とすることを決定する。そして、これらの選択候補を表示部３０に表示させてユーザに提示する（Ｓ７、候補提示ステップ）。Ｓ７においても、選択候補に「おすすめ」を含めてもよく、この場合、例えば図３の（ｂ）または（ｃ）のような画面が表示される。そして、提示した選択候補から何れかのアクセント型が選択されると、単語登録部１３は、Ｓ１で取得した単語のアクセント型を、選択されたアクセント型に設定して（Ｓ８）、発話辞書２１に登録し、処理を終了する。

　〔実施形態２〕
　本発明の他の実施形態について、図５に基づいて説明する。なお、説明の便宜上、前記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。上記実施形態では、端末装置１がアクセント型の選択候補を決定する例を説明したが、本実施形態では、サーバがアクセント型の選択候補を決定して、決定した選択候補を端末装置に表示させるシステムの例を説明する。図５は、本実施形態に係るアクセント型設定システム３００の要部構成の一例を示すブロック図である。図示のように、アクセント型設定システム３００には、端末装置（音声発話装置）１００とサーバ（提示装置）２００が含まれている。

　アクセント型設定システム３００は、端末装置１００が取得した単語のアクセント型の選択候補をサーバ２００が決定し、決定した選択候補を端末装置１００に表示させるシステムである。

　端末装置１００は、アクセント型の選択候補をサーバ２００に決定させる点を除けば、端末装置１と概ね同様の構成である。図示のように、端末装置１００は、通信部１２０を備え、制御部１１０には単語登録部１１１が含まれている。

　通信部１２０は、端末装置１００が他の装置（ここではサーバ２００）と通信するためのものである。また、単語登録部１１１は、単語登録部１３と同様に、端末装置１００に発話させる単語を登録する処理を行う。ただし、取得した単語をサーバ２００に送信する点、およびサーバ２００から通知された選択候補を表示部３０に表示させる点で単語登録部１３と相違している。

　サーバ２００は、端末装置１００から取得した単語のアクセント型の選択候補を決定し、これを端末装置１００に送信することによって、端末装置１００のユーザに提示する。図示のように、サーバ２００は、サーバ２００の動作を統括して制御する制御部２１０と、サーバ２００が他の装置（ここでは端末装置１００）と通信するための通信部２３０とを備えている。また、制御部２１０には候補提示部２１１、音節数特定部（特定部）２１２、および単語取得部２１３が含まれる。

　候補提示部２１１は、予め定められた複数のアクセント型のうち、音節数特定部２１２が特定した音節数に応じたアクセント型をユーザの選択候補として決定する。そして、決定した選択候補を、通信部２３０を介して端末装置１００に通知することにより、端末装置１００のユーザに提示する。なお、候補提示部２１１が選択候補を決定する手法は、上記実施形態の候補提示部１１と同様である。

　音節数特定部２１２は、音節数特定部１２と同様にして、アクセント型を設定する対象となる単語の音節数（文字数）を特定する。また、単語取得部２１３は、端末装置１００がサーバ２００に送信した単語、すなわち、アクセント型を設定する対象となる単語を取得し、音節数特定部２１２に転送する。

　〔処理の流れ〕
　以上の構成を備えるアクセント型設定システム３００では、まず、端末装置１００の単語登録部１１１が、例えば図２のような単語登録の受け付け画面を表示部３０に表示させて単語の入力を受け付ける。そして、単語登録部１１１は、入力された単語を、通信部１２０を介してサーバ２００に送信する。なお、上記実施形態と同様に、取得した単語が複数の単語を複合している場合にはその単語を単語分割部１４に分割させてもよい。また、入力された単語のアクセント型が発話辞書２１に登録されていないことが確認された場合に、その単語をサーバ２００に送信してもよい。

　なお、単語を受信した後の処理（提示装置の制御方法）は図４の例と概ね同様であるから、以下では図４に基づいて説明する。サーバ２００の単語取得部２１３は、端末装置１００がサーバ２００に送信した単語を取得し（Ｓ１）、取得した単語を音節数特定部２１２に送信する。次に、音節数特定部２１２がその単語の音節数を特定し（Ｓ２、特定ステップ）、特定した音節数を候補提示部２１１に通知する。

　ここで、特定された音節数が１であれば（Ｓ２でＹＥＳ）、候補提示部２１１は、その旨を端末装置１００に通知する。そして、この通知を受信した端末装置１００では、単語登録部１１１が、その１つの音節にアクセントを設定して（Ｓ４）、発話辞書２１に登録し、処理を終了する。このように、入力された単語の音節が１つである場合には、選択候補を決定する必要がない。よって、端末装置１００の単語登録部１１１は、入力された単語の音節が１つであるか否かを判定し、１つではないことが確認された場合に、その単語をサーバ２００に送信してもよい。

　一方、特定された音節数が２であれば（Ｓ２でＮＯ、Ｓ５でＹＥＳ）、候補提示部２１１は、頭高型と平板型を選択候補とすることを決定し、これらの選択候補を端末装置１００に通知する。そして、この通知を受信した端末装置１００では、単語登録部１１１が、通知された選択候補を表示部３０に表示させてユーザに提示する（Ｓ６、候補提示ステップ）。

　また、特定された音節数が３以上であれば（Ｓ２でＮＯ、Ｓ５でＮＯ）、候補提示部２１１は、頭高型、中高型、および平板型を選択候補とすることを決定し、これらの選択候補を端末装置１００に通知する。そして、この通知を受信した端末装置１００では、単語登録部１１１が、通知された選択候補を表示部３０に表示させてユーザに提示する（Ｓ７、候補提示ステップ）。なお、サーバ２００にも発話辞書を格納しておき、候補提示部２１１は、発話辞書にアクセント型が登録されている単語については、そのアクセント型を、例えば「おすすめ」として選択候補に含めてもよい。

　また、候補提示部２１１は、決定した選択候補を示す情報（例えば各選択候補のアクセント型を示すコード）を端末装置１００に送信することによって選択候補を通知してもよく、この場合には、図３のような画面は単語登録部１１１が生成して表示させればよい。また、候補提示部２１１が、図３のような画面（画像）を端末装置１００に送信してもよく、この場合には、単語登録部１１１は受信した画面（画像）を表示させればよい。

　この後、提示した選択候補から何れかのアクセント型が選択されると、端末装置１００の単語登録部１１１は、取得した単語のアクセント型を、選択されたアクセント型に設定して（Ｓ８）、発話辞書２１に登録し、処理を終了する。

　なお、上記の例では端末装置１００がアクセント型の登録を行っているが、サーバ２００がアクセント型を登録してもよい。この場合、端末装置１００は、選択されたアクセント型をサーバ２００に通知し、サーバ２００は通知されたアクセント型を登録する。そして、この場合、サーバ２００は、登録したアクセント型、あるいは該アクセント型で単語を発音した音声データを、端末装置１００または他の装置に通知することによって発話させてもよい。

　〔実施形態３〕
　上記各実施形態では、ユーザに入力させた単語を取得する例を説明したが、アクセント型を設定する対象とする単語の取得方法は特に限定されない。例えば、発話処理部１５がテキストの読み上げ機能を備えている場合、読み上げ対象のテキストから単語を取得してもよい。この場合、読み上げ対象のテキストを形態素解析する等により、単語を取得することが可能である。また、この場合、読み上げ対象のテキストに含まれる単語のうち、発話辞書２１にアクセント型が登録されていない単語を選択的に取得してもよい。そして、読み上げ対象のテキストに含まれる単語のうち、発話辞書２１にアクセント型が登録されていない単語をユーザに提示して、ユーザが選択した単語を取得してもよい。

　さらに、例えば、マイク等で取得した音声を音声認識処理に供して得たテキストから単語を取得してもよい。この他にも、端末装置１または１００が音声出力した単語を取得してもよく、この場合、ユーザがその音声出力に対して所定の応答を行ったときに、単語を取得してもよい。例えば、端末装置１または１００による「草食男子」との音声出力に続いて、ユーザがそのアクセントの誤りを指摘する発話（例えば、「今の発音はおかしい」等）が行われたことを検出したときに、「草食男子」の単語を取得してもよい。これにより、端末装置１または１００と対話する感覚で、端末装置１または１００の発音（アクセントの設定）をユーザの好みに合うように調整していくことができる。

　また、上記各実施形態では、表示部３０への表示によって選択候補を提示する例を説明したが、ユーザへの提示の態様はこの例に限られない。例えば、音声で選択候補を提示してもよい。この場合、選択候補のアクセント型を適用して対象の単語を音声出力する処理を、各選択候補のそれぞれについて順次行えばよい。

　さらに、上記各実施形態では、ユーザに所定の種別（具体的には称呼）の単語の入力を促すことにより、その種別の単語を取得する例を説明したが、単語の種別は端末装置１または１００で特定してもよい。そして、特定した種別に応じた選択候補を提示してもよい。例えば、取得した単語が発話辞書２１に登録されている場合、その文法情報からその単語の種別を特定してもよい。なお、所定の種別は、その種別の単語におけるアクセント型に一定の傾向（例えば平板型が少ない、尾高型が少ない等）がある種別であればよく、ユーザの名前や称呼に限られない。

　また、上記各実施形態では、端末装置１または１００が音声発話装置として機能する例を説明したが、端末装置１または１００にて設定されたアクセント型で発話する音声発話装置は、端末装置１または１００と別の装置であってもよい。

　〔ソフトウェアによる実現例〕
　端末装置１、１００の制御ブロック（特に制御部１０および１１０）、ならびにサーバ２００の制御ブロック（特に制御部２１０）は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ＣＰＵ（Central Processing Unit）を用いてソフトウェアによって実現してもよい。

　後者の場合、端末装置１、１００、およびサーバ２００は、各機能を実現するソフトウェアであるプログラムの命令を実行するＣＰＵ、上記プログラムおよび各種データがコンピュータ（またはＣＰＵ）で読み取り可能に記録されたＲＯＭ（Read Only Memory）または記憶装置（これらを「記録媒体」と称する）、上記プログラムを展開するＲＡＭ（Random Access Memory）などを備えている。そして、コンピュータ（またはＣＰＵ）が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

　〔まとめ〕
　本発明の態様１に係る提示装置（端末装置１、サーバ２００）は、音声出力される単語に設定するアクセント型の候補をユーザに提示する提示装置であって、上記単語の音節数または読みの文字数を特定する特定部（音節数特定部１２、２１２）と、複数のアクセント型のうち、上記特定部が特定した音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示部（１１、２１１）と、を備えていることを特徴としている。

　上記の構成によれば、複数のアクセント型のうち、音節数または読みの文字数に応じたアクセント型をユーザの選択候補として提示するので、単語の音節数または読みの文字数に応じた適切な選択候補を提示することが可能になる。また、提示される選択候補の数は、複数のアクセント型の範疇に収まるから、ユーザの選択肢が増えすぎることがない。従って、単語のアクセント型を容易に選択させることができるという効果を奏する。

　なお、上記候補提示部は、上記選択候補がユーザに提示されるように制御するものであればよく、選択候補をユーザに提示するハードウェアは、上記提示装置が備えていてもよいし、上記提示装置の外部に存在するものであってもよい。例えば、提示装置がユーザと対面しており、かつ、上記ハードウェアを備えている場合には、提示装置が備える当該ハードウェアで選択候補を提示してもよい。また、例えば、提示装置がユーザと対面していない場合や、上記ハードウェアを備えていない場合には、そのようなハードウェアを備える他の装置に選択候補を提示させてもよい。

　本発明の態様２に係る提示装置は、上記態様１において、上記特定部は、上記単語の読みの文字数を特定し、上記候補提示部は、予め定められた複数のアクセント型のうち、上記特定部が特定した読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示することを特徴としている。

　上記の構成によれば、単語の読みの文字数を特定して選択候補を提示するので、選択候補の提示のために、例えば背景技術に記載した特許文献１のような複雑な処理や解析を行う必要がない。よって、提示装置の処理の負荷を少なく抑えることができ、これにより、ユーザへの速やかなレスポンスも可能になる。

　本発明の態様３に係る提示装置は、上記態様２において、上記特定部は、上記単語に所定の種類（撥音、促音、長音）の文字が含まれる場合、当該所定の種類の文字を除いた文字数を特定することを特徴としている。

　上記の構成によれば、特定部が特定する単語の読みの文字数を、単語を解析して特定した音節数に近付けることができる。つまり、単語の読みの文字数を特定するという簡易な処理で、文字数以外の要素を考慮した解析で音節数を特定する場合と近い数値を得ることができる。よって、上記の構成によれば、簡易な構成で妥当な選択候補を提示することが可能になる。

　本発明の態様４に係る提示装置は、上記態様１から３の何れかにおいて、上記候補提示部は、上記特定部が特定した音節数または文字数が４以上である場合、先頭の音節または文字と、末尾の音節または文字とを除いた、複数の音節または文字のうち何れか１つにアクセントがある各アクセント型に対応する選択候補（中高型の選択候補）を提示することを特徴としている。

　上記の構成によれば、先頭と末尾の音節または文字とを除いた複数の音節または文字のうち何れか１つにアクセントがある各アクセント型が１または複数の選択候補に集約される。よって、音節数または文字数が４以上の比較的長い単語についても、選択候補の数を増やすことなく妥当なアクセント型をユーザに選択させることが可能になる。

　本発明の態様５に係る提示装置は、上記態様４において、上記候補提示部は、上記特定部が特定した音節数または文字数が奇数であれば、その中央の音節または文字にアクセントがあるアクセント型を上記選択候補として提示し、偶数であれば、その中央の２つの音節または文字の何れかにアクセントがあるアクセント型（中高型）を上記選択候補として提示することを特徴としている。

　上記の構成によれば、単語の中央部の音節または文字にアクセントがあるアクセント型を選択候補として提示する。ここで、先頭および末尾の音節または文字を除いた音節にアクセントがある単語については、その中央付近にアクセントが来ることが多い。また、中央付近にアクセントが来ない場合であっても、中央付近にアクセントを設定しておけば、正しいアクセント位置からの乖離を必要最小限に抑えることができる。つまり、上記の構成によれば、適切なアクセント型、あるいは違和感の少ないアクセント型をユーザに選択させることができる。

　本発明の態様６に係る提示装置は、上記態様１から５の何れかにおいて、上記候補提示部は、先頭、中央部、または末尾の音節または文字にアクセントが設定されたアクセント型（頭高型、中高型、平板型）を、末尾から２番目の音節にアクセントが設定されたアクセント型（尾高型）に優先して、上記選択候補として提示することを特徴としている。この構成は、末尾から２番目の音節にアクセントが設定されることが少ない単語（例えば呼称等）のアクセント型の設定に有効である。

　本発明の態様７に係る提示装置の制御方法は、音声出力される単語に設定するアクセント型の候補をユーザに提示する提示装置の制御方法であって、上記単語の音節数または読みの文字数を特定する特定ステップ（Ｓ２）と、複数のアクセント型のうち、上記特定ステップにて特定した音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示ステップ（Ｓ６、Ｓ７）と、を含むことを特徴としている。上記の構成によれば、上記提示装置と同様の作用効果を奏する。

　本発明の各態様に係る提示装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記提示装置が備える各部（ソフトウェア要素）として動作させることにより上記提示装置をコンピュータにて実現させる提示装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

　本発明は、音声発話装置が発話する単語のアクセント型の設定に利用可能である。

　　１　端末装置（提示装置、音声発話装置）
　１１　候補提示部
　１２　音節数特定部（特定部）
１００　端末装置（音声発話装置）
２００　サーバ（提示装置）
２１１　候補提示部
２１２　音節数特定部（特定部）

Claims

　音声出力される単語に設定するアクセント型の候補をユーザに提示する提示装置であって、
　上記単語の音節数または読みの文字数を特定する特定部と、
　複数のアクセント型のうち、上記特定部が特定した音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示部と、を備えていることを特徴とする提示装置。
　上記特定部は、上記単語に所定の種類の文字が含まれる場合、当該所定の種類の文字を除いた文字数を特定することを特徴とする請求項１に記載の提示装置。
　上記候補提示部は、上記特定部が特定した音節数または文字数が４以上である場合、先頭の音節または文字と、末尾の音節または文字とを除いた、複数の音節または文字のうち何れか１つにアクセントがある各アクセント型に対応する選択候補を提示することを特徴とする請求項１または２に記載の提示装置。
　上記候補提示部は、上記特定部が特定した音節数または文字数が奇数であれば、その中央の音節または文字にアクセントがあるアクセント型を上記選択候補として提示し、偶数であれば、その中央の２つの音節または文字の何れかにアクセントがあるアクセント型を上記選択候補として提示することを特徴とする請求項１から３の何れか１項に記載の提示装置。
　上記候補提示部は、先頭、中央部、または末尾の音節または文字にアクセントが設定されたアクセント型を、末尾から２番目の音節にアクセントが設定されたアクセント型に優先して、上記選択候補として提示することを特徴とする請求項１から４の何れか１項に記載の提示装置。
　音声出力される単語に設定するアクセント型の候補をユーザに提示する提示装置の制御方法であって、
　上記単語の音節数または読みの文字数を特定する特定ステップと、
　複数のアクセント型のうち、上記特定ステップにて特定した音節数または読みの文字数に応じた１または複数のアクセント型をユーザの選択候補として提示する候補提示ステップと、を含むことを特徴とする提示装置の制御方法。
　請求項１から５の何れか１項に記載の提示装置としてコンピュータを機能させるための制御プログラムであって、上記特定部および上記候補提示部としてコンピュータを機能させるための制御プログラム。