JP6597156B2 - Information generation system - Google Patents
Information generation system Download PDFInfo
- Publication number
- JP6597156B2 JP6597156B2 JP2015203864A JP2015203864A JP6597156B2 JP 6597156 B2 JP6597156 B2 JP 6597156B2 JP 2015203864 A JP2015203864 A JP 2015203864A JP 2015203864 A JP2015203864 A JP 2015203864A JP 6597156 B2 JP6597156 B2 JP 6597156B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- character string
- character strings
- guidance
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、案内音声から情報を生成する技術に関する。 The present invention relates to a technique for generating information from guidance voice.
発話音声に対する音声認識の結果に応じて各種の情報を利用者に提供する技術が従来から提案されている。例えば、特許文献1には、利用者の発話音声に対する音声認識を実行して、音声認識の結果として特定された目標地点を中心として地図の表示領域や表示縮尺等を指示する構成が開示されている。
Techniques have been conventionally proposed that provide various types of information to users according to the results of speech recognition for uttered speech. For example,
ところで、例えばショッピングモール等の商業施設で放送される案内音声を音声認識し、認識結果の文字列やその翻訳文等の関連情報を施設の来場者の端末装置に提供できれば、案内音声の聴取が困難な難聴者や案内音声の言語を理解できない外国人にとって便利である。しかし、完全な音声認識の実現は実際には困難であり、例えば個々の発話者に特有の発話の特徴(くせ)や収音時の背景雑音等に起因して誤認識が発生する場合がある。以上の事情を考慮して、本発明は、案内音声に応じた適正な関連情報を利用者に提供することを目的とする。 By the way, for example, if the guidance voice broadcast in a commercial facility such as a shopping mall can be recognized and related information such as a character string of the recognition result and its translation can be provided to the terminal device of the facility visitor, the guidance voice can be heard. Useful for people who have difficulty hearing or who cannot understand the language of the guidance voice. However, it is actually difficult to realize complete speech recognition. For example, erroneous recognition may occur due to utterance characteristics peculiar to individual speakers or background noise at the time of sound collection. . In view of the above circumstances, an object of the present invention is to provide a user with relevant information appropriate to a guidance voice.
以上の課題を解決するために、本発明に係る情報生成システムは、案内音声に関連する関連情報を端末装置が利用者に提示するために当該端末装置に送信される配信情報を生成するシステムであって、案内音声に対する音声認識で解析された複数の認識文字列の各々について、相異なる発音内容を表す複数の登録文字列のうち認識文字列に類似する当該登録文字列を特定する文字列特定部と、複数の登録文字列の相異なる組合せを指定する複数の対応情報のうち、文字列特定部が特定した複数の登録文字列の組合せに対応する対応情報に応じた関連情報を端末装置が利用者に提示するための配信情報を生成する情報生成部とを具備する。以上の構成では、複数の登録文字列のうち、案内音声に対する音声認識で解析された認識文字列に類似する登録文字列が特定される。したがって、案内音声に対する音声認識で解析された複数の認識文字列に応じた関連情報を利用者に提示するための配信情報を生成する構成と比較して、音声認識の誤認識の影響を含まない関連情報を利用者に提示するための配信情報を生成することが可能である。また、複数の登録文字列の相異なる組合せを指定する対応情報に応じた関連情報を端末装置が利用者に提示するための配信情報が生成されるので、文字列特定部が特定した複数の登録文字列に応じた関連情報を利用者に提示するための配信情報を生成する構成と比較して、案内者が例えば文単位で案内音声の発音を誤った場合(例えば、必要な文の発音を忘れた場合や不要な文を発音した場合)でも、案内音声の認識結果から特定される複数の登録文字列の組合せに対応する対応情報に応じた適切な関連情報を利用者に提示するための配信情報を生成することが可能である。 In order to solve the above problems, an information generation system according to the present invention is a system that generates distribution information transmitted to a terminal device so that the terminal device presents related information related to the guidance voice to the user. In addition, for each of a plurality of recognized character strings analyzed by voice recognition for the guidance voice, a character string specification that identifies the registered character string that is similar to the recognized character string among a plurality of registered character strings that represent different pronunciation contents And the terminal device provides related information corresponding to the correspondence information corresponding to the combination of the plurality of registered character strings specified by the character string specifying unit among the plurality of pieces of correspondence information designating different combinations of the plurality of registered character strings. An information generation unit that generates distribution information to be presented to the user. In the above configuration, a registered character string similar to a recognized character string analyzed by voice recognition for the guidance voice is specified from among a plurality of registered character strings. Therefore, it does not include the influence of misrecognition of voice recognition, compared with a configuration that generates distribution information for presenting related information according to a plurality of recognized character strings analyzed by voice recognition to the guidance voice. It is possible to generate distribution information for presenting related information to the user. In addition, since distribution information for the terminal device to present to the user related information corresponding to correspondence information specifying different combinations of a plurality of registered character strings is generated, a plurality of registrations specified by the character string specifying unit Compared to a configuration that generates distribution information for presenting relevant information according to a character string to the user, for example, when the guide mispronounces the guidance voice in units of sentences (for example, to pronounce the necessary sentences) For presenting appropriate related information according to the corresponding information corresponding to the combination of multiple registered character strings specified from the recognition result of the guidance voice, even when forgetting or when an unnecessary sentence is pronounced) Distribution information can be generated.
本発明の好適な態様において、情報生成部は、各対応情報について用意された複数の案内文のうち、文字列特定部が特定した複数の登録文字列の組合せに対応する対応情報の案内文を示す関連情報を端末装置が利用者に提示するための配信情報を生成する。以上の構成では、文字列特定部が特定した複数の登録文字列の組合せに対応する対応情報の案内文を示す関連情報を端末装置が利用者に提示するための配信情報が生成される。したがって、対応情報が指定する登録文字列の組合せとは独立に用意された案内文を示す関連情報を利用者に提示するための配信情報を生成することが可能である。 In a preferred aspect of the present invention, the information generation unit generates a guide sentence of correspondence information corresponding to a combination of a plurality of registered character strings specified by the character string specifying part among a plurality of guide sentences prepared for each piece of correspondence information. Distribution information for the terminal device to present the related information to be shown to the user is generated. In the above configuration, distribution information is generated for the terminal device to present related information indicating the guidance text of the corresponding information corresponding to the combination of the plurality of registered character strings specified by the character string specifying unit to the user. Therefore, it is possible to generate distribution information for presenting the user with related information indicating a guide sentence prepared independently of the combination of registered character strings designated by the correspondence information.
本発明の好適な態様において、情報生成部は、文字列特定部が特定した複数の登録文字列の組合せに対応する対応情報が指定する複数の登録文字列を示す関連情報を端末装置が利用者に提示するための配信情報を生成する。以上の構成では、対応情報が指定する複数の登録文字列を示す関連情報を端末装置が利用者に提示するための配信情報が生成される。したがって、文字列特定部が特定した複数の登録文字列の組合せに対応する対応情報の案内文を示す関連情報を利用者に提示するための配信情報を生成する構成と比較して、案内文を一意に指定するための情報が不要になるという利点がある。 In a preferred aspect of the present invention, the information generation unit is configured such that the terminal device displays related information indicating a plurality of registered character strings specified by correspondence information corresponding to a combination of a plurality of registered character strings specified by the character string specifying unit. To generate distribution information for presentation. With the above configuration, distribution information for the terminal device to present related information indicating a plurality of registered character strings designated by the correspondence information to the user is generated. Therefore, in comparison with the configuration for generating the distribution information for presenting the related information indicating the guidance text of the corresponding information corresponding to the combination of the plurality of registered character strings identified by the character string identification section, the guidance text is There is an advantage that information for uniquely specifying is unnecessary.
本発明の好適な態様において、対応情報は、複数の登録文字列の組合せと、当該組合せに係る複数の登録文字列の順序とを指定し、情報生成部は、対応情報が指定する順序で配列された複数の登録文字列を示す関連情報を端末装置が利用者に提示するための配信情報を生成する。以上の構成では、対応情報が指定する順序で配列された複数の登録文字列を示す関連情報を端末装置が利用者に提示するための配信情報が生成される。したがって、案内音声を構成する複数の文の発音の順序に関わらず、対応情報があらかじめ指定した順序で配列された複数の登録文字列を示す関連情報を利用者に提示するための配信情報を生成することが可能である。 In a preferred aspect of the present invention, the correspondence information specifies a combination of a plurality of registered character strings and an order of the plurality of registered character strings related to the combination, and the information generation unit is arranged in the order specified by the correspondence information The terminal device generates distribution information for presenting the relevant information indicating the plurality of registered character strings to the user. In the above configuration, distribution information for the terminal device to present related information indicating a plurality of registered character strings arranged in the order designated by the correspondence information to the user is generated. Therefore, regardless of the order of pronunciation of the plurality of sentences constituting the guidance voice, the distribution information for presenting the related information indicating the plurality of registered character strings in which the correspondence information is arranged in the order specified in advance is generated. Is possible.
本発明の好適な態様において、案内音声と、配信情報を示す音響とを放音する放音部を具備する。以上の構成では、案内音声を放音する放音部が、配信情報の音響の放音(すなわち空気振動たる音響を伝送媒体とする音響通信)に流用される。したがって、案内音声の放音に使用する放音装置とは別個の放音装置を配信情報を示す音響の放音に利用する構成と比較して、情報生成システムの構成を簡素化することが可能である。 The suitable aspect of this invention comprises the sound emission part which emits a guidance audio | voice and the sound which shows delivery information. In the above configuration, the sound emitting unit that emits the guidance voice is used for sound emission of distribution information (that is, acoustic communication using sound that is air vibration as a transmission medium). Therefore, it is possible to simplify the configuration of the information generation system as compared to a configuration in which a sound emitting device separate from the sound emitting device used for sounding the guidance voice is used for sound emission indicating the distribution information. It is.
<第1実施形態>
図1は、本発明の第1実施形態に係る情報生成システム1の構成図である。第1実施形態の情報生成システム1は、ショッピングモール等の商業施設300内にいる利用者Uに提供する情報を生成するためのコンピュータシステムであり、音声案内システム100と管理装置10とを具備する。音声案内システム100は、例えば商業施設300内に設置され、インターネット等を含む通信網200を介して管理装置10と通信する。管理装置10は、例えば通信網200に接続されたサーバ(例えばウェブサーバ)である。利用者Uは、端末装置30を携帯して商業施設300に来場する。端末装置30は、例えば携帯電話機やスマートフォン等の可搬型の情報処理装置である。なお、実際には商業施設300内にいる複数の利用者Uが情報生成システム1のサービスを利用し得るが、以下の説明では便宜的に1個の端末装置30に着目する。
<First Embodiment>
FIG. 1 is a configuration diagram of an
商業施設300の従業員等の案内者OPは、来場者である利用者Uを案内する各種の音声(以下「案内音声」という)Vを発音する。第1実施形態では、複数の文から構成される商業施設300の来場者向けの情報、例えば「本日はお越しくださいまして誠にありがとうございます。間もなく閉店のお時間となります。お気をつけてお帰りください。」等の音声が案内音声Vとして発音される。第1実施形態では、案内音声Vの発音時に参照するアナウンスブック等に事前に収録された複数の文章の何れかを案内者OPが選択的に案内音声Vとして発音する場合を想定する。複数の文章の各々は、相異なる発話内容を表す1文単位の文字列(以下「登録文字列」という)を組合せて構成される。
The guide OP, such as an employee of the
情報生成システム1は、案内者OPが発音した案内音声Vに関連する情報(以下「関連情報」という)Zを利用者Uに提示するための情報(以下「配信情報」)Qを生成する。例えば、関連情報Zは、案内音声Vの発音内容を表現した文字列や当該発音内容の言語を他言語に翻訳した文字列または音声等の各種の情報である。第1実施形態では、案内音声Vに関連する予め用意された各種の案内文A(A1,A2,……)を関連情報Zとして利用者Uに提示するための配信情報Qを生成する。
The
<音声案内システム100>
図2は、音声案内システム100および管理装置10の構成図である。図2に例示される通り、音声案内システム100は、配信端末20と収音装置22と加算器24と放音装置26とを含んで構成される。
<
FIG. 2 is a configuration diagram of the
収音装置22は、周囲の音響を収音する音響機器(マイクロホン)である。案内者OPは、案内音声Vの発音時に参照するアナウンスブック等に事前に収録された複数の文章を、例えば案内したい情報に応じて選択的に案内音声Vとして発音する。すなわち、案内音声Vは、基本的には、案内者OPが内容を任意に決定できるものではなく、事前に用意された既知の内容である。
The
収音装置22は、案内者OPが発音した案内音声Vを収音して、当該案内音声Vの時間波形を表す音声信号SGを生成する。なお、収音装置22が生成した音声信号SGをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。
The
収音装置22が生成した音声信号SGは、加算器24を経由して音響信号S1として放音装置26に供給される。放音装置26は、加算器24から供給される音響信号S1に応じた音響を放音する音響機器(スピーカ)である。例えば、音声信号SGが表す案内音声Vが放音装置26から利用者Uに放音される。なお、音響信号S1をデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
The sound signal SG generated by the
以上の説明から理解される通り、音声案内システム100は、収音装置22が収音した案内音声Vを放音装置26から放送する既存の館内放送システムに配信端末20と加算器24とを接続した音響システムである。ただし、音声案内システム100の形態は任意であり、例えば配信端末20の各要素と収音装置22と加算器24と放音装置26とを単体の装置に搭載することや収音装置22を配信端末20に搭載することも可能である。
As understood from the above description, the
収音装置22が生成した音声信号SGは、収音装置22と加算器24との間の経路から分岐して配信端末20に供給される。なお、音声信号SGを無線により配信端末20に供給することも可能である。
The audio signal SG generated by the
配信端末20は、収音装置22から供給される音声信号SGの案内音声Vに対応した配信情報Qを端末装置30に提供するための機器であり、例えば、携帯電話機やスマートフォン等の可搬型の端末装置で実現される。配信端末20は、図2に例示される通り、制御装置210と通信装置220とを含んで構成される。
The
通信装置220は、図2に例示される通り、通信網200を介して管理装置10と通信する機器である。通信装置220は、音声信号SGを管理装置10に送信するとともに、音声信号SGに対して管理装置10から配信された配信情報Qを受信する。
As illustrated in FIG. 2, the
制御装置210は、例えばCPU(Central Processing Unit)等の処理装置で構成され、配信端末20の全体的な動作を制御する。具体的には、図2に例示される通り、半導体記録媒体や磁気記録媒体等の公知の記録媒体(図示略)に記憶されたプログラムを制御装置210が実行することで、案内音声Vに対応した配信情報Qの取得および配信するための複数の機能(音声取得部212,信号処理部214)が実現される。
The
音声取得部212は、案内音声Vの音声信号SGを収音装置22から取得し、当該音声信号SGを通信装置220から通信網200を介して管理装置10に送信する。管理装置10は、音声案内システム100から送信された音声信号SGを受信し、当該音声信号SGの案内音声Vに対応する関連情報Zを利用者Uに提示するための配信情報Qを生成する。管理装置10が生成した配信情報Qは、管理装置10から音声案内システム100に送信される。通信装置220は、管理装置10から送信された配信情報Qを通信網200から受信する。
The
信号処理部214は、通信装置220が管理装置10から受信した配信情報Qを含む音響の音響信号SQを生成する。音響信号SQは、配信情報Qを所定の周波数帯域の音響成分として含有する。具体的には、音響信号SQの周波数帯域は、放音装置26による放音と端末装置30による収音とが可能な周波数帯域であり、かつ、利用者Uが通常の環境で聴取する音声(例えば案内音声V)や楽音等の音響の周波数帯域を上回る周波数帯域(例えば18kHz以上かつ20kHz以下)の範囲内に包含される。信号処理部214による音響信号SQの生成には公知の技術が任意に採用され得るが、例えば、所定の周波数の正弦波等の搬送波を配信情報Qで周波数変調することで音響信号SQを生成する構成や、拡散符号を利用した配信情報Qの拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行して音響信号SQを生成する構成が採用され得る。
The
音声案内システム100の加算器24は、信号処理部214が生成した音響信号SQと、収音装置22が生成した音声信号SGとを加算することで音響信号S1を生成する。したがって、案内者OPが発音した案内音声Vとともに配信情報Qの音響成分が放音装置26から放音される。以上の説明から理解される通り、放音装置26は、空気振動としての音響(音波)を伝送媒体とする音響通信で配信情報Qを端末装置30に送信する要素として機能する。すなわち、収音装置22が収音した案内音声Vを放音する放音装置26が配信情報Qの送信に流用される。したがって、案内音声Vの放音に使用する放音装置26とは別個の放音装置26を配信情報Qを示す音響の放音に利用する構成と比較して、情報生成システム1の構成を簡素化することが可能である。
The
<管理装置10>
管理装置10は、音声案内システム100に送信される配信情報Qを管理する装置であり、図2に例示される通り、制御装置110と記憶装置120と通信装置130とを具備する。管理装置10は、単体の装置として実現されるほか、相互に別体で構成された複数の装置でも実現され得る。例えば、管理装置10とは別体で記憶装置120(クラウドストレージ)を設置し、制御装置110が例えば通信網200を介して記憶装置120に対する読出/書込を実行することも可能である。すなわち、記憶装置120は管理装置10から省略され得る。
<
The
通信装置130は、通信網200を介して配信端末20と通信する。具体的には、通信装置130は、配信端末20から送信された音声信号SGを受信するとともに、音声信号SGに対して制御装置110が生成した配信情報Qを配信端末20に送信する。
The
制御装置110は、例えばCPU等の処理装置で構成され、記憶装置120に記憶されたプログラムを実行することで、図2に例示される通り、配信情報Qの生成を制御する複数の要素(音声解析部112、文字列特定部114、情報生成部116)として機能する。なお、制御装置110の一部の機能を専用の電子回路で実現した構成や、制御装置110の機能を複数の装置に分散した構成も採用され得る。
The
図2の音声解析部112は、案内音声Vの発音内容を表す文字列を複数に分割した認識文字列Lを生成する。具体的には、音声解析部112は、通信装置130が配信端末20から受信した音声信号SGに対する音声認識で案内音声Vの発音内容を解析した結果(以下「解析結果」という)Kを文単位で複数の認識文字列Lに分割する。図3は、案内音声Vの解析結果Kを複数の認識文字列Lに分割する動作の説明図である。図3に例示される通り、解析結果K(K1,K2,K3)は文単位で複数の認識文字列Lに分割され得る。音声信号SGの音声認識には、例えばHMM(Hidden Markov Model)等の音響モデルと言語的な制約を示す言語モデルとを利用した認識技術等の公知の技術が任意に採用され得る。また、解析結果Kの分割には、形態素解析等の公知の技術が任意に採用され得る。
The
記憶装置120は、制御装置110が実行するプログラムや制御装置110が使用する各種のデータを記憶する。例えば、半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置120として任意に採用される。記憶装置120は、図2に例示される通り、文字列テーブルTAと案内テーブルTBとを記憶する。
The
図4は、文字列テーブルTAの模式図である。図4に例示される通り、文字列テーブルTAは、案内音声Vとして想定される相異なる文章を構成する複数の登録文字列Xが登録されたデータテーブルである。各登録文字列Xには、当該登録文字列Xを一意に識別するための識別情報DX(DX1,DX2,……)が対応付けられる。アナウンスブック等に収録された複数種の文章の各々を構成する複数の登録文字列X(案内者OPによる発音が予定される文字列)が文字列テーブルTAに登録される。 FIG. 4 is a schematic diagram of the character string table TA. As illustrated in FIG. 4, the character string table TA is a data table in which a plurality of registered character strings X constituting different sentences assumed as the guidance voice V are registered. Each registered character string X is associated with identification information DX (DX1, DX2,...) For uniquely identifying the registered character string X. A plurality of registered character strings X (character strings expected to be pronounced by the guide OP) constituting each of a plurality of types of sentences recorded in the announcement book or the like are registered in the character string table TA.
前述の通り、アナウンスブック等に事前に収録された複数の文章の各々は、複数の登録文字列Xを組合せて構成されている。複数の文章の間で登録文字列Xは共通し得る。例えば、「本日はお越しくださいまして誠にありがとうございます。」という文は、図3で例示される通り、閉店を通知する文章や迷子を通知する文章の間で共通する。図4で例示される通り、文字列テーブルTAの登録文字列Xを1文単位とすることで共通の登録文字列Xを重複して文字列テーブルTAに登録する必要がない。したがって、相異なる複数の案内音声Vの文章を個別に文字列テーブルTAに登録する構成よりも、文字列テーブルTAのデータ量を削減することが可能である。 As described above, each of a plurality of sentences recorded in advance in an announcement book or the like is configured by combining a plurality of registered character strings X. The registered character string X may be common among a plurality of sentences. For example, the sentence “Thank you very much for coming today” is common between the sentence notifying the closing of the store and the sentence notifying the lost child as illustrated in FIG. As illustrated in FIG. 4, the registered character string X of the character string table TA is set to one sentence unit, so that it is not necessary to register the common registered character string X in the character string table TA in duplicate. Therefore, the data amount of the character string table TA can be reduced as compared with the configuration in which sentences of a plurality of different guidance voices V are individually registered in the character string table TA.
図2の文字列特定部114は、音声解析部112が解析した複数の認識文字列Lの各々について、文字列テーブルTAに登録された複数の登録文字列Xのうち当該認識文字列Lに類似する登録文字列Xを特定する。具体的には、文字列特定部114は、文字列テーブルTAの複数の登録文字列Xの各々について認識文字列Lとの類似度の指標(以下「類似指標」という)を算定し、複数の登録文字列Xのうち類似指標が示す類似度が最大となる1個の登録文字列X(すなわち認識文字列Lに最も類似する登録文字列X)を特定する。
The character
前述の通り、案内者OPは発音時に参照するアナウンスブック等に事前に収録された文章(複数の登録文字列Xの組合せで構成される文章)を発音するから、理想的には、音声解析部112が音声信号SGから生成する複数の認識文字列Lの各々は、文字列テーブルTAに登録された何れかの登録文字列Xと一致する。しかし、実際には、個々の案内者OPに特有の発話の特徴(くせ)や商業施設300内の背景雑音等に起因して音声解析部112による解析には誤認識が発生し得る。したがって、各認識文字列Lと登録文字列Xとは、相互に類似するけれども必ずしも一致しない場合がある。例えば、案内者OPが登録文字列X4「お気をつけてお帰りください。」を含む文章を発音しても、実際に音声解析部112が生成する認識文字列Lは、図3に例示される通り、登録文字列Xに類似するけれども完全には一致しない「…おくをつけたおかいりください。」というような認識文字列Lを含んだ解析結果K1になり得る。第1実施形態では、認識文字列Lに類似する登録文字列Xを特定するので、図4に例示される通り、音声認識の誤認識の影響を含まない登録文字列X4が特定され得る。
As described above, since the guide OP pronounces sentences (sentences composed of a combination of a plurality of registered character strings X) recorded in advance in an announcement book or the like to be referred to at the time of pronunciation, ideally a voice analysis unit Each of the plurality of recognized character strings L that 112 generates from the speech signal SG coincides with any registered character string X registered in the character string table TA. However, actually, erroneous recognition may occur in the analysis by the
類似指標の種類は任意であるが、例えば文字列間の類似性を評価するための編集距離(レーベンシュタイン距離)等の公知の指標が類似指標として任意に採用され得る。文字列特定部114による登録文字列Xの特定は、音声解析部112が生成した複数の認識文字列Lの各々を、当該認識文字列Lに類似する登録文字列Xに補正する処理とも換言され得る。文字列特定部114は、以上の手順で特定した複数の登録文字列Xの各々について識別情報DXを文字列テーブルTAから取得する。
The type of the similarity index is arbitrary, but a known index such as an edit distance (Levenstein distance) for evaluating the similarity between character strings can be arbitrarily adopted as the similarity index. The specification of the registered character string X by the character
図5は、案内テーブルTBの模式図である。図5に例示される通り、案内テーブルTBは、案内者OPによる発音が想定される相異なる文章(複数の文の組合せ)に対応する複数の対応情報Cを含む。任意の1個の文章に対応する対応情報Cは、当該文章を構成する複数の登録文字列Xの識別情報DXの組合せを指定する。例えば、「本日はお越しくださいまして誠にありがとうございます。緊急のお知らせがございます。お車のヘッドライトがついたままになっております。」という文章に対応する対応情報C2は、第1文の登録文字列X1の識別情報DX1と、第2文の登録文字列X3の識別情報DX3と、第3文の登録文字列X6の識別情報DX6との組合せを指定する。案内テーブルTBにおいて複数の対応情報Cの各々には識別情報DZ(DZ1,DZ2,……)が対応付けられる。識別情報DZは、案内音声Vに関連する予め用意された各種の案内文Aを指定する。案内文Aは、アナウンスブック等に事前に収録された適正な文章である。具体的には、任意の1個の対応情報Cに対応する識別情報DZは、当該対応情報Cが識別情報DXを指定する複数の登録文字列Xで構成される案内文Aを指定する。なお、案内文Aを構成する所定の単位(例えば、文)ごとに識別情報DZを有し、複数の識別情報DZが1個の案内文Aを指定することも可能である。 FIG. 5 is a schematic diagram of the guide table TB. As illustrated in FIG. 5, the guide table TB includes a plurality of pieces of correspondence information C corresponding to different sentences (combination of a plurality of sentences) expected to be pronounced by the guide OP. Correspondence information C corresponding to an arbitrary sentence specifies a combination of identification information DX of a plurality of registered character strings X constituting the sentence. For example, correspondence information C2 corresponding to the sentence "Thank you for coming today. There is an urgent notice. Your car's headlight is still on." A combination of identification information DX1 of registered character string X1, identification information DX3 of registered character string X3 of the second sentence, and identification information DX6 of registered character string X6 of the third sentence is designated. Identification information DZ (DZ1, DZ2,...) Is associated with each of the plurality of correspondence information C in the guide table TB. The identification information DZ designates various guidance sentences A prepared in advance related to the guidance voice V. The guidance sentence A is an appropriate sentence recorded in advance in an announcement book or the like. Specifically, the identification information DZ corresponding to any one piece of correspondence information C designates a guide sentence A composed of a plurality of registered character strings X in which the correspondence information C designates the identification information DX. Note that it is also possible to have identification information DZ for each predetermined unit (for example, sentence) constituting the guidance sentence A, and a plurality of identification information DZ can designate one guidance sentence A.
図2の情報生成部116は、複数の登録文字列Xの相異なる組合せを指定する複数の対応情報Cのうち、文字列特定部114が取得した複数の登録文字列Xの組合せに対応する対応情報Cに応じた関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成する。具体的には、情報生成部116は、複数の対応情報Cのうち、文字列特定部114が取得した複数の識別情報DXの組合せに類似または合致する組合せを指定する対応情報Cを特定し、案内テーブルTBから、特定した対応情報Cの識別情報DZを取得する。すなわち、情報生成部116は、文字列特定部114が取得した複数の識別情報DXと同様の組合せを指定する対応情報Cを特定するほか、アナウンスブック等に事前に収録された文章を文単位で発音を案内者OPが誤った場合(例えば、必要な文の発音を忘れた場合や不要な文を発音してしまった場合)、情報生成部116は、当該文章の複数の識別情報DXに類似する組合せを指定する対応情報Cを特定し、案内テーブルTBから、特定した対応情報Cの識別情報DZを取得する。
The
例えば、アナウンスブック等に収録されている「本日はお越しくださいまして誠にありがとうございます。緊急のお知らせがございます。お車のヘッドライトがついたままになっております。」という文章を案内者OPが正確に発音した場合、図4に例示される通り、文字列特定部114は、文字列テーブルTAから、識別情報DX1、DX3、およびDX6を取得する。図5に例示される通り、文字列特定部114が取得した識別情報DX1、DX3、およびDX6と対応情報C2が指定する識別情報DX1、DX3、およびDX6とが合致するので、情報生成部116は、案内テーブルTBから、対応情報C2の識別情報DZ2を取得する。他方、「緊急のお知らせがございます。本日はお越しくださいまして誠にありがとうございます。お車のヘッドライトがついたままになっております。」と文の順序を間違えて案内者OPが発音した場合でも、情報生成部116は、案内テーブルTBから、対応情報C2の識別情報DZ2を取得することができる。また、「緊急のお知らせがございます。」の文を抜かして「本日はお越しくださいまして誠にありがとうございます。お車のヘッドライトがついたままになっております。」と案内者OPが誤って発音した場合、図4に例示される通り、文字列特定部114は、文字列テーブルTAから、識別情報DX1とDX6とを取得する。識別情報DX1とDX6との両方を含む対応情報Cが識別情報DX1、DX3、およびDX6を指定する対応情報C2しか存在しない場合、情報生成部116は、案内テーブルTBから、対応情報C2の識別情報DZ2を取得する。したがって、適切な案内文A2が対応づけられている識別情報DZ2を取得することができる。
For example, in the announcement book, the text “Thank you for coming today. There is an urgent notice. The car headlight remains on.” 4 is accurately pronounced, the character
図2の情報生成部116は、以上の手順で取得した識別情報DZを含む配信情報Qを生成し、通信装置130を介して配信端末20に配信情報Qを送信する。
The
以上の説明から理解される通り、対応情報Cが指定する識別情報DXの組合せとは独立に用意された案内文Aを示す関連情報Zを利用者Uに提示するための配信情報Qを生成することが可能である。前述の通り、案内文Aは、アナウンスブック等に事前に収録された文章(つまり対応情報Cが指定する登録文字列Xの組合せで構成される文章)が想定されるが、アナウンスブック等に事前に収録された文章とは異なる文章を案内文Aとすることも可能である。例えば、アナウンスブック等に事前に収録された文章「本日はお越しくださいまして誠にありがとうございます。(=X1)間もなく閉店のお時間となります。(=X2)お気をつけてお帰りください。(=X4)」を構成する3つの登録文字列Xの組合せを示す対応情報C1の識別情報DZ1に対応する案内文A1を「間もなく閉店のお時間となるので、お気をつけてお帰りください。」といった内容にすることも可能である。つまり、アナウンスブック等に事前に収録された文章とは異なる文章を案内文Aとすることも可能である。 As understood from the above description, the distribution information Q for presenting the user U with the related information Z indicating the guidance sentence A prepared independently of the combination of the identification information DX designated by the correspondence information C is generated. It is possible. As described above, the guidance sentence A is assumed to be a sentence recorded in advance in an announcement book or the like (that is, a sentence composed of a combination of registered character strings X specified by the correspondence information C). It is also possible to use a sentence different from the sentence recorded in the guide sentence A. For example, the text recorded in the announcement book etc. "Thank you for coming today. (= X1) It will be closed soon. (= X2) Please be careful. ) "A guide sentence A1 corresponding to the identification information DZ1 of the correspondence information C1 indicating the combination of the three registered character strings X that constitute") "content such as" Please be careful, as it will be closing time soon. " It is also possible to make it. That is, a sentence different from the sentence recorded in advance in the announcement book or the like can be used as the guide sentence A.
図2の音声案内システム100では、管理装置10から通信装置220が受信した配信情報Qの音響成分と案内音声Vとが放音装置26から放音される。案内者OPによる案内音声Vの発話の終了後に制御装置110で行われる処理により配信情報Qの生成が実行されるから、放音装置26からは、案内音声Vの放音から遅延して配信情報Qの音響成分が放音される。
In the
<端末装置30>
図6は、端末装置30の構成図である。図6に例示される通り、端末装置30は、収音装置310と制御装置320と記憶装置330と提示装置340とを含んで構成される。
<
FIG. 6 is a configuration diagram of the
記憶装置330は、制御装置320が実行するプログラムや制御装置320が使用する各種のデータを記憶する。記憶装置330は、図6に例示される通り、提示テーブルTCを記憶する。第1実施形態の提示テーブルTCは、相異なる案内音声Vに対応する複数の案内文A(A1,A2,……)の各々に識別情報DZ(DZ1,DZ2,……)が対応付けられたデータテーブルである。例えば、半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置330として任意に採用される。
The
収音装置310は、周囲の音響を収音する音響機器(マイクロホン)であり、配信端末20の放音装置26から放音される音響を収音して音響信号S2を生成する。音響信号S2は、配信情報Qの音響成分(音響信号SQ)を含有する。なお、収音装置310が生成した音響信号S2をアナログからデジタルに変換するA/D変換器の図示は便宜的に省略されている。
The
制御装置320は、例えばCPU等の処理装置で構成され、記憶装置330に記憶されたプログラムを実行することで、提示テーブルTCに登録された複数の案内文Aのうち配信情報Qにより指定される案内文Aを関連情報Zとして利用者Uに提示するための複数の機能(情報抽出部322および情報管理部324)を実現する。
The
情報抽出部322は、収音装置310が生成した音響信号S2の復調で配信情報Qを抽出する。具体的には、情報抽出部322は、音響信号S2のうち配信情報Qを含む周波数帯域の帯域成分を例えば帯域通過フィルタで強調し、配信情報Qの拡散変調に利用された拡散符号を係数とする整合フィルタを通過させることで配信情報Qを抽出する。
The
情報管理部324は、提示テーブルTCの複数の案内文Aのうち、情報抽出部322が抽出した配信情報Qに含まれる識別情報DZに対応する案内文Aを選択する。すなわち、案内者OPが発音した案内音声Vに関連する案内文Aが関連情報Zとして選択される。
The
提示装置340は、情報管理部324が選択した案内文Aを関連情報Zとして端末装置30の利用者Uに提示する。提示装置340は、関連情報Zが示す案内文Aを表示する表示装置(例えば液晶表示パネル等)である。以上の説明から理解される通り、案内者OPが発音した案内音声Vの発話内容に対応する案内文Aが関連情報Zとして提示装置340により利用者Uに提示される。利用者Uは、提示装置340に提示された関連情報Zを視認することで、案内者OPが発音して放音装置26から放音された案内音声Vに関連する関連情報Zを視覚的に確認することが可能である。
The
図7は、情報生成システム1の全体的な動作の説明図である。案内者OPがアナウンスブック等に事前に収録された文章に対応する案内音声Vを発音すると、音声案内システム100の収音装置22は、案内音声Vを収音して音声信号SGを生成する(SA1)。収音装置22が生成した音声信号SGは、収音装置22から放音装置26に出力されて放音される一方(SA2)、音声取得部212によって取得されて通信装置220から通信網200に送信される(SA3)。
FIG. 7 is an explanatory diagram of the overall operation of the
配信端末20から送信された音声信号SGを通信装置130が通信網200から受信すると、管理装置10の音声解析部112は、案内音声Vの音声信号SGに対する音声認識で案内音声Vの発音内容を表す複数の認識文字列Lを生成する(SA4)。文字列特定部114は、文字列テーブルTAの複数の登録文字列Xから、音声解析部112が生成した複数の認識文字列Lの各々に類似する登録文字列Xを特定する(SA5)。すなわち、認識文字列Lが、当該音声解析部112による誤認識を解消した登録文字列Xに補正される。情報生成部116は、案内テーブルTBの複数の対応情報Cから、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cを特定し(SA6)、特定した対応情報Cの識別情報DZを含む配信情報Qを生成する(SA7)。通信装置130は、情報生成部116が生成した配信情報Qを配信端末20に送信する(SA8)。
When the
管理装置10から送信された配信情報Qを通信装置220が受信すると、配信端末20の信号処理部214は、配信情報Qを音響成分として含有する音響信号SQを生成する(SA9)。配信端末20の加算器24は、収音装置22が生成した音声信号SGと信号処理部214が生成した音響信号SQとを加算することで音響信号S1を生成する(SA10)。放音装置26は、音響信号S1に応じた音響を放音する(SA11)。すなわち、収音装置22が収音した案内音声Vと、配信情報Qの音響成分が放音装置26から放音される。
When the
端末装置30の収音装置310は、放音装置26から放音された音響を収音して音響信号S2を生成する(SA12)。情報抽出部322は、収音装置310が生成した音響信号S2の復調で配信情報Qを抽出する(SA13)。情報管理部324は、情報抽出部322が抽出した配信情報Qに含まれる識別情報DZに対応する案内文Aを提示テーブルTCから選択する。提示装置340は、情報管理部324が選択した案内文Aが示す文字列を関連情報Zとして表示させることで利用者Uに視覚的に提示する(SA14)。
The
以上の説明から理解される通り、第1実施形態では、複数の登録文字列Xのうち、案内音声Vに対する音声認識で解析された認識文字列Lに類似する登録文字列Xが特定されるので、音声認識の誤認識の影響を含まない関連情報Zを利用者Uに提示するための配信情報Qを生成することが可能である。また、複数の登録文字列Xの相異なる組合せを指定する対応情報Cに応じた関連情報Zを利用者Uに提示するための配信情報Qが生成されるので、案内者が例えば文単位で案内音声Vの発音を誤った場合(例えば、必要な文の発音を忘れた場合や不要な文を発音した場合)でも、案内音声Vの解析結果Kから特定される複数の登録文字列Xの組合せに対応する対応情報Cに応じた適切な関連情報Zを利用者Uに提示するための配信情報Qを生成することが可能である。 As understood from the above description, in the first embodiment, among the plurality of registered character strings X, the registered character string X similar to the recognized character string L analyzed by the speech recognition for the guidance voice V is specified. It is possible to generate distribution information Q for presenting related information Z that does not include the influence of misrecognition of voice recognition to the user U. Further, since the distribution information Q for presenting the user U with the related information Z corresponding to the correspondence information C designating different combinations of the plurality of registered character strings X is generated, the guide guides for example in sentence units. A combination of a plurality of registered character strings X identified from the analysis result K of the guidance voice V even when the pronunciation of the voice V is wrong (for example, when a necessary sentence is forgotten or an unnecessary sentence is pronounced) It is possible to generate distribution information Q for presenting relevant information Z corresponding to the correspondence information C corresponding to the user U to the user U.
<第2実施形態>
本発明の第2実施形態を説明する。以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
Second Embodiment
A second embodiment of the present invention will be described. Regarding the elements whose functions and functions are the same as those of the first embodiment in each aspect exemplified below, the detailed description of each is appropriately omitted by using the reference numerals used in the description of the first embodiment.
第1実施形態の情報生成部116は、文字列特定部114が特定した複数の登録文字列Xの組合せを指定する対応情報Cの識別情報DZに応じた案内文Aを関連情報Zとして利用者Uに提示するための配信情報Qを生成した。第2実施形態における情報生成部116は、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cが指定する複数の登録文字列Xを示す関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成する。
The
図8は、第2実施形態に係る案内テーブルTBの模式図である。図8に例示される通り、第2実施形態に係る案内テーブルTBは、案内者OPによる発音が想定される相異なる文章に対応する複数の対応情報Cを含む。任意の1個の文章に対応する対応情報Cは、当該文章を構成する複数の登録文字列Xの識別情報DXの組合せを指定する。例えば、「本日はお越しくださいまして誠にありがとうございます。緊急のお知らせがございます。お車のヘッドライトがついたままになっております。」という文章に対応する対応情報C2は、第1文の登録文字列X1の識別情報DX1と、第2文の登録文字列X3の識別情報DX3と、第3文の登録文字列X6の識別情報DX6との組合せを指定する。図5の第1実施形態に係る案内テーブルTBと比較して、第2実施形態に係る案内テーブルTBは、任意の1個の対応情報Cに対応する識別情報DZを有していない。 FIG. 8 is a schematic diagram of a guide table TB according to the second embodiment. As illustrated in FIG. 8, the guide table TB according to the second embodiment includes a plurality of pieces of correspondence information C corresponding to different sentences assumed to be pronounced by the guide OP. Correspondence information C corresponding to an arbitrary sentence specifies a combination of identification information DX of a plurality of registered character strings X constituting the sentence. For example, correspondence information C2 corresponding to the sentence "Thank you for coming today. There is an urgent notice. Your car's headlight is still on." A combination of identification information DX1 of registered character string X1, identification information DX3 of registered character string X3 of the second sentence, and identification information DX6 of registered character string X6 of the third sentence is designated. Compared with the guide table TB according to the first embodiment of FIG. 5, the guide table TB according to the second embodiment does not have the identification information DZ corresponding to any one correspondence information C.
情報生成部116は、第1実施形態と同様に、複数の対応情報Cから文字列特定部114が取得した複数の識別情報DXに対応する対応情報Cを特定する。情報生成部116は、案内テーブルTBから、特定した対応情報Cが指定する複数の識別情報DXを取得し、当該複数の識別情報DXを含む配信情報Qを生成する。例えば、対応情報C2を特定した場合、情報生成部116は、識別情報DX1と識別情報DX3と識別情報DX6とを含む配信情報Qを生成し、通信装置130を介して配信端末20に配信情報Qを送信する。
The
端末装置30において、配信端末20の放音装置26から放音される音響を収音装置310が収音して音響信号S2を生成し、情報抽出部322が音響信号S2から配信情報Qを抽出する構成および動作は、第1実施形態と同様である。
In the
第2実施形態において端末装置30の記憶装置330が記憶する提示テーブルTCは、図4に例示した文字列テーブルTAと同様に、複数の登録文字列Xの各々について識別情報DXを対応させたデータテーブルである。情報管理部324は、情報抽出部322が抽出した配信情報Qが指定する各識別情報DXの登録文字列Xを提示テーブルTCから取得し、提示装置340は、情報管理部324が選択した複数の登録文字列Xを関連情報Zとして利用者Uに提示する。
In the second embodiment, the presentation table TC stored in the
なお、前述の例示では、提示テーブルTCを文字列テーブルTAと同様の内容としたが、提示テーブルTCを文字列テーブルTAとは異なる内容とすることも可能である。例えば、文字列テーブルTAの識別情報DX5に対応する登録文字列X5は「迷子のお知らせを申し上げます。」であるが、提示テーブルTCの識別情報DX5に対応する文字列は「迷子のお知らせ。」とすることも可能である。情報管理部324は、提示テーブルTCの複数の識別情報DXのうち、配信情報Qに含まれる複数の識別情報DXの各々が示す登録文字列Xを選択し、当該選択した複数の登録文字列Xを組み合わせた文章を関連情報Zとして生成する。提示装置340は、情報管理部324が生成した関連情報Zを端末装置30の利用者Uに提示する。
In the above example, the presentation table TC has the same contents as the character string table TA, but the presentation table TC may have different contents from the character string table TA. For example, the registered character string X5 corresponding to the identification information DX5 of the character string table TA is “I will give you a notification of lost child”, but the character string corresponding to the identification information DX5 of the presentation table TC is “Notice of lost child”. It is also possible. The
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、対応情報Cが指定する複数の登録文字列Xを示す関連情報Zを利用者Uに提示するための配信情報Qが生成される。図5の第1実施形態に係る案内テーブルTBと比較すると、前述の通り、第2実施形態に係る案内テーブルTBは、任意の1個の対応情報Cに対応する識別情報DZを有していない。したがって、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cの案内文Aを示す関連情報Zを利用者Uに提示するための配信情報Qを生成する第1実施形態の構成と比較して、案内文Aを一意に指定するための情報(つまり識別情報DZ)が不要になるという利点がある。一方で、第1実施形態では、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cの案内文Aを示す関連情報Zを利用者Uに提示するための配信情報Qが生成される。したがって、対応情報Cが指定する登録文字列Xの組合せとは独立に用意された案内文Aを示す関連情報Zを利用者Uに提示するための配信情報Qを生成することが可能である。
In the second embodiment, the same effect as in the first embodiment is realized. In the second embodiment, distribution information Q for presenting the user U with related information Z indicating a plurality of registered character strings X designated by the correspondence information C is generated. Compared with the guidance table TB according to the first embodiment of FIG. 5, as described above, the guidance table TB according to the second embodiment does not have the identification information DZ corresponding to any one correspondence information C. . Therefore, the distribution information Q for presenting the user U with the related information Z indicating the guidance sentence A of the correspondence information C corresponding to the combination of the plurality of registered character strings X specified by the character
<第3実施形態>
第2実施形態の対応情報Cは、複数の登録文字列Xの組合せを指定し、情報生成部116は、対応情報Cが指定した複数の登録文字列Xを示す関連情報Zを端末装置30の利用者Uに提示するための配信情報Qを生成した。第3実施形態の対応情報Cは、複数の登録文字列Xの組合せと、当該組合せに係る複数の登録文字列Xの順序とを指定し、情報生成部116は、対応情報Cが指定する順序で配列された複数の登録文字列Xを示す関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成する。
<Third Embodiment>
The correspondence information C of the second embodiment designates a combination of a plurality of registered character strings X, and the
第3実施形態に係る案内テーブルTBは、案内者OPによる発音が想定される相異なる文章に対応する複数の対応情報Cを含む。任意の1個の文章に対応する対応情報Cは、当該文章を構成する複数の登録文字列Xの識別情報DXの組合せと当該複数の識別情報DXの各々が示す登録文字列Xが文章を構成する順序とを指定する。具体的には、任意の1個の対応情報Cは、当該対応情報Cに対応する文章を構成する複数の登録文字列Xの正規の順序で各登録文字列Xの識別情報DXを配列した情報である。ただし、複数の登録文字列Xの順序を指定する方法は以上の例示に限定されない。例えば、対応情報Cが指定する組合せに係る複数の登録文字列Xの各々の識別情報DXに、当該組合せ内の登録文字列Xの順序を示す情報を付加することも可能である。 The guide table TB according to the third embodiment includes a plurality of pieces of correspondence information C corresponding to different sentences that are supposed to be pronounced by the guide OP. Correspondence information C corresponding to an arbitrary sentence is composed of a combination of identification information DX of a plurality of registered character strings X constituting the sentence and a registered character string X indicated by each of the plurality of identification information DX. Specify the order to perform. Specifically, any one piece of correspondence information C is information in which identification information DX of each registered character string X is arranged in a regular order of a plurality of registered character strings X constituting a sentence corresponding to the correspondence information C. It is. However, the method of designating the order of the plurality of registered character strings X is not limited to the above examples. For example, it is possible to add information indicating the order of the registered character strings X in the combination to the identification information DX of each of the plurality of registered character strings X related to the combination designated by the correspondence information C.
第3実施形態に係る情報生成部116は、対応情報Cが指定する複数の識別情報DXを、対応情報Cが指定する順序で配列して配信情報Qを生成する。例えば、「緊急のお知らせがございます。(=DX3)本日はお越しくださいまして誠にありがとうございます。(=DX1)お車のヘッドライトがついたままになっております。(=DX6)」と案内者OPが発音した場合、対応情報Cが、「識別情報DX1:1番、識別情報DX3:2番、識別情報DX6:3番」という順序を指定していれば、「本日はお越しくださいまして誠にありがとうございます。(=DX1)緊急のお知らせがございます。(=DX3)お車のヘッドライトがついたままになっております。(=DX6)」という関連情報Zを端末装置30が利用者Uに提示するための配信情報Qが生成される。
The
第3実施形態においても第2実施形態と同様の効果が実現される。また、対応情報Cが指定する順序で配列された複数の登録文字列Xを示す関連情報Zを端末装置30が利用者Uに提示するための配信情報Qが生成される。したがって、案内音声Vを構成する複数の文の発音の順序に関わらず、対応情報Cがあらかじめ指定した順序で配列された複数の登録文字列Xを示す関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成することが可能である。
In the third embodiment, the same effect as in the second embodiment is realized. Also, distribution information Q for the
<第4実施形態>
第1実施形態から第3実施形態では、関連情報Zの提示を指示する配信情報Qを情報生成システム1から端末装置30に送信した。第4実施形態では、案内音声Vに対応する関連情報Zを情報生成システム1が生成して利用者Uに提供する。音声解析部112および文字列特定部114の動作と情報生成部116が対応情報Cを特定する動作とは、前述の各形態と同様である。したがって、前述の各形態と同様に、音声認識の誤認識の影響を低減した、対応情報Cに応じた適切な関連情報Zを利用者Uに提示することが可能である。
<Fourth embodiment>
In the first to third embodiments, the distribution information Q instructing the presentation of the related information Z is transmitted from the
第4実施形態の情報生成部116は、特定した対応情報Cの識別情報DZが示す案内文Aを他言語に翻訳した文字列を関連情報Zとして生成する。なお、文字列の翻訳には、例えば公知の機械翻訳が任意に採用され得る。情報生成部116が生成した関連情報Zは、音声案内システム100の配信端末20に送信される。
The
配信端末20の信号処理部214は、関連情報Zを適用した音声合成で音響信号SQを生成する。第4実施形態の音響信号SQは、関連情報Zが指定する文字列を発音した音声を表す信号である。音響信号SQの生成には、公知の音声合成が任意に採用され得る。信号処理部214が生成した音響信号SQは、加算器24を経由して放音装置26に供給される。したがって、関連情報Zが指定する文字列を発音した音声が放音装置26から放音される。すなわち、案内者OPが発音した案内音声Vの放音に引続いて、当該案内音声Vを他言語に翻訳した音声が放音装置26から利用者Uに対して放音される。例えば、案内文Aの翻訳文が関連情報Zとして生成された場合には、案内音声Vに相当する案内文Aの翻訳文の音声が当該案内音声Vに引続き放音される。
The
なお、以上の説明では、第1実施形態を基礎とした構成を例示したが、第2実施形態または第3実施形態における文字列の特定を第4実施形態に適用することも可能である。例えば、第4実施形態の情報生成部116は、特定した対応情報Cが指定する複数の識別情報DXの各々が示す登録文字列Xを組み合わせた文章を他言語に翻訳した文字列を関連情報Zとして生成する。したがって、複数の登録文字列Xを組み合わせた文章の翻訳文の音声が案内音声Vに引続いて放音装置26から放音される。また、第3実施形態を想定すると、特定した対応情報Cが指定する複数の識別情報DXの各々が示す登録文字列Xを対応情報Cが指定する順序で配列した文章を他言語に翻訳した文字列を表す関連情報Zを情報生成部116が生成することも可能である。以上の構成では、複数の登録文字列Xを対応情報Cがあらかじめ指定した順序で配列した文章の翻訳文の音声が当該案内音声Vに引続いて放音装置26から放音される。
In the above description, the configuration based on the first embodiment has been exemplified. However, it is also possible to apply the character string specification in the second embodiment or the third embodiment to the fourth embodiment. For example, the
以上の説明から理解される通り、第4実施形態の情報生成システム1は、案内音声Vに関連する関連情報Zを生成(および利用者Uに提供)するシステムであり、案内音声Vに対する音声認識で解析された複数の認識文字列Lの各々について、相異なる発音内容を表す複数の登録文字列Xのうち認識文字列Lに類似する当該登録文字列Xを特定する文字列特定部114と、複数の登録文字列Xの相異なる組合せを指定する複数の対応情報Cのうち、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cに応じた関連情報Zを生成する情報生成部116とを具備する。対応情報Cに応じた関連情報Zの典型例は、第1実施形態で例示した案内文Aの翻訳文、および、対応情報Cが示す複数の登録文字列Xから構成される文章(第2実施形態または第3実施形態)の翻訳文である。なお、関連情報Zが示す文字列の音声を放音装置26から放音する構成を以上の説明では例示したが、関連情報Zの出力方法は以上の例示に限定されない。例えば関連情報Zが示す文字列を表示装置により表示することも可能である。
<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
As understood from the above description, the
<Modification>
Each aspect illustrated above can be variously modified. Specific modifications are exemplified below. Two or more modes arbitrarily selected from the following examples can be appropriately combined within a range that does not contradict each other.
(1)第1実施形態から第3実施形態では、情報生成部116は、案内音声Vの発音内容を示す文字列の識別情報DZ(第2実施形態や第3実施形態では識別情報DX)を配信情報Qとして生成したが、配信情報Qの内容は以上の例示に限定されない。例えば、案内音声Vの発音内容を示す文字列そのものや案内音声Vの発音内容を他言語に翻訳した文字列を提示装置340が表示することも可能である。ただし、利用者Uに対する提示の方法は、表示に限定されない。例えば、配信情報Qで指定された案内文Aや登録文字列Xを音声として放音する放音装置を提示装置340として利用することも可能である。以上の例示から理解される通り、配信情報Qは、案内音声Vに関する情報として包括的に表現される。
(1) In the first to third embodiments, the
(2)前述の各形態では、情報生成部116が対応情報Cを特定した上で配信情報Q(第4実施形態では関連情報Z)を生成したが、配信情報Qの生成に対応情報Cを特定できない場合を加味することも可能である。例えば、第1実施形態から第3実施形態の構成を基礎として、情報生成部116が対応情報Cを特定できない場合、案内音声Vの解析結果Kを配信情報Qとする構成や配信情報Qを生成しない構成も可能である。また、第4実施形態の構成を基礎として、情報生成部116が対応情報Cを特定できない場合、案内音声Vの解析結果Kの文字列の翻訳文を関連情報Zとする構成や関連情報Zを生成しない構成も可能である。
(2) In each of the above-described forms, the
(3)前述の各形態では、アナウンスブック等に収録された文章を構成する文を登録文字列Xとしたが、挿入区間を設けた定型句と挿入句とから構成される文を登録文字列Xとすることも可能である。例えば、解析結果Kに類似する定型句に、解析結果Kの挿入区間に対応する部分に類似する挿入句を挿入した文を登録文字列Xとする。以上の構成では、1個の定型句が複数の解析結果Kにわたり共用される(複数の案内音声Vにわたり共通する文字列を文字列テーブルTAの個々の登録文字列Xに含ませる必要がない)から、文字列テーブルTAのデータ量が削減されるという利点がある。 (3) In each of the above-described forms, a sentence constituting a sentence recorded in an announcement book or the like is a registered character string X. However, a sentence composed of a fixed phrase provided with an insertion section and an insertion phrase is a registered character string. X can also be used. For example, a registered character string X is a sentence in which an insertion phrase similar to a portion corresponding to the insertion section of the analysis result K is inserted into a fixed phrase similar to the analysis result K. In the above configuration, one fixed phrase is shared over a plurality of analysis results K (a character string common to a plurality of guidance voices V need not be included in each registered character string X of the character string table TA). Therefore, there is an advantage that the data amount of the character string table TA is reduced.
(4)前述の各形態では、管理装置10が音声解析部112と文字列特定部114と情報生成部116とを具備する構成を例示したが、管理装置10の一部または全部の機能を音声案内システム100に搭載することも可能である。例えば、第1実施形態から第3実施形態の構成を基礎として、音声解析部112と文字列特定部114と情報生成部116とを配信端末20に搭載した構成では、音声信号SGの解析(音声解析部112)と、登録文字列Xの特定(文字列特定部114)と、配信情報Qの生成(情報生成部116)とが配信端末20にて実行され、配信情報Qが放音装置26から端末装置30に送信される。この構成では、音声案内システム100と管理装置10との間の通信が不要であるから、通信網200を利用した通信ができない環境でも配信情報Qを端末装置30に提供することが可能である。他方、第4実施形態の構成を基礎として、音声解析部112と文字列特定部114と情報生成部116とを配信端末20に搭載した構成では、音声信号SGの解析(音声解析部112)と、登録文字列Xの特定(文字列特定部114)と、関連情報Zの生成(情報生成部116)とが配信端末20にて実行され、関連情報Zが放音装置26から放音される。
(4) In each of the above-described embodiments, the configuration in which the
(5)第1実施形態から第3実施形態では、提示テーブルTCを端末装置30の記憶装置330が記憶したが、提示テーブルTCの記憶先は以上の例示に限定されない。例えば、移動体通信網やインターネット等の通信網を介して端末装置30と通信する配信サーバ装置に提示テーブルTCを記憶することも可能である。端末装置30は、配信情報Qに含まれる識別情報DZ(第2実施形態や第3実施形態では識別情報DX)を指定した情報要求を配信サーバ装置に送信し、配信サーバ装置は、情報要求で指定された識別情報DZに対応する案内文Aを要求元の端末装置30に送信する。端末装置30の提示装置340は、配信サーバ装置から受信した案内文Aを利用者Uに提示する。以上の説明から理解される通り、提示テーブルTCを端末装置30の記憶装置330に記憶することは必須ではない。
(5) In the first embodiment to the third embodiment, the
(6)前述の各形態では、音声認識による案内音声Vの解析結果Kを音声解析部112が文単位に分割したが、解析結果Kを分割する単位は以上の例示に限定されない。例えば、文節や単語単位に解析結果Kを分割することも可能である。また、所定数の文を単位として解析結果Kを分割してもよい。
(6) In each of the above embodiments, the
(7)前述の各形態では、ショッピングモール等の商業施設300で情報生成システム1を利用したが、情報生成システム1を利用する場所は以上の例示に限定されない。例えば、バスや電車等の交通機関の案内に情報生成システム1を利用することも可能である。
(7) In each above-mentioned form, although
(8)第1実施形態から第3実施形態では、端末装置30に対する配信情報Qの配信に音響通信を利用したが、配信情報Qを端末装置30に配信する通信の方式は以上の例示に限定されない。例えば、赤外線や電波を利用した無線通信(例えば近距離無線通信)で端末装置30に配信情報Qを配信することも可能である。
(8) In the first to third embodiments, acoustic communication is used for distributing the distribution information Q to the
(9)第2実施形態おいて、対応情報Cは複数の登録文字列Xの組合せを指定したが、対応情報Cが指定する情報は以上の例示に限定されない。例えば、対応情報Cが示す複数の識別情報DXのうち、配信情報Qに含めない(つまり利用者Uに提示しない)登録文字列Xの識別情報DXを指定することも可能である。例えば、「本日はお越しくださいまして誠にありがとうございます。(=DX1)緊急のお知らせがございます。(=DX3)お車のヘッドライトがついたままになっております。(=DX6)」と案内者OPが発音した場合、識別情報DX1、DX3およびDX6を示す対応情報C2が、「識別情報DX1:非提示」と指定していれば、「緊急のお知らせがございます。(=DX3)お車のヘッドライトがついたままになっております。(=DX6)」という関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成することができる。以上の構成によれば、案内音声Vとして放音はしたい文ではあるが、端末装置30への配信はしたくない文(例えば、個人情報を含む文や重要性が低い文)を配信情報Qに含めないことが可能である。
(9) In the second embodiment, the correspondence information C designates a combination of a plurality of registered character strings X, but the information designated by the correspondence information C is not limited to the above examples. For example, among the plurality of pieces of identification information DX indicated by the correspondence information C, the identification information DX of the registered character string X that is not included in the distribution information Q (that is, not presented to the user U) can be designated. For example, “Thank you for coming today. (= DX1) There is an urgent notice. (= DX3) The car headlight is still on. (= DX6)” When the operator OP pronounces, if the correspondence information C2 indicating the identification information DX1, DX3 and DX6 specifies “identification information DX1: non-presentation”, “There is an urgent notice. (= DX3) The distribution information Q for the
(10)前述の各形態で例示した情報生成システム1は、前述の各形態の例示の通り、管理装置10の制御装置110とプログラムとの協働で実現される。例えば、第1実施形態から第3実施形態に対応するプログラムは、案内音声Vに関連する関連情報Zを端末装置30が利用者Uに提示するために当該端末装置30に送信される配信情報Qを生成するプログラムであって、案内音声Vに対する音声認識で解析された複数の認識文字列Lの各々について、相異なる発音内容を表す複数の登録文字列Xのうち認識文字列Lに類似する当該登録文字列Xを特定する文字列特定部114、および、複数の登録文字列Xの相異なる組合せを指定する複数の対応情報Cのうち、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cに応じた関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成する情報生成部116としてコンピュータを機能させる。また、第4実施形態に対応するプログラムは、案内音声Vに関連する関連情報Zを生成(および利用者Uに提供)するプログラムであって、案内音声Vに対する音声認識で解析された複数の認識文字列Lの各々について、相異なる発音内容を表す複数の登録文字列Xのうち認識文字列Lに類似する当該登録文字列Xを特定する文字列特定部114、および、複数の登録文字列Xの相異なる組合せを指定する複数の対応情報Cのうち、文字列特定部114が特定した複数の登録文字列Xの組合せに対応する対応情報Cに応じた関連情報Zを生成する情報生成部116としてコンピュータを機能させる。以上に例示したプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、通信網を介した配信の形態でプログラムをコンピュータに配信することも可能である。
(10) The
(11)本発明は、前述の各形態に係る情報生成システム1の動作方法(情報生成方法)としても特定される。例えば、第1実施形態から第3実施形態に対応する情報生成方法は、案内音声Vに関連する関連情報Zを端末装置30が利用者Uに提示するために当該端末装置30に送信される配信情報Qを生成する方法であって、案内音声Vに対する音声認識で解析された複数の認識文字列Lの各々について、相異なる発音内容を表す複数の登録文字列Xのうち認識文字列Lに類似する当該登録文字列Xを特定し、複数の登録文字列Xの相異なる組合せを指定する複数の対応情報Cのうち、特定した複数の登録文字列Xの組合せに対応する対応情報Cに応じた関連情報Zを端末装置30が利用者Uに提示するための配信情報Qを生成する。また、第4実施形態に対応する情報生成方法は、案内音声Vに関連する関連情報Zを生成(および利用者Uに提供)する方法であって、案内音声Vに対する音声認識で解析された複数の認識文字列Lの各々について、相異なる発音内容を表す複数の登録文字列Xのうち認識文字列Lに類似する当該登録文字列Xを特定し、複数の登録文字列Xの相異なる組合せを指定する複数の対応情報Cのうち、特定した複数の登録文字列Xの組合せに対応する対応情報Cに応じた関連情報Zを生成する。
(11) The present invention is also specified as an operation method (information generation method) of the
1……情報生成システム、10……管理装置、20……配信端末、22……収音装置、24……加算器、26……放音装置、30……端末装置、100……音声案内システム、110……制御装置、112……音声解析部、114……文字列特定部、116……情報生成部、120……記憶装置、130……通信装置、200……通信網、210……制御装置、212……音声取得部、214……信号処理部、220……通信装置、300……商業施設、310……収音装置、320……制御装置、322……情報抽出部、324……情報管理部、330……記憶装置、340……提示装置
DESCRIPTION OF
Claims (5)
前記案内音声に対する音声認識で解析された複数の認識文字列の各々について、相異なる発音内容を表す複数の登録文字列のうち前記認識文字列に類似する当該登録文字列を特定する文字列特定部と、
複数の登録文字列の相異なる組合せを指定する複数の対応情報のうち、前記文字列特定部が特定した複数の登録文字列の組合せに対応する対応情報に応じた前記関連情報を前記端末装置が利用者に提示するための前記配信情報を生成する情報生成部と
を具備する情報生成システム。 A system for generating distribution information transmitted to a terminal device in order for the terminal device to present related information related to the guidance voice to the user,
For each of a plurality of recognized character strings analyzed by voice recognition with respect to the guidance voice, a character string specifying unit for specifying the registered character string similar to the recognized character string among a plurality of registered character strings representing different pronunciation contents When,
Of the plurality of pieces of correspondence information designating different combinations of the plurality of registered character strings, the terminal device displays the related information according to the correspondence information corresponding to the combination of the plurality of registered character strings specified by the character string specifying unit. An information generation system comprising: an information generation unit that generates the distribution information to be presented to a user.
請求項1の情報生成システム。 The information generation unit includes related information indicating a guidance sentence of correspondence information corresponding to a combination of a plurality of registered character strings identified by the character string identification unit among a plurality of guidance sentences prepared for each correspondence information. The information generation system according to claim 1, wherein the terminal device generates the distribution information to be presented to the user.
請求項1の情報生成システム。 The information generation unit is configured so that the terminal device presents to the user related information indicating a plurality of registered character strings specified by correspondence information corresponding to a combination of a plurality of registered character strings specified by the character string specifying unit. The information generation system according to claim 1, wherein the distribution information is generated.
前記情報生成部は、前記対応情報が指定する順序で配列された複数の登録文字列を示す関連情報を前記端末装置が前記利用者に提示するための前記配信情報を生成する
請求項3の情報生成システム。 The correspondence information specifies a combination of a plurality of registered character strings and an order of the plurality of registered character strings related to the combination,
The information generation unit generates the distribution information for the terminal device to present related information indicating a plurality of registered character strings arranged in an order designated by the correspondence information to the user. Generation system.
を具備する請求項1から請求項4の何れかの情報生成システム。
5. The information generation system according to claim 1, further comprising a sound emitting unit that emits the guidance voice and sound indicating the distribution information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015203864A JP6597156B2 (en) | 2015-10-15 | 2015-10-15 | Information generation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015203864A JP6597156B2 (en) | 2015-10-15 | 2015-10-15 | Information generation system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017076279A JP2017076279A (en) | 2017-04-20 |
JP6597156B2 true JP6597156B2 (en) | 2019-10-30 |
Family
ID=58551372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015203864A Active JP6597156B2 (en) | 2015-10-15 | 2015-10-15 | Information generation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6597156B2 (en) |
-
2015
- 2015-10-15 JP JP2015203864A patent/JP6597156B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017076279A (en) | 2017-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6033927B1 (en) | Information providing system and information providing method | |
CN106537496B (en) | Terminal device, information providing system, information presenting method, and information providing method | |
CN106537497B (en) | Information management system and information management method | |
JP2017195612A (en) | Information management system and terminal device | |
JP6569252B2 (en) | Information providing system, information providing method and program | |
JP6729494B2 (en) | Information management system and information management method | |
JP6597156B2 (en) | Information generation system | |
JP2020190756A (en) | Management device and program | |
JP6971557B2 (en) | Management equipment and programs | |
JP7331645B2 (en) | Information provision method and communication system | |
JP6772468B2 (en) | Management device, information processing device, information provision system, language information management method, information provision method, and operation method of information processing device | |
JP6780305B2 (en) | Information processing device and information provision method | |
JP6984769B2 (en) | Information provision method and information provision system | |
JP7192948B2 (en) | Information provision method, information provision system and program | |
JP2018088088A (en) | Information processing system and terminal device | |
JP6834634B2 (en) | Information provision method and information provision system | |
JP2020064262A (en) | Information processing method and information processing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190916 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6597156 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |