JP2016099466A - 情報送信装置 - Google Patents

情報送信装置 Download PDF

Info

Publication number
JP2016099466A
JP2016099466A JP2014235622A JP2014235622A JP2016099466A JP 2016099466 A JP2016099466 A JP 2016099466A JP 2014235622 A JP2014235622 A JP 2014235622A JP 2014235622 A JP2014235622 A JP 2014235622A JP 2016099466 A JP2016099466 A JP 2016099466A
Authority
JP
Japan
Prior art keywords
identification information
information
sound
terminal device
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014235622A
Other languages
English (en)
Other versions
JP6114249B2 (ja
JP2016099466A5 (ja
Inventor
翔太 森口
Shota MORIGUCHI
翔太 森口
優樹 瀬戸
Yuki Seto
優樹 瀬戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2014235622A priority Critical patent/JP6114249B2/ja
Priority to EP15860790.3A priority patent/EP3223275B1/en
Priority to CN201580063110.5A priority patent/CN107004416B/zh
Priority to PCT/JP2015/082765 priority patent/WO2016080535A1/ja
Publication of JP2016099466A publication Critical patent/JP2016099466A/ja
Publication of JP2016099466A5 publication Critical patent/JP2016099466A5/ja
Application granted granted Critical
Publication of JP6114249B2 publication Critical patent/JP6114249B2/ja
Priority to US15/599,072 priority patent/US20170255615A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】端末装置でコンテンツを再生する利用者の負担を軽減する。
【解決手段】情報送信装置24は、音声信号Gが示す案内音声の語句Wを認識する音声認識部52と、相異なる語句に対応する複数の識別情報Dのうち音声認識部52が認識した語句Wに対応する識別情報Dを特定する情報特定部54と、識別情報Dが示すコンテンツを再生可能な端末装置に、情報特定部54が特定した識別情報Dを送信する送信手段(信号生成部56および放音装置46)とを具備する。
【選択図】図3

Description

本発明は、画像や音声等のコンテンツを端末装置において再生するための技術に関する。
音声信号が示す音声に包含される語句を認識する音声認識技術が従来から提案されている。例えば特許文献1には、音声信号から認識された語句(文字列)を表示装置に表示させる機能が搭載された携帯端末装置が開示されている。
特開2003−051776号公報
特許文献1のように音声認識が可能な端末装置を利用すれば、例えば、電車やバス等の交通機関で放送される案内音声を端末装置により収音したうえで語句を認識し、当該語句に応じた画像等のコンテンツを端末装置で再生することが可能である。しかし、放音機器から放射された案内音声を音声認識に必要なSN比で収音するためには、案内音声を放射する放音装置に利用者が自身の端末装置を充分に接近させる必要がある。また、案内音声が放射される時刻が不定である状況では、利用者の所望の案内音声が実際に放送されるまでの長時間にわたり放音装置に端末装置を接近させた状態で待機する必要があり、端末装置の利用者の負担が大きいという問題がある。以上の事情を考慮して、本発明は、端末装置でコンテンツを再生する利用者の負担を軽減することを目的とする。
以上の課題を解決するために、本発明の情報送信装置は、音声信号が示す音声の語句を認識する音声認識手段と、相異なる語句に対応する複数の識別情報のうち音声認識手段が認識した語句に対応する識別情報を特定する情報特定手段と、識別情報が示すコンテンツを再生可能な端末装置に、情報特定手段が特定した識別情報を送信する送信手段とを具備する。以上の構成では、音声信号から認識される語句に対応した識別情報が端末装置に送信される。したがって、音声を充分なSN比で収音するために利用者が自身の端末装置を放音装置に接近させる必要や、音声が放射されるまで利用者が自身の端末装置を放音装置に接近させた状態で待機する必要はない。すなわち、端末装置でコンテンツを再生する利用者の負担を軽減することが可能である。
本発明の好適な態様において、情報特定手段は、複数の識別情報と事前に登録された複数の語句とを対応付ける登録情報を参照し、登録情報に登録された複数の語句の何れかを音声認識手段が認識した場合に、当該語句に対応する識別情報を登録情報から特定する。以上の態様では、識別情報の送信の要否を登録情報の送信で簡便に判別できるという利点がある。
本発明の好適な態様において、音声認識手段は、端末装置を収容して移動する移動体に設置された収音装置から放音装置に供給される音声信号が示す音声の語句を認識する。以上の態様では、収音装置から放音装置に供給される音声信号に対して音声認識部が音声認識を実行するから、例えば放音装置から放射された音声を収音して音声認識を実行する構成と比較して高精度な音声認識が実現される。
本発明の好適な態様に係る情報送信装置は、音声認識手段が認識した語句を示すコンテンツと当該語句に対応する識別情報とを、端末装置から要求された識別情報に対応するコンテンツを当該端末装置に提供する配信装置に送信する登録処理手段を具備する。以上の態様では、音声信号から認識された語句を示すコンテンツが配信装置に登録されて端末装置に送信されるから、事前に用意されたコンテンツ以外に音声信号に応じた多様なコンテンツを端末装置に迅速に提供できるという利点がある。
本発明の好適な態様において、近距離無線通信は、音響を伝送媒体とする音響通信である。以上の態様では、音響を伝送媒体とする音響通信で識別情報が伝送されるから、音量の調整により識別情報の到達範囲を容易に制御できるという利点や、音響を広範囲に放射することで複数の端末装置に対して一括的に識別情報を送信できるという利点がある。
以上の各態様に係る端末装置は、専用の電子回路で実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。なお、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。また、本発明は、前述の各態様に係る情報送信装置の動作方法(情報送信方法)としても特定され得る。
本発明の第1実施形態に係る案内システムの構成図である。 端末装置の構成図である。 音声案内装置および情報送信装置の構成図である。 登録情報の模式図である。 情報送信装置の動作のフローチャートである。 第2実施形態の説明図である。 第3実施形態に係る案内システムの構成図である。 第3実施形態における登録処理部の動作のフローチャートである。 第4実施形態における案内システムの構成図である。
<第1実施形態>
図1は、第1実施形態に係る案内システム10の構成図である。第1実施形態の案内システム10は、複数の利用者を収容した状態で移動する電車やバス等の交通機関の車輌(移動体)Mに設置された音響システムであり、利用者に対する各種の音声案内(例えば乗降や乗換,運賃,観光等に関する案内)に利用される。車輌M内の各利用者は、携帯電話機やスマートフォン等の可搬型の端末装置12を携帯する。
図2は、任意の1個の端末装置12の構成図である。図2に例示される通り、第1実施形態の端末装置12は、制御装置121と記憶装置122と通信装置123と操作装置124と再生装置125と収音装置126とを具備する。制御装置121は、記憶装置122に記憶されたプログラムを実行することで各種の演算処理および制御処理を実行する。操作装置124は、端末装置12に対する各種の指示のために利用者が操作する入力機器である。例えば利用者が押圧する複数の操作子や利用者による接触を検知するタッチパネルが操作装置124として好適に利用される。通信装置123は、移動通信網やインターネット等の通信網を介して他端末と通信する。
記憶装置122は、例えば半導体記録媒体や磁気記録媒体等の公知の記録媒体で構成され、制御装置121が実行するプログラムや制御装置121が使用する各種のデータを記憶する。第1実施形態の記憶装置122は複数のコンテンツCを記憶する。各コンテンツCは、案内音声に関連する音声または画像(例えば静止画,動画像,文字列)を包含する。例えば案内音声の発音内容の文字列や発音内容を他言語に翻訳した文字列等の各種の情報を表現するコンテンツCが記憶装置122に記憶される。図2に例示される通り、記憶装置122の各コンテンツCには、当該コンテンツCを一意に識別するための識別情報Dが付加される。例えばウェブサーバ等の配信装置(図示略)から配信されて通信装置123が受信した複数のコンテンツCが記憶装置122に事前に格納される。
再生装置125は、記憶装置122に記憶されたコンテンツCを再生する。具体的には、コンテンツCの画像を表示する表示装置(例えば液晶表示パネル)やコンテンツCの音響を放射する放音装置(例えばスピーカやヘッドホン)が再生装置125として利用される。収音装置126は、周囲の音響を収音して音響信号SBを生成する音響機器である。例えば、各端末装置12の相互間の音声通話や動画撮影時の音声収録に収音装置126が利用される。
図1に例示される通り、第1実施形態の案内システム10は、音声案内装置22と情報送信装置24とを具備する。図3は、音声案内装置22および情報送信装置24の具体的な構成図である。音声案内装置22は、音声案内に利用される既存の放送システムであり、図3に例示される通り、収音装置32と放音装置34とを具備する。収音装置32は、周囲の音響を収音して音声信号Gを生成する音響機器(マイクロホン)である。第1実施形態の収音装置32は、車輌Mの管理者(例えば運転者や案内者)が発声する案内音声の音声信号Gを生成する。放音装置34は、収音装置32が生成した音声信号Gに応じた音響を車輌Mの内部に放射する。したがって、車輌Mの内部の利用者は、放音装置34から放射される案内音声を聴取することが可能である。
図3に例示される通り、収音装置32が生成した音声信号Gは、放音装置34に至る経路から分岐して情報送信装置24にも供給される。情報送信装置24は、収音装置32から供給される音声信号Gの案内音声に対応するコンテンツCの識別情報Dを車輌Mの内部の各端末装置12に送信する。例えば車輌Mに初期的に設置された既存の音声案内装置22に対して情報送信装置24が後付けされる。
図3に例示される通り、第1実施形態の情報送信装置24は、制御装置42と記憶装置44と放音装置46とを具備する。記憶装置44は、例えば半導体記録媒体や磁気記録媒体等の公知の記録媒体で構成され、制御装置42が実行するプログラムや制御装置42が使用する各種のデータ(例えば後述の登録情報X)を記憶する。
制御装置42は、記憶装置44に記憶されたプログラムを実行することで各種の演算処理および制御処理を実行する。第1実施形態の制御装置42は、音声信号Gに応じた識別情報Dを送信するための複数の機能(音声認識部52,情報特定部54,信号生成部56)を実現する。なお、制御装置42の各機能を複数の装置に分散した構成や、音声処理専用の電子回路が制御装置42の機能の一部を実現する構成も採用され得る。なお、収音装置32から供給される音声信号Gをアナログからデジタルに変換するA/D変換器の図示は便宜的に省略した。
図3の音声認識部52は、収音装置32が収音した音声信号Gの案内音声に包含される語句Wを認識する。語句Wは、単数または複数の単語を包含する文字列で表現される。音声信号Gの音声認識には、例えばHMM等の音響モデルと言語的な制約を示す言語モデルとを利用した認識技術等の公知の技術が任意に採用され得る。
情報特定部54は、音声認識部52が認識する語句Wに対応した識別情報Dを特定する。具体的には、情報特定部54は、音声認識部52が認識した語句Wを含む案内音声に関連するコンテンツCの識別情報Dを特定する。例えば、車輌Mが直後に停車する地点(駅やバス停)を利用者に報知する案内音声(例えば「次はA駅です」等の音声)の音声信号Gから、当該地点の名称を意味する語句W(例えば「A駅」等の駅名)が認識されると、情報特定部54は、当該地点に関連するコンテンツC(例えば案内音声の文字列)の識別情報Dを特定する。音声認識部52が認識した語句Wに対応する識別情報Dの特定には、例えば記憶装置44に記憶された登録情報Xが利用される。
図4は、登録情報Xの模式図である。図4に例示される通り、第1実施形態の登録情報Xは、案内音声に包含され得る複数の語句(以下「登録語句」という)W(W1,W2,W3,……)の各々について識別情報D(D1,D2,D3,……)を対応させるデータテーブルである。第1実施形態の登録情報Xでは、音声信号Gが示す案内音声に包含され得る登録語句Wに、当該案内音声に関連するコンテンツCの識別情報Dが対応付けられる。登録情報Xに登録される登録語句Wは、例えば車輌Mが移動する経路(停車地点)等の交通機関の事情や性質に応じて事前に選定される。
図3の情報特定部54が特定した識別情報Dが車輌Mの内部の各端末装置12に送信される。第1実施形態における識別情報Dの送信には近距離無線通信が利用される。近距離無線通信の具体的な通信方式は任意であるが、空気振動たる音響を伝送媒体として識別情報Dを各端末装置12に送信する音響通信を第1実施形態では例示する。具体的には、図3の信号生成部56および放音装置46により、識別情報Dを各端末装置12に送信する送信手段が実現される。信号生成部56は、識別情報Dを含有する音響信号SAを生成して放音装置46に供給する。放音装置46は、信号生成部56が生成した音響信号SAに応じた音響を放射する音響機器(スピーカ)である。なお、信号生成部56が生成する音響信号SAをデジタルからアナログに変換するD/A変換器の図示は便宜的に省略した。
識別情報Dを含有する音響信号SAの生成には公知の方法が任意に採用され得るが、例えば国際公開第2010/016589号に開示された方法が好適である。具体的には、信号生成部56は、拡散符号を利用した識別情報Dの拡散変調と所定の周波数の搬送波を利用した周波数変換とを順次に実行することで、識別情報Dを所定の周波数帯域の音響成分として含有する音響信号SAを生成する。音響信号SAの周波数帯域は、放音装置46による放音と端末装置12の収音装置126による収音とが可能な帯域であり、かつ、利用者が通常の環境で聴取する音声や楽音等の音響の周波数帯域(例えば可聴域内の約16kHz以下)を上回る周波数帯域(例えば18kHz以上かつ20kHz以下)の範囲内に包含される。したがって、車輌M内の利用者に殆ど知覚されることなく識別情報Dを情報送信装置24(放音装置46)から周囲に送信することが可能である。もっとも、識別情報Dを可聴域内の音響として放音装置46から放射する構成も採用され得る。識別情報Dの送信に音響通信を採用した第1実施形態によれば、放音装置46の再生音量の調整等により識別情報Dの受信可能範囲を容易かつ詳細に制御できるという利点がある。
図5は、情報送信装置24の制御装置42が音声信号Gに対応する識別情報Dを端末装置12に送信するための処理のフローチャートである。例えば情報送信装置24の電源が投入されると図5の処理が継続的に実行される。
情報送信装置24の音声認識部52は、収音装置32から供給される音声信号Gについて音声認識を実行する(S1)。情報特定部54は、記憶装置44に記憶された登録情報Xを参照することで、登録情報Xに登録された複数の登録語句Wの何れかを音声認識部52が認識したか否かを判定する(S2)。音声認識部52による音声認識は、登録語句Wが認識されるまで反復される(S2:NO)。音声認識部52が登録語句Wを認識すると(S2:YES)、情報特定部54は、登録情報Xに含まれる複数の識別情報Dのうち音声認識部52が認識した語句Wに対応する識別情報Dを特定する(S3)。信号生成部56は、情報特定部54が特定した識別情報Dを含む音響信号SAを生成して放音装置46から放射する(S4)。識別情報Dは、例えば所定の時間内に複数回にわたり反復的に送信される。識別情報Dの送信が完了すると、音声認識部52による音声認識が再開される(S1)。以上の説明から理解される通り、第1実施形態では、音声信号Gに対する音声認識で登録語句Wが抽出されることを契機として各端末装置12に対する識別情報Dの送信が実行される。
なお、識別情報Dの送信の時期は任意である。例えば、案内音声の音声信号Gから登録語句Wが認識された直後(案内音声の再生の終了前)に識別情報Dを送信する構成や、案内音声の再生の終了後に識別情報Dを送信する構成が採用され得る。また、案内音声内で登録語句Wが存在する区間の長短は案内音声の内容や種類に応じて区々であることが想定されるから、案内音声のうち音声認識の対象となる区間(すなわち登録語句Wが包含され得る区間)を車輌Mの管理者が情報送信装置24に対する操作で任意に指定できる構成も好適である。
車輌M内の各端末装置12の収音装置126は、情報送信装置24の放音装置46から放射された音響(識別情報Dを含有する音響)を収音して音響信号SBを生成する。制御装置121は、収音装置126が生成した音響信号SBの復調で識別情報Dを抽出する。具体的には、制御装置121は、音響信号SBのうち識別情報Dを含有する高域側の周波数帯域(18kHz以上かつ20kHz以下)の音響成分を例えば高域通過フィルタで抽出し、識別情報Dの拡散変調に利用された拡散符号を係数とする整合フィルタを通過させることで識別情報Dを抽出する。以上の説明から理解される通り、第1実施形態の収音装置126は、音響通信により情報送信装置24から識別情報Dを受信する受信手段として機能する。
制御装置121は、記憶装置122に記憶された複数のコンテンツCのうち音響信号SBから抽出した識別情報Dに対応するコンテンツCを再生装置125に再生させる。すなわち、音声案内装置22による案内音声の放射を契機として、当該案内音声に含まれる語句Wに関連するコンテンツC(例えば案内音声の発音内容を他言語に翻訳した文字列)が再生される。
以上に説明した通り、第1実施形態では、放音装置34から放射される案内音声の音声信号Gから認識される語句Wに対応した識別情報Dが各端末装置12に送信される。したがって、案内音声を充分なSN比で収音するために利用者が自身の端末装置12を放音装置34に接近させる必要や、案内音声が放射されるまでの長時間にわたり利用者が自身の端末装置12を放音装置34に接近させた状態で待機する必要はない。すなわち、第1実施形態によれば、端末装置12でコンテンツCを再生する利用者の負担を軽減することが可能である。また、第1実施形態では、音声案内装置22の収音装置32から放音装置34に供給される音声信号Gに対して音声認識が実行されるから、例えば放音装置34から放射された案内音声を再収録した音響信号(すなわち放音から収録までに雑音が重畳された音響信号)に対して音声認識を実行する構成と比較して案内音声の語句Wを高精度に認識できるという利点がある。
なお、放音装置34が放射する案内音声の収音で端末装置12の収音装置126が生成する音響信号SBに音声認識を実行し、認識結果たる語句Wに対応するコンテンツCを端末装置12にて再生する構成(以下「対比例」という)では、放音装置34が放射する案内音声の全区間を収音装置126で収音する必要がある。第1実施形態では、情報送信装置24が送信する識別情報Dさえ収音装置126で収音すればコンテンツCを再生できるから、案内音声の全区間のように長時間にわたり収音装置126による収音を継続する必要がないという利点もある。また、対比例では、放音装置34から放音された案内音声に同様の周波数帯域の雑音(例えば暗騒音や環境雑音)が付加され得るから、端末装置12による音響信号SBの音声認識では、雑音に起因して認識精度が低下する可能性がある。他方、第1実施形態では、通常の環境で想定される一般的な雑音が少ない高周波数帯域(例えば18kHz以上かつ20kHz以下)を利用した音響通信が実行されるから、対比例と比較して雑音の影響を低減できる(具体的には、雑音に対して頑健に、端末装置12において所期のコンテンツCを再生できる)という利点がある。
<第2実施形態>
本発明の第2実施形態について説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
第1実施形態では、複数のコンテンツCが端末装置12の記憶装置122に事前に記憶された構成を例示した。第2実施形態では、図6に例示される通り、移動通信網やインターネット等の通信網16を介して端末装置12の通信装置123が通信可能な配信装置14(例えばウェブサーバ)に複数のコンテンツCが保持される。配信装置14が保持する各コンテンツCには、当該コンテンツCを一意に識別するための識別情報Dが付加される。
第1実施形態と同様の手順で情報送信装置24から送信された識別情報Dを取得すると、端末装置12の制御装置121は、当該識別情報Dを含む情報要求Rを通信装置123から配信装置14に送信する。配信装置14は、複数のコンテンツCのうち情報要求Rに含まれる識別情報Dに対応するコンテンツCを選択して要求元の端末装置12に送信する。端末装置12の制御装置121は、通信装置123が配信装置14から受信したコンテンツCを再生装置125に再生させる。なお、コンテンツCを配信装置14から端末装置12にストリーミング配信することも可能である。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、端末装置12による識別情報Dの抽出毎(すなわち案内音声の放送毎)に、当該識別情報Dに対応するコンテンツCが配信装置14から端末装置12に提供されるから、複数のコンテンツCを端末装置12が保持する必要はない。したがって、端末装置12の記憶装置122に必要な記憶容量が削減されるという利点がある。他方、第1実施形態では、端末装置12によるコンテンツCの再生に配信装置14との通信が不要であるから、例えば端末装置12の通信装置123が通信できない状況(例えば山間部等で通信網16からの電波が端末装置12に到達しない状況)でも端末装置12を利用してコンテンツCを再生できるという利点がある。また、第2実施形態では、配信装置14から各端末装置12にコンテンツCが提供されるから、各端末装置12がコンテンツCを保持する第1実施形態と比較して、識別情報DとコンテンツCとの関係を統括的に変更できるという利点や、新規なコンテンツCを統括的に追加できるという利点もある。
<第3実施形態>
図7は、本発明の第3実施形態に係る案内システム10の構成図である。図7に例示される通り、第3実施形態では、第2実施形態と同様に、相異なる識別情報Dが付加された複数のコンテンツCが配信装置14に保持され、端末装置12からの情報要求Rで指定された識別情報DのコンテンツCが配信装置14から要求元の端末装置12に送信される。
図7に例示される通り、第3実施形態における情報送信装置24の制御装置42は、第1実施形態と同様の要素に加えて登録処理部58として機能する。登録処理部58は、音声信号Gに対する音声認識で音声認識部52が認識した語句Wを新規なコンテンツCとして配信装置14に登録する。
図8は、第3実施形態の登録処理部58の動作のフローチャートである。例えばコンテンツC(語句W)の登録が車輌Mの管理者から指示された状態で音声認識部42が語句Wを認識した場合に図8の処理が開始される。
登録処理部58は、音声認識部52が認識した語句Wに対応する識別情報Dを生成する(S10)。識別情報Dは、登録情報Xの登録済の語句Wや配信装置14が保持する既存のコンテンツCの識別情報Dとは重複しないように生成される。登録処理部58は、図7に例示される通り、語句Wを含むコンテンツCと新規に生成した識別情報Dとを含む登録要求を配信装置14に送信する(S11)。配信装置14は、情報送信装置24から送信された登録要求を通信網16から受信し、当該登録要求に含まれるコンテンツCと識別情報Dとを相互に対応させて記憶する。また、登録処理部58は、音声認識部52が認識した語句Wと識別情報Dとを記憶装置44の登録情報Xに登録するとともに(S12)、当該識別情報Dを含む音響信号SAを信号生成部56に生成させる(S13)。第1実施形態と同様に、信号生成部56が生成した音響信号SAに応じた音響は放音装置46から車輌M内の各端末装置12に放射される。すなわち、識別情報Dが情報送信装置24から各端末装置12に送信される。
端末装置12は、第2実施形態と同様に、情報送信装置24から受信(すなわち収音)した識別情報Dを含む情報要求Rを配信装置14に送信する。配信装置14は、複数のコンテンツCのうち情報要求Rに含まれる識別情報Dに対応するコンテンツCを選択して要求元の端末装置12に送信する。すなわち、情報送信装置24の登録処理部58が登録要求(S11)で登録したコンテンツC(具体的には音声信号Gから認識された語句Wを含むコンテンツC)が端末装置12に提供される。
第3実施形態においても第1実施形態や第2実施形態と同様の効果が実現される。また、第3実施形態では、音声信号Gから認識された語句Wに応じたコンテンツCが配信装置14に登録されて端末装置12に提供されるから、登録情報Xに事前に登録されたコンテンツC以外に音声信号Gに応じた多様なコンテンツCを端末装置12に迅速に提供できるという利点がある。例えば、「火事です」等の緊急時用の案内音声の音声信号Gから認識される語句W(例えば「火事です」という文字列)をコンテンツCとして配信装置14に登録することで、当該案内音声の放音から遅延することなく緊急時用のコンテンツCを端末装置12で再生することが可能である。
<第4実施形態>
図9は、本発明の第4実施形態における案内システム10の構成図である。図9に例示される通り、第4実施形態の案内システム10は、第1実施形態と同様の要素に加えて混合部62を具備する。また、第4実施形態の情報送信装置24は、第1実施形態の構成から放音装置46を省略した構成である。図9に例示される通り、情報送信装置24の信号生成部56が生成した音響信号SAが混合部62に供給される。
混合部62は、情報送信装置24(信号生成部56)が生成した音響信号SAと収音装置32が生成した案内音声の音声信号Gとを混合して放音装置34に供給する。したがって、案内音声の語句Wに対応する識別情報Dの音響成分と当該案内音声との混合音が放音装置34から放射される。すなわち、第4実施形態では、信号生成部56と混合部62と音声案内装置22の放音装置34とが、識別情報Dを各端末装置12に送信する送信手段として機能する。
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、識別情報Dの音響成分と案内音声との混合音が放音装置34から放射される。すなわち、案内音声を放射する放音装置34が識別情報Dの送信に流用される。したがって、識別情報Dの送信に専用される放音装置46は不要であり、第1実施形態と比較して案内システム10の構成が簡素化されるという利点がある。なお、第2実施形態や第3実施形態を第4実施形態に適用することも可能である。
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
(1)前述の各形態では、電車やバス等の車輌Mに案内システム10を設置した場合を例示したが、案内システム10が設置される設備は以上の例示に限定されない。例えば、車輌Mのほか船舶や航空機等を含む移動体(端末装置12を収容して移動する設備)に案内システム10を設置することも可能である。また、美術館や博物館等の展示施設の案内に前述の各形態の案内システム10を利用することも可能である。
(2)前述の各形態では、収音装置32が生成する音声信号Gから語句Wを抽出したが、音声信号Gの供給元は収音装置32に限定されない。例えば事前に収録された案内音声を示す複数の音声信号Gを記憶装置に事前に格納し、複数の音声信号Gのうち車輌Mの管理者(例えば運転者)が選択した案内音声の音声信号Gを放音装置34と情報送信装置24とに供給することも可能である。
(3)前述の各形態では、音響を伝送媒体とする音響通信で識別情報Dを各端末装置12に送信したが、識別情報Dを送信するための通信方式は音響通信に限定されない。例えば、電波や赤外線等の電磁波を伝送媒体とした無線通信で情報送信装置24から周囲に識別情報Dを送信することも可能である。以上の例示から理解される通り、識別情報Dの送信には、通信網16が介在しない近距離無線通信が好適であり、音響を伝送媒体とする音響通信や電磁波を伝送媒体とする無線通信は近距離無線通信の例示である。
なお、例えば無線通信に利用される赤外線等の電磁波は指向性ないし直進性が強いのに対し、音響通信に利用される音響は広範囲に伝播され得るから、車輌Mの内部の多数の端末装置12に対して一括的に識別情報Dを送信することが可能である。しかも、音響通信で識別情報Dを送信する構成では、各端末装置12の相互間の音声通話や動画撮影時の音声収録に利用される収音装置126を識別情報Dの受信に流用できる。したがって、識別情報Dの受信に専用される無線通信機器が不要であるという利点もある。
10……案内システム、12……端末装置、14……配信装置、16……通信網、22……音声案内装置、24……情報送信装置、32……収音装置、34……放音装置、42……制御装置、44……記憶装置、46……放音装置、52……音声認識部、54……情報特定部、56……信号生成部、62……混合部、121……制御装置、122……記憶装置、123……通信装置、124……操作装置、125……再生装置、126……収音装置。

Claims (5)

  1. 音声信号が示す音声の語句を認識する音声認識手段と、
    相異なる語句に対応する複数の識別情報のうち前記音声認識手段が認識した語句に対応する識別情報を特定する情報特定手段と、
    識別情報が示すコンテンツを再生可能な端末装置に、前記情報特定手段が特定した識別情報を送信する送信手段と
    を具備する情報送信装置。
  2. 前記情報特定手段は、複数の識別情報と事前に登録された複数の語句とを対応付ける登録情報を参照し、前記登録情報に登録された複数の語句の何れかを前記音声認識手段が認識した場合に、当該語句に対応する識別情報を前記登録情報から特定する
    請求項1の情報送信装置。
  3. 前記音声認識手段は、前記端末装置を収容して移動する移動体に設置された収音装置から放音装置に供給される音声信号が示す音声の語句を認識する
    請求項1または請求項2の情報送信装置。
  4. 前記音声認識手段が認識した語句を示すコンテンツと当該語句に対応する識別情報とを、端末装置から要求された識別情報に対応するコンテンツを当該端末装置に提供する配信装置に送信する登録処理手段
    を具備する請求項1から請求項3の何れかの情報送信装置。
  5. 前記送信手段は、音響を伝送媒体とする音響通信により前記識別情報を送信する
    請求項1から請求項4の何れかの情報送信装置。
JP2014235622A 2014-11-20 2014-11-20 情報送信装置および情報送信方法 Active JP6114249B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2014235622A JP6114249B2 (ja) 2014-11-20 2014-11-20 情報送信装置および情報送信方法
EP15860790.3A EP3223275B1 (en) 2014-11-20 2015-11-20 Information transmission device, information transmission method, guide system, and communication system
CN201580063110.5A CN107004416B (zh) 2014-11-20 2015-11-20 信息发送装置、信息发送方法、引导系统和通信系统
PCT/JP2015/082765 WO2016080535A1 (ja) 2014-11-20 2015-11-20 情報送信装置、情報送信方法、案内システム及び通信システム
US15/599,072 US20170255615A1 (en) 2014-11-20 2017-05-18 Information transmission device, information transmission method, guide system, and communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014235622A JP6114249B2 (ja) 2014-11-20 2014-11-20 情報送信装置および情報送信方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016177344A Division JP6569629B2 (ja) 2016-09-12 2016-09-12 情報送信装置、情報送信方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2016099466A true JP2016099466A (ja) 2016-05-30
JP2016099466A5 JP2016099466A5 (ja) 2016-11-04
JP6114249B2 JP6114249B2 (ja) 2017-04-12

Family

ID=56014065

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014235622A Active JP6114249B2 (ja) 2014-11-20 2014-11-20 情報送信装置および情報送信方法

Country Status (5)

Country Link
US (1) US20170255615A1 (ja)
EP (1) EP3223275B1 (ja)
JP (1) JP6114249B2 (ja)
CN (1) CN107004416B (ja)
WO (1) WO2016080535A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6033927B1 (ja) * 2015-06-24 2016-11-30 ヤマハ株式会社 情報提供システムおよび情報提供方法
CN108140384A (zh) * 2015-10-15 2018-06-08 雅马哈株式会社 信息管理系统和信息管理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004164589A (ja) * 2002-09-24 2004-06-10 Nariyuki Motoi コンテンツ提供システム
JP2010003219A (ja) * 2008-06-23 2010-01-07 Yahoo Japan Corp 関連クエリ導出装置、関連クエリ導出方法及びプログラム
WO2010016589A1 (ja) * 2008-08-08 2010-02-11 ヤマハ株式会社 変調装置及び復調装置
JP2012194898A (ja) * 2011-03-17 2012-10-11 Mizuho Information & Research Institute Inc プレゼンテーション支援システム、プレゼンテーション支援方法及びプレゼンテーション支援プログラム

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5193141A (en) * 1990-11-19 1993-03-09 Zwern Arthur L Vehicular voice storage, playback, and broadcasting device
TW347503B (en) * 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
US6957213B1 (en) * 2000-05-17 2005-10-18 Inquira, Inc. Method of utilizing implicit references to answer a query
US7747434B2 (en) * 2000-10-24 2010-06-29 Speech Conversion Technologies, Inc. Integrated speech recognition, closed captioning, and translation system and method
US7203648B1 (en) * 2000-11-03 2007-04-10 At&T Corp. Method for sending multi-media messages with customized audio
JP2002297177A (ja) * 2001-03-29 2002-10-11 Sharp Corp 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
JP2002366166A (ja) * 2001-06-11 2002-12-20 Pioneer Electronic Corp コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム
US20020198716A1 (en) * 2001-06-25 2002-12-26 Kurt Zimmerman System and method of improved communication
US7162254B1 (en) * 2002-09-09 2007-01-09 Bellsouth Intellectual Property Corp: Methods and systems for delivering travel-related information
US20040059578A1 (en) * 2002-09-20 2004-03-25 Stefan Schulz Method and apparatus for improving the quality of speech signals transmitted in an aircraft communication system
JP3920812B2 (ja) * 2003-05-27 2007-05-30 株式会社東芝 コミュニケーション支援装置、支援方法、及び支援プログラム
US8666746B2 (en) * 2004-05-13 2014-03-04 At&T Intellectual Property Ii, L.P. System and method for generating customized text-to-speech voices
CN1584874A (zh) * 2004-06-15 2005-02-23 汪兰珍 一种智能采集、语言互译、语音合成的方法及装置
US7830408B2 (en) * 2005-12-21 2010-11-09 Cisco Technology, Inc. Conference captioning
CN101030130A (zh) * 2006-03-02 2007-09-05 英华达(南京)科技有限公司 利用语音识别实现字元输入的手持式装置及方法
CN101809651B (zh) * 2007-07-31 2012-11-07 寇平公司 提供语音到语音翻译和模拟人类属性的化身的移动无线显示器
US20090171663A1 (en) * 2008-01-02 2009-07-02 International Business Machines Corporation Reducing a size of a compiled speech recognition grammar
US8019276B2 (en) * 2008-06-02 2011-09-13 International Business Machines Corporation Audio transmission method and system
WO2009146700A1 (en) * 2008-06-04 2009-12-10 Gn Netcom A/S A wireless headset with voice announcement means
CN201345797Y (zh) * 2008-10-07 2009-11-11 厦门市海菱电子有限公司 一种车载收放机
CN201323726Y (zh) * 2008-12-05 2009-10-07 王文华 带无线喊话器的车载式音响
US20110153330A1 (en) * 2009-11-27 2011-06-23 i-SCROLL System and method for rendering text synchronized audio
US20120253822A1 (en) * 2009-12-11 2012-10-04 Thomas Barton Schalk Systems and Methods for Managing Prompts for a Connected Vehicle
US20110183725A1 (en) * 2010-01-28 2011-07-28 Shai Cohen Hands-Free Text Messaging
CN103038818B (zh) * 2010-06-24 2016-10-12 本田技研工业株式会社 在车载语音识别系统与车外语音识别系统之间的通信系统和方法
GB2481992A (en) * 2010-07-13 2012-01-18 Sony Europe Ltd Updating text-to-speech converter for broadcast signal receiver
US8468010B2 (en) * 2010-09-24 2013-06-18 Damaka, Inc. System and method for language translation in a hybrid peer-to-peer environment
WO2012051288A2 (en) * 2010-10-12 2012-04-19 Armital Llc System and method for providing audio content associated with broadcasted multimedia and live entertainment events based on profiling information
EP2696579B1 (en) * 2011-04-05 2019-04-24 YAMAHA Corporation Information providing system, identification information solution server and mobile terminal device
CN103503482A (zh) * 2011-05-04 2014-01-08 峰力公司 自学式听力辅助系统及其操作方法
CN102779509B (zh) * 2011-05-11 2014-12-03 联想(北京)有限公司 语音处理设备和语音处理方法
US9230549B1 (en) * 2011-05-18 2016-01-05 The United States Of America As Represented By The Secretary Of The Air Force Multi-modal communications (MMC)
US9026446B2 (en) * 2011-06-10 2015-05-05 Morgan Fiumi System for generating captions for live video broadcasts
US8798995B1 (en) * 2011-09-23 2014-08-05 Amazon Technologies, Inc. Key word determinations from voice data
US9015032B2 (en) * 2011-11-28 2015-04-21 International Business Machines Corporation Multilingual speech recognition and public announcement
JP2013186228A (ja) * 2012-03-07 2013-09-19 Seiko Epson Corp 音声認識処理装置及び音声認識処理方法
US9026439B2 (en) * 2012-03-28 2015-05-05 Tyco Fire & Security Gmbh Verbal intelligibility analyzer for audio announcement systems
EP2845191B1 (en) * 2012-05-04 2019-03-13 Xmos Inc. Systems and methods for source signal separation
KR101907406B1 (ko) * 2012-05-08 2018-10-12 삼성전자 주식회사 통신 서비스 운용 방법 및 시스템
CN102811284A (zh) * 2012-06-26 2012-12-05 深圳市金立通信设备有限公司 一种语音输入自动翻译为目标语言的方法
CN103794215A (zh) * 2012-10-30 2014-05-14 上海斐讯数据通信技术有限公司 基于语音控制的手持终端、系统及其基于语音的控制方法
CN202871252U (zh) * 2012-11-09 2013-04-10 许巧智 基于录音笔的具有翻译功能的导游系统
CN202980310U (zh) * 2012-11-16 2013-06-12 南通纺织职业技术学院 一种导游帽
KR20140088449A (ko) * 2013-01-02 2014-07-10 엘지전자 주식회사 중앙 제어 장치 및 그것의 제어 방법
US9549295B2 (en) * 2013-02-08 2017-01-17 Audionow Ip Holdings, Llc System and method for broadcasting audio tweets
KR102108500B1 (ko) * 2013-02-22 2020-05-08 삼성전자 주식회사 번역 기반 통신 서비스 지원 방법 및 시스템과, 이를 지원하는 단말기
CN203217358U (zh) * 2013-05-06 2013-09-25 天津恒达文博科技有限公司 车船讲解调度管理设备
KR101456974B1 (ko) * 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법
CN203340192U (zh) * 2013-05-29 2013-12-11 郑州宇通客车股份有限公司 客车视听播放系统
KR102195897B1 (ko) * 2013-06-05 2020-12-28 삼성전자주식회사 음향 사건 검출 장치, 그 동작 방법 및 그 동작 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능 기록 매체
KR102060661B1 (ko) * 2013-07-19 2020-02-11 삼성전자주식회사 통신 방법 및 이를 위한 디바이스
CN103731707A (zh) * 2013-12-03 2014-04-16 乐视致新电子科技(天津)有限公司 移动终端设备控制智能电视端语音输入的方法及系统
CN203858414U (zh) * 2014-01-09 2014-10-01 盈诺飞微电子(上海)有限公司 头戴式语音识别投影装置及系统
CN104036779B (zh) * 2014-06-24 2017-12-26 湖南大学 一种用于移动平台的无线语音控制方法及系统
JP6346281B2 (ja) * 2014-07-04 2018-06-20 クラリオン株式会社 車載対話型システム、及び車載情報機器
US9751527B2 (en) * 2014-07-09 2017-09-05 Alcatel-Lucent Usa Inc. In-the-road, passable obstruction avoidance arrangement

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004164589A (ja) * 2002-09-24 2004-06-10 Nariyuki Motoi コンテンツ提供システム
JP2010003219A (ja) * 2008-06-23 2010-01-07 Yahoo Japan Corp 関連クエリ導出装置、関連クエリ導出方法及びプログラム
WO2010016589A1 (ja) * 2008-08-08 2010-02-11 ヤマハ株式会社 変調装置及び復調装置
JP2012194898A (ja) * 2011-03-17 2012-10-11 Mizuho Information & Research Institute Inc プレゼンテーション支援システム、プレゼンテーション支援方法及びプレゼンテーション支援プログラム

Also Published As

Publication number Publication date
WO2016080535A1 (ja) 2016-05-26
CN107004416B (zh) 2021-05-18
EP3223275A4 (en) 2018-07-18
US20170255615A1 (en) 2017-09-07
JP6114249B2 (ja) 2017-04-12
EP3223275A1 (en) 2017-09-27
CN107004416A (zh) 2017-08-01
EP3223275B1 (en) 2019-07-10

Similar Documents

Publication Publication Date Title
JP6860055B2 (ja) 情報提供方法、端末装置の動作方法、情報提供システム、端末装置およびプログラム
JP5871088B1 (ja) 端末装置、情報提供システム、情報提供方法およびプログラム
JP5887446B1 (ja) 情報管理システム、情報管理方法およびプログラム
JP6213700B1 (ja) 端末装置、情報提供方法およびプログラム
JP6114249B2 (ja) 情報送信装置および情報送信方法
JP6569629B2 (ja) 情報送信装置、情報送信方法およびプログラム
CN107209901B (zh) 信息提供系统、信息提供方法以及管理装置
JP6493343B2 (ja) 情報提供システム、情報提供方法およびプログラム
JP2017033398A (ja) 端末装置
JP6955838B2 (ja) 再生制御装置、再生制御方法およびプログラム
JP6881477B2 (ja) 情報提供システム、情報提供方法およびプログラム
JP7087745B2 (ja) 端末装置、情報提供システム、端末装置の動作方法および情報提供方法
JP7067597B2 (ja) 情報提供方法、情報提供装置、移動端末の動作方法、移動端末およびプログラム
JP6780529B2 (ja) 情報提供装置および情報提供システム
JP2020198550A (ja) プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160912

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160912

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20160912

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20161121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170316

R151 Written notification of patent or utility model registration

Ref document number: 6114249

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151