JP2021119379A - 音声放送方法、装置、システム、機器およびコンピュータ可読媒体 - Google Patents

音声放送方法、装置、システム、機器およびコンピュータ可読媒体 Download PDF

Info

Publication number
JP2021119379A
JP2021119379A JP2021040983A JP2021040983A JP2021119379A JP 2021119379 A JP2021119379 A JP 2021119379A JP 2021040983 A JP2021040983 A JP 2021040983A JP 2021040983 A JP2021040983 A JP 2021040983A JP 2021119379 A JP2021119379 A JP 2021119379A
Authority
JP
Japan
Prior art keywords
audio
broadcasting
parameter information
broadcast
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021040983A
Other languages
English (en)
Inventor
ウェイ・シャン
Shang Wei
ジエンジョー・チェン
Jianzhe Chen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN202010333064.9A external-priority patent/CN113643686B/zh
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021119379A publication Critical patent/JP2021119379A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/44Arrangements characterised by circuits or components specially adapted for broadcast
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • G10L13/0335Pitch control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/49Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying locations
    • H04H60/53Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying locations of destinations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】異なる音声放送内容に対して差別化された放送パラメータを設定することで、異なる音声放送内容を際立たせ、ユーザ体験を向上させる音声放送方法、装置、システム、機器、コンピュータ可読記憶媒体及びコンピュータプログラム製品を提供する。【解決手段】音声放送方法は、音声放送指令における各音声放送内容に対して優先度パラメータ情報を設けるステップと、優先度パラメータ情報に基づき、各音声放送内容の放送パラメータを調整するステップと、調整後の放送パラメータに従って、各音声放送内容を放送するステップと、を含む。【選択図】図2

Description

本開示の実施例はオーディオ処理の技術分野に関し、特に、音声放送方法、装置、システム、機器、コンピュータ可読記憶媒体およびコンピュータプログラム製品に係るものである。
コンピュータ技術の発展と普及に伴い、ヒューマンコンピュータインタラクションなどのスマート技術は人々の生活の各方面において便利で快適なサービスを提供している。テキスト音声変換(Text To Speech、TTS)技術は、テキストから音声への変換を実現可能であり、人工知能技術におけるヒューマンコンピュータインタラクションの重要な技術である。
音声放送過程において、通常は、放送すべきTTS内容に統一的な放送戦略を採用し、即ち、放送パラメータが完全に一致する。完全に一致した放送パラメータを用いることで、放送パラメータの設定方式が単一となり、重要なTTSの内容が見落とされやすくなる。
本開示の実施例は、音声放送方法、装置、システム、機器、コンピュータ可読記憶媒体およびコンピュータプログラム製品を提供し、異なる音声放送内容に対して差別化された放送パラメータを設定することができ、これにより、異なる音声放送内容を際立たせ、ユーザ体験を向上させる。
第一態様において、本開示の実施例では、音声放送指令における各音声放送内容の優先度パラメータ情報を設けるステップと、優先度パラメータ情報に基づき、各音声放送内容の放送パラメータを調整するステップと、調整後の放送パラメータに従って、各音声放送内容を放送するステップと、を含む音声放送方法を提供する。
第二態様において、本開示の実施例では、音声放送指令における各音声放送内容の優先度パラメータ情報を確定するためのパラメータ確定モジュールと、優先度パラメータ情報に基づき、各音声放送内容の放送パラメータを調整して、各音声放送内容の調整後の放送パラメータを得るためのパラメータ調整モジュールと、調整後の放送パラメータに従って、各音声放送内容を放送するための内容放送モジュールと、を含む音声放送装置を提供する。
第三態様において、本開示の実施例では、少なくとも1つの音声放送内容が含まれる音声放送指令を受信するための指令受信装置と、受信した音声放送指令に応じて、上記のいずれかの音声放送方法を実行するための音声放送装置と、を含む音声放送システムを提供する。
第四態様において、本開示の実施例では、1つまたは複数のプロセッサと、1つまたは複数のプログラムが記憶され、1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに、上記のいずれかの音声放送方法を実行させるメモリと、プロセッサとメモリとの間に接続され、プロセッサとメモリの情報インタラクションを実現するように配置された1つまたは複数のI/Oインターフェースと、を含む音声放送機器を提供する。
第五態様において、本開示の実施例では、コンピュータプログラムが記憶され、コンピュータプログラムがプロセッサによって実行される時に、上記のいずれかの音声放送方法を実現するコンピュータ可読記憶媒体を提供する。
第六態様において、本開示の実施例では、プロセッサによって実行される時に、上記のいずれかの音声放送方法を実現するコンピュータプログラムを備えるコンピュータプログラム製品を提供する。
本開示の実施例が提供する音声放送方法、装置、システム、機器、コンピュータ可読記憶媒体およびコンピュータプログラム製品は、音声放送指令における各音声放送内容に対して優先度パラメータ情報を設けることが可能で、設けられた優先度パラメータ情報に基づいて各音声放送内容の放送パラメータを調整し、異なる音声放送内容に対して差別化された放送パラメータを設定することができ、これにより異なる音声放送内容を際立たせ、ユーザ体験を向上させる。
図面は本開示の実施例のさらなる理解を提供するために使用され、本明細書の一部を構成し、本開示の実施例とともに本開示を説明するために使用されるもので、本開示を限定するものではない。図面を参照しながら詳しい例示的な実施例を説明することにより、上記および他の特徴と利点は当業者にとってより自明なものになる。
本開示の実施例が提供するシーン概念図である。 本開示の実施例が提供する音声放送方法のフローチャートである。 本開示の実施例が提供するもう1つの音声放送方法のフローチャートである。 本開示の実施例が提供する音声放送装置の構造ブロック図である。 本開示の実施例が提供する音声放送システムの構造ブロック図である。 本開示の実施例が提供する音声放送機器の構造ブロック図である。 本開示の実施例が提供するコンピュータ可読記憶媒体の構造ブロック図である。
本開示の技術案を当業者により良く理解させるために、以下では図面を組み合わせて本開示が提供する音声放送方法、装置、システム、機器、コンピュータ可読記憶媒体およびコンピュータプログラム製品について詳細に説明する。
以下では、図面を参照して例示的な実施例についてより詳細に説明するが、例示的な実施例は種々の形態で体現することができ、且つ本明細書で説明する実施例に限定されると解釈されるべきではない。むしろ、これらの実施例を提供する目的は、本開示を徹底して完全なものにし、当業者に本開示の範囲を十分に理解させることである。矛盾しない限り、本開示の各実施例および実施例における各特徴は、互いに組み合わせることが可能である。
TTSは音声合成アプリケーションの一種であり、コンピュータに記憶されたファイルやテキストの内容を自然な音声出力に変換する。TTSはコンピュータ上の情報の読み取りを補助するだけでなく、テキスト文書の可読性を高めることができる。
図1は、本開示の実施例の音声放送方法のシーン概念図である。図1に示すように、当該シーンには、ユーザ10および音声放送機器20が含まれる。
音声ナビゲーションシーンにおいて、音声放送機器20は、受信した目的地情報に基づいてナビゲーション情報を生成することができ、テキスト音声変換技術を用いて、ナビゲーション情報に対応する音声放送指令を生成し、当該音声放送指令における音声放送内容をユーザ10に放送することで、ユーザ10が車両走行中にリアルタイムで当該音声放送の走行ルートおよび道路状況情報を取得することができる。
本開示の実施例において、音声放送方法は、音声ナビゲーションシーンだけでなく、人工知能インタラクションシーンおよび純音声アプリケーションの放送などの使用シーンに適用することができる。
人工知能インタラクションシーンにおいて、人工知能機器はオーディオ信号を受信し、オーディオ信号をオーディオ処理してインタラクション情報を生成することができ、この時、生成されたインタラクション情報を音声放送する必要がある。
他の純音声アプリケーションの放送シーンにおいては、天気情報の深刻さについて放送したり、文章やジョークなどのテキスト内容を放送することができ、日程情報などの内容について放送することもできる。音声放送内容は、任意の音声放送形式で放送される内容であってよく、実際のシーンによって音声放送内容は異なってよく、本開示の実施例は特に限定しないと理解されたい。
音声放送の際に、放送しようとする各音声放送内容に対して、統一した放送戦略を用い、各音声放送内容の放送パラメータを特に区別しない場合、ある重要なTTS内容について、ユーザによっては見落としやすい場合がある。
図2は、本開示の実施例が提供する音声放送方法のフローチャートを示す。図2に示すように、1つの実施例において、当該音声放送方法は以下のようなステップを含むことができる。
S110、音声放送指令における各音声放送内容の優先度パラメータ情報を設けるステップ。
S120、優先度パラメータ情報に基づき、各音声放送内容の放送パラメータを調整するステップ。
S130、調整後の放送パラメータに従って、各音声放送内容を放送するステップ。
本開示の実施例の音声放送方法によれば、音声放送指令における各音声放送内容に対して優先度パラメータ情報を設けることが可能で、設けられた優先度パラメータ情報に基づいて各音声放送内容の放送パラメータを調整し、異なる音声放送内容に対して差別化された放送パラメータを設定することができ、これにより、異なる音声放送内容を際立たせ、ユーザ体験を向上させる。
1つの実施例において、ステップS110の前には、S11、少なくとも1つの音声放送内容が含まれる音声放送指令を受信するステップを含んでもよい。
本開示の実施例において、音声放送指令における音声放送内容は、音声放送の形態で出力される任意の内容であってよい。1つの実施例において、当該音声放送内容は、音声ナビゲーションシステムによって生成されるナビゲーション情報に対応する放送内容と、人工知能インタラクションシステムによって生成されるインタラクション情報に対応する放送内容と、または他の純音声アプリケーションにおける放送内容を含むが、これらに限定されない。
そのうち、人工知能インタラクションシステムによって生成されるインタラクション情報に対応する放送内容において、当該インタラクション情報は、ユーザが入力したオーディオ信号に応じて生成されるインタラクション情報であってよく、他の純音声アプリケーションの放送内容において、当該放送内容は、文章やジョークなどのテキスト内容の放送、天気情報の深刻さの放送、または期限間近の日程放送などを含むが、これらに限定されない。
上記実施例において、音声放送指令は、音声によりルートのナビゲーション情報を提供するための、ナビゲーションシステムによって生成される放送指令であってよく、あるいは、音声インタラクション情報を提供するための、人工知能インタラクションシステムによって生成される放送指令であってもよく、あるいは、純音声アプリケーションにおける放送内容に対応する放送指令であってもよい。
なお、上記音声放送内容の例はあくまでも例示に過ぎず、実用上の需要に応じて、音声放送内容は、音声放送の形態で出力される任意の内容であってよく、具体的には、実用場面に応じて柔軟に配置することができ、この方面の内容は特に限定しないと理解されたい。
1つの実施例において、ステップS110は具体的に、S21、各音声放送内容から特定重要情報を抽出するステップと、S22、特定重要情報を含む音声放送内容に対して、特定重要情報に対応する優先度パラメータ情報を設けるステップと、を含むことができる。
当該実施例において、特定重要情報が抽出されていない音声放送内容については、機器優先度パラメータ情報が、当該元の放送パラメータ情報と一致してよい。
1つの実施例において、当該優先度パラメータ情報は放送前に、ユーザにより手動設定またはカスタム設定することもできる。
1つの実施例において、音声放送内容がナビゲーション情報に対応する放送内容を含む場合、特定重要情報には、例えば、特定道路状況情報または特定交差点情報を含んでよい。特定道路状況情報は、例えば、カーブ情報、道路工事情報、道路事故情報などを含み、特定交差点は、例えば、信号交差点、ナビゲーション情報における行先の重要交差点などを含んでよい。
ある実施例において、音声放送内容における特定重要情報は、例えば、天気予報情報、災害性天気情報、期限間近の日程情報などをさらに含んでもよい。本開示の実施例において、音声放送内容における特定重要情報は、ナビゲーションシステム、人工知能インタラクションシステムまたは他の純音声アプリケーションを使用する前に、ユーザにより実際の状況に応じて予め設定される特定情報であってもよく、本開示の実施例では特に限定しない。
1つの実施例において、優先度パラメータ情報のカテゴリには、音声特徴パラメータおよびヒント音特徴パラメータの少なくとも1つが含まれる。
具体的に、音声特徴パラメータは、音速、音量、音調、音高、音色、響きの少なくとも1つを含み、および/または、ヒント音特徴パラメータは、ヒント音の内容、ヒント音の長さ、ヒント音繰返し回数の少なくとも1つを含む。
当該実施例では、一例として、ある音声放送内容に特定重要情報が含まれている場合、放送音量または他の警告音等を適宜に大きくすることで、音声放送内容の重要性を告知することができる。
例えば、ナビゲーション過程において、我々は、カーブまたは交差点において、事前に反応するために、この策略を通じてどのように走行するかをユーザに警告し、天気情報の放送過程では、事前に出かける計画などを立てるために、この策略を通じて、天気予報情報に注意するようユーザに警告することができる。
1つの実施例において、ステップS120は具体的に、S31、優先度パラメータ情報を分類して、優先度パラメータ情報のカテゴリを得るステップと、S32、カテゴリに従って、各カテゴリに含まれる各音声放送内容の放送パラメータをそれぞれ調整するステップと、を含む。
当該実施例において、優先度パラメータ情報を分類した後、同じカテゴリのパラメータを毎回調整し、例えば、先に音量などの音声特徴パラメータを一括調整してから、ヒント音を一括追加し、毎回1つの種類だけを調整し、設定されたカテゴリの頻繁な切替えを回避して、放送パラメータの調整効率を向上させることができる。
本開示の実施例の音声放送方法によれば、音声放送内容の優先度に基づいて放送の関連パラメータを修正し、ユーザが応答するよう適時に警告でき、ユーザが重要なTTS内容を見逃すことを回避し、ユーザの使用体験を大幅に向上している。
図3は、本開示の別の実施例の音声放送方法のフローチャートを示す。図3に示すように、当該音声放送方法はさらに以下のようなステップを含むことができる。
S201、放送する必要のある音声放送内容を取得し、各音声放送内容の優先度パラメータ情報を定義する。
例として、当該優先度パラメータ情報には、例えば、音量、音速、ヒント音を必要とするかなどが含まれる。
S202、受信した音声放送内容に対して、各音声放送内容の優先度パラメータ情報を分類する。
例として、音量調整、音速調整などは音声特徴パラメータ情報類に分類することができる。
S203、各分類に対応する放送パラメータに従って、各分類における各音声放送内容の放送パラメータを順次調節する。
S204、設定された放送パラメータに基づいて、当該音声放送内容を放送する。
本開示の実施例の音声放送方法によれば、音声放送内容の優先度パラメータ情報に基づいて放送の関連パラメータを修正し、ユーザが応答するよう適時に警告でき、ユーザが重要な音声放送情報を見逃すことを回避する。
図4は、本開示の実施例が提供する音声放送装置の構造ブロック図を示す。図4に示すように、当該音声放送装置は、以下のようなモジュールを含むことができる。
即ち、音声放送指令における各音声放送内容の優先度パラメータ情報を確定するためのパラメータ確定モジュール310と、
優先度パラメータ情報に基づき、各音声放送内容の放送パラメータを調整して、各音声放送内容の調整後の放送パラメータを得るためのパラメータ調整モジュール320と、
調整後の放送パラメータに従って、各音声放送内容を放送するための内容放送モジュール330と、を含む。
1つの実施例において、音声放送装置は、少なくとも1つの音声放送内容が含まれる音声放送指令を受信するための指令受信モジュールをさらに含む。
1つの実施例において、パラメータ確定モジュール310は具体的に、各音声放送内容から特定重要情報を抽出することにさらに用いられ、特定重要情報を含む音声放送内容に対して、特定重要情報に対応する優先度パラメータ情報を設ける。
1つの実施例において、特定重要情報は、特定道路状況情報、特定交差点情報、特定天気情報および/または特定スケジュール情報などを含む。
1つの実施例において、パラメータ調整モジュール320は具体的に、優先度パラメータ情報を分類して、優先度パラメータ情報のカテゴリを得るためのパラメータ分類ユニットをさらに含み、パラメータ調整モジュール320はさらに、カテゴリに従って、各カテゴリに含まれる各音声放送内容の放送パラメータをそれぞれ調整することに用いられる。
1つの実施例において、優先度パラメータ情報のカテゴリは、音声特徴パラメータ情報とヒント音特徴パラメータ情報の少なくとも1つを含む。
1つの実施例において、音声特徴パラメータ情報は、音速、音量、音調、音高、音色、響きの少なくとも1つを含み、および/または、ヒント音特徴パラメータ情報は、ヒント音の内容、ヒント音の長さ、ヒント音繰返し回数の少なくとも1つを含む。
本開示の実施例の音声放送装置によれば、音声放送指令における各音声放送内容に対して優先度パラメータ情報を設けることが可能で、設けられた優先度パラメータ情報に基づいて各音声放送内容の放送パラメータを調整し、異なる音声放送内容を際立たせ、ユーザ体験を向上させる。
本発明は、上記の実施例で説明し、図面に示された特定の配置および処理に限定されないことは明らかである。説明の便宜上および簡潔にするために、ここでは既知の方法の詳細な説明は省略し、且つ上記で説明したシステム、モジュールおよびユニットの具体的な動作過程は、前記方法の実施例における対応過程を参照することができるため、ここでは繰り返し説明しない。
図5は、本開示の実施例の音声放送システムの構造概念図を示す。図5に示すように、当該音声処理システムは、以下のようなモジュールを含むことができる。
即ち、少なくとも1つの音声放送内容が含まれる音声放送指令を受信するための指令受信装置410と、受信した音声放送指令に基づき、上記実施例のいずれかの音声放送方法を実行するための音声放送装置420と、を含む。
上記実施例の説明から分かるように、当該音声放送内容は、音声放送の形態で出力される任意の内容であってよい。例えば、音声ナビゲーションシステムによって生成されるナビゲーション情報に対応する放送内容と、人工知能インタラクションシステムによって生成されるインタラクション情報に対応する放送内容と、または他の純音声アプリケーションにおける放送内容などであり、ここでは繰り返し説明しない。
説明の便宜上および簡潔にするために、ここでは既知の方法の詳細な説明は省略し、且つ上記で説明したシステム、モジュールおよびユニットの具体的な動作過程は、前記方法の実施例における対応過程を参照することができるため、ここでは繰り返し説明しない。
図6は、本開示の実施例が提供する音声放送機器の構造ブロック図を示す。図6に示すように、本開示の実施例では、1つまたは複数のプロセッサ501と、1つまたは複数のプログラムが記憶され、1つまたは複数のプログラムが1つまたは複数のプロセッサによって実行されると、1つまたは複数のプロセッサに、上記のいずれかの音声放送方法を実現させるメモリ502と、プロセッサとメモリとの間に接続され、プロセッサとメモリの情報インタラクションを実現するように配置された1つまたは複数のI/Oインターフェース503と、を含む音声放送機器を提供する。
そのうち、プロセッサ501は、データ処理能力を有するデバイスであり、中央処理装置(CPU)等が含まれるが、これに限定されない。メモリ502は、データ記憶能力を有するデバイスであり、ランダムアクセスメモリ(RAM、より具体的には、例えば、SDRAM、DDRなど)、読み取り専用メモリ(ROM)、電気的消去可能プログラマブル読み取り専用メモリ(EEPROM(登録商標))、フラッシュメモリ(FLASH(登録商標))などが含まれるが、これらに限定されない。I/Oインターフェース(読み書きインターフェース)503は、プロセッサ501とメモリ502との間に接続され、プロセッサ501とメモリ502との情報インタラクションを実現し、これにはデータバス(Bus)などが含まれるが、これに限定されない。
いくつかの実施例において、プロセッサ501、メモリ502およびI/Oインターフェース503は、バス504により互いに接続され、さらには音声放送機器の他のコンポーネントに接続される。
図7は、本開示の実施例が提供するコンピュータ可読記憶媒体の構造ブロック図を示す。図7に示すように、本開示の実施例では、コンピュータプログラムが記憶され、プログラムがプロセッサによって実行される時に、上記のいずれかの音声放送方法を実現するコンピュータ可読記憶媒体を提供する。
上文で公開した方法における全部または幾つかのステップ、システム、装置における機能モジュール/ユニットは、ソフトウェア、ファームウェア、ハードウェアおよびそれらの適切な組み合わせとして実施することが可能であると当業者は理解できる。ハードウェアの実施形態において、上記の説明で言及した機能モジュール/ユニットとの間の区別は、必ずしも物理コンポーネントの区別に対応するとは限らない。例えば、1つの物理コンポーネントは、複数の機能を有してもよく、または1つの機能またはステップは、幾つかの物理コンポーネントによって協働して実行されてもよい。いくつかの物理コンポーネントあるいは全ての物理コンポーネントは、中央処理装置、デジタル信号プロセッサ、マイクロプロセッサなどのプロセッサによって実行されるソフトウェアによって実施されるか、あるいはハードウェアとして実施されるか、あるいは専用集積回路のような集積回路として実施されてもよい。このようなソフトウェアはコンピュータ可読媒体上に設けられ、コンピュータ可読媒体は、コンピュータ記憶媒体(または非一時的媒体)および通信媒体(または一時的媒体)を含むことが可能である。当業者に公知されているように、コンピュータ記憶媒体という用語は、情報(例えば、コンピュータ可読指令、データ構造、プログラムモジュール、または他のデータ)を記憶するための任意の方法または技術で実施される揮発性および不揮発性、取り外し可能および取り外し不可能な媒体を含む。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリあるいは他のメモリ技術、CD-ROM、デジタル多用途ディスク(DVD)あるいは他のCDストレージ、磁気カセット、磁気テープ、磁気ディスクストレージもしくは他の磁気記憶装置を含むが、これらに限定されず、あるいは所望の情報を記憶するために使用され、コンピュータによってアクセス可能な任意の他の媒体であってよい。また、当業者に公知されているように、通信媒体は一般的に、コンピュータ可読指令、データ構造、プログラムモジュール、あるいはキャリアもしくは他の伝送機構などの変調データ信号における他のデータを含み、任意の情報配信媒体を含むことができる。
本開示の実施例では、プロセッサによって実行される時に、上記のいずれかの音声放送方法を実現するコンピュータプログラムを備えるコンピュータプログラム製品を提供する。
本開示の方法を実施するためのプログラムコードは、1つまたは複数のプログラミング言語の任意の組み合わせで書かれてもよい。これらのプログラムコードは、コンピュータプログラムがプロセッサまたはコントローラによって実行される時に、フローチャートおよび/またはブロック図で規定された機能/動作が実施されるように、汎用コンピュータ、専用コンピュータ、または他のプログラマブルデータ処理装置のプロセッサまたはコントローラに提供されてもよい。プログラムコードは、完全にマシン上で実行され、部分的にマシン上で実行され、独立したソフトウェアパッケージとして部分的にマシン上で実行され、且つ部分的にリモートマシン上で実行され、または完全にリモートマシンあるいはサーバ上で実行されてもよい。
本明細書では例示的な実施例が既に公開され、具体的な用語を使用しているが、それらは、一般的な例示的な意味でのみ使用されており、そのように解釈されるべきであり、限定を目的としたものではない。いくつかの実例例では、特に限定しない限り、特定の実施例と組み合わせて説明される特徴、特性および/または素子は、単独で使用してもよく、または他の実施例と組み合わせて説明される特徴、特性および/または要素と組み合わせて使用してもよいということは、当業者にとって自明なことである。よって、添付の特許請求の範囲によって説明される本開示の範囲から逸脱することなく、様々な形態および詳細における変更が可能であることを当業者は理解するであろう。

Claims (11)

  1. 音声放送指令における各音声放送内容の優先度パラメータ情報を設けるステップと、
    前記優先度パラメータ情報に基づき、前記各音声放送内容の放送パラメータを調整するステップと、
    調整後の放送パラメータに従って、前記各音声放送内容を放送するステップと、を含む
    音声放送方法。
  2. 音声放送指令における各音声放送内容の優先度パラメータ情報を設ける前記ステップは、
    前記各音声放送内容から特定重要情報を抽出するステップと、
    前記特定重要情報を含む音声放送内容に対して、前記特定重要情報に対応する優先度パラメータ情報を設けるステップと、を含む
    請求項1に記載の方法。
  3. 前記優先度パラメータ情報に基づき、前記各音声放送内容の放送パラメータを調整する前記ステップは、
    前記優先度パラメータ情報を分類して、前記優先度パラメータ情報のカテゴリを得るステップと、
    前記カテゴリに従って、各カテゴリに含まれる各音声放送内容の放送パラメータをそれぞれ調整するステップと、を含む
    請求項1に記載の方法。
  4. 前記優先度パラメータ情報のカテゴリには、音声特徴パラメータ情報およびヒント音特徴パラメータ情報の少なくとも1つが含まれる
    請求項1に記載の方法。
  5. 前記音声特徴パラメータ情報は、音速、音量、音調、音高、音色、響きの少なくとも1つを含み、および/または、
    前記ヒント音特徴パラメータ情報は、ヒント音の内容、ヒント音の長さ、ヒント音繰返し回数の少なくとも1つを含む
    請求項4に記載の方法。
  6. 音声放送指令における各音声放送内容の優先度パラメータ情報を確定するためのパラメータ確定モジュールと、
    前記優先度パラメータ情報に基づき、前記各音声放送内容の放送パラメータを調整して、前記各音声放送内容の調整後の放送パラメータを得るためのパラメータ調整モジュールと、
    前記調整後の放送パラメータに従って、前記各音声放送内容を放送するための内容放送モジュールと、を含む
    音声放送装置。
  7. 前記パラメータ調整モジュールは、
    前記優先度パラメータ情報を分類して、前記優先度パラメータ情報のカテゴリを得るためのパラメータ分類ユニットをさらに含み、
    前記パラメータ調整モジュールはさらに、前記カテゴリに従って、各カテゴリに含まれる各音声放送内容の放送パラメータをそれぞれ調整することに用いられる
    請求項6に記載の装置。
  8. 少なくとも1つの音声放送内容が含まれる音声放送指令を受信するための指令受信装置と、
    受信した音声放送指令に応じて、請求項1〜5のいずれか一項に記載の音声放送方法を実行するための音声放送装置と、を含む
    音声放送システム。
  9. 1つまたは複数のプロセッサと、
    1つまたは複数のプログラムが記憶され、前記1つまたは複数のプログラムが前記1つまたは複数のプロセッサによって実行されると、前記1つまたは複数のプロセッサに、請求項1〜5のいずれか一項に記載の音声放送方法を実現させる記憶装置と、
    前記プロセッサとメモリとの間に接続され、前記プロセッサとメモリの情報インタラクションを実現するように配置された1つまたは複数のI/Oインターフェースと、を含む
    音声放送機器。
  10. コンピュータプログラムが記憶され、前記コンピュータプログラムがプロセッサによって実行される時に、請求項1〜5のいずれか一項に記載の音声放送方法を実現する
    コンピュータ可読記憶媒体。
  11. プロセッサによって実行される時に、請求項1〜5のいずれか一項に記載の音声放送方法を実現するコンピュータプログラムを備える
    コンピュータプログラム製品。
JP2021040983A 2020-04-24 2021-03-15 音声放送方法、装置、システム、機器およびコンピュータ可読媒体 Pending JP2021119379A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010333064.9 2020-04-24
CN202010333064.9A CN113643686B (zh) 2020-04-24 语音播报方法、装置、系统、设备和计算机可读介质

Publications (1)

Publication Number Publication Date
JP2021119379A true JP2021119379A (ja) 2021-08-12

Family

ID=75238105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021040983A Pending JP2021119379A (ja) 2020-04-24 2021-03-15 音声放送方法、装置、システム、機器およびコンピュータ可読媒体

Country Status (2)

Country Link
JP (1) JP2021119379A (ja)
KR (1) KR102508771B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113328816B (zh) * 2021-08-03 2021-10-29 北京百瑞互联技术有限公司 一种le音频广播流同步收听方法及装置
CN115022462A (zh) * 2022-05-30 2022-09-06 中国银行股份有限公司 手机应用程序的语音播报方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001116574A (ja) * 1999-10-15 2001-04-27 Equos Research Co Ltd ナビゲーション装置
JP2002116045A (ja) * 2000-10-11 2002-04-19 Clarion Co Ltd 音量制御装置
JP2005345292A (ja) * 2004-06-03 2005-12-15 Denso Corp 車両用ナビゲーション装置
JP2007279975A (ja) * 2006-04-05 2007-10-25 Kenwood Corp 車載装置、音声情報提供システムおよび発話速度調整方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08247779A (ja) * 1995-03-09 1996-09-27 Honda Motor Co Ltd 音声出力装置
JPH10104000A (ja) * 1996-09-30 1998-04-24 Mazda Motor Corp ナビゲーション装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001116574A (ja) * 1999-10-15 2001-04-27 Equos Research Co Ltd ナビゲーション装置
JP2002116045A (ja) * 2000-10-11 2002-04-19 Clarion Co Ltd 音量制御装置
JP2005345292A (ja) * 2004-06-03 2005-12-15 Denso Corp 車両用ナビゲーション装置
JP2007279975A (ja) * 2006-04-05 2007-10-25 Kenwood Corp 車載装置、音声情報提供システムおよび発話速度調整方法

Also Published As

Publication number Publication date
KR102508771B1 (ko) 2023-03-10
KR20210035111A (ko) 2021-03-31
CN113643686A (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
JP2021119379A (ja) 音声放送方法、装置、システム、機器およびコンピュータ可読媒体
CN102324995B (zh) 语音广播方法及系统
CN107943877B (zh) 待播放多媒体内容的生成方法和装置
JP2020079921A (ja) 音声インタラクション実現方法、装置、コンピュータデバイス及びプログラム
CN109543192B (zh) 自然语言解析方法、装置、设备及存储介质
CN106976434B (zh) 用于车辆中的语音识别设备的装置及方法
US11069351B1 (en) Vehicle voice user interface
CN110428825B (zh) 用于忽略流式媒体内容中的触发词的方法和系统
JP2019091014A (ja) マルチメディアを再生するための方法及び装置
JP7308335B2 (ja) 車載音声機器のテスト方法、装置、電子機器及び記憶媒体
WO2022252946A1 (zh) 语音控制方法、语音控制装置、服务器和存储介质
JP2019015951A (ja) 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体
CN110556102B (zh) 意图识别和执行的方法、设备、车载语音对话系统以及计算机存储介质
CN107844587B (zh) 用于更新多媒体播放列表的方法和装置
CN109348068A (zh) 一种信息处理方法、装置及存储介质
CN110310632A (zh) 语音处理方法及装置、以及电子设备
CN112685534B (zh) 在创作过程中生成已创作内容的脉络信息的方法与设备
CN115240659B (zh) 分类模型训练方法、装置、计算机设备及存储介质
KR101655958B1 (ko) 개인 통합형 음성 정보를 제공하는 방법과 시스템 및 기록 매체
CN113643686B (zh) 语音播报方法、装置、系统、设备和计算机可读介质
WO2021259073A1 (en) System for voice-to-text tagging for rich transcription of human speech
US8510118B2 (en) Attaching audio generated scripts to graphical representations of applications
KR102488623B1 (ko) 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템
CN112667774B (zh) 一种在作品创作过程中提供创作帮助信息的方法与设备
CN117807961B (zh) 一种文本生成模型的训练方法、装置、介质及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210315

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20211101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220913

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220920

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20221026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230804

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230816

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20231102