KR102508771B1 - 음성 방송 방법, 장치, 시스템, 설비 및 컴퓨터 판독 가능 매체 - Google Patents

음성 방송 방법, 장치, 시스템, 설비 및 컴퓨터 판독 가능 매체 Download PDF

Info

Publication number
KR102508771B1
KR102508771B1 KR1020210032232A KR20210032232A KR102508771B1 KR 102508771 B1 KR102508771 B1 KR 102508771B1 KR 1020210032232 A KR1020210032232 A KR 1020210032232A KR 20210032232 A KR20210032232 A KR 20210032232A KR 102508771 B1 KR102508771 B1 KR 102508771B1
Authority
KR
South Korea
Prior art keywords
voice
broadcasting
broadcast
parameter information
content
Prior art date
Application number
KR1020210032232A
Other languages
English (en)
Other versions
KR20210035111A (ko
Inventor
웨이 시앙
지안저 첸
Original Assignee
아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디. filed Critical 아폴로 인텔리전트 커넥티비티 (베이징) 테크놀로지 씨오., 엘티디.
Publication of KR20210035111A publication Critical patent/KR20210035111A/ko
Application granted granted Critical
Publication of KR102508771B1 publication Critical patent/KR102508771B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/44Arrangements characterised by circuits or components specially adapted for broadcast
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser
    • G10L13/0335Pitch control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/49Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying locations
    • H04H60/53Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying locations of destinations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

이 개시의 실시예는 음성 방송 방법, 장치, 시스템, 설비, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램을 제공하며, 이 방법은: 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 설정하며; 우선 순위 파라미터 정보에 따라, 각 음성 방송 콘텐츠의 방송 파라미터를 조정하며; 조정된 방송 파라미터에 따라, 각 음성 방송 콘텐츠를 방송하는 것을 포함한다.

Description

음성 방송 방법, 장치, 시스템, 설비 및 컴퓨터 판독 가능 매체{Method, device, system and equipment for broadcasting Voice and computer readable medium}
이 개시의 실시예는 음성 처리 기술 분야에 관련되며, 특히 음성 방송 방법, 장치, 시스템, 설비, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램에 관련된다.
컴퓨터 기술의 발전과 보급에 따라, 인간-컴퓨터 인터랙션과 같은 지능형 기술은 사람들의 삶의 모든 측면에서 편리하고 효율적인 서비스를 제공한다. 텍스트 음성 변환(Text To Speech, TTS) 기술은 텍스트에서 음성으로의 변환을 실현할 수 있으며, 인공 지능 기술에서 인간-컴퓨터 인터랙션을 위한 중요한 기술이다.
음성 방송 과정에서, 일반적으로 방송해야 하는 TTS 콘텐츠에 대해 통일된 방송 전략을 채택한다. 즉, 방송 파라미터가 완전히 일치한다. 완전히 일치된 방송 파라미터를 사용하고, 방송 파라미터의 설정 방식은 단일하며, 또한 중요한 TTS 콘텐츠를 쉽게 놓칠 수 있다.
이 개시의 실시예는 음성 방송 방법, 장치, 시스템, 설비, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램을 제공하고, 서로 다른 음성 방송 콘텐츠에 대해 차별화된 방송 파라미터를 설정함으로써 서로 다른 음성 방송 콘텐츠를 강조하고 사용자 경험을 향상시킬 수 있다.
제1 양태에서, 이 개시의 실시예는 음성 방송 방법을 제공하며, 이 방법은: 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 설정하며; 우선 순위 파라미터 정보에 따라, 각 음성 방송 콘텐츠의 방송 파라미터를 조정하며; 조정된 방송 파라미터에 따라, 각 음성 방송 콘텐츠를 방송하는 것을 포함한다.
제2 양태에서, 이 개시의 실시예는 음성 방송 장치를 제공하며, 이 장치는: 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 결정하는데 사용되는 파라미터 결정 모듈; 우선 순위 파라미터 정보에 따라 각 음성 방송 콘텐츠의 방송 파라미터를 조정하여, 각 음성 방송 콘텐츠의 조정된 방송 파라미터를 획득하는데 사용되는 파라미터 조정 모듈; 조정된 방송 파라미터에 따라, 각 음성 방송 콘텐츠를 방송하는데 사용되는 콘텐츠 방송 모듈을 포함한다.
제3 양태에서, 이 개시의 실시예는 음성 방송 시스템을 제공하며, 이 시스템은: 음성 방송 명령을 수신하도록 사용되고, 음성 방송 명령은 적어도 하나의 음성 방송 콘텐츠를 포함하는 명령 수신 장치; 수신된 음성 방송 명령에 따라 전술한 어느 하나의 음성 방송 방법을 실행하는데 사용되는 음성 방송 장치를 포함한다.
제4 양태에서, 이 개시의 실시예는 음성 방송 설비를 제공하며, 이 설비는: 하나 이상의 프로세서; 그 위에 하나 이상의 프로그램을 저장하고, 하나 이상의 프로그램이 하나 이상의 프로세서에 의해 실행될 때, 하나 이상의 프로세서는 전술한 어느 하나의 음성 방송 방법을 구현하는 메모리; 프로세서와 메모리 사이에 연결되고, 프로세서와 메모리 사이의 정보 인터랙션을 구현하도록 구성되는 하나 이상의 I/O 인터페이스를 포함한다.
제5 양태에서, 이 개시의 실시예는 컴퓨터 판독 가능 저장 매체를 제공하며, 이 매체는: 그 위에 컴퓨터 프로그램이 저장되며, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 음성 방송 방법을 구현한다.
제6 양태에서, 이 개시의 실시예는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 제공하며, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 음성 방송 방법을 구현한다.
이 개시의 실시예가 제공하는 음성 방송 방법, 장치, 시스템, 설비, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램은, 음성 방송 명령의 각 음성 방송 콘텐츠에 대해 우선 순위 파라미터 정보를 설정하고, 또한 설정된 우선 순위 파라미터 정보에 따라 각 음성 방송 콘텐츠의 방송 파라미터를 조정하고, 다른 음성 방송 콘텐츠에 대해 차별화된 방송 파라미터를 설정하여, 서로 다른 음성 방송 콘텐츠를 강조하고, 사용자 경험을 개선할 수 있다.
첨부 도면은 이 개시의 실시예에 대한 이해를 돕기 위해 제공되고, 명세서의 일부를 구성하며, 이 개시의 실시예와 함께 이 개시를 해석하기 위해 사용되는 것으로, 이 개시를 제한하는 것이 아니다. 첨부 도면을 참조하여 상세한 예시적인 실시예를 설명함으로써, 상기 및 기타 특징 및 장점이 이 분야의 기술자에게 더욱 명백해질 것이다. 첨부 도면에서:
도 1은 이 개시의 실시예에 의해 제공되는 시나리오의 개략도이다.
도 2는 이 개시의 실시예에 의해 제공되는 음성 방송 방법의 흐름도이다.
도 3은 이 개시의 실시예에 의해 제공되는 다른 음성 방송 방법의 흐름도이다.
도 4는 이 개시의 실시예에 의해 제공되는 음성 방송 장치의 블록도이다.
도 5는 이 개시의 실시예에 의해 제공되는 음성 방송 시스템의 블록도이다.
도 6은 이 개시의 실시예에 의해 제공되는 음성 방송 설비의 구성 블록도이다.
도 7은 이 개시 내용의 실시예에 의해 제공되는 컴퓨터 판독 가능 저장 매체의 구성 블록도이다.
이 분야의 기술자가 이 개시의 기술 방안을 보다 잘 이해할 수 있도록 하기 위해, 다음은 첨부 도면을 참조하여 이 개시에 의해 제공되는 음성 방송 방법, 장치, 시스템, 설비, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램에 대해 상세하게 설명한다.
이하에서 첨부 도면을 참조하여 예시적인 실시예를 보다 상세하게 설명하지만, 예시적인 실시예는 다른 형태로 구현될 수 있으며, 여기에서 설명하는 실시예로 제한하는 것으로 해석해서는 안 된다. 달리 말하면, 이러한 실시예를 제공하는 목적은 이 개시를 철저하고 완전하게 만들고, 또한 이 분야의 기술자가 이 개시의 범위를 완전히 이해할 수 있도록 하는 것이다. 상충되지 않는 한, 이 개시의 실시예 및 실시예 중의 각 특징은 서로 결합될 수 있다.
TTS는 컴퓨터에 저장된 파일 또는 텍스트 콘텐츠를 자연스러운 음성 출력으로 변환하는 일종의 음성 합성 애플리케이션이다. TTS는 컴퓨터에서 정보를 읽는데 도움이 될 뿐만 아니라 텍스트 문서의 가독성을 높일 수 있다.
도 1은 이 개시의 실시예에 따른 음성 방송 방법의 시나리오의 개략도이다. 도 1에 도시 된 바와 같이, 이 시나리오는 사용자(10) 및 음성 방송 설비(20)를 포함한다.
음성 내비게이션 시나리오에서, 음성 방송 설비(20)는 수신된 목적지 정보에 따라 내비게이션 정보를 생성하고, 또한 텍스트 음성 변환 기술을 이용하여 내비게이션 정보에 대응하는 음성 방송 명령을 생성하며, 사용자(10)에게 그 음성 방송 명령에 포함된 음성 방송 콘텐츠를 방송하고, 사용자(10)는 차량 주행 과정에서 그 음성 방송의 주행 경로 및 도로 상황 정보를 실시간으로 획득할 수 있다.
이 개시의 실시예에서, 음성 방송 방법은 음성 내비게이션 시나리오뿐만 아니라 인공 지능 인터랙션 시나리오 및 순수 음성 애플리케이션의 방송 등과 같은 사용 시나리오에도 적용될 수 있다.
인공 지능 인터랙션 시나리오에서, 인공 지능 설비는 음성 신호를 수신하고, 또한 음성 신호에 대해 음성 처리를 수행하여 인터랙티브 정보를 생성할 수 있으며, 이때 생성된 인터랙티브 정보에 대해 음성 방송을 수행해야 한다.
다른 순수 음성 애플리케이션의 방송 시나리오에서, 날씨의 심각도에 대한 정보에 대해 방송할 수 있고, 기사 및 농담 등과 같은 텍스트 콘텐츠에 대해 방송할 수 있으며, 일정 정보 등과 같은 콘텐츠에 대해서도 방송할 수 있다. 음성 방송 콘텐츠는 음성 방송의 형태로 방송되는 모든 콘텐츠일 수 있고, 실제 시나리오에 따라 음성 방송의 콘텐츠가 약간 다를 수 있으며, 이 개시의 실시예에서는 특별히 제한되지 않는다.
음성 방송 시에, 방송해야 하는 각 음성 방송 콘텐츠에 대해 통일된 방송 전략을 채택하면, 각 음성 방송 콘텐츠의 방송 파라미터에 대해 어떠한 구분도 행하지 않는다. 이런 경우, 일부 중요한 TTS 콘텐츠에 대해 사용자가 놓치기 쉬운 경우가 있다.
도 2는 이 개시의 실시예에 따른 음성 방송 방법의 흐름도를 도시한다. 도 2에 도시된 바와 같이, 하나의 실시예에서, 이 음성 방송 방법은 다음 단계를 포함할 수 있다.
S110 단계: 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 설정한다.
S120 단계: 우선 순위 파라미터 정보에 따라, 각 음성 방송 콘텐츠의 방송 파라미터를 조정한다.
S130 단계: 조정된 방송 파라미터에 따라, 각 음성 방송 콘텐츠를 방송한다.
이 개시의 실시예의 음성 방송 방법에 따르면, 음성 방송 명령의 각 음성 방송 콘텐츠에 대해 우선 순위 파라미터 정보를 설정하고, 또한 설정된 우선 순위 파라미터 정보에 따라 각 음성 방송 콘텐츠의 방송 파라미터를 조정하고, 다른 음성 방송 콘텐츠에 대해 차별화된 방송 파라미터를 설정하여, 서로 다른 음성 방송 콘텐츠를 강조하고, 또한 사용자 경험을 개선할 수 있다.
하나의 실시예에서, S110 단계 이전에 다음을 더 포함할 수 있다: S11 단계: 음성 방송 명령을 수신한다. 그 중에서, 음성 방송 명령은 적어도 하나의 음성 방송 콘텐츠를 포함할 수 있다.
이 개시의 실시예에서, 음성 방송 명령의 음성 방송 컨텐츠는 음성 방송 형태로 출력되는 임의의 컨텐츠일 수 있다. 하나의 실시예에서, 그 음성 방송 콘텐츠는 다음을 포함하지만 이에 제한되지는 않는다: 음성 내비게이션 시스템에 의해 생성된 내비게이션 정보에 대응하는 방송 콘텐츠, 인공 지능 인터랙티브 시스템에 의해 생성된 인터랙티브 정보에 대응하는 방송 콘텐츠, 또는 다른 순수 음성 애플리케이션 중의 방송 콘텐츠.
그 중에서, 인공 지능 인터랙티브 시스템에 의해 생성된 인터랙티브 정보에 대응하는 방송 콘텐츠에서, 그 인터랙티브 정보는 사용자가 입력한 음성 신호에 따라 생성된 인터랙티브 정보일 수 있으며; 다른 순수 음성 애플리케이션의 방송 콘텐츠에서, 그 방송 콘텐츠는 기사 및 농담 등과 같은 텍스트 콘텐츠의 방송, 날씨의 심각도에 대한 정보의 방송, 마감일에 가까운 일정 방송 등을 포함하지만 이에 제한되지 않는다.
전술한 실시예에서, 음성 방송 명령은 네비게이션 시스템에 의해 생성된 방송 명령으로, 이는 음성을 통해 경로 네비게이션 정보를 제공하는데 사용될 수 있다. 또는, 음성 방송 명령은 인공 지능 인터랙티브 시스템에 의해 생성된 방송 명령으로, 음성 인터랙티브 정보를 제공할 수 있으며; 또는 음성 방송 명령은 순수 음성 애플리케이션의 방송 콘텐츠에 대응하는 방송 명령일 수 있다.
전술한 음성 방송 콘텐츠의 예는 예시적일 뿐이며, 실제 응용 요구에 따라 음성 방송 콘텐츠는 음성 방송의 형태로 출력되는 모든 콘텐츠가 될 수 있으며, 구체적으로 실제 응용 시나리오에 따라 유연하게 구성할 수 있고, 이와 관련하여 콘텐츠에 제한이 없다는 점을 이해해야 한다.
하나의 실시예에서, S110 단계는 구체적으로 다음을 포함할 수 있다: S21 단계: 각 음성 방송 콘텐츠에서 특정 중요 정보를 추출한다; S22 단계: 특정 중요 정보를 포함하는 음성 방송 콘텐츠에 대해, 특정 중요 정보에 대응하는 우선 순위 파라미터 정보를 설정한다.
이 실시예에서, 특정 중요 정보가 추출되지 않은 음성 방송 콘텐츠에 대해, 설비 우선 순위 파라미터 정보는 원래의 방송 파라미터 정보와 일치할 수 있다.
하나의 실시예에서, 우선 순위 파라미터 정보는 방송 전에 사용자에 의해 수동으로 설정되거나 맞춤화될 수 있다.
하나의 실시예에서, 음성 방송 컨텐츠가 내비게이션 정보에 대응하는 방송 컨텐츠를 포함하는 경우, 특정 중요 정보는 예를 들어 특정 도로 상황 정보 또는 특정 교차로 정보를 포함할 수 있다. 특정 도로 상황 정보는 예를 들어 커브 정보, 도로 공사 정보, 도로 사고 정보 등을 포함할 수 있으며, 특정 교차로는 예를 들어 신호등 교차로, 내비게이션 정보에서 목적지까지의 중요 교차로 등을 포함할 수 있다.
일부 실시예에서, 음성 방송 콘텐츠의 특정 중요 정보는 예를 들어 날씨 경고 정보, 악천후 정보, 마감일에 대한 일정 정보 등을 포함할 수도 있다. 이 개시의 실시예에서, 음성 방송 컨텐츠의 특정 중요 정보는 내비게이션 시스템, 인공 지능 인터랙티브 시스템 또는 기타 순수 음성 애플리케이션을 사용하기 전에, 실제 상황에 따라 사용자에 의해 미리 설정될 수도 있으며, 이 실시예는 구체적으로 제한하지 않는다.
하나의 실시예에서, 우선 순위 파라미터 정보의 카테고리는 음성 특징 파라미터 및 프롬프트 사운드 특징 파라미터 중 적어도 하나를 포함한다.
구체적으로, 음성 특징 파라미터는 다음을 포함한다: 음속, 음량, 음조, 음고, 음색 및 음의 강약 중 적어도 하나를 포함한다; 및/또는 프롬프트 사운드 특징 파라미터는 프롬프트 사운드 콘텐츠, 프롬프트 사운드 지속 시간 및 프롬프트 사운드 반복 횟수 중 적어도 하나를 포함한다.
이 실시예에서, 예를 들어 어떤 음성 방송 콘텐츠에 특정 중요 정보가 포함된 경우, 방송 음량 또는 기타 경고음을 적절히 증가시켜 그 음성 방송 콘텐츠의 중요성을 알릴 수 있다.
예를 들어, 내비게이션 과정에서, 커브 또는 신호등 교차로에서 이 전략을 통해 사용자에게 운전하는 방법을 알려주어 미리 대응하도록 할 수 있다. 날씨 정보의 방송 과정에서, 이 전략을 통해 사용자에게 날씨 경보 정보에 대비하도록 경고하여 미리 여행 계획을 짜게 할 수 있다.
하나의 실시예에서, S120 단계는 구체적으로 다음을 포함할 수 있다: S31 단계: 우선 순위 파라미터 정보를 분류하여, 우선 순위 파라미터 정보의 카테고리를 획득한다; S32 단계: 카테고리에 따라, 각 카테고리에 포함된 각 음성 방송 콘텐츠의 방송 파라미터를 각각 조정한다.
이 실시예에서, 우선 순위 파라미터 정보를 분류한 후, 동일한 카테고리의 파라미터를 매번 조정할 수 있다. 예를 들어, 음량 등과 같은 음성 특징 파라미터를 일괄적으로 조정한 다음, 프롬프트 사운드를 일괄적으로 추가한다. 한 번에 하나의 카테고리만 조정하므로 설정된 카테고리를 빈번하게 변환할 필요가 없어, 방송 파라미터의 조정 효율성을 향상시킬 수 있다.
이 개시의 실시예의 음성 방송 방법에 따르면, 음성 방송 콘텐츠의 우선 순위에 따라 방송의 관련 파라미터를 수정하고, 사용자에게 즉시 응답하도록 경고하여 사용자가 일부 중요한 TTS 콘텐츠를 놓치는 것을 방지하고, 사용자 경험을 크게 향상시킬 수 있다.
도 3은 이 개시의 다른 실시예에 따른 음성 방송 방법의 개략적인 흐름도를 도시한다. 도 3에 도시된 바와 같이, 이 음성 방송 방법은 다음과 같은 단계를 포함할 수 있다.
S201 단계: 방송해야 하는 음성 방송 콘텐츠를 획득하고, 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 정의한다.
예시적으로, 그 우선 순위 파라미터 정보는 예를 들어 음량, 음속, 프롬프트 사운드 여부 등을 포함한다.
S202 단계: 수신된 음성 방송 콘텐츠에 대해, 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 분류한다.
예시적으로, 음량 조절, 음속 조절 등은 음성 특징 파라미터 정보로 분류될 수 있다.
S203 단계: 각 카테고리에 대응하는 방송 파라미터에 따라, 각 카테고리에서 각 음성 방송 콘텐츠의 방송 파라미터를 차례로 조정한다.
S204 단계: 설정된 방송 파라미터에 따라, 그 음성 방송 콘텐츠를 방송한다.
이 개시의 실시예에 따른 음성 방송 방법에 따르면, 음성 방송 컨텐츠의 우선 순위 파라미터 정보에 따라 방송의 관련 파라미터를 수정하고, 사용자에게 즉시 응답하도록 경고하여, 사용자가 일부 중요한 음성 방송 정보를 놓치는 것을 방지할 수 있다.
도 4는 이 개시의 실시예에 의해 제공되는 음성 방송 장치의 구성 블록도를 도시한다. 도 4에 도시된 바와 같이, 이 음성 방송 장치는 다음과 같은 모듈을 포함한다.
파라미터 결정 모듈(310)은, 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 결정하는데 사용된다.
파라미터 조정 모듈(320)은, 우선 순위 파라미터 정보에 따라 각 음성 방송 콘텐츠의 방송 파라미터를 조정하여, 각 음성 방송 콘텐츠의 조정된 방송 파라미터를 획득하는데 사용된다.
콘텐츠 방송 모듈(330)은, 조정된 방송 파라미터에 따라, 각 음성 방송 콘텐츠를 방송하는데 사용된다.
하나의 실시예에서, 음성 방송 장치는 다음을 더 포함한다: 명령 수신 모듈은 음성 방송 명령을 수신하는데 사용되며, 그 중에서, 음성 방송 명령은 적어도 하나의 음성 방송 콘텐츠를 포함한다.
하나의 실시예에서, 파라미터 결정 모듈(310)은, 또한 구체적으로 각 음성 방송 콘텐츠에서 특정 중요 정보를 추출하는데 사용되며; 특정 중요 정보를 포함하는 음성 방송 콘텐츠에 대해, 특정 중요 정보에 대응하는 우선 순위 파라미터 정보를 설정한다.
하나의 실시예에서, 특정 중요 정보는 특정 도로 상태 정보, 특정 교차로 정보, 특정 날씨 정보 및/또는 특정 일정 정보 등을 포함한다.
하나의 실시예에서, 파라미터 조정 모듈(320)은 구체적으로 다음을 포함할 수 있다: 파라미터 분류 유닛은, 우선 순위 파라미터 정보를 분류하여 우선 순위 파라미터 정보의 카테고리를 획득하는데 사용된다; 파라미터 조정 모듈(320)은, 구체적으로 또한 카테고리에 따라 각 카테고리에 포함된 각 음성 방송 콘텐츠의 방송 파라미터를 각각 조정하는데 사용된다.
하나의 실시예에서, 우선 순위 파라미터 정보의 카테고리는 음성 특징 파라미터 정보 및 프롬프트 사운드 특징 파라미터 정보 중 적어도 하나를 포함한다.
하나의 실시예에서, 음성 특징 파라미터 정보는 음속, 음량, 음조, 음고, 음색 및 음의 강약 중 적어도 하나를 포함한다; 및/또는 프롬프트 사운드 특징 파라미터 정보는 프롬프트 사운드 콘텐츠, 프롬프트 사운드 지속 시간 및 프롬프트 사운드 반복 횟수 중 적어도 하나를 포함한다.
이 개시의 실시예의 음성 방송 장치에 따르면, 음성 방송 명령의 각 음성 방송 콘텐츠에 대해 우선 순위 파라미터 정보를 설정하고, 또한 설정된 우선 순위 파라미터 정보에 따라 각 음성 방송 콘텐츠의 방송 파라미터를 조정하여, 서로 다른 음성 방송 콘텐츠를 강조하고, 또한 사용자 경험을 개선할 수 있다.
이 개시가 상기 실시예에서 설명되고 또한 도면에서 도시된 특정 구성 및 처리에만 제한되지 않음을 유의할 필요가 있다. 설명의 편의와 간결함을 위해, 여기서 이미 공지된 방법에 대한 자세한 설명은 생략하며, 또한 전술한 시스템, 모듈, 유닛의 구체적인 작업 과정은 전술한 방법 실시예의 해당 과정을 참조할 수 있으므로, 여기서 반복 설명하지 않는다.
도 5는 이 개시의 실시예에 따른 음성 방송 시스템의 개략적인 구조도이다. 도 5에 도시된 바와 같이, 이 음성 방송 시스템은 다음과 같은 모듈을 포함할 수 있다.
명령 수신 장치(410)는, 음성 방송 명령을 수신하도록 사용되고, 음성 방송 명령은 적어도 하나의 음성 방송 콘텐츠를 포함한다; 음성 방송 장치(420)는, 수신된 음성 방송 명령에 따라 전술한 실시예의 어느 하나의 음성 방송 방법을 실행하는데 사용된다.
전술한 실시예의 설명을 통해, 음성 방송 콘텐츠는 음성 방송의 형태로 출력되는 임의의 콘텐츠일 수 있음을 알 수 있다. 예를 들어, 음성 내비게이션 시스템에 의해 생성된 내비게이션 정보에 대응하는 방송 콘텐츠, 인공 지능 인터랙티브 시스템에 의해 생성된 인터랙티브 정보에 대응하는 방송 콘텐츠, 또는 다른 순수 음성 애플리케이션의 방송 콘텐츠 등으로, 다시 반복 설명하지 않는다.
설명의 편의와 간결함을 위해, 여기서 이미 공지된 방법에 대한 자세한 설명은 생략하며, 또한 전술한 시스템, 모듈, 유닛의 구체적인 작업 과정은 전술한 방법 실시예의 해당 과정을 참조할 수 있으므로, 여기서 반복 설명하지 않는다.
도 6은 이 개시의 실시예에 의해 제공되는 음성 방송 설비의 구성 블록도이다. 도 6에 도시된 바와 같이, 이 개시의 실시예는 다음을 포함하는 음성 방송 설비를 제공한다: 하나 이상의 프로세서(501); 그 위에 하나 이상의 프로그램을 저장하고, 하나 이상의 프로그램이 하나 이상의 프로세서에 의해 실행될 때, 하나 이상의 프로세서는 전술한 어느 하나의 음성 방송 방법을 구현하는 메모리(502); 프로세서와 메모리 사이에 연결되고, 프로세서와 메모리 사이의 정보 인터랙션을 구현하는 하나 이상의 I/O 인터페이스(503).
그 중에서, 프로세서(501)는 데이터 처리 능력을 가진 장치이고, 이는 중앙 처리 장치(CPU) 등을 포함하지만, 이에 제한되지는 않는다; 메모리(502)는 데이터 저장 기능을 가진 장치이며, 이는 랜덤 액세스 메모리(RAM, 보다 구체적으로는 SDRAM, DDR 등), 읽기 전용 메모리(ROM), 전기적으로 소거 가능 프로그래머블 읽기 전용 메모리(EEPROM), 플래시 메모리(FLASH)를 포함하지만, 이에 제한되지는 않는다; I/O 인터페이스(읽기-쓰기 인터페이스)(503)는 프로세서(501)와 메모리(502) 사이에 연결되어, 프로세서(501)와 메모리(502) 사이의 정보 인터랙션을 구현할 수 있으며, 이는 데이터 버스(Bus) 등을 포함하지만, 이에 제한되지는 않는다.
일부 실시예에서, 프로세서(501), 메모리(502) 및 I/O 인터페이스(503)는 버스(504)를 통해 서로 연결되고, 음성 방송 설비의 다른 구성 요소에 추가로 연결된다.
도 7은 이 개시의 실시예에 의해 제공되는 컴퓨터 판독 가능 저장 매체의 구성 블록도를 도시한다. 도 7에 도시된 바와 같이, 이 개시의 실시예는 그 위에 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능 저장 매체를 제공하며, 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 음성 방송 방법이 구현된다.
이 분야의 기술자는 위에서 개시된 방법 중의 전부 또는 일부 단계와, 시스템 및 장치 중의 기능 모듈/유닛이 소프트웨어, 펌웨어, 하드웨어 및 이들의 적절한 조합으로 구현될 수 있음을 이해할 수 있다. 하드웨어 구현에서, 위 설명에서 언급된 기능 모듈/유닛 간의 구분은 반드시 물리적 구성 요소의 구분과 일치하지는 것은 아니다; 예를 들어, 하나의 물리적 구성 요소는 여러 기능을 가질 수 있거나 하나의 기능 또는 단계가 여러 물리적 구성 요소의 협력에 의해 실행될 수 있다. 일부 물리적 구성 요소 또는 모든 물리적 구성 요소는 중앙 처리 장치, 디지털 신호 프로세서 또는 마이크로 프로세서와 같은 프로세서에 의해 실행되는 소프트웨어로 구현되거나, 하드웨어로 구현되거나 또는 전용 집적 회로와 같은 집적 회로로 구현될 수 있다. 이러한 소프트웨어는 컴퓨터 판독 가능 매체에 배포될 수 있으며, 컴퓨터 판독 가능 매체는 컴퓨터 저장 매체(또는 비 일시적 매체) 및 통신 매체(또는 일시적인 매체)를 포함할 수 있다. 이 분야의 기술자에게 잘 알려진 바와 같이, 컴퓨터 저장 매체는 정보(예를 들면, 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타데이터)를 저장하기 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성,이동식 및 비 이동식 매체를 포함한다. 컴퓨터 저장 매체에는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, 디지털 다용도 디스크(DVD) 또는 기타 광 디스크 스토리지, 자기 카세트, 자기 테이프, 자기 디스크 스토리지 또는 기타 자기 저장 장치, 또는 원하는 정보를 저장하는데 사용되며 컴퓨터에서 액세스 할 수 있는 기타 모든 매체가 포함되지만, 이에 제한되지는 않는다. 또한, 이 분야의 기술자에게 잘 알려진 바와 같이, 통신 매체는 일반적으로 컴퓨터 판독 가능 명령어, 데이터 구조, 프로그램 모듈 또는 반송파 또는 기타 전송 메커니즘과 같은 변조된 데이터 신호의 기타 데이터를 포함하고, 또한 임의의 정보 전달 매체를 포함할 수 있다.
이 개시의 실시예는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 제공하며, 컴퓨터 프로그램이 프로세서에 의해 실행될 때 전술한 어느 하나의 음성 방송 방법을 구현한다.
이 개시의 방법을 구현하기 위한 프로그램 코드는 하나 이상의 프로그래밍 언어의 임의의 결합으로 작성될 수 있다. 이러한 프로그램 코드는 범용 컴퓨터, 전용 컴퓨터 또는 기타 프로그램 가능 데이터 처리 장치의 프로세서 또는 컨트롤러에 제공될 수 있으므로 프로그램 코드가 프로세서 또는 컨트롤러에 의해 실행될 때 순서도 및/또는 블록 다이어그램에 지정된 기능/작업이 구현된다. 프로그램 코드는 전체적으로 기기에서 실행되거나, 부분적으로 기기에서 실행되거나, 독립 소프트웨어 패키지로서 부분적으로 기기에서 실행되고 부분적으로 원격 기기에서 실행되거나, 또는 전체적으로 원격 기기 또는 서버에서 실행될 수 있다.
이 명세서에는 예시적인 실시예가 개시되고, 특정 용어가 채택되었지만, 이들은 단지 일반적인 설명적 의미로만 사용되고 해석되어야 하며, 제한적인 목적으로 사용되지는 않는다. 일부 실시예에서, 달리 명확하게 지시되지 않는 한, 특정 실시예와 결합하여 설명된 특징, 특성 및/또는 요소가 단독으로 사용될 수 있거나, 다른 실시예와 결합하여 설명된 특징, 특성 및/또는 요소의 조합이 사용될 수 있다는 것은 이 분야의 기술자에게 명백하다. 따라서, 이 분야의 기술자는 청구 범위에 의해 제시된 이 개시 내용의 범위를 벗어나지 않고 형태 및 세부 사항의 다양한 변경이 이루어질 수 있음을 이해할 수 있을 것이다.

Claims (11)

  1. 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 설정하며―텍스트 음성 변환을 통해 텍스트에서 상기 음성 방송 콘텐츠를 얻음―;
    상기 우선 순위 파라미터 정보에 따라, 상기 각 음성 방송 콘텐츠의 방송 파라미터를 조정하며;
    조정된 방송 파라미터에 따라, 상기 각 음성 방송 콘텐츠를 방송하는 것을 포함하고,
    상기 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 설정하는 것은:
    상기 텍스트에서 각 음성 방송 콘텐츠를 위한 특정 중요 정보를 추출하며;
    상기 특정 중요 정보를 포함하는 음성 방송 콘텐츠에 대해, 상기 특정 중요 정보에 대응하는 우선 순위 파라미터 정보를 설정하는 것을 포함하는, 음성 방송 방법.
  2. 청구항 1에 있어서,
    상기 우선 순위 파라미터 정보에 따라, 상기 각 음성 방송 콘텐츠의 방송 파라미터를 조정하는 것은;
    상기 우선 순위 파라미터 정보를 분류하여, 상기 우선 순위 파라미터 정보의 카테고리를 획득하며;
    상기 카테고리에 따라, 각 카테고리에 포함된 각 음성 방송 콘텐츠의 방송 파라미터를 각각 조정하는 것을 포함하는, 음성 방송 방법.
  3. 청구항 1에 있어서,
    상기 우선 순위 파라미터 정보의 카테고리는 음성 특징 파라미터 정보 및 프롬프트 사운드 특징 파라미터 정보 중 적어도 하나를 포함하는, 음성 방송 방법.
  4. 청구항 3에 있어서,
    상기 음성 특징 파라미터 정보는 음속, 음량, 음조, 음고, 음색 및 음의 강약 중 적어도 하나를 포함하며; 및/또는,
    상기 프롬프트 사운드 특징 파라미터 정보는 프롬프트 사운드 콘텐츠, 프롬프트 사운드 지속 시간 및 프롬프트 사운드 반복 횟수 중 적어도 하나를 포함하는, 음성 방송 방법.
  5. 음성 방송 명령에서 각 음성 방송 콘텐츠의 우선 순위 파라미터 정보를 결정하는데 사용되는, 파라미터 결정 모듈―텍스트 음성 변환을 통해 텍스트에서 상기 음성 방송 콘텐츠를 얻음―;
    상기 우선 순위 파라미터 정보에 따라 상기 각 음성 방송 콘텐츠의 방송 파라미터를 조정하여, 상기 각 음성 방송 콘텐츠의 조정된 방송 파라미터를 획득하는데 사용되는, 파라미터 조정 모듈;
    상기 조정된 방송 파라미터에 따라, 상기 각 음성 방송 콘텐츠를 방송하는데 사용되는, 콘텐츠 방송 모듈;을 포함하고,
    상기 파라미터 결정 모듈은
    상기 텍스트에서 각 음성 방송 콘텐츠를 위한 특정 중요 정보를 추출하고;
    상기 특정 중요 정보를 포함하는 음성 방송 콘텐츠에 대해, 상기 특정 중요 정보에 대응하는 우선 순위 파라미터 정보를 설정하는데 사용되는, 음성 방송 장치.
  6. 청구항 5에 있어서,
    상기 파라미터 조정 모듈은:
    상기 우선 순위 파라미터 정보를 분류하여 상기 우선 순위 파라미터 정보의 카테고리를 획득하는데 사용되는, 파라미터 분류 유닛;을 더 포함하고,
    상기 파라미터 조정 모듈은 또한 상기 카테고리에 따라 각 카테고리에 포함된 각 음성 방송 콘텐츠의 방송 파라미터를 각각 조정하는데 사용되는, 음성 방송 장치.
  7. 음성 방송 명령을 수신하도록 사용되고, 상기 음성 방송 명령은 적어도 하나의 음성 방송 콘텐츠를 포함하는, 명령 수신 장치;
    수신된 음성 방송 명령에 따라 청구항 1 내지 청구항 4 중 어느 하나의 음성 방송 방법을 실행하는데 사용되는, 음성 방송 장치;를 포함하는, 음성 방송 시스템.
  8. 하나 이상의 프로세서;
    그 위에 하나 이상의 프로그램을 저장하고, 상기 하나 이상의 프로그램이 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 하나 이상의 프로세서는 청구항 1 내지 청구항 4 중 어느 하나의 상기 음성 방송 방법을 구현하는 메모리;
    상기 프로세서와 메모리 사이에 연결되고, 상기 프로세서와 상기 메모리 사이의 정보 인터랙션을 구현하도록 구성되는 하나 이상의 I/O 인터페이스를 포함하는, 음성 방송 설비.
  9. 그 위에 컴퓨터 프로그램이 저장되며, 상기 컴퓨터 프로그램이 프로세서에 의해 실행될 때 청구항 1 내지 청구항 4 중 어느 하나의 상기 음성 방송 방법을 구현하는, 컴퓨터 판독 가능 저장 매체.
  10. 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램이 프로세서에 의해 실행될 때 청구항 1 내지 청구항 4 중 어느 하나의 상기 음성 방송 방법을 구현하는, 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.
  11. 삭제
KR1020210032232A 2020-04-24 2021-03-11 음성 방송 방법, 장치, 시스템, 설비 및 컴퓨터 판독 가능 매체 KR102508771B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010333064.9 2020-04-24
CN202010333064.9A CN113643686B (zh) 2020-04-24 2020-04-24 语音播报方法、装置、系统、设备和计算机可读介质

Publications (2)

Publication Number Publication Date
KR20210035111A KR20210035111A (ko) 2021-03-31
KR102508771B1 true KR102508771B1 (ko) 2023-03-10

Family

ID=75238105

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210032232A KR102508771B1 (ko) 2020-04-24 2021-03-11 음성 방송 방법, 장치, 시스템, 설비 및 컴퓨터 판독 가능 매체

Country Status (3)

Country Link
JP (1) JP2021119379A (ko)
KR (1) KR102508771B1 (ko)
CN (1) CN113643686B (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113328816B (zh) * 2021-08-03 2021-10-29 北京百瑞互联技术有限公司 一种le音频广播流同步收听方法及装置
CN115022462A (zh) * 2022-05-30 2022-09-06 中国银行股份有限公司 手机应用程序的语音播报方法及装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6345608A (ja) * 1986-08-12 1988-02-26 Toshiba Corp 音声通報装置
JPH08247779A (ja) * 1995-03-09 1996-09-27 Honda Motor Co Ltd 音声出力装置
JPH0998226A (ja) * 1995-09-29 1997-04-08 Toshiba Corp ケーブル電話端末装置
JPH10104000A (ja) * 1996-09-30 1998-04-24 Mazda Motor Corp ナビゲーション装置
JP2001116574A (ja) * 1999-10-15 2001-04-27 Equos Research Co Ltd ナビゲーション装置
JP2002116045A (ja) * 2000-10-11 2002-04-19 Clarion Co Ltd 音量制御装置
JP2002213985A (ja) * 2001-01-15 2002-07-31 Matsushita Electric Ind Co Ltd オーディオ装置とナビゲーション装置
JP2005345292A (ja) * 2004-06-03 2005-12-15 Denso Corp 車両用ナビゲーション装置
JP2006084406A (ja) * 2004-09-17 2006-03-30 Denso Corp 車両用経路案内装置
JP4961807B2 (ja) * 2006-04-05 2012-06-27 株式会社Jvcケンウッド 車載装置、音声情報提供システムおよび発話速度調整方法
EP1860918B1 (en) * 2006-05-23 2017-07-05 Harman Becker Automotive Systems GmbH Communication system and method for controlling the output of an audio signal
JP2008170980A (ja) * 2006-12-12 2008-07-24 Mitsubishi Electric Corp 車載用ガイダンス装置
JP5691693B2 (ja) * 2011-03-16 2015-04-01 三菱電機株式会社 エレベーター制御システム
US8862387B2 (en) * 2013-01-08 2014-10-14 Apple Inc. Dynamic presentation of navigation instructions
CN107452400A (zh) * 2017-07-24 2017-12-08 珠海市魅族科技有限公司 语音播报方法及装置、计算机装置和计算机可读存储介质
CN109981448B (zh) * 2019-03-28 2022-03-25 联想(北京)有限公司 信息处理方法和电子设备

Also Published As

Publication number Publication date
KR20210035111A (ko) 2021-03-31
CN113643686A (zh) 2021-11-12
JP2021119379A (ja) 2021-08-12
CN113643686B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
US11080016B2 (en) Speech-based interaction with a display window
KR102508771B1 (ko) 음성 방송 방법, 장치, 시스템, 설비 및 컴퓨터 판독 가능 매체
US11293766B2 (en) Cognitive journey companion system
EP3510591B1 (en) Dynamic text-to-speech provisioning
CN109065044B (zh) 唤醒词识别方法、装置、电子设备及计算机可读存储介质
US20160004501A1 (en) Audio command intent determination system and method
CN107342088B (zh) 一种声音信息的转换方法、装置及设备
JP5662273B2 (ja) 割り込み制御装置および割り込み制御方法
US10054921B2 (en) Apparatus and method for adaptively controlling a target system according to operating environment
CN111261151B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN111402925A (zh) 语音调节的方法、装置、电子设备、车载系统和可读介质
CN108564945B (zh) 车载语音控制方法与装置,以及电子设备与存储介质
CN102324995A (zh) 语音广播方法及系统
WO2022252946A1 (zh) 语音控制方法、语音控制装置、服务器和存储介质
CN114898749B (zh) 一种汽车电子手册交互方法、装置及车辆
CN110556102B (zh) 意图识别和执行的方法、设备、车载语音对话系统以及计算机存储介质
CN112346697A (zh) 一种对设备进行控制的方法、装置和存储介质
US20150268842A1 (en) Method for configuring dynamic user interface of head unit of vehicle by using mobile terminal, and head unit and computer-readable recoding media using the same
CN110415067A (zh) 下单方法、设备及存储介质
CN114446296A (zh) 车载用语音交互方法、装置及车辆
JP2016126436A (ja) 画像認識評価システム及び画像認識評価装置
CN110764054A (zh) 一种紧急声音方位辨识方法及装置
US20140280618A1 (en) Dynamic alert recognition system
US20240127810A1 (en) Dialogue Management Method, Dialogue Management System, And Computer-Readable Recording Medium
US11847309B1 (en) Auditory memories

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant