KR100406625B1 - 운송수단에서 코드화 음성 항목을 생성하기 위한 장치 - Google Patents

운송수단에서 코드화 음성 항목을 생성하기 위한 장치 Download PDF

Info

Publication number
KR100406625B1
KR100406625B1 KR1019970700670A KR19970700670A KR100406625B1 KR 100406625 B1 KR100406625 B1 KR 100406625B1 KR 1019970700670 A KR1019970700670 A KR 1019970700670A KR 19970700670 A KR19970700670 A KR 19970700670A KR 100406625 B1 KR100406625 B1 KR 100406625B1
Authority
KR
South Korea
Prior art keywords
items
message
fixed
variable
information
Prior art date
Application number
KR1019970700670A
Other languages
English (en)
Inventor
레오나르두스 람베르투스 마리아 보그텐
Original Assignee
스캔소프트, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 스캔소프트, 인코포레이티드 filed Critical 스캔소프트, 인코포레이티드
Application granted granted Critical
Publication of KR100406625B1 publication Critical patent/KR100406625B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/53Arrangements specially adapted for specific applications, e.g. for traffic information or for mobile receivers
    • H04H20/55Arrangements specially adapted for specific applications, e.g. for traffic information or for mobile receivers for traffic information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/10Aspects of broadcast communication characterised by the type of broadcast system
    • H04H2201/13Aspects of broadcast communication characterised by the type of broadcast system radio data system/radio broadcast data system [RDS/RBDS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Traffic Control Systems (AREA)

Abstract

장치에 있어서, 고정된 포맷과 코딩된 제어 정보는 음성 공고를 위하여 수신된다. 코딩된 제어 정보 소자는 저장 장치로부터 합성 음성 정보 항목을 선택하고, 이후에 제어 항목의 제어 하에서 음성 생성기는 합성 음성 메시지를 생성한다. 고정된 항목과 가변 항목을 포함하는 메시지에 대해서, 고정된 항목은 풍부한 음소 표시법으로 엔코딩된다. 가변 항목은 직접적인 음소 표시법으로 엔코딩된다. 항목은 다양한 변형으로 제공된다. 각 변형은 그 음소 시퀀스의 피치 및/또는 리듬의 각기 다른 운율학적인 패턴을 갖고, 관련된 제어 정보 소자에 근접하거나 함축된 다양한 값의 내용 심벌에 의해 선택된다. 본 발명은 상기 음성 메시지를 생성하기 위한 장치와 합성 음성 메시지를 엔코딩하기 위한 엔코딩 장치가 제공된 자동차를 더 포함한다.

Description

운송 수단에서 코드화 음성 항목을 생성하기 위한 장치
이런 종류의 시스템은 본 원의 양수인의 유럽 특허 EP-A-543,459(PHD 91.161)에 대응하는 미국 특허(07/978,097)에 개시되었고, 이 내용은 본 발명에 참고로 포함된다. 적절한 저장 공간만을 필요로 하면서 유연한 내용의 메시지를 생성하기 위하여, 인용문은 자연적으로 기록된 것과 합성적으로 생성된 음성 항목을 결합한다. 이러한 관점에서, 인용문은 개별적으로 높은 발생 빈도를 갖는 음성 요소를 생성하기 위하여 관련된 비교적 높은 저장 요구에도 불구하고, 자연의 음성을 사용한다. 이와 대비하여, 각각이 비교적 낮은 빈도로 발생하는 음성 요소의 큰 집합에 대한 비교적 낮은 저장 요구에 대해 음성 합성이 사용된다. 인용문의 사용 분야는 기차 접속 등과 같은 공고 시스템이다. 여기에서 빈번한 요소는 '지연', '플랫폼 출발' 과 같은 지시인 반면, 낮은 빈도의 항목은 '출발지' 또는 '목적지'의 큰 집합이다.
현재, 자동차 및 다른 도로 운송 수단에서 사용을 위한, 지역 코드가 수반된 교통 정보 메시지를 방송하여 자동차 제어 시스템이 이들 메시지로부터 적절한 선택 사항만을 운전자에게 제공하는 경향이 있다. 더욱이 현재의 기술은 이와 같은 시스템의 완전 디지탈화로 진행하고 있고, 이는 본 실시예가 RDS-TMC(라디오 데이터 시스템-교통 메시지 제어)시스템에 이르는 이유이다. 방송 메시지가 코드만의 시퀀스로 형성된다면 유리하다.
본 발명은 음성 메시지 정보를 생성하기 위한 장치에 관한 것이다. 상기 장치는 고정된 포맷의 코드화 제어 정보 소자를 수신하기 위한 입력 수단과, 상기 코드화 제어 정보 소자에 의해 순차적으로 선택 가능한 합성 음성 정보 항목을 저장하기 위한 저장 유니트와, 상기 음성 정보 항목의 제어 하에서의 합성 음성 메시지를 생성하기 위한 음성 생성기를 포함한다. 음성 메시지는 공고 시스템의 부분을 형성할 수 있다.
본 발명의 이들 및 다른 측면과 장점은 이후에 개시된 양호한 실시예를 참조로 특히 다음의 도면을 참조하여 설명된다.
도 1은 본 발명에 사용하기 위한 운송 수단.
도 2는 본 발명에 따른 장치의 다이어그램.
도 3은 이와 같은 시스템의 메모리 구조.
도 4a 내지 도 4j는 피치/억양 및 운율학의 표준 패턴의 집합.
도 5는 다양한 예의 메시지의 표.
그러므로, 다른 것 중에서도, 음성 표현이 완전히 디지탈이고, 결과 음성의 운율학이 인간 집단 중 많은 사람에게 유쾌하고 명쾌함을 증대시키는, 서론에 따른 장치를 제공하는 것이 본 발명의 목적이다. 결과적으로 한 특성에 따라서, 본 발명은, 고정된 항목과 가변 항목을 포함하는 메시지 포맷에 대해서, 관련된 제어 정보 시스템 에 인접하거나 또는 이에 함축적인 다양한 값의 내용 심벌에 의해 선택될 수 있는 것과 같이, 고정된 항목은 다양한 음소 표시법으로 엔코딩되고, 각 가변 항목은 사전의 엑센트와 함께 직접적인 음소 표시법으로 엔코딩되고, 상기 항목들은, 각각이 관련된 음소의 순서의 피치 및/또는 리듬의 각각 다른 운율학적인 패턴을 갖는 다양한 변형(version)으로 청취자에게 제공되는 것을 특징으로 한다. 고정된 음성 부분의 풍부한 음소 코딩은, 사전적인 엑센트의 사용과 관련된, 높은 품질의 음성 출력과 다른 부분의 직접적인 음소 엔코딩을 제공하고, 제어 정보에 의해제어되는 각 변형 내의 각기 다른 다이내믹한 운율학 패턴의 사용은 좋은 취사 선택 조건을 제공한다. 고정된 음성 부분의 풍부한 음소 표시법은 B.van Coile 등에 의한 PROTRAN(: 문자-음성 응용을 위한 운율학 이식법)(음성 및 언어 처리를 위한 국제 회의(ICSLP94, 일본 요코하마, 424-426쪽)에 설명되었다. 한편 직접적인 음소 엔코딩은 합성 음성 발생의 분야에서 폭넓게 사용된다.
본 발명은 또한 음성을 발생하기 위한 이와 같은 시스템이 제공된 운송 수단과 이와 같은 공고 정보를 생성하기 위한 시스템에서 사용을 위한 엔코딩 장치에 관한 것이다. 본 발명의 추가의 장점 적인 특성은 부가된 청구 범위에 기재된다.
이후에 우선 본 발명의 원리가 요약되고, 그후에 하드웨어 설비의 실시예가 설명되고, 최종적으로 예의 방법으로 데이터 구조의 부-집합이 주어지고, 이로부터 요구되는 전체 집합은 당업자에게 쉽게 구성될 수 있다. 이제, RDS-TMC 교통 정보시스템에 있어서, 메시지는 중앙 스테이션에 의해 코드 시퀀스의 형태로 FM 방송되고, 후속적으로 해당 자동차의 디지탈 라디오에서 수신되고 디코딩된다. 필터링 동작은 해당 메시지가 운전자에게 실제로 적절한 지의 여부를 검출한다. 적절할 경우, 메시지는 자동적으로, 음성으로 표시되거나, 또는 운전자의 요구에 따른다. 방송 메시지는 유럽에서 국제적으로 규정된 내용의 사전 정의된 구조를 갖고, 이는 언어에 독립적이다. 내용을 표시하기 위하여, 메시지는 각 언어에 대해 특정한 형태가 될 수 있는 캐리어 문장으로 변형된다. 이와 같은 캐리어 문장은 그후 번호와 확인자 또는 위치 이름과 같은 가변 부분으로 채워져야 하는 오픈 슬롯으로 보충될 수 있는, 특정 이벤트와 같은, 하나 이상의 고정된 부분을 갖는다. 특정 영역 또는 국가에 속하는 이와 같은 이름의 양은 일반적으로 매우 크고, 결과적으로 본 발명에 따라 캐리어 문장의 코드에 덧붙여 하나 이상의 코드로 방송된다.
방송 코드는 자동차 내부의 저장 메카니즘의 어드레스 지정을 위하여 사용되고, 이 코드는 합성 음성을 생성하는 것을 기초한 정보를 포함한다. 후자의 저장에 있어서, 메시지의 고정된 부분은 소위 말하는 풍부한 표시법으로 코딩될 수 있다. 피치 주파수를 한정하는 운율학적인 패턴과 이의 다이내믹한 변동과 같은 다양한 속성 및 다양한 음소 부분의 기간은 함축적으로 표시될 수 있다. 특히 지명의 수에 있어서 다양한 정보의 집합은 상기 풍부한 음소의 표시법을 저장하기에는 일반적으로 너무 커서, 사전적인 엑센트와 함께 직접적인 음소 표시법만이 유효하다. 이와 같은 경우에 있어서, 저장 내용은 사전과 너무 유사하게 된다. 자연적인 음성에 있어서, 다양한 요소의 억양 및 리듬은 이들 요소가 캐리어 문장 내에서 발생하는 그내용에 의존한다. 예컨대 구문의 경계 바로 전에 특정 지명이 그 피치에서, 동일한 이름이 다른 지명 뒤에 나오는 것보다, 상당히 다른 시간 의존도를 가질 수 있다. 그러므로 본 발명은 많은 상황에 대한 적절한 운율학을 제공한다.
해결책은, 메시지에 있어서, 각 채워져야 할 각 슬롯은 피치 윤곽과 음소 기간 조정 중 특정 선택 중 어느 것을 나타내거나 또는 음성 합성에서 리듬이 뒤따라야만 한다는 것을 나타내는 특정 내용 심벌을 포함한다. 이 방법에 있어서, 음성 품질과 명료도를 개선하는 쉬운 방법이 제공된다. 이와 같은 시스템에는 단순한 방법으로 정확한 억양과 타이밍이 제공될 수 있다. 물론, 특정 가변 항목에 대해서는, 실제 교통 메시지 내용에 따라서 단일의 변형이 표시될 필요가 있을 수 있다.
도 1은 구성적인 방법만으로 도시된 다소간의 표준의 자동차 내에 위치한 본 발명에 따른 장치의 전체 다이어그램이다. 부가적인 다양한 시스템은, 본 발명의 내용에 그 완전한 동작이 유지되지만, 생략되었다. 도면의 다양한 부분은 유럽 특허(707 704, 대응 미국 특허 08/433,669)로부터 유도되었다. 자동차는 몸체(20), 전륜(22) 및 엔진과 기어 박스(26)의 결합에 연결된 후륜(24)을 구비한다. 자동차는 실제 위치를 결정하는 다양한 설비를 구비한다. 우선 나침반(30)이 있고, 한 쌍의 바퀴 중 각 하나에 대한 하나의 주행 기록계(32)가 있다. 두 주행 기록계의 판독과 나침반의 결합이 프로세서(34)내에서 방향과 주행 거리를 계산하기 위해 사용된다. 유사하게, 접시 안테나(5)와 프로세서(28)의 결합은 GPS 위성 파형 패턴으로부터 실제 자동차 위치를 계산할 수 있다. 선택적으로 안테나(54)는 도로 측의 표시판으로부터 프로세서(56) 내에서의 처리를 위한 위치 코드를 수신할 수 있다.
블록(40)은 지리 데이터를 위한 CD-ROM 플레이어이다. 이들 데이터는 사용자 인터페이스(42)의 선택적인 제어 하에서 항로 계획 프로세서(38)에 의해 억세스된다. 실제 위치와 의도된 목적지의 입력에 따라서, 프로세서(38)는 최적의 항로를 계산하고, 이에 필요한 운전자의 동작을 지시하고, 이미 주행한 실제 항로의 관점에서 이를 갱신한다. 또한 지도 정보를 계산된 위치와 비교하는 것은 도로상의 위치에 대응하는 계산된 위치를 정정하거나 재설정한다. 당업자에게는 명백하듯이, 상기의 부 집합은 항로를 계획하거나 상기의 항로 계획에 의해 실제 항로를 충분히 확인할 수 있게 한다.
블록(28)은 운전에 포함되는 지의 여부, 로딩, 및 다양한 다른 것과 같은 자동차의 상태의 내부 변환을 검출한다. 상태의 항법적인 변화는 중앙 프로세서(58) 내에서 검출된다. 이 프로세서는 송신기-수신기(44), 항로 계획 프로세서(38), 및 위치 검출기(34,56)에 접속된다.
블록(44)은, 수 킬로메터가 될 수 있는 실제 셀 크기에 대해 적합한 제한된 범위를 갖는 셀 방식의 방송 시스템을 위한 송신기-수신기이다. 소자(52)는 라디오, 교통 메시지 시스템 및 전화와 같은 다른 시스템과 공유될 수 있는 관련된 안테나이다. 자동차 자체에 유지되는 메시지는 경찰, 전화 교환대 또는 교통 관리 컴퓨터 시스템과 같은 중앙 당국 시스템(100)에 보내질 수 있다. 자동차나 그 운전자에 관련될 수 있는 메시지는 외부 당국 또는 시스템으로부터 안테나(50 또는 52)에서 수신될 것이고, 본 발명에 따라서, 대인 인터페이스 작동기 수단(41)에 의해 작동되는 음성 출력 수단(43)에 음성으로 변환된다. 이와 같은 동작이 없이, 메시지는 시스템이 이와 같은 관련성을 고려할 때까지 저장된다. 긴급 메시지는 사용자의 요구와는 독립적으로 출력될 수 있다.
도 2는 본 발명에 따른 장치의 다이어그램이다. 블록(68)은 일부 중앙 스테이션에서의 메시지 및 후속 방송의 설정을 나타낸다. 블록(70)은 도 1의 시스템에서의 이 메시지의 후속의 수신을 나타낸다. 블록(72)은 수신기에서의 이의 전자적인 처리를 나타내고, 메시지는 소정의 포맷의 비트 열로 생성된다. 양호한 실시예에 따라서, 이 비트 열은 의도된 표현 언어와는 독립적이 된다. 블록(78)은 도 1에 따른 내용에 따라서 동작할 수 있는 자동차의 위치 결정 시스템이다. 이 위치 결정으로부터 블록(76)에서 영역의 세계적인 서비스 범위를 제공하는 셀 집합으로부터 해당 셀이 선택된다. 해당 셀은, 우선 자동차가 존재하는 실제의 셀이고, 추가로 운전 속도와 이동 방향의 관점에서 해당 셀로 간주되는 미래의 셀이다. 아마도 이들 셀은 실제 계획된 도로를 따라 선택될 수 있다. 게다가 블록(80)에서, 자동차의 실제 상태가 검출된다. 예컨대 이 상태는 빠르거나 늦은 여행, 정지, 적재와 같은 화물 관련 상태, 및 비상사태가 될 수 있다.
블록(74)에 있어서, 블록(76 및 80)으로부터의 선택 정보의 제어 하에서 블록(72)으로부터의 입력 메시지에 따라서 선택이 이루어진다. 부적절한 메시지는 억제되는 반면, 적절한 메시지는 진행된다. 블록(82)은 저장 제어기이다. 블록(74)에 의해 송신된 메시지는 도착 순서에 따라 파괴적으로 메모리에 기록된다. 순서의 시작은 특정 선두 지시자에 의해 표시된다. 각 메시지는 순서 번호를 가질 수 있다. 게다가 메모리 블록(88,90)중의 선택은 시분할 다중에 따른다. 예컨대 타이밍제어(86)는 메모리 블록(88,90) 사이의 동작을 주기적으로 교체시킨다. 기록이 한 블록에서 일어나면, 판독은 다른 블록에서 일어난다. 사용자 입력(84) 상의 제어 신호 판독의 수신 시에, 판독 모듈의 전체 내용이 한 번 판독된다. 블록(92)에서, 음성으로의 변환이 이루어진다. 이러한 취지로, IC-메모리 카드(94)는 메모리(88,90)로부터 판독된 하나의 유일한 항목 코드와 각각 관련되는 언어 지정 음소 심벌을 포함하고, 음성 메시지의 출력을 위한 이 것은 그후 순차적으로 어드레스 지정된다. 후속하여, 출력(96)은 도시 안된 증폭기-스피커 조합에 공급된다.
도 3은 이와 같은 장치의 메모리 구성을 도시한다. 블록(104)은 방송 수단에 의해 수신된 정보를 포함하는 수신 레지스터이다. 여기에서, 블록(106)은 메시지의 확인자를, 블록(108)은 메시지의 지리 코드를, 블록(110 내지 116)은 사용자에게 출력될 공고 메시지에 삽입을 위한 위치 코드를 각각 포함한다. 블록(102)에 있어서, 메시지의 지리 코드는, 도 1을 참조로 설명한 위치 결정 시스템을 심볼화하는 블록(100)으로부터 표시된 자동차의 실제 위치와 비교된다. 예컨대 실제 위치가 특정 셀 내에 있고, 실제 셀이 메시지에 포함된 셀과 동일한 셀이거나 인접한 셀이라면, 비교는 O.K. 신호만을 제공한다. 유사한 방법으로, 자동차의 실제 상태는 O.K. 신호의 생성을 동시 결정할 수 있다. 예컨대, 자동차가 하역 중이라면, 인접 셀은 O.K. 신호를 내보내지 않는다.
만약 O.K. 신호가 생성되었다면, 이는 게이트 블록(118)을 전달될 수 있게 한다. 일반적으로, 도 3에서의 표시는 물리적이 아닌 기능적이다. 제어 코드는 도 2의 메모리 모듈(88,90)의 부분을 형성할 수 있는 저장 유니트(120,122) 내에 효과적으로 저장된다. 음성이 생성되어야만 할 때, 블록(120) 내의 메시지 번호는 디렉토리(121)의 어드레스를 지정한다. 여기에서 어드레스 지정은 부분(122)에서 이루어진다. 저장 부분(124)은 메시지 생성을 제어하기 위한 2차 적인 제어 정보 즉, 다양한 메시지 슬롯의 위치를 포함하고, 고정된 슬롯을 위해서, 채워져야 할 항목 코드를 포함한다. 고정된 항목 코드는 이제 고정된 항목 저장 장치(136)의 어드레스를 지정하고, 이 항목은 풍부한 음소 표시 내에 저장된다. 레지스터(122)로부터 가변 항목 코드는, 관련된 운율학 코드 및 그들의 확인자를 포함하여, 디렉토리로부터의 그들의 메시지를 얻는다. 운율학 코드는 관련된 확인자와 결합하여 가변 항목 저장 장치(134)의 어드레스를 지정하고, 이는 이와 같은 가변 항목을 위하여 직접적으로 음소 엔코딩된 표시의 다양한 변형을 형성할 수 있게 한다. 저장 장치(134 및 136)로부터 출력된 표시는 레지스터(126)내에서 정확한 방법으로 나열된다. 여기에서 고정된 부분은 십자가에 의해, 가변 부분은 빈 박스에 의해, 내용 심벌은 도 4a 내지 도 4j를 참조로 논의될 접미사에 의해 표시된다.
도 4a 내지 도 4j는 타이밍과 운율학의 표준 패턴을 도시한다. 설명된 실시예에 있어서, 4 개의 다이내믹한 피치 패턴이 존재한다, 이들 각각은 이 후에 관련된 구두점에 의해 다음과 같이 표시된다.
a. 완전 정지점' . '은 피치의 낮아짐으로 종료하는 정상 문장 내에서 특정 항목의 사용을 나타낸다.
b. 세미콜론 ' : '은 최종 피치가 올라가는 문장의 왼쪽의 엑센트가 낮아지는 것을 나타내고, 강조된 항목에서 피치가 올라간다.
c. 콤마 ' , '는 특별한 최종 피치 상승의 문장에서 엑센트의 유지를 나타내고, 이는 일정 분리를 유지하면서 일종의 연결을 나타낸다.
d. 수평선' - '은 모든 엑센트를 제외한 경사만을 나타낸다, 이는 다음에 뒤따르는 항목의 장래의 엑센트를 나타낸다.
물론, 다이내믹 피치 패턴의 목록은 확장되거나 보다 제한되게 유지될 수 있다. 이 후의 표에 있어서, 모든 항목(S)은 수평선(-)을 갖는다.
도 4a는 세미콜론의 사용을 도시한다, 여기에서 일련의 4 개의 독일 도시명(Koln, Olpe, Hildesheim 및 Hanover)이 표시되었다. 상부 그래프는 시간 변화에 따른 진폭 신호를 도시하고, 이는 시간상의 음향의 실제 위치를 표시한다. 하부 그래프는 시간에 대한 피치 변화를 도시한다. 여기에서 4 개 표현의 두드러진 측면은 피치가 도시명의 스트레스가 가해진 부분 중에서 예리한 상승을 갖고, 이후 단어의 종료까지 적절하게 유지된다는 것이다. Hanover에 대해서는 배타적으로 스트레스가 가해진 음절은 두 번째 것이다.
도 4b는 동일한 일련의 4 개 독일 지명에 대해 완전 정지점의 사용을 도시한다. 여기에서, 4 개 모든 표현의 두드러진 측면은 스트레스가 가해진 음절 중에 피치가 처음에 상승한 후 예리하게 떨어지고 적절하게 낮게 유지된다는 것이다.
도 4c 및 4d는 두 개의 보다 복잡한 음성 항목('Koln Ring' 및 'Messeschnellweg'(고속도로))에 대한 세미콜론과 완전 정지점에 대해서 각각 동일한 것을 도시한다. 여기에서 제 1의 지명은 두 개의 엑센트 음절과, 각 단어에 대한 하나의 엑센트를 갖는다. 이제 세미콜론 변형에서, 'Ring' 위의 제 2의 엑센트만이 피치 상승에 의해 표시된다. 완전 정지점 변형에서는 두 엑센트 음절이 'Koln' 상의 피치 상승과 'Ring'상의 최종의 떨어짐에 의해 표시된다. 이들 두 엑센트는 시간에서 명백히 분리된다.
도 4e는 긴 메시지('Aa vier: Koln: Richtung Olpe: Autobahnkreuz- Sechzehn- Koln- Ost:')(Koln으로부터 Olpe까지의 고속도로 상에서 Koln 동쪽의 교차점 16에서)를 도시한다. 메시지의 미래의 내용은 억제된다. 앞에서 논의된 효과를 여기에서도 확인할 수 있다.
도 4f 내지 4j는 복잡한 수(funfhundert- sieben- und- vierzig)(547)의 다양한 표시를 도시한다. 도 4f는 시간상의 음향의 크기를 도시한다. 다음엔, 도 4g는 완전 정지점 측면의 피치의 변형을 도시한다. 피치의 명확한 최종의 하락은 'vierzig'에서 엑센트 음절 상에서 볼 수 있다. 도 4h는 세미콜론의 측면을 갖는다. 여기에서 피치의 명백한 최종 상승(1.5에서)을 볼 수 있다. 도 4i는 콤마의 측면을 갖는다. 여기에서, 특별한 '최종의' 상승은 'vierzig'의 엑센트가 없는 음절(zig)상에서 표시된다. 도 4j는 수평선의 측면을 갖는다. 여기에서 모든 피치 변화를 야기하는 엑센트는 없다.
도 5는 다양한 예의 메시지 표이다. 우선 r, z, u 및 사건(event)과 같은 메시지의 항목이 풍부한 음소 표시법으로 엔코딩된다. 사건 항목의 집합은 비교적 크지만, 보다 쉬운 인식을 위하여, 허용 가능한 특별한 저장 공간이 고려된다. 이들 항목의 운율학은 자연의 운율학을 복사한다. r, z, u의 항목은 비교적 빈번하게 발생하여, 사람에 의한 이의 인식은 매우 직관적이다. 게다가 인식하지 못함이 매우심각한 것은 아니다, 그 이유는 이와 같은 잘못된 인식이 대부분의 경우 운전자가 정확한 판단을 못하게 하지는 않기 때문이다. 사건을 고려하면, 이들은 비교적 많은 언어학상의 쓸데없는 말을 포함하는 것으로 밝혀졌다. 요구되는 다양한 형태의 저장에 대한 대강의 측정으로서, 다음 사항이 비교를 위해 주어진다. 오디오 파형의 저장은 초당 10 kbit 정도를 요구하고, 이는 본 발명에서 사용된다. 이로부터 합성 음성을 생성하기 위한 파라메터의 저장은 초당 60 비트의 범위로 대략 100 배정도 더 경제적이다. 덧붙여 간격 기간 및 피치 윤곽의 저장은 대략 500 비트의 고정된 양을 요구하고, 이 후자의 시스템은 고정된 윤곽 항목을 위하여 사용된다.
다음 사항은 이와 같은 고정된 항목의 제한된 목록이다.
r : 방향 또는 묵음(단락)
z : 사이(間)
i : --의 영역에서
u : 항로변경(도 5의 예에서는 없음)
'사건(event)'
'사건(event)'은 도로의 사용자를 위하여 적절한 사건 또는 상황이다. 사실 항목(사건)은 특정 내용에서 다양한 다른 사건이 해당될 수 있는 것처럼 많은 값을 갖는다. 사건의 전체 수는 시스템의 의도한 복잡성에 따라서 적거나 (수천 정도로)클 수 있다. 사실 특정 사건은 단어 열 또는 사건의 구로서 구성될 수 있다. 특정 사건 역시 예컨대 교통 혼잡의 길이 또는 경과 시간을 나타내는 양자화기에 의해서 채워지는 오픈 슬롯을 가질 수 있다. 본 실시예에 있어서, 사건의 항목은 풍부한음소 표시법으로 표시된다.
부가적인 도 5는 직접적인 음소 표시법으로 코딩되고 문맥에 민감한 운율학을 사용하는 많은 슬롯 필터를 갖는다. 특히, 지리적인 위치 이름의 수는 저장 내용을 파형으로서 하기에는 너무 크다. 수의 양은 적지만, 여기에서는 동일한 접근이 이름에 대해서와 같이 이루어진다.
L 숫자 변형 L- L : L.
N 위치 이름 변형 N- N : N.
Rt 도로 형태 변형 Rt-만이 사용된다.
Rn 도로명 변형 Rn.만이 사용된다.
S 부-형태(교차로, 삼각형, 접속, 도로변 여관)
변형 S-만이 사용된다.
표의 예에 있어서, 콤마(,)는 사용되지 않았다. 다른 접미사('-', ':', 및 '.')는 도 4a 내지 도 4j를 참조하여 설명되었다. 실시예에서 사용된 바와 같이, 이들 내용에 민감한 운율학 항목은 지리적인 이름과 숫자와 같은 중요한 항목의 인식을 증대시키기 위하여 제 1의 위치에 사용된다. 사실 이들 항목은 내용에서 넓은 변위를 갖지만, 한 철자만이 틀리거나 또는 동일하기도 하여 관련된 도 또는 주와 같은 별도의 표시가 이후에 제공되어야만 하는 도시의 이름과 같은 주어진 상황에서, 교환 가능한 다양한 쌍이 존재한다. 게다가 많은 이들 항목이 드물게 발생한다는 사실이 운전자가 인식하기 더 힘들게 만든다. 또한 거의 자연의 운율학으로 이들 항목을 제공하는 것이 사용자가 이 메시지를 쉽게 인식할 수 있음이 밝혀졌다.
위치에 민감한 캐리어는 다양한 위치, 도로 확인자 및 번호가 삽입될 수 있는 메시지이다. 이 캐리어는 각각이 간혹 이전의 정의의 부분이 아닌 부가적인 용어로 채워질 필요가 있는 일련의 슬롯 라벨을 포함한다. 사건에 민감한 캐리어는, 상황이 메시지의 핵심이고, 소수의 상기의 짧은 삽입물만이 요구되는 메시지이다. 물론, 상기에 덧붙여, 광고, 정부의 경고 등과 같은 교통 본연에 관련되지 않은 다양한 메시지가 삽입될 수 있다. 기본형의 시스템에 있어서, 전적으로 수 백 개의 캐리어 메시지가 정의되고, 이들 중 제한된 집합만이 정보를 위하여 표시된다. 교통 전문가는 필요에 따라 다른 메시지를 보충할 수 있다.
도 5는 거의 모든 상황에 적용되는 36 개의 메시지를 포함한다. 예컨대, 최종 메시지는, "교차점<번호>D와 교차점<번호>E 사이의 위치 B 방향 C 의 고속도로 번호 A<이름>에서 특정 <사건>이 발생하였다."라고 판독될 수 있다. 방송에 있어서, 메시지는 코드 열로 송신된다. 예컨대 최종 메시지 번호(40)는, 먼저 메시지 번호, 그후엔 사건 코드에 의해 종료되는 모든 위치 슬롯 필터(이 경우, Rt, N, Rn, L, L, S, N, S, N, L)에 따라 디코딩된다. 여기에서, 항목(N, L, S)은 번호로서 코딩된다, 특정 메시지에 있어서, 이들은 상호 동일할 수 있지만, 이 것은 표현의 제한은 아니다. 메시지 번호는 메시지가 포함된 지리적인 영역을 표시하는 것과 같은 부가적인 수식어에 의해 보충될 수 있고, 이 수식어는 메시지가 출력될 지의 여부를 결정하기 위한 디코딩 시스템에 의해 사용될 수 있다. 도 5에 도시된 운율학 표시자는 일반적으로 전송되지 않는다, 이 이유는 각 메시지 형태에 대해 표에서의 특정 입력을 위한 운율학은 요구되는 항목의 확인과는 무관하기 때문이다. 메시지 구조가 명확하지 않은 상황에서, 슬롯 필터 항목을 운율학 코드와 함께 전송하는 것이 필요할 수 있다. 보다 간결한 표시법에서, 항목(Rt, Rn)은 메시지의 코드화된 표현에 이미 함축될 수 있다.
위치의 음소 표시법에 단어의 엑센트가 제공된다, 이로부터 다양한 내용에 의존하는 위치의 변형이 유도된다.

Claims (6)

  1. 고정된 포맷의 코드화 제어 정보 소자를 수신하기 위한 입력 수단과, 상기 코드화 제어 정보 소자에 의해 순차적으로 선택 가능한 합성 음성 정보 항목을 저장하기 위한 저장 유니트와, 상기 음성 정보 항목의 제어 하에서의 합성 음성 메시지를 생성하기 위한 음성 생성기를 포함하는, 음성 메시지 정보를 생성하기 위한 장치에 있어서,
    고정된 항목과 가변 항목을 포함하는 메시지 포맷에 대해서, 관련된 제어 정보 시스템 에 인접하거나 또는 이에 함축적인 다양한 값의 내용 심벌에 의해 선택될 수 있는 것과 같이, 고정된 항목은 다양한 음소 표시법으로 엔코딩되고, 각 가변 항목은 사전의 엑센트와 함께 직접적인 음소 표시법으로 엔코딩되고, 상기 항목들은, 각각이 관련된 음소의 순서의 피치 및/또는 리듬의 각각 다른 운율학적인 패턴을 갖는 다양한 변형으로 청취자에게 제공되는 것을 특징으로 하는 음성 메시지 정보를 생성하기 위한 장치.
  2. 제 1항에 있어서, 상기 입력 수단은 방송 수신 수단을 포함하고,
    상기 고정된 포맷의 제어 소자는, 각각이 메시지에서 상기 가변 항목 모두를 표시하는 하나의 메시지 코드와 하나 이상의 코드 항목에 의해 표시되는 것을 특징으로 하는 음성 메시지 정보를 생성하기 위한 장치.
  3. 제 1항 또는 제 2항에 있어서, 자동차에서 교통 정보 메시지를 표시하기 위하여, 상기 장치는 실제 자동차 상태의 제어 하에서 생성되거나 억제될 상기 메시지 중에서 선택적으로 선택하기 위한 선택 수단을 더 구비하는 것을 특징으로 하는 음성 메시지 정보를 생성하기 위한 장치.
  4. 고정된 포맷의 코드화 제어 정보 소자를 수신하기 위한 방송 수단과, 상기 코드화 제어 정보 소자에 의해 순차적으로 선택 가능한 합성 음성 정보 항목을 저장하기 위한 저장 유니트와, 상기 음성 정보 항목의 제어 하에서 합성 음성 메시지를 생성하기 위한 음성 생성기를 포함하는, 음성 메시지 정보를 생성하기 위한 장치가 제공된 자동차에 있어서,
    고정된 항목과 가변 항목을 포함하는 메시지 포맷에 대해서, 관련된 제어 정보 시스템 에 인접하거나 또는 이에 함축적인 다양한 값의 내용 심벌에 의해 선택될 수 있는 것과 같이, 고정된 항목은 다양한 음소 표시법으로 엔코딩되고, 각 가변 항목은 사전의 엑센트와 함께 직접적인 음소 표시법으로 엔코딩되고, 상기 항목들은, 각각이 관련된 음소의 순서의 피치 및/또는 리듬의 각각 다른 운율학적인 패턴을 갖는 다양한 변형으로 청취자에게 제공되는 것을 특징으로 하는 자동차.
  5. 제 4항에 있어서, 상기 저장 유니트는, 최소한 모든 실제 상기 가변 메시지 항목을 수용하는 것과 같이, 상기 장치와 역으로 결합될 수 있는 저장 캐리어를 포함하는 것을 특징으로 하는 자동차.
  6. 합성 음성 메시지로서의 궁극적인 표시를 위하여, 고정된 포맷과 코딩된 제어 정보 소자의 제어 하에서, 상기 코딩된 제어 정보 소자에 의해 순차적으로 선택 가능한 합성 음성 정보를 저장하기 위한 저장 유니트의 수단에 의해, 음성 메시지 정보의 생성을 제어하기 위한 전송되는 합성 음성 메시지를 엔코딩하기 위한 엔코딩 장치에 있어서,
    고정된 항목과 가변 항목을 포함하는 메시지 포맷에 대해서, 관련된 제어 정보 시스템 에 인접하거나 또는 이에 함축적인 다양한 값의 내용 심벌에 의해 선택될 수 있는 것과 같이, 고정된 항목은 다양한 음소 표시법으로 엔코딩되고, 각 가변 항목은 사전의 엑센트와 함께 직접적인 음소 표시법으로 엔코딩되고, 상기 항목들은, 각각이 관련된 음소의 순서의 피치 및/또는 리듬의 각각 다른 운율학적인 패턴을 갖는 다양한 변형으로 청취자에게 제공되는 것을 특징으로 하는 엔코딩 장치.
KR1019970700670A 1995-06-02 1996-05-28 운송수단에서 코드화 음성 항목을 생성하기 위한 장치 KR100406625B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP95201453.8 1995-06-02
EP95201453 1995-06-02

Publications (1)

Publication Number Publication Date
KR100406625B1 true KR100406625B1 (ko) 2004-03-24

Family

ID=8220350

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970700670A KR100406625B1 (ko) 1995-06-02 1996-05-28 운송수단에서 코드화 음성 항목을 생성하기 위한 장치

Country Status (9)

Country Link
US (1) US5845250A (ko)
EP (1) EP0774152B1 (ko)
JP (1) JPH10504116A (ko)
KR (1) KR100406625B1 (ko)
CN (1) CN1110033C (ko)
AT (1) ATE195828T1 (ko)
DE (1) DE69609926T2 (ko)
ES (1) ES2151658T3 (ko)
WO (1) WO1996038835A2 (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10510065A (ja) * 1995-08-14 1998-09-29 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 多言語テキスト音声合成のための二連音を生成及び利用する方法及びデバイス
JPH10511488A (ja) * 1995-10-19 1998-11-04 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 電子回路を有する識別名トークン及び識別名コードを実現するための回路に対する外部のトークンにおける導体手段
JPH10143191A (ja) * 1996-11-13 1998-05-29 Hitachi Ltd 音声認識システム
US6081780A (en) * 1998-04-28 2000-06-27 International Business Machines Corporation TTS and prosody based authoring system
JP3460579B2 (ja) 1998-05-21 2003-10-27 松下電器産業株式会社 データ転送方法
DE19914041A1 (de) * 1999-03-27 2000-09-28 Bosch Gmbh Robert Verfahren zur Information von Autofahrern
EP1045372A3 (en) * 1999-04-16 2001-08-29 Matsushita Electric Industrial Co., Ltd. Speech sound communication system
US7058569B2 (en) * 2000-09-15 2006-06-06 Nuance Communications, Inc. Fast waveform synchronization for concentration and time-scale modification of speech
DE10151284A1 (de) * 2001-10-22 2003-04-30 Bayerische Motoren Werke Ag Verfahren zur Steuerung eines akustischen Informationswiedergabesystems in Fahrzeugen
JP2003186490A (ja) * 2001-12-21 2003-07-04 Nissan Motor Co Ltd テキスト音声読み上げ装置および情報提供システム
JP2003308283A (ja) * 2002-04-18 2003-10-31 Mitsubishi Electric Corp 通信装置、通信方法及び車載用ナビゲーション装置
US7013282B2 (en) * 2003-04-18 2006-03-14 At&T Corp. System and method for text-to-speech processing in a portable device
US20040215461A1 (en) * 2003-04-24 2004-10-28 Visteon Global Technologies, Inc. Text-to-speech system for generating information announcements
CN100346390C (zh) * 2003-07-25 2007-10-31 华为技术有限公司 可变语音信号编译的方法
US7558389B2 (en) * 2004-10-01 2009-07-07 At&T Intellectual Property Ii, L.P. Method and system of generating a speech signal with overlayed random frequency signal
DE102008019071A1 (de) * 2008-04-15 2009-10-29 Continental Automotive Gmbh Verfahren, Fahrerinformationssystem und Fahrerassistenzsystem zur Ausgabe von Informationen
US9031776B2 (en) 2012-11-29 2015-05-12 Nissan North America, Inc. Vehicle intersection monitoring system and method
US9620014B2 (en) 2012-11-29 2017-04-11 Nissan North America, Inc. Vehicle intersection monitoring system and method
US9349291B2 (en) 2012-11-29 2016-05-24 Nissan North America, Inc. Vehicle intersection monitoring system and method
US9020728B2 (en) 2013-01-17 2015-04-28 Nissan North America, Inc. Vehicle turn monitoring system and method
US8990001B2 (en) 2013-07-26 2015-03-24 Nissan North America, Inc. Vehicle collision monitoring method
US9177478B2 (en) 2013-11-01 2015-11-03 Nissan North America, Inc. Vehicle contact avoidance system
US9031758B1 (en) 2014-03-04 2015-05-12 Nissan North America, Inc. On-board vehicle control system and method for determining whether a vehicle is within a geographical area of interest
US9485247B2 (en) 2014-03-04 2016-11-01 Nissan North America, Inc. On-board vehicle communication system and method
US9324233B2 (en) 2014-03-04 2016-04-26 Nissan North America, Inc. Vehicle contact warning method and system
US9153132B2 (en) 2014-03-04 2015-10-06 Nissan North America, Inc. On-board vehicle control system and method for determining whether a value is within an area of interest for extraneous warning suppression
US9694737B2 (en) 2014-06-16 2017-07-04 Nissan North America, Inc. Vehicle headlight control system and method
US9778349B2 (en) 2014-10-03 2017-10-03 Nissan North America, Inc. Method and system of monitoring emergency vehicles
US9776614B2 (en) 2014-10-03 2017-10-03 Nissan North America, Inc. Method and system of monitoring passenger buses

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4692941A (en) * 1984-04-10 1987-09-08 First Byte Real-time text-to-speech conversion system
JP2556501B2 (ja) * 1987-02-09 1996-11-20 株式会社日立製作所 運転免許証カ−ドシステム
DE3709523A1 (de) * 1987-03-23 1988-10-13 Bosch Gmbh Robert Rundfunkempfaenger mit mindestens einem verkehrsfunkdecoder
US4998753A (en) * 1990-04-03 1991-03-12 Sharon Wichael Multi-purpose computer readable driver's license
JPH0512896A (ja) * 1991-07-08 1993-01-22 Sharp Corp 音声録音再生装置
DE4138016A1 (de) * 1991-11-19 1993-05-27 Philips Patentverwaltung Einrichtung zur erzeugung einer ansageinformation
US5384893A (en) * 1992-09-23 1995-01-24 Emerson & Stern Associates, Inc. Method and apparatus for speech synthesis based on prosodic analysis
US5463715A (en) * 1992-12-30 1995-10-31 Innovation Technologies Method and apparatus for speech generation from phonetic codes
WO1995030882A2 (en) * 1994-05-06 1995-11-16 Philips Electronics N.V. A method and apparatus for differential location of a vehicle under control of an internal change of status
US5592585A (en) * 1995-01-26 1997-01-07 Lernout & Hauspie Speech Products N.C. Method for electronically generating a spoken message

Also Published As

Publication number Publication date
JPH10504116A (ja) 1998-04-14
WO1996038835A2 (en) 1996-12-05
EP0774152B1 (en) 2000-08-23
DE69609926D1 (de) 2000-09-28
US5845250A (en) 1998-12-01
ATE195828T1 (de) 2000-09-15
CN1110033C (zh) 2003-05-28
CN1159240A (zh) 1997-09-10
DE69609926T2 (de) 2001-03-15
EP0774152A2 (en) 1997-05-21
WO1996038835A3 (en) 1997-01-30
ES2151658T3 (es) 2001-01-01

Similar Documents

Publication Publication Date Title
KR100406625B1 (ko) 운송수단에서 코드화 음성 항목을 생성하기 위한 장치
US6108631A (en) Input system for at least location and/or street names
US8386166B2 (en) Apparatus for text-to-speech delivery and method therefor
US5835854A (en) Traffic information system comprising a multilingual message generator
US20120095676A1 (en) On demand tts vocabulary for a telematics system
JP3573907B2 (ja) 音声合成装置
JPH116743A (ja) 移動端末装置及びそのための音声出力システム
WO1996006326A2 (en) A navigation device for a land vehicle with means for generating a multi-element anticipatory speech message, and a vehicle comprising such device
JPH0969793A (ja) 無線放送受信機および符号化メッセージの処理モジュール
EP0777210B1 (en) Text to voice read-out system
JP5234370B2 (ja) 車載器
KR100436609B1 (ko) 트래픽정보장치,모듈및휴대가능카드
KR100424215B1 (ko) 합성음성에의해디지털부호화된교통메시지출력방법및장치
KR19980024599A (ko) 특정 지역 및 초지역적인 도로나 영역 표기를 처리하는 무선 수신기
KR100450913B1 (ko) 디지털코딩된트래픽메세지의음성출력장치
KR100386382B1 (ko) 개선된음성합성기를갖는교통정보장치
EP1324313B1 (en) Text to speech conversion
JP2009085697A (ja) 車載器
KR19980081821A (ko) 언설 세그먼트 메모리를 구비한 무선 수신기
JPH0969791A (ja) 無線放送受信機および符号化メッセージの処理モジュール
Van Coile et al. Speech synthesis for the new Pan-European traffic message control system RDS-TMC
JPH09114807A (ja) 文音声合成装置
JPH10228294A (ja) 音声合成装置
JP2000075877A (ja) 音声合成システム
KR100342228B1 (ko) 차량항법장치의 음성안내 방법

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121019

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20131017

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20141022

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20151016

Year of fee payment: 13

EXPY Expiration of term