KR20010086258A - Controlling navigation paths of a speech-recognition process - Google Patents

Controlling navigation paths of a speech-recognition process Download PDF

Info

Publication number
KR20010086258A
KR20010086258A KR1020007009503A KR20007009503A KR20010086258A KR 20010086258 A KR20010086258 A KR 20010086258A KR 1020007009503 A KR1020007009503 A KR 1020007009503A KR 20007009503 A KR20007009503 A KR 20007009503A KR 20010086258 A KR20010086258 A KR 20010086258A
Authority
KR
South Korea
Prior art keywords
nodes
node
recognition process
speech recognition
user
Prior art date
Application number
KR1020007009503A
Other languages
Korean (ko)
Inventor
폰드섹말크에스.
게브리스게레쓰엘.
세이트라자케이.
그로스만피터
워머메트휴디.
콜린스팀제이.
카즈닉키로이스더블유.
벨레스테스다이에나피.
자스펄스흔게리엠.
Original Assignee
요트.게.아. 롤페즈
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 요트.게.아. 롤페즈, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 요트.게.아. 롤페즈
Publication of KR20010086258A publication Critical patent/KR20010086258A/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Abstract

본 발명은 사용자에게 프롬프트가 제공되고 사용자의 구두 응답과 저장된 음성 엘리먼트의 비교에 기초하여 동작이 취해지는 음성 인식 프로세스의 네비게이션 경로를 제어하는 방법 및 컴퓨터 프로그램에 관한 것이다. 본 발명의 방법은 그룹 노드 및 터미널 노드를 포함하는 노드의 계층으로 프롬프트, 동작 및 음성 엘리먼트를 구성하는 단계와, 음성 인식 프로세스의 네비게이션 경로를 지시하는 계층 리스트로 노드를 디스플레이하는 단계를 포함한다. 사용자는 계층 리스트의 노드 위치를 편집함으로써 음성 인식 프로세스에서 네비게이션 경로를 변경한다. 음성 인식 프로세스는 호출 루틴 프로세스를 포함한다.The present invention relates to a method and a computer program for controlling a navigation path of a speech recognition process in which a user is prompted and an action is taken based on a comparison of a spoken response of a user with a stored speech element. The method includes constructing prompts, actions, and speech elements in a hierarchy of nodes, including group nodes and terminal nodes, and displaying the nodes in a hierarchical list indicating navigation paths of the speech recognition process. The user changes the navigation path in the speech recognition process by editing the node position in the hierarchical list. The speech recognition process includes a calling routine process.

Description

음성 인식 프로세스의 네비게이션 경로를 제어하기 위한 방법 및 컴퓨터 프로그램{Controlling navigation paths of a speech-recognition process}Controlling navigation paths of a speech-recognition process

업무상, 주요 전화번호를 종종 엔트리 포인트로써 전화 네트워크에 제공한다. 주요 전화번호를 자주 호출하는 고객은 특정 사람 또는 부서에 연락을 취할 때 보조 장치를 필요로 한다. 음성에 기초한 자동 안내 소프트웨어(autoattendant)는 주요 전화번호로부터 특정 구내 전화에 호출(call)를 빠르게 전송하기 위하여 음성 인식 기술을 사용한다. 예컨대, 자동 안내 소프트웨어는 "당신이 연락하려고 하는 직원의 이름이 무엇입니까 ?" 라고 요청한 후에, 호출 목적지를 결정하기 위하여 호출자의 구두 대답을 분석한다. 이러한 작업을 자동화하면, 주요 업무 전화번호를 제공하는 부담이 감소한다.In business, a major telephone number is often provided to the telephone network as an entry point. Customers who frequently call a major phone number need an assistive device to contact a specific person or department. Voice-based autoattendant uses speech recognition technology to quickly transfer calls from a primary telephone number to a specific local telephone. For example, the automated guidance software asks "What is the name of the employee you want to contact?" And then parse the caller's verbal answer to determine the call destination. Automating these tasks reduces the burden of providing key business phone numbers.

불행하게도, 정보 관리 작업은 음성에 기초한 자동 안내를 설치하는 장점을부분적으로 상쇄시킬 수 있다. 예컨대, 호출자의 음성에 대해 자동 안내 질문 및 응답("호 흐름")을 스크립트하면 시간이 많이 소요된다. 더욱이, 다른 음성 발생, 음성 인식, 및 전화 번호부 데이터를 통합하는 것은 상당한 데이터 베이스 관리 노력을 필요로 한다.Unfortunately, information management tasks can partially offset the benefits of installing automatic guidance based on voice. For example, scripting automatic guided questions and responses (“call flows”) on the caller's voice is time consuming. Moreover, integrating other speech generation, speech recognition, and phonebook data requires significant database management efforts.

본 발명은 음성 인식 프로세스의 네비게이션 경로를 제어하기 위한 방법 및 컴퓨터 프로그램에 관한 것이다.The present invention relates to a method and a computer program for controlling a navigation path of a speech recognition process.

도 1a 내지 도 1d는 자동 안내 기능을 기술하는 도면.1A to 1D are diagrams describing the automatic guidance function.

도 2는 자동 안내 구성 소자를 포함하는 컴퓨터 플랫폼을 나타낸 도면.2 illustrates a computer platform including an autonomous guidance component.

도 3은 자동 안내 구성 소자를 나타낸 도면.3 shows an automatic guidance component.

도 4는 자동 안내 관계 데이터베이스의 테이블 상호관계를 나타낸 도면.4 shows table correlations in an automated guidance relationship database.

도 5는 계층 레코드를 나타낸 도면.5 shows a hierarchical record.

도 6은 계층적으로 조직된 노드 및 호출 흐름 네비게이션 경로 사이의 상호관계를 기술한 흐름도.6 is a flow chart describing the interrelationships between hierarchically organized nodes and call flow navigation paths.

도 7은 자동 안내를 관리하는 계층적 사용자 인터페이스(GUI)의 스크린 디스플레이를 나타낸 도면.7 shows a screen display of a hierarchical user interface (GUI) for managing automatic guidance.

도 8a 내지 도 8d는 자동 안내 GUI 다이얼로그의 스크린 디스플레이를 나타낸 도면.8A-8D illustrate screen displays of an automatic guidance GUI dialog.

일반적으로 본 발명은 사용자에게 프롬프트가 제공되고 저장된 음성 엘리먼트와 사용자의 구두 응답의 비교에 기초하여 동작이 취해지는 음성 인식 프로세스의 네비게이션 경로를 용이하게 제어한다. 본 발명은 그룹 노드 및 터미널 노드를 포함하는 노드의 계층에서 프롬프트, 동작, 및 음성 엘리먼트를 인식하며, 음성 인식 프로세스의 네비게이션 경로를 지시하는 계층 리스트에 노드를 디스플레이한다. 사용자는 계층 리스트에 노드의 위치를 편집함으로써 음성 인식 프로세스의 네비게이션 경로를 변경할 수 있다.In general, the present invention facilitates the navigation path of the speech recognition process in which an action is taken based on a comparison of the spoken response of the user with a prompted and stored speech element. The present invention recognizes prompts, actions, and speech elements in a hierarchy of nodes, including group nodes and terminal nodes, and displays the nodes in a hierarchical list that indicates the navigation path of the speech recognition process. The user can change the navigation path of the speech recognition process by editing the location of the node in the hierarchical list.

본 발명의 일 실시예는 다음과 같은 하나 이상의 특징을 포함할 수 있다. 네비게이션 경로는 그래픽 사용자 인터페이스와 상호작용함으로써 변경될 수 있다. 사용자는 계층적으로 포함된 노드의 위치를 편집할 수 있는 드래그 및 드롭 연산에 의하여 계층 리스트에 노드의 위치를 편집할 수 있다. 사용자는 추가, 삭제 또는 편집 작업을 수행할 수 있다. 프롬프트, 동작 및 음성 엘리먼트는 관계 데이터베이스에서 레코드로써 인식될 수 있다.One embodiment of the invention may include one or more of the following features. The navigation path can be changed by interacting with the graphical user interface. The user can edit the position of the node in the hierarchical list by dragging and dropping operations that can edit the position of the node included hierarchically. The user can add, delete or edit. Prompt, action, and voice elements can be recognized as records in the relational database.

사용자에게는 계층적으로 포함된 노드들에서 선택된 그룹 노드의 계층적으로포함된 노드가 디스플레이될 수 있다. 사용자는 계층 리스트의 디스플레이를 변경하기 위하여 그룹 노드를 감소 및 확장시킬 수 있다.The user may display a hierarchically included node of a group node selected from hierarchically included nodes. The user can reduce and expand the group node to change the display of the hierarchical list.

음성 인식 프로세스는 호출 루틴 프로세스일 수 있다. 호출 루틴 프로세스는 전화 구내 전화에 호출을 전송하는 단계 또는 음성 파일을 동작시키는 단계를 포함할 수 있다.The speech recognition process may be a calling routine process. The call routine process may include sending a call to a telephone premises phone or operating a voice file.

본 발명은 다음과 같이 하나 이상의 장점을 가질 수 있다.The present invention may have one or more advantages as follows.

직관적인 사용자 인터페이스를 사용하여 호출의 흐름을 제어하면, 호출 흐름 관리의 부담이 감소한다. 게다가, 계층 데이터에 기초하여 호출의 흐름을 제어하는 능력은 사용자가 적절한 구내 전화로 연락을 취하는데 도움을 줄 뿐만 아니라 임의의 특정 프롬프트로 허용 가능한 프롬프트를 좁힘으로써 자동 안내 응답의 속도를 높일 수 있다.Controlling the flow of calls using an intuitive user interface reduces the burden of call flow management. In addition, the ability to control the flow of calls based on hierarchical data not only helps the user to reach the appropriate local telephone, but can also speed up the automated prompt response by narrowing the acceptable prompts to any particular prompt. .

본 발명은 하드웨어, 소프트웨어 또는 이들의 결합으로 수행될 수 있다. 바람직하게, 본 발명은 프로세서, 프로세서에 의해 판독할 수 있는 저장 매체(휘발성 및 비휘발성 메모리 및/또는 저장 엘리먼트를 포함함), 적어도 하나의 입력장치, 및 적어도 하나의 출력장치를 포함하는 프로그램 가능 컴퓨터상에서 실행되는 컴퓨터 프로그램으로 실현된다. 프로그램 코드는 전술한 기능을 실행하여 출력 정보를 발생시키기 위하여 입력장치에 의해 입력된 데이터에 적용된다.The invention can be performed in hardware, software or a combination thereof. Preferably, the present invention is programmable including a processor, a storage medium readable by the processor (including volatile and nonvolatile memory and / or storage elements), at least one input device, and at least one output device. It is realized as a computer program running on a computer. The program code is applied to the data input by the input device to execute the above functions to generate output information.

각각의 프로그램은 바람직하게 컴퓨터와 통신하기 위하여 고레벨 또는 고목적 프로그래밍 언어로 실현된다. 그러나, 프로그램은 필요한 경우 어셈블리 또는 기계 언어로 실현될 수 있다. 임의의 경우에, 언어는 컴파일 또는 해석된 언어일수 있다.Each program is preferably realized in a high level or general purpose programming language to communicate with a computer. However, the program can be realized in assembly or machine language if necessary. In any case, the language can be a compiled or interpreted language.

이러한 각각의 프로그램은 바람직하게 저장 매체 또는 저장 장치(예컨대, ROM 또는 자기 디스켓)에 저장되며, 상기 저장 매체 또는 저장 장치는 저장 매체 또는 저장 장치가 본 명세서에 기술된 프로시듀어를 실행하기 위하여 컴퓨터에 의해 판독될 때 컴퓨터를 구성 및 동작시키기 위하여 범용 또는 특정 목적 프로그램 가능 컴퓨터에 의해 판독할 수 있다. 시스템은 컴퓨터 프로그램으로 구성된 컴퓨터 판독 가능 저장 매체로써 실현되는 것으로 고려된다. 이와 같이 구성된 저장 매체는 컴퓨터가 특정 및 소정 방식으로 실행되도록 한다.Each such program is preferably stored on a storage medium or storage device (eg, a ROM or magnetic diskette), the storage medium or storage device being a computer for the storage medium or storage device to execute the procedures described herein. It can be read by a general purpose or special purpose programmable computer to configure and operate the computer when it is read. The system is considered to be realized as a computer readable storage medium composed of computer programs. The storage medium thus configured allows the computer to be executed in a specific and predetermined manner.

본 발명의 다른 특징 및 장점은 도면을 포함하는 이하의 상세한 설명 및 청구범위로부터 명백해질 것이다.Other features and advantages of the invention will be apparent from the following detailed description and claims, including the drawings.

도 1a 내지 도 1d를 참조하면, 자동 안내 구조(10)는 PBX(구내 전화 교환 시스템)와 같은 스위치(20)에 의해 수신된 입력 호출(12)를 자동 안내부(24)에 전송한다. 자동 안내부(24)는 호출자가 연락하기를 원하는 구내 전화(14, 16, 1 또는 22)를 결정하기 위하여 호출자 질문을 요청할 수 있다. 자동 안내부(24)는 도 1b에 도시된 결정된 구내 전화에 입력 호출(12)를 접속하기 위하여 스위치(20)를 제어한다.Referring to FIGS. 1A-1D, the autonomous guidance structure 10 transmits an input call 12 received by a switch 20, such as a PBX (premises switched telephone system), to the autonomous guidance unit 24. Automated guidance 24 may request caller questions to determine the premises phone 14, 16, 1 or 22 that the caller would like to contact. The automatic guide 24 controls the switch 20 to connect the input call 12 to the determined office telephone shown in FIG. 1B.

다른 구내 전화는 다른 그룹에 속할 수 있다. 예컨대, 구내 전화(16, 18)는 판매부(26)에 근무하는 직원의 전화일 수 있다. 계층적 부서/직원의 상호관계에 대한 설명이 제공되지 않는다면, 자동 안내부(24)는 호출자가 연락하기를 원하는 부서가 어느 부서인지를 호출자에게 요청할 수 있다. 호출자의 응답을 결정한 후, 자동 안내부(24)는 판매부(26)내의 구내 전화에 호출을 전송하거나 또는 호출자가 연락하기를 원하는 판매부(26)내의 구내 전화가 구내 전화(16)인지 또는 구내 전화(18)인지를 호출자에게 요청할 수 있다.Different extension phones can belong to different groups. For example, the premises telephones 16 and 18 may be the telephones of employees working in the sales department 26. If no description of the hierarchical department / employee interrelationship is provided, the automatic guidance unit 24 may ask the caller which department the caller wishes to contact. After determining the caller's response, the automatic guide 24 sends the call to the premises telephone in the sales department 26 or whether the premises telephone in the sales department 26 that the caller wants to contact is the premises telephone 16 or the premises telephone. (18) The caller may be asked to confirm.

도 1c에 도시된 바와 같이, 안내부(24)는 예컨대 직원(14)이 특정 부서(26)내에서 다른 직원과 통신할 필요가 있을 때 스위치(20)에 접속된 구내 전화로부터발생한 호출을 처리할 수 있다. 질문에 대한 호출자의 응답을 분석한 다음, 자동 안내부(24)는 도 1d에 도시된 바와 같이 호출자를 접속할 수 있다.As shown in FIG. 1C, the guidance unit 24 handles calls originating from the on-premises telephones connected to the switch 20, for example when an employee 14 needs to communicate with another employee within a particular department 26. can do. After analyzing the caller's response to the question, automatic guide 24 may connect the caller as shown in FIG. 1D.

입력 호출(12)를 루틴하는 대신에, 자동 안내부(24)는 다른 호출 처리를 수행할 수 있다. 예컨대, 자동 안내부(24)는 기술적 지원 정보 또는 로드 방향의 음성 파일을 실행시킬 수 있다.Instead of routinely making an input call 12, the automatic guide 24 may perform other call processing. For example, the automatic guide 24 may execute the technical support information or the voice file in the load direction.

도 2를 참조하면, 자동 안내부(24)는 프로세서(36), 메모리(34), 및 버스 인터페이스 회로(도시안됨)와 같은 다른 구성 소자를 구비하는 컴퓨터 시스템(32)을 포함할 수 있다. 컴퓨터 플랫폼(24)은 표준 PC형 키보드(28), 마우스(30)와 같은 포인팅 장치 및 모니터(27)를 포함한다. 컴퓨터 시스템(32)은 CD, 플로피 디스크, 하드디스크등과 같은 대용량 저장 엘리먼트(38)를 포함한다. 컴퓨터 시스템(32)은 라인 카드(37)를 통해 입력 호출을 수신한다. 대용량 저장 엘리먼트(38)의 일부분은 동작 과정 중에 메모리(34) 및 프로세서(36)에 전송된다.Referring to FIG. 2, the automatic guide 24 may include a computer system 32 having a processor 36, a memory 34, and other components such as a bus interface circuit (not shown). Computer platform 24 includes a standard PC-type keyboard 28, a pointing device such as a mouse 30, and a monitor 27. Computer system 32 includes mass storage elements 38 such as CDs, floppy disks, hard disks, and the like. Computer system 32 receives an input call via line card 37. Portions of mass storage element 38 are transmitted to memory 34 and processor 36 during operation.

대용량 저장 엘리먼트(32)는 자동 안내 관리 소프트웨어(40), 데이터(44) 및 음성 사용자 인터페이스(VUI) 소프트웨어(42)를 포함한다. 관리 소프트웨어(40)는 모니터(27)상에 자동 안내 정보를 디스플레이하며 관리자가 적정 호출 흐름을 제공하기 위하여 데이터(44)를 빠르게 편집 및 구성하도록 하는 그래픽 사용자 인터페이스(GUI)를 제공한다. VUI(42)는 관리 소프트웨어(40)에 의해 배열되는 데이터(44)에 기초하여 입력 호출을 처리한다. 로킹기술은 관리 소프트웨어(40)가 VUI(42) 서비스를 간섭하지 않고 데이터(44)를 변경하도록 한다.Mass storage element 32 includes automatic announcement management software 40, data 44, and voice user interface (VUI) software 42. The management software 40 displays automatic guidance information on the monitor 27 and provides a graphical user interface (GUI) that allows the administrator to quickly edit and organize the data 44 to provide the proper call flow. VUI 42 processes input calls based on data 44 arranged by management software 40. The locking technique allows the management software 40 to change the data 44 without interfering with the VUI 42 service.

도 3을 참조하면, 데이터(44)는 다른 관계 데이터베이스(50, 52)를 포함하나, 다른 실행은 단일 관계 데이터베이스를 사용한다. 각각의 데이터베이스(50,52)는 다른 호출 흐름에 대응하며 다른 프롬프트(54, 58) 및 그램머 파일(grammar files)(56, 60)을 발생시킨다.Referring to FIG. 3, data 44 includes other relational databases 50, 52, but other implementations use a single relational database. Each database 50, 52 corresponds to a different call flow and generates different prompts 54, 58 and grammar files 56, 60.

프롬프트 파일(54, 58)은 자동 안내 음성을 발생시키기 위하여 VUI(42)에 의해 사용된 인덱스 신호 정보를 포함한다. 예컨대, 동작시킬 프롬프트를 결정하기 위하여 관계 데이터베이스(50 또는 52)를 액세스한 후에, VUI(42)는 특정 프롬프트(예컨대, 우리 부서에 전화 주셔서 감사합니다")를 발생시키는데 필요한 프롬프트 파일(54 또는 58) 정보를 검색할 수 있다. 프롬프트 파일(54, 58)은 미리 기록된 특정 프롬프트 및 위치가 결정된 특정 프롬프트를 포함할 수 있다.Prompt files 54 and 58 contain index signal information used by VUI 42 to generate an automatic announcement voice. For example, after accessing relational database 50 or 52 to determine which prompts to act on, VUI 42 may prompt files 54 or 58 to generate specific prompts (eg, thank you for calling our department "). Information may be retrieved Prompt files 54 and 58 may include specific pre-recorded prompts and specific prompts with determined locations.

그램머 파일(56, 60)은 자동 안내부가 특정 프롬프트(예컨대, 판매부입니다)에 응답하여 인식할 수 있는 다른 음성 엘리먼트를 나타내는 인덱스된 신호 정보를 포함한다. 호출자의 음성을 분석한 후에, VUI(42)는 자동 안내부가 어떻게 응답해야하는 지(예컨대, 구내 전화에 호출을 전송하거나 또는 다른 프롬프트를 실행하거나)를 결정하기 위하여 관계 데이터베이스(50 또는 52)를 액세스할 수 있다.The grammar files 56 and 60 contain indexed signal information representing other spoken elements that the automatic guide can recognize in response to a particular prompt (eg, a sales department). After analyzing the caller's voice, the VUI 42 accesses the relational database 50 or 52 to determine how the auto attendant should respond (eg, send a call to a local telephone or issue another prompt). can do.

컴파일링 소프트웨어(64)는 관계 데이터베이스(50, 52) 레코드로부터 그램머 파일(56, 60)을 발생시킨다. 컴파일은 양호한 런-타임 간격 동안 또는 관리자가 증분 컴파일을 초기화하고 휴지기간 컴파일을 자동적으로 스케줄링할 때중 어느 하나 또는 둘다에서 발생할 수 있다.Compiling software 64 generates grammar files 56 and 60 from relational database 50 and 52 records. Compilation can occur either during good run-time intervals or when an administrator initiates an incremental compilation and automatically schedules a dormant compilation.

관리 소프트웨어(40) 서비스 관리자(66)는 관리자가 다른 데이터베이스에 포함되는 다른 호출 흐름을 다른 입력 채널(62)에 할당하도록 한다. 예컨대, 고객 문의를 위한 전화 라인세트 및 기술 지원을 위한 다른 전화 라인 세트를 가질 수 있다. VUI(42)는 관계 데이터베이스(50 또는 52)가 할당된 호출 흐름을 제공하는지를 결정하기 위하여 호출 전송 파일(48)을 검사할 수 있다. 많은 채널(62)은 동일한 관계 데이터베이스(50, 52)를 동시에 사용한다.The management software 40 service manager 66 allows the manager to assign different call flows contained in other databases to different input channels 62. For example, you may have a telephone line set for customer inquiries and another telephone line set for technical support. VUI 42 may examine call transfer file 48 to determine if relational database 50 or 52 provides an assigned call flow. Many channels 62 use the same relational database 50, 52 at the same time.

도 4를 참조하면, 데이터베이스(50)와 같은 각각의 관계 데이터베이스는 호출 흐름 구성 레코드(64)를 포함한다. 구성 레코드(64)는 자동 안내부에 접속된 스위치의 형태 및 사용된 언어(예컨대, 영어 또는 스페인어)와 같은 일반적인 파라미터를 기술하는 데이터를 저장한다. 구성 레코드(64)는 업무 시간, 휴일 및 업무 시간 이후에 수신된 메시지를 처리하는 구내 전화(예컨대, 음성 메일 또는 교환수)를 지시하는 정보를 저장할 수 있다.Referring to FIG. 4, each relational database, such as database 50, includes a call flow configuration record 64. The configuration record 64 stores data describing general parameters such as the type of switch connected to the automatic guide and the language used (eg English or Spanish). The configuration record 64 may store information indicating an office telephone (eg, voice mail or attendant) that processes messages received after business hours, holidays and after business hours.

구성 레코드(64)는 VUI(42)가 호출자에게 질문하기 위하여 사용하는 프롬프트를 제어하는 구성형 식별자를 저장한다. 예컨대, "기본적인" 구성은 구내 전화 또는 그룹내의 다른 그룹을 찾지 않는 플랫 구성에 대한 프롬프트를 발생시킨다. 예컨대, 기본적인 구성 형태는 "당신이 연락하기를 원하는 부서의 사람을 말하십시오"를 프롬프트하고 호출자의 응답에 기초하여 호출을 전송한다.Configuration record 64 stores a configuration identifier that controls the prompt that VUI 42 uses to ask the caller. For example, a "basic" configuration generates a prompt for a flat configuration that does not look for a local telephone or another group within the group. For example, the basic configuration prompts "tell the person of the department you want to contact" and sends the call based on the caller's response.

"부서-이름" 구성은 구내 전화, 그룹내의 다른 그룹등을 찾는 다중레벨 구성에 대한 프롬프트를 발생시킨다. 부서-이름 구성은 호출자에게, "부서와 연락을 취하기 위해서는 부서의 이름을 말하거나 부서의 리스트를 기다리십시오" 라고 프롬프트한다. 만일 호출자가 부서 이름에 응답한다면, VUI(42)는 선택된 부서에 속하는 사람 이름을 리스트할 수 있다.The "Department-Name" configuration raises the prompt for a multilevel configuration to look up the local telephone, other groups within the group, and so on. The department-name configuration prompts the caller, "To contact the department, say the name of the department or wait for the list of departments." If the caller responds to the department name, VUI 42 may list the person names belonging to the selected department.

각각의 관계 데이터베이스(50)는 계측 레코드(66)의 테이블을 포함한다. 도 5를 참조하면, 각각의 계층 레코드(66)는 계층(68)내의 노드를 기술한다. 노드는 그룹 노드(26, 130, 132, 134) 또는 터미널 노드일 수 있다. 터미널 노드는 구내 전화(14, 16, 18, 24, 140), 음성 파일(136, 138) 또는 다른 호출 처리 명령(도시안됨)을 포함하는 파일을 나타낼 수 있다. 그룹(26, 130, 132, 134)은 다른 노드 형태중 일부 형태를 계층적으로 포함할 수 있다. 다른 네비게이션 경로로부터의 노드와 호출자 사이의 접속은 노드를 네비게이트할 수 있다. 도 4를 다시 참조하면, 계층 테이블(66) 레코드는 인덱스(5)로써 다른 데이터베이스(50) 테이블로써 사용된 고유의 식별 번호를 포함한다.Each relationship database 50 includes a table of measurement records 66. 5, each hierarchical record 66 describes a node within hierarchy 68. As shown in FIG. The node may be a group node 26, 130, 132, 134 or a terminal node. The terminal node may represent a file that includes an extension telephone 14, 16, 18, 24, 140, voice files 136, 138, or other call processing instructions (not shown). Groups 26, 130, 132, and 134 may include some of the other node types hierarchically. Connections between nodes and callers from other navigation paths can navigate the nodes. Referring again to FIG. 4, the hierarchical table 66 record contains a unique identification number used as an index 5 as another database 50 table.

이름 항목(70) 및 그룹 항목(72) 테이블내의 레코드는 각각의 계층 테이블(66) 레코드를 기술한다. 예컨대, 이름 항목 테이블(70) 레코드는 직원의 이름 및 구내 전화를 포함하며, VUI(42)는 입력 호출을 전송하기 위하여 사용할 수 있다. 그룹 항목 테이블(72) 레코드는 그룹 이름을 포함하나, 구내 전화 데이터를 포함하지 않는다. 왜냐하면, 부서 이름형 구성내의 그룹은 다른 호출자가 질문(예컨대, 당신은 부서내의 누구와 연락하고 싶은가 ?) 할때까지 호출을 전송하지 않기 때문이다.The records in the name item 70 and group item 72 tables describe each hierarchical table 66 record. For example, the name entry table 70 record includes an employee's name and a local telephone, and the VUI 42 can be used to send an incoming call. The group entry table 72 record contains the group name but does not contain the premises telephone data. This is because a group in a department-named configuration does not send a call until another caller asks (eg who do you want to contact?).

발음 테이블(74)은 이름 항목(70)(예컨대, 사람의 이름) 및 그룹 항목(72)(예컨대, 그룹의 이름) 테이블의 워드를 기술한다. 예컨대, "Jone Doe"의 이름은 두 개의 워드를 포함하며 두 개의 대응하는 발음 테이블(74) 레코드에 의해 표현된다. 발음 테이블(74) 레코드는 워드 및 이 워드를 구성하는 음운을 포함한다. 예컨대,음운 "j", "ah" 및 "n"은 워드 "Jone"을 기술한다. 컴파일 프로세스(도 3의 64)는 발음 레코드(74)에 대응하는 계층 테이블(66) 레코드의 고유 식별 번호와 함께 그램머 파일내의 엔트리로써 수집된 음운을 저장한다. 호출자가 말할 때, VUI(42)는 호출자의 음성내의 음운을 검출하고, 그램머 파일내의 음운에 대비되는 음운을 검사하며, 호출자의 음성과 매칭되는 그램머 파일 음운과 대응하는 계층 테이블(66) 레코드를 검색한다. 예컨대, 호출자가 "Jone"라고 말할 때, VUI(42)는 그램머 파일내에서 j-jh-n를 발견하며, 대응하는 계층(66) 레코드에 대한 관계 데이터베이스(50) 계층 테이블(66)을 탐색한다. 만일 계층(66) 레코드가 이름을 저장한다면, VUI(42)는 대응하는 이름 항목(7) 레코드에 저장된 구내 전화에 호출자를 접속할 수 있다. 계층(66) 레코드가 음성 파일 기준을 저장한다면, VUI(42)는 호출자에게 다른 질문을 하기 위하여 그룹-레벨 프롬프트를 실행시킬 수 있다.The pronunciation table 74 describes the words of the name entry 70 (eg, person's name) and group entry 72 (eg, name of the group) table. For example, the name "Jone Doe" contains two words and is represented by two corresponding pronunciation table 74 records. The pronunciation table 74 record includes a word and a phoneme constituting the word. For example, the phonemes "j", "ah" and "n" describe the word "Jone". The compilation process (64 in FIG. 3) stores the phoneme collected as an entry in the grammar file with the unique identification number of the hierarchy table 66 record corresponding to the pronunciation record 74. When the caller speaks, the VUI 42 detects the phoneme in the caller's voice, examines the phoneme in contrast to the phoneme in the grammar file, and records the hierarchical table 66 record corresponding to the grammar file phoneme that matches the caller's voice. Search. For example, when the caller says "Jone", the VUI 42 finds j-jh-n in the grammar file and searches the relational database 50 hierarchy table 66 for the corresponding hierarchy 66 record. do. If the layer 66 record stores a name, the VUI 42 may connect the caller to the extension telephone stored in the corresponding name entry 7 record. If the layer 66 record stores voice file criteria, the VUI 42 may issue a group-level prompt to ask the caller another question.

관리 시스템(40)은 관리자가 적정 ODBC(개방 데이터베이스 접속성)을 공급하는 경우 CSV(콤마 분리 값) 파일을 포함하는 다양한 소스와 임의의 ODBC 데이터 소스(예컨대, 마이크로소프트 액셀 또는 액세스)로부터 데이터베이스(50)에 데이터를 입력시킬 수 있다. 관리자가 자동 안내 데이터베이스 필드를 사용하여 입력된 데이터 소스내에 필드를 링크시킨후, 자동 안내부는 계층(66), 이름 항목(70) 및 그룹 항목(72) 레코드에 각각의 데이터 소스 레코드를 로드할 수 있다. 자동 안내부는 대응하는 발음 테이블(74) 레코드를 발생시킨다. 관리자는 입력 레코드(예컨대, 특정 사람의 정보)가 기존 레코드와 중첩하거나 무시되는지의 여부를 상술할 수 있다. 기존의 사람 자원 데이터 파일을 입력함으로써, 관리자는 어려운 데이터 엔트리없이 자동 안내부를 사용하여 빠르게 시작할 수 있다.The management system 40 stores the database (from Microsoft Excel or Access) from various sources, including comma separated value (CSV) files, and any ODBC data source (e.g., Microsoft Excel or Access) when the administrator supplies the appropriate ODBC (Open Database Connectivity). 50) can be input data. After the administrator links the fields within the data source entered using the Auto Guidance Database fields, the Auto Guidance can load each data source record into the Hierarchy 66, Name Entry 70, and Group Entry 72 records. have. The automatic guide generates a corresponding pronunciation table 74 record. The administrator can specify whether an input record (eg, information of a particular person) overlaps or is ignored with an existing record. By entering an existing human resource data file, the administrator can quickly get started using automatic guidance without difficult data entry.

데이터베이스(50)는 VUI(42)가 호출자에게 동작하는 프롬프트를 제어하는 데이터를 포함한다. 자동 안내 데이터(44)는 소정 사건(즉, 호출자가 응답에 실폐하거나 또는 호출자가 그램머 파일내에 있지 않는 발음으로 말하는 사건)에 응답하는 미리 기록된 프롬프트를 포함한다. 도 5를 참조하면, 프롬프트는 다른 계층 노드(레코드)로의 호출자 네비게이션에 대응한다. 예컨대, 구성 노드(64)로의 네비게이션은 호출이 업무 시간 이후에 발생한 호출자를 말하는 메시지를 트리거할 수 있다. 그룹 노드(26, 130, 132)로의 네비게이션은 특정 직원 또는 그룹내의 다른 노드를 선택하기 위하여 호출자를 말하는 그룹 프롬프트를 트리거할 수 있다. 각각의 노드는 여러 연관된 프롬프트를 가질 수 있다. VUI(42)는 호출자의 행동에 기초하여 프롬프트를 선택할 수 있다. 예컨대, VUI(42)는 호출자가 얼마나 많이 응답에 실패하고 호출을 종료하기 전에 일련의 다른 프롬프트를 실행하는지를 추적할 수 있다.The database 50 contains data that controls the prompts that the VUI 42 acts on the caller. The automatic announcement data 44 includes a pre-recorded prompt that responds to certain events (i.e., the caller misses the response or the caller speaks with a pronunciation that is not in the Grammar file). 5, the prompt corresponds to caller navigation to another layer node (record). For example, navigation to configuration node 64 may trigger a message that tells the caller that the call occurred after business hours. Navigation to group nodes 26, 130, and 132 can trigger a group prompt that tells the caller to select a particular employee or other node in the group. Each node can have several associated prompts. VUI 42 may select a prompt based on the caller's action. For example, VUI 42 may track how many times a caller fails to respond and executes a series of other prompts before ending the call.

도 4를 참조하면, 템플릿 프롬프트 테이블(73)은 프롬프트 파일내에 미리 저장된 프롬프트에 참조문을 저장한다. 관리자는 특정 부서 정보를 포함하고 프롬프트 파일내의 여러 프롬프트를 참조하는 무효 프롬프트 테이블(75) 레코드를 발생시키는 미리 저장된 프롬프트상에 기록할 수 있다. 호출동안, VUI(42)는 템플릿 프롬프트 테이블(73)을 검사하기 전에 프롬프트 레코드에 대한 프롬프트 테이블(75)을 검사한다. 그 다음에, VUI(42)는 자동 안내 음성을 발생시키기 위하여 대응하는 프롬프트 파일 정보를 검색할 수 있다.Referring to FIG. 4, the template prompt table 73 stores reference statements in prompts stored in advance in a prompt file. Administrators can write on pre-stored prompts that generate invalid Prompt Table 75 records that contain specific department information and refer to various prompts in the prompt file. During the call, VUI 42 checks the prompt table 75 for the prompt record before checking the template prompt table 73. The VUI 42 may then retrieve the corresponding prompt file information to generate an automatic announcement voice.

도 6을 참조하면, 호출 흐름은 데이터베이스에 정의된 계층을 따른다. 입력 호출을 수신한 후에, VUI(42)는 계층의 루트, 즉 구성 노드(64)(110)에 호출자의 위치를 설정한다. 그 다음에, VUI(42)는 계층(114-124)을 통해 네비게이션을 제어하는 "대화"로 호출자를 예약한다.Referring to Figure 6, the call flow follows a hierarchy defined in the database. After receiving the input call, the VUI 42 sets the caller's position at the root of the hierarchy, ie, the configuration node 64 (110). VUI 42 then reserves the caller with a "conversation" that controls navigation through layers 114-124.

기술된 바와 같이, 각각의 노드는 연관된 프롬프트 세트를 가진다. VUI(42)는 호출자의 행동(호출자가 얼마나 여러번 동일한 노드를 방문하는지)에 기초하여 현재의 호출자 노드 위치(112)에 대한 프롬프트를 실행한다. VUI(42)는 노드의 연관된 그램머 파일(114)을 검사함으로써 프롬프트에 대한 호출자의 응답을 분석한다. VUI(42)는 호출자의 음성에 대응하는 계층 테이블(66) 레코드를 식별한다. 만일 호출자가 지정되면, 이름 레코드(즉, 구내 전화에 관한 레코드)(118), 자동 안내부는 호출(120)를 전송할 수 있다. 만일 호출자가 그룹 레코드를 지정하면, VUI(42)는 호출자의 음성(124)에 대응하는 그룹 노드에 호출자를 연결시키며, 프롬프트/응답 교환 어게인(112)을 시작한다.As described, each node has a set of associated prompts. VUI 42 executes a prompt for the current caller node location 112 based on the caller's behavior (how many times the caller visits the same node). VUI 42 analyzes the caller's response to the prompt by examining the node's associated grammar file 114. VUI 42 identifies the hierarchy table 66 record corresponding to the caller's voice. If the caller is designated, name record (i.e., a record about the premises phone) 118, the automatic guide can transmit the call 120. If the caller specifies a group record, VUI 42 connects the caller to the group node corresponding to the caller's voice 124 and initiates prompt / response exchange Again 112.

도 7을 참조하면, 자동 안내 데이터 구조 및 호출 흐름의 설명은 복잡하게 보인다. 다행히도, 관리 소프트웨어(40)는 시스템을 관리하는 복잡성을 상당히 감소시킨다.Referring to FIG. 7, the description of the automatic announcement data structure and call flow seems complicated. Fortunately, management software 40 significantly reduces the complexity of managing the system.

관리 소프트웨어(40)는 다른 마이크로소프트 창설 클래스(MFC) 제어(예컨대, 버튼, 리스트 제어 및 다이얼로그)로부터 구성된 그래픽 사용자 인터페이스(GUI)(84)를 포함한다. GUI(84)는 직관적인 관계 데이터베이스 관리 시스템을 제공하는 것 외에 빠르게 규정하는 능력을 관리자에 제공하며 데이터베이스노드 계층(도 6)을 변경한다. GUI(78)는 메뉴 바(86), 툴바 버튼(88), 계층 리스트 디스플레이(90)를 포함하는 평행 디스플레이 및 계층 리스트 디스플레이(90)에서 선택된 그룹의 계층적으로 포함된 노드(92)에 대한 디스플레이를 포함한다.The management software 40 includes a graphical user interface (GUI) 84 constructed from other Microsoft creation class (MFC) controls (eg, buttons, list controls, and dialogs). In addition to providing an intuitive relational database management system, the GUI 84 provides administrators with the ability to quickly define and change the database node hierarchy (FIG. 6). GUI 78 provides a menu bar 86, a toolbar button 88, a parallel display including a hierarchical list display 90 and a hierarchically included node 92 of a group selected from the hierarchical list display 90. It includes a display.

계층 리스트 디스플레이(90)는 노드 계층에 포함된 호출 흐름의 아웃라인을 도시한다. 계층 리스트 디스플레이(90)는 구성 및 계층 노드의 이름을 리스트한다. 각각의 리스트된 이름은 폴더 아이콘(94) 및 사인(93)(예컨대, "+" 또는 "-")을 나타낸다. 사인(93)은 계층 리스트 디스플레이(90)가 특정 노드에 포함된 노드를 도시하는지의 여부를 지시한다.Hierarchical list display 90 shows the outline of the call flow included in the node hierarchy. Hierarchical list display 90 lists the names of configurations and hierarchy nodes. Each listed name represents a folder icon 94 and a sign 93 (eg, "+" or "-"). The sign 93 indicates whether the hierarchical list display 90 shows nodes included in a particular node.

계층 리스트 디스플레이(90)에서 계층 노드를 확장하면(리스트 "+" 사인(93)을 클릭함), 확장된 노드내에 계층적으로 포함된 노드를 도시하기 위하여 계층 리스트 디스플레이(90)가 확장된다. 예컨대, 그룹 노드(96)를 확장하면, 확장된 그룹 노드(96)에 관련하여 포함된 그룹 노드(96)의 리스트를 포함하는 계층 리스트 디스플레이(90)가 발생된다. 계층 노드를 폐쇄하면(예컨대, 리스트 "-" 사인을 클릭하면), 계층 리스트 디스플레이(90)로부터 폐쇄 계층 노드 내의 노드가 숨겨진다. 예컨대, 그룹 노드(96)를 폐쇄하면, 계층 리스트 디스플레이(90)상의 디스플레이로부터 그룹 노드(95)가 숨겨진다.Expanding the hierarchical node in the hierarchical list display 90 (clicking the list " + " sign 93) expands the hierarchical list display 90 to show the nodes hierarchically included in the expanded node. For example, expanding group node 96 generates a hierarchical list display 90 that includes a list of group nodes 96 included in association with expanded group node 96. Closing a hierarchy node (e.g., clicking a list "-" sign) hides the node in the hierarchy hierarchy display from hierarchy list display 90. For example, closing group node 96 hides group node 95 from the display on hierarchical list display 90.

관리자는 계층 리스트 디스플레이(90)로부터의 그룹을 조작한다. 예컨대, 관리자는 구성으로부터 그룹 노드를 추가 및 삭제할 수 있다. 계층 리스트 디스플레이(90)는 "드래그 및 드롭" 능력을 제공한다. 예컨대, 관리자는 선택된 그룹을 다른 그룹으로 드래그할 수 있다. 호출자에게 네비게이션의 레벨을 더 제공하는 동안, 이와같은 기술은 많은양의 정보, 구내 전화 및 기술 지원정보등을 호출자에게 윈도윙하는데 도움이 된다. VUI(42)가 그램머 파일을 결정하기 위하여 고려할 필요가 있는 응답은 호출자 응답 속도 VUI(42)의 응답과 매칭된다.The administrator manipulates the group from the hierarchical list display 90. For example, an administrator can add and delete group nodes from the configuration. Hierarchical list display 90 provides "drag and drop" capabilities. For example, the administrator can drag the selected group to another group. While providing the caller with more levels of navigation, this technique helps to window the caller with a large amount of information, premises telephone and technical support information. The response that VUI 42 needs to consider to determine the Grammer file is matched with the response of the caller response rate VUI 42.

계층적으로 포함된 노드 디스플레이(92)는 선택된 계층적인 리스트 디스플레이(90) 엘리먼트의 내용을 도시한다. 예컨대, 계층적인 리스트 디스플레이(90)에서 그룹 노드(97)를 선택하면, 개방 폴더에 대한 선택된 그룹 엘리먼트 아이콘, 계층적으로 포함된 그룹의 리스트 및 계층적으로 포함된 노드 디스플레이(92)의 구내 전화가 변화된다. 디스플레이(92)는 노드 정보(예컨대, 이름, 구내 전화 또는 주의)를 포함할 수 있다. 디스플레이(92)는 각각의 노드에 대하여 관리 정보를 포함한다. 예컨대, 만일 직원이 그의 이름의 발음 표기를 기록하지 않는다면, 디스플레이(92)는 노드를 감탄 포인트(도시안됨)로 노드를 마크함으로써 상기와 같은 것을 지시할 수 있다. 관리자는 노드가 계층등에 추가될 때 알파벳 순서와 같은 다양한 기준에 의해 디스플레이(92)를 정렬시킬 수 있다.The hierarchically included node display 92 shows the contents of the selected hierarchical list display 90 element. For example, selecting a group node 97 in the hierarchical list display 90 causes the selected group element icon for the open folder, the list of hierarchically included groups, and the premises phone of the hierarchically contained node display 92 to be selected. Is changed. Display 92 may include node information (eg, name, local telephone, or notice). Display 92 includes management information for each node. For example, if an employee does not record the phonetic notation of his name, display 92 may indicate the above by marking the node with a point of admiration (not shown). The administrator can sort the display 92 by various criteria such as alphabetical order when nodes are added to the hierarchy and the like.

관리자는 디스플레이(92) 엘리먼트를 추가, 삭제 및 편집할 수 있다. 관리자는 계층적으로 포함된 노드 디스플레이(90) 또는 계층적으로 리스트 디스플레이(92)내의 다른 그룹으로 엘리먼트를 드래그 및 드롭함으로써 호출 계층의 다른 위치로 엘리먼트(즉, 그룹 또는 이름)를 이동시킨다. 관리 시스템(40)은 이들 동작에 기초하여 데이터베이스 내용을 변경시킨다. 이는 관리자가 데이터를 빠르게 인식하여 호출 흐름을 변경하도록 한다.Administrators can add, delete, and edit display 92 elements. The administrator moves the element (ie, group or name) to another location in the call hierarchy by dragging and dropping the element into a hierarchically included node display 90 or another group in the hierarchical list display 92. The management system 40 changes the database contents based on these operations. This allows administrators to quickly recognize data and change the call flow.

도 8a 및 8b를 참조하면, GUI 다이얼로그는 데이터베이스 정보의 관리를 용이하게 제공한다. 예컨대, 편집을 위하여 구성 노드(도 7)를 선택하면, 도 8a 및 도 8b에 도시된 탭 다이얼로그가 발생된다. 도 8a에서, 관리자는 구성 레코드를 기술하는 다이얼로그 필드에서 정보를 편집할 수 있다. 도 8b에서, 관리자는 초기 호출 처리를 포함하는 구성 노드에 네비게이트함으로써 야기된 사건에 응답하여 VUI(42)에 의해 송출된 구성 레벨 프롬프트 메시지를 변경할 수 있다.8A and 8B, the GUI dialog facilitates management of database information. For example, selecting the configuration node (FIG. 7) for editing generates the tab dialog shown in FIGS. 8A and 8B. In FIG. 8A, an administrator can edit information in a dialog field describing a configuration record. In FIG. 8B, an administrator may change the configuration level prompt message sent by VUI 42 in response to an event caused by navigating to a configuration node that includes initial call processing.

다이얼로그 "OK" 버튼(100)을 선택하면, 관계 데이터베이스에 편집된 정보가 저장되며, 이 경우에 구성 레코드가 잠재적으로 갱신되며 새로운 프롬프트 레코드가 추가된다. 관리 소프트웨어는 데이터베이스 변화가 기록 로킹을 조정하기 위하여 발생할 때 추가로 기록된다. "폐쇄" 버튼(102)은 편집기를 버린다. GUI는 관리자가 관리 섹션을 종료할 때 "만들어진 변화를 유지하라" 다이얼로그에 관리자를 제공한다. 데이터베이스 개념과 유사한 데이터베이스 개념은 "OK" 버튼이 SQL INSERT와 유사하나 "만들어진 변화를 유지하라" 다이얼로그가 다이얼로그 수용 또는 롤백을 야기한다는 것을 인식할 것이다.When the dialog "OK" button 100 is selected, the edited information is stored in the relational database, in which case the configuration record is potentially updated and a new prompt record is added. Management software is additionally recorded when database changes occur to coordinate record locking. "Close" button 102 discards the editor. The GUI provides the administrator with the "Keep Changes Made" dialog when the administrator exits the administration section. Database concepts similar to the database concept will recognize that the "OK" button is similar to SQL INSERT but the "Keep Made Changes" dialog causes the dialog to accept or roll back.

그러나, 이러한 데이터베이스 개념과의 유사성은 GUI가 우연한 워드 처리 사용자와 유사한 다이얼로그 버튼에 데이터베이스 개념을 제공하기 때문에 시스템 관리를 위해 불필요하다.However, this similarity to the database concept is unnecessary for system administration because the GUI provides the database concept in a dialog button similar to an accidental word processing user.

도 8c를 참조하면, 다른 다이얼로그는 그룹 노드 정보를 편집하며 선택적으로 그룹 이름의 발음을 선택적으로 기록한다. 그룹 노드 정보를 변경하면, 프롬프트 및 발음 레코드를 잠재적으로 추가, 삭제 또는 수정하는 계층 테이블의 노드 설명이 변경될 수 있다. 다시, 관리 시스템(40)은 관리자로부터 안정 자동 안내 관리로의 데이터베이스 변화의 숨긴다.Referring to FIG. 8C, another dialog edits group node information and optionally records pronunciation of the group name. Changing the group node information may change the node description of the hierarchical table that potentially adds, deletes, or modifies prompts and pronunciation records. Again, the management system 40 hides the database change from the manager to the stable automatic guidance management.

도 8d에 있어서, 이름 노드를 선택하면 이름 특정 다이얼로그가 발생한다. 이러한 다이얼로그에서, 관리자는 직원의 구내 전화를 변경하거나 직원 이름을 구성하는 음운을 변경할 수 있다. 그룹 노드 다이얼로그와 유사하게, 관리자는 직원 이름의 발음을 기록하거나 또는 관리 소프트웨어는 철자법에 기초하여 발음을 발생시킨다. 관리 소프트웨어(40)는 개별 직원이 그 자체의 이름의 발음을 원격적으로(즉, 임의의 전화로부터) 기록하도록 한다. 임의의 변경은 발음 레코드를 발생 또는 변경시키며, 프롬프트 파일의 엔트리를 발생시킨다.In Fig. 8D, when a name node is selected, a name specific dialog is generated. In this dialog, the administrator can change the phone of the employee's premises or change the phonemes that make up the employee's name. Similar to the group node dialog, the administrator records the pronunciation of the employee name or the management software generates the pronunciation based on the spelling. The management software 40 allows an individual employee to record the pronunciation of his or her name remotely (ie from any phone). Any change generates or changes the pronunciation record and generates an entry in the prompt file.

다른 실시예는 첨구범위내에서 구현된다. 전술한 설명은 자동 안내 기능에 제한되지 않고 다양하게 응용할 수 있다.Other embodiments are implemented within the scope of the appended claims. The above description is not limited to the automatic guidance function and can be applied in various ways.

Claims (22)

사용자에게 프롬프트가 제공되고 사용자의 구두 응답과 저장된 음성 엘리먼트의 비교에 기초하여 동작이 취해지는 음성 인식 프로세스의 네비게이션 경로를 제어하는 방법에 있어서,A method of controlling a navigation path of a speech recognition process in which a prompt is provided to a user and an action is taken based on a comparison of a user's spoken response and a stored speech element, the method comprising: 그룹 노드 및 터미널 노드를 포함하는 노드의 계층으로 프롬프트, 동작, 및 음성 엘리먼트를 구성하는 단계,Organizing prompts, actions, and voice elements into a hierarchy of nodes, including group nodes and terminal nodes, 상기 음성 인식 프로세스의 네비게이션 경로를 지시하는 계층 리스트로 상기 노드를 디스플레이하는 단계,Displaying the node in a hierarchical list indicating a navigation path of the speech recognition process; 상기 계층 리스트에서의 노드 위치에 대한 사용자 편집에 응답하여 상기 음성 인식 프로세스의 네비게이션 경로를 변경하는 단계를 포함하는 네비게이션 경로 제어 방법.Changing a navigation path of the speech recognition process in response to a user edit of a node location in the hierarchical list. 제 1항에 있어서,The method of claim 1, 상기 네비게이션 경로를 변경하는 단계는 그래픽 사용자 인터페이스와 상호작용하는 단계를 포함하는 네비게이션 경로 제어 방법.Changing the navigation path comprises interacting with a graphical user interface. 제 1항에 있어서,The method of claim 1, 상기 계층 리스트에서의 노드의 위치를 편집하는 단계는 계층적으로 포함된 노드의 위치를 편집하는 단계를 구성하는 드래그 및 드롭 연산을 포함하는 네비게이션 경로 제어 방법.And editing the position of the node in the hierarchical list comprises drag and drop operations that comprise editing the position of the hierarchically included node. 제 1항에 있어서,The method of claim 1, 상기 노드의 계층으로 프롬프트, 동작 및 음성 엘리먼트를 구성하는 단계는 관계 데이터베이스에서 레코드를 구성하는 단계를 포함하는 네비게이션 경로 제어 방법.Organizing prompts, actions, and voice elements into the hierarchy of nodes comprises organizing records in a relational database. 제 1항에 있어서,The method of claim 1, 상기 노드의 계층으로 프롬프트, 동작 및 음성 엘리먼트를 구성하는 단계는 노드를 추가, 삭제 또는 편집하는 단계를 포함하는 네비게이션 경로 제어 방법.Organizing prompts, actions, and voice elements into the hierarchy of nodes includes adding, deleting, or editing nodes. 제 1항에 있어서,The method of claim 1, 계층적으로 포함된 노드의 개별 리스트에서 선택된 그룹 노드의 계층적으로 포함된 노드를 디스플레이하는 단계를 더 포함하는 네비게이션 경로 제어 방법.And displaying the hierarchically included nodes of the group nodes selected from the individual list of hierarchically included nodes. 제 1항에 있어서,The method of claim 1, 상기 계층 리스트에서의 그룹 노드는 계층적으로 포함된 노드를 디스플레이하기 위하여 확장될 수 있거나 또는 상기 계층적으로 포함된 노드를 감추기 위하여 수축되는 네비게이션 경로 제어 방법.The group node in the hierarchical list can be expanded to display hierarchically included nodes or shrunk to hide the hierarchically included nodes. 제 1항에 있어서,The method of claim 1, 상기 음성 인식 프로세스는 호출 루틴 프로세스를 포함하는 네비게이션 경로 제어 방법.And the speech recognition process comprises a calling routine process. 제 8항에 있어서,The method of claim 8, 상기 터미널 노드는 구내 전화를 포함하는 네비게이션 경로 제어 방법.And said terminal node comprises a local telephone. 제 9항에 있어서,The method of claim 9, 상기 동작은 사용자가 구내 전화 터미널 노드로 네비게이트를 할 때 구내 전화에 호출을 전송하는 단계를 포함하는 네비게이션 경로 제어 방법.The operation includes sending a call to a local telephone when the user navigates to the local telephone terminal node. 제 8항에 있어서,The method of claim 8, 상기 터미널 노드는 음성 파일을 포함하는 네비게이션 경로 제어 방법.And said terminal node comprises a voice file. 사용자에게 프롬프트가 제공되고 사용자의 구두 응답과 저장된 음성 엘리먼트의 비교에 기초하여 동작이 취해지는 음성 인식 프로세스의 네비게이션 경로를 제어하며, 컴퓨터 판독 가능 매체상에 상주하는 컴퓨터 프로그램에 있어서,A computer program resident on a computer readable medium that prompts a user and controls a navigation path of a speech recognition process in which an action is taken based on a comparison of a spoken response of a user with a stored speech element. 상기 컴퓨터 프로그램은,The computer program, 그룹 노드 및 터미널 노드를 포함하는 노드의 계층으로 상기 프롬프트, 동작 및 음성 엘리먼트를 구성하는 명령,Commands for organizing the prompt, action, and voice elements into a hierarchy of nodes including group nodes and terminal nodes, 상기 음성 인식 프로세스의 네비게이션 경로를 지시하는 계층 리스트로 상기 노드를 디스플레이하는 명령,Displaying the node in a hierarchical list indicating a navigation path of the speech recognition process; 상기 계층 리스트에서의 노드 위치에 대한 사용자 편집에 응답하여 상기 음성 인식 프로세스의 네비게이션 경로를 변경하는 명령을 포함하는 컴퓨터 프로그램.Instructions for changing a navigation path of the speech recognition process in response to user editing of node locations in the hierarchical list. 제 12항에 있어서,The method of claim 12, 상기 네비게이션 경로를 변경하는 명령은 그래픽 사용자 인터페이스와 상호작용하는 명령을 포함하는 컴퓨터 프로그램.And the command to change the navigation path includes a command to interact with a graphical user interface. 제 12항에 있어서,The method of claim 12, 상기 계층 리스트에서의 노드의 위치를 편집하는 명령은 계층적으로 포함된 노드의 위치를 편집하는 명령을 구성하는 드래그 및 드롭 연산을 포함하는 컴퓨터 프로그램.And the instructions for editing the position of the node in the hierarchical list comprise drag and drop operations for constructing instructions for editing the position of the hierarchically included nodes. 제 12항에 있어서,The method of claim 12, 노드의 계층으로 상기 프롬프트, 동작 및 음성 엘리먼트를 구성하는 명령은 관계 데이터베이스에서 레코드를 구성하는 명령을 포함하는 컴퓨터 프로그램.And instructions for configuring the prompt, action, and voice elements in a hierarchy of nodes includes instructions for organizing records in a relational database. 제 12항에 있어서,The method of claim 12, 노드의 계층으로 상기 프롬프트, 동작 및 음성 엘리먼트를 구성하는 명령은 상기 노드를 추가, 삭제 또는 편집하는 명령을 포함하는 컴퓨터 프로그램.And instructions for configuring the prompt, action, and voice elements in a hierarchy of nodes includes instructions for adding, deleting, or editing the node. 제 12항에 있어서,The method of claim 12, 계층적으로 포함된 노드의 개별 리스트에서 선택된 그룹 노드의 계층적으로 포함된 노드를 디스플레이하는 명령을 더 포함하는 컴퓨터 프로그램.Further comprising instructions for displaying the hierarchically included nodes of the group nodes selected from the respective list of hierarchically included nodes. 제 12항에 있어서,The method of claim 12, 상기 계층 리스트에서의 그룹 노드는 계층적으로 포함된 노드를 디스플레이하기 위하여 확장될 수 있거나 또는 상기 계층적으로 포함된 노드를 감추기 위하여 수축되는 컴퓨터 프로그램.The group nodes in the hierarchical list may be expanded to display hierarchically included nodes or contracted to hide the hierarchically included nodes. 제 12항에 있어서,The method of claim 12, 상기 음성 인식 프로세스는 호출 루틴 프로세스를 포함하는 컴퓨터 프로그램.And the speech recognition process comprises a calling routine process. 제 19항에 있어서,The method of claim 19, 상기 터미널 노드는 구내 전화를 포함하는 컴퓨터 프로그램.The terminal node comprises a local telephone. 제 20항에 있어서,The method of claim 20, 상기 동작은 사용자가 구내 전화 터미널 노드로 네비게이트 할 때 구내 전화에 호출을 전송하는 명령을 포함하는 컴퓨터 프로그램.The operation includes instructions for sending a call to an extension telephone when the user navigates to an extension telephone terminal node. 제 19항에 있어서,The method of claim 19, 상기 터미널 노드는 음성 파일을 포함하는 컴퓨터 프로그램.And the terminal node comprises a voice file.
KR1020007009503A 1998-02-27 1999-03-01 Controlling navigation paths of a speech-recognition process KR20010086258A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US3226698A 1998-02-27 1998-02-27
US09/032,266 1998-02-27
PCT/US1999/004747 WO1999044345A2 (en) 1998-02-27 1999-03-01 Controlling navigation paths of a speech-recognition process

Publications (1)

Publication Number Publication Date
KR20010086258A true KR20010086258A (en) 2001-09-10

Family

ID=21864005

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020007009503A KR20010086258A (en) 1998-02-27 1999-03-01 Controlling navigation paths of a speech-recognition process

Country Status (5)

Country Link
EP (1) EP1057317A2 (en)
JP (1) JP2002505556A (en)
KR (1) KR20010086258A (en)
AU (1) AU2982699A (en)
WO (1) WO1999044345A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020023294A (en) * 2002-01-12 2002-03-28 (주)코리아리더스 테크놀러지 GUI Context based Command and Control Method with Speech recognition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297616B (en) * 2019-05-31 2023-06-02 百度在线网络技术(北京)有限公司 Method, device, equipment and storage medium for generating speech technology

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4821211A (en) * 1987-11-19 1989-04-11 International Business Machines Corp. Method of navigating among program menus using a graphical menu tree
US5488650A (en) * 1991-09-24 1996-01-30 Active Voice Corporation Configurable telephone interface for electronic devices
US5414809A (en) * 1993-04-30 1995-05-09 Texas Instruments Incorporated Graphical display of data
US5493606A (en) * 1994-05-31 1996-02-20 Unisys Corporation Multi-lingual prompt management system for a network applications platform
US5588044A (en) * 1994-11-22 1996-12-24 Voysys Corporation Voice response system with programming language extension

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020023294A (en) * 2002-01-12 2002-03-28 (주)코리아리더스 테크놀러지 GUI Context based Command and Control Method with Speech recognition

Also Published As

Publication number Publication date
WO1999044345A2 (en) 1999-09-02
AU2982699A (en) 1999-09-15
EP1057317A2 (en) 2000-12-06
WO1999044345A3 (en) 1999-10-21
JP2002505556A (en) 2002-02-19

Similar Documents

Publication Publication Date Title
US7548967B2 (en) Interactive conflict resolution for personalized policy-based services
US6466654B1 (en) Personal virtual assistant with semantic tagging
US6839671B2 (en) Learning of dialogue states and language model of spoken information system
JP4460305B2 (en) Operation method of spoken dialogue system
US8949131B2 (en) System and method of dialog trajectory analysis
US8661112B2 (en) Customized interactive voice response menus
US6922466B1 (en) System and method for assessing a call center
US6789064B2 (en) Message management system
CN101138228A (en) Customisation of voicexml application
US7286985B2 (en) Method and apparatus for preprocessing text-to-speech files in a voice XML application distribution system using industry specific, social and regional expression rules
US7609829B2 (en) Multi-platform capable inference engine and universal grammar language adapter for intelligent voice application execution
US8355918B2 (en) Method and arrangement for managing grammar options in a graphical callflow builder
US6073102A (en) Speech recognition method
US6460057B1 (en) Data object management system
GB2376335A (en) Address recognition using an automatic speech recogniser
US20040162724A1 (en) Management of conversations
US20090228264A1 (en) Management of conversations
US7624016B2 (en) Method and apparatus for robustly locating user barge-ins in voice-activated command systems
US20090049006A1 (en) Method and system for processing knowledge
US20050283764A1 (en) Method and apparatus for validating a voice application
JP4890721B2 (en) How to operate a spoken dialogue system
KR20100032291A (en) Voice response unit harvesting
KR20010086258A (en) Controlling navigation paths of a speech-recognition process
Marx Toward effective conversational messaging
WO2001075555A2 (en) Personal virtual assistant

Legal Events

Date Code Title Description
N231 Notification of change of applicant
WITN Withdrawal due to no request for examination