KR20030027359A - Method and System for interworking between voice-browser and existing web-browser - Google Patents

Method and System for interworking between voice-browser and existing web-browser Download PDF

Info

Publication number
KR20030027359A
KR20030027359A KR1020010060532A KR20010060532A KR20030027359A KR 20030027359 A KR20030027359 A KR 20030027359A KR 1020010060532 A KR1020010060532 A KR 1020010060532A KR 20010060532 A KR20010060532 A KR 20010060532A KR 20030027359 A KR20030027359 A KR 20030027359A
Authority
KR
South Korea
Prior art keywords
voice
web
server
engine
data
Prior art date
Application number
KR1020010060532A
Other languages
Korean (ko)
Inventor
박기철
정광호
Original Assignee
박기철
정광호
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박기철, 정광호 filed Critical 박기철
Priority to KR1020010060532A priority Critical patent/KR20030027359A/en
Publication of KR20030027359A publication Critical patent/KR20030027359A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

PURPOSE: A method and system for interlocking a voice browser with a conventional web browser is provided to interlock with a conventionally used web browser and to supply a voice recognition function and a voice synthesis function. CONSTITUTION: A web/voice interface(12) is interlocked with a web browser(11) and uses an HTTP(Hyper Text Transfer Protocol) for requesting data to various web servers on the Internet. A server computer(30) is connected to a client computer(10) through a network(20). The web/voice interface(12) executes as a voice browser with a voice engine(33). A web server(31) supplies a web page prepared through a tool such as an HTML(Hyper Text Markup Language) in accordance with a request of the client computer(10). A voice server(32) is interlocked with a voice file DB having voice contents of a VXML(Voice eXtensible Markup Language) format, and supplies voice contents to the client computer(10). The voice engine(33) converts voice data and character data interactively through a voice recognition function and a voice synthesis function between the web/voice interface(12) and the voice server(32).

Description

보이스 브라우저와 기존 웹 브라우저의 연동을 위한 방법 및 시스템{Method and System for interworking between voice-browser and existing web-browser}Method and System for interworking between voice browser and existing web browser {Method and System for interworking between voice-browser and existing web-browser}

본 발명은 인터넷에 있어서 보이스 브라우저(Voice Browser)와 웹 브라우저(Web Browser)의 연동을 위한 방법 및 시스템에 관한 것으로서, 특히 기존의 웹 브라우저를 그대로 사용하면서 보이스 브라우저와 연동(Interworking)이 이루어지도록 하는 보이스 브라우저와 기존 웹 브라우저의 연동을 위한 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for interworking a voice browser and a web browser in the Internet, and in particular, to interwork with a voice browser while using an existing web browser. The present invention relates to a method and system for interworking a voice browser and an existing web browser.

최근, 음성인식 기술이 급속히 발달함에 따라 다양한 제품에 음성인식 기능을 접목하여 생활의 편의를 제공하려는 연구가 활발히 진행되고 있다.Recently, with the rapid development of voice recognition technology, studies are being actively conducted to provide convenience of life by incorporating voice recognition functions into various products.

현재 개발되고 있는, 음성인식이나 음성합성 기술이 적용된 시스템의 예를 살펴보면, 전화를 이용하여 항공예약을 하거나 은행계좌, 주식, 날씨 등의 정보를 제공받을 수 있는 시스템이 있으며, 전화상으로 이메일(E-Mail)을 보내거나 수신된 이메일을 TTS(Text To Speech)를 통해 음성으로 들을 수 있는 제품도 최근에 선보이고 있다.Looking at an example of a system using voice recognition or voice synthesis technology, which is currently being developed, there is a system that can be used to make a flight reservation using a telephone, or receive information such as a bank account, stocks, and weather. Recently, products that can send e-mails or receive e-mails by voice through text to speech (TTS) have been introduced.

특히, 인터넷에 있어서는 음성인식이 가능한 보이스 웹 브라우저가 개발되어 음성명령을 통해 웹사이트 접속이나 정보검색기능이 수행되도록 함으로써, 키보드나 마우스 조작이 곤란한 사용자에게 편의를 제공하고, 희망하는 웹페이지로 직접 액세스 할 수 있도록 하는 기술이 제안되고 있다.In particular, on the Internet, a voice web browser capable of voice recognition has been developed to enable a user to access a website or search information through voice commands, providing convenience to users who have difficulty in operating a keyboard or mouse, and directly to desired web pages. Techniques for making it accessible are proposed.

그러나, 기존의 이러한 보이스 웹 브라우저는 별도로 개발된 웹 브라우저에 음성인식 기능을 클라이언트에 탑재하게 되므로 비용이 많이 들고 상호 대화를 할 수 없으며, 일반화 하는데 어려움이 있다. 또한 기존의 웹 브라우저와 호환하여 사용할 수 없는 문제점이 있다.However, the existing voice web browser is equipped with a voice recognition function in the client, a web browser developed separately, it is expensive and can not communicate with each other, it is difficult to generalize. In addition, there is a problem that can not be compatible with the existing web browser.

본 발명은 상기와 같은 점에 착안하여 창출된 것으로서, 기존에 사용되고 있던 웹 브라우저와 연동하며 음성인식 및 음성합성 기능을 제공하게 되는 보이스 브라우저와 기존 웹 브라우저의 연동을 위한 방법 및 시스템을 제공하는 것을 그 목적으로 한다.The present invention has been made in view of the above points, and provides a method and system for interworking with a conventional web browser and a voice browser which interoperates with a web browser that is being used and provides a voice recognition and a speech synthesis function. For that purpose.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니된다.The following drawings attached to this specification are illustrative of preferred embodiments of the present invention, and together with the detailed description of the invention to serve to further understand the technical spirit of the present invention, the present invention is a matter described in such drawings It should not be construed as limited to

도 1은 본 발명에 따른 보이스 브라우저와 기존 웹 브라우저의 연동방법을 구현하기 위한 시스템 구성을 도시하는 도면이다.1 is a diagram illustrating a system configuration for implementing a method of linking a voice browser and an existing web browser according to the present invention.

도 2는 본 발명의 일 실시예에 따라 음성입력수단을 통해 음성입력시 웹/음성 인터페이스와 기존 웹 브라우저가 연동되도록 하는 구성을 보여주는 블록도이다.2 is a block diagram illustrating a configuration in which a web / voice interface and an existing web browser are interworked when a voice is input through a voice input unit according to an embodiment of the present invention.

도 3은 도 2의 구성을 통해 웹/음성 인터페이스와 웹 브라우저의 연동이 수행되는 과정을 나타내는 흐름도이다.FIG. 3 is a flowchart illustrating a process of interworking a web / voice interface and a web browser through the configuration of FIG. 2.

도 4는 본 발명의 다른 실시예에 따라 문자입력수단을 통해 요청사항 입력시 웹/음성 인터페이스와 웹 브라우저가 연동되도록 하는 구성을 보여주는 블록도이다.4 is a block diagram illustrating a configuration in which a web / voice interface and a web browser are interworked when a request is input through a text input unit according to another embodiment of the present invention.

도 5는 도 4의 구성을 통해 웹/음성 인터페이스와 웹 브라우저의 연동이 수행되는 과정을 나타내는 흐름도이다.5 is a flowchart illustrating a process of interworking a web / voice interface and a web browser through the configuration of FIG. 4.

<도면의 주요 참조부호에 대한 설명><Description of main reference numerals in the drawings>

10: 클라이언트 컴퓨터 11: 웹 브라우저 12: 웹/음성 인터페이스10: client computer 11: web browser 12: web / voice interface

20: 네트워크 30: 서버 컴퓨터 31: 웹서버20: network 30: server computer 31: web server

32: 음성서버 33: 음성엔진32: voice server 33: voice engine

상기와 같은 목적을 달성하기 위한 본 발명은 웹서버, 음성서버 및 음성엔진을 포함하는 서버 컴퓨터와, 클라이언트 컴퓨터에 탑재된 기존 웹 브라우저와 접속되는 웹/음성 인터페이스를 통한, 보이스 브라우저와 기존 웹 브라우저 연동방법으로서, 클라이언트 컴퓨터에 구비되는 음성입력수단으로부터 웹/음성 인터페이스에 이용자의 음성신호가 전달되는 (a)단계; 웹/음성 인터페이스에서 상기 음성신호를 음성 스트리밍 데이터로 변환하는 (b)단계; 상기 음성 스트리밍 데이터를 음성엔진의 음성인식모듈로 전송하여 문자 데이터로 변환하는 (c)단계; 상기 문자 데이터를 음성엔진의 음성플랫폼을 경유하여 음성서버로 전달하고, 상기 음성서버의 음성 데이터 DB로부터 상기 문자 데이터에 대응되는 음성파일을 추출하는 (d)단계; 상기 추출된 음성파일을 음성엔진의 음성합성모듈을 통해 음성 스트리밍 데이터로 변환하는 (e)단계; 및 상기 변환된 음성 스트리밍 데이터를 웹/음성 인터페이스로 전송하여 스피커를 통해 음성출력하는 (f)단계;를 포함하고, 상기 (c)단계에서, 변환된 문자 데이터를 웹/음성 인터페이스에 전송하는 단계; 상기 전송된 문자 데이터가 웹/음성 인터페이스의 웹/음성 플랫폼을 경유하여 웹 브라우저로 전달되는 단계; 상기 웹 브라우저에서 서버시스템의 웹서버로 상기 문자 데이터에 대응하는 웹페이지 요청 데이터가 전송되는 단계; 및 상기 웹서버로부터 해당 웹페이지가 수신되어 모니터를 통해 출력되는 단계;를 포함한다.To achieve the above object, the present invention provides a voice browser and a conventional web browser through a server computer including a web server, a voice server, and a voice engine, and a web / voice interface connected to an existing web browser mounted on a client computer. An interworking method comprising the steps of: (a) transmitting a voice signal of a user from a voice input means provided in a client computer to a web / voice interface; (B) converting the voice signal into voice streaming data in a web / voice interface; (C) transmitting the voice streaming data to a voice recognition module of a voice engine and converting the voice streaming data into text data; (D) transferring the text data to a voice server via a voice platform of a voice engine, and extracting a voice file corresponding to the text data from the voice data DB of the voice server; (E) converting the extracted voice file into voice streaming data through a voice synthesis module of a voice engine; And (f) transmitting the converted voice streaming data to a web / voice interface and outputting a voice through a speaker. In step (c), transmitting the converted text data to a web / voice interface. ; Delivering the transmitted text data to a web browser via a web / voice platform of a web / voice interface; Transmitting web page request data corresponding to the text data from the web browser to a web server of a server system; And receiving a corresponding web page from the web server and outputting the same through a monitor.

한편, 본 발명에 따른 보이스 브라우저와 기존 웹 브라우저 연동 시스템은, 음성서버를 포함하는 서버 컴퓨터 측에 탑재되는 엔진으로서, 클라이언트 컴퓨터로부터 수신되는 음성 스트리밍 데이터를 음성인식하여 문자 데이터로 변환한 후 음성서버로 전달하고, 상기 음성서버에서 추출된, 상기 문자 데이터에 대응되는 음성파일을 음성합성하여 음성 스트리밍 데이터로 변환하기 위한 음성엔진;을 포함하며, 기존의 웹 브라우저와 접속되며 클라이언트 컴퓨터 측에 탑재되는 인터페이스로서, 클라이언트 컴퓨터의 음성입력수단으로부터 음성신호를 입력받아 음성 스트리밍 데이터로 변환한 후 상기 음성엔진으로 전송하고, 상기 음성엔진에서 변환된, 상기 음성 스트리밍 데이터에 대응되는 문자 데이터를 수신하여 상기 웹 브라우저로 전달하여 웹서버로 전송하도록 하는 기능과, 상기 음성엔진에서 음성 스트리밍 데이터로 음성합성된 음성파일을 수신하여 스피커를 통해 음성출력하는 기능을 수행하기 위한 웹/음성 인터페이스;를 포함한다.On the other hand, the voice browser and the existing web browser interworking system according to the present invention is an engine mounted on the server computer side including the voice server, the voice streaming data received from the client computer to recognize the voice to convert the text data after the voice server And a voice engine configured to synthesize a voice file corresponding to the text data and convert the voice file extracted from the voice server into voice streaming data. The voice engine is connected to an existing web browser and mounted on a client computer. An interface, which receives a voice signal from a voice input means of a client computer, converts the voice signal into voice streaming data, transmits the voice signal to the voice engine, and receives text data corresponding to the voice streaming data converted by the voice engine to receive the web. Pass it to the browser And a web / voice interface for transmitting a voice file synthesized as voice streaming data by the voice engine and outputting a voice file through a speaker.

상기와 같은 본 발명에 의하면 기존의 웹 브라우저와 연동하는 보이스 브라우저가 제공된다.According to the present invention as described above is provided a voice browser to work with the existing web browser.

이하, 첨부된 도면을 참조로 하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

먼저, 도 1은 본 발명에 따른 보이스 브라우저와 웹 브라우저의 연동방법을 구현하기 위한 시스템 구성을 나타내는 도면이다. 도면에 도시된 바와 같이, 본 발명은 클라이언트 컴퓨터(10) 측에 탑재되어 웹 브라우저(11)와 연동하게 되는 웹/음성 인터페이스(12)와; 네트워크(20)를 통해 상기 클라이언트 컴퓨터(10)와 접속되는 서버 컴퓨터(30)를 포함한다. 여기서, 상기 서버 컴퓨터(30)는, 웹서버(31); 음성서버(32); 및 음성엔진(33)을 포함한다.First, FIG. 1 is a diagram illustrating a system configuration for implementing a method of interworking between a voice browser and a web browser according to the present invention. As shown in the figure, the present invention includes a web / voice interface 12 mounted on the client computer 10 side and interworking with the web browser 11; A server computer 30 is connected to the client computer 10 via a network 20. Here, the server computer 30, the web server 31; Voice server 32; And a voice engine 33.

상기 네트워크(20)로는 유/무선 인터넷망 혹은 공중 전화망(PSTN; Public Switched Telephone Network), 이동 통신망 등 데이터 통신기능을 제공하는 다양한 통신망이 채용가능하다.As the network 20, various communication networks that provide data communication functions such as wired / wireless Internet networks, public switched telephone networks (PSTN), mobile communication networks, and the like may be employed.

클라이언트 컴퓨터(10)로는 소정의 운영체제(Operating System)와, TCP/IP와 같은 통신 프로토콜, 데이터통신을 위한 통신모듈 등이 탑재된 통상의 퍼스널 컴퓨터(Personal Computer)가 해당된다. 대안으로서, 휴대폰이나 PDA(Personal Digital Assistant)와 같은 모바일단말기가 해당될 수도 있음은 물론이다.The client computer 10 corresponds to a general personal computer equipped with a predetermined operating system, a communication protocol such as TCP / IP, a communication module for data communication, and the like. As an alternative, of course, a mobile terminal such as a mobile phone or a personal digital assistant (PDA) may be applicable.

상기 클라이언트 컴퓨터(10)에는 또한, 인터넷상의 다양한 웹서버에 자료를 요청하기 위해 HTTP(Hypertext Transfer Protocol)를 사용하는 클라이언트 프로그램인 웹 브라우저(11)가 탑재된다.The client computer 10 is also equipped with a web browser 11, which is a client program that uses HTTP (Hypertext Transfer Protocol) to request data from various web servers on the Internet.

이때, 상기 웹 브라우저(11)로는 통상적으로 사용되고 있는, 예컨대 넷스케이프 네비게이터(Netscape Navigator)나 인터넷 익스플로러(Internet Explorer) 등이 해당될 수 있다. 여기서, 상기 웹 브라우저(11)가 이러한 예에 한정되지 않음은 물론이다.In this case, the web browser 11 may be, for example, a Netscape Navigator or an Internet Explorer. Here, of course, the web browser 11 is not limited to this example.

웹/음성 인터페이스(12)는 본 발명에 따라 음성엔진(33)과 함께 보이스 브라우저의 기능을 수행하며, 상기 웹 브라우저(11)와 접속되어 연동하게 되는 구성요소로서, 바람직하게 자바 애플릿(Java applet)과 같은 애플릿을 통해 제작이 된다.The web / voice interface 12 is a component that performs the function of a voice browser together with the voice engine 33 according to the present invention, and is connected to the web browser 11 to be interoperable, preferably a Java applet. It is produced through applets such as).

웹서버(31)는 상기 클라이언트 컴퓨터(10) 측의 요청에 따라 예컨대, HTML((Hypertext Markup Language)과 같은 저작도구를 통해 작성된 웹페이지를 제공하는 서버로서, 다양한 웹 사이트에 구축되는 서버가 해당된다.The web server 31 is a server that provides a web page written through an authoring tool such as HTML (Hypertext Markup Language) according to a request of the client computer 10 side. do.

음성서버(32)는 예컨대, VXML(Voice Extensible Markup Language)형식의 음성 컨텐츠가 저장된 음성파일 DB(32a)와 연동하며 클라이언트 컴퓨터(10) 측으로 음성 컨텐츠를 제공하게 된다.The voice server 32 is interlocked with, for example, the voice file DB 32a in which voice content in VXML (Voice Extensible Markup Language) format is stored, and provides voice content to the client computer 10.

음성엔진(33)은 상기 웹/음성 인터페이스(12)와 음성서버(32) 사이에서 음성인식 및 음성합성 기능을 통해 음성 데이터와 문자 데이터를 상호변환하는 역할을 수행한다.The voice engine 33 converts voice data and text data between the web / voice interface 12 and the voice server 32 through voice recognition and voice synthesis functions.

도 2는 본 발명에 따라 음성입력시 상기 웹/음성 인터페이스(12)와 웹 브라우저(11)가 연동되도록 하는 구성을 나타내는 도면이다. 도면에서 실선화살표는 음성 데이터의 이동을, 점선화살표는 문자 데이터의 이동을 나타낸다.2 is a diagram illustrating a configuration in which the web / voice interface 12 and the web browser 11 interwork with each other during voice input according to the present invention. In the drawing, solid arrows indicate movement of voice data, and dotted arrows indicate movement of text data.

도면을 참조하면, 웹/음성 인터페이스(12)는 음성입력수단(13)으로부터 입력되는 음성신호를 스트리밍(Streaming) 데이터로 변환시키기 위한 음성 캡쳐링(Capturing) 모듈(12a)과; 음성엔진(33)으로부터 전송되는 음성 스트리밍 데이터를 신호처리하여 스피커(14)로 인가하기 위한 음성구동모듈(12b)과; 음성엔진(33)으로부터 수신되는 문자 데이터를 웹 브라우저(11)로 전달하기 위한 플랫폼(platform)에 해당하는 웹/음성 플랫폼(12c)을 포함한다.Referring to the drawings, the web / voice interface 12 includes a voice capturing module 12a for converting a voice signal input from the voice input means 13 into streaming data; A voice driving module 12b for processing and processing the voice streaming data transmitted from the voice engine 33 to the speaker 14; And a web / voice platform 12c corresponding to a platform for delivering text data received from the voice engine 33 to the web browser 11.

여기서, 상기 음성입력수단(13)은 클라이언트 컴퓨터(10) 이용자의 음성을 전기적 신호로 변환하기 위한 수단으로서 통상의 마이크로폰(Microphone)이 해당된다.Here, the voice input means 13 is a normal microphone as a means for converting the voice of the user of the client computer 10 into an electrical signal.

한편, 음성엔진(33)은 음성 데이터를 인식하여 문자 데이터로 변환하기 위한 음성인식모듈(33a)과; 음성서버(32)로부터 예컨대, VXML형식의 음성파일을 전달받아 음성합성하는 음성합성모듈(33b)과; 상기 음성인식모듈(33a)에서 출력되는 문자 데이터를 음성서버(32)로 전달하며, 상기 음성서버(32)로부터 입력되는 음성파일을 상기 음성합성모듈(33b)로 전달하는 플랫폼이 되는 음성 플랫폼(33c)를 포함한다.On the other hand, the voice engine 33 includes a voice recognition module 33a for recognizing voice data and converting the voice data into text data; A voice synthesis module 33b for receiving a voice file of, for example, a VXML format from the voice server 32 and synthesizing the voice file; The voice platform, which transmits the text data output from the voice recognition module 33a to the voice server 32, and delivers the voice file input from the voice server 32 to the voice synthesis module 33b. 33c).

여기서, 상기 음성인식모듈(33a)과 음성합성모듈(33b)은 통상 사용되고 있는 음성인식기술 및 음성합성기술을 채용하여 구성될 수 있다.Here, the speech recognition module 33a and the speech synthesis module 33b may be configured by employing a speech recognition technique and a speech synthesis technique that are commonly used.

상기와 같은 구성요소를 포함하여 웹/음성 인터페이스(12)와 웹 브라우저(11)의 연동이 수행되는 과정을 상기 도 2와 더불어 도 3을 참조하여 설명하면 다음과 같다.Referring to FIG. 3 along with FIG. 2, a process in which the web / voice interface 12 and the web browser 11 are performed including the above components is described as follows.

먼저, 클라이언트 컴퓨터(10) 이용자가 음성입력수단(13)을 통해 예컨대, 검색어에 대한 음성정보를 입력하면(단계 S100), 웹/음성 인터페이스(12)의 음성 캡쳐링 모듈(12a)에서 상기 음성정보에 해당하는 음성신호가 음성 스트리밍 데이터로 변환된 후 음성엔진(33)으로 전송된다(단계 S110).First, when the user of the client computer 10 inputs, for example, voice information about a search word through the voice input means 13 (step S100), the voice is captured by the voice capturing module 12a of the web / voice interface 12. The voice signal corresponding to the information is converted into voice streaming data and then transmitted to the voice engine 33 (step S110).

음성엔진(33)의 음성인식모듈(33a)에서는 상기 음성 스트리밍 데이터를 수신하여 음성인식을 한 후 문자 데이터로 변환하는 기능을 수행한다(단계 S115).The voice recognition module 33a of the voice engine 33 performs the function of receiving the voice streaming data, converting the voice data into text data (step S115).

이어서, 상기 문자 데이터는 음성 플랫폼(33c)을 통해 음성서버(32)로 전달되고, 상기 음성서버(32)에서는 음성파일 DB(32a)로부터 상기 문자 데이터에 대응되는 음성파일, 즉 상기 문자 데이터가 특정 검색어일 경우, 검색결과가 되는 음성파일을 추출한다(단계 S120).Subsequently, the text data is transmitted to the voice server 32 through the voice platform 33c, and the voice server 32 receives a voice file corresponding to the text data from the voice file DB 32a, that is, the text data. In the case of a specific search word, a voice file which is a search result is extracted (step S120).

상기 추출된 음성파일은 음성 플랫폼(33c)을 경유하여 음성합성모듈(33b)로 전달되고, 상기 음성합성모듈(33b)에서 음성 스트리밍 데이터로 변환된 후 웹/음성 인터페이스(12)로 전송이 된다(단계 S125).The extracted voice file is transferred to the voice synthesis module 33b via the voice platform 33c, and is converted into voice streaming data in the voice synthesis module 33b and then transmitted to the web / voice interface 12. (Step S125).

웹/음성 인터페이스(12)의 음성구동모듈(12b)은 수신된 상기 음성 스트리밍 데이터를 스피커(14)에 인가하기에 적합한 신호가 되도록 파형정형 등 신호처리한 후, 스피커(14)를 통해 음성출력하는 기능을 수행한다(단계 S126).The voice drive module 12b of the web / voice interface 12 processes signals such as waveform shaping so as to be a signal suitable for applying the received voice streaming data to the speaker 14, and then outputs the voice through the speaker 14. Perform a function (step S126).

한편, 상기 단계 S115를 통해 변환된 문자 데이터는 웹/음성 인터페이스(12)의 웹/음성 플랫폼(12c)으로 전송이 된다(단계 S130).On the other hand, the text data converted through the step S115 is transmitted to the web / voice platform 12c of the web / voice interface 12 (step S130).

다음, 상기 문자 데이터는 웹/음성 플랫폼(12c)으로부터 웹 브라우저(11)로전달이 되고(단계 S135), 웹페이지 요청을 위해 상기 웹 브라우저(11)에서 웹서버(31)로 전송이 된다(단계 S136).Next, the text data is transferred from the web / voice platform 12c to the web browser 11 (step S135), and is transmitted from the web browser 11 to the web server 31 for the web page request ( Step S136).

이어서, 웹서버(31)로부터 상기 문자 데이터에 대응되는 웹페이지가 수신되어 모니터(15)를 통해 출력이 된다(단계 S137). 여기서, 웹 브라우저(11)에서 웹페이지를 요청하고 웹서버(31)로부터 해당 웹페이지를 수신하는 과정은 이미 공지되어 있는 처리과정을 채용하게 된다.Subsequently, a web page corresponding to the text data is received from the web server 31 and output through the monitor 15 (step S137). Here, the process of requesting a web page from the web browser 11 and receiving the web page from the web server 31 adopts a known process.

한편, 본 발명에 의하면 도 4에 도시된 바와 같은 구성을 통하여, 문자 혹은 아이콘 클릭(Click)으로 입력한 요청사항에 대하여 웹페이지 출력과 음성출력이 연동되며 수행된다.On the other hand, according to the present invention, through the configuration as shown in Figure 4, the web page output and the voice output is performed in conjunction with the request information input by the character or icon click (Click).

도면에 있어서, 도 3과 동일한 참조부호는 동일 구성요소임을 나타내며, 문자입력수단(16)은 예컨대, 키보드나 마우스와 같이 문자정보를 웹 브라우저(11)로 입력하기 위한 수단에 해당한다.In the drawing, the same reference numerals as those in Fig. 3 indicate the same components, and the character input means 16 corresponds to a means for inputting character information to the web browser 11, for example, a keyboard or a mouse.

상기 도 4와 더불어 도 5를 참조하여 본 실시예를 설명하면 다음과 같다.The present embodiment will be described with reference to FIG. 5 along with FIG. 4 as follows.

먼저, 클라이언트 컴퓨터(10) 이용자가 문자입력수단(16)을 통해 요청사항을 입력하면(단계 S200), 웹 브라우저(11)에서는 문자 데이터를 웹서버(31)로 전송하여 문자 데이터에 대응되는 웹페이지를 요청한다(단계 S210).First, when the user of the client computer 10 inputs a request through the text input means 16 (step S200), the web browser 11 transmits the text data to the web server 31 to correspond to the text data. The page is requested (step S210).

이어서, 상기 웹서버(31)로부터 해당 웹페이지가 수신되면, 웹 브라우저(11)는 모니터(15)를 통해 웹페이지를 출력한다(단계 215). 여기서, 웹 브라우저(11)에서 웹페이지를 요청하고 웹서버(31)로부터 해당 웹페이지를 수신하는 과정은 이미 공지되어 있는 처리과정이 채용된다.Subsequently, when the web page is received from the web server 31, the web browser 11 outputs the web page through the monitor 15 (step 215). Here, the process of requesting a web page from the web browser 11 and receiving the web page from the web server 31 is a known process.

한편, 상기 단계 S200에서 문자 데이터는 웹 브라우저(11)에서 웹/음성 인터페이스(12)의 웹/음성 플랫폼(12c)으로 전달이 된다(단계 S220).Meanwhile, in step S200, the text data is transferred from the web browser 11 to the web / voice platform 12c of the web / voice interface 12 (step S220).

다음, 상기 문자 데이터는 웹/음성 플랫폼(12c)에서 음성엔진(33)의 음성 플랫폼(33c)으로 전송이 된 후(단계 S222), 해당 음성파일을 추출하도록 음성서버(32)로 전달이 된다(단계 S224).Next, the text data is transmitted from the web / voice platform 12c to the voice platform 33c of the voice engine 33 (step S222), and then transferred to the voice server 32 to extract the corresponding voice file. (Step S224).

상기 추출된 음성파일은 음성 플랫폼(33c)을 경유하여 음성엔진(33)의 음성합성모듈(33b)로 전달되어 음성 스트리밍 데이터로 변환되고(단계 S226), 이어서 웹/음성 인터페이스(12)의 음성구동모듈(12b)로 전송이 된다(단계 S228).The extracted voice file is transferred to the voice synthesis module 33b of the voice engine 33 via the voice platform 33c and converted into voice streaming data (step S226), followed by the voice of the web / voice interface 12. The transfer is made to the drive module 12b (step S228).

상기 음성구동모듈(12b)에서는 수신된 음성 스트리밍 데이터를 스피커(14)에 인가하기에 적합한 신호가 되도록 신호처리한 후, 스피커(14)를 통해 음성출력하게 된다(단계 S230).The voice driving module 12b processes the signal to be a signal suitable for applying the received voice streaming data to the speaker 14, and then outputs the voice through the speaker 14 (step S230).

본 발명은 상기와 같은 구성요소와 처리과정을 통해 보이스 브라우저와 웹 브라우저를 연동하는 기능을 제공하게 된다.The present invention provides a function of interfacing the voice browser and the web browser through the above components and processing.

이상, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조로 설명하였다. 여기서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.In the above, preferred embodiments of the present invention have been described with reference to the accompanying drawings. Here, the embodiments described in the specification and the drawings shown in the drawings are only the most preferred embodiment of the present invention and do not represent all of the technical idea of the present invention, various modifications that can be replaced at the time of the present application It should be understood that there may be equivalents and variations.

본 발명에 의하면, 음성명령으로 웹서핑이나 정보검색을 수행할 수 있으므로컴퓨터 사용에 익숙하지 않은 사용자에게 편의를 제공하며, 특히 키보드나 마우스 조작이 어려운 사용자에게 매우 유용한 효과가 있다.According to the present invention, since it is possible to perform web surfing or information search by voice command, it provides convenience for users who are not familiar with computer use, and is particularly useful for users who are difficult to operate a keyboard or mouse.

본 발명에 따르면 기존의 웹 브라우저가 그대로 사용되며 보이스 브라우저가 연동되므로, 종래와는 달리 보이스 브라우저 탑재를 위해 별도의 웹 브라우저를 개발해야 하는 시간적, 경제적 부담을 해소할 수 있는 효과가 있다.According to the present invention, since the existing web browser is used as it is and the voice browser is interlocked, unlike the conventional method, it is possible to solve the time and economic burden of developing a separate web browser for mounting the voice browser.

또한, 본 발명은 음성 엔진을 포함한 음성 브라우저를 클라이언트에 설치해야 하는 불편함을 배제할 수 있고, 설사 클라이언트에 설치하여도 단순히 사이트만을 이동하는 단순한 기능만이 아니라 웹서버와 연동하여 기존 웹콘텐츠의 기능에 서버의 컴퓨터와 사용자 간의 대화형 솔루션을 제공하므로, 각종 전자상거래, 홈쇼핑 등 인터넷 사용의 활성화를 도모하게 되는 장점이 있다.In addition, the present invention can eliminate the inconvenience of having to install a voice browser including a speech engine on the client, even if installed on the client, it is not only a simple function of simply moving the site but also in conjunction with the web server of the existing web content Because it provides an interactive solution between the computer and the user of the server in the function, there is an advantage to facilitate the use of the Internet, such as various e-commerce, home shopping.

Claims (4)

웹서버, 음성서버 및 음성엔진을 포함하는 서버 컴퓨터와, 클라이언트 컴퓨터에 탑재된 기존 웹 브라우저와 접속되는 웹/음성 인터페이스를 통하여, 이용자의 음성입력시 음성응답 및 문자출력이 연동되며 이루어지도록 하는 보이스 브라우저와 기존 웹 브라우저 연동방법으로서,Voice to allow voice response and text output to be interlocked when a user inputs a voice through a server computer including a web server, a voice server and a voice engine, and a web / voice interface connected to an existing web browser mounted on a client computer. As a method of linking the browser and the existing web browser, 음성입력에 대한 음성응답이 수행되도록 하는 방법은,In order to perform a voice response to the voice input, (a) 클라이언트 컴퓨터에 구비되는 음성입력수단으로부터 웹/음성 인터페이스에 이용자의 음성신호가 전달되는 단계;(a) transmitting a user's voice signal from the voice input means provided in the client computer to the web / voice interface; (b) 웹/음성 인터페이스에서 상기 음성신호를 음성 스트리밍 데이터로 변환하는 단계;(b) converting the voice signal into voice streaming data in a web / voice interface; (c) 상기 음성 스트리밍 데이터를 음성엔진의 음성인식모듈로 전송하여 문자 데이터로 변환하는 단계;(c) transmitting the voice streaming data to a voice recognition module of a voice engine and converting the voice streaming data into text data; (d) 상기 문자 데이터를 음성엔진의 음성플랫폼을 경유하여 음성서버로 전달하고, 상기 음성서버의 음성 데이터 DB로부터 상기 문자 데이터에 대응되는 음성파일을 추출하는 단계;(d) transferring the text data to a voice server via a voice platform of a voice engine, and extracting a voice file corresponding to the text data from the voice data DB of the voice server; (e) 상기 추출된 음성파일을 음성엔진의 음성합성모듈을 통해 음성 스트리밍 데이터로 변환하는 단계; 및(e) converting the extracted voice file into voice streaming data through a voice synthesis module of a voice engine; And (f) 상기 변환된 음성 스트리밍 데이터를 웹/음성 인터페이스로 전송하여 스피커를 통해 음성출력하는 단계;를 포함하고,(f) transmitting the converted voice streaming data to a web / voice interface and outputting a voice through a speaker; 음성입력에 대한 문자출력이 수행되도록 하는 방법은,The text output to the voice input is performed, 상기 단계 (c)에서, 변환된 문자 데이터를 웹/음성 인터페이스에 전송하는 단계;In step (c), transmitting the converted text data to a web / voice interface; 상기 전송된 문자 데이터가 웹/음성 인터페이스의 웹/음성 플랫폼을 경유하여 웹 브라우저로 전달되는 단계;Delivering the transmitted text data to a web browser via a web / voice platform of a web / voice interface; 상기 웹 브라우저에서 서버시스템의 웹서버로 상기 문자 데이터에 대응하는 웹페이지 요청 데이터가 전송되는 단계; 및Transmitting web page request data corresponding to the text data from the web browser to a web server of a server system; And 상기 웹서버로부터 해당 웹페이지가 수신되어 모니터를 통해 출력되는 단계;를 포함하는 보이스 브라우저와 기존 웹 브라우저 연동방법.Receiving a corresponding web page from the web server and output through the monitor; Voice browser and existing web browser interworking method comprising a. 웹서버, 음성서버 및 음성엔진을 포함하는 서버 컴퓨터와, 클라이언트 컴퓨터에 탑재된 기존 웹 브라우저와 접속되는 웹/음성 인터페이스를 통하여, 이용자의 문자입력시 문자출력 및 음성응답이 연동되며 이루어지도록 하는 보이스 브라우저와 기존 웹 브라우저 연동방법으로서,Voice server that allows text output and voice response to be interlocked when a user inputs text through a server computer including a web server, a voice server and a voice engine, and a web / voice interface connected to an existing web browser mounted on a client computer. As a method of linking the browser and the existing web browser 문자입력에 대한 문자출력이 수행되도록 하는 방법은,In order to perform the character output for the character input, 클라이언트 컴퓨터의 문자입력수단을 통해 입력된 문자 데이터에 대응되는 웹페이지 요청 데이터가 웹 브라우저에서 웹서버로 전송되는 단계; 및Transmitting the web page request data corresponding to the text data input through the text input means of the client computer from the web browser to the web server; And 상기 웹서버로부터 해당 웹페이지가 수신되어 모니터를 통해 출력되는 단계;를 포함하고,Receiving a corresponding web page from the web server and output through a monitor; 문자입력에 대한 음성응답이 수행되도록 하는 방법은,The voice response to the text input is performed, 상기 웹 브라우저에서 웹/음성 인터페이스의 웹/음성 플랫폼으로 상기 문자 데이터가 전달되는 단계;Transmitting the text data from the web browser to a web / voice platform of a web / voice interface; 상기 문자 데이터에 대응되는 음성파일을 요청하도록 문자 데이터가 음성엔진으로 전송된 후, 음성엔진의 음성플랫폼을 경유하여 음성서버로 전달되는 단계;Transmitting the text data to the voice engine to request a voice file corresponding to the text data, and then transmitting the text data to the voice server via the voice platform of the voice engine; 음성서버의 음성 데이터 DB로부터 상기 문자 데이터에 대응되는 음성파일이 추출되어 음성엔진으로 전달되는 단계;Extracting a voice file corresponding to the text data from a voice data DB of a voice server and transferring the extracted voice file to a voice engine; 음성엔진의 음성합성모듈을 통해 상기 음성파일을 음성 스트리밍 데이터로 변환하는 단계; 및Converting the voice file into voice streaming data through a voice synthesis module of a voice engine; And 상기 변환된 음성 스트리밍 데이터를 웹/음성 인터페이스로 전송하여 스피커를 통해 음성출력하는 단계;를 포함하는 보이스 브라우저와 기존 웹 브라우저 연동방법.And transmitting the converted voice streaming data to a web / voice interface and outputting a voice through a speaker. 음성서버(32)를 포함하는 서버 컴퓨터 측에 탑재되는 엔진으로서,An engine mounted on the server computer side including the voice server 32, 클라이언트 컴퓨터(10)로부터 수신되는 음성 스트리밍 데이터를 음성인식하여 문자 데이터로 변환한 후 음성서버(32)로 전달하고, 상기 음성서버(32)에서 추출된, 상기 문자 데이터에 대응되는 음성파일을 음성합성하여 음성 스트리밍 데이터로 변환하기 위한 음성엔진(33);을 포함하며,The voice streaming data received from the client computer 10 is voice recognized, converted into text data, and then transmitted to the voice server 32, and the voice file corresponding to the text data extracted from the voice server 32 is voiced. And a voice engine 33 for synthesizing and converting the data into voice streaming data. 기존의 웹 브라우저(11)와 접속되며 클라이언트 컴퓨터(10) 측에 탑재되는 인터페이스로서,As an interface connected to an existing web browser 11 and mounted on the client computer 10 side, 클라이언트 컴퓨터(10)의 음성입력수단(13)으로부터 음성신호를 입력받아 음성 스트리밍 데이터로 변환한 후 상기 음성엔진(33)으로 전송하고, 상기 음성엔진(33)에서 변환된, 상기 음성 스트리밍 데이터에 대응되는 문자 데이터를 수신하여 상기 웹 브라우저(11)로 전달하여 웹서버(31)로 전송하도록 하는 기능과, 상기 음성엔진(33)에서 음성 스트리밍 데이터로 음성합성된 음성파일을 수신하여 스피커(14)를 통해 음성출력하는 기능을 수행하기 위한 웹/음성 인터페이스(12);를 포함하는 연동 시스템.Receives a voice signal from the voice input means 13 of the client computer 10, converts the voice signal into voice streaming data, transmits the voice signal to the voice engine 33, and converts the voice signal into the voice streaming data. Receives the corresponding text data and transmits it to the web browser 11 and transmits it to the web server 31, and receives the voice file synthesized as voice streaming data from the voice engine 33 speaker 14 Interworking system comprising a; web / voice interface (12) for performing a function to output a voice through. 음성서버(32)를 포함하는 서버 컴퓨터(30) 측에 탑재되는 엔진으로서,An engine mounted on the server computer 30 side including the voice server 32, 클라이언트 컴퓨터(10)로부터 수신되는 문자 데이터를 음성서버(32)로 전달하고, 상기 음성서버(32)에서 추출된, 상기 문자 데이터에 대응되는 음성파일을 음성합성하여 음성 스트리밍 데이터로 변환하기 위한 음성엔진(33);을 포함하며,A voice for transferring text data received from the client computer 10 to the voice server 32, and for synthesizing a voice file corresponding to the text data extracted from the voice server 32 into voice streaming data. An engine 33; 기존의 웹 브라우저(11)와 접속되며 클라이언트 컴퓨터(10) 측에 탑재되는 인터페이스로서,As an interface connected to an existing web browser 11 and mounted on the client computer 10 side, 클라이언트 컴퓨터(10)의 웹 브라우저(11)로부터 문자 데이터를 전달받아 상기 음성엔진(33)으로 전송하는 기능과, 상기 음성엔진(33)에서 음성 스트리밍 데이터로 음성합성된 음성파일을 수신하여 스피커(14)를 통해 음성출력하는 기능을 수행하기 위한 웹/음성 인터페이스(12);를 포함하는 연동 시스템.A function of receiving text data from the web browser 11 of the client computer 10 and transmitting the text data to the voice engine 33, and receiving a voice file synthesized with voice streaming data from the voice engine 33 and receiving a speaker ( And a web / voice interface (12) for performing a function of outputting voice via 14).
KR1020010060532A 2001-09-28 2001-09-28 Method and System for interworking between voice-browser and existing web-browser KR20030027359A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010060532A KR20030027359A (en) 2001-09-28 2001-09-28 Method and System for interworking between voice-browser and existing web-browser

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010060532A KR20030027359A (en) 2001-09-28 2001-09-28 Method and System for interworking between voice-browser and existing web-browser

Publications (1)

Publication Number Publication Date
KR20030027359A true KR20030027359A (en) 2003-04-07

Family

ID=29562838

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010060532A KR20030027359A (en) 2001-09-28 2001-09-28 Method and System for interworking between voice-browser and existing web-browser

Country Status (1)

Country Link
KR (1) KR20030027359A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100986443B1 (en) * 2004-01-28 2010-10-08 주식회사 케이티 Speech recognizing and recording method without speech recognition grammar in VoiceXML

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990015328A (en) * 1997-08-05 1999-03-05 정선종 How to Implement Speech Recognizer on Web Browser
KR19990031015A (en) * 1997-10-08 1999-05-06 김덕중 Audio web browser device using speech synthesis
WO1999048088A1 (en) * 1998-03-20 1999-09-23 Inroad, Inc. Voice controlled web browser
JP2000137596A (en) * 1998-10-06 2000-05-16 Lucent Technol Inc Interactive voice response system
KR20000049417A (en) * 2000-02-29 2000-08-05 이만균 Method and system for processing a voice internet command language
KR20010025243A (en) * 2000-11-14 2001-04-06 신정환 Method for Voice Web Browser Service in Internet

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990015328A (en) * 1997-08-05 1999-03-05 정선종 How to Implement Speech Recognizer on Web Browser
KR19990031015A (en) * 1997-10-08 1999-05-06 김덕중 Audio web browser device using speech synthesis
WO1999048088A1 (en) * 1998-03-20 1999-09-23 Inroad, Inc. Voice controlled web browser
JP2000137596A (en) * 1998-10-06 2000-05-16 Lucent Technol Inc Interactive voice response system
KR20000049417A (en) * 2000-02-29 2000-08-05 이만균 Method and system for processing a voice internet command language
KR20010025243A (en) * 2000-11-14 2001-04-06 신정환 Method for Voice Web Browser Service in Internet

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100986443B1 (en) * 2004-01-28 2010-10-08 주식회사 케이티 Speech recognizing and recording method without speech recognition grammar in VoiceXML

Similar Documents

Publication Publication Date Title
KR100459299B1 (en) Conversational browser and conversational systems
US7382770B2 (en) Multi-modal content and automatic speech recognition in wireless telecommunication systems
AU2004218693B2 (en) Sequential multimodal input
US8788620B2 (en) Web service support for a multimodal client processing a multimodal application
US7770105B2 (en) Communication apparatus, system and web page processing method
KR100561228B1 (en) Method for VoiceXML to XHTML+Voice Conversion and Multimodal Service System using the same
US20030139930A1 (en) Architecture for DSR client and server development platform
US20060064499A1 (en) Information retrieval system including voice browser and data conversion server
EP1104155A2 (en) Voice recognition based user interface for wireless devices
US7363027B2 (en) Sequential multimodal input
WO2004064357A2 (en) Data conversion server for voice browsing system
US20060111909A1 (en) System and method for providing network coordinated conversational services
WO2003063137A1 (en) Multi-modal information delivery system
JPH10133847A (en) Mobile terminal system for voice recognition, database search, and resource access communications
CN1666199A (en) An arrangement and a method relating to access to internet content
JPH11510977A (en) Method and apparatus for extracting information using audio interface
JPH10177469A (en) Mobile terminal voice recognition, database retrieval and resource access communication system
JPWO2005091128A1 (en) Audio processing apparatus and system and audio processing method
KR20070119153A (en) Wireless mobile for multimodal based on browser, system for generating function of multimodal based on mobil wap browser and method thereof
KR20030027359A (en) Method and System for interworking between voice-browser and existing web-browser
CN1489856B (en) Communication apparatus and method for communication system having interactive voice function, and multimedia platform
KR100486030B1 (en) Method and Apparatus for interfacing internet site of mobile telecommunication terminal using voice recognition
US20020077814A1 (en) Voice recognition system method and apparatus
KR100462812B1 (en) System and method for interfacing a web route using of a speech recognition
KR20030060082A (en) HTML/VXML Converting Engine Development for Voice User Interface

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application