KR100820217B1 - System and method for offering voice portal service using telephone - Google Patents
System and method for offering voice portal service using telephone Download PDFInfo
- Publication number
- KR100820217B1 KR100820217B1 KR1020060025169A KR20060025169A KR100820217B1 KR 100820217 B1 KR100820217 B1 KR 100820217B1 KR 1020060025169 A KR1020060025169 A KR 1020060025169A KR 20060025169 A KR20060025169 A KR 20060025169A KR 100820217 B1 KR100820217 B1 KR 100820217B1
- Authority
- KR
- South Korea
- Prior art keywords
- web
- data
- information
- user
- voice
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Abstract
본 발명은 전화를 이용한 음성 포털 서비스 제공 시스템 및 그 방법에 관한 것으로서, 사용자가 중앙 제어부에 전화를 걸면 특정 웹 사이트에 접속한 후 사용자로부터 전송되는 DTMF 신호, 또 음성을 인식하여 음성정보 신호를 출력하고, 이 음성정보 신호를 통해 인터넷 망에 접속하여 소정의 웹 사이트의 웹문서 데이터를 불러들여 파싱(Parsing) 및 분석한 후 음성 포맷으로 변환하는데, 이때 웹문서 데이터가 사용자에게 유효한 데이터인지를 검색하여 미흡한 부분은 데이터베이스를 토대로 보정처리한 후 유효 데이터들을 전화 음성 데이터 처리를 위한 음성언어로 변환 처리하여 사용자에게 음성으로 전송한다. The present invention relates to a system for providing a voice portal service using a telephone and a method thereof. When a user makes a call to a central control unit, a user accesses a specific web site and outputs a voice information signal by recognizing a DTMF signal transmitted from the user and a voice. The user accesses the Internet network through this voice information signal, retrieves the web document data of a predetermined web site, parses and analyzes it, and converts it into a voice format. The insufficient portion is corrected based on a database, and then the effective data is converted into a voice language for processing voice data and transmitted to the user as voice.
음성 포털 서비스, 음성 인식, 음성 포맷, 웹 파싱 Voice Portal Service, Speech Recognition, Speech Formats, Web Parsing
Description
도 1은 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 시스템의 구성을 도시한 것이다.1 is a block diagram of a system for providing a voice portal service using a telephone according to an embodiment of the present invention.
도 2는 도 2의 중앙 제어 서버의 세부 구성을 도시한 것이다.FIG. 2 illustrates a detailed configuration of the central control server of FIG. 2.
도 3은 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 방법의 순서도를 도시한 것이다.3 is a flowchart illustrating a method for providing a voice portal service using a telephone according to an embodiment of the present invention.
본 발명은 전화를 이용한 음성 포털 서비스 제공 시스템 및 그 방법에 관한 것으로, 특히 사용자가 일반 전화를 이용하여 웹 사이트에 접속한 후 음성 포털 서비스를 제공하도록 하는 전화를 이용한 음성 포털 서비스 제공 시스템 및 그 방법에 관한 것이다. The present invention relates to a system for providing a voice portal service using a telephone and a method thereof, and more particularly, to a system for providing a voice portal service using a telephone for providing a voice portal service after a user accesses a web site using a regular telephone. It is about.
컴퓨터와 전화의 통합 기술(Computer Telephony Integration, CTI)은 전화와 컴퓨터를 연결하여 서로 다른 장치사이에서 정보자원(데이터, 팩스, 음성정보 등)을 공유하는 기술이며, 단순히 전화와 컴퓨터간의 정보자원 공유뿐만 아니라 그 연 결된 장치들의 제어와 기존에 구축되어 있는 정보들과 네트워크를 형성하여 등록된 정보들을 제공하는 것이다.Computer Telephony Integration (CTI) is a technology for sharing information resources (data, fax, voice information, etc.) between different devices by connecting a phone and a computer, and simply sharing information resources between the phone and the computer. In addition, it provides the registered information by controlling the connected devices and forming a network with the existing information.
이러한 CTI 기술은 정보 탐색 수단이라기보다 정보 전달 수단이라고 할 수 있는데, 기존에 구축된 정보 인프라를 활용하는 것이 아니기 때문에 포털 커뮤니티(Portal community)와 같은 공유 매체로 활용하는데 한계가 있다. Such CTI technology is an information delivery means rather than an information search means. However, since the CTI technology does not utilize an existing information infrastructure, there is a limitation in using it as a shared medium such as a portal community.
시각 장애인, 노안자, 환우, 컴퓨터 사용이 불편한 사용자 등의 정보 소외 계층은 인터넷상의 다양한 웹 사이트에서 소개되는 정보에 접근 및 취득하는 과정이 매우 어렵고, 그로 인해 정보 양극화 현상이 벌어져 정보의 접근 및 취득이 유리한 사용자들에 비해 사회 경쟁력에서 현저히 뒤떨어지는 문제점이 있다.The disadvantaged information group, such as the visually impaired, presbyopia, patients with disabilities, and users who have difficulty using the computer, have a very difficult process of accessing and acquiring information from various web sites on the Internet. There is a problem that is significantly behind in social competitiveness compared to these advantageous users.
최근, 정보 소외 계층에게 ARS 시스템을 변형하여 신문기사, 도서물 등을 전화 매체를 통해 음성으로 전달해주는 서비스가 제공되고 있지만, 이 서비스는 사람이 직접 인쇄물을 읽어 녹취한 후 수록하는 방식이므로 온라인/오프라인 상에 광범위에게 유통되는 정보를 소화하기에 역부족이다.Recently, the ARS system has been modified to deliver news articles, books, etc. by voice to the underprivileged through the telephone media. It is not enough to digest information that is distributed to a wide range of people offline.
따라서, 정보 소외 계층이 사회 경쟁력에서 뒤쳐짐으로 인해 사회적으로 부담해야 할 비용과 정부 예산 등을 감안하여, 정보 소외 계층이 사회 적응과 경쟁력을 회복할 수 있도록 인터넷상에 유통되는 정보를 가능한 모두 이용할 수 있는 정보 취득 욕구와 정보 접근성을 보장해 주어야 한다. Therefore, in view of the costs and social budgets that socially disadvantaged people have, as the underprivileged fall behind in social competitiveness, they can use all the information distributed on the Internet so that the underprivileged can regain their social adaptation and competitiveness. The need for information acquisition and accessibility should be assured.
본 발명이 이루고자 하는 기술적 과제는 일반 전화나 핸드폰을 이용하여 사용자가 인터넷상의 특정 웹 사이트에 접속한 후, 편리한 사용자 인터페이스를 통해 음성으로 정보를 검색 및 취득할 수 있도록 하는 전화를 이용한 음성 포털 서비스 제공 시스템 및 그 방법을 제공하는 것이다. The technical problem to be achieved by the present invention is to provide a voice portal service using a telephone that allows a user to access a specific web site on the Internet using a regular telephone or a mobile phone, and then retrieve and acquire information by voice through a convenient user interface. It is to provide a system and a method thereof.
본 발명의 첫 번째 특징에 따른 전화를 이용한 음성 포털 서비스 제공 시스템은, 사용자가 전화를 걸어 접속되면, 사용자 음성 또는 전화 버튼을 통해 사용자 인증을 거쳐 인터넷 연결을 시도 한 후에 소정의 웹 사이트에 접속하고, HTTP(HyperText Transfer Protocol) 정보를 해석하여 CTI(Computer Telephony Integration) 환경으로 변환함으로써 전화망을 통해 상기 사용자가 모든 인터넷 활용이 가능하도록 음성 포털 서비스를 제공하는 중앙 제어 서버; 및 상기 중앙 제어 서버와 연계되어 사용자 가입 정보, 사용자 설정 정보, 사용자 인터페이스 정보, 웹 접속 및 해석 관련 데이터, 및 음성 출력 데이터들을 관리하는 데이터베이스를 포함한다. The system for providing a voice portal service using a telephone according to the first aspect of the present invention, when a user makes a phone call and connects, accesses a predetermined website after attempting to connect to the Internet through user authentication through a user voice or a telephone button. A central control server for interpreting HTTP (HyperText Transfer Protocol) information and converting the information into a computer telephony integration (CTI) environment, thereby providing a voice portal service to enable the user to utilize all the Internet through a telephone network; And a database associated with the central control server to manage user subscription information, user setting information, user interface information, web access and analysis related data, and voice output data.
상기에서, 중앙 제어 서버는, In the above, the central control server,
상기 사용자로부터 전화망을 통해 전송되는 DTMF(Dual Tone Multi Frequency) 신호 또는 음성을 인식(Automatic Speech Recognition, ASR)하여 데이터 입력 신호를 출력하는 데이터 입력부; 상기 데이터 입력부에서 전송되는 데이터 입력 신호를 통해 상기 데이터베이스에서 사용자 인증 및 사용자 설정 정보를 읽어 조회하는 사용자 관리부; 상기 사용자 관리부의 조회 결과에 따라 사용자별 설정된 음성 합성 정보에 부합하여 상기 DTMF 신호 또는 사용자 음성, 텍스트 정보를 음성으로 합성 출력하는 음성 합성부; 상기 데이터 입력부를 통한 사용자의 입력 정보 를 해석하여 소정의 웹 사이트(WEB SITE)에 접속한 후 HTTP 정보에 의해 수집 가능한 웹문서 데이터를 불러들여 파싱(Parsing) 및 분석하여 적합한 텍스트 정보로 변환 출력하는 웹 분석부; 및 상기 웹 파싱부에서 전달되는 텍스트 정보를 전화 인터페이스에 맞게 정렬한 후 전화 음성 데이터 처리를 위한 IVR(Interactive Voice Response) 및 VoiceXML(Extensible Markup Language) 규격에 맞게 작성하여 사용자의 전화로 음성 출력하는 데이터 출력부를 포함한다. A data input unit which outputs a data input signal by recognizing a DTMF (Dual Tone Multi Frequency) signal or voice transmitted from the user through an automatic telephone recognition (ASR); A user manager for reading and inquiring user authentication and user setting information from the database through a data input signal transmitted from the data input unit; A voice synthesizer for synthesizing and outputting the DTMF signal, user voice, or text information as voice in accordance with voice synthesis information set for each user according to a query result of the user manager; Analyzing input information of the user through the data input unit, accessing a predetermined web site, and importing web document data that can be collected by HTTP information, parsing and analyzing the converted document into appropriate text information. A web analysis unit; And aligning text information transmitted from the web parsing unit to a telephone interface, and then writing the text information according to the IVR (Interactive Voice Response) and VoiceXML (Extensible Markup Language) standards for processing voice data of a voice and outputting the voice to a user's phone. It includes an output unit.
상기에서 중앙 제어 서버는 상기 웹 분석부의 요청에 따라 상기 웹문서 데이터의 부족한 웹요소들을 최적화하여 텍스트 정보로 가공하고, 상기 텍스트 정보에 준하는 재배치를 정보를 상기 웹 분석부에 전달하는 웹 보정부를 더 포함한다. Wherein the central control server in response to the request of the web analysis unit optimizes the insufficient web elements of the web document data into text information, and further a web correction unit for transferring the relocation according to the text information to the web analysis unit Include.
상기 데이터 입력부는, 상기 웹 사이트에서 다른 웹 사이트로의 접속, 상기 웹문서 상에서 텍스트 입력시 사용되는 DTMF 문자 조합 모듈; 및 상기 웹 사이트의 웹 문서 내에서 탐색, 진입, 전송, 사용자 설정과 같은 브라우징 동작을 수행하는 DTMF 브라우징 모듈을 포함하는 것이 바람직하다. The data input unit may include: a DTMF character combination module used for accessing another web site from the web site and inputting text on the web document; And a DTMF browsing module that performs a browsing operation such as searching, entering, transmitting, and user setting in a web document of the web site.
상기 DTMF 문자 조합 모듈은 상기 전화 버튼마다 해당되는 문자와 대응되는 DTMF 문자 테이블 코드표를 구비하고 있고, 상기 DTMF 문자 테이블 코드표를 통해 사용자가 입력하는 전화 버튼에 따라 완성되어가는 문자를 상기 음성 합성부를 통해 음성으로 읽어주는 것이 바람직하다. The DTMF character combination module includes a DTMF character table code table corresponding to a corresponding character for each of the telephone buttons, and the voice synthesis of the characters completed according to a telephone button input by a user through the DTMF character table code table. It is desirable to read aloud through wealth.
상기 DTMF 브라우징 모듈은 상기 전화 버튼마다 웹 문서 내에서 개체/문자 이동, 링크 개체 진입, 개체/문자 읽음, 웹 사이트 종료, 메뉴 실행, 단축키 설정 및 실행과 같은 사용자 인터페이스를 구비하고 있는 것이 바람직하다. The DTMF browsing module preferably has a user interface for each phone button such as object / text movement, link object entry, object / character reading, web site termination, menu execution, shortcut key setting and execution in a web document.
상기 데이터 입력부는 사용자 음성으로 상기 웹 문서 내에서 커서의 이동, 진입, 실행과 같은 인터넷 활용이 가능하도록 음성 명령어 리스트를 구비하고 있는 것이 바람직하다. The data input unit preferably includes a voice command list to enable the user to use the Internet such as movement, entry, and execution of a cursor in the web document.
상기 음성 합성부는 사용자마다 취향에 맞게 속도, 억양, 볼륨이 개별적으로 설정 가능한 것이 바람직하다. The voice synthesizer may be individually set to speed, intonation, and volume according to taste.
상기 웹 분석부는, 상기 데이터 입력부를 통한 사용자 입력 정보를 해석하여 적합한 웹 정보 접근 체계를 수립하는 명령 계통 해석부; 상기 명령 계통 해석부의 지시에 따라 웹 사이트에 접속하는 웹 접속부; 상기 웹 접속부에서 접속한 웹 사이트에서 HTTP 정보에 의해 수집 가능한 웹 문서 데이터들을 저장하는 데이터 수신부; 상기 데이터 수신부의 웹문서 데이터들의 유효성 검사를 수행하고, 상기 유효성 검사결과에 따라 정상/에러 처리하는 데이터 검사부; 상기 데이터 검사부에서 정상 처리된 웹문서 데이터들을 개체 단위로 분절하고, 1차원 정보에 맞게 재배열하는 데이터 정렬부; 상기 데이터 정렬부에서 재배열된 웹문서 데이터들 중에서 텍스트 정보로 변환 가능한 데이터들을 구분하고, 상기 텍스트 정보로 해석되지 않는 데이터들을 상기 웹 보정부에 조회 요청하는 데이터 필터부; 상기 데이터 필터부에서 전달되는 웹문서 데이터들을 텍스트 정보로 변환하고, 웹이미지 개체를 분석 요청하는 데이터 조회부; 상기 데이터 조회부에서 전달되는 웹이미지 개체를 그림 파일명, 툴팁 정보, 캡션 정보와 같은 내부적 정보, 웹이미지의 위치, 주변 정보와의 상관관계, 상기 웹이미지가 연결된 하위 페이지 정보와 같은 유기적 정보를 규합하여 텍스트 정보로 해석하는 웹이미지 해석부; 및 상기 데이터 조회부 및 웹이미지 해석부에서 텍스트화된 웹문서 데이터들을 규합하고, 1차원 정보에 맞게 정렬한 텍스트 정보를 상기 데이터 출력부에 전달하는 데이터 전송부를 포함한다. The web analysis unit may include a command line analysis unit configured to analyze user input information through the data input unit and establish a suitable web information access system; A web access unit for accessing a web site according to the instruction of the command line analyzing unit; A data receiving unit storing web document data collectable by HTTP information from a web site accessed from the web accessing unit; A data inspecting unit for validating the web document data of the data receiving unit and processing normal / error according to the validity checking result; A data alignment unit for segmenting the web document data normally processed by the data inspection unit into individual units and rearranging the web document data according to one-dimensional information; A data filter unit for distinguishing data convertible into text information from the web document data rearranged by the data sorting unit, and requesting the web correction unit to inquire data that is not interpreted as the text information; A data inquiry unit for converting web document data transmitted from the data filter unit into text information and requesting an analysis of a web image entity; The web image object delivered from the data retrieval unit combines organic information such as internal information such as picture file name, tool tip information, caption information, location of web image, surrounding information, and lower page information connected to the web image. Web image analysis unit to interpret the text information; And a data transmission unit for assembling the web document data textified by the data retrieval unit and the web image analysis unit, and transferring the text information aligned to one-dimensional information to the data output unit.
상기 데이터 출력부는 상기 음성 합성부와 연동되어 있어 사용자 인터페이스 체계를 구비하고, 상기 데이터 입력부의 사용자 입력 정보를 수용 가능하며, 대량의 명령 체계를 수용할 수 있는 메뉴 방식의 IVR 구조로 설계되는 것이 바람직하다. The data output unit is interlocked with the speech synthesis unit to provide a user interface system, to accommodate user input information of the data input unit, and to be designed as a menu type IVR structure that can accommodate a large amount of command systems. Do.
한편, 본 발명의 두 번째 특징에 따른 전화를 이용한 음성 포털 서비스 제공 방법은, 사용자가 중앙 제어 서버에 전화를 걸면 소정의 웹 사이트에 접속한 후 사용자에게 전화망을 통해 음성 포털 서비스 관련한 음성을 송수신하는 방법에 있어서, a) 상기 중앙 제어 서버가 사용자로부터 전송되는 DTMF(Dual Tone Multi Frequency) 신호, 또 음성을 인식(Automatic Speech Recognition, ASR)하여 사용자 입력 정보를 출력하는 단계; b) 상기 a) 단계에서 전송되는 상기 사용자 입력 정보를 통해 사용자 인증을 수행하고, 인터넷망에 접속하여 소정의 웹 사이트(WEB SITE)에 접속한 후 상기 웹 사이트 내의 모든 웹문서 데이터를 불러들여 파싱(Parsing) 및 분석한 후 음성 포맷으로 변환하는 단계; c) 상기 b) 단계에서 파싱 및 분석되는 웹문서 데이터가 상기 사용자에게 유효한 데이터인지를 검색하는 단계; 및 d) 상기 b) 단계 및 c) 단계를 거쳐 전송되는 유효 데이터들을 전화 음성 데이터 처리를 위한 음성언어로 변환 처리한 후 상기 사용자에게 전송하는 단계를 포함한다. On the other hand, the voice portal service providing method using a telephone according to the second aspect of the present invention, when the user makes a call to the central control server is connected to a predetermined web site to send and receive voice related voice portal service to the user through the telephone network A method, comprising: a) the central control server recognizing a DTMF (Dual Tone Multi Frequency) signal and a speech (Automatic Speech Recognition (ASR)) and outputting user input information; b) performing user authentication through the user input information transmitted in step a), accessing a web site by accessing an internet network, and then retrieving and parsing all web document data in the web site. Converting to a speech format after Parsing and analysis; c) searching whether the web document data parsed and analyzed in step b) is valid data for the user; And d) converting the valid data transmitted through steps b) and c) into a voice language for telephone voice data processing and transmitting the converted valid data to the user.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명 이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those skilled in the art may easily implement the present invention.
먼저, 음성 포털 서비스는 전화로 원하는 정보를 음성으로 명령하면 음성 인식 엔진이 사용자 명령에 대한 음성을 인식, 사용자가 요구하는 인터넷 정보를 음성을 통해 사용자에게 전달해 주는 서비스이다.First, a voice portal service is a service in which a voice recognition engine recognizes a voice for a user command and delivers Internet information required by the user to the user through voice.
음성 포털 서비스의 핵심 기술은 음성 인식(ASR, Automatic Speech Recognition)기술과 음성합성(TTS, TextTo Speech) 기술, 그리고 HTML을 음성 정보로 변환시켜주는 언어체계(VoiceXML)이다. The core technologies of voice portal service are Automatic Speech Recognition (ASR) technology, TextTo Speech (TTS) technology, and Language XML (VoiceXML) that converts HTML into voice information.
다음, 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 시스템에 대하여 도 1 및 도 2를 참고로 하여 상세하게 설명한다.Next, a voice portal service providing system using a telephone according to an embodiment of the present invention will be described in detail with reference to FIGS. 1 and 2.
도 1은 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 시스템의 구성을 도시한 것이고, 도 2는 도 1의 중앙 제어 서버의 세부 구성을 도시한 것이다. 1 is a block diagram of a voice portal service providing system using a telephone according to an embodiment of the present invention, and FIG. 2 is a detailed block diagram of the central control server of FIG.
도 1에 나타낸 바와 같이, 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 시스템은, 사용자가 전화를 걸어 접속되면, 사용자 음성 또는 전화 버튼을 통해 사용자 인증을 거쳐 인터넷 연결을 시도 한 후에 소정의 웹 사이트에 접속하고, HTTP(HyperText Transfer Protocol) 정보를 해석하여 CTI(Computer Telephony Integration) 환경으로 변환함으로써 전화망을 통해 사용자가 모든 인터넷 활용이 가능하도록 음성 포털 서비스를 제공하는 중앙 제어 서버(100), 및 중앙 제어 서버(100)와 연계되어 사용자 가입 정보, 사용자 설정 정보, 사용자 인터페이 스 정보, 웹 접속 및 해석 관련 데이터, 및 음성 출력 데이터들을 저장 관리하는 데이터베이스(200)를 포함하고 있지만 이에 한정되지는 않는다.As shown in FIG. 1, in a voice portal service providing system using a telephone according to an embodiment of the present invention, when a user makes a phone call and is connected, the user attempts to connect to the Internet through user authentication through a user voice or a telephone button.
먼저, 중앙 제어 서버(100)는 도 2에 도시된 바와 같이 데이터 입력부(110), 사용자 관리부(120), 음성 합성부(130), 웹 분석부(140), 웹 보정부(150), 데이터 출력부(160)를 포함하지만 이에 한정되지는 않는다. First, as shown in FIG. 2, the
데이터 입력부(110)는 사용자가 특정 전화 번호(예를 들면, 02)736-6000이 있음)를 통해 접속된 후, 음성 안내 멘트와 함께 사용자의 아이디(ID) 번호와 비밀번호가 입력되면 사용자 인증 과정을 수행한다. The
이때, 사용자 관리부(120)는 사용자 아이디, 비밀번호, 주민번호, 전화번호와 같은 가입 계정과 즐겨찾기 목록, 각종 브라우징 설정 정보, 사용자별 음성합성 정보와 같은 사용자 설정 정보를 관리한다. In this case, the
데이터 입력부(110)와 사용자 관리부(120)는 사용자 인증이 완료되면 사용자의 설정 정보에 따라 시작 페이지로 설정해 둔 웹 사이트로 자동 접속되도록 하고, 웹사이트에 접속되면 음성합성부(130)에 의해 웹 사이트의 내용이 전화상으로 출력되므로, 데이터 입력부(110)는 전화 버튼(DTMF)과 사용자 음성을 이용해 상호 입출력을 수행한다. The
이 과정에서, 데이터 입력부(110)는 데이터 출력부(160)와 유기적으로 정보를 교환한다. In this process, the
데이터 입력부(110)는 사용자가 전화 버튼을 이용하여 사용자 입력 정보를 입력할 경우에 DTMF 문자조합 모듈과 DTMF 브라우징 모듈로 구분될 수 있는데, DTMF 문자 조합 모듈은 웹문서 상에서 다른 웹 사이트로 접속하기 위해 URL입력시, 또는 웹문서 내 텍스트 박스에 문자입력시 사용되고, DTMF 브라우징 모듈은 웹문서 내에 탐색, 진입, 전송과 사용자 설정 등을 위해 사용된다. The
예를 들어, DTMF 문자 조합 모듈은 웹 사이트 내에 텍스트 박스에서 전화기 5번 버튼에 의해 자동 실행되며, 버튼으로 문자 입력시 자소단위로 완성되어가는 글자를 음성 합성부(130)와 연계하여 사용자에게 읽어 준다. 이러한 DTMF 문자조합 모듈에는 자체적으로 DTMF 문자 테이블 코드표라고 하는 전화 버튼별 해당되는 문자와 대응되는 일람표가 있다.For example, the DTMF character combination module is automatically executed by a
예시1) 사용자가 "WWW" 를 입력시 해당되는 전화버튼은 "9#9#9#"를 차례로 누름.Example 1) When the user enters "WWW", the corresponding telephone button presses "9 # 9 # 9 #".
DTMF 브라우징 모듈은 아래 예시2와 같은 사용자 인터페이스를 가지고 있다. The DTMF Browsing Module has the user interface shown in Example 2 below.
예시2) 전화 버튼에서,Example 2) In the phone button,
8번키: 웹문서 내에서 한 개체 아래로 포커스를 이동시키고 읽음.Key 8: Move focus down one object in the web document and read it.
2번키: 웹문서 내에서 한 개체 위로 포커스를 이동시키고 읽음.Key 2: Move focus to one object in the web document and read it.
5번키: 웹문서 내에 링크 개체(클릭가능 사항)에서 진입.Key 5: Enter from link object (clickable) within web document.
4번키: 웹문서 개체 내에서 한 문자 왼쪽으로 포커스를 이동시키고 읽음.Key 4: Move focus to the left of one character within the web document object and read it.
6번키: 웹문서 개체 내에서 한 문자 오른쪽으로 포커스를 이동시키고 읽음.Key 6: Move the focus to the right of one character within the web document object and read it.
3번키: 웹문서 내에서 열 개체 아래로 포커스를 이동시키고 읽음.Key 3: Move focus below the column object in the web document and read it.
9번키: 웹문서 내에서 열 개체 위로 포커스를 이동시키고 읽음.Key 9: Move focus over the column object in the web document and read it.
1번키: 웹문서 내에서 이미 가리킨 개체를 다시 읽음.Key 1: Reread the object already pointed to within the web document.
7번키: 웹문서 내에서 링크 개체만 찾아 아래로 포커스를 이동시키고 읽음.Key 7: Find only the link object in the web document and move down and read.
0번키: 웹 사이트 접속을 종료.Key 0: Closes the website.
*표키: 상황에 맞는 메뉴가 실행되어 여러 가지 브라우징 설정.* Key: Launches a context menu to set various browsing settings.
#표키: 여러 가지 단축키 설정과 실행에 활용.#Table key: Used to set and execute various shortcuts.
한편, 데이터 입력부(110)는 사용자 음성(ASR)을 이용해 사용자 입력 정보를 입력할 경우에 문자입력을 제외한 브라우징에 한정되어 작동되도록 DTMF 브라우징 모듈과 동기화 되어 동작된다. On the other hand, the
사용자는 사용자 음성을 이용한 사용자 입력 정보를 입력하기 위해서는 음성 명령어 리스트를 숙지해야 하는데, 음성 명령어 리스트는 데이터베이스(200)의 ASR DB에 저장되어 있다. In order to input user input information using a user's voice, a user must be familiar with a voice command list. The voice command list is stored in the ASR DB of the
사용자 음성과 DTMF 브라우징 모듈이 동기화되어 웹문서 내에서 활용되는 과정은 아래 예시3에 나타나 있다.The process of synchronizing user voice and DTMF browsing module in a web document is shown in Example 3 below.
예시3)Example 3)
1. 사용자 음성으로 "아래로"라고 말하면 DTMF 브라우징 모듈이 2번키와 동기화 되며 웹문서 내에서 한 개체 아래로 포커스를 이동시키고 읽음.1. If you say "down" in your voice, the DTMF Browsing Module is synchronized with the # 2 key and moves the focus down one object in the web document and reads it.
2. 사용자 음성으로 "진입", 또는 "실행" 이라고 말하면 DTMF 5번키가 작동되며 웹문서 내에서 링크 개체 안으로 진입.2. If you say "enter" or "execute" in your voice,
3. 사용자 음성으로 "부동산" 이라고 말하면 웹 페이지 내에 링크중 "부동산"이라는 제목의 링크가 존재하면 해당 위치로 포커스를 이동.3. When the user speaks "Real Estate", if there is a link in the web page called "Real Estate", the focus moves to that location.
음성 합성부(130)는 DTMF 입력시와 음성 출력 시에는 모든 과정이 음성합성 (TTS)으로 전부 읽어주는데, 음성합성(TTS)의 속도, 억양, 볼륨이 사용자마다 취향에 맞게 개별적으로 설정될 수 있다.The
음성 합성부(130)는 적절히 가공된 텍스트 정보를 넘겨받기만 하면 자동으로 음성화하여 데이터 출력부(160)에 전송한다. The
웹 분석부(140)는 사용자의 입력 정보를 해석하여 소정의 웹 사이트(WEB SITE)에 접속한 후 HTTP 정보에 의해 수집 가능한 웹문서 데이터를 불러들여 파싱(Parsing) 및 분석하여 적합한 텍스트 정보로 변환 출력한다. The
이러한 웹 분석부(140)는 데이터 입력부(110)를 통한 사용자 입력 정보를 해석하여 적합한 웹 정보 접근 체계를 수립하는 명령 계통 해석부, PSTN망을 통해 명령 계통 해석부의 지시에 따른 웹사이트에 접속하는 웹 접속부, 웹 접속부에서 접속한 웹사이트에서 HTTP 정보에 의해 수집 가능한 웹소스를 전부 불러들여 임시 저장하는 데이터 수신부, 데이터 수신부를 통해 웹 소스가 안전하게 도착했는지, 웹 소소의 접근과 가공이 가능한지 등에 필요한 데이터 유효성 검사를 수행한 후 유효성 검사결과에 따라 정상/에러 처리하는 데이터 검사부, 데이터 검사부에서 정상 처리된 웹소스를 개체 단위로 분절하고 이를 다시 2차원 정보에서 1차원 정보에 맞게 재배열하는 데이터 정렬부, 데이터 정렬부에서 재배열된 웹요소들 중에서 텍스트 정보로 변환 가능한 데이터들을 구분하고 텍스트 정보로 해석되지 않는 데이터들을 웹 보정부(150)에 조회 요청하는 데이터 필터부, 데이터 필터부에서 전달되는 웹요소 중 개체 속성을 의미 있는 텍스트 정보로 변환하고 웹이미지 개체를 웹이미지 분석부(140)에 분석 요청하는 데이터 조회부, 데이터 조회부에서 전달되는 웹이 미지 개체를 그림 파일명, 툴팁 정보, 캡션 정보와 같은 내부적 정보, 웹이미지의 위치, 주변 정보와의 상관관계, 상기 웹이미지가 연결된 하위 페이지 정보와 같은 유기적 정보를 규합하여 텍스트 정보로 해석하는 웹이미지 해석부, 및 데이터 조회부 및 웹이미지 해석부에서 텍스트화된 웹문서 데이터들을 규합하고, 웹요소에서 누락된 것들을 검사한 후 1차원 정보에 맞게 정렬한 텍스트 정보를 상기 데이터 출력부에 전달하는 데이터 전송부를 포함한다. The
위에서, 웹이미지 해석부는 웹페이지 상에 존재하는 웹이미지가 해당 이미지를 대표하는 텍스트(단어나 문장)로 해석될 수 있도록 웹이미지가 종속적으로 연관되어지는 주변 지점을 추적하여 텍스트화 할 수 있는 합당한 단서를 찾게 된다. In the above, the web image interpreter is capable of tracking and textifying the surrounding point where the web image is dependently related so that the web image existing on the web page can be interpreted as text (word or sentence) representing the image. Find clues.
웹이미지 해석부는 추적에 의해 추출해낸 단서를 기초로 하여 표현상의 보정 작업을 거치면 웹이미지를 완전한 대체 텍스트로 변환하게 된다. The web image analysis unit converts the web image into a complete alternative text by correcting the expression based on the clue extracted by the tracking.
웹이미지 해석부의 웹이미지 해석 단계는 아래와 같이 크게 7단계로 나누어질 수 있다. The web image interpreting step of the web image analyzing unit may be divided into seven steps as follows.
제1 단계는 웹이미지 수신과 확인 과정으로서 웹이미지가 종속적으로 연관되어지는 주변 지점의 웹소스를 수집한다. 제2 단계는 웹이미지 파일명을 파악하는 과정으로서 해당 웹이미지를 웹소스로부터 파일명을 추출하고 버퍼에 보관한다. The first step is to receive and confirm the web image, and collect web sources of neighboring points where the web image is dependently associated. The second step is to determine the web image file name. The web image is extracted from the web source and stored in the buffer.
제3 단계는 웹이미지의 위치를 파악하는 과정으로서 해당 웹이미지를 웹소스로부터 위치 정보를 추출하고 버퍼에 보관한다. 제4 단계는 웹이미지 선후(先後) 웹소스를 파악하는데, 해당 웹이미지를 웹소스로부터 일정 수준에 위치한 앞부분과 뒷부분의 선후 웹소스를 파악하고 버퍼에 보관한다.The third step is to determine the location of the web image and extract the location information from the web source and store it in a buffer. The fourth step is to identify the web source before and after the web image. The web image is identified at the front and rear portions of the web image at a predetermined level from the web source and stored in a buffer.
제5 단계는 웹이미지 링크 페이지를 파악하는 과정으로서 해당 웹이미지를 웹소스로부터 부여된 링크정보를 근거로 웹접속을 시도하고 해당 웹페이지에서 문서 타이틀, 문서 내용 등을 분석해 버퍼에 보관한다. The fifth step is to identify the web image link page. The web image is attempted to access the web image based on the link information provided from the web source, and the document title and the document content are analyzed and stored in the buffer.
제6 단계는, 웹이미지 선행 경로를 파악하는 과정으로서 해당 웹이미지에 도달하게 된 경로를 근거로 이전 웹페이지에 접속하고 문서 타이틀, 문서 내용 등을 분석하며 버퍼에 보관한다. The sixth step is to identify the web image leading path and access the previous web page based on the path to reach the web image, analyze the document title, the document content, and store it in the buffer.
제7 단계는 웹이미지 규합 텍스트 선택 과정으로서 버퍼에 보관된 자료들 중에 웹이미지를 대표할 수 있는 가장 합당한 텍스트 정보를 선택하게 된다. The seventh step is a web image registration text selection process, and among the data stored in the buffer, the most suitable text information that can represent the web image is selected.
한편, 웹 보정부(150)는 웹 분석부(140)의 조회를 받아 미진한 웹요소들을 최적화하는데, 웹요소 중 개체속성과 기능을 구현하기 위해 사용된 HTML 규약 등을 적절한 텍스트 정보로 가공하고 이에 준하는 재배치 정보를 포함하여 웹 분석부(140)에 재전송한다.Meanwhile, the
이때, 웹 보정부(150)의 재배치 정보는 데이터 출력부(160)에 사용자 인터페이스 메뉴 체계를 적합하게 구성하는 데 필수적인 역할을 담당한다. In this case, the relocation information of the
데이터 출력부(160)는 웹 분석부(140)에서 전송되는 전화 음성 포맷에 타당한 텍스트 데이터를 실제로 전화 인터페이스에 맞게 메뉴화 구조로 1차 정렬하고, IVR 및 VXML 규격에 맞게 작성하고 동작시킨다. The
이때, 데이터 출력부(160)는 음성 합성부(130)와 연동되어 정교한 사용자 인터페이스 체계를 갖추고, 데이터 입력부(110)의 명령 계통이 적절히 수용되도록 한다. At this time, the
데이터 출력부(160)에서 IVR 구조는 통상적으로 링크 방식이지만 본 발명에서는 메뉴 방식을 채택하는데, 이때 메뉴 방식은 대량의 명령 체계를 효과적으로 수용할 수 있는 가장 합당한 구조를 제공하게 된다. In the
본 발명에서, 웹 사이트는 HTTP기반의 웹 사이트로서 HTML 규격은 물론 "미디어플레이어", "자바스크립트/VBScript", "플래시" 를 모두 포함하는 것이다.(예를 들면, , , , 모든 웹사이트)In the present invention, the web site is an HTTP-based web site and includes not only the HTML standard but also all of "media player", "JavaScript / VBScript" and "flash" (for example, all web sites,,,).
도 3을 참조하여 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 시스템의 동작에 대하여 자세하게 설명한다. Referring to Figure 3 will be described in detail the operation of the voice portal service providing system using a telephone according to an embodiment of the present invention.
도 2는 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 방법의 순서도를 도시한 것이다. 2 is a flowchart illustrating a method for providing a voice portal service using a telephone according to an embodiment of the present invention.
도 2에 도시된 바와 같이, 본 발명의 실시예에 따른 전화를 이용한 음성 포털 서비스 제공 방법은, 사용자가 컴퓨터가 아닌 일반 전화나 핸드폰 등을 이용하여 중앙 제어 서버(10O)에 전화를 걸면(S1), 중앙 제어 서버(10)는 접속한 사용자에게 아이디와 비밀번호를 요청하고, 사용자가 자신의 아이디와 비밀번호를 입력하면 사용자 인증을 수행한다.(S2)As shown in FIG. 2, in the method of providing a voice portal service using a telephone according to an embodiment of the present invention, when a user makes a call to the
사용자 인증이 정상적으로 완료되면, 사용자는 데이터 입력부(110)를 통해 URL 입력을 위해 음성으로 주소 입력창을 말하거나 전화 버튼(예를 들어, *, 2, 5를 차례로 입력)을 누르게 되고, 중앙제어 서버(100)는 사용자의 URL 요청에 따라 해당 웹사이트에 접속하고(S3), 웹사이트에 속한 모든 웹소스를 불러들여 개체를 분석하여 보정하여 의미 있는 텍스트로 변환 절차를 수행한다. When the user authentication is normally completed, the user speaks the address input window by voice or presses a telephone button (for example, *, 2, 5) in order to input a URL through the
즉, 데이터 입력부(110)는 DTMF 신호, 또는 사용자 음성을 인식(Automatic Speech Recognition, ASR)하여 디지털 변환을 통해 사용자 입력 정보 신호를 출력한다.(S4) That is, the
웹 분석부(140)는 사용자 입력 정보 신호를 통해 실제 인터넷망(PSDN)에 접속하여 특정 웹사이트에 접속한 후 해당 웹사이트의 모든 웹문서 데이터를 불러들여 파싱(Parsing) 및 분석한 후 적절한 음성 포맷(TTS)으로 변환한다.(S5, S6)The
이때, 웹 분석부(140)는 웹문서 데이터가 사용자에게 유효한 데이터인지를 검색하고, 데이터의 미흡한 부분은 웹 보정부(150)를 토대로 보정 처리한다.(S7, S8) At this time, the
데이터 출력부(160)는 웹문서 데이터들이 웹 분석부(140)를 통해 의미 있는 텍스트로 가공되어 있으므로, 음성 합성부(130)와 연동하여 적절한 음성 포맷으로 변환한 후 사용자의 전화로 음성 출력한다.(S9, S10)Since the
상기 도면과 발명의 상세한 설명은 단지 본 발명의 예시적인 것으로서, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.The drawings and detailed description of the invention are merely exemplary of the invention, which are used for the purpose of illustrating the invention only and are not intended to limit the scope of the invention as defined in the appended claims or claims. Therefore, those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. Therefore, the true technical protection scope of the present invention will be defined by the technical spirit of the appended claims.
이와 같이, 본 발명에 의한 전화를 이용한 음성 포털 서비스 제공 시스템 및 그 방법은 일반인, 특히 정보 소외 계층에게 전화를 이용해 쉽게 웹사이트에 접근하여 정보를 활용할 수 있도록 하고, 웹사이트를 운용하는 업체에게 전화 콜 센터 시스템을 충족할 수 있도록 하는 효과가 있다.As described above, the system and method for providing a voice portal service using a telephone according to the present invention make it possible to easily access a website using information by using a telephone to an ordinary person, especially an information marginalized layer, and to call a company operating a website. It is effective to meet the call center system.
또한, 본 발명에 의한 전화를 이용한 음성 포털 서비스 제공 시스템 및 그 방법은 전화 활용도 및 인터넷 활용도가 확대되어 향후 홈 네트워크 시스템에 연동될 수 있고, 정보 활용 대체 수단이 확대되어 사회 전반에 정보 유통화 회전이 신속히 이루어지도록 하는 효과가 있다.In addition, the voice portal service providing system and method using the telephone according to the present invention can be interlocked with the home network system in the future as the telephone utilization and the Internet utilization is expanded, and the alternative means for using information is expanded to rotate information distribution throughout society This has the effect of making it happen quickly.
Claims (14)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060025169A KR100820217B1 (en) | 2006-03-20 | 2006-03-20 | System and method for offering voice portal service using telephone |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060025169A KR100820217B1 (en) | 2006-03-20 | 2006-03-20 | System and method for offering voice portal service using telephone |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070095026A KR20070095026A (en) | 2007-09-28 |
KR100820217B1 true KR100820217B1 (en) | 2008-04-08 |
Family
ID=38688461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060025169A KR100820217B1 (en) | 2006-03-20 | 2006-03-20 | System and method for offering voice portal service using telephone |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100820217B1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020011569A (en) * | 2000-08-02 | 2002-02-09 | 강민구 | System and Method for providing information on the Internet through the wire/wireless/mobile telephone network with the use of voice |
KR20020012362A (en) * | 2000-08-07 | 2002-02-16 | 최중인 | Voice-web system based on voice recognition |
KR20020062017A (en) * | 2001-01-19 | 2002-07-25 | 엠제이엘테크놀러지 주식회사 | Method and system for providing voice information by using the internet |
KR20030060082A (en) * | 2003-04-02 | 2003-07-12 | 최중인 | HTML/VXML Converting Engine Development for Voice User Interface |
-
2006
- 2006-03-20 KR KR1020060025169A patent/KR100820217B1/en not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020011569A (en) * | 2000-08-02 | 2002-02-09 | 강민구 | System and Method for providing information on the Internet through the wire/wireless/mobile telephone network with the use of voice |
KR20020012362A (en) * | 2000-08-07 | 2002-02-16 | 최중인 | Voice-web system based on voice recognition |
KR20020062017A (en) * | 2001-01-19 | 2002-07-25 | 엠제이엘테크놀러지 주식회사 | Method and system for providing voice information by using the internet |
KR20030060082A (en) * | 2003-04-02 | 2003-07-12 | 최중인 | HTML/VXML Converting Engine Development for Voice User Interface |
Also Published As
Publication number | Publication date |
---|---|
KR20070095026A (en) | 2007-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100524295C (en) | An arrangement and a method relating to access to internet content | |
US9769314B2 (en) | Personal voice-based information retrieval system | |
US7415537B1 (en) | Conversational portal for providing conversational browsing and multimedia broadcast on demand | |
JP4089148B2 (en) | Interpreting service method and interpreting service device | |
US6658414B2 (en) | Methods, systems, and computer program products for generating and providing access to end-user-definable voice portals | |
CN1317661C (en) | System and method for facilitating internet search by providing web document layout image | |
JP2002125047A5 (en) | ||
US20110067059A1 (en) | Media control | |
WO1997023973A1 (en) | Method and system for audio access to information in a wide area computer network | |
KR20160104635A (en) | Methods, systems, and media for generating search results based on contextual information | |
EP1143691B1 (en) | System for simplifying the access and the use of internet services from a mobile terminal | |
US6909999B2 (en) | Sound link translation | |
JP3141833B2 (en) | Network access system | |
WO2007101022A2 (en) | System and method for retrieving files from a file server using file attributes | |
JPH10177469A (en) | Mobile terminal voice recognition, database retrieval and resource access communication system | |
KR100820217B1 (en) | System and method for offering voice portal service using telephone | |
KR100381606B1 (en) | Voice web hosting system using vxml | |
JP2001075968A (en) | Information retrieving method and recording medium recording the same | |
KR100519748B1 (en) | Method and apparatus for internet navigation through continuous voice command | |
CN106850923A (en) | Associated person information display methods, system and its equipment | |
WO2010038923A1 (en) | System and method of auto-complete with query type under guarantee of search results and storage media having program source thereof | |
CA2471133A1 (en) | Method for exchanging information by means of voice over a packet-oriented network | |
US9549002B2 (en) | Method and device for making available at least one communication datum | |
KR101090554B1 (en) | Wireless Internet Access Method Based on Conversational Interface | |
KR20020011569A (en) | System and Method for providing information on the Internet through the wire/wireless/mobile telephone network with the use of voice |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
N231 | Notification of change of applicant | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130329 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20140417 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |