KR102386529B1 - Apparatus and method for verifying road name address recognized based on voice - Google Patents

Apparatus and method for verifying road name address recognized based on voice Download PDF

Info

Publication number
KR102386529B1
KR102386529B1 KR1020200115222A KR20200115222A KR102386529B1 KR 102386529 B1 KR102386529 B1 KR 102386529B1 KR 1020200115222 A KR1020200115222 A KR 1020200115222A KR 20200115222 A KR20200115222 A KR 20200115222A KR 102386529 B1 KR102386529 B1 KR 102386529B1
Authority
KR
South Korea
Prior art keywords
address
text
address information
building
name
Prior art date
Application number
KR1020200115222A
Other languages
Korean (ko)
Other versions
KR20220033168A (en
Inventor
이건수
방기덕
박상현
Original Assignee
주식회사 씨앤에이아이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨앤에이아이 filed Critical 주식회사 씨앤에이아이
Priority to KR1020200115222A priority Critical patent/KR102386529B1/en
Publication of KR20220033168A publication Critical patent/KR20220033168A/en
Application granted granted Critical
Publication of KR102386529B1 publication Critical patent/KR102386529B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/487Arrangements for providing information services, e.g. recorded voice services or time announcements
    • H04M3/493Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
    • H04M3/4936Speech interaction details

Abstract

본 발명은 음성 기반으로 인식된 도로명 주소를 검증하는 장치 및 방법을 개시한다. 본 발명의 일 측면에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 장치는, 사용자로부터 주소지 정보를 음성으로 입력받아 저장하는 녹취부; 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하는 변환부; 및 상기 텍스트로 변환된 주소지 정보의 유효성을 검증하는 주소 검증부;를 포함한다. The present invention discloses an apparatus and method for verifying a street name address recognized based on voice. According to an aspect of the present invention, there is provided an apparatus for verifying a street name address recognized based on a voice, comprising: a recorder for receiving and storing address information by voice input from a user; a conversion unit converting the address information into text using STT; and an address verification unit that verifies the validity of the address information converted into the text.

Description

음성 기반으로 인식된 도로명 주소를 검증하는 장치 및 방법{Apparatus and method for verifying road name address recognized based on voice}Apparatus and method for verifying road name address recognized based on voice}

본 발명은 음성 기반으로 인식된 도로명 주소를 검증하는 장치 및 방법에 관한 것으로, 더욱 상세하게는 TV 홈쇼핑을 통한 상품의 구매 과정에서 전화망을 통해 입력받은 배송지 정보의 정확한 확인을 위한 음성 기반으로 인식된 도로명 주소를 검증하는 장치 및 방법에 관한 것이다. The present invention relates to an apparatus and method for verifying a street name address recognized by voice, and more particularly, to an apparatus and method for verifying a street name address recognized based on voice It relates to an apparatus and method for verifying a street name address.

TV홈쇼핑을 통한 상품 구매 과정에서, 전화망을 통한 배송지 정보의 확보는 필수적인 과정이며 동시에, 서비스 운영 효율을 높이기 위한 주요한 자동화 적용 대상 과정이다. TV홈쇼핑을 통해 제품을 구매하려는 소비자는 우선 TV 방송을 보고, 구매하고자 하는 물건을 결정한 뒤, 전화를 통해, 주문 의사를 밝히고, 결제정보와 배송지 정보를 등록하는 것으로 구매 과정을 종료하게 된다. 구매 과정에서, 상담원이 소비자와 직접 통화하는 부분은 구매 의사를 확인하는 과정까지이며, 결제정보와 주소지 정보는 소비자가 음성을 통해 녹음하고, 추후 녹취된 정보의 전사를 통해 주소지를 확인하고, 출고를 진행하게 된다. 하지만, 녹취된 주소 정보는 홈쇼핑 사이트의 관리자 및/또는 상담원이 수동으로 검증을 하여 정확한 정보인지를 확인해야 하므로 업무가 효율적이지 못하다는 단점이 있다. In the process of purchasing products through TV home shopping, securing delivery address information through the telephone network is an essential process, and at the same time, it is a major automation application process to increase service operation efficiency. Consumers who want to purchase products through TV home shopping first watch TV broadcasts, decide on the products they want to purchase, then make an order over the phone and end the purchase process by registering payment information and delivery address information. In the purchase process, the part where the agent directly communicates with the consumer is the process of confirming the intention to purchase, and the consumer records the payment information and address information through voice, and later confirms the address through transcription of the recorded information, and releases the product. will proceed with However, since the recorded address information must be manually verified by an administrator and/or a counselor of the home shopping site to confirm whether it is accurate information, there is a disadvantage in that the work is not efficient.

따라서, 음성으로 기록된 배송지 정보를 자동으로 인식 및 검증하기 위한 기술에 대한 연구가 필요한 실정이다. Therefore, there is a need for research on technology for automatically recognizing and verifying delivery address information recorded in voice.

한국등록특허 제10-1176404호(2012.08.28 공고)Korean Patent Registration No. 10-1176404 (Announcement on August 28, 2012)

본 발명은 상기와 같은 문제점을 해결하기 위해 제안된 것으로서, TV 홈쇼핑을 통한 상품의 구매 과정에서 전화망을 통해 입력받은 배송지 정보의 확인 절차를 자동화함으로써 홈쇼핑 업무의 효율을 획기적으로 증가시킬 수 있는 음성 기반으로 인식된 도로명 주소를 검증하는 장치 및 방법을 제공하는데 그 목적이 있다. The present invention has been proposed to solve the above problems, and it is a voice-based method that can dramatically increase the efficiency of home shopping tasks by automating the confirmation procedure of delivery address information input through the telephone network in the process of purchasing products through TV home shopping. An object of the present invention is to provide an apparatus and method for verifying a street name address recognized as

본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 일 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허청구범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.Other objects and advantages of the present invention may be understood by the following description, and will be more clearly understood by an embodiment of the present invention. Further, it will be readily apparent that the objects and advantages of the present invention can be realized by the means and combinations thereof indicated in the claims.

상기와 같은 목적을 달성하기 위한 본 발명의 일 측면에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 장치는, 사용자로부터 주소지 정보를 음성으로 입력받아 저장하는 녹취부; 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하는 변환부; 및 상기 텍스트로 변환된 주소지 정보의 유효성을 검증하는 주소 검증부;를 포함한다. According to an aspect of the present invention for achieving the above object, an apparatus for verifying a street name address recognized based on voice includes: a voice recorder for receiving and storing address information from a user by voice; a conversion unit converting the address information into text using STT; and an address verification unit that verifies the validity of the address information converted into the text.

상기 변환부는, 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명 및 도로명발화로 구분된 레코드 형태로 주소를 분리하여 변환하고, 상기 도로명발화는, 다양한 발화 가능 표현을 고려하여 쉼표를 이용해 하나 이상의 문자열로 변환하여 표현한 정보인 것을 특징으로 한다. The conversion unit converts the address information into text using STT, but separates and converts the address into a record form divided into cities, towns and villages, towns and villages, road names and road names, and the road name speech is a variety of speech possible expressions It is characterized in that it is information expressed by converting it into one or more character strings using commas in consideration.

상기 주소 검증부는, 상기 텍스트로 변환된 주소지 정보에서, 도로명발화 컬럼과 미리 설정된 주소 데이터베이스의 도로명 컬럼을 비교하여, 텍스트 내에 존재하는 숫자 발음이 문자인지 또는 숫자인지를 검증하고, 텍스트 내에 존재하는 숫자 발음이 숫자로 판단되는 경우 숫자 표현으로 텍스트를 변환하여 주소 정보의 유효성을 검증하는 것을 특징으로 한다. The address verification unit, in the address information converted into text, compares a street name speech column with a road name column of a preset address database, verifies whether the pronunciation of a number present in the text is a letter or a number, and a number existing in the text When the pronunciation is determined as a number, the text is converted into a numeric expression to verify the validity of the address information.

상기 변환부는, 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명 및 건물번호와 건물이름과 동, 층, 호를 포함하는 상세주소로 구분된 레코드 형태로 주소를 분리하여 변환하고, 상기 주소 검증부는, 상기 텍스트로 변환된 주소지 정보에서, 상세주소의 건물이름을 미리 설정된 주소 데이터베이스와 비교하여, 주소 정보의 유효성을 검증하는 것을 특징으로 한다. The conversion unit converts the address information into text using STT, but separates the address in the form of a record divided into cities and provinces, cities, towns, and villages, road names and building numbers, and detailed addresses including building names and dongs, floors, and numbers and the address verification unit, in the address information converted into text, compares the building name of the detailed address with a preset address database to verify the validity of the address information.

상기 주소 검증부는, 상기 유효성 검증이 완료된 주소 정보에서, key-value 방식 및 단일 문자열 방식을 이용하여 띄어쓰기 되지 않은 주소 정보를 검증하는 것을 특징으로 한다. The address verification unit, in the address information for which the validation has been completed, is characterized in that it verifies the address information without spaces by using a key-value method and a single string method.

상기와 같은 목적을 달성하기 위한 본 발명의 다른 측면에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 장치에서의 주소 검증 방법은, 사용자로부터 주소지 정보를 음성으로 입력받아 저장하는 녹취 단계; 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하는 텍스트 변환 단계; 및 상기 텍스트로 변환된 주소지 정보의 유효성을 검증하는 주소 검증 단계;를 포함한다. According to another aspect of the present invention for achieving the above object, there is provided an address verification method in an apparatus for verifying a street name address recognized based on a voice, comprising: a recording step of receiving and storing address information by voice input from a user; a text conversion step of converting the address information into text using STT; and an address verification step of verifying the validity of the address information converted into the text.

상기 텍스트 변환 단계는, 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명 및 도로명발화로 구분된 레코드 형태로 주소를 분리하여 변환하고, 상기 도로명발화는, 다양한 발화 가능 표현을 고려하여 쉼표를 이용해 하나 이상의 문자열로 변환하여 표현한 정보인 것을 특징으로 한다. The text conversion step converts the address information into text using STT, but separates and converts the address into a record form divided into cities, towns and villages, towns and villages, road names and road names, and the road name speech can be uttered in various ways It is characterized in that it is information expressed by converting it into one or more character strings using commas in consideration of the expression.

상기 주소 검증 단계는, 상기 텍스트로 변환된 주소지 정보에서, 도로명발화 컬럼과 미리 설정된 주소 데이터베이스의 도로명 컬럼을 비교하여, 텍스트 내에 존재하는 숫자 발음이 문자인지 또는 숫자인지를 검증하고, 텍스트 내에 존재하는 숫자 발음이 숫자로 판단되는 경우 숫자 표현으로 텍스트를 변환하여 주소 정보의 유효성을 검증하는 것을 특징으로 한다. In the address verification step, in the address information converted into text, by comparing a street name speech column with a road name column of a preset address database, verifying whether the pronunciation of a number present in the text is a letter or a number, and When it is determined that the pronunciation of a number is a number, the text is converted into a numeric expression to verify the validity of the address information.

상기 텍스트 변환 단계는, 상기 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명 및 건물번호와 건물이름과 동, 층, 호를 포함하는 상세주소로 구분된 레코드 형태로 주소를 분리하여 변환하고, 상기 주소 검증 단계는, 상기 텍스트로 변환된 주소지 정보에서, 상세주소의 건물이름을 미리 설정된 주소 데이터베이스와 비교하여, 주소 정보의 유효성을 검증하는 것을 특징으로 한다. In the text conversion step, the address information is converted into text using STT, but the address is in the form of a record divided into cities and provinces, cities, towns, and villages, road names and building numbers, and detailed addresses including building names and dongs, floors, and numbers. is separated and converted, and the address verification step is characterized by verifying the validity of the address information by comparing the building name of the detailed address in the text-converted address information with a preset address database.

상기 주소 검증 단계는, 상기 유효성 검증이 완료된 주소 정보에서, key-value 방식 및 단일 문자열 방식을 이용하여 띄어쓰기 되지 않은 주소 정보를 검증하는 것을 특징으로 한다. The address verification step is characterized in that the address information without spaces is verified using a key-value method and a single string method in the address information for which the validation is completed.

본 발명의 일 측면에 따르면, 홈쇼핑의 구매 과정에서 이루어지는 배송지(주소) 확인 절차를 자동화함으로써 홈쇼핑 업무의 효율을 획기적으로 증가시킬 수 있는 효과가 있다.According to one aspect of the present invention, there is an effect that can dramatically increase the efficiency of home shopping tasks by automating the delivery address (address) verification process performed in the purchase process of home shopping.

본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The effects obtainable in the present invention are not limited to the above-mentioned effects, and other effects not mentioned will be clearly understood by those of ordinary skill in the art to which the present invention belongs from the following description. .

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명을 실시하기 위한 구체적인 내용들과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니 된다.
도 1은 본 발명의 일 실시예에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 장치의 개략적인 기능 블록도,
도 2는 본 발명의 일 실시예에 따른 주소 검증부에서 주소의 구성 요소를 추출하는 과정에 대한 단계별 처리 과정의 일 예,
도 3은 본 발명의 일 실시예에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 방법의 개략적인 흐름도이다.
The following drawings attached to this specification illustrate preferred embodiments of the present invention, and serve to further understand the technical spirit of the present invention together with specific contents for carrying out the invention, so the present invention is in such drawings It should not be construed as being limited only to the stated matters.
1 is a schematic functional block diagram of an apparatus for verifying a street name address recognized based on voice according to an embodiment of the present invention;
2 is an example of a step-by-step process for extracting components of an address by an address verification unit according to an embodiment of the present invention;
3 is a schematic flowchart of a method of verifying a street name address recognized based on voice according to an embodiment of the present invention.

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일 실시예를 상세히 설명하기로 한다.The above objects, features and advantages will become more apparent through the following detailed description in relation to the accompanying drawings, and accordingly, those of ordinary skill in the art to which the present invention pertains can easily implement the technical idea of the present invention. There will be. In addition, in the description of the present invention, if it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. Hereinafter, a preferred embodiment according to the present invention will be described in detail with reference to the accompanying drawings.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 “포함”한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 “…부” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.Throughout the specification, when a part "includes" a certain element, it means that other elements may be further included, rather than excluding other elements, unless otherwise stated. In addition, the “… The term “unit” means a unit that processes at least one function or operation, which may be implemented as hardware or software or a combination of hardware and software.

TV홈쇼핑은 TV방송을 통해 제품소개를 받은 고객이 전화망을 통해 구매의사를 전달하고, 결제정보와 배송지정보를 등록하면, 이후 상담사가 해당 정보를 확인 후, 해피콜을 통해 구매를 확정하는 과정으로 이루어진다. 이처럼, 배송지 정보의 확인은 수잡업으로 이루어지므로, 업무 효율이 저하되는 단점이 존재하므로, 이러한 점을 개선하기 위한 즉, 배송지 정보를 확인하는 과정을 자동화하여 업무의 효율을 높이기 위한 기술 개발이 필요하였다. 한편, 한국의 주소 체계는 도로명 주소와 지번 주소로 구분된다. 지번 주소의 경우, 1945년 이전 일제강점기 시기에 도입되어 사용됐다. 하지만, 도시화에 따른 주소의 변동을 제대로 반영하지 못한다는 단점이 존재했다. 가령, 토지의 분할 및 합병 등에 따라 지번의 신규 생성, 삭제 및 변경이 반복되면서, 지번 자체의 배열이 무질서하게 변화되었고 그 결과로 인접 지역 간 주소의 연계성이 떨어지며, 한 지번 내에 여러 가옥이 밀집한 경우, 다수의 가옥이 동일 주소를 공유하거나, 기존의 분할된 필지가 합쳐져 대형 건물이 신축된 경우, 동일 건물에 여러 지번에 배정되는 경우 또한 존재했다. 더욱이 법정동과 행정동이 달라지면서, 지번 주소의 불편함이 적체되었다.TV home shopping consists of a process in which a customer who receives a product introduction through a TV broadcast sends a purchase intention through the telephone network, registers payment information and delivery address information, and then a counselor confirms the information and confirms the purchase through Happy Call. . As such, since the verification of the delivery address information is a manual task, there is a disadvantage in that work efficiency is lowered. In order to improve this point, that is, it is necessary to develop a technology to increase the work efficiency by automating the process of checking the delivery address information. did On the other hand, the address system in Korea is divided into street name address and lot number address. In the case of the lot number, it was introduced and used during the Japanese colonial period before 1945. However, there was a disadvantage in that it did not properly reflect the change of address due to urbanization. For example, as new creation, deletion, and change of lot numbers are repeated due to division and merger of land, the arrangement of lot numbers itself has changed in a disorderly manner, and as a result, the linkage of addresses between adjacent areas is reduced, and several houses are densely located within a lot number , there were also cases where a large number of houses shared the same address, existing divided lots were merged to construct a large building, and the same building was assigned to multiple lot numbers. Moreover, as the legal dong and administrative dong were different, the inconvenience of lot number addresses accumulated.

행정동의 경우, 지방자치단체의 조례로 정해지는 만큼, 법정동과 다른 경우가 존재한다. 가령, 서울시 중구 명동의 경우, 16개의 법정동으로 구성되나, 행정동으로는 하나만 존재하며, 행정동 기준으로 행정업무가 진행되지만, 지번주소는 법정동을 기준으로 하고 있기 때문에, 일상 생활에서의 지번 주소의 사용이 점점 일상과의 괴리를 보이게 되었다. 이런 문제를 해결하기 위해 도로명 주소가 제안되었고, 2001년 1차 도로명 주소 사업을 시작으로, 지번을 대신할 도로명 주소가 만들어졌고, 수많은 도로에 그 이름이 신설되기 시작했다. 그리고, 2014년 1월 1일부터 새로운 도로명 주소의 사용이 전면 시행되었다. 원칙상으로는 토지대장을 제외한 모든 곳에서 도로명 주소만을 써야 한다. 도로명 주소의 형식은 도로명 주소법 시행령 제3조(http://www.law.go.kr/법령/도로명 주소법시행령)에 정의되어 있다. In the case of administrative buildings, there are cases where they are different from those of statutory buildings to the extent that they are determined by local government ordinances. For example, in the case of Myeong-dong, Jung-gu, Seoul, there are 16 legal dongs, but there is only one administrative dong, and administrative work is carried out based on the administrative dong. This gradually became more and more disconnected from everyday life. To solve this problem, street name addresses were proposed, and starting with the first street name address project in 2001, street name addresses were created to replace lot numbers, and new names began to be added to numerous roads. And, from January 1, 2014, the use of the new street name address was fully implemented. In principle, only the street name and address should be used in all places except the land ledger. The format of the street name address is defined in Article 3 of the Enforcement Decree of the Road Name Address Act (http://www.law.go.kr/Law/Enforcement Decree of the Road Name Address Act).

시행령에 의해 도로명 주소를 사용하기 위한 제반 규칙들이 정해져있지만, 실제로는 시행령 규칙에 적합하게 사용되고 있지는 않다. 가령, 도로명 주소법 시행규칙 제2조 제1항에는 도로명 주소를 읽는 방법으로, 건물 번호는 "번"으로 읽고, 하이픈은 "의"라고 읽도록 되어 있지만, 현실은 건물 번호까지를 읽고, 하이픈은 "다시" 라고 읽는 경우가 일반적이다. 또한 제3조 제5항에서 명시된 것처럼, 건물 번호와 상세주소 사이를 쉼표로 구분하기 보다는 괄호를 이용해 상세 주소를 기술하는 경우가 일반적이다. Although all rules for using street name addresses are set by the Enforcement Decree, they are not actually being used appropriately for the Enforcement Decree rules. For example, in Article 2 Paragraph 1 of the Enforcement Rule of the Road Name and Address Act, the street name address is read, building numbers are read as "number" and hyphens are read as "in", but in reality, even building numbers are read and hyphens are read. is usually read as "again". Also, as specified in Article 3 (5), it is common to describe the detailed address using parentheses rather than separating the building number and the detailed address with a comma.

이처럼, 도로명 주소를 사용하는 과정에 있어서, 시행령과 실제 사용법 사이의 차이, 도로명 주소와 기존 지번 기반 주소의 혼용의 문제가 존재하기에, 고객의 배송지 발화 정보를 처리하기 위해서는 기존의 텍스트 기반 주소 처리 방법으로는 충분하지 못하다. As such, in the process of using the street name address, there is a difference between the enforcement ordinance and the actual usage, and there is a problem of mixing the street name address and the existing lot number-based address. method is not enough.

따라서, 고객의 주소 발화를 인식 및 검증하는 다양한 연구가 수행되었으며, 그 중 STT를 이용해 고객의 주소 발화를 인식 및 검증하기 위한 기술 즉, 음성 기반으로 인식된 도로명 주소를 검증하는 절차를 자동화할 수 있는 기술에 대해 이하, 도 1 내지 도 3을 참조하여 설명하기로 한다.Therefore, various studies have been conducted to recognize and verify customer address utterances, and among them, STT can be used to automate the technology for recognizing and verifying customer address utterances, that is, the procedure for verifying recognized street name addresses based on voice. Hereinafter, the present technology will be described with reference to FIGS. 1 to 3 .

도 1은 본 발명의 일 실시예에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 장치의 개략적인 기능 블록도, 도 2는 본 발명의 일 실시예에 따른 주소 검증부에서 주소의 구성 요소를 추출하는 과정에 대한 단계별 처리 과정의 일 예이다. 1 is a schematic functional block diagram of an apparatus for verifying a street name address recognized based on voice according to an embodiment of the present invention. This is an example of a step-by-step processing process for the process.

TV홈쇼핑은 TV방송을 통해 제품소개를 받은 고객이 전화망을 통해 구매의사를 전달하고, 결제정보와 배송지정보를 등록하면, 이후 상담사가 해당 정보를 확인 후, 해피콜을 통해 구매를 확정하는 과정으로 이루어진다. 하지만, 기존에는 전화망을 통해 등록한 고객의 음성 정보를 판매 관리 시스템에 수작업으로 등록하는 과정을 거쳐 업무 효율이 저하되고, 상담사의 개인적인 판단에 의해 배송지(주소) 정보를 기입하므로, 그 정보가 정확하지 않다는 단점이 있었다. 따라서, 배송지 정보를 자동으로 인식하고 검증하게 되면 업무 효율이 증가하고, 배송지 정보가 정확하게 되므로 배송 사고가 발생하지 않을 수 있는 장점이 있다. TV home shopping consists of a process in which a customer who receives a product introduction through a TV broadcast sends a purchase intention through the telephone network, registers payment information and delivery address information, and then a counselor confirms the information and confirms the purchase through Happy Call. . However, in the past, the customer's voice information registered through the telephone network was manually registered in the sales management system, reducing work efficiency and entering the delivery address (address) information according to the personal judgment of the counselor. The downside was that it wasn't. Therefore, if the delivery address information is automatically recognized and verified, work efficiency is increased, and since the delivery address information is accurate, there is an advantage that a delivery accident may not occur.

도 1을 참조하면, 본 실시예에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 장치는, 녹취부(100), 변환부(200) 및 주소 검증부(300)를 포함한다. Referring to FIG. 1 , an apparatus for verifying a street name address recognized based on voice according to the present embodiment includes a recording unit 100 , a conversion unit 200 , and an address verification unit 300 .

녹취부(100)는 사용자로부터 주소지 정보를 음성으로 입력받아 저장한다. 녹취부(100)는 사람의 음성을 입력받는 마이크일 수 있다. 녹취부(100)는 사람의 입력을 입력받고 별도로 저장된 저장소에 입력받은 사람의 음성을 저장할 수 있다. The recording unit 100 receives the address information from the user by voice and stores it. The recorder 100 may be a microphone that receives a human voice. The recorder 100 may receive a person's input and store the inputted person's voice in a separately stored storage.

변환부(200)는 주소지 정보를 STT를 이용하여 텍스트로 변환한다. 이때, STT(Speech to Text)는 사람이 말하는 음성 언어를 컴퓨터가 해석해 그 내용을 문자 데이터로 전환하는 처리를 말한다. STT는 종래 기술이므로, 보다 상세한 설명은 생략하기로 한다. The conversion unit 200 converts the address information into text using STT. At this time, STT (Speech to Text) refers to a process in which the computer interprets the spoken language and converts the content into text data. Since STT is a prior art, a more detailed description will be omitted.

변환부(200)는 주소지 정보를 STT를 이용하여 텍스트로 변환했을 때, 텍스트 안에서 존재하는 숫자 발음을 숫자로 변화시킬 것인지, 발음 그대로 유지할 것인지를 판단할 수 있어야 한다. 예컨대, “산막이옛길”이라는 텍스트를 “산막이옛길”인지, “산막2옛길”인지를 결정하는 기능이 필요하다. 더욱이 “원호암사길”처럼, “강동구 암사길”의 경우에는 “암사”가 맞고, “충주시 원호암4길”은 “암4”가 맞는 경우가 존재하는 경우, 단순한 정규표현으로는 구분할 수 없다. 이런 숫자-문자 변환의 모호성은 건물번호와 건물이름이 동시에 발화되었을 때, 특히 중요한데, “서울시 중구 청계천로 400 이마트”의 경우, “서울시 중구 청계천로 사백이마트” 이라는 입력값에서, “사백이마트”, “4 백이마트”, “402 마트”, 또는 “400 2마트”처럼, 다양한 변화 후보들 중에서 정답을 발견하기가 쉽지 않기 때문이다. 이러한 문제점을 해결하기 위해, 본원발명에 따르면, 숫자 표현의 변화가 필요한 부분은 “읍면”, “도로명” 두 부분으로, 우정사업본부의 주소 DB(https://www.epost.go.kr/search/zipcode/cmzcd002k01.jsp)를 기반으로 17개의 특별시, 직할시, 도에 대해서 각각의 주소 테이블을 생성하였다. 우정사업본부의 주소 DB는 다음의 26개의 컬럼으로 이루어져있고, 이들 중 “시도, 시군구, 읍면, 도로명”과 “도로명”에 대한 발음을 추가하여, 각 시도별로 DB를 생성한다. 이렇게 생성한 주소 DB의 테이블 스키마는 “시도, 시군구, 읍면, 도로명, 도로명발화”로 구성되며, “경기도, 광주시, 초월읍, 현산로385번길”의 레코드의 경우, “도로명발화” 컬럼의 값은 “현산로삼백팔십오번길, 현산로삼팔오번길”로 발화 가능 표현을 쉼표로 구분된 문자열로 표현한다. 이후, STT를 통해 획득한 고객의 주소 발화에서 “도로명” 부분을 추출한 뒤, “도로명발화”의 발화 가능 표현들과 비교하여, 일치하는 발화 표현의 경우, 해당 레코드의 “도로명” 컬럼의 값으로 변경한다. 건물 이름의 경우, 도로명에 대한 발화와 표기를 비교한 방법과 동일한 방식으로 처리하며, 한 가지 예외 사항을 추가하여 진행한다. 이 예외 사항은, 건물 이름이 숫자로 시작하는 경우, 건물 번호와 구분이 올바르게 구분되지 않는 문제점을 해결하기 위함이다. 가령, “성동구 뚝섬로 379 이마트”라는 주소의 경우, “삼백칠십구이마트”의 경우, “3792 마트”로 분리되는 문제가 존재한다. 이 문제를 해결하기 위해, 상세주소의 경우, 우측부터 시작해, “동/층/호” 정보를 정규표현을 이용해 분리해내고, 남은 상세주소를 대상으로, “시도”, “시군구”, “읍면”, “도로명”을 대상으로 해당 구역에 존재하는 건물 이름 목록을 검색한 뒤, 건물 이름과 일치하는 부분을 제외하고, 남은 부분을 “건물 번호”로 분리한다. 즉 “성동구 뚝섬로”에 존재하는 건물의 목록에서, 건물 이름이 “마트”로 끝나는 건물 중에, “마트”앞의 명칭이 “이”, “구이”, “칠구이”, “칠십구이”가 존재하는지를 확인해가며, 일치하는 부분, 즉 “이마트”가 존재한다는 것을 확인하면, “이”를 제외한, “삼백칠십구”까지를 건물 번호로, “이마트”를 건물 이름으로 구분한다. “건물 번호”와 “건물 이름”을 결정하기 위해, 행정안전부의 주소 데이터베이스(https://www.juso.go.kr/addrlink/addrlinkJusoDBUse.do?menu=main&cPath=99MD)와 이 주소DB를 사용하기 위해, 행정안전부에서 제공하는 도로명주소 API(https://www.juso.go.kr/addrlink/devAddrLinkRequestGuide.do?menu=roadApi)를 사용하였다. When the address information is converted into text using STT, the conversion unit 200 should be able to determine whether to change the pronunciation of numbers existing in the text to numbers or to keep the pronunciation as it is. For example, a function is needed to determine whether the text “Sanmakyetgil” is “Sanmakyetgil” or “Sanmakiiyetgil”. Moreover, like “Wonhoamsa-gil”, if “Amsa” is correct in the case of “Gangdong-gu Amsa-gil” and “Am 4” is correct in “Wonhoam 4-gil in Chungju-si,” it cannot be distinguished by a simple regular expression. . The ambiguity of this number-letter conversion is especially important when the building number and the building name are uttered at the same time. This is because it is not easy to find the correct answer among various change candidates like , “4 Baek E-Mart”, “402 Mart”, or “400 2 Mart”. In order to solve this problem, according to the present invention, the parts that need to be changed in numerical expression are “eup-myeon” and “road name” two parts, and the address DB of the Postal Service Headquarters (https://www.epost.go.kr/ search/zipcode/cmzcd002k01.jsp), each address table was created for 17 special cities, municipalities, and provinces under direct control. The address DB of the Postal Service Headquarters consists of the following 26 columns, and among them, the pronunciation for “province, city, county, eup, myeon, and town” and “road name” are added to create a DB for each province. The table schema of the address DB created in this way consists of “province, city, county, eup, myeon, road name, road name”. Expressions that can be uttered as “Hyeonsan-ro three hundred and eighty-five beon-gil, Hyeonsan-ro three hundred and fifty five-beon-gil” are expressed as character strings separated by commas. After that, after extracting the “road name” part from the utterance of the customer’s address obtained through STT, it is compared with the possible expressions of “road name utterance”. change In the case of the building name, it is processed in the same way as the method comparing the speech and notation of the road name, with one exception added. This exception is to solve the problem that when the building name starts with a number, the building number and the division are not properly distinguished. For example, in the case of “E-Mart 379, Ttukseom-ro, Seongdong-gu,” there is a problem of separation into “3792 Mart” in the case of “Seventy-Nine Mart”. To solve this problem, in the case of detailed addresses, starting from the right, “dong/floor/room” information is separated using regular expressions, and for the remaining detailed addresses, After searching the list of building names in the area for ” and “road name”, exclude the part that matches the building name and separate the remaining parts by “building number”. That is, in the list of buildings that exist in “Ttukseom-ro, Seongdong-gu,” among the buildings whose building names end in “Mart,” the names in front of “Mart” are “Lee”, “Guy”, “Chilgui”, and “Seventy-nine”. If it is checked whether there is a matching part, that is, “E-Mart”, and “three hundred and seventy-nine”, excluding “Lee”, is classified as a building number and “E-Mart” as a building name. To determine “building number” and “building name”, the Ministry of Public Administration and Security’s address database (https://www.juso.go.kr/addrlink/addrlinkJusoDBUse.do?menu=main&cPath=99MD) and this address DB are used To do this, the road name address API (https://www.juso.go.kr/addrlink/devAddrLinkRequestGuide.do?menu=roadApi) provided by the Ministry of Public Administration and Security was used.

다시 말해, 변환부(200)는 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명 및 도로명발화로 구분된 레코드 형태로 주소를 분리하여 변환한다. 이때, 도로명발화는, 다양한 발화 가능 표현을 고려하여 쉼표를 이용해 하나 이상의 문자열로 변환하여 표현한 정보일 수 있다. In other words, the conversion unit 200 converts the address information into text by using the STT, but separates and converts the address into a record form divided into cities, towns and villages, towns and villages, road names and road names. In this case, the road famous utterance may be information expressed by converting it into one or more character strings using a comma in consideration of various possible utterance expressions.

또한, 변환부(200)는 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명 및 건물번호와 건물이름과 동, 층, 호를 포함하는 상세주소로 구분된 레코드 형태로 주소를 분리하여 변환할 수 있다. In addition, the conversion unit 200 converts the address information into text using STT, but in the form of a record divided into cities and provinces, cities, towns, and villages, road names and building numbers, and detailed addresses including building names and dongs, floors, and numbers. Addresses can be converted by separating them.

주소 검증부(300)는 텍스트로 변환된 주소지 정보의 유효성을 검증한다. 본 실시예에를 설명함에 있어, 도로명 주소는 “시도”, “시군구”, “읍면”, “도로명”, “건물번호”, “상세주소”로 구성되고, “상세주소”는 다시 “건물 이름”과 “동/층/호”로 구분된다. 주소를 구성하는 각각의 세부 구성 요소를 분리하기 위한, 두 번째 단계는 주소를 “일반주소”와 “상세주소”로 분리하는 것이다. 주소 유효성에 대한 검증은 “일반주소”의 경우 그 주소가 주소 DB에 존재하는지로 결정한다. “상세주소”의 경우, 상세주소 중 “건물이름”이 주소 DB에 존재하는지로 결정한다. “동/층/호” 정보에 대한 유효성을 검증하지 않는 까닭은 해당 정보의 실체는 직접 확인하는 것 이외의 방법이 없기 때문이다. “일반주소”와 “상세주소”를 구분하기 위해서는, 우선 “일반주소”의 마지막인 “건물번호”를 찾아야 하고, “건물번호”를 찾기 위해서는 “도로명”을 찾아야 하며, “도로명”을 찾기 위해서는 “시도”, “시군구”, “읍면” 정보를 찾아야 한다. 따라서, 첫 번째 단계가 “시도”, “시군구”, “읍면”, “도로명”을 찾는 것이 된다. “시도”는 총 17개의 고정 명칭으로 구성되며, “시군구”, “읍면”, “도로명”은 정해져있기에 정규표현식을 이용해 검출한다. 정규표현식을 이용한 만큼, 정규표현과 다른 표기에 대해서는 대응하지 않는다. 다만, “시군구”의 경우는 생략 가능하기 때문에, 생략된 구역 기준은 포함한다. 즉, “서울특별시”의 경우, “서울시” 또는 “서울”이라고 발화되어도 대응할 수 있도록 정규표현식을 사용한다. “도로명”의 경우, 숫자가 포함되어 있기 때문에, 숫자에 대한 발음 표기를 변환하여, 입력된 고객의 발화와 비교한다. 발음 표기는 두 가지 경우를 고려한다. 가령, “119”의 경우, “백십구”라고 발화될 수도 있고, “일일구”라고 발화될 수 있기 때문에, 두 가지 종류의 발화 경우를 같이 고려하여, “건물 번호”의 경우, “도로명”이 추출된 이후, 숫자 발화의 연속 값을 “건물 번호”로 가정한다. 이를 위해서, “도로명”과 “건물 번호”는 연속해서 존재한다고 가정한다. 이처럼, 주소 검증부(300)에서 주소의 구성 요소를 추출하는 과정에 대한 단계별 처리 과정은 도 2에 도시된 바와 같다. The address verification unit 300 verifies the validity of the address information converted into text. In describing this embodiment, the street name address consists of “city and city”, “si, gun-gu”, “eup/myeon”, “road name”, “building number”, and “detailed address”, and “detailed address” is again “building name” ” and “Wing/Floor/Ho”. In order to separate each detailed component constituting an address, the second step is to separate the address into “general address” and “detailed address”. Verification of address validity is determined by whether the address exists in the address DB in the case of a “general address”. In the case of “detailed address”, it is determined whether “building name” among the detailed addresses exists in the address DB. The reason for not verifying the validity of the “Wing/Floor/Room” information is that there is no other way than to directly check the substance of the information. In order to distinguish between “general address” and “detailed address”, you must first find the last “building number” of the “general address”, and to find the “building number”, you must find the “road name” You need to find “city”, “city, county,” and “eup and town” information. Therefore, the first step is to find “city”, “city, county,” “eup, myeon,” and “road name”. “City and province” consists of a total of 17 fixed names, and “si, county,” “eup, myeon,” and “road name” are fixed, so they are detected using regular expressions. As long as regular expressions are used, it does not correspond to other notations than regular expressions. However, since it is possible to omit “si, county,” and so on, the omitted district standard is included. That is, in the case of “Seoul Metropolitan City”, regular expressions are used to respond even when “Seoul City” or “Seoul” is spoken. In the case of “road name”, since numbers are included, the pronunciation of the numbers is converted and compared with the inputted utterance of the customer. Two cases are considered for pronunciation notation. For example, in the case of “119”, it can be uttered as “one hundred and nineteen” or “one day nine”, so consider both types of utterances, and in the case of “building number”, “road name” After this is extracted, it is assumed that the continuous value of the number utterance is “building number”. For this purpose, it is assumed that “road name” and “building number” exist consecutively. As described above, a step-by-step processing process for the process of extracting the components of the address by the address verification unit 300 is shown in FIG. 2 .

다시 말해, 주소 검증부(300)는 텍스트로 변환된 주소지 정보에서, 도로명발화 컬럼과 미리 설정된 주소 데이터베이스의 도로명 컬럼을 비교하여, 텍스트 내에 존재하는 숫자 발음이 문자인지 또는 숫자인지를 검증하고, 텍스트 내에 존재하는 숫자 발음이 숫자로 판단되는 경우 숫자 표현으로 텍스트를 변환하여 주소 정보의 유효성을 검증한다. In other words, the address verification unit 300 compares the street name column of the address database with the street name column in the address information converted into text, verifies whether the pronunciation of numbers present in the text is a letter or a number, and the text When it is determined that the pronunciation of a number in the text is a number, the text is converted into a numeric expression to verify the validity of the address information.

또한, 주소 검증부(300)는 텍스트로 변환된 주소지 정보에서, 상세주소의 건물이름을 미리 설정된 주소 데이터베이스와 비교하여, 주소 정보의 유효성을 검증할 수 있다. 이때, 주소 검증부(300)는 유효성 검증이 완료된 주소 정보에서, key-value 방식 및 단일 문자열 방식을 이용하여 띄어쓰기 되지 않은 주소 정보를 검증할 수도 있다. 주소 띄어쓰기는 상술한 바에 따라 주소 구성 요소의 추출이 완료되면, 두 가지 출력 방식을 적용하여 최종 사용자에게 제공한다. 첫 번째 출력 방식은 구성 요소에 따른 개별 출력 방식으로, “Key-Value” 방식을 사용한다. 이는 이후 JSON 표현으로 쉽게 변환 가능하기 때문에, 외부 서비스와 RESTful 연동을 위해 사용될 수 있다. 두 번째 방식은, 단일 문자열로 출력하는 것으로, 구성 요소의 순서는 도로명주소 시행령 제3조 제1항에서 명기된 순서에 따라, 나열하며, 구분자로는 공백과 쉼표를 선택하여 사용한다. 이 방식은 전체 주소를 배송장에 직접 출력하기 위해 사용될 수 있다. In addition, the address verification unit 300 may verify the validity of the address information by comparing the building name of the detailed address in the text-converted address information with a preset address database. In this case, the address verification unit 300 may verify address information that is not spaced by using a key-value method and a single string method in the address information for which validation is completed. Address spacing is provided to end users by applying two output methods when extraction of address components is completed as described above. The first output method is an individual output method according to the component, and the “Key-Value” method is used. Since it can be easily converted to JSON expression later, it can be used for RESTful interworking with external services. The second method is to output as a single character string, and the order of the components is listed in the order specified in Article 3, Paragraph 1 of the Enforcement Decree of the Street Name and Address, and a space and a comma are selected and used as delimiters. This method can be used to print the full address directly on the shipping note.

도 3은 본 발명의 일 실시예에 따른 음성 기반으로 인식된 도로명 주소를 검증하는 방법의 개략적인 흐름도이다. 3 is a schematic flowchart of a method of verifying a street name address recognized based on voice according to an embodiment of the present invention.

도 3에 도시된 바와 같이, 음성 기반으로 인식된 도로명 주소를 검증하는 방법은 크게 발화 인식 단계(S310), 주소 분리 단계(S320), 후보 주소 검색 단계(S330), 상세 주소 검증 단계(S340) 및 최종 주소 도출 단계(S350)를 포함할 수 있다. As shown in FIG. 3 , the method of verifying a street name address recognized based on voice is largely a speech recognition step (S310), an address separation step (S320), a candidate address search step (S330), and a detailed address verification step (S340) and a final address deriving step (S350).

먼저, 발화 인식 단계(S310)에서는 STT를 이용해, 사용자의 발화 내용을 입력받는다. First, in the speech recognition step ( S310 ), the content of the user's speech is received using STT.

다음으로, 주소 분리 단계(S320)에서는, 주소 분리를 수행하며, “시도”, “시군구”, “읍면”, “도로명”, “건물 번호”, “상세주소”로 분리한다. “시도”와 “시군구” 정보는 정규표현식을 이용해, 해당 정보를 추출하고, “읍면”과 “도로명” 정보는 기 추출한 “시도”와 “시군구” 정보를 바탕으로, 내부 DB를 이용해, 해당 지역의 “읍면”과 “도로명”의 정보를 추출한 뒤, 분리한 “읍면”, “도로명” 정보와 비교하여, 주소 DB의 내용으로 변경한다. 가령, “청도군 운문면 마일사길”로 “청도군 운문면 마일4길”이 검색되었다면, “마일사길”은 “마일4길”로 변경된다. Next, in the address separation step (S320), the address separation is performed, and it is divided into “province”, “si, gun-gu”, “eup-myeon”, “road name”, “building number”, and “detailed address”. “Province” and “city, county,” information is extracted using regular expressions, and “eup, myeon” and “road name” information is based on previously extracted “city and county” and “city, county, and district” information, using the internal DB, After extracting the information of “eup-myeon” and “road name” of , compare it with the separated “eup-myeon” and “road name” information, and change it to the contents of the address DB. For example, if “Mile 4-gil, Unmun-myeon, Qingdao-gun” is searched for as “Milesa-gil, Unmun-myeon, Cheongdo-gun,” “Milesa-gil” is changed to “Mile 4-gil”.

다음으로, 후보 주소 검색 단계(S330)에서는, “읍면”과 “도로명” 정보가 확정되면, 행정안전부의 주소 DB를 이용해, 후보 주소군을 수집한다. 이미 “시도”, “시군구”, “읍면”, “도로명”, “건물 번호”를 도출했음에도 불구하고, 후보 주소군이 나오는 까닭은 “건물 번호”의 오인식 가능성이 있기 때문이다. 가령, “5”라는 건물 번호를 획득했을 때, “51”, “52” 등의 건물 번호를 갖는 주소들이 후보 주소군이 된다. Next, in the candidate address search step ( S330 ), when “eup, myeon” and “road name” information is confirmed, a group of candidate addresses is collected using the address DB of the Ministry of Public Administration and Security. Even though “city”, “city, county,” “eup, myeon,” “road name,” and “building number” have already been derived, the reason why the candidate address group appears is because there is a possibility of misrecognition of “building number”. For example, when a building number of “5” is acquired, addresses having building numbers such as “51” and “52” become a candidate address group.

다음으로, 상세 주소 검증 단계(S340)에서는, 상세 주소를 검증한다. 상세주소는 “건물 이름”과 “동/층/호”로 구성된다. 건물 이름을 확정할 수 없기 때문에, 상세주소의 우측부터, “동/층/호”정보를 정규표현식을 이용해 추출하고, 남은 부분을 “건물 이름”으로 가정한다. 이렇게 가정한 “건물 이름”이 실제 유효한 이름인지를 확인하기 위해, 해당 지역에 등록된 건물 목록을 “시도”, “시군구”, “읍면”, “도로명” 정보를 사용해 검색하고, 검색된 건물 목록에 상세주소로부터 추출한 “건물 이름”이 존재하는지를 확인한다. “건물 이름”이 건물 목록 안에 존재한다면, 그 상세주소의 검증을 마친다. Next, in the detailed address verification step ( S340 ), the detailed address is verified. The detailed address consists of “building name” and “building/floor/room”. Since the name of the building cannot be determined, from the right side of the detailed address, “building/floor/room” information is extracted using regular expressions, and the remaining part is assumed to be “building name”. In order to check whether the assumed “building name” is actually a valid name, search the list of buildings registered in the area using “province”, “si, county,” “eup, myeon,” and “street name” information, and enter the searched building list. Check whether the “building name” extracted from the detailed address exists. If "building name" exists in the building list, the verification of the detailed address is completed.

마지막으로, 최종 주소 도출 단계(S350)에서는, “건물 이름”이 확인되면, S320 단계에서 분리한 “건물 번호”를 확정할 수 있고, S330 단계에서 획득한 후보 주소 중에서 최종 주소를 확정할 수 있다. 확정된 주소의 도로명주소, 지번, 그리고 우편번호를 반환하는 것으로 프로세스는 종료된다. Finally, in the final address derivation step (S350), if the “building name” is confirmed, the “building number” separated in the step S320 can be determined, and the final address can be determined from the candidate addresses obtained in the step S330 . The process ends by returning the street name, lot number, and zip code of the confirmed address.

상술한 바와 같은 본원발명에 따르면, TV홈쇼핑 분야에서 전화망을 통해 구매를 원하는 고객의 배송 주소 검증을 자동화하여 업무 효율을 높일 수 있는 효과가 있다. 다시 말해, 고객의 배송지 발화를 자동으로 처리해 줄 수 있기 때문에, TV홈쇼핑 업무의 효율을 향상시킬 수 있는 효과가 있다. According to the present invention as described above, it is possible to increase work efficiency by automating the verification of the delivery address of the customer who wants to purchase through the telephone network in the TV home shopping field. In other words, since it is possible to automatically handle the customer's delivery address, there is an effect of improving the efficiency of the TV home shopping business.

본 발명의 실시예에 따른 방법들은 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는, 본 발명을 위한 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Methods according to an embodiment of the present invention may be implemented as an application or implemented in the form of program instructions that may be executed through various computer components and recorded in a computer-readable recording medium. The computer-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the computer-readable recording medium are specially designed and constructed for the present invention, and may be known and used by those skilled in the art of computer software. Examples of the computer-readable recording medium include hard disks, magnetic media such as floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magneto-optical media such as floppy disks. media) and hardware devices specially configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules for carrying out the processing according to the present invention, and vice versa.

본 명세서는 많은 특징을 포함하는 반면, 그러한 특징은 본 발명의 범위 또는 특허청구범위를 제한하는 것으로 해석되어서는 아니 된다. 또한, 본 명세서의 개별적인 실시예에서 설명된 특징들은 단일 실시예에서 결합되어 구현될 수 있다. 반대로, 본 명세서의 단일 실시예에서 설명된 다양한 특징들은 개별적으로 다양한 실시예에서 구현되거나, 적절히 결합되어 구현될 수 있다.While this specification contains many features, such features should not be construed as limiting the scope of the invention or the claims. Also, features described in individual embodiments herein may be implemented in combination in a single embodiment. Conversely, various features described in a single embodiment herein may be implemented in various embodiments individually, or may be implemented in appropriate combination.

도면에서 동작들이 특정한 순서로 설명되었으나, 그러한 동작들이 도시된 바와 같은 특정한 순서로 수행되는 것으로 또는 일련의 연속된 순서, 또는 원하는 결과를 얻기 위해 모든 설명된 동작이 수행되는 것으로 이해되어서는 안 된다. 특정 환경에서 멀티태스킹 및 병렬 프로세싱이 유리할 수 있다. 아울러, 상술한 실시예에서 다양한 시스템 구성요소의 구분은 모든 실시예에서 그러한 구분을 요구하지 않는 것으로 이해되어야 한다. 상술한 앱 구성요소 및 시스템은 일반적으로 단일 소프트웨어 제품 또는 멀티플 소프트웨어 제품에 패키지로 구현될 수 있다.Although the operations have been described in a specific order in the drawings, it should not be understood that the operations are performed in the specific order as illustrated, or that all of the described operations are performed in a continuous order, or to obtain a desired result. Multitasking and parallel processing can be advantageous in certain circumstances. In addition, it should be understood that the division of various system components in the above-described embodiments does not require such division in all embodiments. The aforementioned app components and systems may generally be implemented as a package in a single software product or multiple software products.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것은 아니다.The present invention described above, for those of ordinary skill in the art to which the present invention pertains, various substitutions, modifications and changes are possible within the scope without departing from the technical spirit of the present invention. It is not limited by the drawings.

100 : 녹취부
200 : 변환부
300 : 주소 검증부
100: recording part
200: conversion unit
300: address verification unit

Claims (10)

사용자로부터 주소지 정보를 음성으로 입력받아 저장하는 녹취부;
상기 주소지 정보를 STT를 이용하여 텍스트로 변환하는 변환부; 및
상기 텍스트로 변환된 주소지 정보의 유효성을 검증하는 주소 검증부;를 포함하고,
상기 변환부는,
상기 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명, 도로명발화 및 건물번호와 건물이름과 동, 층, 호를 포함하는 상세주소로 구분된 레코드 형태로 주소를 분리하여 변환하고,
상기 도로명발화는,
다양한 발화 가능 표현을 고려하여 쉼표를 이용해 하나 이상의 문자열로 변환하여 표현한 정보인 것을 특징으로 하고,
상기 주소 검증부는,
상기 텍스트로 변환된 주소지 정보에서, 상기 변환부에 의해 분리하여 변환된 읍면 및 도로명을 대상으로, 도로명발화 컬럼과 미리 설정된 주소 데이터베이스의 도로명 컬럼을 비교하여, 상기 주소지 정보와 대응되는 도로명을 결정하고, 결정된 도로명을 기초로 텍스트 내에 존재하는 숫자 발음이 문자인지 또는 숫자인지를 검증하고, 텍스트 내에 존재하는 숫자 발음이 숫자로 판단되는 경우 숫자 표현으로 텍스트를 변환하여 주소 정보의 유효성을 검증하는 것을 특징으로 하고,
상기 주소 검증부는,
상기 텍스트로 변환된 주소지 정보에서, 상기 변환부에 의해 분리하여 변환된 시도, 시군구, 읍면 및 도로명을 대상으로, 상기 주소 데이터베이스로부터 상기 주소지 정보와 연관된 건물이름 목록을 검색하고, 상기 텍스트에서 상기 건물이름 목록에 포함된 특정 건물이름과 일치하는 부분을 제외하고 남은 부분을 건물번호로 분리하여, 상기 주소지 정보의 유효성을 검증하는 것을 특징으로 하는 음성 기반으로 인식된 도로명 주소를 검증하는 장치.
a recording unit for receiving and storing address information by voice from a user;
a conversion unit converting the address information into text using STT; and
and an address verification unit that verifies the validity of the converted address information into text.
The conversion unit,
The address information is converted into text using STT, but the address is separated into a record format that is divided into cities and provinces, cities and towns, towns and villages, road names, street names, building numbers, and detailed addresses including building names and buildings, floors, and numbers. convert,
The road name utterance is,
It is characterized in that it is information expressed by converting it into one or more character strings using commas in consideration of various utterable expressions,
The address verification unit,
In the address information converted to the text, by comparing the street name and utterance column with the street name column of the preset address database, targeting the towns and villages and street names separated and converted by the conversion unit, determine the street name corresponding to the address information, and , Verifies whether the pronunciation of a number in the text is a letter or a number based on the determined road name, and when the pronunciation of a number in the text is determined to be a number, converts the text into a numeric expression to verify the validity of address information with
The address verification unit,
In the address information converted into the text, a list of building names associated with the address information is retrieved from the address database for the cities, towns and villages, towns and villages and road names separated and converted by the conversion unit, and the building from the text A device for verifying a voice-based recognized street name address, characterized in that the remaining parts are separated by the building number except for the part that matches the specific building name included in the name list, and the validity of the address information is verified.
삭제delete 삭제delete 삭제delete 제 1 항에 있어서,
상기 주소 검증부는,
상기 유효성 검증이 완료된 주소 정보에서, key-value 방식 또는 단일 문자열 방식을 이용하여 띄어쓰기 되지 않은 주소 정보를 검증하는 것을 특징으로 하는 음성 기반으로 인식된 도로명 주소를 검증하는 장치.
The method of claim 1,
The address verification unit,
The apparatus for verifying a street name address recognized based on voice, characterized in that in the validation-verified address information, non-spaced address information is verified using a key-value method or a single string method.
음성 기반으로 인식된 도로명 주소를 검증하는 장치에서의 주소 검증 방법에 있어서,
사용자로부터 주소지 정보를 음성으로 입력받아 저장하는 녹취 단계;
상기 주소지 정보를 STT를 이용하여 텍스트로 변환하는 텍스트 변환 단계; 및
상기 텍스트로 변환된 주소지 정보의 유효성을 검증하는 주소 검증 단계;를 포함하고,
상기 텍스트 변환 단계는,
상기 주소지 정보를 STT를 이용하여 텍스트로 변환하되, 시도, 시군구, 읍면, 도로명, 도로명발화 및 건물번호와 건물이름과 동, 층, 호를 포함하는 상세주소로 구분된 레코드 형태로 주소를 분리하여 변환하는 단계;를 포함하고,
상기 도로명발화는,
다양한 발화 가능 표현을 고려하여 쉼표를 이용해 하나 이상의 문자열로 변환하여 표현한 정보인 것을 특징으로 하고,
상기 주소 검증 단계는,
상기 텍스트로 변환된 주소지 정보에서, 변환된 읍면 및 도로명을 대상으로, 도로명발화 컬럼과 미리 설정된 주소 데이터베이스의 도로명 컬럼을 비교하여, 상기 주소지 정보와 대응되는 도로명을 결정하고, 결정된 도로명을 기초로 텍스트 내에 존재하는 숫자 발음이 문자인지 또는 숫자인지를 검증하고, 텍스트 내에 존재하는 숫자 발음이 숫자로 판단되는 경우 숫자 표현으로 텍스트를 변환하여 주소 정보의 유효성을 검증하는 것을 특징으로 하는 음성 기반으로 인식된 도로명 주소를 검증하는 단계;를 포함하고,
상기 주소 검증 단계는,
상기 텍스트로 변환된 주소지 정보에서, 변환된 시도, 시군구, 읍면 및 도로명을 대상으로, 주소 데이터베이스로부터 상기 주소지 정보와 연관된 건물이름 목록을 검색하고, 상기 텍스트에서 상기 건물이름 목록에 포함된 특정 건물이름과 일치하는 부분을 제외하고 남은 부분을 건물번호로 분리하여, 주소 정보의 유효성을 검증하는 단계;를 포함하는 음성 기반으로 인식된 도로명 주소를 검증하는 장치에서의 주소 검증 방법.
In the address verification method in a device for verifying a street name address recognized based on voice,
a recording step of receiving and storing address information by voice from a user;
a text conversion step of converting the address information into text using STT; and
Including; an address verification step of verifying the validity of the converted address information into the text;
The text conversion step is
The address information is converted into text using STT, but the address is separated into a record format that is divided into cities and provinces, cities and towns, towns and villages, road names, street names, building numbers, and detailed addresses including building names and buildings, floors, and numbers. converting; including;
The road name utterance is,
It is characterized in that it is information expressed by converting it into one or more character strings using commas in consideration of various utterable expressions,
The address verification step is
From the converted address information, the converted eup, myeon and street names are compared with the street name column of the preset address database to determine the street name corresponding to the address information, and text based on the determined street name Speech-based recognition, characterized in that verifying whether the pronunciation of a number present in the text is a letter or a number, and verifying the validity of address information by converting the text into a numeric expression when the pronunciation of a number existing in the text is determined as a number Including; verifying the street name address;
The address verification step is
In the address information converted to the text, a list of building names associated with the address information is retrieved from the address database for the converted city, city, county, eup, and road names, and a specific building name included in the list of building names in the text A method of verifying an address in a device for verifying a street name address recognized based on a voice comprising a; separating the remaining parts with the building number except for the part matching with and verifying the validity of the address information.
삭제delete 삭제delete 삭제delete 제 6 항에 있어서,
상기 주소 검증 단계는,
상기 유효성 검증이 완료된 주소 정보에서, key-value 방식 또는 단일 문자열 방식을 이용하여 띄어쓰기 되지 않은 주소 정보를 검증하는 것을 특징으로 하는 음성 기반으로 인식된 도로명 주소를 검증하는 장치에서의 주소 검증 방법.
7. The method of claim 6,
The address verification step is
An address verification method in an apparatus for verifying a street name address recognized based on a voice, characterized in that, from the validated address information, using a key-value method or a single string method to verify the address information without spaces.
KR1020200115222A 2020-09-09 2020-09-09 Apparatus and method for verifying road name address recognized based on voice KR102386529B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200115222A KR102386529B1 (en) 2020-09-09 2020-09-09 Apparatus and method for verifying road name address recognized based on voice

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200115222A KR102386529B1 (en) 2020-09-09 2020-09-09 Apparatus and method for verifying road name address recognized based on voice

Publications (2)

Publication Number Publication Date
KR20220033168A KR20220033168A (en) 2022-03-16
KR102386529B1 true KR102386529B1 (en) 2022-05-13

Family

ID=80937678

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200115222A KR102386529B1 (en) 2020-09-09 2020-09-09 Apparatus and method for verifying road name address recognized based on voice

Country Status (1)

Country Link
KR (1) KR102386529B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102632872B1 (en) 2023-05-22 2024-02-05 주식회사 포지큐브 Method for correcting error of speech recognition and system thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102585761B1 (en) * 2022-08-19 2023-10-06 (주)페르소나에이아이 Control method of electronic device for providing address robot service recognizing address by compartment and convert voice into text

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101176404B1 (en) 2011-11-29 2012-08-28 주식회사 예스피치 Automatic response system for voice recognition having local address grammar, and address recognition method using local address grammar
KR102212093B1 (en) * 2019-01-04 2021-02-03 에스케이 주식회사 AI interactive phone ordering system for T commerce

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102632872B1 (en) 2023-05-22 2024-02-05 주식회사 포지큐브 Method for correcting error of speech recognition and system thereof

Also Published As

Publication number Publication date
KR20220033168A (en) 2022-03-16

Similar Documents

Publication Publication Date Title
US20060004572A1 (en) Homonym processing in the context of voice-activated command systems
KR102386529B1 (en) Apparatus and method for verifying road name address recognized based on voice
WO2020215554A1 (en) Speech recognition method, device, and apparatus, and computer-readable storage medium
US20190370398A1 (en) Method and apparatus for searching historical data
CN109145281B (en) Speech recognition method, apparatus and storage medium
US7983913B2 (en) Understanding spoken location information based on intersections
US8949133B2 (en) Information retrieving apparatus
CN1842788B (en) Dialog supporting apparatus, system and method
TWI711967B (en) Method, device and equipment for determining broadcast voice
US11545139B2 (en) System and method for determining the compliance of agent scripts
US20110004473A1 (en) Apparatus and method for enhanced speech recognition
JPWO2011093025A1 (en) Input support system, method, and program
US20100036867A1 (en) Method and system for improved travel record creation
CN108351876A (en) System and method for point of interest identification
TWI237991B (en) Integrated dialogue system and method thereof
JP6208631B2 (en) Voice document search device, voice document search method and program
Kamm et al. Speech recognition issues for directory assistance applications
JP6712940B2 (en) Voice input device, voice input method
JP5378907B2 (en) Spoken dialogue apparatus and spoken dialogue program
JP2004226698A (en) Speech recognition device
KR101577890B1 (en) Method and apparatus of identifying multi-domain for natural language dialogue system
JP2012108262A (en) Interaction content extraction apparatus, interaction content extraction method, program therefor and recording medium
KR100977000B1 (en) Grammar-creating method and the system
CN112860724A (en) Automatic address deviation rectifying method for man-machine integration customer service system
JP2005301138A (en) Device and program for interaction processing

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right