KR102666308B1 - 인공지능 방문자 관리 장치 - Google Patents

인공지능 방문자 관리 장치 Download PDF

Info

Publication number
KR102666308B1
KR102666308B1 KR1020230102975A KR20230102975A KR102666308B1 KR 102666308 B1 KR102666308 B1 KR 102666308B1 KR 1020230102975 A KR1020230102975 A KR 1020230102975A KR 20230102975 A KR20230102975 A KR 20230102975A KR 102666308 B1 KR102666308 B1 KR 102666308B1
Authority
KR
South Korea
Prior art keywords
information
module
data
core information
core
Prior art date
Application number
KR1020230102975A
Other languages
English (en)
Inventor
김홍철
김응천
Original Assignee
에이아이앤솔루션즈 주식회사
Filing date
Publication date
Application filed by 에이아이앤솔루션즈 주식회사 filed Critical 에이아이앤솔루션즈 주식회사
Application granted granted Critical
Publication of KR102666308B1 publication Critical patent/KR102666308B1/ko

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/00174Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys
    • G07C9/00309Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys operated with bidirectional data transmission between data carrier and locks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/00174Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys
    • G07C9/00571Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys operated by interacting with a central unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

사용자 입력부와 A/V 입력부를 포함하여 구성되며, 외부로부터 데이터를 입력받는 입력부; 데이터를 시각적으로 출력하는 디스플레이부와 데이터를 청각적으로 출력하는 스피커부를 포함하여 구성되는 출력부; 및 상기 입력부를 통해 입력된 사용자 음성 신호를 수집하는 데이터 수집 모듈과, 상기 사용자 음성 신호를 텍스트 신호로 변환하는 STT 변환 모듈과, 변환된 텍스트 신호로부터 핵심 정보를 추출하는 기준을 갖는 핵심정보 추출 모델을 생성하는 인공지능 학습 모듈과, 상기 핵심정보 추출 모델을 적용하여 소정 데이터로부터 핵심 정보를 추출하는 핵심 정보 추출 모듈과, 텍스트 신호를 음향 신호로 변환하는 TTS 변환 모듈과, 상기 핵심 정보의 추출 결과에 따라, 상기 출력부로 하여금 추출된 핵심 정보를 출력하도록 하고, 방문자 인증을 수행하는 방문자 인증 모듈과, 상기 핵심 정보의 추출 결과 및 사용자의 정보 수정 요청에 따라, 핵심 정보를 수정하는 정보 수정 모듈을 포함하는, 제어부;를 포함하여 구성되며, 상기 인공지능 학습 모듈은, 입력데이터로부터 핵심 정보를 추출하기 위한 학습 데이터를 획득하는 학습 데이터 획득 모듈과, 획득된 학습 데이터를 이용하여, 상기 핵심 정보 추출 모듈이 상기 소정 데이터로부터 핵심 정보를 추출하는 판단 기준을 갖도록 학습시키는 모델 학습 모듈을 포함하는, 인공지능 방문자 관리 장치가 개시된다.

Description

인공지능 방문자 관리 장치{ARTIFICIAL INTELLIGENCE VISITOR MANAGEMENT DEVICE}
본 발명은 인공지능 방문자 관리 장치에 관한 것이다.
아파트와 같은 공동 주택에서는, 공동주택 방문자를 관리하기 위하여 공동주택 진출입로 등에서 방문자 등록 절차가 요구된다.
기존의 방문자 등록 절차는, 방문자가 경비실 근무자에게 방문지 동 정보, 호수 정보, 방문 목적, 방문 소요 예정 시간 등을 수기로 기입하거나 전달하여 방문자 등록을 하는 방식이었다.
한편, 최근 들어, 무인 시스템 방문자 등록 장치가 보편화되고 있다. 예를 들어, 경비실에 경비실 근무자가 더 이상 상주하지 않고, 무인 키오스크 등의 무인 시스템 방문자 등록 장치가 공동주택 진출입로 등에 설치되어 있다. 그러나 이러한 무인 시스템을 제대로 활용할 수 없는 소외 계층이 다수 존재하고 있으며, 특히, 고령층이 그러한 예이다. 또한, 고령층이 아니더라도 최신 기술이 적용된 기계를 자연스럽게 사용하는데 어려움을 겪는 사람들이 다수 존재한다.
종래의 무인 방문자 등록 장치에서는, 장치가 사용자 입력을 제대로 수신하지 못한 경우에도, 동일한 내용의 오디오 메시지만을 반복하여 송출하거나, 원래의 질문을 되풀이하여 송출할 뿐, 사용자가 장치를 사용함에 있어서 다음 단계로 넘어가는데 실질적인 도움을 주지 못한다. 이에, 많은 사용자가 무인 방문자 등록 장치를 사용함에 있어서 답답함과 불편함을 느껴 왔다.
이에, 사용자가 방문자 등록을 수행함에 있어서 발생할 수 있는 다양한 경우에 맞게 가이드라인을 제공하여 사용자의 편의를 향상시킬 수 있는 방문자 관리 장치가 필요한 실정이다.
본 발명은 상기한 종래의 문제점을 해결하기 위해 안출된 것으로, 스마트하게 아파트 방문자 또는 방문 차량을 관리하고자 하는 데 그 목적이 있다.
또한, 본 발명은 키오스크 등 최신식 터치식 방문자 등록 장치에 익숙하지 않은 사용자라 할지라도 아파트 등을 방문함에 있어서 불편함이 없도록 하는 인공지능 방문자 관리 장치를 제공하고자 한다.
또한, 본 발명은 아파트 등의 방문자 또는 방문 차량 확인 절차를 종래보다 더 편리하고 신속하게 하는 인공지능 방문자 관리 장치를 제공하고자 한다.
본 발명의 일 실시예에 따른 인공지능 방문자 관리 장치는, 사용자 입력부와 A/V 입력부를 포함하여 구성되며, 외부로부터 데이터를 입력받는 입력부; 데이터를 시각적으로 출력하는 디스플레이부와 데이터를 청각적으로 출력하는 스피커부를 포함하여 구성되는 출력부; 및 상기 입력부를 통해 입력된 사용자 음성 신호를 수집하는 데이터 수집 모듈과, 상기 사용자 음성 신호를 텍스트 신호로 변환하는 STT 변환 모듈과, 변환된 텍스트 신호로부터 핵심 정보를 추출하는 기준을 갖는 핵심정보 추출 모델을 생성하는 인공지능 학습 모듈과, 상기 핵심정보 추출 모델을 적용하여 소정 데이터로부터 핵심 정보를 추출하는 핵심 정보 추출 모듈과, 텍스트 신호를 음향 신호로 변환하는 TTS 변환 모듈과, 상기 핵심 정보의 추출 결과에 따라, 상기 출력부로 하여금 추출된 핵심 정보를 출력하도록 하고, 방문자 인증을 수행하는 방문자 인증 모듈과, 상기 핵심 정보의 추출 결과 및 사용자의 정보 수정 요청에 따라, 핵심 정보를 수정하는 정보 수정 모듈을 포함하는, 제어부;를 포함하여 구성되며, 상기 인공지능 학습 모듈은, 입력데이터로부터 핵심 정보를 추출하기 위한 학습 데이터를 획득하는 학습 데이터 획득 모듈과, 획득된 학습 데이터를 이용하여, 상기 핵심 정보 추출 모듈이 상기 소정 데이터로부터 핵심 정보를 추출하는 판단 기준을 갖도록 학습시키는 모델 학습 모듈을 포함한다.
일 실시예에 있어서, 상기 인공지능 학습 모듈은, 사용자가 방문하고자 하는 곳의 위치 정보와 연락처 정보가 발음되는 다양한 경우에 대한 시나리오 데이터를 학습 데이터로 이용하여, 방문하고자 하는 곳의 동 정보, 호수 정보, 사용자 연락처 정보 중 적어도 하나를 핵심 정보로서 추출하도록 하는 핵심정보 추출 모델을 생성하는 것이 바람직하다.
일 실시예에 있어서, 상기 모델 학습 모듈은, 상기 사용자의 음성 데이터에서 숫자와 문자를 구조화하여 인식하여 숫자 부분을 상기 핵심 정보로서 추출하도록 상기 핵심 정보 추출 모듈을 학습시키는 것이 바람직하다.
일 실시예에 있어서, 상기 STT 변환 모듈은, HMM, 동적시간왜곡(DTW), 신경망(Neural Net) 중 적어도 하나를 음성인식 알고리즘으로 채택하는 것이 바람직하다.
일 실시예에 있어서, 상기 핵심 정보 추출 모듈은, 상기 사용자의 음성 데이터를 핵심정보 추출 모델의 입력 데이터로서 사용하여, 핵심 정보를 획득하는 핵심 정보 획득 모듈; 및 상기 핵심 정보 획득 모듈로부터 수신한 핵심 정보 추출의 정확도를 판단하고, 결과 데이터를 상기 방문자 인증 모듈 또는 상기 정보 수정 모듈로 제공하는, 결과 제공 모듈을 포함하는 것이 바람직하다.
일 실시예에 있어서, 상기 결과 제공 모듈은, 추출된 핵심 정보의 개수와 관리자에 의해 기 설정된 핵심 정보의 개수를 비교하여 핵심 정보 추출의 정확도를 판단하는 것이 바람직하다.
일 실시예에 있어서, 상기 결과 제공 모듈은, 상기 핵심 정보 추출의 정확도 판단 결과, 핵심 정보 추출 완료 메시지를 상기 방문자 인증 모듈로 전송하거나, 핵심 정보 재수집 요청 메시지를 상기 정보 수정 모듈로 전송하는 것이 바람직하다.
일 실시예에 있어서, 상기 방문자 인증 모듈이 상기 핵심 정보 추출 완료 메시지를 수신하면, 상기 방문자 인증 모듈은, 상기 디스플레이부로 하여금, 사용자 음성에 기반하여 핵심 정보로서 추출된 방문자 관련 정보를 디스플레이 하도록 하고, 상기 스피커부로 하여금 상기 사용자에게 정보 확인 요청 신호를 청각적으로 출력하도록 하는 것이 바람직하다.
일 실시예에 있어서, 상기 정보 확인 요청 신호에 대해, 상기 입력부를 통해, 정보가 옳다는 사용자 확인이 입력되면, 방문자 인증 모듈은 상기 사용자에 대한 방문 허용 메시지를 외부 장치로 전송하는 것이 바람직하다.
일 실시예에 있어서, 상기 정보 수정 모듈이 상기 핵심 정보 재수집 요청 메시지를 수신하면, 상기 정보 수정 모듈은, 상기 사용자로부터 입력된 정보를 반영하여 핵심 정보를 수정하며, 상기 사용자로부터 입력된 정보 수정 요청이, 관리자에 의해 설정된 소정 횟수를 초과하는 경우에는, 상기 통신부를 통해, 정보 수정 중지 메시지를 외부 장치로 전송하는, 것이 바람직하다.
따라서 본 발명에 따르면, 스마트하게 아파트 방문자 또는 방문 차량을 관리할 수 있다.
또한, 본 발명에 따르면, 키오스크 등 최신식 터치식 방문자 등록 장치에 익숙하지 않은 사용자라 할지라도 아파트 등을 방문함에 있어서 불편함이 해소될 수 있다.
또한, 본 발명에 따르면, 아파트 등의 방문자 또는 방문 차량 확인 절차를 종래보다 더 편리하고 신속하게 할 수 있다.
또한, 본 발명에 따르면, 핵심 정보가 발음되는 다양한 경우에 대하여 시나리오 데이터를 학습 데이터로 이용하여 AI 학습시키므로, 핵심 정보 추출의 정확도를 높일 수 있다.
또한, 본 발명에 따르면, 사용자의 음성으로부터 핵심 정보를 추출하여 시각적으로 표시하면서, 사용자 가이드 라인을 음성으로 제공할 수 있으므로, 방문자 및 방문차량 정보 확인 절차를 기존보다 빠르게, 사용자 친화적으로 수행할 수 있다.
도 1 은 본 발명의 일 실시예에 따른 인공지능 방문자 관리 장치(1)의 블록도이다.
도 2 는 본 발명의 일 실시예에 따른 입력부(100)의 블록도이다.
도 3 은 본 발명의 일 실시예에 따른 출력부(300)의 블록도이다.
도 4 는 본 발명의 일 실시예에 따른 제어부(200)의 블록도이다.
도 5 는 본 발명의 일 실시예에 따른 인공지능 학습 모듈(230)의 블록도이다.
도 6 은 본 발명의 일 실시예에 따른 핵심 정보 추출 모듈(240)의 블록도이다.
이하, 첨부된 도면들을 참조하여 바람직한 실시예를 첨부된 도면을 참조하여 설명한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로써 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 명세서에서 '모듈' 또는 '부' 라 함은, 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다.
또한, 어떤 구성요소가 다른 구성요소에 '연결되어' 있다거나 '접속되어' 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 '직접 연결되어' 있다거나 '직접 접속되어' 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
또한, 본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본 발명은 본 발명의 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있음은 당업자에게 자명하다. 또한, 하기 실시예는 본 발명의 권리범위를 한정하는 것이 아니라 단지 예시로 제시하는 것이며, 본 기술 사상을 통해 구현되는 다양한 실시예가 있을 수 있다.
이하, 도면들을 참조하여 본 발명의 실시예에 대해 상세히 설명하기로 한다. 도면상에서 동일 부호는 동일한 요소를 지칭한다.
도 1 은 본 발명의 일 실시예에 따른 인공지능 방문자 관리 장치(1)의 블록도이다.
본 발명의 일 실시예에 따른 인공지능(Artificial intelligence, AI) 방문자 관리 장치(이하, 'AI 방문자 관리 장치'라고 한다.)(1)는, 입력부(100), 제어부(200), 출력부(300)를 포함하여 구성된다. 또한, AI 방문자 관리 장치(1)는, 저장부(400), 통신부(500) 및 센서부(600) 중 적어도 하나를 선택적으로 더 포함할 수 있다.
입력부(100)는 AI 방문자 관리 장치(1) 외부로부터 데이터를 입력받기 위한 구성이다.
도 2 를 참조하면, 입력부(100)는 사용자 입력부(110)와 A/V입력부(120)를 포함하여 구성된다.
사용자 입력부(110)는, AI 방문자 관리 장치(1)를 제어하기 위한 사용자 명령을 입력받는 수단이다. 예를 들어, 사용자 입력부(110)에는 키패드(key pad), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등이 있을 수 있다.
A/V입력부(120)는, 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 카메라부(122)와 마이크로폰부 (124) 등을 포함할 수 있다.
일 실시예에 따르면, 카메라부 (122)는 촬영 모드에서 이미지 센서를 통해 정지 영상 또는 동영상 등의 화상 프레임을 얻을 수 있다.
또한, 마이크로폰부(124)은 방문자와 같은 사용자의 음성 신호를 입력 받을 수 있다.
다시 도 1 을 참조하면, AI 방문자 관리 장치(1)는 제어부(200)를 포함한다. 제어부(200)는, AI 방문자 관리 장치(1)의 전반적인 동작을 제어하기 위한 구성으로, 특히, 입력부(100)로 하여금 사용자 음성 신호 및 사용자 명령을 입력받도록 입력부(100)의 동작을 제어하는 기능을 수행한다. 또한, 제어부(200)는 사용자 음성 신호를 텍스트 신호로 변환하고, 이에 대해 인공지능 기반 시나리오 분석을 수행함으로써 핵심 정보를 추출하고, 추출된 핵심 정보가 출력부(300)에 출력되도록 출력부(300)의 동작을 제어하는 기능을 수행한다. 또한, 제어부(200)는, 사용자 음성 신호 및 그로부터 추출된 핵심 정보 데이터 등을 저장부(400)에 저장하도록 제어한다. 또한, 제어부(200)는, 통신부(500)가 외부 장치 또는 서버와 통신을 수행하도록 통신부(500)의 동작을 제어한다. 제어부(200)의 제어에 따라, 통신부(500)는, 예를 들어, 특정 방문자에 대한 방문 허용 메시지, 정보 수정 중지 메시지 등을 외부 장치로 전송할 수 있다.
이러한 제어부(200)는, ASICs (application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기 (controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors) 중 적어도 하나로 구현될 수 있다.
제어부(200)의 상세 구성에 대해서는 추후 도 4 를 참조하여 상세히 설명하도록 한다.
다음으로, 출력부(300)는 시각, 청각, 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 도 3 에 도시된 바와 같이, 디스플레이부(310) 및 스피커부(320)를 포함할 수 있다.
디스플레이부(310)는 AI 방문자 관리 장치(1)에서 처리된 정보를 시각적으로 출력한다. 특히, 디스플레이부(310)는 사용자 음성에 기반하여 핵심 정보로서 추출된 방문자 관련 정보를 표시할 수 있다. 디스플레이부(310)는 핵심 정보를 하이라이트, 볼드체 또는 글자 크기를 크게 하는 등으로 강조 표시하여 출력할 수 있다.
스피커부(320)는, 제어부(200)의 제어에 따라, 다양한 오디오 신호를 출력할 수 있다. 스피커부(320)는, 저장부(400)에 기 저장된 오디오 신호를 출력할 수도 있고, AI 방문자 관리 장치(1)에서 처리된 텍스트 신호가, TTS 변환 모듈(250)에서 오디오 신호로 변환된 신호를 출력할 수도 있다.
본 발명의 바람직한 실시예에 따르면, 디스플레이부(310)가 핵심 정보를 시각적으로 출력함과 동시에, 스피커부(320)는 디스플레이부(310)를 통해 출력되는 정보 중에서 수정 사항의 존재 여부를 확인하는 메시지를 청각적으로 출력할 수 있다. 또한, 사용자로부터 수정 요청이 있는 경우에, 스피커부(320)는 제어부(200)의 제어에 따라, 수정 가이드 라인을 청각적으로 출력할 수 있다. 이에 대해서는 추후 상세히 설명하기로 한다.
다시 도 1 을 참조하면, AI 방문자 관리 장치(1)는 저장부(400)를 더 포함할 수 있다. 저장부(400)는, AI 방문자 관리 장치(1)의 구동에 필요한 데이터 및 사용자 등으로부터 수집한 데이터, 핵심 정보 추출 모델을 생성하기 위해 필요한 학습 데이터 등 다양한 데이터를 저장할 수 있다.
이러한 저장부(400)는 플래시 메모리(flash memory), 하드디스크(hard disk), SD 카드(Secure Digital Card), 램 (Random Access Memory, RAM), 롬(Read Only Memory, ROM), 웹 스토리지(web storage) 등의 저장 매체 중 어느 하나 이상의 저장매체로 구현될 수 있다.
또한, AI 방문자 관리 장치(1)는 통신부(500)를 더 포함할 수 있다. 통신부(500)는 외부 장치와 통신을 수행하기 위한 모듈로, 여기서, 외부 장치는 사용자 단말기, 차단 장치, 외부 서버 등일 수 있다. 통신부(500)는 통신을 수행하기 위해 송신 안테나, 수신 안테나, 각종 통신 프로토콜이 구현 가능한 RF(Radio Frequency) 회로 및 RF 소자 중 적어도 어느 하나를 포함할 수 있다.
통신부(500)는, 근거리 통신부, 위치 정보부, 광통신부, 방송 송수신부 및 ITS(Intelligent Transport Systems) 통신부 중 적어도 하나를 포함할 수 있다.
여기서, 근거리 통신부는, 근거리 통신을 위한 유닛이다. 근거리 통신부는, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wide Band), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다.
또한, AI 방문자 관리 장치(1)는 센서부(600)를 더 포함할 수 있다. 센서부(600)는, AI 방문자 관리 장치(1)의 상태 또는 AI 방문자 관리 장치(1) 주변의 상태를 감지하고, 감지된 데이터를 제어부(200)로 전달한다.
이러한 센서부(600)는, 지자기 센서(Magnetic sensor), 가속도 센서(Acceleration sensor), 온/습도 센서, 적외선 센서, 자이로스코프 센서, 위치 센서(예를 들어, GPS), 기압 센서, 근접 센서, 및 RGB 센서 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다. 각 센서들의 기능은 그 명칭으로부터 당업자가 직관적으로 추론할 수 있으므로, 구체적인 설명은 생략하기로 한다.
본 발명에서, 특히 적외선 센서는 PIR 센서로서, 인체의 움직임이 감지되면 AI 방문자 관리 장치(1)가 사용자 가이드 라인을 출력하는 동작을 개시할 수 있다. 예를 들어, AI 방문자 관리 장치가 최초 출력하는 사용자 가이드 라인은, '안녕하세요. 방문하시는 동과 호수, 귀하의 핸드폰 번호를 알려주세요.'일 수 있다.
다음으로 도 4를 참조하여, 본 발명의 일 실시예에 따른 AI 방문자 관리 장치(1)의 제어부(200)의 세부 구성을 설명한다.
도면을 참조하면, 제어부(200)는 데이터 수집 모듈(210), STT 변환 모듈(220), 인공지능 학습 모듈(230), 핵심 정보 추출 모듈(240), TTS 변환 모듈(250), 방문자 인증 모듈(260), 정보 수정 모듈(270)을 포함하여 구성된다.
데이터 수집 모듈(210)은, 상술한 제어부(200)의 동작을 수행하기 위해 필요한 데이터를 수집한다. 예를 들어, 데이터 수집 모듈(210)은 입력부(100)를 통해 입력된 사용자(방문자)의 음성 신호를 수집할 수 있다. 또한, 데이터 수집 모듈(210)은 핵심정보 추출 모델을 생성하는데 필요한 학습 데이터를 저장부(400) 또는 외부로부터 수집할 수 있다.
STT(Speech To Text) 변환 모듈(220)은, 수집된 방문자의 음성 신호를 텍스트 신호로 변환한다. 이러한 STT 변환 모듈(220)은 히든 마르코프 모델(Hidden Markov Model: 이하, HMM이라 함.), 동적시간왜곡(DTW), 신경망(Neural Net) 중 적어도 하나를 음성인식 알고리즘으로 채택할 수 있다.
또한, 제어부(200)는 TTS 변환 모듈(250)을 포함할 수 있다. TTS 변환 모듈(250)은 텍스트 신호를 음향 신호로 변환한다. 이러한 TTS 변환 모듈(250)은 HMM, 동적시간왜곡(DTW), 신경망(Neural Net) 중 적어도 하나를 음향 합성 알고리즘으로 채택할 수 있다.
또한, 제어부(200)는 인공지능 학습 모듈(230)을 포함한다. 인공지능 학습 모듈(230)은, 변환된 텍스트 신호로부터 핵심 정보를 추출하는 기준을 갖는 핵심정보 추출 모델을 생성, 학습 또는 갱신시킬 수 있다. 인공지능 학습 모듈(230)은 수집된 학습 데이터를 이용하여 핵심 정보를 추출할 수 있는 핵심정보 추출 모델을 생성할 수 있다. 예를 들어, 인공지능 학습 모듈(230)은, 방문자가 방문하고자 하는 곳의 위치 정보와 연락처 정보가 발음되는 다양한 경우에 대한 시나리오 데이터를 학습 데이터로 이용하여, 방문하고자 하는 곳의 위치 정보를 핵심 정보로서 추출할 수 있는 핵심정보 추출 모델을 생성할 수 있다. 여기서, 상기 시나리오 데이터는 저장부(400)에 기 저장되어 있을 수 있다.
여기서, 핵심 정보로 추출되는, 방문하고자 하는 곳의 위치 정보는, 예를 들어, 아파트의 동/호수 정보, 오피스텔의 호수 또는 동/호수 정보, 건물의 호수 정보 등일 수 있다. 다만, 핵심 정보는 이에 한정되는 것은 아니며, 관리자에 의해 핵심 정보는 다양하게 설정될 수 있다.
또한, 인공지능 학습 모듈(230)은, 방문자의 음성 신호에 포함된, 방문하고자 하는 곳의 위치 정보 및/또는 연락처 정보를 데이터 수집 모듈(210)로부터 실시간으로 수신하여, 이를 학습 데이터로 이용하여, 핵심정보 추출 모델을 학습 또는 갱신할 수도 있다.
핵심 정보 추출 모듈(240)은, 소정의 데이터를 핵심 정보 추출 모델(240)의 입력 데이터로서 사용하여, 소정의 데이터에 대한 핵심 정보를 추출할 수 있다. 여기서, 소정의 데이터는, 예를 들어, 입력부(100)로 입력된 방문자의 음성 신호일 수 있다. 입력부(100)를 통해 입력된 방문자의 음성 신호는, 데이터 수집 모듈(210)에서 수집되어 핵심 정보 추출 모듈(240)로 전송될 수 있다.
여기서, 핵심 정보는 상술한 바와 같이, 방문자가 방문하고자 하는 곳의 위치 정보(예를 들어, 동/호수 정보) 및 방문자의 연락처 정보 중 적어도 하나를 포함하지만, 이에 한정되는 것은 아니며, 관리자에 의해 다양하게 설정될 수 있다.
인공지능 학습 모듈(230) 및 핵심 정보 추출 모듈(240)은, 소프트웨어 모듈로 구현되거나 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 인공지능 학습 모듈(230) 및 핵심 정보 추출 모듈(240) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예를 들어, CPU) 또는 그래픽 전용 프로세서(예를 들어, GPU)의 일부로 제작되어 각종 전자 장치에 탑재될 수도 있다. 여기서, 인공 지능을 위한 전용 하드웨어 칩은 확률 연산에 특화된 전용 프로세서로서, 기존의 범용 프로세서보다 병렬처리 성능이 높아 기계 학습과 같은 인공 지능 분야의 연산 작업을 빠르게 처리할 수 있다.
한편, 인공지능 학습 모듈(230) 및 핵심 정보 추출 모듈(240)이 소프트웨어 모듈로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다.
인공지능 학습 모듈(230) 및 핵심 정보 추출 모듈(240)은 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 인공지능 학습 모듈(230) 및 핵심 정보 추출 모듈(240) 중 하나는 AI 방문자 관리 장치(1)에 포함되고, 나머지 하나는 외부의 서버에 포함될 수 있다. 또한, 인공지능 학습 모듈(230) 및 핵심 정보 추출 모듈(240)은 유선 또는 무선으로 통하여, 인공지능 학습 모듈(230)이 구축한 모델 정보를 핵심 정보 추출 모듈(240)로 제공할 수도 있다.
도 5는 본 발명의 일 실시예에 따른 인공지능 학습 모듈(230)의 블록도이다.
도면을 참조하면, 인공지능 학습 모듈(230)은 학습 데이터 획득 모듈(232) 및 모델 학습 모듈(236)을 포함하여 구성된다. 또한, 인공지능 학습 모듈(230)은 학습 데이터 전처리 모듈(234)을 선택적으로 더 포함할 수 있다.
학습 데이터 획득 모듈(232)은 입력 데이터로부터 핵심 정보를 추출하기 위한 학습 데이터를 획득한다. 학습 데이터 획득 모듈(232)이 획득하는 학습 데이터는, 예를 들어, 방문 관련 정보가 발음되는 다양한 경우에 대한 시나리오 데이터일 수 있다.
또 다른 예로, 학습 데이터 획득 모듈(232)이 획득하는 학습 데이터는, 데이터 수집 모듈(210)이 수집하는 방문자의 음성 데이터로서, 방문 관련 정보가 포함된 방문자의 음성 데이터일 수 있다.
여기서, 방문 관련 정보라 함은, 특정 주소의 방문지를 방문하는 자의 방문을 허가하기 위해 관리자가 수집해야 하는 정보를 통칭하는 것으로, 예를 들어, 아파트와 같은 공동 주택에서, 방문지 동/호수와 같은 방문하고자 하는 곳의 위치 정보, 방문자의 연락처 정보, 방문 목적 및 방문 소요 시간 중 적어도 하나를 포함할 수 있다. 여기서, 관리 주체라 함은 경비실 또는 아파트 관리 사무소 등일 수 있다.
상술한 학습 데이터는 저장부(400)에 기 저장되어 있을 수도 있고, 통신부(500)가 외부로부터 수신하여 데이터 수집 모듈(210)을 통해 학습 데이터 획득 모듈(232)이 획득할 수도 있다.
모델 학습 모듈(236)은 학습 데이터를 이용하여, 핵심 정보 추출 모듈(240)이 소정의 데이터에서 핵심 정보를 어떻게 추출할지에 대한 판단 기준을 갖도록 학습시킬 수 있다. 예를 들어, 모델 학습 모듈(236)은 단어의 종류, 단어 사이의 공백, 단어의 배치 관계, 단어들과의 관계 등을 참조하여 핵심 정보를 추출하도록 핵심 정보 추출 모듈(240)을 학습시킬 수 있다.
예를 들어, 한 방문자가 아파트 동/호수가 101동 1301호인 가구에 방문하는 경우를 상정해보자. 이 때, 방문 관련 정보가 방문자에 의해 발음되는 다양한 시나리오가 존재할 수 있다.
예를 들어, 방문자는, 아파트 동/호수와 관련하여, '백일동천삼백일호', '백일동 (공백) 천삼백일호', '백일 (공백) 동 (공백) 천삼백일 호', '백일동 (공백) 일삼공일호', '백일동 (공백) 일삼영일호', '백일 (공백) 동 (공백) 일삼공일 (공백) 호', '백일 (공백) 동 (공백) 일삼영일 (공백) 호', '백일 (공백) 다시 (공백) 천삼백일', '백일 (공백) 덩 (공백) 천삼백일 (공백)호', '백일덩 (공백) 천삼백일호', '백일 (공백) 동 (공백) 천삼백일 (공백) 허', '백일동 (공백) 천삼백일허' 등으로 다양하게 발음할 수 있다.
본 발명의 일 실시예에 따르면, 모델 학습 모듈(236)은, 상기와 같이 다양하게 발음 가능한 방문 관련 정보의 시나리오 데이터를 학습 데이터로 이용하여, 핵심 정보 추출 모듈(240)이 소정의 데이터에서 핵심 정보를 어떻게 추출할지에 대한 판단 기준을 갖도록 학습시킬 수 있다.
구체적으로, 모델 학습 모듈(236)은 단어의 종류(예를 들어, 단어가 '일/이/삼/십/백/천' 과 같은 숫자인지, '동/덩/다시/호/허'와 같은 숫자가 아닌 문자인지 등), 어절 단위, 단어 사이의 공백(예를 들어, '백일동' 과 '천삼백일호' 사이의 공백 등), 단어의 배치 관계(예를 들어, 문자'동'앞에 배치되는 단어, 문자 '호'앞에 배치되는 단어 등) 등을 바탕으로 핵심 정보를 추출하도록 핵심 정보 추출 모듈(240)을 학습시킬 수 있다.
예를 들면, 방문자가 방문하고자 하는 아파트 동/호수를, '백일동 (공백) 천삼백일호' 로의 2개 어절로 발음한 경우, 여기서, 모델 학습 모듈(236)은, 핵심 정보 추출 모듈(240)로 하여금, 음성 데이터를 어절 단위로 나누고, 첫번째 어절인 '백일동'에 대해, '숫자(백일)'와 문자(동)'으로 구조화하여 인식하여 숫자 부분을 핵심 정보로서 추출하도록 학습시킬 수 있다. 또한, 모델 학습 모듈(236)은, 핵심 정보 추출 모듈(240)로 하여금, 두번째 어절인 '천삼백일호'에 대해, '숫자(천삼백일)'와 문자(호)'로 구조화하여 인식하여 숫자 부분을 핵심 정보로서 추출하도록 학습시킬 수 있다. 또한, 모델 학습 모듈(236)은, 핵심 정보 추출 모듈(240)로 하여금, '동' 문자를 포함하는 어절에서 추출된 숫자 정보를 동 정보로 지정하고, '호'문자를 포함하는 어절에서 추출된 숫자 정보를 호수 정보로 지정하도록 학습시킬 수 있다.
또 다른 예로, 방문자가 방문 관련 정보로서 방문자 연락처(예를 들어, 010-1234-5678)를 발음하는 경우를 상정해보자. 이 경우에도, 방문자 연락처 정보가 방문자에 의해 발음되는 다양한 시나리오가 존재할 수 있으며, 예를 들어, '공일공에일이삼사에오육칠팔' 또는 '영일영에일이삼사에오육칠팔' 또는 '공일공 (공백) 일이삼사 (공백) 오육칠팔' 또는 '영일영 (공백) 일이삼사 (공백) 오육칠팔' 등으로 다양하게 발음할 수 있다.
여기서, 모델 학습 모듈(236)은, 핵심 정보 추출 모듈(240)로 하여금, 상기 연락처 정보에 대해, '숫자(3자리)+문자(에)+숫자(4자리)+문자(에)+숫자(4자리)'로 구조화하여 인식하여 숫자 부분을 핵심 정보로서 추출하도록 학습시킬 수 있다.
또는, 모델 학습 모듈(236)은, 핵심 정보 추출 모듈(240)로 하여금, 상기 연락처 정보에 대해, '숫자(3자리)+공백+숫자(4자리)+공백+숫자(4자리)'로 구조화하여 인식하여 숫자 부분을 핵심 정보로서 추출하도록 학습시킬 수도 있다.
이러한 모델 학습 모듈(236)은 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습을 통해 핵심 정보 추출 모듈(240)을 학습시킬 수도 있고, 별다른 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 핵심 정보를 추출하기 위한 기준을 발견하는 비지도 학습을 통해 핵심 정보 추출 모듈(240)을 학습시킬 수도 있다.
도 5를 참조하면, 인공지능 학습 모듈(230)은 학습 데이터 전처리 모듈(234)을 선택적으로 더 포함할 수 있다. 학습 데이터 전처리 모듈(234)은 핵심 정보 추출을 위한 학습에 획득된 데이터가 이용될 수 있도록, 학습 데이터 획득 모듈(232)이 획득한 데이터를 전처리할 수 있다.
다음으로, 도 6 은 본 발명의 일 실시예에 따른, 핵심 정보 추출 모듈(240)의 블록도이다.
도면을 참조하면, 핵심 정보 추출 모듈(240)은 핵심 정보 획득 모듈(242) 및 결과 제공 모듈(246)를 포함하여 구성된다. 또한, 핵심 정보 추출 모듈(240)은 데이터 전처리 모듈을 선택적으로 더 포함할 수 있다. 핵심 정보 추출 모듈에 포함되는 데이터 전처리 모듈을, 학습 데이터 전처리 모듈(234)과 구별하기 위하여, '핵심 데이터 전처리 모듈(244)'이라 한다.
핵심 정보 획득 모듈(242)는, 방문자의 음성 데이터를 핵심정보 추출 모델의 입력 데이터로서 사용하여, 그에 대한 핵심 정보를 획득하여 결과 제공 모듈(246)로 전송할 수 있다.
결과 제공 모듈(246)은, 핵심 정보 획득 모듈(242)로부터 수신한 핵심 정보 추출의 정확도를 판단하고, 결과 데이터를 방문자 인증 모듈(260) 또는 정보 수정 모듈(270)로 제공할 수 있다. 예를 들어, 결과 제공 모듈(246)은, 추출된 핵심 정보의 개수와 관리자에 의해 기 설정된 핵심 정보의 개수를 비교하여 핵심 정보 추출의 정확도를 판단할 수 있다. 정확도 판단 결과, 결과 제공 모듈(246)은, '핵심 정보 추출 완료' 메시지를 방문자 인증 모듈(260)로 전송할 수 있다. 또한, 결과 제공 모듈은, '핵심 정보 전부 없음' 또는 '핵심 정보 일부 없음'과 같은 핵심 정보 재수집 요청 메시지를 정보 수정 모듈(270)로 전송할 수 있다.
예를 들어, 관리자에 의해 기 설정된 핵심 정보가 방문지 동 정보, 방문지 호수 정보, 방문자 연락처 정보로 3개라고 가정할 때, 핵심 정보 3가지 중 어느 하나도 핵심 정보로서 추출되지 않은 경우, 결과 제공 모듈(246)은 '핵심 정보 전부 없음'과 같은 핵심 정보 재수집 요청 메시지를 정보 수정 모듈(270)로 전송할 수 있다.
또 다른 예로, 관리자에 의해 기 설정된 3가지 핵심 정보인 방문지 동 정보, 방문지 호수 정보, 방문자 연락처 정보 중 1개만 핵심 정보로서 추출된 경우, 결과 제공 모듈(246)은 '핵심 정보 일부 없음'과 같은 핵심 정보 재수집 요청 메시지를 정보 수정 모듈(270)로 전송할 수 있다. 이 때, 결과 제공 모듈(246)은 재수집 대상 핵심 정보가 무엇인지에 대한 재수집 대상 핵심 정보 데이터를 정보 수정 모듈(270)로 전송할 수 있다.
관리자에 의해 기 설정된 3가지 핵심 정보인 방문지 동 정보, 방문지 호수 정보, 방문자 연락처 정보 중 2개만 핵심 정보로서 추출된 경우에도 마찬가지이다. 결과 제공 모듈(246)은 '핵심 정보 일부 없음'과 같은 핵심 정보 재수집 요청 메시지와 재수집 대상 핵심 정보 데이터를 정보 수정 모듈(270)로 전송할 수 있다.
한편, 관리자에 의해 기 설정된 3가지 핵심 정보가 방문지 동 정보, 방문지 호수 정보, 방문자 연락처 정보이고, 핵심 정보가 전부 추출된 경우에는, 결과 제공 모듈(246)은 '핵심 정보 추출 완료'의 결과 메시지와 해당 핵심 정보를 방문자 인증 모듈(260)로 전송할 수 있다.
한편, 핵심 정보 추출 모듈(240)은 핵심 데이터 전처리 모듈(244)을 선택적으로 더 포함할 수 있다. 핵심 데이터 전처리 모듈(244)은 핵심 정보 추출에 획득된 데이터가 이용될 수 있도록, 핵심 정보 획득 모듈(242)이 획득한 데이터를 전처리할 수 있다.
도면을 참조하면, 제어부(200)는 방문자 인증 모듈(260)을 더 포함할 수 있다. 방문자 인증 모듈(260)은, 핵심 정보 추출 모듈(240)로부터 '핵심 정보 추출 완료' 결과 메시지를 수신하면, 출력부(300)로 하여금, 추출된 핵심 정보를 출력하도록 제어하고, 이에 대한 사용자 확인을 요청할 수 있다.
방문자 인증 모듈(260)의 제어에 따라, 디스플레이부(310)는 상술한 바와 같이, 사용자 음성에 기반하여 핵심 정보로서 추출된 방문자 관련 정보(예를 들어, 101동 1301호 및 010-1234-5678)를 표시할 수 있다.
또한, 일 실시예에 따르면, 디스플레이부(310)가 방문자 관련 정보를 표시하는 동안, 스피커부(320)는 사용자에게 정보 확인 요청 신호를 출력할 수 있다. 이러한 정보 확인 요청 신호는, 예를 들어, '백일동 천삼백일호 방문하시는 방문자님, 방문 내용이 맞나요?'라는 오디오 신호일 수 있다.
입력부(100)를 통해, 정보가 옳다는 사용자 확인이 입력되면, 방문자 인증 모듈(260)은 방문자 인증이 완료된 것으로 판단하여, 통신부(500)를 통해 해당 방문자에 대한 방문 허용 메시지를 외부 장치로 전송할 수 있다. 여기서, 외부 장치라 함은, 아파트 출입구에 설치된 차량 진입 차단기를 포함한다. 차량 진입 차단기는 AI 방문자 관리 장치(1)로부터 특정 방문자에 대한 방문 허용 메시지를 수신한 경우에 열리도록 제어 설정될 수 있다.
한편, 입력부(100)를 통해, 정보가 옳지 않다는 사용자 확인이 입력되면, 방문자 인증 모듈(260)은 핵심 정보 추출 모듈(240)로 핵심 정보 재추출 요청을 전송하고, 이 후 핵심 정보 추출 모듈(240)의 상술한 동작에 따라 핵심 정보를 재추출 할 수 있다.
도면을 참조하면, 제어부(200)는 정보 수정 모듈(270)을 더 포함할 수 있다.
정보 수정 모듈(270)은, 결과 제공 모듈(246)로부터 '핵심 정보 일부 없음'의 결과 메시지를 수신한 경우, 사용자에게 정보의 입력을 요청하여 정보를 수정하는 역할을 한다. 또는, 정보 수정 모듈(270)은, 사용자의 정보 수정 요청을 수신하여, 정보를 수정할 수도 있다. 여기서, 정보 수정 모듈(270)은, 사용자로부터 입력된 정보 수정 요청이, 관리자에 의해 설정된 소정 횟수를 초과하는 경우에는, 더 이상의 정보 수정을 수행하지 않을 수 있다. 이 경우, 정보 수정 모듈(270)은 정보 수정 중지 메시지를 통신부(500)를 통해 외부 장치로 전송할 수 있다. 여기서, 외부 장치라 함은, 관리자 단말기를 포함한다.
상술한 예에서, 정보 수정 모듈(270)이 결과 제공 모듈(246)로부터 '핵심 정보 전부 없음'의 결과 메시지를 수신한 경우, 정보 수정 모듈(270)은, 출력부(300)로 하여금, '정보가 하나도 입력되지 않았습니다. 방문하시는 동과 호수와 귀하의 핸드폰 번호를 다시 알려주세요.' 라는 정보 요청 메시지를 시각적 및/또는 청각적으로 출력하도록 제어할 수 있다.
또한, 정보 수정 모듈(270)이 결과 제공 모듈(246)로부터 '핵심 정보 일부 없음'의 결과 메시지와 누락된 핵심 정보 데이터를 수신한 경우, 정보 수정 모듈(270)은, 출력부(300)로 하여금, 누락된 핵심 정보 데이터의 요청 메시지를 시각적 및/또는 청각적으로 출력하도록 제어할 수 있다. 예를 들어, 핵심 정보가 방문지 동 정보, 방문지 호수 정보, 방문자 연락처 정보 3가지로 설정된 경우에, 방문 동 정보만 추출되었다면, 출력부(300)는, 정보 수정 모듈(270)의 제어에 따라, '방문 동만 입력되었습니다. 방문하시는 호수와 귀하의 핸드폰 번호를 알려주세요'라는 정보 요청 메시지를 출력할 수 있다.
상술한 바와 같이, 본 발명의 다양한 실시예에 따라, 핵심 정보가 발음되는 다양한 경우에 대하여 시나리오 데이터를 학습 데이터로 이용하여 AI 학습시키므로, 핵심 정보 추출의 정확도를 높일 수 있다.
또한, 사용자의 음성으로부터 핵심 정보를 추출하여 시각적으로 표시하면서, 사용자 가이드 라인을 음성으로 제공할 수 있으므로, 방문자 및 방문차량 정보 확인 절차를 기존보다 빠르게, 사용자 친화적으로 수행 가능하며, 사용자 편의를 향상시킬 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CDROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체 (magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드 뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. 소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.
1 : 인공지능 방문자 관리 장치
100: 입력부
200: 제어부
300: 출력부
400: 저장부
500: 통신부
600: 센서부
210: 데이터 수집 모듈
220: STT 변환 모듈
230: 인공지능 학습 모듈
232: 학습 데이터 획득 모듈
234: 학습 데이터 전처리 모듈
236: 모델 학습 모듈
240: 핵심 정보 추출 모듈
242: 핵심 정보 획득 모듈
244: 핵심 데이터 전처리 모듈
246: 결과 제공 모듈
250: TTS 변환 모듈
260: 방문자 인증 모듈
270: 정보 수정 모듈
310: 디스플레이부
320: 스피커부

Claims (10)

  1. 사용자 입력부와 A/V 입력부를 포함하여 구성되며, 외부로부터 데이터를 입력받는 입력부;
    데이터를 시각적으로 출력하는 디스플레이부와 데이터를 청각적으로 출력하는 스피커부를 포함하여 구성되는 출력부; 및
    상기 입력부를 통해 입력된 사용자 음성 신호를 수집하는 데이터 수집 모듈과, 상기 사용자 음성 신호를 텍스트 신호로 변환하는 STT 변환 모듈과, 변환된 텍스트 신호로부터 핵심 정보를 추출하는 기준을 갖는 핵심정보 추출 모델을 생성하는 인공지능 학습 모듈과, 상기 핵심정보 추출 모델을 적용하여 소정 데이터로부터 핵심 정보를 추출하는 핵심 정보 추출 모듈과, 텍스트 신호를 음향 신호로 변환하는 TTS 변환 모듈과, 상기 핵심 정보의 추출 결과에 따라, 상기 출력부로 하여금 추출된 핵심 정보를 출력하도록 하고, 방문자 인증을 수행하는 방문자 인증 모듈과, 상기 핵심 정보의 추출 결과 및 사용자의 정보 수정 요청에 따라, 핵심 정보를 수정하는 정보 수정 모듈을 포함하는, 제어부;
    를 포함하여 구성되며,
    상기 인공지능 학습 모듈은, 입력데이터로부터 핵심 정보를 추출하기 위한 학습 데이터를 획득하는 학습 데이터 획득 모듈과, 획득된 학습 데이터를 이용하여, 상기 핵심 정보 추출 모듈이 상기 소정 데이터로부터 핵심 정보를 추출하는 판단 기준을 갖도록 학습시키는 모델 학습 모듈을 포함하는, 인공지능 방문자 관리 장치.
  2. 제1항에 있어서, 상기 인공지능 학습 모듈은,
    사용자가 방문하고자 하는 곳의 위치 정보와 연락처 정보가 발음되는 다양한 경우에 대한 시나리오 데이터를 학습 데이터로 이용하여, 방문하고자 하는 곳의 동 정보, 호수 정보, 사용자 연락처 정보 중 적어도 하나를 핵심 정보로서 추출하도록 하는 핵심정보 추출 모델을 생성하는, 인공지능 방문자 관리 장치.
  3. 제2항에 있어서, 상기 모델 학습 모듈은,
    상기 사용자의 음성 데이터에서 숫자와 문자를 구조화하여 인식하여 숫자 부분을 상기 핵심 정보로서 추출하도록 상기 핵심 정보 추출 모듈을 학습시키는, 인공지능 방문자 관리 장치.
  4. 제1항에 있어서, 상기 STT 변환 모듈은, HMM, 동적시간왜곡(DTW), 신경망(Neural Net) 중 적어도 하나를 음성인식 알고리즘으로 채택하는, 인공지능 방문자 관리 장치.
  5. 제1항에 있어서, 상기 핵심 정보 추출 모듈은,
    상기 사용자의 음성 데이터를 핵심정보 추출 모델의 입력 데이터로서 사용하여, 핵심 정보를 획득하는 핵심 정보 획득 모듈; 및
    상기 핵심 정보 획득 모듈로부터 수신한 핵심 정보 추출의 정확도를 판단하고, 결과 데이터를 상기 방문자 인증 모듈 또는 상기 정보 수정 모듈로 제공하는, 결과 제공 모듈을 포함하는, 인공지능 방문자 관리 장치.
  6. 제5항에 있어서,
    상기 결과 제공 모듈은, 추출된 핵심 정보의 개수와 관리자에 의해 기 설정된 핵심 정보의 개수를 비교하여 핵심 정보 추출의 정확도를 판단하는, 인공지능 방문자 관리 장치.
  7. 제6항에 있어서, 상기 결과 제공 모듈은,
    상기 핵심 정보 추출의 정확도 판단 결과, 핵심 정보 추출 완료 메시지를 상기 방문자 인증 모듈로 전송하거나, 핵심 정보 재수집 요청 메시지를 상기 정보 수정 모듈로 전송하는, 인공지능 방문자 관리 장치.
  8. 제7항에 있어서, 상기 방문자 인증 모듈이 상기 핵심 정보 추출 완료 메시지를 수신하면, 상기 방문자 인증 모듈은,
    상기 디스플레이부로 하여금, 사용자 음성에 기반하여 핵심 정보로서 추출된 방문자 관련 정보를 디스플레이하도록 하고,
    상기 스피커부로 하여금 상기 사용자에게 정보 확인 요청 신호를 청각적으로 출력하도록 하는, 인공지능 방문자 관리 장치.
  9. 제8항에 있어서, 상기 정보 확인 요청 신호에 대해,
    상기 입력부를 통해, 정보가 옳다는 사용자 확인이 입력되면, 방문자 인증 모듈은 상기 사용자에 대한 방문 허용 메시지를 외부 장치로 전송하는, 인공지능 방문자 관리 장치.
  10. 제7항에 있어서,
    상기 정보 수정 모듈이 상기 핵심 정보 재수집 요청 메시지를 수신하면,
    상기 정보 수정 모듈은, 상기 사용자로부터 입력된 정보를 반영하여 핵심 정보를 수정하며, 상기 사용자로부터 입력된 정보 수정 요청이, 관리자에 의해 설정된 소정 횟수를 초과하는 경우에는, 상기 통신부를 통해, 정보 수정 중지 메시지를 외부 장치로 전송하는, 인공지능 방문자 관리 장치.

KR1020230102975A 2023-08-07 인공지능 방문자 관리 장치 KR102666308B1 (ko)

Publications (1)

Publication Number Publication Date
KR102666308B1 true KR102666308B1 (ko) 2024-05-17

Family

ID=

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101945688B1 (ko) 2018-06-28 2019-02-08 (주)케이제이엔지니어링 구내 통신망을 이용한 아파트 관리 방법
KR102037314B1 (ko) 2019-01-08 2019-11-26 주식회사 베텍스 Ai 음성인식을 이용한 iot 잠금장치
JP2020182033A (ja) 2019-04-23 2020-11-05 アイホン株式会社 インターホンシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101945688B1 (ko) 2018-06-28 2019-02-08 (주)케이제이엔지니어링 구내 통신망을 이용한 아파트 관리 방법
KR102037314B1 (ko) 2019-01-08 2019-11-26 주식회사 베텍스 Ai 음성인식을 이용한 iot 잠금장치
JP2020182033A (ja) 2019-04-23 2020-11-05 アイホン株式会社 インターホンシステム

Similar Documents

Publication Publication Date Title
CN108735209B (zh) 唤醒词绑定方法、智能设备及存储介质
CN108711430B (zh) 语音识别方法、智能设备及存储介质
US20210125605A1 (en) Speech processing method and apparatus therefor
US11386895B2 (en) Speech processing method and apparatus therefor
EP3580753A1 (en) Voice signature for user authentication to electronic device
US11437042B2 (en) Communication robot and method for operating the same
KR20190118996A (ko) 음성 처리 방법 및 음성 처리 장치
US20210082421A1 (en) Method and device for speech processing
EP3654170B1 (en) Electronic apparatus and wifi connecting method thereof
WO2015178070A1 (ja) 情報処理システム、記憶媒体及び情報処理方法
US11514902B2 (en) Speech recognition method and apparatus therefor
CN114333774B (zh) 语音识别方法、装置、计算机设备及存储介质
CN110718217B (zh) 一种控制方法、终端及计算机可读存储介质
KR102376964B1 (ko) 잠금 상태에서의 음성 명령을 기반으로 하는 기능 실행 운용 방법 및 이를 지원하는 전자 장치
Sivakumar et al. Virtual vision architecture for VIP in ubiquitous computing
KR102666308B1 (ko) 인공지능 방문자 관리 장치
KR20190101100A (ko) 음성 입력 처리 방법 및 이를 지원하는 전자 장치
CN111526244A (zh) 一种闹钟处理方法以及电子设备
CN111611812A (zh) 翻译成盲文
CN113261055A (zh) 电子装置及其控制方法
KR102632212B1 (ko) 얼굴 인식을 이용하여 차량 정보를 관리하는 전자 장치 및 그 동작 방법
KR20230023520A (ko) 장거리 모션 제스처 인식장치
US11445120B2 (en) Information processing method for adjustting an image capture region based on spoken utterance and apparatus therefor
US20090125640A1 (en) Ultrasmall portable computer apparatus and computing system using the same
CN111339264A (zh) 智能拐杖的工作方法、装置、设备、存储介质和智能拐杖