KR102046728B1 - 음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스 - Google Patents

음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스 Download PDF

Info

Publication number
KR102046728B1
KR102046728B1 KR1020187000743A KR20187000743A KR102046728B1 KR 102046728 B1 KR102046728 B1 KR 102046728B1 KR 1020187000743 A KR1020187000743 A KR 1020187000743A KR 20187000743 A KR20187000743 A KR 20187000743A KR 102046728 B1 KR102046728 B1 KR 102046728B1
Authority
KR
South Korea
Prior art keywords
time
feature
data
field
identifier
Prior art date
Application number
KR1020187000743A
Other languages
English (en)
Other versions
KR20180016554A (ko
Inventor
페이 왕
하오 쉬
샤오빙 펑
전싱 쉬
궈둥 페이
Original Assignee
텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 filed Critical 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Publication of KR20180016554A publication Critical patent/KR20180016554A/ko
Application granted granted Critical
Publication of KR102046728B1 publication Critical patent/KR102046728B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G10L15/265
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스가 개시되어 있으며, 이 방법은 음성 정보를 수집하고, 시간 정보를 포함하는 음성 정보를 식별하고 텍스트 정보를 취득하는 단계(S10); 텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 식별하고, 매칭 시간 피쳐에 따라 적어도 하나의 프로파일을 검색하여 대응 시간 식별자를 획득하는 단계(S20); 시간 피쳐가 위치되는 프로파일에 대응하는 중간 데이터의 필드에 시간 식별자를 할당하는 단계(S30); 및 중간 데이터의 필드 각각의 내용에 따라 시간 데이터를 획득하는 단계(S40)를 포함한다. 이 방법은 프로그램 코드가 더 양호한 판독성을 가지고, 코드 번잡성이 방지되도록 프로파일에 시간 피쳐를 저장한다. 시간 피쳐 데이터는 프로파일을 수정함으로써 간단히 필요에 따라 수정 또는 추가될 수 있고, 프로그램 코드는 변경 또는 다시 코딩될 필요가 없으며, 그에 의해, 식별 프로그램을 위한 수정 프로세스를 단순화하여 프로그램 코드의 편리한 유지 보수를 가능하게 한다.

Description

음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스
관련 출원
본 출원은 2015 년 7 월 31 일자로 중국 특허청에 출원된 발명의 명칭이 "METHOD AND DEVICE FOR RECOGNIZING TIME INFORMATION FROM SPEECH DATA"인 중국 특허 출원 제201510465853.7호에 대한 우선권을 주장하며, 이 출원은 그 전체가 본 명세서에 참고로 포함된다.
기술 분야
본 출원은 음성 인식 기술 분야에 관한 것으로, 특히 대화 데이터로부터 시간 정보를 인식하는 방법 및 디바이스에 관한 것이다.
음성 인식 기술의 발달과 함께, 음성 인식은 단말 애플리케이션과 결합되어, 예로서 날씨 및 비행 정보를 쿼리하거나, 주변에서 맛있는 음식을 검색하거나, 전화를 걸거나, 리마인더를 설정하거나, 클록을 조정하거나 음악을 연주하는 검색 쿼리 기능 및 동작 기능을 음성 상호작용을 통해 달성한다. 사용자가 단말과 음성 상호 작용을 수행할 때, 음성 명령은 일반적으로 시간 정보, 예로서, 5 월 5 일 오전 10시에 회의가 있음을 상기시키거나, 다음 월요일에 심천에서 베이징까지 항공편을 쿼리하거나, 내일 오전 8시에 알람을 설정하는 시간 정보를 전달한다.
본 출원의 실시예는 대화 데이터로부터 시간 정보를 인식하는 방법 및 디바이스를 개시한다. 음성 명령의 키 인식 단어를 수정하거나 추가하면, 프로그램 코드는 수정되거나 다시 코딩될 필요가 없으므로, 조작성이 강하다.
일부 실시예에서, 대화 데이터로부터 시간 정보를 인식하는 방법은 다음 단계를 포함한다:
대화 데이터를 수집하고, 시간 정보를 포함하는 대화 데이터를 인식하여, 대화 데이터에 대응하는 텍스트 정보를 획득하는 단계;
텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 인식하고, 매칭 시간 피쳐에 따라 적어도 하나의 구성 파일을 검색하여 대응 시간 식별자를 획득하는 단계;
대응하는 시간 식별자를 중간 데이터에 있고 매칭 시간 피쳐가 위치하는 구성 파일에 대응하는 필드에 할당하는 단계- 중간 데이터는 다수의 필드를 포함하며, 각 필드는 구성 파일에 대응함 -; 및
중간 데이터의 각 필드의 내용에 따라, 대화 데이터의 시간 정보에 대응하는 시간 데이터를 획득하는 단계.
일부 실시예에서, 대화 데이터로부터 시간 정보를 인식하는 디바이스는,
대화 데이터를 수집하고, 시간 정보를 포함하는 대화 데이터를 인식하여, 대화 데이터에 대응하는 텍스트 정보를 획득하도록 구성된 음성 수집 모듈;
텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 인식하고, 매칭 시간 피쳐에 따라 적어도 하나의 구성 파일을 검색하여 대응 시간 식별자를 획득하도록 구성된 구성 쿼리 모듈;
대응하는 시간 식별자를 중간 데이터에 있고 매칭 시간 피쳐가 위치하는 구성 파일에 대응하는 필드에 할당하도록 구성된 중간 할당 모듈- 중간 데이터는 다수의 필드를 포함하며, 각 필드는 구성 파일에 대응함 -; 및
중간 데이터의 각 필드의 내용에 따라, 대화 데이터 내의 시간 정보에 대응하는 시간 데이터를 획득하도록 구성된 시간 변환 모듈을 포함한다.
본 출원의 실시예에 따르면, 대화 데이터에서 발생할 수 있는 시간 피쳐는 구성 파일의 대응하는 카테고리에 배치되고 모든 카테고리의 구성 파일은 중간 데이터의 모든 필드와 일대일 대응한다. 대화 데이터에서 시간 정보를 인식할 때, 구성 파일들 중 하나로부터 매칭 시간 피쳐가 검색되고 식별되며, 매칭 시간 피쳐에 대응하는 시간 식별자는 구성 파일로부터 획득된다. 획득된 대응 시간 식별자는 중간 데이터의 대응 필드에 할당되고 이 필드의 내용에 따라 정확한 시간 데이터가 생성된다. 이러한 방식으로 매칭시킬 모든 키 시간 피쳐가 각각의 구성 파일에 배치된다. 인식 프로그램은 구성 파일로부터 시간 피쳐에 대응하는 시간 식별자를 추출하는 것만이 필요하고, 중간 파일을 변환하여 추출 시간 데이터를 획득한다. 따라서, 프로그램 코드는 훨씬 더 읽기 쉽고, 긴 프로그램 코드를 효과적으로 피할 수 있다. 프로그램 코드를 수정하거나 다시 코딩하지 않고 시간 피쳐를 수정하거나 추가할 수 있도록 구성 파일을 수정하는 것만이 필요하다. 이는 인식 프로그램을 수정하는 프로세스를 단순화하고 프로그램 코드의 유지 보수를 용이하게 한다.
도 1은 일부 실시예에 따라 대화 데이터로부터 시간 정보를 인식하는 디바이스가 위치하는 단말의 마스터 다이어그램이다.
도 2는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제1 실시예의 흐름도이다.
도 3은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제2 실시예의 흐름도이다.
도 4는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제3 실시예의 흐름도이다.
도 5는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제4 실시예의 흐름도이다.
도 6은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제5 실시예의 흐름도이다.
도 7은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제6 실시예의 흐름도이다.
도 8은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 디바이스의 제1 실시예의 모듈의 개략도이다.
도 9는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 디바이스의 제2 실시예의 모듈의 개략도이다.
도 10은 일부 실시예에 따른 구성 파일의 제1 실시예의 개략도이다.
도 11은 일부 실시예에 따른 구성 파일의 제2 실시예의 개략도이다.
본 출원의 구현예, 기능적 특징 및 장점은 실시예 및 첨부 도면을 참조하여 더 설명된다.
본 명세서에 설명된 특정 실시예는 이 출원을 설명하기 위한 것일 뿐이며 본 출원을 제한하려는 의도는 아니라는 것을 이해해야 한다.
본 출원의 실시예에서, 음성 명령 내의 시간 정보는 하드 코딩 방식으로 인식된다. 구체적으로, 다양한 키워드가 프로그램 코드로 코딩되고, 음성 명령 내의 키워드는 인식된 후에 대응하는 시간 파라미터로 변환되어 대응하는 시간을 생성한다. 그러나, 하드 코딩 방식은 모든 시간 키워드를 코드에 추가하는 것을 필요로 한다.
도 1을 참조하면, 도 1은 일부 실시예에 따라 대화 데이터로부터 시간 정보를 인식하는 디바이스가 위치하는 단말의 마스터 다이어그램이다. 단말은 이동 전화, 패드 또는 컴퓨터일 수 있고, 적어도 하나의 프로세서(101), 예로서 CPU, 적어도 하나의 네트워크 인터페이스(104), 사용자 인터페이스(103), 메모리(105) 및 적어도 하나의 통신 버스(102)를 포함할 수 있다. 통신 버스(102)는 이들 컴포넌트 사이의 연결 및 통신을 달성하도록 구성된다. 사용자 인터페이스(103)는 디스플레이 및 키보드를 포함할 수 있으며, 표준 유선 인터페이스 및 무선 인터페이스를 더 포함할 수 있다. 네트워크 인터페이스(104)는 표준 유선 인터페이스 및 무선 인터페이스(예로서, WiFi 인터페이스)를 포함할 수 있다. 메모리(105)는 고속 RAM 메모리일 수 있거나, 비-휘발성 메모리, 예로서, 적어도 하나의 자기 디스크 메모리일 수 있다. 메모리(105)는 또한 전술한 프로세서(101)로부터 멀리 떨어져 위치한 적어도 하나의 저장 디바이스일 수 있다. 메모리(105)는 컴퓨터 저장 매체로서, 운영 체제, 네트워크 통신 모듈, 사용자 인터페이스 모듈 및 대화 데이터로부터 시간 정보를 인식하는 프로그램을 포함할 수 있다. 일부 실시예에 따르면, 대화 데이터는 자연적 대화 데이터, 예로서 사람에 의해 표현된 자연 언어의 대화 데이터일 수 있다.
도 1에 도시된, 대화 데이터로부터 시간 정보를 인식하는 디바이스가 위치하는 단말에서, 네트워크 인터페이스(104)는 주로 서버 또는 다른 단말과 데이터 통신을 수행하도록 서버 또는 다른 단말에 접속되도록 구성된다. 또한, 사용자 인터페이스(103)는 주로 사용자 명령을 수신하고 사용자와 상호작용하도록 구성된다. 프로세서(101)는 메모리(105)에 저장되고 대화 데이터로부터 시간 정보를 인식하기 위한 프로그램을 호출하고 다음 단계를 수행하도록 구성될 수 있다:
사용자 인터페이스(103)를 사용하여 대화 데이터를 수집하고, 시간 정보를 포함하는 대화 데이터를 인식하여, 대화 데이터에 대응하는 텍스트 정보를 획득하는 단계;
텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 인식하고, 매칭 시간 피쳐에 따라 적어도 하나의 구성 파일을 검색하여 대응 시간 식별자를 획득하는 단계;
대응하는 시간 식별자를 중간 데이터에 있고 매칭 시간 피쳐가 위치하는 구성 파일에 대응하는 필드에 할당하는 단계- 중간 데이터는 다수의 필드를 포함하며, 각 필드는 각각의 구성 파일에 대응함 -; 및
중간 데이터의 각 필드의 내용에 따라, 대화 데이터의 시간 정보에 대응하는 시간 데이터를 획득하는 단계.
일부 실시예에 따르면, 중간 데이터 내의 필드는 전술한 구성 파일에 대응하는 필드일 수 있다.
일 실시예에서, 프로세서(101)는 메모리(105)에 저장되고 대화 데이터로부터 시간 정보를 인식하기 위한 프로그램을 호출하는 것에 추가로 다음의 동작을 추가로 수행할 수 있다:
사용자 인터페이스(103)를 사용하여 새롭게 기록된 시간 피쳐를 수신하고, 새로운 시간 피쳐에 대응하는 카테고리를 결정하는 동작;
새로운 시간 피쳐를 새로운 시간 피쳐에 대응하는 카테고리의 대응 구성 파일에 추가하는 동작; 및
대응 카테고리의 구성 파일이 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 갖는지 여부를 결정하는 동작;
그러한 경우, 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라, 새로운 시간 피쳐에 대응하는 시간 식별자를 설정하는 동작;
그렇지 않은 경우, 새로운 시간 피쳐에 대한 새로운 시간 식별자를 제공하는 동작.
일 실시예에서, 프로세서(101)는 메모리(105)에 저장되고 대화 데이터로부터 시간 정보를 인식하기 위한 프로그램을 호출하는 것에 추가로 다음의 동작을 추가로 수행할 수 있다:
각 구성 파일 내의 시간 피쳐 테이블에서, 텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 검색하는 동작; 및
매칭 시간 피쳐가 위치하는 구성 파일의 시간 식별자 테이블에서, 매칭 시간 피쳐에 대응하는 시간 식별자를 검색하는 동작.
일 실시예에서, 프로세서(101)는 메모리(105)에 저장되고 대화 데이터로부터 시간 정보를 인식하기 위한 프로그램을 호출하는 것에 추가로 다음의 동작을 추가로 수행할 수 있다:
할당된 중간 데이터에서 오전/오후 필드가 할당되지 않고 날짜 필드가 할당되지 않았거나 현재 시간의 날짜와 동일할 때 현재 시간을 획득하는 동작; 및
할당된 중간 데이터의 시점 필드의 시간 식별자가 현재 시간의 시점 보다 큰지 여부를 결정하는 동작;
그러한 경우, 중간 데이터의 오전/오후 필드를 현재 시간의 시간 기간과 일치하도록 설정하는 동작;
그렇지 않은 경우, 중간 데이터의 오전/오후 필드를 현재 시간의 시간 기간과 상반되도록 설정하는 동작.
일 실시예에서, 프로세서(101)는 메모리(105)에 저장되고 대화 데이터로부터 시간 정보를 인식하기 위한 프로그램을 호출하는 것에 추가로 다음의 동작을 추가로 수행할 수 있다:
할당된 중간 데이터에서 요일 필드가 할당되고 이번 주/다음 주 필드가 할당되지 않은 경우 현재 시간을 획득하는 동작; 및
할당된 중간 데이터에서 요일 필드의 시간 식별자가 현재 시간의 요일 보다 큰지 여부를 결정하는 동작;
그러한 경우, 중간 데이터의 이번 주/다음 주 필드를 이번 주로 설정하는 동작;
그렇지 않은 경우 중간 데이터의 이번 주/다음 주 필드를 다음 주로 설정하는 동작.
일 실시예에서, 프로세서(101)는 메모리(105)에 저장되고 대화 데이터로부터 시간 정보를 인식하기 위한 프로그램을 호출하는 것에 추가로 다음의 동작을 추가로 수행할 수 있다:
매칭 시간 피쳐가 내일을 포함하는 경우 현재 시간을 획득하는 동작; 및
현재 시간이 오전 0시에서부터 오전 x시까지의 범위인 경우- x는 미리설정된 시점임 -, 중간 데이터의 날짜 필드를 현재 시간의 날짜와 동일하게 할당하는 동작.
대화 데이터로부터 시간 정보를 인식하기 위한 디바이스 및 본 실시예의 도 1에서 설명된 디바이스가 위치되는 단말에 따르면, 대화 데이터의 텍스트 정보에서 발생할 수 있는 시간 피쳐는 구성 파일의 대응하는 카테고리에 배치되고, 모든 카테고리의 구성 파일은 중간 데이터의 모든 필드와 일대일 대응한다. 대화 데이터에서 시간 정보를 인식할 때, 매칭 시간 피쳐가 구성 파일로부터 검색되고, 매칭 시간 피쳐에 대응하는 시간 식별자가 획득된다. 대응 시간 식별자는 중간 데이터의 대응 필드에 할당되고 이 필드의 내용에 따라 정확한 시간 데이터가 생성된다. 이러한 방식으로 매칭시킬 모든 키 시간 피쳐가 각각의 구성 파일에 배치된다. 인식 프로그램은 구성 파일로부터 시간 피쳐에 대응하는 시간 식별자를 추출하는 것만이 필요하고, 중간 파일을 변환하여 추출 시간 데이터를 획득한다. 따라서, 프로그램 코드는 훨씬 더 읽기 쉽고, 긴 프로그램 코드를 효과적으로 피할 수 있다. 프로그램 코드를 수정하거나 다시 코딩하지 않고 시간 피쳐를 수정하거나 추가할 수 있도록 구성 파일을 수정하는 것만이 필요하다. 이는 인식 프로그램을 수정하는 프로세스를 단순화하고 프로그램 코드의 유지 보수를 용이하게 한다.
도 2에 도시된 바와 같이, 도 2는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제1 실시예의 흐름도이다. 대화 데이터로부터 시간 정보를 인식하는 방법은 다음 단계를 포함한다:
단계 S10 : 대화 데이터를 수집하고, 대화 데이터를 인식하여 대화 데이터에 대응하는 텍스트 정보를 획득한다.
일부 실시예에 따른 단말 캐리어는 이동 전화, 패드 또는 마이크로폰과 연결된 컴퓨터일 수 있다. 사용자가 단말의 음성 수집 기능을 시작할 때, 단말은 레오마이크로폰 또는 마이크로폰과 같은 음성 수집 디바이스를 사용하여 사용자의 대화 데이터를 수집한다. 일부 실시예에 따라, 시간 정보는 수집된 대화 데이터에 포함되며 시간을 설명하기 위한 음성 포맷으로 코딩된 정보일 수 있다. 이 실시예에서, 대화 데이터의 내용이 인식될뿐만 아니라, 대화 데이터에 대한 동작가능한 제어 명령이 획득되며, 그래서, 단말은 제어 명령에 따라 대응하는 동작을 수행한다. 따라서, 단말 시스템은 공통 음성 인식 프로그램을 포함한다. 음성 인식 프로그램을 통해 대화 데이터에 대응하는 텍스트 정보를 획득하고, 그후, 본 실시예에서 설명한 방식으로 대화 데이터의 내용을 표준 포맷으로 변환하여 동작가능한 제어 명령을 생성한다. 대화 데이터의 내용은 제한되지 않는다. 이 실시예는 대화 데이터의 시간 정보를 일 예로서 인식하는 것을 사용하고, 다른 내용의 인식 및 변환은 또한 이 실시예의 해결책을 사용할 수 있다.
단계 S20: 텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 인식하고, 매칭 시간 피쳐에 따라 적어도 하나의 구성 파일을 검색하여 대응 시간 식별자를 획득한다.
일부 실시예에 따라, 시간 피쳐는 텍스트 정보에 포함되며 시간을 설명하기 위한 텍스트 포맷으로 코딩된 정보일 수 있다. 이 실시예에서, 다수의 구성 파일이 제공되며, 여기서 각각의 구성 파일은 일 카테고리에 대응한다. 예로서, 주 구성 파일은 주의 날과 주의 각 날을 위한 시간 피쳐를 포함하고; 날 구성 파일은 날짜의 시간 피쳐를 포함하며; 달 구성 파일은 달의 시간 피쳐를 포함하고; 시각 구성 파일은 하루 중의 각 시각의 시간 피쳐를 포함한다. 텍스트 정보에서 시간 피쳐를 인식하는 다수의 방식이 존재한다. 이 실시예는 매칭 시간 피쳐를 획득하기 위해 대화 데이터의 텍스트 정보의 내용을 각 구성 파일의 시간 피쳐와 매칭시킨다. 예로서, 대화 데이터의 텍스트 정보는 "5 월 8 일 오후 2시 반에 회의가 있음을 상기시킬 것"이고, 이때, "5 월"의 시간 피쳐는 5월의 달을 위한 달 구성 파일에 매칭되고, "8"의 시간 피쳐는 달의 8일이라는 날짜를 위한 날짜 구성 파일에 매칭되고, "오후"의 시간 피쳐는 하루의 나중 절반으로서 오전/오후 구성 파일에 매칭되고, "2"의 시간 피쳐는 하루 중의 시각의 목록 중 시각 "2"를 위한 시각 구성 파일에 매칭되고, "반(half past)"의 시간 피쳐는 해당 시각을 30분 초과한 분 구성 파일에 매칭된다.
추가로, 시간 피쳐는 절대 시간 피쳐 및 상대 시간 피쳐로 더 분할될 수 있다. 예로서, 10시 반, 달의 10일, 1월 1일, 음력 새해 5일, 금요일, 어버이날, 국경일 및 새해 전야는 현재 시간의 변화에 따라 변하지 않으며, 따라서, 모두 절대 시간 피쳐다. 30분 후, 내년 2월 14일, 다음 달 3일, 다음 수요일, 모래는 모두 기준으로서 현재 시간을 사용할 필요가 있으며, 따라서, 시간 피쳐에 대응하는 특정 시간이 또한 현재 시간이 변화하는 경우 변하기 때문에 상대 시간 피쳐다.
이 카테고리의 다중 시간 피쳐는 구성 파일에 저장되고, 도 10에 도시된 바와 같이, 각 시간 피쳐는 하나의 시간 식별자에 대응한다. 예로서, 달 구성 파일의 "5 월"은 시간 식별자 5에 대응하고 날짜 구성 파일의 "8 일"는 시간 식별자 8에 대응한다. 동일한 의미를 갖는 동일한 구성 파일에서 다수의 상이한 시간 피쳐에 대하여, 대응 시간 식별자도 동일하다. 예로서, 도 10에서, 일요일(표현 1 "Zhouqi"), 일요일(표현 2 "Zhouri"), 일요일(표현 3 "Zhoutian"), 일요일(표현 4 "Xingqiqi"), 일요일(표현 5 "Xingqiri"), 일요일(표현 6 "Xingqitian"), 일요일(표현 7 "Libaiqi"), 일요일(표현 8 "Libairi") 및 일요일(표현 9 "Libaitian")이라 지칭되는 일요일에 대한 9개 중국 표현은 동일한 의미(일요일)를 가지고, 모두 시간 식별자 7(월요일부터 시작하는 주의 7일)에 대응한다. 전술한 실시예에서, 분 구성 파일 "min"의 "반(half past)"과 ":30"의 시간 피쳐는 동일한 의미를 가지며, 대응하는 시간 식별자는 모두 30(정시를 30 분 지난 시간)이다. 일부 실시예에 따라, 시간 식별자는 구성 파일에 포함되면서 시간을 설명하기 위해 텍스트 포맷으로 코딩된 정보일 수 있다. 시간 피쳐 및 시간 식별자는 모두 텍스트 포맷으로 코딩된 정보일 수 있다. 시간 피쳐와 시간 식별자 사이의 차이는 둘이 상이한 방식으로 시간을 설명한다는 것일 수 있다는 것을 위에서 알 수 있다.
단계 S30 : 중간 데이터에 있고 매칭 시간 피쳐가 위치한 구성 파일에 대응하는 필드에 대응하는 시간 식별자를 할당한다.
이 실시예에서, 중간 데이터가 더 제공되고, 중간 데이터는 다수의 필드를 포함하고, 각각의 필드는 하나의 구성 파일에 대응한다. 단말은 텍스트 정보와 매칭 시간 피쳐를 찾은 후, 시간 피쳐에 대응하는 시간 식별자를 매칭 시간 피쳐가 위치하는 구성 파일에 대응하는 필드에 할당한다. 예로서, "5월"의 시간 피쳐가 위치하는 구성 파일은 달 구성 파일, 달이다. 중간 데이터의 대응 필드는 달 필드(month)이며, 달 필드의 변수는 m이고 단위는 "달"이다. 달 필드의 변수에는, "5 월"의 시간 피쳐에 대응하는 시간 식별자 5가 할당되어 있다. 즉, m은 5와 같게 되고 이 필드는 할당된 후 "5 월"이 된다.
단계 S40: 중간 데이터의 각 필드의 내용에 따라, 대화 데이터의 시간 정보에 대응하는 시간 데이터를 획득한다.
대화 데이터의 텍스트 정보 내의 모든 매칭 시간 피쳐에 대응하는 시간 식별자가 중간 데이터의 대응하는 필드에 할당된 후에, 단말은 중간 데이터 내의 할당된 필드에 따라 정확한 시간 데이터를 획득한다. 획득된 시간 데이터는 절대 시간 및 상대 시간을 포함한다. 절대 시간은 특정 시간과 특정 날짜를 포함하며, 또한, 음력 날짜 및 공휴일, 예로서, 음력 5 월 5 일, 중추절, 어버이 날)이 포함된다. 상대 날짜는 현재 시간에 관한 오프셋이다. 예로서, 오늘이 3 월 1 일이고 중간 데이터의 할당된 필드에 따라 획득된 내용이 5 일 후인 경우 현재 날짜에 5 일을 더하여 변환된 정확한 시간은 3 월 6 일이다.
본 실시예에 따르면, 대화 데이터의 텍스트 정보에서 발생할 수 있는 시간 피쳐는 구성 파일의 대응하는 카테고리에 배치되고 모든 카테고리의 구성 파일은 중간 데이터의 모든 필드와 일대일 대응한다. 대화 데이터에서 시간 정보를 인식할 때, 매칭 시간 피쳐가 구성 파일로부터 검색되고, 매칭 시간 피쳐에 대응하는 시간 식별자가 획득된다. 대응 시간 식별자는 중간 데이터의 대응 필드에 할당되고 이 필드의 내용에 따라 정확한 시간 데이터가 생성된다. 이러한 방식으로 매칭시킬 모든 키 시간 피쳐가 각각의 구성 파일에 배치된다. 인식 프로그램은 구성 파일로부터 시간 피쳐에 대응하는 시간 식별자를 추출하는 것만이 필요하고, 중간 파일을 변환하여 추출 시간 데이터를 획득한다. 따라서, 프로그램 코드는 훨씬 더 읽기 쉽고, 긴 프로그램 코드를 효과적으로 피할 수 있다. 프로그램 코드를 수정하거나 다시 코딩하지 않고 시간 피쳐를 수정하거나 추가할 수 있도록 구성 파일을 수정하는 것만이 필요하다. 이는 인식 프로그램을 수정하는 프로세스를 단순화하고 프로그램 코드의 유지 보수를 용이하게 한다.
도 3에 도시된 바와 같이, 도 3은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제2 실시예의 흐름도이다. 대화 데이터로부터 시간 정보를 인식하는 방법에서 구성 파일의 수정은 다음 단계를 포함한다:
단계 S51: 새롭게 기록된 시간 피쳐를 수신하고, 새로운 시간 피쳐에 대응하는 카테고리를 결정한다.
단계 S52: 새로운 시간 피쳐에 대응하는 카테고리의 구성 파일에 새로운 시간 피쳐를 추가한다.
단계 S53: 대응하는 카테고리의 구성 파일이 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 갖는지 여부를 결정하고, 그러한 경우 단계 S54를 수행하고 그렇지 않은 경우 단계 S55를 수행한다.
단계 S54: 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라, 새로운 시간 피쳐에 대응하는 시간 식별자를 제공한다.
단계 S55: 새로운 시간 피쳐에 대한 새로운 시간 식별자를 제공한다.
이 실시예에서, 음성 인식을 위한 새로운 키 시간 피쳐가 수정되거나 추가될 때, 새로운 시간 피쳐를 대응 카테고리의 구성 파일에 추가하고, 새로운 시간 피쳐에 대한 대응하는 시간 식별자를 제공하는 것 만이 필요하다. 구성 파일이 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 포함하는 경우, 새로운 시간 피쳐에 대응하는 시간 식별자는 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라 제공된다. 그렇지 않은 경우, 새로운 시간 식별자는 새로운 시간 피쳐에 대응하는 시간 식별자로서 설정된다. 이 실시예에서, 프로그램 코드를 수정하거나 다시 코딩하지 않고 시간 피쳐 데이터를 수정하거나 추가할 수 있도록 구성 파일을 수정하는 것만이 필요하다. 이는 인식 프로그램을 수정하는 프로세스를 단순화하고 프로그램 코드의 유지 보수를 용이하게 한다.
도 4에 도시된 바와 같이, 도 4는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제3 실시예의 흐름도이다. 이 실시예는 도 2에 도시된 실시예에서의 단계들을 포함하며, 단계 S20은 추가로 다음을 포함한다:
단계 S21: 각 구성 파일 내의 시간 피쳐 테이블에서, 텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 검색한다.
단계 S22: 매칭 시간 피쳐가 위치하는 구성 파일의 시간 식별자 테이블에서, 매칭 시간 피쳐에 대응하는 시간 식별자를 검색한다.
이 실시예의 구성 파일은 2개의 테이블을 포함한다. 도 11에 도시된 바와 같이, 하나는 시간 피쳐 테이블이고, 다른 하나는 시간 식별자 테이블이다. 구성 파일을 정립할 때 구성 파일의 대응 카테고리의 시간 피쳐가 시간 피쳐 테이블에 저장되고 다수의 시간 식별자가 시간 식별자 테이블에 미리설정된다. 맵핑 관계는 시간 피쳐 테이블의 각 시간 피쳐와 시간 식별자 테이블의 시간 식별자 사이에 각각 정립된다. 시간 피쳐의 양은 시간 식별자의 양 보다 작거나 같을 수 있고, 다수의 시간 피쳐는 하나의 시간 식별자에 대응할 수 있다. 시간 피쳐를 추가할 때, 추가된 시간 피쳐는 시간 피쳐 테이블에 위치되고, 시간 피쳐 테이블이 추가된 시간 피쳐의 의미와 동일한 의미를 갖는 원래 시간 피쳐를 갖는지 여부가 검색된다. 시간 피쳐 테이블이 추가된 시간 피쳐의 의미와 동일한 의미를 갖는 원래 시간 피쳐를 갖는 경우, 동일한 의미를 갖는 원래의 시간 피쳐와 매칭 시간 식별자가 시간 식별자 테이블에서 검색되고, 맵핑 관계가 발견된 시간 피쳐와 추가된 시간 피쳐 사이에 정립된다. 시간 피쳐 테이블이 추가된 시간 피쳐의 의미와 동일한 의미를 갖는 원래의 시간 피쳐를 가지지 않으면, 시간 식별자 테이블에 새로운 시간 식별자가 정립되고, 새로운 시간 식별자와 새로운 시간 피쳐 사이에 맵핑 관계가 정립된다. 매칭 시간 피쳐를 검색할 때, 각 구성 파일의 시간 피쳐 테이블에서 텍스트 정보와 매칭 시간 피쳐가 검색되고, 그후, 매칭된 구성 파일의 시간 식별자 테이블에서 매칭 시간 피쳐에 대응하는 시간 식별자가 검색된다.
이 실시예의 구성 파일은 각각 시간 피쳐 및 시간 식별자를 저장하기 위해 시간 피쳐 테이블 및 시간 식별자 테이블을 사용하기 때문에, 매칭 및 검색이 보다 편리하다. 한편, 시간 피쳐 및 시간 식별자의 추가는 각각의 테이블에서 수행되어, 시간 피쳐 테이블 및 시간 식별자 테이블의 확장을 용이하게 한다. 추가적으로, 다수의 시간 피쳐가 하나의 시간 식별자에 대응하는 경우, 도 10에 도시된 실시예에서, 동일한 시간 식별자는 구성 파일에서 다수 회 반복될 필요가 있다. 그러나, 도 11에 도시된 실시예에서, 너무 많은 반복 데이터를 구성 파일에 기입할 필요가 없고, 2개의 테이블 사이의 맵핑 관계 만이 정립될 필요가 있다. 시간 피쳐와 시간 식별자 모두는 구성 파일에서 한 번 발생하므로 구성 파일의 데이터 볼륨이 감소되고 구성 파일이 너무 많은 저장 공간을 점유하는 것을 방지한다.
도 5에 도시된 바와 같이, 도 5는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제4 실시예의 흐름도이다. 이 실시예는 도 2에 도시된 실시예의 단계를 포함하고, 다음 단계는 단계 S40 이전에 추가로 포함된다:
단계 S61: 할당된 중간 데이터에서 오전/오후 필드가 할당되지 않고 날짜 필드가 할당되지 않았거나 현재 시간의 날짜와 동일할 때 현재 시간을 획득한다.
단계 S62: 할당된 중간 데이터의 시점 필드의 시간 식별자가 현재 시간의 시점 보다 큰지 여부를 결정하고, 그러한 경우 단계 S63을 수행하고 그렇지 않은 경우 단계 S64를 수행한다.
단계 S63: 중간 데이터의 오전/오후 필드를 현재 시간의 시간 기간과 일치하도록 설정한다.
단계 S64: 중간 데이터의 오전/오후 필드를 현재 시간의 시간 기간과 상이한 시간 기간으로 설정한다. 예로서, 현재 시간의 시간 기간은 오전이며, 이때 중간 데이터는 오후 필드로 설정된다.
이 실시예에서, 불완전한 정보는 일반적으로 대화 데이터를 수집할 때 발생한다. 예로서, "10시에 회의가 있다는 것을 상기시킬 것"이 오전 10시 또는 오후 10시 중 어느 쪽을 참조하는지 여부가 명확하지 않다. 이 경우, 이 시간은 미래의 시간으로서 우선적으로 인식될 필요가 있다. 이 경우, 대화 데이터의 텍스트 정보의 현재 시간 및 매칭 시간 피쳐의 크기가 비교되어 대화 데이터의 시간 기간이 현재 시간의 시간 기간과 일치하는지 여부를 결정할 수 있다. 예로서, 현재 시간은 오전 9시이다. 대화 데이터의 텍스트 정보가 "10시에 회의가 있는 것을 상기시킬 것"일 때, 매칭 시간 피쳐는 "10시"이고 현재 시간 보다 늦으며, 대화 데이터의 "10시"는 오전 10시인 것이 기본값이고, 알람은 오전 10시로 설정된다. 대화 데이터의 텍스트 정보가 "8시에 회의가 있는 것을 상기시킬 것"일 때, 매칭 시간 피쳐는 "8시"이고 현재 시간 보다 빠르며, 대화 데이터의 "8시"는 오후 8인 것이 기본값이고, 알람은 오후 8시로 설정된다. 이러한 방식으로, 오인으로 유발되는 시간 변환 에러가 회피되어, 대화 데이터의 시간을 인식하는 정확도를 향상시키는 것을 돕는다.
도 6에 도시된 바와 같이, 도 6은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제5 실시예의 흐름도이다. 이 실시예는 도 2에 도시된 실시예의 단계를 포함하고, 다음 단계는 단계 S40 이전에 추가로 포함된다:
단계 S71: 할당된 중간 데이터에서 요일 필드가 할당되고 이번 주/다음 주 필드가 할당되지 않은 경우 현재 시간을 획득한다.
단계 S72: 할당된 중간 데이터의 요일 필드의 시간 식별자가 현재 시간의 요일 보다 큰지 여부를 결정하고, 그러한 경우 단계 S73을 수행하고 그렇지 않은 경우 단계 S74를 수행한다.
단계 S74: 중간 데이터의 이번 주/다음 주 필드를 이번 주로 설정한다.
단계 S73: 중간 데이터의 이번 주/다음 주 필드를 다음 주로 설정한다.
"수요일에 회의가 있는 것을 상기시킬 것"과 같이 이 실시예에서의 불완전한 정보에 관해, 수요일이 이번 주 수요일 또는 다음 수요일 중 어느 쪽을 지칭하는지 여부가 불명확하다. 이 경우, 시간은 미래의 시간으로서 우선적으로 인식될 필요가 있다. 이 경우, 대화 데이터의 텍스트 정보의 현재 시간 및 매칭 시간 피쳐의 크기가 비교되어 대화 데이터의 요일이 현재 시간의 요일과 일치하는지 여부를 결정할 수 있다. 예로서, 현재 시간의 요일은 월요일이다. 대화 데이터의 텍스트 정보가 "수요일에 회의가 있는 것을 상기시킬 것"일 때, 매칭 시간 피쳐는 "수요일"이고 현재 시간 보다 늦으며, 대화 데이터의 "수요일"은 이번주 수요일인 것이 기본값이고, 알람은 이번 주 수요일로 설정된다. 현재 시간의 요일이 금요일인 경우, 매칭 시간 피쳐 "수요일"은 현재 시간 보다 빠르며, 대화 데이터의 "수요일"은 다음 주 수요일인 것이 기본값이고, 알람은 다음 주 수요일로 설정된다. 이러한 방식으로, 오인으로 유발되는 시간 변환 에러가 회피되어, 대화 데이터의 시간을 인식하는 정확도를 향상시키는 것을 돕는다.
도 7에 도시된 바와 같이, 도 7은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 방법의 제6 실시예의 흐름도이다. 이 실시예는 도 2에 도시된 실시예의 단계를 포함하고, 다음 단계는 단계 S40 이전에 추가로 포함된다:
단계 S81: 매칭 시간 피쳐가 내일을 포함하는 경우 현재 시간을 획득한다.
단계 S82: 현재 시간이 오전 0시에서부터 오전 x시까지의 범위인 경우- x는 미리설정된 시점임 -, 중간 데이터의 날짜 필드를 현재 시간의 날짜와 동일하게 할당한다.
이 실시예에서, 대화 데이터를 수집할 때 몇몇 특별한 상황이 발생할 수 있다. 사람들은 일반적으로 새벽 시간 기간은 전날에 속하는 것으로 고려하지만, 실제로 새벽 시간 기간은 다음날에 속한다. 예로서, 현재 시간이 달의 7 일 오전 1 시이면, "내일 오전 10시에 회의가 있다는 것을 상기시킬 것"의 대화 데이터는 7일 오전 10시 또는 8일 오전 10시 중 어느 쪽을 지칭하는지 여부가 불분명하다. 이 경우 사용자는 시간 범위를 미리설정할 수 있으며 시간 범위가 새벽 시간 기간인 것이 기본값이다. 따라서, 새벽 시간 기간 내의 시간은 전날이 속하는 것이 기본값이다. 예로서, 미리설정된 시점은 5시이며 미리설정된 새벽 시간 기간은 오전 0시에서 오전 5시 사이이며 현재 시간은 7일 오전 1시(아침 1시)이다. 이 범위 내에서, "내일 오전 10시 회의를 상기시킬 것"의 대화 데이터는 7일 오전 10시를 가리키며, 알람은 7일 오전 10시로 설정된다. 이러한 방식으로, 오인으로 유발되는 시간 변환 에러가 회피되어, 대화 데이터의 시간을 인식하는 정확도를 향상시키는 것을 돕는다.
도 8에 도시된 바와 같이, 도 8은 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 디바이스의 제1 실시예의 모듈의 개략도이다. 이 실시예에 개시된 대화 데이터로부터 시간 정보를 인식하는 디바이스는:
대화 데이터를 수집하고, 대화 데이터를 인식하여, 대화 데이터에 대응하는 텍스트 정보를 획득하도록 구성된 음성 수집 모듈(110);
텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 인식하고, 매칭 시간 피쳐에 따라 적어도 하나의 구성 파일을 검색하여 대응 시간 식별자를 획득하도록 구성된 구성 쿼리 모듈(120);
중간 데이터에 있고 매칭 시간 피쳐가 위치된 구성 파일에 대응하는 필드에 대응하는 시간 식별자를 할당하도록 구성된 중간 할당 모듈(130); 및
중간 데이터의 각 필드의 내용에 따라, 대화 데이터 내의 시간 정보에 대응하는 시간 데이터를 획득하도록 구성된 시간 변환 모듈(140)을 포함한다.
일부 실시예에 따른 단말 캐리어는 이동 전화, 패드 또는 마이크로폰과 연결된 컴퓨터일 수 있다. 사용자가 단말의 음성 수집 기능을 시작할 때, 단말은 레오마이크로폰 또는 마이크로폰과 같은 음성 수집 디바이스를 사용하여 사용자의 대화 데이터를 수집한다. 이 실시예에서, 대화 데이터의 내용이 인식될뿐만 아니라, 대화 데이터에 대한 동작가능한 제어 명령이 획득되며, 그래서, 단말은 제어 명령에 따라 대응하는 동작을 수행한다. 따라서, 단말 시스템은 공통 음성 인식 프로그램을 포함한다. 음성 인식 프로그램을 통해 대화 데이터에 대응하는 텍스트 정보를 획득하고, 그후, 본 실시예에서 설명한 방식으로 대화 데이터의 내용을 표준 포맷으로 변환하여 동작가능한 제어 명령을 생성한다. 대화 데이터의 내용은 제한되지 않는다. 이 실시예는 대화 데이터의 시간 정보를 일 예로서 인식하는 것을 사용하고, 다른 내용의 인식 및 변환은 또한 이 실시예의 해결책을 사용할 수 있다.
이 실시예에서, 다수의 구성 파일이 제공되며, 여기서 각각의 구성 파일은 일 카테고리에 대응한다. 예로서, 주 구성 파일은 주의 날과 주의 각 날을 위한 시간 피쳐를 포함하고; 날 구성 파일은 날짜의 시간 피쳐를 포함하며; 달 구성 파일은 달의 시간 피쳐를 포함하고; 시각 구성 파일은 시간의 시간 피쳐를 포함한다. 텍스트 정보에서 시간 피쳐를 인식하는 다수의 방식이 존재한다. 이 실시예는 매칭 시간 피쳐를 획득하기 위해 대화 데이터의 텍스트 정보의 내용을 각 구성 파일의 시간 피쳐와 매칭시킨다. 예로서, 대화 데이터의 텍스트 정보는 "5 월 8 일 오후 2시 반에 회의가 있음을 상기시킬 것"이고, 이때, "5 월"의 시간 피쳐는 달 구성 파일, 달에 매칭되고, "8"의 시간 피쳐는 날 구성 파일(day)에 매칭되고, "오후"의 시간 피쳐는 오전/오후 구성 파일, 절반에 매칭되고, "2"의 시간 피쳐는 시각 구성 파일(hour)에 매칭되고, "반"의 시간 피쳐는 분 구성 파일(min)에 매칭된다.
추가로, 시간 피쳐는 절대 시간 피쳐 및 상대 시간 피쳐로 더 분할될 수 있다. 예로서, 10시 반, 달의 10일, 1월 1일, 음력 새해 5일, 금요일, 어버이날, 국경일 및 새해 전야는 현재 시간의 변화에 따라 변하지 않으며, 따라서, 모두 절대 시간 피쳐다. 30분 후, 내년 2월 14일, 다음 달 3일, 다음 수요일, 모래는 모두 기준으로서 현재 시간을 사용할 필요가 있으며, 따라서, 시간 피쳐에 대응하는 특정 시간이 또한 현재 시간이 변화하는 경우 변하기 때문에 상대 시간 피쳐다.
이 카테고리의 다중 시간 피쳐는 구성 파일에 저장되고, 도 10에 도시된 바와 같이, 각 시간 피쳐는 하나의 시간 식별자에 대응한다. 예로서, 달 구성 파일의 "5 월"은 시간 식별자 5에 대응하고 날 구성 파일의 "8 일"는 시간 식별자 8에 대응한다. 동일한 의미를 갖는 다수의 시간 피쳐에 대하여, 대응 시간 식별자도 동일하다. 예로서, 도 10에서, 일요일(표현 1), 일요일(표현 2), 일요일(표현 3), 일요일(표현 4), 일요일(표현 5), 일요일(표현 6), 일요일(표현 7), 일요일(표현 8) 및 일요일(표현 9)이라 지칭되는 일요일에 대한 9개 중국 표현은 동일한 의미를 갖고 모두 시간 식별자 7에 대응한다. 전술한 실시예에서, 분 구성 파일(min)의 "반(half past)"과 ":30"의 시간 피쳐는 동일한 의미를 가지며, 대응하는 시간 식별자는 모두 30이다.
이 실시예에서, 중간 데이터가 더 제공되고, 중간 데이터는 다수의 필드를 포함하고, 각각의 필드는 하나의 구성 파일에 대응한다. 단말은 텍스트 정보와 매칭 시간 피쳐를 찾은 후, 시간 피쳐에 대응하는 시간 식별자를 매칭 시간 피쳐가 위치하는 구성 파일에 대응하는 필드에 할당한다. 예로서, "5월"의 시간 피쳐가 위치하는 구성 파일은 달 구성 파일, 달이다. 중간 데이터의 대응 필드는 달 필드(month)이며, 달 필드의 변수는 m이고 단위는 "달"이다. 달 필드의 변수에는, "5 월"의 시간 피쳐에 대응하는 시간 식별자 5가 할당되어 있다. 즉, m은 5와 같게 되고 이 필드는 할당된 후 "5 월"이 된다.
대화 데이터의 텍스트 정보 내의 모든 매칭 시간 피쳐에 대응하는 시간 식별자가 중간 데이터의 대응하는 필드에 할당된 후에, 단말은 중간 데이터 내의 할당된 필드에 따라 정확한 시간 데이터를 획득한다. 획득된 시간 데이터는 절대 시간 및 상대 시간을 포함한다. 절대 시간은 특정 시간과 특정 날짜를 포함하며, 또한, 음력 날짜 및 공휴일, 예로서, 음력 5 월 5 일, 중추절, 어버이 날)이 포함된다. 상대 날짜는 현재 시간에 관한 오프셋이다. 예로서, 오늘이 3 월 1 일이고 중간 데이터의 할당된 필드에 따라 획득된 내용이 5 일 후인 경우 현재 날짜에 5 일을 더하여 변환된 정확한 시간은 3 월 6 일이다.
본 실시예에 따르면, 대화 데이터의 텍스트 정보에서 발생할 수 있는 시간 피쳐는 구성 파일의 대응하는 카테고리에 배치되고 모든 카테고리의 구성 파일은 중간 데이터의 모든 필드와 일대일 대응한다. 대화 데이터에서 시간 정보를 인식할 때, 매칭 시간 피쳐가 구성 파일로부터 검색되고, 매칭 시간 피쳐에 대응하는 시간 식별자가 획득된다. 대응 시간 식별자는 중간 데이터의 대응 필드에 할당되고 이 필드의 내용에 따라 정확한 시간 데이터가 생성된다. 이러한 방식으로 매칭시킬 모든 키 시간 피쳐가 각각의 구성 파일에 배치된다. 인식 프로그램은 구성 파일로부터 시간 피쳐에 대응하는 시간 식별자를 추출하는 것만이 필요하고, 중간 파일을 변환하여 추출 시간 데이터를 획득한다. 따라서, 프로그램 코드는 훨씬 더 읽기 쉽고, 긴 프로그램 코드를 효과적으로 피할 수 있다. 프로그램 코드를 수정하거나 다시 코딩하지 않고 시간 피쳐 데이터를 수정하거나 추가하도록 구성 파일을 수정하는 것만이 필요하다. 이는 인식 프로그램을 수정하는 프로세스를 단순화하고 프로그램 코드의 유지 보수를 용이하게 한다.
도 9에 도시된 바와 같이, 도 9는 일부 실시예에 따른 대화 데이터로부터 시간 정보를 인식하는 디바이스의 제2 실시예의 모듈의 개략도이다. 이 실시예는 도 8에 도시된 실시예의 모듈을 포함하며, 또한, 구성 수정 모듈(150)을 포함하며, 이는
새롭게 기록된 시간 피쳐를 수신하고, 새로운 시간 피쳐에 대응하는 카테고리를 결정하고;
새로운 시간 피쳐에 대응하는 카테고리의 구성 파일에 새로운 시간 피쳐를 추가하며; 그리고
대응 카테고리의 구성 파일이 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 갖는지 여부를 결정하고;
그러한 경우, 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라, 새로운 시간 피쳐에 대응하는 시간 식별자를 설정하며;
그렇지 않은 경우, 새로운 시간 피쳐에 대한 새로운 시간 식별자를 제공하도록 구성된다.
이 실시예에서, 음성 인식을 위한 새로운 키 시간 피쳐가 수정되거나 추가될 때, 새로운 시간 피쳐를 대응 카테고리의 구성 파일에 추가하고, 새로운 시간 피쳐에 대한 대응하는 시간 식별자를 제공하는 것 만이 필요하다. 구성 파일이 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 포함하는 경우, 새로운 시간 피쳐에 대응하는 시간 식별자는 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라 제공된다. 그렇지 않은 경우, 새로운 시간 식별자는 새로운 시간 피쳐에 대응하는 시간 식별자로서 설정된다. 이 실시예에서, 프로그램 코드를 수정하거나 다시 코딩하지 않고 시간 피쳐 데이터를 수정하거나 추가할 수 있도록 구성 파일을 수정하는 것만이 필요하다. 이는 인식 프로그램을 수정하는 프로세스를 단순화하고 프로그램 코드의 유지 보수를 용이하게 한다.
또한, 구성 쿼리 모듈(120)은:
각 구성 파일 내의 시간 피쳐 테이블에서, 텍스트 정보에 매칭되는 적어도 하나의 시간 피쳐를 검색하고;
매칭 시간 피쳐가 위치하는 구성 파일의 시간 식별자 테이블에서, 매칭 시간 피쳐에 대응하는 시간 식별자를 검색하도록 추가로 구성된다.
이 실시예의 구성 파일은 2개의 테이블을 포함한다. 도 11에 도시된 바와 같이, 하나는 시간 피쳐 테이블이고, 다른 하나는 시간 식별자 테이블이다. 구성 파일을 정립할 때 구성 파일의 대응 카테고리의 시간 피쳐가 시간 피쳐 테이블에 저장되고 다수의 시간 식별자가 시간 식별자 테이블에 미리설정된다. 맵핑 관계는 시간 피쳐 테이블의 각 시간 피쳐와 시간 식별자 테이블의 시간 식별자 사이에 각각 정립된다. 시간 피쳐의 양은 시간 식별자의 양 보다 작거나 같을 수 있고, 다수의 시간 피쳐는 하나의 시간 식별자에 대응할 수 있다. 시간 피쳐를 추가할 때, 추가된 시간 피쳐는 시간 피쳐 테이블에 위치되고, 시간 피쳐 테이블이 추가된 시간 피쳐의 의미와 동일한 의미를 갖는 원래 시간 피쳐를 갖는지 여부가 검색된다. 시간 피쳐 테이블이 추가된 시간 피쳐의 의미와 동일한 의미를 갖는 원래 시간 피쳐를 갖는 경우, 동일한 의미를 갖는 원래의 시간 피쳐와 매칭 시간 식별자가 시간 식별자 테이블에서 검색되고, 맵핑 관계가 발견된 시간 피쳐와 추가된 시간 피쳐 사이에 정립된다. 시간 피쳐 테이블이 추가된 시간 피쳐의 의미와 동일한 의미를 갖는 원래의 시간 피쳐를 가지지 않으면, 시간 식별자 테이블에 새로운 시간 식별자가 정립되고, 새로운 시간 식별자와 새로운 시간 피쳐 사이에 맵핑 관계가 정립된다. 매칭 시간 피쳐를 검색할 때, 각 구성 파일의 시간 피쳐 테이블에서 텍스트 정보와 매칭 시간 피쳐가 검색되고, 그후, 매칭된 구성 파일의 시간 식별자 테이블에서 매칭 시간 피쳐에 대응하는 시간 식별자가 검색된다.
이 실시예의 구성 파일은 각각 시간 피쳐 및 시간 식별자를 저장하기 위해 시간 피쳐 테이블 및 시간 식별자 테이블을 사용하기 때문에, 매칭 및 검색이 보다 편리하다. 한편, 시간 피쳐 및 시간 식별자의 추가는 각각의 테이블에서 수행되어, 시간 피쳐 테이블 및 시간 식별자 테이블의 확장을 용이하게 한다. 추가적으로, 다수의 시간 피쳐가 하나의 시간 식별자에 대응하는 경우, 도 10에 도시된 실시예에서, 동일한 시간 식별자는 구성 파일에서 다수 회 반복될 필요가 있다. 그러나, 도 11에 도시된 실시예에서, 너무 많은 반복 데이터를 구성 파일에 기입할 필요가 없고, 2개의 테이블 사이의 맵핑 관계 만이 정립될 필요가 있다. 시간 피쳐와 시간 식별자 모두는 구성 파일에서 한 번 발생하므로 구성 파일의 데이터 볼륨이 감소되고 구성 파일이 너무 많은 저장 공간을 점유하는 것을 방지한다.
또한, 중간 할당 모듈(130)은:
할당된 중간 데이터에서 오전/오후 필드가 할당되지 않고 날짜 필드가 할당되지 않았거나 현재 시간의 날짜와 동일할 때 현재 시간을 획득하고;
할당된 중간 데이터의 시점 필드의 시간 식별자가 현재 시간의 시점 보다 큰지 여부를 결정하고;
그러한 경우, 중간 데이터의 오전/오후 필드를 현재 시간의 시간 기간과 일치하도록 설정하며;
그렇지 않은 경우, 중간 데이터의 오전/오후 필드를 현재 시간의 시간 기간과 상반되도록 설정하도록 추가로 구성된다.
이 실시예에서, 불완전한 정보는 일반적으로 대화 데이터를 수집할 때 발생한다. 예로서, "10시에 회의가 있다는 것을 상기시킬 것"이 오전 10시 또는 오후 10시 중 어느 쪽을 참조하는지 여부가 명확하지 않다. 이 경우, 이 시간은 미래의 시간으로서 우선적으로 인식될 필요가 있다. 이 경우, 대화 데이터의 텍스트 정보의 현재 시간 및 매칭 시간 피쳐의 크기가 비교되어 대화 데이터의 시간 기간이 현재 시간의 시간 기간과 일치하는지 여부를 결정할 수 있다. 예로서, 현재 시간은 오전 9시이다. 대화 데이터의 텍스트 정보가 "10시에 회의가 있는 것을 상기시킬 것"일 때, 매칭 시간 피쳐는 "10시"이고 현재 시간 보다 늦으며, 대화 데이터의 "10시"는 오전 10시인 것이 기본값이고, 알람은 오전 10시로 설정된다. 대화 데이터의 텍스트 정보가 "8시에 회의가 있는 것을 상기시킬 것"일 때, 매칭 시간 피쳐는 "8시"이고 현재 시간 보다 빠르며, 대화 데이터의 "8시"는 오후 8인 것이 기본값이고, 알람은 오후 8시로 설정된다. 이러한 방식으로, 오인으로 유발되는 시간 변환 에러가 회피되어, 대화 데이터의 시간을 인식하는 정확도를 향상시키는 것을 돕는다.
또한, 중간 할당 모듈(130)은:
할당된 중간 데이터에서 요일 필드가 할당되고 이번 주/다음 주 필드가 할당되지 않은 경우 현재 시간을 획득하고;
할당된 중간 데이터에서 요일 필드의 시간 식별자가 현재 시간의 요일 보다 큰지 여부를 결정하고;
그러한 경우, 중간 데이터의 이번 주/다음 주 필드를 이번 주로 설정하며;
그렇지 않은 경우 중간 데이터의 이번 주/다음 주 필드를 다음 주로 설정하도록 추가로 구성된다.
"수요일에 회의가 있는 것을 상기시킬 것"과 같이 이 실시예에서의 불완전한 정보에 관해, 수요일이 이번주 수요일 또는 다음 수요일 중 어느 쪽을 지칭하는지 여부가 불명확하다. 이 경우, 시간은 미래의 시간으로서 우선적으로 인식될 필요가 있다. 이 경우, 대화 데이터의 텍스트 정보의 현재 시간 및 매칭 시간 피쳐의 크기가 비교되어 대화 데이터의 요일이 현재 시간의 요일과 일치하는지 여부를 결정할 수 있다. 예로서, 현재 시간의 요일은 월요일이다. 대화 데이터의 텍스트 정보가 "수요일에 회의가 있는 것을 상기시킬 것"일 때, 매칭 시간 피쳐는 "수요일"이고 현재 시간 보다 늦으며, 대화 데이터의 "수요일"은 이번주 수요일인 것이 기본값이고, 알람은 이번 주 수요일로 설정된다. 현재 시간의 요일이 금요일인 경우, 매칭 시간 피쳐 "수요일"은 현재 시간 보다 빠르며, 대화 데이터의 "수요일"은 다음 주 수요일인 것이 기본값이고, 알람은 다음 주 수요일로 설정된다. 이러한 방식으로, 오인으로 유발되는 시간 변환 에러가 회피되어, 대화 데이터의 시간을 인식하는 정확도를 향상시키는 것을 돕는다.
또한, 중간 할당 모듈(130)은:
매칭 시간 피쳐가 내일을 포함하는 경우 현재 시간을 획득하고;
현재 시간이 오전 0시에서부터 오전 x시까지의 범위인 경우- x는 미리설정된 시점임 -, 중간 데이터의 날짜 필드를 현재 시간의 날짜와 동일하게 할당하도록 추가로 구성된다.
이 실시예에서, 대화 데이터를 수집할 때 몇몇 특별한 상황이 발생할 수 있다. 사람들은 일반적으로 새벽 시간 기간은 전날에 속하는 것으로 고려하지만, 실제로 새벽 시간 기간은 다음날에 속한다. 예로서, 현재 시간이 달의 7 일 오전 1 시 이면, "내일 오전 10시에 회의가 있다는 것을 상기시킬 것"의 대화 데이터는 7일 오전 10시 또는 8일 오전 10시 중 어느 쪽을 지칭하는지 여부가 불분명하다. 이 경우 사용자는 시간 범위를 미리설정할 수 있으며 시간 범위가 새벽 시간 기간인 것이 기본값이다. 따라서, 새벽 시간 기간 내의 시간은 전날이 속하는 것이 기본값이다. 예로서, 미리설정된 시점은 5시이며 미리설정된 새벽 시간 기간은 오전 0시에서 오전 5시 사이이며 현재 시간은 7일 오전 1시(아침 1시)이다. 이 범위 내에서, "내일 오전 10시 회의를 상기시킬 것"의 대화 데이터는 7일 오전 10시를 가리키며, 알람은 7일 오전 10시로 설정된다. 이러한 방식으로, 오인으로 유발되는 시간 변환 에러가 회피되어, 대화 데이터의 시간을 인식하는 정확도를 향상시키는 것을 돕는다.
본 명세서에서, "포함하다" 또는 그 임의의 변형은 비 배제적 포함을 포괄하도록 의도된다는 것에 유의해야 한다. 따라서, 일련의 요소를 포함하는 프로세스, 방법, 물품 또는 디바이스와 관련하여, 프로세스, 방법, 대상, 물품 또는 디바이스는 이러한 요소를 포함할 뿐만 아니라 명시적으로 표현되지 않은 다른 요소를 포함할 수 있거나 프로세스, 방법, 물품 또는 디바이스의 고유한 요소를 포함할 수 있다. 달리 지정하지 않는한 "일 ...를 포함한다"에 의해 제한되는 요소는 요소가 포함된 프로세스, 방법, 물품 또는 디바이스에 있는 다른 동일한 요소를 배제하지 않는다.
본 출원의 전술한 실시예의 서수는 설명의 편의를 위한 것일 뿐이며, 실시예들 사이의 선호도를 의미하지는 않는다.
실시예의 전술한 설명에 기초하여, 본 기술 분야의 숙련자는 전술한 실시예에서의 방법이 필요한 범용 하드웨어 플랫폼에 추가로 소프트웨어에 의해 또는 하드웨어에 의해서만 구현될 수 있음을 명확히 이해할 수 있다. 대부분의 환경에서, 이전 내용은 예시적 구현예이다. 이러한 이해에 기초하여, 기존 기술에 기여하는 부분 또는 본질적으로 본 출원의 기술적 해결책은 소프트웨어 제품의 형태로 구현될 수 있다. 컴퓨터 소프트웨어 제품은 저장 매체(예컨대, ROM/RAM, 자기 디스크 또는 광 디스크)에 저장되며, 단말 디바이스(이동 전화, 컴퓨터, 서버, 네트워크 디바이스 등일 수 있음)에 본 출원의 실시예들에서 설명된 방법들을 수행할 것을 명령하기 위한 다수의 명령어를 포함한다.
전술한 설명은 본 출원의 단지 바람직한 실시예일 뿐이며, 본 출원의 특허 범위를 제한하려는 것은 아니다. 다른 관련 기술 분야에서의 직접적 또는 간접적 사용을 위한 본 출원의 명세서 및 첨부 도면의 내용에 기초한 구조 또는 프로세스에 대한 임의의 등가의 수정은 역시 본 출원의 특허 보호 범위에 포함된다.

Claims (12)

  1. 대화 데이터로부터 시간 정보를 인식하는 방법으로서,
    대화 데이터를 수집하고, 시간 정보를 포함하는 상기 대화 데이터를 인식하며, 상기 대화 데이터에 대응하는 텍스트 정보를 획득하는 단계;
    상기 텍스트 정보에 매칭되는 적어도 제1 시간 피쳐를 식별하는 단계;
    상기 제1 시간 피쳐에 대응하는 각각의 구성 파일 내에서 상기 제1 시간 피쳐에 대한 대응하는 시간 식별자를 획득하기 위해 검색하는 단계;
    상기 제1 시간 피쳐가 위치하는 상기 각각의 구성 파일에 대응하고 중간 데이터에 있는 필드에 상기 대응하는 시간 식별자를 할당하는 단계- 상기 중간 데이터는 다수의 필드를 포함하며, 각 필드는 복수의 구성 파일 중 각각의 구성 파일에 대응함 -; 및
    상기 중간 데이터의 하나 이상의 필드의 내용에 따라 상기 대화 데이터에 포함된 상기 시간 정보에 대응하는 시간 데이터를 획득하는 단계를 포함하고,
    상기 방법은,
    새롭게 기록된 시간 피쳐를 수신하고, 상기 새로운 시간 피쳐에 대응하는 카테고리를 결정하는 단계;
    상기 새로운 시간 피쳐를 상기 새로운 시간 피쳐에 대응하는 상기 카테고리의 각각의 구성 파일에 추가하는 단계;
    상기 대응 카테고리의 상기 각각의 구성 파일이 상기 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 갖는지 여부를 결정하는 단계;
    그러한 경우, 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라, 상기 새로운 시간 피쳐에 대응하는 시간 식별자를 설정하는 단계; 및
    그렇지 않은 경우, 상기 새로운 시간 피쳐에 대한 새로운 시간 식별자를 제공하는 단계를 추가로 포함하는 대화 데이터로부터 시간 정보를 인식하는 방법.
  2. 제1항에 있어서, 상기 텍스트 정보에 매칭되는 적어도 제1 시간 피쳐를 식별하는 단계 및 상기 제1 시간 피쳐에 대응하는 각각의 구성 파일 내에서 상기 제1 시간 피쳐에 대한 대응하는 시간 식별자를 획득하기 위해 검색하는 단계는
    상기 복수의 구성 파일 중 각 구성 파일 내의 시간 피쳐 테이블에서, 상기 텍스트 정보에 매칭되는 시간 피쳐를 검색하는 단계; 및
    상기 제1 시간 피쳐가 위치하는 상기 각각의 구성 파일의 시간 식별자 테이블에서, 상기 제1 시간 피쳐에 대응하는 상기 시간 식별자를 검색하는 단계를 포함하는 대화 데이터로부터 시간 정보를 인식하는 방법.
  3. 제1항 또는 제2항에 있어서, 상기 중간 데이터의 하나 이상의 필드의 내용에 따라 상기 대화 데이터의 상기 시간 정보에 대응하는 시간 데이터를 획득하는 단계 이전에,
    상기 중간 데이터의 오전/오후 필드가 할당된 값을 갖지 않는다는 결정 및 날짜 필드가 할당된 값을 갖지 않거나 현재 날짜와 동일한 날짜가 할당된다는 결정에 따라 현재 시간을 획득하는 단계; 및
    상기 중간 데이터의 시점 필드의 시간 식별자가 상기 현재 시간의 시점 보다 큰지 여부를 결정하는 단계;
    상기 중간 데이터의 상기 시점 필드의 상기 시간 식별자가 상기 현재 시간의 상기 시점보다 늦다는 결정에 따라, 상기 중간 데이터의 상기 오전/오후 필드를 상기 현재 시간과 일치하는 오전/오후 값이 되도록 설정하는 단계; 및
    상기 중간 데이터의 상기 시점 필드의 상기 시간 식별자가 상기 현재 시간의 상기 시점보다 이르다는 결정에 따라, 상기 중간 데이터의 상기 오전/오후 필드를 상기 현재 시간과 일치하는 오전/오후 값과는 상이한 오전/오후 값이 되도록 설정하는 단계를 추가로 포함하는 대화 데이터로부터 시간 정보를 인식하는 방법.
  4. 제1항 또는 제2항에 있어서, 상기 중간 데이터의 하나 이상의 필드의 내용에 따라 상기 대화 데이터에 포함된 상기 시간 정보에 대응하는 시간 데이터를 획득하는 단계 이전에,
    상기 중간 데이터의 요일 필드가 할당된 값을 갖고 이번 주/다음 주 필드가 할당된 값을 갖지 않는다는 결정에 따라 현재 시간을 획득하는 단계;
    상기 중간 데이터에서 요일 필드의 시간 식별자가 상기 현재 시간의 요일 값 보다 큰지 여부를 결정하는 단계;
    상기 중간 시간 데이터의 상기 요일 필드의 상기 시간 식별자가 상기 현재 시간의 상기 요일 값보다 늦다는 결정에 따라, 상기 중간 데이터의 상기 이번 주/다음 주 필드의 값을 이번 주로 설정하는 단계; 및
    상기 중간 시간 데이터의 상기 요일 필드의 상기 시간 식별자가 상기 현재 시간의 상기 요일 값보다 이르다는 결정에 따라, 상기 중간 데이터의 상기 이번 주/다음 주 필드의 값을 다음 주로 설정하는 단계를 추가로 포함하는 대화 데이터로부터 시간 정보를 인식하는 방법.
  5. 제1항 또는 제2항에 있어서, 상기 중간 데이터의 각 필드의 내용에 따라 상기 대화 데이터의 상기 시간 정보에 대응하는 시간 데이터를 획득하는 단계 이전에,
    상기 제1 시간 피쳐가 내일을 포함하는 경우 현재 시간을 획득하는 단계; 및
    상기 현재 시간이 오전 0시에서부터 오전 x시까지의 범위인 경우- x는 미리설정된 시점임 -, 상기 중간 데이터의 날짜 필드를 상기 현재 시간의 날짜와 동일하게 할당하는 단계를 추가로 포함하는 대화 데이터로부터 시간 정보를 인식하는 방법.
  6. 음성 정보로부터 시간 정보를 인식하는 디바이스로서,
    대화 데이터를 수집하고, 시간 정보를 포함하는 상기 대화 데이터를 인식하며, 상기 대화 데이터에 대응하는 텍스트 정보를 획득하도록 구성된 음성 수집 모듈;
    상기 텍스트 정보에 매칭되는 적어도 제1 시간 피쳐를 식별하고, 상기 제1 시간 피쳐에 대한 대응하는 시간 식별자를 획득하기 위해 상기 제1 시간 피쳐에 대응하는 각각의 구성 파일 내에서 검색하도록 구성되는 구성 쿼리 모듈;
    상기 제1 시간 피쳐가 위치하는 상기 각각의 구성 파일에 대응하고 중간 데이터에 있는 필드에 상기 대응하는 시간 식별자를 할당하도록 구성된 중간 할당 모듈- 상기 중간 데이터는 다수의 필드를 포함하며, 각 필드는 복수의 구성 파일 중 각각의 구성 파일에 대응함 -; 및
    상기 중간 데이터의 하나 이상의 필드의 내용에 따라 상기 대화 데이터에 포함된 상기 시간 정보에 대응하는 시간 데이터를 획득하도록 구성된 시간 변환 모듈을 포함하고,
    상기 디바이스는, 구성 수정 모듈을 추가로 포함하고, 구성 수정 모듈은
    새롭게 기록된 시간 피쳐를 수신하고, 상기 새로운 시간 피쳐에 대응하는 카테고리를 결정하며;
    상기 새로운 시간 피쳐를 상기 새로운 시간 피쳐에 대응하는 상기 카테고리의 각각의 구성 파일에 추가하고;
    상기 대응 카테고리의 상기 각각의 구성 파일이 상기 새로운 시간 피쳐의 의미와 동일한 의미를 갖는 시간 피쳐를 갖는지 여부를 결정하고;
    그러한 경우, 동일한 의미를 갖는 시간 피쳐의 시간 식별자에 따라, 상기 새로운 시간 피쳐에 대응하는 시간 식별자를 설정하며; 및
    그렇지 않은 경우, 상기 새로운 시간 피쳐에 대한 새로운 시간 식별자를 제공하도록 구성되는 음성 정보로부터 시간 정보를 인식하는 디바이스.
  7. 제6항에 있어서, 상기 구성 쿼리 모듈은
    상기 복수의 구성 파일 중 각 구성 파일 내의 시간 피쳐 테이블에서, 상기 텍스트 정보에 매칭되는 시간 피쳐를 검색하고; 및
    상기 제1 시간 피쳐가 위치하는 상기 각각의 구성 파일의 시간 식별자 테이블에서, 상기 제1 시간 피쳐에 대응하는 상기 시간 식별자를 검색하도록 추가로 구성되는 음성 정보로부터 시간 정보를 인식하는 디바이스.
  8. 제6항 또는 제7항에 있어서, 상기 중간 할당 모듈은
    상기 중간 데이터의 오전/오후 필드가 할당된 값을 갖지 않는다는 결정 및 날짜 필드가 할당된 값을 갖지 않거나 현재 날짜와 동일한 날짜가 할당된다는 결정에 따라 현재 시간을 획득하고; 및
    상기 중간 데이터의 시점 필드의 시간 식별자가 상기 현재 시간의 시점 보다 큰지 여부를 결정하고;
    상기 중간 데이터의 상기 시점 필드의 상기 시간 식별자가 상기 현재 시간의 상기 시점보다 늦다는 결정에 따라, 상기 중간 데이터의 상기 오전/오후 필드를 상기 현재 시간과 일치하는 오전/오후 값이 되도록 설정하고; 및
    상기 중간 데이터의 상기 시점 필드의 상기 시간 식별자가 상기 현재 시간의 상기 시점보다 이르다는 결정에 따라, 상기 중간 데이터의 상기 오전/오후 필드를 상기 현재 시간과 일치하는 오전/오후 값과는 상이한 오전/오후 값이 되도록 설정하도록 추가로 구성되는 음성 정보로부터 시간 정보를 인식하는 디바이스.
  9. 제6항 또는 제7항에 있어서, 상기 중간 할당 모듈은
    상기 중간 데이터의 요일 필드가 할당된 값을 갖고 이번 주/다음 주 필드가 할당된 값을 갖지 않는다는 결정에 따라 현재 시간을 획득하고; 및
    상기 중간 데이터에서 상기 요일 필드의 시간 식별자가 상기 현재 시간의 요일 값 보다 큰지 여부를 결정하고;
    상기 중간 시간 데이터의 상기 요일 필드의 상기 시간 식별자가 상기 현재 시간의 상기 요일 값보다 늦다는 결정에 따라, 상기 중간 데이터의 상기 이번 주/다음 주 필드의 값을 이번 주로 설정하고; 및
    상기 중간 시간 데이터의 상기 요일 필드의 상기 시간 식별자가 상기 현재 시간의 상기 요일 값보다 이르다는 결정에 따라, 상기 중간 데이터의 상기 이번 주/다음 주 필드의 값을 다음 주로 설정하도록 추가로 구성되는 음성 정보로부터 시간 정보를 인식하는 디바이스.
  10. 제6항 또는 제7항에 있어서, 상기 중간 할당 모듈은
    상기 제1 시간 피쳐가 내일을 포함하는 경우 현재 시간을 획득하고; 및
    상기 현재 시간이 오전 0시에서부터 오전 x시까지의 범위인 경우- x는 미리설정된 시점임 -, 상기 중간 데이터의 날짜 필드를 상기 현재 시간의 날짜와 동일하게 할당하도록 추가로 구성되는 음성 정보로부터 시간 정보를 인식하는 디바이스.


  11. 삭제
  12. 삭제
KR1020187000743A 2015-07-31 2016-06-17 음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스 KR102046728B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510465853.7A CN106409295B (zh) 2015-07-31 2015-07-31 从自然语音信息中识别时间信息的方法和装置
CN201510465853.7 2015-07-31
PCT/CN2016/086125 WO2017020657A1 (zh) 2015-07-31 2016-06-17 从语音信息中识别时间信息的方法和装置

Publications (2)

Publication Number Publication Date
KR20180016554A KR20180016554A (ko) 2018-02-14
KR102046728B1 true KR102046728B1 (ko) 2019-11-19

Family

ID=57942393

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187000743A KR102046728B1 (ko) 2015-07-31 2016-06-17 음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스

Country Status (6)

Country Link
US (1) US10249302B2 (ko)
EP (1) EP3330962B1 (ko)
JP (1) JP6667931B2 (ko)
KR (1) KR102046728B1 (ko)
CN (1) CN106409295B (ko)
WO (1) WO2017020657A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107179714B (zh) * 2017-05-17 2020-06-05 广东美的制冷设备有限公司 基于设备控制的时段识别方法和装置
CN107423950B (zh) * 2017-07-07 2021-07-23 北京小米移动软件有限公司 闹钟设置方法和装置
WO2019041343A1 (zh) * 2017-09-04 2019-03-07 深圳传音通讯有限公司 一种闹钟设置方法、用户终端以及电子设备
CN107679823A (zh) * 2017-09-06 2018-02-09 珠海市魅族科技有限公司 一种闹钟提醒方法、装置、计算机装置及计算机可读存储介质
CN108597504A (zh) * 2018-04-04 2018-09-28 上海思依暄机器人科技股份有限公司 一种语音解析方法、装置及机器人
CN108965588A (zh) * 2018-06-27 2018-12-07 维沃移动通信有限公司 一种信息提示方法及移动终端
CN109241271B (zh) * 2018-08-30 2021-09-17 天津做票君机器人科技有限公司 一种汇票交易机器人识别自然语言中汇票到期日的方法
US11727245B2 (en) * 2019-01-15 2023-08-15 Fmr Llc Automated masking of confidential information in unstructured computer text using artificial intelligence
CN110047489A (zh) * 2019-04-04 2019-07-23 科讯嘉联信息技术有限公司 一种家电报装场景智能录入报装时间的方法及系统
CN110619873A (zh) 2019-08-16 2019-12-27 北京小米移动软件有限公司 音频处理方法、装置及存储介质
WO2024076139A1 (ko) * 2022-10-06 2024-04-11 삼성전자 주식회사 전자 장치 및 상기 전자 장치에서 사용자의 발화를 처리하는 방법
CN117725908B (zh) * 2024-02-07 2024-05-24 青岛海尔科技有限公司 一种自然语言处理中的时间解析方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002023783A (ja) * 2000-07-13 2002-01-25 Fujitsu Ltd 対話処理システム
JP2002215592A (ja) * 2001-01-19 2002-08-02 Just Syst Corp 日時決定装置、日時決定方法、ならびに、記録媒体

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668797B2 (ja) * 1984-05-15 1994-08-31 オムロン株式会社 電子式キヤツシユレジスタ
US6658455B1 (en) * 1999-12-30 2003-12-02 At&T Corp. Method and system for an enhanced network and customer premise equipment personal directory
US7366979B2 (en) * 2001-03-09 2008-04-29 Copernicus Investments, Llc Method and apparatus for annotating a document
US7246063B2 (en) * 2002-02-15 2007-07-17 Sap Aktiengesellschaft Adapting a user interface for voice control
EP1536638A4 (en) * 2002-06-24 2005-11-09 Matsushita Electric Ind Co Ltd METADATA PRODUCTION DEVICE, CREATION METHOD DAFUR AND TESTING DEVICE
US20040260561A1 (en) * 2003-01-10 2004-12-23 Joseph Enterprises, Inc. Voice-activated programmable remote control
US20090119062A1 (en) * 2007-11-01 2009-05-07 Timetracking Buddy Llc Time Tracking Methods and Systems
CN101246687A (zh) * 2008-03-20 2008-08-20 北京航空航天大学 一种智能语音交互系统及交互方法
JP5353346B2 (ja) * 2009-03-19 2013-11-27 カシオ計算機株式会社 スケジュール管理装置およびスケジュール管理プログラム
US20100318398A1 (en) * 2009-06-15 2010-12-16 Xerox Corporation Natural language interface for collaborative event scheduling
CN101609445A (zh) * 2009-07-16 2009-12-23 复旦大学 基于时间信息的关键子话题提取方法
US8190420B2 (en) * 2009-08-04 2012-05-29 Autonomy Corporation Ltd. Automatic spoken language identification based on phoneme sequence patterns
CN102023995B (zh) * 2009-09-22 2013-01-30 株式会社理光 语音检索设备和语音检索方法
US9922332B2 (en) * 2009-12-09 2018-03-20 Robert Sant'Anselmo Digital signatory and time stamping notary service for documents and objects
US8880406B2 (en) * 2011-03-28 2014-11-04 Epic Systems Corporation Automatic determination of and response to a topic of a conversation
CN102207845A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种日程表语音管理装置及方法
CN102956231B (zh) * 2011-08-23 2014-12-31 上海交通大学 基于半自动校正的语音关键信息记录装置及方法
US8914285B2 (en) * 2012-07-17 2014-12-16 Nice-Systems Ltd Predicting a sales success probability score from a distance vector between speech of a customer and speech of an organization representative
US9172747B2 (en) * 2013-02-25 2015-10-27 Artificial Solutions Iberia SL System and methods for virtual assistant networks
CN104023269A (zh) * 2013-03-01 2014-09-03 联想(北京)有限公司 一种事件提醒方法及电子设备
CA3199033A1 (en) * 2013-04-10 2014-10-16 Ruslan Albertovich SHIGABUTDINOV Systems and methods for processing input streams of calendar applications
CN104123937B (zh) * 2013-04-28 2016-02-24 腾讯科技(深圳)有限公司 提醒设置方法、装置和系统
CN103390229A (zh) * 2013-07-23 2013-11-13 宇龙计算机通信科技(深圳)有限公司 一种日程提醒的方法和装置
CN103886093A (zh) * 2014-04-03 2014-06-25 江苏物联网研究发展中心 电子商务搜索引擎同义词的处理方法
CN104008476A (zh) * 2014-05-09 2014-08-27 北京奇虎科技有限公司 时间类消息的提醒方法及装置
CN104021787A (zh) * 2014-06-13 2014-09-03 中国民航信息网络股份有限公司 基于语音识别的机票搜索系统及方法
US20160070580A1 (en) * 2014-09-09 2016-03-10 Microsoft Technology Licensing, Llc Digital personal assistant remote invocation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002023783A (ja) * 2000-07-13 2002-01-25 Fujitsu Ltd 対話処理システム
JP2002215592A (ja) * 2001-01-19 2002-08-02 Just Syst Corp 日時決定装置、日時決定方法、ならびに、記録媒体

Also Published As

Publication number Publication date
WO2017020657A1 (zh) 2017-02-09
EP3330962A4 (en) 2018-08-08
US10249302B2 (en) 2019-04-02
EP3330962A1 (en) 2018-06-06
JP6667931B2 (ja) 2020-03-18
US20170372702A1 (en) 2017-12-28
KR20180016554A (ko) 2018-02-14
JP2018527611A (ja) 2018-09-20
CN106409295B (zh) 2020-06-16
EP3330962B1 (en) 2021-02-24
CN106409295A (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
KR102046728B1 (ko) 음성 정보로부터 시간 정보를 식별하는 방법 및 디바이스
CN106782526B (zh) 语音控制方法和装置
CN107918666B (zh) 一种区块链上的数据同步方法和系统
CN110223695B (zh) 一种任务创建方法及移动终端
EP3340239A1 (en) Electronic device and speech recognition method therefor
CN105469789A (zh) 一种语音信息的处理方法及终端
KR20130031880A (ko) 이동단말에서 어플리케이션을 자동으로 분류하기 위한 방법 및 장치
CN111078701B (zh) 基于关系型数据库的数据抽取方法及装置
CN109427331B (zh) 语音识别方法及装置
CN107992523B (zh) 移动应用的功能选项查找方法及终端设备
US10068583B2 (en) Systems and methods of interpreting speech data
CN108132768A (zh) 语音输入的处理方法,终端和网络服务器
CN104978045B (zh) 一种汉字输入方法及装置
CN104462030A (zh) 字符转换装置、字符转换方法
CN113051362A (zh) 数据的查询方法、装置和服务器
CN105353957A (zh) 一种信息显示方法及终端
CN107316185B (zh) 一种lims系统中检测流程的建立方法及建立系统
JP5887162B2 (ja) 通信端末、制御方法及びプログラム
CN110765328A (zh) 一种数据处理的方法、装置及存储介质
CN105991400B (zh) 一种群组搜索方法及其设备
CN110865853B (zh) 云服务的智能操作方法和装置以及电子设备
CN106294703A (zh) 一种文件分类方法、装置及终端
CN109558387A (zh) 身份证号的处理方法、装置、存储介质及终端
CN109871463B (zh) 音频处理方法、装置、电子设备及存储介质
CN111401011B (zh) 信息处理方法、装置及电子设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant