KR102320708B1

KR102320708B1 - 영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체

Info

Publication number: KR102320708B1
Application number: KR1020190175879A
Authority: KR
Inventors: 용씨 루오; 샤샤 왕
Original assignee: 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드; 상하이 샤오두 테크놀로지 컴퍼니 리미티드
Priority date: 2019-09-19
Filing date: 2019-12-27
Publication date: 2021-11-03
Also published as: US20210092481A1; CN112533041A; US11178454B2; JP2021047835A; KR20210034452A; EP3796318A1

Abstract

본 출원은 영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체를 개시하는바, 이는 인고 지능과 음성 인식 분야에 관한 것이다. 구체적인 구현 방안은, 목표 동작 모드에서 영상 재생 조작을 검출하고; 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득된 것이고; 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하고; 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다. 당해 방안은 영상 재생 인터페이스에 대한 차폐를 감소시키는 것을 구현할 수 있고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다.

Description

영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체{VIDEO PLAYING METHOD AND DEVICE, ELECTRONIC DEVICE, AND READABLE STORAGE MEDIUM}

본 출원은 음성 인식과 인공 지능 기술 분야에 관한 것이며, 특히 영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체에 관한 것이다.

인공 지능 기술 및 단말 기술이 부단히 발전됨에 따라 인공 지능 제품, 예를 들어 스마트 스피커 등 전자 기기가 부단히 보급되고 있는바, 사용자는 전자 기기를 음성 제어함으로써 상응한 제어 명령을 실행한다. 현재, 사용자가 전자 기기를 사용하여 영상을 관람할 때, 사용자가 전자 기기를 통해 인터랙션 수요를 표현하는 경우, 영상 재생 인터페이스는 음성 수집 아이콘, 사용자에 의해 입력되는 음성에 응답하는 인식 정보, 해석된 중간 상태 인식 정보와 거부된 인식 정보, 제시 정보 등을 디스플레이한다.

이러한 방식에 따르면, 디스플레이하는 요소가 보다 많으므로 영상 재생 인터페이스에 대한 차폐가 보다 크고 사용자가 영상을 관람할 때의 몰입 경험을 심하게 저하시킨다.

본 출원은 관련 기술의 기술 문제 중 하나를 적어도 어느 정도 해결하고자 한다.

본 출원은 영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체를 제공하는바, 영상 재생 인터페이스에 대한 차폐 감소를 구현하여 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다.

본 출원의 제1 측면의 실시예는 영상 재생 방법을 제공하는바, 당해 방법은,

목표 동작 모드에서 영상 재생 조작을 검출하는 단계 - 상기 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 상기 정보 스트림은 상기 오디오 스트림을 음성 인식하여 획득됨 - ; 및

상기 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이함으로써, 상기 영상 재생 인터페이스에서 영상을 재생하는 단계 - 상기 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 상기 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고 상기 제2 요소는 상기 정보 스트림에 따라 디스플레이하기 위한 것임 - ;를 포함한다.

본 출원의 제2 측면의 실시예는 영상 재생 장치를 제공하는바, 당해 장치는,

목표 동작 모드에서 영상 재생 조작을 검출하는 검출 모듈 - 상기 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 상기 정보 스트림은 상기 오디오 스트림을 음성 인식하여 획득됨 - ; 및

상기 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이함으로써 상기 영상 재생 인터페이스에서 영상을 재생하는 디스플레이 모듈 - 상기 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 상기 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 상기 제2 요소는 상기 정보 스트림에 따라 디스플레이하기 위한 것임 - ;을 포함한다.

본 출원의 제3 측면의 실시예는 전자 기기를 제공하는바, 당해 전자 기기는,

적어도 하나의 프로세서; 및

상기 적어도 하나의 프로세서와 통신 가능하게 연결되는 메모리; 를 포함하고,

상기 메모리에는 상기 적어도 하나의 프로세서가 실행 가능한 명령이 저장되어 있고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행됨으로써 상기 적어도 하나의 프로세서가 본 출원의 제1 측면의 실시예에 의해 제공되는 영상 재생 방법을 실행한다.

본 출원의 제4 측면의 실시예는 컴퓨터 명령의 비일시적 컴퓨터 판독 가능 저장 매체를 제공하는바, 상기 컴퓨터 명령은, 상기 컴퓨터가 본 출원의 제1 측면의 실시예에 의해 제공되는 영상 재생 방법을 실행하도록 한다.

상술한 출원의 한 실시예는 다음과 같은 이점 또는 유익한 효과를 가진다.

목표 동작 모드에서 영상 재생 조작을 검출하고; 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득되고; 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하고; 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다. 이로써, 목표 동작 모드에서 전자 기기의 스크린에는 영상 재생 인터페이스를 표시하는 외에 일부 제1 요소와 제2 요소만을 디스플레이하기 때문에, 영상 재생 인터페이스에 대한 차폐를 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다. 또한, 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있고, 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있으므로, 사용자의 사용 경험을 나아가 더 개선할 수 있다.

상술한 선택적인 방식이 가지는 기타의 효과는 아래 구체적인 실시예를 결부하여 설명하고자 한다.

첨부 도면은 본 방안을 더 잘 이해하기 위한 것으로, 본 출원을 한정하지 않으며, 본 출원의 상술한 및/또는 추가적인 측면과 이점은 아래 첨부 도면을 결부한 실시예에 대한 설명에서 더욱 분명해지고 이해하기 수월해질 것이다.
도1은 본 출원의 실시예1에 의해 제공되는 영상 재생 방법의 개략적인 흐름도이다.
도2는 본 출원의 실시예2에 의해 제공되는 영상 재생 방법의 개략적인 흐름도이다.
도3은 본 출원의 실시예3에 의해 제공되는 영상 재생 방법의 개략적인 흐름도이다.
도4는 본 출원의 실시예4에 의해 제공되는 영상 재생 장치의 개략적인 구조도이다.
도5는 본 출원의 실시예5에 의해 제공되는 전자 기기의 개략적인 구조도이다.

아래, 첨부 도면을 결부하여 본 출원의 시범적인 실시예에 대해 설명하고자 하는바, 여기에는 이해를 돕기 위해 본 출원의 실시예의 다양한 디테일이 포함되는데, 이러한 것을 단지 시범적인 것으로 간주하여야 한다. 따라서 당업자라면 여기서 설명하는 실시예에 대한 다양한 변경과 수정은 실행 가능한 것으로, 이는 본 출원의 범위와 사상을 벗어나지 않는 것임을 알 수 가 있다. 마찬가지로, 명백하고 간단명료하게 하고자 아래의 설명에서는 공지된 기능과 구조에 대한 설명을 생략하기로 한다.

아래, 첨부 도면을 참조하여 본 출원의 실시예의 영상 재생 방법, 장치, 전자 기기 및 판독 가능 저장 매체에 대해 설명하고자 한다.

도1은 본 출원의 실시예1에 의해 제공되는 영상 재생 방법의 개략적인 흐름도이다.

본 출원의 실시예는 당해 영상 재생 방법이 영상 재생 장치에 구성되는 경우를 예로 들어 설명하고자 하는바, 당해 영상 재생 장치는 임의의 전자 기기에 응용될 수 있고 따라서 당해 전자 기기는 영상 재생 기능을 구현할 수 있게 된다.

여기서, 전자 기기는 개인용 컴퓨터(Personal Computer, PC로 약칭됨), 클라우드 기기, 모바일 장치, 스마트 스피커 등일 수 있고 모바일 장치는 예를 들어 휴대전화, 태블릿 컴퓨터, 개인용 디지털 보조기, 웨어러블 기기, 차량용 기기 등의 다양한 운영 체제, 터치 스크린 및/또는 표시 스크린를 구비하는 하드웨어 기기일 수 있다.

도1에 도시한 바와 같이, 당해 영상 재생 방법은 다음의 단계를 포함할 수 있다.

단계101: 목표 동작 모드에서 영상 재생 조작을 검출하고, 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득된다.

본 출원의 실시예에서, 목표 동작 모드는 청취 상태를 가지는 동작 모드일 수 있는바, 전자 기기가 당해 청취 상태를 가지는 목표 동작 모드에 있는 경우, 사용자는 웨이크업 워드를 음성 입력할 필요 없이 음성 명령을 실시간으로 입력하여 전자 기기와 인터랙션할 수 있다. 상응하게, 전자 기기는 당해 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 당해 오디오 스트림에 대해 음성 인식하여 정보 스트림을 획득할 수 있다. 따라서, 사용자한테 전자 기기와 실시간으로 인터랙션하거나 또는 연속적으로 인터랙션하는 수요가 있는 경우, 웨이크업 워드를 연속하여 입력할 필요 없이 사용자 조작을 간략화시키고 사용자의 사용 경험을 개선할 수 있다.

본 출원의 실시예에서, 전자 기기가 목표 동작 모드에 있는 경우, 영상 재생 장치는 감청 방식을 통하여 사용자에 의해 영상 재생 조작이 트리거링되었는지 여부를 결정할 수 있는바, 그렇다면, 단계102를 수행하고, 아니라면, 계속하여 오디오을 수집하여 오디오 스트림을 획득한다.

예를 들어 사용자는 전자 기기의 표시 인터페이스의 영상 파일을 클릭함으로써 영상 재생 조작을 트리거링하거나 또는 영상 재생 명령을 음성을 통해 입력할 수 있는바, 예를 들면 사용자가 '나는 영화A를 볼래'라고 음성을 통해 입력하는 경우, 영상 재생 명령은 '영화A를 재생'이고, 상응하게, 영상 재생 장치가 사용자에 의해 입력된 음성을 검출하고 대응되는 영상 재생 명령이 결정되면, 영상 재생 조작이 검출되었다고 결정할 수 있다.

단계102: 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하는바; 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다.

본 출원의 실시예에서, 영상 재생 장치에 의해 영상 재생 조작이 검출되는 경우, 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생할 수 있으며, 영상 재생 인터페이스에서 제1 요소의 일부가 은폐되고, 제2 요소가 디스플레이되는바, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 사용자 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다. 이로써, 목표 동작 모드에서 전자 기기의 스크린에는 영상 재생 인터페이스를 표시하는 외에, 일부 제1 요소와 제2 요소만을 디스플레이하기 때문에, 영상 재생 인터페이스에 대한 차폐를 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다. 또한, 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있고, 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있으므로, 사용자의 사용 경험을 나아가 더 개선할 수 있다.

일 예시로, 전자 기기가 목표 동작 모드에 있을 때 사용자에 의해 전자 기기의 표시 인터페이스의 영상 파일B가 클릭되는 경우, 전자 기기는 사용자가 영상 재생 조작을 트리거링하였다고 결정할 수 있다. 따라서, 당해 영상 파일B를 재생하고 영상 재생 인터페이스를 디스플레이할 수 있다. 영상 재생 인터페이스에서 일부 제1 요소와 제2 요소만을 디스플레이하면, 영상 재생 인터페이스에 대한 차폐를 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킬 수 있다.

다른 예시로, 전자 기기가 목표 동작 모드에 있을 때 사용자가 영상 재생 명령, 예를 들어 '나는 영화A를 볼래'를 음성을 통해 입력하는 경우, 전자 기기는 사용자가 영상 재생 조작을 트리거링하였다고 결정할 수 있다. 따라서, 당해 영화A를 재생하고 영상 재생 인터페이스를 디스플레이할 수 있다. 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있기 때문에 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있다. 예를 들어 당해 영상 재생 인터페이스에서 사용자가 소리 볼륨을 조절하고자 한다면, '더 높게'라고 음성 입력할 수 있고, 또는, 사용자가 날씨를 조회하고자 한다면 '오늘 날씨 어때’라고 음성 입력할 수 있는 등이 있는바, 웨이크업 워드를 입력할 필요 없이 기기와 인터랙션할 수 있다.

본 출원의 실시예의 영상 재생 방법에 따르면, 목표 동작 모드에서 영상 재생 조작을 검출하고; 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득된 것이고; 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하고; 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다. 이로써, 목표 동작 모드에서 전자 기기의 스크린에는 영상 재생 인터페이스를 표시하는 외에 일부 제1 요소와 제2 요소만을 디스플레이하기 때문에, 영상 재생 인터페이스에 대한 차폐를 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다. 또한, 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있고, 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있으므로, 사용자의 사용 경험을 나아가 더 개선할 수 있다.

설명하고자 하는 바는, 전자 기기가 비 목표 동작 모드에 있는 경우, 사용자는 전자 기기를 목표 동작 모드로 전환되도록 음성으로 또는 수동으로 제어할 수 있다. 예를 들어 사용자는 웨이크업 워드를 입력한 후, '목표 동작 모드에 진입’라고 음성을 통해 입력하거나 설정 인터페이스에서 전자 기기의 동작 모드를 목표 동작 모드로 설정할 수 있다. 또는, 전자 기기가 비 목표 동작 모드에 있는 경우, 사용자는 설정 제어 의도를 가지는 목표 조작을 트리거링함으로써 전자 기기를 비 목표 동작 모드에서 목표 동작 모드로 전환할 수 있는바, 본 출원은 이에 대해 한정하지 않는다. 여기서 설정 제어 의도는 전자 기기의 내장 프로그램에 의해 미리 설정될 수도 있고 당해 방법의 유연성 및 적용성을 향상시키기 위해 사용자에 의해 설정될 수도 있는 것으로, 이에 대해 한정하지 않는다. 예를 들어 당해 설정 제어 의도는 오디오 재생 또는 영상 재생, 날씨 조회 등일 수 있다.

한 가능한 구현 방식으로, 전자 기기가 비 목표 동작 모드에 있는 경우, 웨이크업 워드가 획득되면, 웨이크업 워드 이후의 오디오 클립을 수집하고 오디오 클립의 의도를 획득하며, 오디오 클립의 의도가 설정 제어 의도를 가지면 설정 제어 의도를 가지는 목표 조작이 검출되었다고 결정하는바, 이때, 목표 조작에 대응되는 제어 명령을 수행하고 전자 기기의 동작 모드를 비 목표 동작 모드로부터 목표 동작 모드로 전환할 수 있다.

구체적으로, 전자 기기가 비 목표 동작 모드에 있는 경우, 전자 기기는 사용자에 의해 웨이크업 워드가 입력되었는지 여부를 검출할 수 있는바, 그렇다면, 사용자에 의해 웨이크업 워드 이후에 입력되는 오디오 클립을 수집하고, 음성 인식 기술에 기반하여 당해 오디오 클립을 인식하여 당해 오디오 클립에 대응되는 텍스트 정보를 결정할 수 있다. 이 후, 상기 텍스트 정보를 의미 인식하여 대응되는 의도를 결정할 수 있다. 예를 들어 오디오 클립이 ’나 노래 듣고 싶어’라면 당해 오디오 클립의 의도는 '노래 청취' 또는 '오디오 재생'이다. 오디오 클립의 의도가 설정 제어 의도에 매칭되는 경우, 목표 조작이 검출되었다고 결정할 수 있고, 오디오 클립의 의도가 설정 제어 의도에 매칭되지 않는 경우, 목표 조작이 검출되지 않았다고 결정할 수 있다.

일 예시로, 전자 기기가 스마트 스피커이고 오디오 또는 영상을 재생하는 설정 제어 의도를 가지는 경우를 예시로 하면, 사용자가 '샤오두 샤오두(小度小度), 나 노래 듣고 싶어’라고 음성을 통해 입력하면 스마트 스피커는 사용자에 의해 입력된 오디오 데이터를 수집하여 인식한 후, 오디오 클립인 '나 노래 듣고 싶어'에 대응되는 의도는 '오디오 재생'이라고 결정할 수 있는바, 이때, 오디오 클립의 의도가 설정 제어 의도에 매칭된다고 결정할 수 있다. 따라서, 노래를 재생하고 전자 기기의 동작 모드를 비 청취 상태를 가지는 동작 모드에서 청취 상태를 가지는 동작 모드로 전환함으로써, 사용자가 스마트 스피커와 연속적인 대화, 예를 들어 '다음 곡 재생', '재생에서 탈출' 등을 진행할 수 있도록 할 수 있는바, 이는 인간-기계 간 통신(human-machine conversation)이 더욱 자연스럽고 진실되게 하므로 사용자의 몰입 경험이 향상된다.

다른 예시로, 전자 기기가 스마트 스피커이고 다음 곡을 재생하는 설정 제어 의도를 가지는 경우를 예시로 하면, 사용자가 노래를 들을 때, '샤오두 샤오두(小度小度), 다음 곡을 재생해’라고 음성을 통해 입력하면, 스마트 스피커는 오디오 클립의 의도가 설정 제어 의도에 매칭된다고 결정할 수 있다. 따라서, 다음 곡을 재생하고 전자 기기의 동작 모드를 비 청취 상태를 가지는 동작 모드에서 청취 상태를 가지는 동작 모드로 전환함으로써, 사용자가 스마트 스피커와 연속적으로 대화할 수 있도록 할 수 있다.

이로써, 사용자한테 전자 기기와 실시간으로 인터랙션하거나 또는 연속적으로 인터랙션하는 수요가 있는 경우, 웨이크업 워드를 연속하여 입력할 필요 없이 음성 입력되는 오디오 데이터가 설정 제어 의도를 충족시키는 것을 확보하기만 하면, 전자 기기와의 실시간 인터랙션을 구현할 수 있으므로, 사용자 조작을 간략화시키고 사용자의 사용 경험을 개선할 수 있다.

다른 가능한 구현 방식으로, 전자 기기가 비 목표 동작 모드에 있는 경우, 터치에 의한 제어 조작이 검출되고 터치에 의한 제어 조작이 오디오 또는 영상을 개시하는 조작이라면, 터치에 의한 제어 조작을 설정 제어 의도를 가지는 목표 조작이라고 결정한다. 여기서 터치에 의한 제어 조작은 클릭 조작, 선택 조작, 입력 조작 등일 수 있다.

본 출원의 실시예에서, 전자 기기가 비 목표 동작 모드에 있는 경우, 터치에 의한 제어 조작이 오디오 또는 영상을 개시하는 조작이라면, 예를 들어 사용자가 전자 기기의 표시 인터페이스의 오디오 또는 영상을 클릭할 때, 터치에 의한 제어 조작이 설정 제어 의도를 가지는 목표 조작이라고 결정할 수 있고, 즉 설정 제어 의도는 오디오 재생 또는 영상 재생이다. 터치에 의한 제어 조작이 오디오 또는 영상을 개시하는 조작이 아니라면, 예를 들어 사용자가 메세지를 편집하거나 상태를 업데이트하거나 정보를 수정하거나 등을 할 때, 터치에 의한 제어 조작이 설정 제어 의도를 가지지 않는 목표 조작이라고 결정할 수 있다. 다시 말해, 본 출원에서, 터치에 의한 제어 조작이 대응되는 설정 제어 의도를 가질 때만이 당해 터치에 의한 제어 조작이 목표 조작이라고 결정하는바, 이때, 사용자한테 실시간으로 인터랙션하거나 또는 연속적으로 인터랙션하는 수요가 있다고 간주할 수 있으며, 따라서 후속의 단계를 수행할 수 있다. 터치에 의한 제어 조작이 대응되는 설정 제어 의도를 가지지 않은 경우, 당해 터치에 의한 제어 조작은 목표 조작이 아니라고 결정할 수 있는바, 이때, 사용자가 실시간으로 인터랙션하거나 또는 연속적으로 인터랙션하는 수요를 가지지 않는다고 간주할 수 있으며, 따라서, 전자 기기를 당해 비 목표 동작 모드에 유지시킬 수 있다.

한 응용 시나리오로, 전자 기기가 스마트 스피커인 경우, 사용자에 의해 표시 인터페이스의 어느 한 영상 파일이 클릭될 경우, 사용자에 의해 트리거링되는 터치에 의한 제어 조작이 제어 의도를 가지는 목표 조작이라고 결정할 수 있으며, 따라서 당해 영상 파일을 재생하고 전자 기기의 동작 모드를 비 청취 상태를 가지는 동작 모드에서 청취 상태를 가지는 동작 모드로 전환함으로써, 사용자가 스마트 스피커와 연속적으로 대화할 수 있도록 할 수 있다.

이로써, 사용자한테 전자 기기와 실시간으로 인터랙션하거나 또는 연속적으로 인터랙션하는 수요가 있는 경우, 웨이크업 워드를 연속하여 입력할 필요 없이 오디오 또는 영상을 개시하는 조작을 트리거링하기만 하면, 전자 기기와의 연속적인 인터랙션을 구현할 수 있으므로, 사용자 조작을 간략화시키고 사용자의 사용 경험을 개선할 수 있다.

설명하고자 하는 바는, 사용자가 영상을 재생할 때, 사용자가 말을 하지 않았거나 당해 사용자가 기타의 사용자와 채팅하는 상황이 발생할 수 있는데, 이때 수집된 영상 스트림을 인식하여 정보 스트림을 획득하고, 당해 정보 스트림을 영상 재생 인터페이스에 실시간으로 디스플레이한다면, 사용자의 관람 경험을 심하게 저하시킨다. 그러므로 본 출원의 실시예의 한 가능한 구현 방식으로, 영상 재생 인터페이스에 대한 차폐를 나아가 더 감소시키고, 영상에 대한 사용자의 몰입 관람 경험을 향상시키기 위하여, 본 출원에서는 영상 재생 인터페이스에서 유효한 정보 스트림만을 디스플레이하고 무효한 정보 스트림은 차폐할 수 있다. 아래, 실시예1을 결부하여 상술한 과정에 대해 상세히 설명하고자 한다.

도2는 본 출원의 실시예2에 의해 제공되는 영상 재생 방법의 개략적인 흐름도이다.

도2에 도시한 바와 같이, 도1에 도시한 실시예에 기초하여 영상 재생 인터페이스를 디스플레이하는 단계는 구체적으로 다음과 같은 단계를 포함할 수 있다.

단계201: 정보 스트림으로부터 제어 의도를 가지는 목표 정보를 선별한다.

본 출원의 실시예에서, 정보 스트림을 의미 인식함으로써 당해 정보 스트림이 제어 의도를 가지는지 여부를 결정할 수 있는바, 그렇다면, 정보 스트림으로부터 대응되는 제어 의도를 가지는 목표 정보를 선별하고, 아니라면, 당해 정보 스트림을 차폐할 수 있다.

예를 들어 정보 스트림이 빈 것이고 대응되는 텍스트 정보가 없는 경우, 이는 사용자가 말을 하지 않았거나 또는 당해 정보 스트림의 의미상의 불연속으로 인해 대응되는 제어 의도가 식별 불가능하거나 또는 당해 정보 스트림이 의미상으로 연속되는 것일 지라도 당해 정보 스트림이 대응되는 제어 의도를 가지지 않는 경우인바, 예를 들어 당해 정보 스트림이 '샤오밍(小明), 오후 몇 시에 미팅이지?'-인 경우, 이때 당해 정보 스트림은 사용자가 기타의 사용자와 채팅하는 경우에 대응되는 텍스트 정보이지 대응되는 제어 의도를 가지는 것이 아님을 알 수 있다. 따라서 상술한 정보 스트림을 차폐할 수 있고, 즉, 영상 재생 인터페이스에서 제2 요소를 디스플레이하지 않을 수 있는데, 이는 인터페이스 자원에 대한 점유를 감소시킬 수 있다.

단계202: 선별을 통해 목표 정보가 획득될 경우, 목표 정보에 따라 제2 요소를 생성한다.

단계203: 영상 재생 인터페이스 내에서 제2 요소를 디스플레이한다.

본 출원의 실시예에서, 선별을 통해 목표 정보가 획득될 경우, 당해 목표 정보에 따라 제2 요소를 생성하고, 영상 재생 인터페이스 내에서 제2 요소를 디스플레이할 수 있다. 예를 들면, 정보 스트림이 '이 노래는 아니야, 다음 곡으로'이면, 제어 의도는 '다음 곡 재생'이고, 따라서 목표 정보는 '다음 곡'일 수 있고, 이때 영상 재생 인터페이스 내에서만 '다음 곡' 세 글자를 디스플레이함으로써 영상 재생 인터페이스에 대한 차폐를 감소시킬 수 있고, 동시에, 목표 정보에 대응되는 제어 명령을 실행할 수 있는바, 즉, 다음 곡 노래를 재생하여 사용자의 실제 제어 요구를 충족시킨다.

본 출원의 실시예의 영상 재생 방법에 따르면, 정보 스트림으로부터 제어 의도를 가지는 목표 정보를 선별하고; 선별을 통해 목표 정보가 획득될 경우, 목표 정보에 따라 제2 요소를 생성하고; 영상 재생 인터페이스 내에서 제2 요소를 디스플레이한다. 이로써, 영상 재생 인터페이스에 대한 차폐를 나아가 더 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다.

설명하고자 하는 바는, 현재, 오디오 스트림을 인식하여 정보 스트림이 획득될 경우, 영상 재생 인터페이스에는 중간 상태의 인식 정보, 거부된 인식 정보 또는 무효한 인식 정보가 표시되는데, 따라서 영상 재생 인터페이스에 대한 차폐가 증가된다.

그러나 본 출원의 실시예의 영상 재생 방법에 따르면, 영상 재생 인터페이스에는 제어 의도를 가지는 목표 정보에 따라 생성된 제2 요소만을 디스플레이하므로, 영상 재생 인터페이스에 대한 차폐를 감소시킬 수 있다. 또한, 목표 정보에 대해 인식할 때에는, 오디오 스트림에서 완전한 문장을 가지는 오디오에 따라 인식하여 획득된 것이므로, 일 측면으로는 컴퓨팅 자원에 대한 점유를 감소시킬 수 있고, 다른 측면으로는 의도 인식의 정확성을 향상시킬 수 있다. 아래, 실시예3을 결부하여 상술한 과정에 대해 상세히 설명하고자 한다.

도3은 본 출원의 실시예3에 의해 제공되는 영상 재생 방법의 개략적인 흐름도이다.

도3에 도시한 바와 같이, 도2에 도시한 실시예에 기초하여 단계201은 구체적으로 다음과 같은 단계를 포함할 수 있다.

단계301: 정보 스트림으로부터 중간 상태의 인식 정보가 획득될 경우, 일정한 시간을 대기함으로써 정보 스트림으로부터 최종 상태의 인식 정보를 획득하고, 중간 상태의 인식 정보는 불완전한 문장의 오디오를 음성 인식하여 획득된 것이고, 최종 상태의 인식 정보는 완전한 문장의 오디오를 음성 인식하여 획득된 것이다.

본 출원의 실시예에서, 당해 정보 스트림을 의미 인식하여 당해 정보 스트림에 중간 상태의 인식 정보가 있는지 여부를 판단할 수 있다. 여기서 중간 상태의 인식 정보는 불완전한 문장의 오디오를 음성 인식하여 획득되는 것인바, 즉, 중간 상태의 인식 정보는 의미상 불연속적인 것이며, 이때, 일정한 시간을 대기함으로써 정보 스트림으로부터 최종 상태의 인식 정보를 획득할 수 있다. 여기서, 최종 상태의 인식 정보는 완전한 문장의 오디오를 음성 인식하여 획득되는 것이고, 즉 최종 상태의 인식 정보는 의미상 연속적인 것이다.

단계302: 최종 상태의 인식 정보를 의도 인식한다.

단계303: 인식된 의도가 제어 의도에 매칭된다면, 최종 상태의 인식 정보를 목표 정보로 한다.

본 출원의 실시예에서, 제어 의도는 전자 기기에 의해 실행 가능한 제어 의도일 수 있고, 당해 전자 기기에는 제어 의도 데이터베이스가 내장될 수 있는바, 당해 제어 의도 데이터베이스에는 전자 기기에 의해 실행 가능한 각 제어 의도가 저장되어 있다. 여기서, 당해 방법의 유연성 및 적용성을 향상시키기 위해, 당해 제어 의도 데이터베이스에 대해 동적인 유지관리와 보충을 수행할 수도 있는바, 예를 들어 사용자는 자체 수요에 따라 대응되는 제어 의도를 추가하거나 삭제할 수 있으며, 본 출원은 이에 대해 한정하지 않는다.

본 출원의 실시예에서, 최종 상태의 인식 정보의 의도가 전자 기기에 의해 실행 가능한 제어 의도에 매칭되는 경우, 최종 상태의 인식 정보를 목표 정보로 할 수 있다. 따라서, 최종 상태의 인식 정보에만 따라 의도 인식을 수행하면, 컴퓨팅 자원에 대한 점유를 감소시킬 수 있고 또한 의도 인식의 정확성을 향상시킬 수도 있다.

한 가능한 구현 방식으로, 재생 조작이 인식되는 것에 응답하여 영상 재생 인터페이스를 디스플레이하는 경우, 제1 요소가 영상 재생 인터페이스에서 디스플레이되는 위치를 설정함으로써 일부를 은폐할 수 있는바, 예를 들어 제1 요소가 영상 재생 인터페이스에서 디스플레이되는 위치를 인터페이스에서의 비 하이라이트 표시 위치로 설정함으로써 사용자에 대한 방해를 회피할 수 있고, 예를 들면 당해 디스플레이되는 위치는 인터페이스에서 왼쪽아래 코너 또는 오른쪽아래 코너 등일 수 있다. 이 후, 상술한 디스플레이되는 위치에 따라 영상 재생 인터페이스에서 제1 요소를 디스플레이할 수 있다. 이에 따라 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면, 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있고 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있는바, 이는 사용자의 사용 경험을 나아가 더 개선할 수 있다.

한 가능한 구현 방식으로, 제1 요소는 본체 영역 및 본체 영역을 에워싸는 헤일로(halo) 영역을 가질 수 있고, 영상 재생 인터페이스에서 본체 영역 및 일부 헤일로 영역이 은폐될 수 있다. 따라서, 영상 재생 인터페이스에서 일부 헤일로 영역만을 디스플레이하기 때문에, 일 측면으로는 인터페이스 자원에 대한 점유를 감소시킬 수 있고 다른 측면으로는 사용자가 영상 재생 인터페이스에서 당해 일부 헤일로 영역, 예를 들어 컬러 헤일로 영역을 볼 수 있는바, 당해의 눈에 잘 띄는 컬러 헤일로 영역을 통해 전자 기기가 청취 중이라는 것을 분명히 할 수 있고, 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것이 인지될 수 있으며 이는 사용자의 사용 경험을 나아가 더 개선할 수 있다.

다시 말해, 목표 동작 모드에서는 영상 재생 인터페이스에서 일부 헤일로 영역만을 디스플레이함으로써, 영상 재생 인터페이스에 대한 점유를 감소시키고, 비 목표 동작 모드에서는 본체 영역을 디스플레이하거나 또는 본체 영역과 헤일로 영역을 디스플레이함으로써, 당해 제1 요소를 완전하게 디스플레이할 수 있다. 따라서 사용자가 당해 제1 요소를 관람하기 편리하게 되고, 당해 제1 요소를 통해 전자 기기가 청취 중이라는 것을 인지하기 편리하게 된다.

한 가능한 구현 방식으로, 영상 재생 인터페이스에 대한 차폐를 나아가 더 감소시키기 위하여, 본 출원에서, 영상 재생 조작에 응답할 때, 영상 재생 인터페이스에서 가이드 워드를 디스플레이하기 위한 요소를 은폐할 수 있는바, 여기서 가이드 워드는 실행 가능한 제어 의도를 제시하기 위한 것이다.

다시 말해, 본 출원에서, 재생 인터페이스에 일부 제1 요소와 제어 의도를 가지는 제2 요소가 디스플레이되는 것이 인식되기만 하면, 전자 기기는 당해 제2 요소에 따라 대응되는 제어 의도를 직접 실행할 수 있는바, 대응되는 제어 의도를 디스플레이할 필요가 없으므로, 영상 재생 인터페이스에 대한 차폐를 나아가 더 감소시키고 사용자의 사용 경험을 개선할 수 있다.

상술한 실시예를 구현하기 위해 본 출원은 영상 재생 장치를 더 제공한다.

도4는 본 출원의 실시예5에 의해 제공되는 영상 재생 장치의 개략적인 구조도이다.

도4에 도시한 바와 같이, 당해 영상 재생 장치(400)는 검출 모듈(401)과 디스플레이 모듈(402)을 포함한다.

검출 모듈(401)은 목표 동작 모드에서 영상 재생 조작을 검출한다. 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득된다.

디스플레이 모듈(402)은 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하고, 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다.

한 가능한 구현 방식으로, 디스플레이 모듈(402)은 구체적으로, 정보 스트림으로부터 제어 의도를 가지는 목표 정보를 선별하고; 선별을 통해 목표 정보가 획득될 경우, 목표 정보에 따라 제2 요소를 생성하고; 영상 재생 인터페이스 내에서 제2 요소를 디스플레이한다.

다른 가능한 구현 방식으로, 디스플레이 모듈(402)은 또한, 정보 스트림으로부터 중간 상태의 인식 정보가 획득될 경우, 일정한 시간을 대기함으로써 정보 스트림으로부터 최종 상태의 인식 정보를 획득하고, 중간 상태의 인식 정보는 불완전한 문장의 오디오를 음성 인식하여 획득된 것이고, 최종 상태의 인식 정보는 완전한 문장의 오디오를 음성 인식하여 획득된 것이고; 최종 상태의 인식 정보를 의도 인식하고; 인식된 의도가 제어 의도에 매칭된다면 최종 상태의 인식 정보를 목표 정보로 한다.

또 다른 가능한 구현 방식으로, 디스플레이 모듈(402)은 구체적으로, 영상 재생 조작에 응답하여, 제1 요소가 영상 재생 인터페이스에서 디스플레이되는 위치를 설정함으로써 일부를 은폐시키고, 디스플레이되는 위치에 따라 영상 재생 인터페이스에서 제1 요소를 디스플레이한다.

여기서, 제1 요소는 본체 영역 및 본체 영역을 에워싸는 헤일로 영역을 가지고, 영상 재생 인터페이스에서 본체 영역과 일부 헤일로 영역이 은폐된다.

다른 가능한 구현 방식으로, 디스플레이 모듈(402)은 구체적으로, 영상 재생 조작에 응답하여 영상 재생 인터페이스에서 가이드 워드를 디스플레이하기 위한 요소를 은폐하는바; 여기서 가이드 워드는 실행 가능한 제어 의도를 제시하기 위한 것이다.

설명하고자 하는 바는, 상술한 영상 재생 방법 실시예에 대한 해석과 설명은 당해 실시예의 영상 재생 장치에도 적용되는바, 여기서 상세한 설명은 생략하기로 한다.

본 출원의 실시예의 영상 재생 장치는, 목표 동작 모드에서 영상 재생 조작을 검출하고, 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득되고; 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하며, 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이,고 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다. 이로써, 목표 동작 모드에서 전자 기기의 스크린에는 영상 재생 인터페이스를 표시하는 외에 일부 제1 요소와 제2 요소만을 디스플레이하기 때문에, 영상 재생 인터페이스에 대한 차폐를 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다. 또한, 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있고, 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있으므로, 사용자의 사용 경험을 나아가 더 개선할 수 있다.

상술한 실시예를 구현하기 위해 본 출원은 전자 기기를 더 제공하는바, 이는, 적어도 하나의 프로세서; 및 적어도 하나의 프로세서와 통신 가능하게 연결되는 메모리; 를 포함하고, 메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어 있고, 명령이 적어도 하나의 프로세서에 의해 실행됨으로써 적어도 하나의 프로세서가 본 출원의 실시예에 의해 제공되는 영상 재생 방법을 수행한다.

상술한 실시예를 구현하기 위해 본 출원은 컴퓨터 명령의 비일시적 컴퓨터 판독 가능 저장 매체를 더 제공하는바, 컴퓨터 명령은, 컴퓨터가 본 출원의 실시예에 의해 제공되는 영상 재생 방법을 실행하도록 한다.

본 출원의 실시예에 따르면, 본 출원은 전자 기기와 판독 가능 저장 매체를 더 제공한다.

도5에 도시한 바와 같이, 이는 본 출원의 실시예의 영상 재생 방법에 따른 전자 기기의 블록도이다. 전자 기기는 다양한 형식의 디지털 컴퓨터, 예를 들어 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크벤치, 개인용 디지털 보조기, 서버, 블레이드 서버, 대형 컴퓨터 및 기타의 적합한 컴퓨터를 가리키고자 하는 것이다. 전자 기기는 다양한 형식의 이동 장치, 예를 들어 개인용 디지털 보조기, 셀룰러 폰, 스마트폰, 웨어러블 기기 및 기타의 이와 유사한 컴퓨팅 기기를 가리킬 수도 있다. 본 명세서에서 제시하는 부품, 이들의 연결과 관계 및 이들의 기능은 단지 예시일 뿐, 본 명세서에서 설명한 및/또는 요구하는 본 출원의 구현을 한정하고자 하는 하는 것이 아니다.

도5에 도시한 바와 같이, 당해 전자 기기는 하나 또는 복수의 프로세서(501), 메모리(502) 및 각 부품을 연결하는 인터페이스를 포함하는바, 고속 인터페이스와 저속 인터페이스가 포함된다. 각 부품은 부동한 버스를 이용하여 서로 연결되고 공용 메인기판에 장착되거나 또는 필요에 따라 기타의 방식으로 장착될 수 있다. 프로세서는 전자 기기 내에서 실행되는 명령을 처리할 수 있는바, 메모리 내에 또는 메모리 위에 저장되어 외부 입력/출력 장치(예를 들어 인터페이스에 커플링되는 디스플레이 기기)에 GUI의 그래픽 정보를 표시하는 명령이 포함된다. 기타의 구현 방식에서, 필요하다면 복수의 프로세서 및/또는 복수의 버스를 복수의 메모리와 함께 사용할 수 있다. 마찬가지로, 복수의 전자 기기를 연결할 수 있는바, 각 기기는 일부 필요한 조작을 제공한다(예를 들어 서버 어레이, 한 그룹의 블레이드 서버 또는 멀티프로세서 시스템으로서). 도5는 한 프로세서(501)를 예로 든다.

메모리(502)가 바로 본 출원에 의해 제공되는 비일시적 컴퓨터 판독 가능 저장 매체이다. 상기 메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어 있는바, 당해 명령은, 상기 적어도 하나의 프로세서가 본 출원에 의해 제공되는 영상 재생 방법을 실행하도록 한다. 본 출원의 비일시적 컴퓨터 판독 가능 저장 매체는 컴퓨터 명령을 저장하고, 당해 컴퓨터 명령은 컴퓨터가 본 출원에 의해 제공되는 영상 재생 방법을 실행하도록 한다.

메모리(502)는 비일시적 컴퓨터 판독 가능 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램 및 모듈, 예를 들면 본 출원의 실시예의 영상 재생 방법에 대응되는 프로그램 명령/모듈(예를 들면 도4에 도시한 검출 모듈(401) 및 디스플레이 모듈(402))을 저장할 수 있다. 프로세서(501)는 메모리(502)에 저장되는 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행함으로써 서버의 다양한 기능 응용 및 데이터 처리를 수행하는바, 즉 상술한 방법 실시예의 영상 재생 방법을 구현한다.

메모리(502)는 프로그램 저장 영역과 데이터 저장 영역을 포함할 수 있는바, 여기서, 프로그램 저장 영역은 운영 체제, 적어도 하나의 기능에 있어서 필요한 응용 프로그램을 저장할 수 있고 데이터 저장 영역은 전자 기기의 사용에 따라 구축되는 데이터 등을 저장할 수 있다. 이 외에도 메모리(502)는 고속 랜덤 액세스 메모리를 포함할 수도 있고 비일시적 메모리, 예를 들어 적어도 하나의 자기 디스크 저장 장치, 플래시 메모리 장치 또는 기타의 비일시적 고체 상태 저장 장치를 포함할 수도 있다. 일부 실시예에서, 메모리(502)는 선택적으로 프로세서(501) 대비 원격 설치되는 메모리를 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 전자 기기에 연결될 수 있다. 상술한 네트워크의 실례는 인터넷, 기업 내부 네트워크, 근거리 통신망, 이동 통신 네트워크 및 이들의 조합을 포함하나 이에 한정되지 않는다.

전자 기기는 입력 장치(503)와 출력 장치(504)를 더 포함할 수 있다. 프로세서(501), 메모리(502), 입력 장치(503) 및 출력 장치(504)는 버스 또는 기타의 방식으로 연결될 수 있는바, 도5에서는 버스에 의한 연결을 예로 든다.

입력 장치(503)는 입력되는 숫자 또는 캐릭터 정보를 수신하고 전자 기기의 사용자 설정 및 기능 제어에 관련되는 키 신호 입력을 발생시킬 수 있는바, 예를 들면 터치 스크린, 숫자 키패드, 마우스, 트랙패드, 터치패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙볼, 조종 스틱 등 입력 장치가 있다. 출력 장치(504)는 디스플레이 기기, 보조 조명장치(예를 들어 LED) 및 촉각 피드백 장치(예를 들어 진동 모터) 등을 포함할 수 있다. 당해 디스플레이 기기는 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있으나 이에 한정되지 않는다. 일부 구현 방식에서 디스플레이 기기는 터치 스크린일 수 있다.

여기서 설명하는 시스템과 기술의 다양한 구현 방식은 디지털 전자 회로 시스템, 집적 회로 시스템, 주문형ASIC(주문형 집적회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 구현될 수 있다. 이러한 다양한 구현 방식은 하나 또는 복수의 컴퓨터 프로그램에서 실시되는 것을 포함할 수 있고, 당해 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 프로세서를 포함하는 프로그램 가능 시스템에서 실행되거나 및/또는 해석될 수 있고, 당해 프로그램 가능 프로세서는 전용 또는 범용 프로그램 가능 프로세서일 수 있고 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터와 명령을 수신하고 데이터와 명령을 당해 저장 시스템, 당해 적어도 하나의 입력 장치 및 당해 적어도 하나의 출력 장치로 전송할 수 있다.

이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드로 지칭되기도 함)은 프로그램 가능 프로세서의 기계 명령을 포함하며 고급 절차 및/또는 객체지향 프로그래밍 언어, 및/또는 어셈블리어/기계어를 이용하여 이러한 컴퓨팅 프로그램을 실시할 수 있다. 본 명세서에서 사용한 바와 같이, 용어 '기계 판독 가능 매체'와 '컴퓨터 판독 가능 매체'는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기, 및/또는 장치(예를 들어, 자기 디스크, 광 디스크, 메모리, 프로그램 가능 논리 장치(PLD))를 가리키는바, 이는 기계 판독 가능 신호로서의 기계 명령을 수신하는 기계 판독 가능 매체를 포함한다. 용어 '기계 판독 가능 신호'는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 신호를 가리킨다.

사용자와의 인터랙션을 제공하기 위해, 여기서 설명하는 시스템과 기술을 컴퓨터에서 실시할 수 있는바, 당해 컴퓨터는 사용자한테 정보를 표시하기 위한 표시 장치(예를 들어, CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터) 및 키보드와 포인팅 장치(예를 들어, 마우스 또는 트랙볼)를 포함하고, 사용자는 당해 키보드와 당해 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 기타 종류의 장치도 사용자와의 인터랙션을 제공하는 데 사용될 수 있는바, 예를 들어, 사용자한테 제공되는 피드백은 임의 형식의 감각 피드백(예를 들어 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있고 임의 형식(소리 입력, 음성 입력 또는 촉각 입력을 포함함)으로 사용자로부터의 입력이 수신될 수 있다.

여기서 설명하는 시스템과 기술을 백그라운드 부품을 포함하는 컴퓨팅 시스템(예를 들면 데이터 서버로서), 미들웨어를 포함하는 컴퓨팅 시스템(예를 들면 애플리케이션 서버), 프런트 엔드 부품을 포함하는 컴퓨팅 시스템(예를 들면 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비하는 사용자 컴퓨터일 수 있는바, 사용자는 당해 그래픽 사용자 인터페이스 또는 당해 네트워크 브라우저를 통하여 여기서 설명하는 시스템 및 기술의 구현 방식과 인터랙션할 수 있음) 또는 이러한 백그라운드 부품, 미들웨어 또는 프런트 엔드 부품의 임의 조합을 포함하는 컴퓨팅 시스템에서 구현할 수 있다. 임의 형식 또는 매체의 디지털 데이터 통신(예를 들면 통신 네트워크)으로 시스템의 부품을 서로 연결시킬 수 있다. 통신 네트워크의 예시는 근거리 통신망(LAN), 광대역 통신망(WAN) 및 인터넷을 포함한다.

컴퓨터 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로는 서로 멀리 떨어져 있고 통상적으로 통신 네트워크를 통해 인터랙션한다. 상응한 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 이루는 컴퓨터 프로그램을 통해 클라이언트와 서버의 관계가 발생된다.

본 출원의 실시예의 기술안에 따르면, 목표 동작 모드에서 영상 재생 조작을 검출하고, 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 정보 스트림은 오디오 스트림을 음성 인식하여 획득되고; 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하여 영상 재생 인터페이스에서 영상을 재생하고, 영상 재생 인터페이스에서 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이하며, 제1 요소는 오디오를 연속적으로 수집하고 있다는 것을 제시하기 위한 것이고, 제2 요소는 정보 스트림에 따라 디스플레이를 수행하기 위한 것이다. 이로써, 목표 동작 모드에서 전자 기기의 스크린에는 영상 재생 인터페이스를 표시하는 외에 일부 제1 요소와 제2 요소만을 디스플레이하기 때문에, 영상 재생 인터페이스에 대한 차폐를 감소시키고 영상에 대한 사용자의 몰입 관람 경험을 향상시킨다. 또한, 영상 재생 인터페이스에서 일부 제1 요소를 디스플레이하면 사용자는 전자 기기가 청취 중이라는 것을 분명히 할 수 있고, 따라서 기기를 재차 웨이크업할 필요 없이 대응되는 제어 명령 또는 인터랙션 수요를 음성 입력할 수 있다는 것을 인지할 수 있으므로, 사용자의 사용 경험을 나아가 더 개선할 수 있다.

위에서 제시한 다양한 형식의 흐름을 적용하여 단계를 재정렬, 증가 또는 삭제할 수 있음을 이해하여야 한다. 예를 들어, 본 출원에 기재된 각 단계는 병행으로 수행될 수도 있고 순차로 수행될 수도 있고 부동한 순서로 수행될 수도 있는바, 본 출원에서 개시하는 기술안에 대한 기대 효과를 구현할 수만 있으면 되며, 본 명세서는 이에 대해 한정하지 않는다.

상술한 구체적인 구현 방식은 본 출원의 보호 범위를 한정하지 않는다. 설계 요구와 기타 요소에 따른 다양한 수정, 조합, 서브 조합 및 치환이 가능하다는 점은 당업자에 있어서 자명할 것이다. 본 출원의 사상과 원칙 이내에 있는 임의의 수정, 등가적 치환 및 개량 등은 모두 본 출원의 보호 범위에 포함되어야 한다.

Claims

영상 재생 방법에 있어서,
목표 동작 모드에서 영상 재생 조작을 검출하는 단계 - 상기 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 상기 정보 스트림은 상기 오디오 스트림을 음성 인식하여 획득됨 - ; 및
상기 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이함으로써, 상기 영상 재생 인터페이스에서 영상을 재생하는 단계 - 상기 정보 스트림으로부터 제어 의도를 가지는 목표 정보를 선별하고, 선별을 통해 상기 목표 정보가 획득될 경우, 상기 목표 정보에 따라 제2 요소를 생성하고, 상기 영상 재생 인터페이스를 변경하지 않고 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이함으로써, 상기 제1 요소가 상기 영상 재생 인터페이스에 대한 차폐를 감소함 - ;를 포함하고,
상기 정보 스트림으로부터 제어 의도를 가지는 목표 정보를 선별하는 단계는,
상기 정보 스트림으로부터 중간 상태의 인식 정보가 획득될 경우, 일정한 시간을 대기함으로써 상기 정보 스트림으로부터 최종 상태의 인식 정보를 획득하는 단계 - 상기 중간 상태의 인식 정보는 불완전한 문장의 오디오를 음성 인식하여 획득된 것이고, 상기 최종 상태의 인식 정보는 완전한 문장의 오디오를 음성 인식하여 획득된 것임 - ;
상기 최종 상태의 인식 정보를 의도 인식하는 단계; 및
인식된 의도가 상기 제어 의도에 매칭된다면, 상기 최종 상태의 인식 정보를 상기 목표 정보로 하는 단계; 를 포함하는,
것을 특징으로 하는 영상 재생 방법.
삭제
삭제
제1항에 있어서,
상기 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하는 단계는,
상기 영상 재생 조작에 응답하여, 상기 제1 요소가 상기 영상 재생 인터페이스에서 디스플레이되는 위치를 설정함으로써 일부를 은폐시키는 단계; 및
상기 디스플레이되는 위치에 따라 상기 영상 재생 인터페이스에서 상기 제1 요소를 디스플레이하는 단계; 를 포함하는,
것을 특징으로 하는 영상 재생 방법.
제4항에 있어서,
상기 제1 요소는 본체 영역 및 상기 본체 영역을 에워싸는 헤일로 영역을 가지고, 상기 영상 재생 인터페이스에서 상기 본체 영역과 일부 상기 헤일로 영역이 은폐되는,
것을 특징으로 하는 영상 재생 방법.
제1항에 있어서,
상기 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이하는 단계는,
상기 영상 재생 조작에 응답하여 상기 영상 재생 인터페이스에서 가이드 워드를 디스플레이하기 위한 요소를 은폐시키는 단계를 포함하고,
상기 가이드 워드는 실행 가능한 제어 의도를 제시하기 위한,
것을 특징으로 하는 영상 재생 방법.
영상 재생 장치에 있어서,
목표 동작 모드에서 영상 재생 조작을 검출하는 검출 모듈 - 상기 목표 동작 모드에서 오디오를 연속적으로 수집하여 오디오 스트림을 획득하고 정보 스트림을 획득하며, 상기 정보 스트림은 상기 오디오 스트림을 음성 인식하여 획득됨 - ; 및
상기 영상 재생 조작에 응답하여 영상 재생 인터페이스를 디스플레이함으로써 상기 영상 재생 인터페이스에서 영상을 재생하는 디스플레이 모듈 - 상기 정보 스트림으로부터 제어 의도를 가지는 목표 정보를 선별하고, 선별을 통해 상기 목표 정보가 획득될 경우, 상기 목표 정보에 따라 제2 요소를 생성하고, 상기 영상 재생 인터페이스를 변경하지 않고 제1 요소의 일부를 은폐시키고 제2 요소를 디스플레이함으로써, 상기 제1 요소가 상기 영상 재생 인터페이스에 대한 차폐를 감소함 - ;을 포함하고,
상기 디스플레이 모듈은 또한,
상기 정보 스트림으로부터 중간 상태의 인식 정보가 획득될 경우, 일정한 시간을 대기함으로써 상기 정보 스트림으로부터 최종 상태의 인식 정보를 획득하고 - 상기 중간 상태의 인식 정보는 불완전한 문장의 오디오를 음성 인식하여 획득되고, 상기 최종 상태의 인식 정보는 완전한 문장의 오디오를 음성 인식하여 획득됨 - ;
상기 최종 상태의 인식 정보를 의도 인식하고;
인식된 의도가 상기 제어 의도에 매칭된다면, 상기 최종 상태의 인식 정보를 상기 목표 정보로 하는,
것을 특징으로 하는 영상 재생 장치.
삭제
삭제
제7항에 있어서,
상기 디스플레이 모듈은,
상기 영상 재생 조작에 응답하여, 상기 제1 요소가 상기 영상 재생 인터페이스에서 디스플레이되는 위치를 설정함으로써 일부를 은폐시키고;
상기 디스플레이되는 위치에 따라 상기 영상 재생 인터페이스에서 상기 제1 요소를 디스플레이하는,
것을 특징으로 하는 영상 재생 장치.
제10항에 있어서,
상기 제1 요소는 본체 영역 및 상기 본체 영역을 에워싸는 헤일로 영역을 가지고, 상기 영상 재생 인터페이스에서 상기 본체 영역과 일부 상기 헤일로 영역이 은폐되는,
것을 특징으로 하는 영상 재생 장치.
제7항에 있어서,
상기 디스플레이 모듈은,
상기 영상 재생 조작에 응답하여 상기 영상 재생 인터페이스에서 가이드 워드를 디스플레이하기 위한 요소를 은폐시키고;
상기 가이드 워드는 실행 가능한 제어 의도를 제시하기 위한,
것을 특징으로 하는 영상 재생 장치.
전자 기기에 있어서,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서와 통신 가능하게 연결되는 메모리; 를 포함하고,
상기 메모리에는 상기 적어도 하나의 프로세서가 실행 가능한 명령이 저장되어 있고, 상기 명령이 상기 적어도 하나의 프로세서에 의해 실행됨으로써 상기 적어도 하나의 프로세서가 제1항, 제4항 내지 제6항 중 어느 한 항의 영상 재생 방법을 실행하는,
것을 특징으로 하는 전자 기기.
컴퓨터 명령이 저장되어 있는 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
상기 컴퓨터 명령은, 상기 컴퓨터가 제1항, 제4항 내지 제6항 중 어느 한 항의 영상 재생 방법을 실행하도록 하는,
것을 특징으로 하는 비일시적 컴퓨터 판독 가능 저장 매체.