KR20210068333A - 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체 - Google Patents

응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체 Download PDF

Info

Publication number
KR20210068333A
KR20210068333A KR1020210064900A KR20210064900A KR20210068333A KR 20210068333 A KR20210068333 A KR 20210068333A KR 1020210064900 A KR1020210064900 A KR 1020210064900A KR 20210064900 A KR20210064900 A KR 20210064900A KR 20210068333 A KR20210068333 A KR 20210068333A
Authority
KR
South Korea
Prior art keywords
guide data
application program
operation guide
user
application
Prior art date
Application number
KR1020210064900A
Other languages
English (en)
Inventor
셩용 주오
웬치앙 마오
준멩 첸
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210068333A publication Critical patent/KR20210068333A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/70Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
    • G06F21/71Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer to assure secure computing or processing of information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • G06F9/453Help systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 출원은 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체를 개시하고, 음성 인식 기술분야에 관한 것이다. 구체적인 구현 방법은, 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하고, 상기 조작 안내 데이터를 상기 사용자에게 제공하는 단계; 상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계; 및 상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하여, 상기 제1 응용 프로그램이 상기 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 하는 단계;를 포함함으로써 효율적이고 편리하게 자발적인 여러 라운드의 조작 안내를 구현하여 사용자 기억이 필요하지 않은 동시에, 제1 응용 프로그램이 사용자의 구체적인 조작 행동을 획득하기 용이하고, 사용자에 대한 행동 분석을 진행하는데 유리하다.

Description

응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체{Method and device for guiding operation of application program, equipment and readable storage medium}
본 출원은 컴퓨터 기술분야에 관한 것으로, 특히 음성 인식 기술분야에 관한 것이다.
스마트 기기 및 인터넷 기술의 급속한 발전에 따라, 쇼핑 응용 프로그램, 음악 응용 프로그램 및 소셜 응용 프로그램과 같은 대량의 응용 프로그램이 나타나고 있다.
사용자의 각종 가능한 요구를 충족시키기 위해, 응용 프로그램에 의해 지원되는 기능은 점점 더 많아지고, 페이지 조작도 점점 더 번거로워지고 있다. 사용자에게 조작 안내를 진행하기 위해, 현재는 일반적으로 응용 프로그램에 진입한 후, 여러 페이지의 조작 안내 페이지를 로딩하고, 상기 페이지에는 새롭게 추가된 기능 아이콘, 새롭게 추가된 기능 아이콘에 대한 조작 설명 등이 디스플레이되어 있다.
그러나, 실제 사용 중, 조작 안내 페이지의 콘텐츠가 많고 난잡하며, 또한 사용자가 기억해야 하므로, 대부분 사용자로 하여금 조작 안내 페이지를 자세히 열독해야 하는 인내심이 없도록 하여 안내가 실패한다. 사용자에게 효과적이고 편리하게 조작 안내를 진행하는 것은 이미 시급히 해결해야 할 기술적 과제가 되었다.
본 출원의 실시예는 사용자에게 효과적이고 편리하게 조작 안내를 진행하도록, 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체를 제공한다.
제1 양태에서, 본 출원의 실시예는 응용 프로그램의 조작 안내 방법을 제공하고, 상기 방법은,
제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하되, 상기 조작 안내 데이터는 상기 제1 응용 프로그램이 사용자의 현재 조작에 따라 얻은 다음 조작의 안내 데이터인 단계;
상기 조작 안내 데이터를 상기 사용자에게 제공하는 단계;
상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계; 및
상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하여, 상기 제1 응용 프로그램이 상기 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 하는 단계; 를 포함한다.
본 출원의 실시예에서, 제1 응용 프로그램에 의해 송신된 사용자의 다음 조작의 조작 안내 데이터를 수신하고, 상기 조작 안내 데이터를 사용자에게 제공함으로써, 사용자가 다음 조작을 알게 한다. 사용자가 다음 조작의 음성 정보를 입력하여, 음성 정보와 매칭되는 타겟 조작 데이터를 결정하고, 음성 입력의 방식은 사용자의 조작이 용이하도록 하며, 사용자와 음성 서비스 응용 프로그램 사이의 인터랙션 체험 느낌을 향상시킨다. 다음 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하여, 제1 응용 프로그램은 타겟 조작 안내 데이터에 따라 다음 조작을 수행한다. 본 실시예의 제1 응용 프로그램은 음성 인식 기능을 통합할 필요가 없고, 즉 제1 응용 프로그램의 내부 구현 로직을 수정할 필요가 없고, 조작 안내 데이터를 제공하기만 하면 사용자가 다음 조작을 수행하도록 자발적으로 안내할 수 있다. 제1 응용 프로그램이 여러 라운드의 조작 안내 데이터를 제공할 경우, 사용자가 단계적으로 조작을 수행하도록 자발적으로 안내할 수 있으며, 효율적이고 편리하게 자발적인 여러 라운드의 조작 안내를 구현하고, 사용자 기억이 필요하지 않은 동시에, 제1 응용 프로그램이 사용자의 구체적인 조작 행동을 획득하기 용이하며, 사용자에 대한 행동 분석을 진행하는데 유리하다.
선택적으로, 조작 안내 데이터의 수량은 적어도 하나이고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계 이전에,
상기 제1 응용 프로그램에 의해 송신된 각 상기 조작 안내 데이터의 키워드를 수신하는 단계를 더 포함하며,
상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계는,
상기 음성 정보에 대해 키워드 인식을 진행하여, 상기 음성 정보의 키워드를 얻는 단계; 및
각 상기 조작 안내 데이터의 키워드를 상기 음성 정보의 키워드와 비교하여, 비교 결과가 일치한 타겟 조작 안내 데이터를 얻는 단계; 를 포함한다.
상기 출원의 하나의 선택적인 실시형태에서, 키워드 비교 방법을 통해 음성 정보와 매칭되는 조작 안내 데이터를 결정하여, 타겟 조작 안내 데이터를 정확하게 획득하고, 또한, 키워드를 비교하여 조작 안내 데이터를 결정하는 방법은 속도가 더 빠르고 효율이 더 높다.
선택적으로, 상기 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하는 단계는,
상기 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출한 것을 모니터링하고, 상기 크로스 프로세스 액세스 인터페이스에서 조작 안내 데이터를 판독하되, 상기 제1 응용 프로그램은 상기 크로스 프로세스 액세스 인터페이스를 호출하여 상기 조작 안내 데이터를 상기 크로스 프로세스 액세스 인터페이스에 저장하는 단계; 를 포함하며,
상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하는 단계는,
상기 크로스 프로세스 액세스 인터페이스를 호출하고, 상기 타겟 조작 안내 데이터를 상기 크로스 프로세스 액세스 인터페이스에 저장하여, 상기 제1 응용 프로그램이 상기 크로스 프로세스 액세스 인터페이스를 호출하여 상기 타겟 조작 안내 데이터를 획득하도록 하는 단계; 를 포함한다.
상기 출원의 하나의 선택적인 실시형태에서, 크로스 프로세스 액세스 인터페이스를 통해 제1 응용 프로그램과 음성 서비스 응용 프로그램 사이의 데이터 전송을 구현하여, 데이터 전송의 신뢰성, 안정성 및 효율성을 확보한다.
선택적으로, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계 이전에,
상기 제1 응용 프로그램에 의해 송신된 각 상기 조작 안내 데이터에 대응되는 예비 사용자 의도 및 각 상기 조작 안내 데이터에 대응되는 다음 조작 데이터를 수신하는 단계를 더 포함하고,
상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계 이후에,
응용 프로그램 세트에서, 상기 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계; 및
상기 타겟 조작 안내 데이터에 대응되는 다음 조작 데이터를 상기 제2 응용 프로그램에 송신하고, 상기 제2 응용 프로그램이 상기 다음 조작 데이터를 조작하도록 트리거하는 단계; 를 더 포함한다.
상기 출원의 하나의 선택적인 실시형태에서, 제1 응용 프로그램은 조작 안내 데이터의 예비 사용자 의도를 제공하고, 예비 사용자 의도는 제1 응용 프로그램이 만약 사용자가 다음 조작을 수행하면 가능하다고 간주하는 사용자 의도이며, 제2 응용 프로그램이 예비 사용자 의도를 충족시키면 다음 조작 데이터를 제2 응용 프로그램에 송신하고, 제2 응용 프로그램이 다음 조작 데이터를 조작하도록 자발적으로 트리거하여 사용자 의도를 구현한다. 본 실시예는 제1 응용 프로그램에서 조작 안내를 진행할 뿐만 아니라, 제2 응용 프로그램을 자발적으로 트리거하여 사용자 의도를 구현할 수 있다.
선택적으로, 상기 응용 프로그램 세트에서, 상기 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계는,
상기 음성 정보에 대해 의도 인식을 진행하여 명확한 사용자 의도를 얻는 단계; 및
만약 상기 명확한 사용자 의도가 상기 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도와 일치하면, 응용 프로그램 세트에서, 상기 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계; 를 포함한다.
상기 출원의 하나의 선택적인 실시형태에서, 명확한 사용자 의도의 정확도가 높기에, 음성 정보에 대해 의도 인식을 진행하여 명확한 사용자 의도를 다시 얻고, 만약 음성 정보의 명확한 사용자 의도가 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도와 일치하면, 사용자에게 상기 의도가 확실히 있음을 설명하고, 예비 사용자 의도 및 제2 응용 프로그램을 결정하는 정확성을 향상시킨다.
선택적으로, 상기 조작 안내 데이터를 상기 사용자에게 제공하는 단계는,
상기 조작 안내 데이터를 디스플레이하는 단계; 및
상기 조작 안내 데이터의 음성 정보를 재생하는 단계; 중의 적어도 하나를 포함한다.
상기 출원의 하나의 선택적인 실시형태에서, 디스플레이 및 음성 재생 중 적어도 하나의 방식을 통해 조작 안내 데이터를 사용자에게 제공하고, 제공 방식이 다양하며, 선행기술의 여러 페이지의 조작 안내 페이지와 비교하면, 본 실시예는 다음 조작의 안내 데이터만 디스플레이하거나 재생하기에, 제공 콘텐츠를 단순화하여 사용자가 더 쉽게 수락한다.
선택적으로, 상기 조작 안내 데이터를 디스플레이하는 단계는,
상기 조작 안내 데이터를 페이징 디스플레이하는 단계를 포함하고,
상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계는,
상기 사용자에 의해 입력된 적어도 하나의 라운드의 음성 정보를 수신하고, 각 라운드의 상기 음성 정보를 인식하는 단계;
만약 페이지 번호 정보가 인식되면, 상기 페이지 번호 정보에 대응되는 조작 안내 데이터를 디스플레이하는 단계; 및
만약 페이지 번호 정보가 인식되지 않으면, 현재 페이지에 디스플레이된 조작 안내 데이터에서 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계; 를 포함한다.
상기 출원의 하나의 선택적인 실시형태는, 조작 안내 데이터의 페이징 디스플레이를 지원하여 조작 안내 데이터의 데이터 양을 향상시키고, 페이징 방식을 통해 페이지의 간결을 확보하며, 사용자는 음성을 통해 페이지 넘기기를 제어할 수 있고, 단일 라운드 조작에서 다단계 음성 입력 조작을 겸용한다.
선택적으로, 상기 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하는 단계 이전에,
상기 제1 응용 프로그램의 서명을 수신하는 단계; 및
상기 서명을 검증하고, 검증 통과 결과를 얻는 단계; 를 더 포함한다.
상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하는 단계는,
상기 타겟 조작 안내 데이터를 암호화한 후 상기 제1 응용 프로그램에 송신하는 단계를 포함한다.
상기 출원의 하나의 선택적인 실시형태에서, 제1 응용 프로그램의 서명을 검증하고 타겟 조작 안내 데이터를 암호화 송신하여, 데이터 전송의 안전성을 확보한다.
제2 양태에서, 본 출원의 실시예는 응용 프로그램의 조작 안내 장치를 더 제공하고, 상기 장치는,
제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하되, 상기 조작 안내 데이터는 상기 제1 응용 프로그램이 사용자의 현재 조작에 따라 얻은 다음 조작의 안내 데이터인 수신 모듈;
상기 조작 안내 데이터를 상기 사용자에게 제공하기 위한 제공 모듈;
상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하기 위한 결정 모듈; 및
상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하여, 상기 제1 응용 프로그램이 상기 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 하기 위한 송신 모듈; 을 포함한다.
제3 양태에서, 본 출원의 실시예는 전자 기기를 더 제공하고, 상기 전자 기기는,
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서에 통신 가능하게 연결되는 메모리; 를 포함하고,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어 있고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1 양태의 실시예에서 제공하는 응용 프로그램의 조작 안내 방법을 수행하도록 한다.
제4 양태에서, 본 출원의 실시예는 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장 매체를 더 제공하고, 상기 컴퓨터 명령은 상기 컴퓨터가 제1 양태의 실시예에서 제공하는 응용 프로그램의 조작 안내 방법을 수행하도록 한다.
제5 양태에서, 본 출원의 실시예는 비일시적 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 더 제공하고, 상기 컴퓨터 프로그램은 상기 컴퓨터가 제1 양태의 실시예에서 제공하는 응용 프로그램의 조작 안내 방법을 수행하도록 한다.
상기 선택 가능한 방식이 가지는 다른 효과에 대해서는, 아래 구체적인 실시예를 결부하여 설명하고자 한다.
본 출원의 실시예는 사용자에게 효과적이고 편리하게 조작 안내를 진행하도록, 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체를 제공한다.
첨부 도면은 본 기술적 수단을 더 잘 이해하기 위한 것으로, 본 출원을 한정하지 않는다.
도 1은 본 출원의 실시예1의 응용 프로그램의 조작 안내 방법의 흐름도이다.
도 2는 본 출원의 실시예2의 응용 프로그램의 조작 안내 방법의 흐름도이다.
도 3은 본 출원의 실시예3의 응용 프로그램의 조작 안내 방법의 흐름도이다.
도 4는 본 출원의 실시예4의 응용 프로그램의 조작 안내 방법의 흐름도이다.
도 5는 본 출원의 실시예5의 응용 프로그램의 조작 안내 장치의 구조도이다.
도 6은 본 출원의 실시예의 응용 프로그램의 조작 안내 방법을 구현하기 위한 전자 기기의 블록도이다.
이하, 첨부 도면을 결부하여 본 출원의 예시적인 실시예들을 설명하고자 하며, 이해를 돕기 위해 본 출원의 실시예들의 다양한 세부 사항들이 포함되는데, 이들은 단지 예시적인 것으로 간주되어야 한다. 따라서, 본 출원의 기술분야의 통상의 지식을 가진 자라면 본 출원의 범위 및 사상을 벗어나지 않으면서 본 명세서에 설명된 실시예들에 대해 다양한 변경 및 수정이 이루어질 수 있음을 알아야 한다. 또한, 명확성 및 간결성을 위해, 공지된 기능 및 구조에 대한 설명은 아래 설명에서 생략된다.
실시예1
도 1은 본 출원의 실시예1의 응용 프로그램의 조작 안내 방법의 흐름도이다. 본 출원의 실시예는 사용자가 응용 프로그램을 단계적으로 조작하도록 안내하는 상황에 적용되며, 상기 방법은 응용 프로그램의 조작 안내 장치를 통해 수행되고, 상기 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현되며, 구체적으로 일정한 데이터 연산 능력을 구비한 전자 기기에 배치된다. 선택적으로, 전자 기기는 스마트 폰 또는 자동차 단말기이고, 자동차 단말기에는 제1 응용 프로그램 및 음성 서비스 응용 프로그램이 장착되며, 제1 응용 프로그램은 음성 서비스 응용 프로그램의 도움으로 사용자에 대한 조작 안내를 진행한다.
도 1에 도시된 응용 프로그램의 조작 안내 방법은 구체적으로 전자 기기의 음성 서비스 응용 프로그램에 의해 수행되고, 다음과 같은 단계를 포함한다.
단계S110에서, 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하고, 조작 안내 데이터는 제1 응용 프로그램이 사용자의 현재 조작에 따라 얻은 다음 조작의 안내 데이터이다.
제1 응용 프로그램은 새로 출시된 응용 프로그램 또는 새로운 기능을 추가한 응용 프로그램과 같은 조작 안내 수요를 갖는 응용 프로그램이다. 설명과 구분의 편의를 위해, 조작 안내 수요를 갖는 응용 프로그램을 제1 응용 프로그램이라고 지칭한다.
사용자는 제1 응용 프로그램을 직접 조작할 수 있고, 예를 들면 제1 응용 프로그램의 아이콘을 트리거하여 제1 응용 프로그램을 열며, 또한 예를 들면 제1 응용 프로그램의 기능 아이콘을 트리거하여 제1 응용 프로그램이 대응되는 기능을 수행하도록 제어한다. 사용자는 또한 음성 정보를 입력하여 다음 조작 데이터를 얻고, 다음 조작 데이터를 제1 응용 프로그램에 송신하여 제1 응용 프로그램에 대한 간접 조작을 구현할 수 있다. 사용자의 현재 조작은 직접적인 조작일 수 있거나, 간접적인 조작일 수 있지만, 현재 조작은 단일 단계 조작이어야 한다.
내부 구현 로직에 따르면, 제1 응용 프로그램은 사용자의 현재 조작에 따라 응답하여 현재 조작의 다음 조작의 안내 데이터를 얻는다. 다음 조작의 안내 데이터는 사용자가 다음 조작을 수행하도록 하는 데이터이고, 다음 조작 및 조작 안내 데이터의 수량은 모두 적어도 하나이며, 다음 조작과 조작 안내 데이터 사이에는 일대일 대응 관계를 갖는다. 일 예시에서, 현재 조작은 식사 주문 아이콘을 클릭하는 조작이고, 다음 조작은 후난 요리 아이콘을 선택하는 조작, 광둥 요리 아이콘을 선택하는 조작 및 서양 음식 아이콘을 선택하는 조작을 포함하며, 각 다음 조작의 안내 데이터는 각각 텍스트이고, 즉 후난 요리 선택 여부, 광둥 요리 선택 여부 및 서양 음식 선택 여부이다. 다음, 제1 응용 프로그램은 조작 안내 데이터를 음성 서비스 응용 프로그램에 송신한다.
단계S120에서, 조작 안내 데이터를 사용자에게 제공한다.
음성 서비스 응용 프로그램은 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신한 후, 조작 안내 데이터를 사용자에게 제공하여 사용자가 다음 조작의 안내 데이터를 알게 한다.
조작 안내를 진행하는 외에 음성 서비스 응용 프로그램은 또한 통상적인 음성 인터랙션 기능을 겸용하고, 즉 사용자에 의해 입력된 음성 정보를 인식하며, 적합한 콘텐츠를 매칭하여 재생하여, 사용자와의 음성 인터랙션을 구현할 수 있다. 이에 기반하여 조작 안내 데이터를 사용자에게 제공 시 또는 제공하기 전에, 조작 안내 데이터에 라벨을 붙인다.
단계S130에서, 사용자에 의해 입력된 음성 정보를 수신하고, 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정한다.
사용자는 다음 조작의 안내 데이터를 알게 된후, 그중에서 진행할 다음 조작을 결정하고, 다음 조작에 대응되는 음성을 자발적으로 송신한다. 상기 예시 다음으로, 사용자는 음성 정보인 "나는 후난 요리를 선택한다"를 입력한다.
만약 조작 안내 데이터에 라벨이 붙여지면, 단계S120 이후에 수신된 음성 정보에 대해 전술한 통상적인 조작 대신 단계S130 및 단계S140의 조작이 수행되어야 함을 설명한다. 반대로, 만약 특정 데이터에 라벨이 붙여지지 않으면, 이후에 수신된 음성 정보에 대해 통상적인 조작을 수행하고, 즉 음성 정보를 인식하며, 적합한 콘텐츠를 매칭하여 재생한다.
선택적으로, 만약 조작 안내 데이터의 수량이 하나이면, 음성 정보가 상기 조작 안내 데이터와 매칭되는지 여부를 판단하고, 만약 매칭되면 상기 조작 안내 데이터를 타겟 조작 안내 데이터로 결정하며, 만약 매칭되지 않으면 상기 조작 안내 데이터는 타겟 조작 안내 데이터가 아니다. 만약 조작 안내 데이터의 수량이 두 개 이상이면, 두 개 이상의 조작 안내 데이터에서 음성 정보와 매칭되는 조작 안내 데이터를 결정하고, 타겟 조작 안내 데이터라고 지칭한다. 구체적으로, 음성 서비스 응용 프로그램은 음성 정보를 인식하고, 인식 결과를 조작 안내 데이터와 매칭시켜, 매칭되는 타겟 조작 안내 데이터를 결정한다.
단계S140에서, 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하여, 제1 응용 프로그램이 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 한다.
조작 안내 데이터와 다음 조작 데이터 사이에는 일대일 대응 관계를 갖는다. 다음 조작 데이터는 조작 명령과 파라미터를 포함하고, 예를 들면 후난 요리 선택 여부에 대응되는 다음 조작 데이터는, 조작 명령과 후난 요리 파라미터를 선택하는 것을 포함한다. 제1 응용 프로그램은 타겟 조작 안내 데이터를 획득한 후, 타겟 조작 안내 데이터에 따라 대응되는 다음 조작 데이터를 결정하고, 그 중의 조작 명령과 파라미터에 따라 다음 조작을 수행하며, 예를 들면 후난 요리 아이콘의 선택 조작을 수행하고, 후난 요리 레스토랑 페이지로 진입한다.
선택적으로, 제1 응용 프로그램은 음성 서비스 응용 프로그램으로 조작 안내 데이터를 송신 시, 또한 조작 안내 데이터에 대응되는 다음 조작 데이터를 송신한다. 따라서, 단계S130 이전에, 제1 응용 프로그램에 의해 송신된 조작 안내 데이터에 대응되는 다음 조작 데이터를 수신하는 단계를 더 포함한다. 나아가 단계S130 이후에, 타겟 조작 안내 데이터에 따라 대응되는 다음 조작 데이터를 결정하는 단계를 더 포함하고, 이에 기반하여 음성 서비스 응용 프로그램은 사용자의 다음 조작 데이터를 알 수 있어, 사용자의 구체적인 조작 행동을 획득하기 용이하며, 사용자에 대해 행동 분석을 진행하는데 유리하다.
본 출원의 실시예에서, 제1 응용 프로그램에 의해 송신된 사용자의 다음 조작의 조작 안내 데이터를 수신하고, 상기 조작 안내 데이터를 사용자에게 제공함으로써 사용자가 다음 조작을 알게 한다. 사용자가 다음 조작의 음성 정보를 입력하고, 음성 정보와 매칭되는 타겟 조작 데이터를 결정하고, 음성 입력의 방식은 사용자의 조작이 용이하도록 하며, 사용자와 음성 서비스 응용 프로그램 사이의 인터랙션 체험 느낌을 향상시킨다. 다음 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하고, 제1 응용 프로그램은 타겟 조작 안내 데이터에 따라 다음 조작을 수행할 수 있다. 본 실시예의 제1 응용 프로그램은 음성 인식 기능을 통합할 필요가 없고, 즉 제1 응용 프로그램의 내부 구현 로직을 수정할 필요가 없고, 조작 안내 데이터를 제공하기만 하면 사용자가 다음 조작을 수행하도록 자발적으로 안내할 수 있다. 제1 응용 프로그램이 여러 라운드의 조작 안내 데이터를 제공할 경우, 사용자가 단계적으로 조작을 수행하도록 자발적으로 안내할 수 있으며, 효율적이고 편리하게 자발적인 여러 라운드의 조작 안내를 구현하고, 사용자 기억이 필요하지 않은 동시에, 제1 응용 프로그램이 사용자의 구체적인 조작 행동을 획득하기 용이하며, 사용자에 대해 행동 분석을 진행하는데 유리하다.
실시예2
도 2는 본 출원의 실시예2의 응용 프로그램의 조작 안내 방법의 흐름도이고다. 본 출원의 실시예는 상기 각 실시예의 기술적 수단의 기초 상에서 최적화한다.
선택적으로, 조작 안내 데이터의 수량은 적어도 하나이고, 조작 "음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계" 이전에, 조작 "제1 응용 프로그램에 의해 송신된 각 조작 안내 데이터의 키워드를 수신하는 단계"를 추가한다.상응하게, 조작 "음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계"를 "음성 정보에 대해 키워드 인식을 진행하여 음성 정보의 키워드를 얻는 단계; 각 조작 안내 데이터의 키워드를 음성 정보의 키워드와 비교하여 비교 결과가 일치한 타겟 조작 안내 데이터를 얻는 단계"로 세분화하여, 매칭 정확도 및 효율을 제공한다.
도 2에 도시된 응용 프로그램의 조작 안내 방법은 다음과 같은 단계를 포함한다.
단계S210에서, 제1 응용 프로그램에 의해 송신된 조작 안내 데이터 및 각 조작 안내 데이터의 키워드를 수신한다.
제1 응용 프로그램은 조작 안내 데이터와 키워드를 함께 송신할 수 있고, 본 단계에 표시된 바와 같이, 또한 각각 송신할 수 있으며, 구체적으로 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하기 전에, 각 조작 안내 데이터의 키워드를 송신하면, 음성 서비스 응용 프로그램은 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하기 전에, 상기 키워드를 수신할 수 있다.
각 조작 안내 데이터의 키워드의 수량은 적어도 하나이고, 예를 들면 후난 요리 선택 여부의 키워드는 후난 요리이고, 인민공원의 주차장으로 간다의 키워드는 인민공원과 주차장을 포함한다.
단계S220에서, 조작 안내 데이터를 사용자에게 제공한다.
단계S230에서, 사용자에 의해 입력된 음성 정보를 수신하고, 음성 정보에 대해 키워드 인식을 진행하여 음성 정보의 키워드를 얻는다.
선택적으로, 음성 정보를 텍스트로 변환하여 상기 텍스트에 대해 하기 임의의 조작을 수행한다. 즉, 1)텍스트를 정규식과 매칭시키고, 키워드의 위치를 결정하여 키워드를 인식하거나; 2)텍스트의 접두사와 접미사를 제거하여 키워드를 유지한다.
음성 서비스 응용 프로그램은 음성 정보를 로컬에서 차단하고, 로컬에서 음성 정보에 대해 키워드 인식을 진행하여 음성 정보의 키워드를 얻음으로써, 서버 인식이 필요없으며, 속도가 더 빠르고 효율이 더 높다. 물론, 또한 음성 정보를 서버로 송신하고 서버에서 제공하는 방법을 사용하여 키워드 인식을 진행할 수 있다.
단계S240에서, 각 조작 안내 데이터의 키워드를 음성 정보의 키워드와 비교하여, 비교 결과가 일치한 타겟 조작 안내 데이터를 얻는다.
만약 조작 안내 데이터의 키워드의 수량이 두 개 이상이고, 상기 조작 안내 데이터의 임의의 키워드와 음성 정보의 키워드의 비교 결과가 일치하면, 상기 조작 안내 데이터는 타겟 조작 안내 데이터이다.
단계S250에서, 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하고, 제1 응용 프로그램이 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 한다.
본 실시예에서, 키워드 비교 방법을 통해 음성 정보와 매칭되는 조작 안내 데이터를 결정하여 타겟 조작 안내 데이터를 정확하게 획득하고, 또한, 키워드를 비교하여 조작 안내 데이터를 결정하는 방법을 통해 속도가 더 빠르고 효율이 더 높다.
실시예3
도 3은 본 출원의 실시예3의 응용 프로그램의 조작 안내 방법의 흐름도이다. 본 출원의 실시예는 상기 각 실시예의 기술적 수단의 기초 상에서 최적화한다.
선택적으로, 조작 "제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하는 단계"를 "제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출한 것을 모니터링하고, 크로스 프로세스 액세스 인터페이스에서 조작 안내 데이터를 판독하되, 제1 응용 프로그램은 크로스 프로세스 액세스 인터페이스를 호출하여 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장하는 단계"로 세분화하고; 상응하게, 조작 "타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하는 단계"를 "크로스 프로세스 액세스 인터페이스를 호출하고, 타겟 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장하여, 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출하여 타겟 조작 안내 데이터를 획득하도록 하는 단계"로 세분화한다.
선택적으로, 조작 "제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하는 단계" 이전에, "제1 응용 프로그램의 서명을 수신하는 단계; 서명을 검증하고, 검증 통과 결과를 얻는 단계"를 추가한다.
선택적으로, 조작 "타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하는 단계"를 "타겟 조작 안내 데이터를 암호화한 후 제1 응용 프로그램에 송신하는 단계"로 세분화한다.
도 3에 도시된 응용 프로그램의 조작 안내 방법은 다음과 같은 단계를 포함한다.
단계S300에서, 제1 응용 프로그램의 서명을 수신한다.
단계S310에서, 서명을 검증하고, 검증 통과 결과를 얻는다.
구체적으로, 제1 응용 프로그램은 자신의 개인키로 데이터 패킷을 암호화하여 서명을 얻고, 서명을 데이터 패킷에 첨부한다. 제1 응용 프로그램은 서명과 데이터 패킷을 음성 서비스 응용 프로그램에 송신한다. 음성 서비스 응용 프로그램은 공개키를 사용하여 서명을 성공적으로 복호화하여 데이터 패킷을 얻고, 데이터 패킷 이름이 화이트 리스트에 있으면 검증이 통과된다.
검증이 통과된 후, 음성 서비스 응용 프로그램은 반복적인 검증없이 제1 응용 프로그램에 의해 송신된 데이터를 끊임없이 수신할 수 있다.
단계S320에서, 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출한 것을 모니터링하고, 크로스 프로세스 액세스 인터페이스에서 조작 안내 데이터를 판독하되, 제1 응용 프로그램은 크로스 프로세스 액세스 인터페이스를 호출하여 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장한다.
본 실시예는 크로스 프로세스 액세스 인터페이스를 개발하여 제1 응용 프로그램이 호출하도록 한다. 크로스 프로세스 액세스 인터페이스는 안드로이드 인터페이스 정의 언어(Android Interface definition language, AIDL)를 사용하여 개발되어, 제1 응용 프로그램과 음성 인터랙션 시스템 사이의 인터랙션이 가능하도록 한다. 크로스 프로세스 액세스 인터페이스에는 데이터의 저장 방법과 판독 방법이 패킹되어 있고, 제1 응용 프로그램은 크로스 프로세스 액세스 인터페이스를 호출하여 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장하여, 음성 서비스 응용 프로그램이 판독하도록 한다.
응용 시나리오에서, 제1 응용 프로그램과 음성 서비스 응용 프로그램은 모두 모바일 개발 플랫폼, 즉 모바일 개발 플랫폼이 통합된 소프트웨어 개발 키트(Software Development Kit, SDK)에 연결된다. 모바일 개발 플랫폼에서 크로스 프로세스 액세스 인터페이스를 개발하여 제1 응용 프로그램과 음성 서비스 응용 프로그램의 호출 및 모니터링이 용이하도록 한다.
선택적으로, 데이터 전송의 안전성을 확보하기 위해, 제1 응용 프로그램은 조작 안내 데이터를 암호화한 후, 다시 크로스 프로세스 액세스 인터페이스를 호출하여 저장한다. 상응하게, 음성 서비스 응용 프로그램은 암호화된 조작 안내 데이터를 복호화하여야 후속 조작을 수행할 수 있다.
선택적으로, 조작 안내 데이터의 포맷은 점용한 대역폭을 감소시키기 위한 Json이다.
단계S330에서, 조작 안내 데이터를 사용자에게 제공한다.
단계S340에서, 사용자에 의해 입력된 음성 정보를 수신하고, 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정한다.
단계S350에서, 크로스 프로세스 액세스 인터페이스를 호출하고, 타겟 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장하여, 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출하여 타겟 조작 안내 데이터를 획득하고, 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 한다.
구체적으로, 음성 서비스 응용 프로그램은 크로스 프로세스 액세스 인터페이스를 호출하여 타겟 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장한다. 제1 응용 프로그램은 음성 서비스 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출한 것을 모니터링하고, 마찬가지로 크로스 프로세스 액세스 인터페이스를 호출하여 타겟 조작 안내 데이터를 획득한다.
선택적으로, 음성 서비스 응용 프로그램은 타겟 조작 안내 데이터를 암호화한 후 크로스 프로세스 액세스 인터페이스에 저장하여, 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출하여 암호화된 타겟 조작 안내 데이터를 획득하고, 타겟 조작 데이터를 복호화하며; 복호화된 타겟 조작 안내 데이터에 따라 다음 조작을 수행한다.
본 실시예에서, 제1 응용 프로그램의 서명을 검증하고 타겟 조작 안내 데이터를 암호화하여 송신함으로써, 데이터 전송의 안전성을 확보한다. 크로스 프로세스 액세스 인터페이스를 통해 제1 응용 프로그램과 음성 서비스 응용 프로그램 사이의 데이터 전송을 구현하여, 데이터 전송의 신뢰성, 안정성 및 효율성을 확보한다. 설명해야 할 부분으로는, 본 실시예는 크로스 프로세스 액세스 인터페이스를 호출하여 조작 안내 데이터를 송신 및 수신하고, 크로스 프로세스 액세스 인터페이스를 호출하여 상기 실시예 및 하기 실시예의 키워드, 예비 사용자 의도 및 다음 조작 데이터를 송신 및 수신하며, 동시에 키워드, 예비 사용자 의도 및 다음 조작 데이터를 암호화하여 송신함으로써, 모든 데이터의 안전성, 신뢰성, 안정성 및 효율성을 확보한다.
실시예4
도 4는 본 출원의 실시예4의 응용 프로그램의 조작 안내 방법의 흐름도이다. 본 출원의 실시예는 상기 각 실시예의 기술적 수단의 기초 상에서 최적화한다.
선택적으로, 조작 "음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계" 이전에 "제1 응용 프로그램에 의해 송신된 각 조작 안내 데이터에 대응되는 예비 사용자 의도 및 각 조작 안내 데이터에 대응되는 다음 조작 데이터를 수신하는 단계"를 추가하고; 상응하게, 조작 "음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계" 이후에 "응용 프로그램 세트에서, 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계; 타겟 조작 안내 데이터에 대응되는 다음 조작 데이터를 제2 응용 프로그램에 송신하고, 제2 응용 프로그램이 다음 조작 데이터를 조작하도록 트리거하는 단계"를 추가한다.
선택적으로, 조작 "조작 안내 데이터를 사용자에게 제공하는 단계"를 "조작 안내 데이터를 디스플레이하는 단계; 및/또는, 조작 안내 데이터의 음성 정보를 재생하는 단계"로 세분화하고, 제공 콘텐츠를 단순화하여 사용자가 더 쉽게 수락한다.
도 4에 도시된 응용 프로그램의 조작 안내 방법은 다음과 같은 단계를 포함한다.
단계S410에서, 제1 응용 프로그램에 의해 송신된 조작 안내 데이터, 각 조작 안내 데이터에 대응되는 예비 사용자 의도 및 각 조작 안내 데이터에 대응되는 다음 조작 데이터를 수신한다.
제1 응용 프로그램은 조작 안내 데이터와 예비 사용자 의도 및 다음 조작 데이터를 함께 송신할 수 있고; 본 단계에 표시된 바와 같이, 각각 송신할 수 있으며, 구체적으로 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하기 전에, 각 조작 안내 데이터에 대응되는 예비 사용자 의도 및 다음 조작 데이터를 송신하면, 음성 서비스 응용 프로그램은 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하기 전에, 예비 사용자 의도 및 다음 조작 데이터를 수신할 수 있다.
각 조작 안내 데이터의 대응되는 예비 사용자 의도는 제1 응용 프로그램이 조작 안내 데이터에 대해 의도 분석을 수행한 후 얻은 것이고, 제1 응용 프로그램이 만약 사용자가 조작 안내 데이터에 대응되는 다음 조작을 수행하면 가능하다고 간주하는 사용자 의도이다. 예를 들면 조작 안내 데이터가 인민공원의 주차장을 간다는 것이면, 이에 대응되는 예비 사용자 의도는 네비게이션이고; 또한 조작 안내 데이터가 가수 A의 노래이면 이에 대응되는 예비 사용자 의도는 음악을 청취하는 것이다.
설명해야 할 부분으로는, 제1 응용 프로그램이 예비 사용자 의도를 충족시킬 수 없는 경우, 예를 들면 네비게이션 및 음악 재생 기능을 구비하지 않는 경우, 예비 사용자 의도를 음성 서비스 응용 프로그램에 송신한다. 제1 응용 프로그램이 예비 사용자 의도를 충족시킬 수 있는 경우, 제1 응용 프로그램에 송신할 필요가 없고, 타겟 조작 안내 데이터를 수신한 후, 본 응용 프로그램의 관련 기능을 통해 예비 사용자 의도를 만족시킬 수 있다. 이로부터 알 수 있다 시피, 만약 제1 응용 프로그램에 의해 송신된 예비 사용자 의도를 수신하면, 이는 외부에서 예비 사용자 의도를 충족시킬 수 있는 기능 지원이 필요함을 설명한다.
단계S420에서, 조작 안내 데이터를 디스플레이하고; 및/또는, 조작 안내 데이터의 음성 정보를 재생한다.
선택적으로, 조작 안내 데이터를 목록 형태로 스마트 폰 또는 자동차 단말기의 스크린과 같은 전자 기기에 디스플레이하고, 및/또는 조작 안내 데이터에 대해 음성 합성을 진행하여 음성 정보를 얻고, 전자 기기의 플레이어를 통해 재생한다. 디스플레이 및 음성 재생 중 적어도 하나의 방식을 통해 조작 안내 데이터를 사용자에게 제공하여 제공 방식이 다양하며, 선행기술의 여러 페이지의 조작 안내 페이지와 비교하면, 본 실시예는 다음 조작의 안내 데이터만 디스플레이하거나 재생하기에, 제공 콘텐츠를 단순화하여 사용자가 더 쉽게 수락한다.
선택적으로, 조작 안내 데이터가 많을 경우, 조작 안내 데이터를 페이징 디스플레이하고, 페이징 디스플레이 모드는 조작 안내 데이터의 데이터 양을 향상시키는데 유리하며, 페이징 방식을 통해 단일 페이지의 데이터 양을 한정하고 페이지의 간결을 확보한다.
단계S430에서, 사용자에 의해 입력된 음성 정보를 수신하고, 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정한다.
선택적으로, 조작 안내 데이터를 페이징 디스플레이하는 경우, 사용자에 의해 입력된 적어도 하나의 라운드의 음성 정보를 수신하고, 각 라운드의 음성 정보를 인식하며; 만약 페이지 번호 정보가 인식되면 페이지 번호 정보에 대응되는 조작 안내 데이터를 디스플레이하고; 만약 페이지 번호 정보가 인식되지 않으면 현재 페이지에 디스플레이된 조작 안내 데이터에서 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정한다.
페이지 번호 정보는 “이전 페이지”, “다음 페이지” 및 “제X 페이지”를 포함한다. 사용자는 3 라운드의 “다음 페이지”를 연속으로 입력하는 것과 같이 적어도 하나의 라운드의 음성 정보를 입력할 수 있다. 만약 페이지 번호 정보가 인식되면 페이지 번호 정보에 대응되는 조작 안내 데이터를 전자 기기의 스크린에 디스플레이한다. 만약 페이지 번호 정보가 인식되지 않으면 음성 정보에 대해 키워드 인식을 진행하여 음성 정보의 키워드를 얻고, 현재 페이지에 디스플레이된 조작 안내 데이터의 키워드와 음성 정보의 키워드를 비교하여 비교 결과가 일치한 타겟 조작 안내 데이터를 얻는다. 본 실시예에서, 사용자는 음성을 통해 페이지 넘기기를 제어할 수 있고, 단일 라운드 조작에서 다단계 음성 입력 조작을 겸용한다.
선택적으로, 단계S420 이후의 설정된 기간, 예컨대 2분 이내에 사용자에 의해 입력된 음성 정보가 수신되지 않으면, 임의의 조작 안내 데이터를 타겟 조작 안내 데이터로 사용하거나, 또는 이번 조작을 종료한다.
단계S440에서, 응용 프로그램 세트에서, 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정한다.
전자 기기에는 제1 응용 프로그램 및 음성 서비스 응용 프로그램 외의 복수개의 응용 프로그램이 설치되어, 응용 프로그램 세트을 구성한다. 응용 프로그램 세트의 응용 프로그램은 예비 사용자 의도를 충족시킬 수 있다.
선택적으로, 예비 사용자 의도와 예비 사용자 의도를 충족시킬 수 있는 응용 프로그램의 대응 관계를 미리 구축하고, 예를 들면 네비게이션과 지도 응용 프로그램의 대응 관계를 구축하며, 음악 청취와 음악 응용 프로그램의 대응 관계를 구축한다. 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 결정한 후, 대응 관계에 따라 결정된 예비 사용자 의도에 대응되는 응용 프로그램을 선택하고, 제2 응용 프로그램이라고 지칭하여 제1 응용 프로그램의 명명과 구별한다.
단계S450에서, 타겟 조작 안내 데이터에 대응되는 다음 조작 데이터를 제2 응용 프로그램에 송신하고, 제2 응용 프로그램이 다음 조작 데이터를 조작하도록 트리거한다.
선택적으로, 상기 응용 프로그램 세트는 마찬가지로 모바일 개발 플랫폼에 연결되고, 음성 서비스 응용 프로그램에 의해 제어된다. 구체적으로, 음성 서비스 응용 프로그램은 타겟 조작 안내 데이터에 대응되는 조작 명령과 파라미터를 제2 응용 프로그램에 송신하고, 예를 들면 인민공원의 주차장에 간다의 조작 명령은 네비게이션이고, 파라미터는 현재 위치와 목적지인 인민공원의 주차장이다. 나아가, 음성 서비스 응용 프로그램은 제2 응용 프로그램이 조작 명령과 파라미터를 조작하도록 트리거하고, 예를 들면 제2 응용 프로그램은 인민공원의 주차장으로 자발적으로 네비게이션한다.
예비 사용자 의도의 정확도를 우선으로 감안하여, 선택적으로, 음성 정보에 대해 의도 인식을 진행하여 명확한 사용자 의도를 얻고; 만약 명확한 사용자 의도가 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도와 일치하면, 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정한다. 구체적으로 음성 정보의 텍스트를 의도 인식 모델에 입력하여 의도 인식 모델에 의해 출력되는 사용자 의도를 얻고, 명확한 사용자 의도라고 지칭하여 예비 사용자 의도의 명명과 구별한다. 명확한 사용자 의도의 정확도가 높기에, 음성 정보에 대해 의도 인식을 진행하여 명확한 사용자 의도를 다시 얻고; 만약 음성 정보의 명확한 사용자 의도가 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도와 일치하면, 사용자에게 상기 의도가 확실히 있음을 설명하고, 예비 사용자 의도 및 제2 응용 프로그램을 결정하는 정확성을 향상시킨다.
단계S460에서, 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하여, 제1 응용 프로그램이 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 한다.
설명해야 할 부분으로는, 단계S440-단계S450은 단계S460과 병행하여 수행할 수 있거나, 먼저 단계S460을 수행하고 다시 단계S440-단계S450을 수행할 수 있다.
본 실시예에서, 제1 응용 프로그램은 조작 안내 데이터의 예비 사용자 의도 및 다음 조작 데이터를 제공하고, 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하여 다음 조작 데이터를 제2 응용 프로그램에 송신하며, 제2 응용 프로그램이 다음 조작 데이터를 조작하도록 자발적으로 트리거하여 사용자 의도를 구현한다. 본 실시예는 제1 응용 프로그램에서 조작 안내를 진행할 뿐만 아니라, 제2 응용 프로그램이 사용자 의도를 구현하도록 자발적으로 트리거 할 수 있다.
실시예5
도 5는 본 출원의 실시예5의 응용 프로그램의 조작 안내 장치의 흐름도이다. 본 출원의 실시예는 사용자가 응용 프로그램을 단계적으로 조작하도록 안내하는 상황에 적용되며, 상기 장치는 소프트웨어 및/또는 하드웨어를 사용하여 구현되고, 구체적으로 일정한 데이터 연산 능력을 구비한 전자 기기에 배치된다.
도 5에 도시된 응용 프로그램의 조작 안내 장치(500)는 수신 모듈(501), 제공 모듈(502), 결정 모듈(503) 및 송신 모듈(504)을 포함한다.
수신 모듈(501)은 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하고, 조작 안내 데이터는 제1 응용 프로그램이 사용자의 현재 조작에 따라 얻은 다음 조작의 안내 데이터이다.
제공 모듈(502)은 조작 안내 데이터를 사용자에게 제공한다.
결정 모듈(503)은 사용자에 의해 입력된 음성 정보를 수신하고, 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정한다.
송신 모듈(504)은 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하여, 제1 응용 프로그램이 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 한다.
본 출원의 실시예에서, 제1 응용 프로그램에 의해 송신된 사용자의 다음 조작의 조작 안내 데이터를 수신하고, 상기 조작 안내 데이터를 사용자에게 제공함으로써 사용자가 다음 조작을 알게 한다. 사용자가 다음 조작의 음성 정보를 입력하여, 음성 정보와 매칭되는 타겟 조작 데이터를 결정하고, 음성 입력의 방식은 사용자의 조작이 용이하도록 하며, 사용자와 음성 서비스 응용 프로그램 사이의 인터랙션 체험 느낌을 향상시킨다. 다음 타겟 조작 안내 데이터를 제1 응용 프로그램에 송신하고, 제1 응용 프로그램은 타겟 조작 안내 데이터에 따라 다음 조작을 바로 수행한다. 본 실시예의 제1 응용 프로그램은 음성 인식 기능을 통합할 필요가 없고, 즉 제1 응용 프로그램의 내부 구현 로직을 수정할 필요가 없고, 조작 안내 데이터를 제공하기만 하면 사용자가 다음 조작을 수행하도록 자발적으로 안내할 수 있다. 제1 응용 프로그램이 여러 라운드의 조작 안내 데이터를 제공할 경우, 사용자가 단계적으로 조작을 수행하도록 자발적으로 안내할 수 있으며, 효율적이고 편리하게 자발적인 여러 라운드의 조작 안내를 구현하고, 사용자 기억이 필요하지 않은 동시에, 제1 응용 프로그램이 사용자의 구체적인 조작 행동을 획득하기 용이하며, 사용자에 대한 행동 분석을 진행하는데 유리하다.
나아가, 조작 안내 데이터의 수량은 적어도 하나이고, 상기 장치는 제1 응용 프로그램에 의해 송신된 각 조작 안내 데이터의 키워드를 수신하기 위한 키워드 수신 모듈을 더 포함한다. 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정할 경우, 결정 모듈(503)은 구체적으로 음성 정보에 대해 키워드 인식을 진행하여 음성 정보의 키워드를 얻고; 각 조작 안내 데이터의 키워드를 음성 정보의 키워드와 비교하여, 비교 결과가 일치한 타겟 조작 안내 데이터를 얻는다.
나아가, 수신 모듈(501)은 구체적으로 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출한 것을 모니터링하고, 크로스 프로세스 액세스 인터페이스에서 조작 안내 데이터를 판독하되, 제1 응용 프로그램은 크로스 프로세스 액세스 인터페이스를 호출하여 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장한다. 송신 모듈(504)은 구체적으로 크로스 프로세스 액세스 인터페이스를 호출하고, 타겟 조작 안내 데이터를 크로스 프로세스 액세스 인터페이스에 저장하여, 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출하여 타겟 조작 안내 데이터를 획득하도록 한다.
나아가, 상기 장치는 제1 응용 프로그램에 의해 송신된 각 조작 안내 데이터에 대응되는 예비 사용자 의도 및 각 조작 안내 데이터에 대응되는 다음 조작 데이터를 수신하기 위한 예비 사용자 의도 및 다음 조작 데이터 수신 모듈을 더 포함한다. 상기 장치는 응용 프로그램 결정 모듈 및 트리거링 모듈을 더 포함하며; 응용 프로그램 결정 모듈은 응용 프로그램 세트에서, 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하고, 트리거링 모듈은 타겟 조작 안내 데이터에 대응되는 다음 조작 데이터를 제2 응용 프로그램에 송신하며, 제2 응용 프로그램이 다음 조작 데이터를 조작하도록 트리거한다.
나아가, 응용 프로그램 결정 모듈은 구체적으로 음성 정보에 대해 의도 인식을 진행하여 명확한 사용자 의도를 얻고; 만약 명확한 사용자 의도가 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도와 일치하면, 응용 프로그램 세트에서, 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정한다.
나아가, 제공 모듈(502)은 구체적으로 조작 안내 데이터를 디스플레이하고; 및/또는, 조작 안내 데이터의 음성 정보를 재생한다. 제공 모듈(502)은 조작 안내 데이터를 디스플레이할 경우, 구체적으로 조작 안내 데이터를 페이징 디스플레이한다. 결정 모듈(503)은 구체적으로 사용자에 의해 입력된 적어도 하나의 라운드의 음성 정보를 수신하고, 각 라운드의 음성 정보를 인식하며; 만약 페이지 번호 정보가 인식되면 페이지 번호 정보에 대응되는 조작 안내 데이터를 디스플레이하고; 만약 페이지 번호 정보가 인식되지 않으면, 현재 페이지에 디스플레이된 조작 안내 데이터에서 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정한다.
나아가, 상기 장치는 제1 응용 프로그램의 서명을 수신하고 서명을 검증하며 검증 통과 결과를 얻기 위한 검증 모듈을 더 포함한다. 송신 모듈(504)은 구체적으로 타겟 조작 안내 데이터를 암호화한 후 제1 응용 프로그램에 송신한다.
상기 응용 프로그램의 조작 안내 장치는 본 출원의 임의의 실시예에서 제공하는 응용 프로그램의 조작 안내 방법을 수행할 수 있고, 응용 프로그램의 조작 안내 방법을 수행하는 상응한 기능 모듈 및 유리한 효과를 갖는다.
실시예6
본 출원의 실시예에 따르면, 본 출원은 전자 기기 및 판독 가능 저장 매체를 더 제공한다.
본 출원의 실시예에 따르면, 본 출원은 비일시적 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 더 제공하고, 상기 컴퓨터 프로그램은 상기 컴퓨터가 본 출원의 실시예에서 제공하는 응용 프로그램의 조작 안내 방법을 수행하도록 한다.
도 6에 도시된 바와 같이, 도 6은 본 출원의 실시예의 응용 프로그램의 조작 안내 방법을 구현하는 전자 기기의 블록도이다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인용 정보 단말기, 서버, 블레이드 서버, 메인 프레임 및 다른 적합한 컴퓨터 등의 다양한 형태의 디지털 컴퓨터를 가리킨다. 전자 기기는 또한 개인용 정보 단말기, 셀룰러 폰, 스마트 폰, 웨어러블 장치 및 다른 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타낼 수 있다. 본 명세서에 도시된 구성 요소, 그들의 연결 및 관계 및 그 기능은 단지 예시에 불과하며, 본 명세서에 기술되거나 청구된 본 출원의 구현을 한정하도록 의도되지 않는다.
도 6에 도시된 바와 같이, 상기 전자 기기는 하나 또는 복수의 프로세서(601), 메모리(602) 및 고속 인터페이스 및 저속 인터페이스를 포함하는 각 구성 요소를 연결하기 위한 인터페이스를 포함한다. 각 구성 요소는 서로 다른 버스를 사용하여 서로 연결되며, 공동 메인보드에 설치되거나 필요에 따라 다른 방식으로 설치될 수 있다. 프로세서는 외부 입력/출력 장치(예를 들어, 인터페이스에 연결된 디스플레이 장치)에 GUI의 그래픽 정보를 표시하기 위해 메모리에 저장된 명령을 포함하여 전자 기기 내에서 실행되는 명령을 처리할 수 있다. 다른 실시 방식에서, 필요한 경우, 복수의 프로세서 및/또는 복수의 버스를 복수의 메모리와 함께 사용할 수 있다. 마찬가지로, 여러 전자 기기를 연결할 수 있고, 각 기기는 일부 필요한 동작(예를 들어, 서버 어레이, 한 그룹의 블레이드 서버 또는 멀티 프로세서 시스템)을 제공할 수 있다. 도 6에서는 프로세서(601)를 예로 한다.
메모리(602)는 본 출원에 의해 제공된 비일시적 컴퓨터 판독 가능 저장 매체이다. 적어도 하나의 프로세서에 의해 본 출원에서 제공하는 응용 프로그램의 조작 안내 방법을 수행하도록, 메모리에는 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장된다. 본 출원의 비일시적 컴퓨터 판독 가능 저장 매체에는 컴퓨터가 본 출원에서 제공하는 응용 프로그램의 조작 안내 방법을 수행하도록 하는 컴퓨터 명령이 저장된다.
메모리(602)는 비일시적 컴퓨터 판독 가능 저장 매체로서, 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행 가능 프로그램, 본 출원의 실시예에서의 응용 프로그램의 조작 안내의 방법에 대응되는 프로그램 명령/모듈과 같은 모듈(예를 들면 도 5에 도시된 수신 모듈(501), 제공 모듈(502), 결정 모듈(503) 및 송신 모듈(504)을 포함)을 저장하기 위해 사용될 수 있다. 프로세서(601)는 메모리(602)에 저장된 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행하여 서버의 다양한 기능 응용및 데이터 처리를 실행하고, 즉 상기 방법 실시예의 응용 프로그램의 조작 안내 방법을 구현한다.
메모리(602)는 프로그램 저장 영역 및 데이터 저장 영역을 포함할 수 있고, 프로그램 저장 영역은 운영 체제 및 적어도 하나의 기능에 필요한 응용 프로그램이 저장될 수 있고, 데이터 저장 영역에는 응용 프로그램의 조작 안내 방법을 구현하는 전자 기기를 사용하여 생성된 데이터가 저장될 수 있다. 또한, 메모리(602)는 고속 랜덤 액세스 메모리를 포함할 수 있고, 또한 자기 디스크 저장 장치, 플래시 메모리 장치 또는 다른 비일시적 솔리드 스테이트 저장 장치와 같은 적어도 하나의 비일시적 메모리를 포함할 수 있다. 일부 실시예에서, 메모리(602)는 프로세서(601)에 대해 원격으로 설치된 메모리를 선택적으로 포함할 수 있고, 이러한 원격 메모리는 네트워크를 통해 응용 프로그램의 조작 안내 방법을 실행하는 전자 기기에 연결될 수 있다. 상기 네트워크의 구현예는 인터넷, 인트라넷, 근거리 통신망, 이동 통신 네트워크 및 이들의 조합을 포함하나 이에 한정되지 않는다.
응용 프로그램의 조작 안내 방법을 실행하는 전자 기기는 입력 장치(603) 및 출력 장치(604)를 더 포함할 수 있다. 프로세서(601), 메모리(602), 입력 장치(603) 및 출력 장치(604)는 버스를 통해 연결되거나 또는 다른 방식으로 연결될 수 있으며, 도 6은 버스를 통한 연결을 예시한 것이다.
입력 장치(603)는 입력된 숫자 또는 문자 정보를 수신할 수 있고, 응용 프로그램의 조작 안내 방법을 실행하는 전자 기기의 사용자 설정 및 기능 제어와 관련된 키 신호 입력을 생성할 수 있으며, 예를 들어 터치 스크린, 키 패드, 마우스, 트랙 패드, 터치 패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙 볼, 조이스틱 및 기타 입력 장치일 수 있다. 출력 장치(604)는 디스플레이 장치, 보조 조명 장치(예를 들어, LED), 촉각 피드백 장치(예를 들어, 진동 모터) 등을 포함할 수 있다. 상기 디스플레이 장치는 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있으나 이에 한정되지 않는다. 일부 실시 방식에서, 디스플레이 장치는 터치 스크린일 수 있다.
여기서 설명된 시스템 및 기술의 다양한 실시 방식은 디지털 전자 회로, 집적 회로 시스템, 전용 ASIC(특정 용도 지향 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에 의해 구현될 수 있다. 이러한 다양한 실시 방식은 하나 또는 복수의 컴퓨터 프로그램에 의해 실시될 수 있고, 상기 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그래밍 가능 시스템에 의해 실행 및/또는 해석될 수 있으며, 상기 프로그래밍 가능 프로세서는 전용 또는 일반 프로그래밍 가능 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령을 수신하며, 데이터 및 명령을 상기 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치에 전송할 수 있다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 응용 프로그램 또는 코드라고도 함)에는 프로그래밍 가능 프로세서의 기계 명령이 포함되고, 고급 프로세스 및/또는 객체 지향 프로그래밍 언어 및/또는 어셈블리 언어/기계 언어를 사용하여 이러한 컴퓨팅 프로그램을 구현할 수 있다. 본 명세서에서 사용되는 용어 "기계 판독 가능 매체" 및 "컴퓨터 판독 가능 매체"는 프로그래밍 가능 프로세서에 기계 명령 및/또는 데이터를 제공하기 위해 사용되는 임의의 컴퓨터 프로그램 제품, 기기 및/또는 장치(예를 들어, 자기 디스크, 광 디스크, 메모리, 프로그래밍 가능 논리 장치(PLD))를 가리키며, 기계 판독 가능 신호인 기계 명령을 수신하는 기계 판독 가능 매체를 포함한다. 용어 "기계 판독 가능 신호"는 기계 명령 및/또는 데이터를 프로그래밍 가능 프로세서에 제공하기 위한 임의의 신호를 지칭한다.
사용자와의 인터랙션을 제공하기 위해, 컴퓨터에서 여기에 설명된 시스템 및 기술을 구현할 수 있다. 상기 컴퓨터는 사용자에게 정보를 표시하기 위한 디스플레이 장치(예를 들면 CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터)와 키보드 및 포인팅 장치(예를 들어, 마우스 또는 트랙 볼)를 포함하고, 사용자는 상기 키보드 및 상기 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 다른 종류의 장치를 사용하여 사용자와의 인터랙션을 제공할 수도 있다. 예를 들어, 사용자에게 제공되는 피드백은 임의의 형태의 감각 피드백(예를 들어, 시각적 피드백, 청각적 피드백 또는 촉각적 피드백) 일 수 있고, 임의의 형태(음향 입력, 음성 입력 또는 촉각 입력을 포함)로 사용자에 의해 입력된 정보를 수신할 수 있다.
여기서 설명된 시스템 및 기술은 백 엔드 컴포넌트(예를 들어, 데이터 서버)를 포함하는 컴퓨팅 시스템 또는 미들웨어 컴포넌트(예를 들어, 애플리케이션 서버)를 포함하는 컴퓨팅 시스템 또는 프론트 엔드 컴포넌트(예를 들어, 그래픽 사용자 인터페이스 또는 웹 브라우저를 가진 사용자 컴퓨터일 수 있으며, 사용자는 그래픽 사용자 인터페이스 또는 웹 브라우저를 통해 여기에 설명된 시스템 및 기술의 구현과 상호 작용할 수 있음)를 포함하는 컴퓨팅 시스템 또는 이러한 백 엔드 컴포넌트, 미들웨어 컴포넌트 또는 프론트 엔드 컴포넌트의 임의의 조합을 포함하는 컴퓨팅 시스템에 의해 구현될 수 있다. 시스템의 컴포넌트는 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)에 의해 상호 연결될 수 있다. 통신 네트워크의 예로는 근거리 통신망 (LAN), 광역 통신망 (WAN), 인터넷 및 블록 체인 네트워크가 포함된다.
컴퓨터 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 떨어져 있으며, 일반적으로 통신 네트워크를 통해 인터랙션한다. 클라이언트와 서버 간의 관계는 해당 컴퓨터에서 실행되고 서로 클라이언트-서버 관계가 있는 컴퓨터 프로그램에 의해 발생된다.
상기에 도시된 다양한 형태의 과정을 통해 단계를 재정렬, 추가 또는 삭제할 수 있다는 것을 이해해야 한다. 예를 들어, 본 출원에 설명된 각 단계들은 병렬, 순차적 또는 상이한 순서로 수행될 수 있으며, 본 출원에 개시된 기술적 수단이 원하는 결과를 달성할 수만 있으면 별도로 한정되지 않는다.
상기 구체적인 실시 방식은 본 출원의 보호 범위에 대한 제한을 구성하지 않는다. 당업자는 설계 요건 및 다른 요인에 따라 다양한 변형, 조합, 하위 조합 및 대체가 이루어질 수 있다는 것을 이해해야 한다. 본 출원의 원리와 원칙 내에서 이루어진 모든 수정, 동등한 대체 및 개선은 모두 본 출원의 보호 범위에 포함된다.

Claims (12)

  1. 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하되, 상기 조작 안내 데이터는 상기 제1 응용 프로그램이 사용자의 현재 조작에 따라 얻은 다음 조작의 안내 데이터인 단계;
    상기 조작 안내 데이터를 상기 사용자에게 제공하는 단계;
    상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계; 및
    상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하여, 상기 제1 응용 프로그램이 상기 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 하는 단계; 를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  2. 제1항에 있어서,
    상기 조작 안내 데이터의 수량은 적어도 하나이고,
    상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계 이전에,
    상기 제1 응용 프로그램에 의해 송신된 각 상기 조작 안내 데이터의 키워드를 수신하는 단계를 더 포함하며,
    상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계는,
    상기 음성 정보에 대해 키워드 인식을 진행하여 상기 음성 정보의 키워드를 얻는 단계; 및
    각 상기 조작 안내 데이터의 키워드를 상기 음성 정보의 키워드와 비교하여, 비교 결과가 일치한 타겟 조작 안내 데이터를 얻는 단계; 를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  3. 제1항에 있어서,
    상기 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하는 단계는,
    상기 제1 응용 프로그램이 크로스 프로세스 액세스 인터페이스를 호출한 것을 모니터링하고, 상기 크로스 프로세스 액세스 인터페이스에서 조작 안내 데이터를 판독하되, 여기서, 상기 제1 응용 프로그램은 상기 크로스 프로세스 액세스 인터페이스를 호출하여 상기 조작 안내 데이터를 상기 크로스 프로세스 액세스 인터페이스에 저장하는 단계를 포함하며,
    상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하는 단계는,
    상기 크로스 프로세스 액세스 인터페이스를 호출하고, 상기 타겟 조작 안내 데이터를 상기 크로스 프로세스 액세스 인터페이스에 저장하여, 상기 제1 응용 프로그램이 상기 크로스 프로세스 액세스 인터페이스를 호출하여 상기 타겟 조작 안내 데이터를 획득하도록 하는 단계를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  4. 제1항에 있어서,
    상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계 이전에,
    상기 제1 응용 프로그램에 의해 송신된 각 상기 조작 안내 데이터에 대응되는 예비 사용자 의도 및 각 상기 조작 안내 데이터에 대응되는 다음 조작 데이터를 수신하는 단계를 더 포함하고,
    상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계 이후에,
    응용 프로그램 세트에서, 상기 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계; 및
    상기 타겟 조작 안내 데이터에 대응되는 다음 조작 데이터를 상기 제2 응용 프로그램에 송신하고, 상기 제2 응용 프로그램이 상기 다음 조작 데이터를 조작하도록 트리거하는 단계; 를 더 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  5. 제4항에 있어서,
    상기 응용 프로그램 세트에서, 상기 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계는,
    상기 음성 정보에 대해 의도 인식을 진행하여 명확한 사용자 의도를 얻는 단계; 및
    만약 상기 명확한 사용자 의도가 상기 타겟 조작 안내 데이터에 대응되는 예비 사용자 의도와 일치하면, 응용 프로그램 세트에서, 상기 예비 사용자 의도를 충족시키는 제2 응용 프로그램을 결정하는 단계; 를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  6. 제1항에 있어서,
    상기 조작 안내 데이터를 상기 사용자에게 제공하는 단계는,
    상기 조작 안내 데이터를 디스플레이하는 단계; 및
    상기 조작 안내 데이터의 음성 정보를 재생하는 단계; 중의 적어도 하나를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  7. 제6항에 있어서,
    상기 조작 안내 데이터를 디스플레이하는 단계는,
    상기 조작 안내 데이터를 페이징 디스플레이하는 단계를 포함하며,
    상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계는,
    상기 사용자에 의해 입력된 적어도 하나의 라운드의 음성 정보를 수신하고, 각 라운드의 상기 음성 정보를 인식하는 단계;
    만약 페이지 번호 정보가 인식되면, 상기 페이지 번호 정보에 대응되는 조작 안내 데이터를 디스플레이하는 단계; 및
    만약 페이지 번호 정보가 인식되지 않으면, 현재 페이지에 디스플레이된 조작 안내 데이터에서 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하는 단계; 를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  8. 제1항에 있어서,
    상기 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하는 단계 이전에,
    상기 제1 응용 프로그램의 서명을 수신하는 단계; 및
    상기 서명을 검증하고, 검증 통과 결과를 얻는 단계; 를 더 포함하고,
    상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하는 단계는,
    상기 타겟 조작 안내 데이터를 암호화한 후 상기 제1 응용 프로그램에 송신하는 단계를 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 방법.
  9. 제1 응용 프로그램에 의해 송신된 조작 안내 데이터를 수신하되, 상기 조작 안내 데이터는 상기 제1 응용 프로그램이 사용자의 현재 조작에 따라 얻은 다음 조작의 안내 데이터인 수신 모듈;
    상기 조작 안내 데이터를 상기 사용자에게 제공하기 위한 제공 모듈;
    상기 사용자에 의해 입력된 음성 정보를 수신하고, 상기 음성 정보와 매칭되는 타겟 조작 안내 데이터를 결정하기 위한 결정 모듈; 및
    상기 타겟 조작 안내 데이터를 상기 제1 응용 프로그램에 송신하여, 상기 제1 응용 프로그램이 상기 타겟 조작 안내 데이터에 따라 다음 조작을 수행하도록 하기 위한 송신 모듈; 을 포함하는,
    것을 특징으로 하는 응용 프로그램의 조작 안내 장치.
  10. 적어도 하나의 프로세서; 및
    상기 적어도 하나의 프로세서에 통신 가능하게 연결된 메모리; 를 포함하고,
    상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령이 저장되어 있고, 상기 명령은 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제1항 내지 제8항 중 어느 한 항에 따른 응용 프로그램의 조작 안내 방법을 수행하도록 하는,
    것을 특징으로 하는 전자 기기.
  11. 컴퓨터 명령이 저장된 비일시적 컴퓨터 판독 가능 저장 매체에 있어서,
    상기 컴퓨터 명령은 상기 컴퓨터가 제1항 내지 제8항 중 어느 한 항에 따른 응용 프로그램의 조작 안내 방법을 수행하도록 하는,
    것을 특징으로 하는 비 일시적 컴퓨터 판독 가능 저장 매체.
  12. 비일시적 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램에 있어서,
    상기 컴퓨터 프로그램은 상기 컴퓨터가 제1항 내지 제8항 중 어느 한 항에 따른 응용 프로그램의 조작 안내 방법을 수행하도록 하는,
    것을 특징으로 하는 비일시적 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램.
KR1020210064900A 2020-05-21 2021-05-20 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체 KR20210068333A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010437003.7 2020-05-21
CN202010437003.7A CN111638928B (zh) 2020-05-21 2020-05-21 应用程序的操作引导方法、装置、设备和可读存储介质

Publications (1)

Publication Number Publication Date
KR20210068333A true KR20210068333A (ko) 2021-06-09

Family

ID=72333019

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210064900A KR20210068333A (ko) 2020-05-21 2021-05-20 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체

Country Status (3)

Country Link
JP (1) JP7381518B2 (ko)
KR (1) KR20210068333A (ko)
CN (1) CN111638928B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114385053A (zh) * 2022-01-18 2022-04-22 阿里巴巴(中国)有限公司 交互处理方法、装置、电子设备及计算机存储介质
CN115220851A (zh) * 2022-09-09 2022-10-21 荣耀终端有限公司 操作指引的方法、电子设备及可读存储介质

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347459A (zh) * 2020-10-23 2021-02-09 上汽通用五菱汽车股份有限公司 Adas功能激活方法、智能车辆及计算机存储介质
CN112885361A (zh) * 2021-03-01 2021-06-01 长沙克莱自动化设备有限公司 语音控制方法、装置、电子设备和存储介质
CN113485779A (zh) * 2021-07-19 2021-10-08 维沃移动通信有限公司 应用程序的操作引导方法和装置
CN114489907B (zh) * 2022-01-29 2024-03-12 国泰新点软件股份有限公司 系统操作引导方法、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003091412A (ja) 2001-09-18 2003-03-28 Hcx:Kk ドキュメント処理装置およびドキュメント処理方法
JP4837594B2 (ja) 2007-02-16 2011-12-14 三菱電機株式会社 車載マルチメディア装置
KR20140089861A (ko) 2013-01-07 2014-07-16 삼성전자주식회사 디스플레이 장치 및 그의 제어 방법
US9524147B2 (en) * 2013-05-10 2016-12-20 Sap Se Entity-based cross-application navigation
US10176336B2 (en) * 2015-07-27 2019-01-08 Microsoft Technology Licensing, Llc Automated data transfer from mobile application silos to authorized third-party applications
CN108287739A (zh) * 2017-12-19 2018-07-17 维沃移动通信有限公司 一种操作引导方法及移动终端
CN108769725B (zh) * 2018-06-07 2020-11-03 广州虎牙信息科技有限公司 直播应用程序启动方法、装置、存储介质和计算机设备
CN109657236B (zh) * 2018-12-07 2022-02-18 腾讯科技(深圳)有限公司 引导信息获取方法、装置、电子装置及存储介质
CN110069177A (zh) * 2019-03-13 2019-07-30 平安普惠企业管理有限公司 电子装置、应用程序操作引导方法及存储介质
CN110334352B (zh) * 2019-07-08 2023-07-07 腾讯科技(深圳)有限公司 引导信息显示方法、装置、终端及存储介质
CN110459222A (zh) * 2019-09-06 2019-11-15 Oppo广东移动通信有限公司 语音控制方法、语音控制装置及终端设备
CN110647305B (zh) * 2019-09-29 2023-10-31 阿波罗智联(北京)科技有限公司 应用程序的语音交互方法、装置、设备和介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114385053A (zh) * 2022-01-18 2022-04-22 阿里巴巴(中国)有限公司 交互处理方法、装置、电子设备及计算机存储介质
CN115220851A (zh) * 2022-09-09 2022-10-21 荣耀终端有限公司 操作指引的方法、电子设备及可读存储介质
CN115220851B (zh) * 2022-09-09 2023-07-21 荣耀终端有限公司 操作指引的方法、电子设备及可读存储介质

Also Published As

Publication number Publication date
JP2021121969A (ja) 2021-08-26
JP7381518B2 (ja) 2023-11-15
CN111638928B (zh) 2023-09-01
CN111638928A (zh) 2020-09-08

Similar Documents

Publication Publication Date Title
KR20210068333A (ko) 응용 프로그램의 조작 안내 방법, 장치, 기기 및 판독 가능 저장 매체
TWI511125B (zh) 語音操控方法、行動終端裝置及語音操控系統
US11749276B2 (en) Voice assistant-enabled web application or web page
KR20180115628A (ko) 복수의 지능형 개인 비서 서비스를 위한 관리 계층
JP2021099533A (ja) 音声インタラクション処理方法、装置及び電子機器
CN110489440B (zh) 数据查询方法和装置
WO2020259133A1 (zh) 录制热门片段方法、装置、电子设备和可读介质
US10375342B2 (en) Browsing remote content using a native user interface
JP2021111379A (ja) インタラクション情報推薦方法及び装置
CN109800557B (zh) 基于区块链的集成处理方法、装置、服务器、设备及介质
EP3832492A1 (en) Method and apparatus for recommending voice packet, electronic device, and storage medium
US11343468B2 (en) Method, system, and non-transitory computer readable record medium for providing communication using video call bot
US20230350502A1 (en) Information input method, system of cloud input method and client
KR20210152396A (ko) 비디오 처리 방법, 장치, 전자 기기 및 기록 매체
CN104461512A (zh) 一种快速启动应用程序的方法和装置
US11449313B2 (en) System and method applied to integrated development environment
WO2024037480A1 (zh) 交互方法、装置、电子设备和存储介质
US20210098012A1 (en) Voice Skill Recommendation Method, Apparatus, Device and Storage Medium
US10747755B2 (en) Method for providing immediate result for user input, and apparatus therefor
JP6986590B2 (ja) 音声スキル作成方法、音声スキル作成装置、電子機器及び記憶媒体
JP2024509824A (ja) ドキュメントの編集方法、装置、デバイス及び記憶媒体
WO2024022432A1 (zh) 信息处理方法、装置及电子设备
WO2024125214A1 (zh) 信息处理方法及设备
WO2024036979A9 (zh) 一种多媒体资源播放方法及相关装置
KR20240043486A (ko) 레이어 기반의 다자 협업 동영상 편집 장치 및 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application