RU2015102279A - Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система - Google Patents

Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система Download PDF

Info

Publication number
RU2015102279A
RU2015102279A RU2015102279A RU2015102279A RU2015102279A RU 2015102279 A RU2015102279 A RU 2015102279A RU 2015102279 A RU2015102279 A RU 2015102279A RU 2015102279 A RU2015102279 A RU 2015102279A RU 2015102279 A RU2015102279 A RU 2015102279A
Authority
RU
Russia
Prior art keywords
text
electronic device
tags
application
input field
Prior art date
Application number
RU2015102279A
Other languages
English (en)
Other versions
RU2646350C2 (ru
Inventor
Евгений Михайлович Волков
Денис Сергеевич Филиппов
Илья Алексеевич Мельников
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2015102279A priority Critical patent/RU2646350C2/ru
Priority to EP15879783.7A priority patent/EP3251113A4/en
Priority to PCT/IB2015/053789 priority patent/WO2016120675A1/en
Priority to US15/525,614 priority patent/US20170372700A1/en
Publication of RU2015102279A publication Critical patent/RU2015102279A/ru
Application granted granted Critical
Publication of RU2646350C2 publication Critical patent/RU2646350C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/686Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title or artist information, time, location or usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Machine Translation (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

1. Способ ввода данных в электронное устройство, включающий в себя:получение голосового запроса через голосовой интерфейс электронного устройства;получение множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, относящегося к приложению на упомянутом электронном устройстве;получение по меньшей мере одной части текста, связанной с соответствующим тегом, который является производным от упомянутого голосового запроса;заполнение по меньшей мере одного поля ввода упомянутого приложения с помощью соответствующей части текста, которая связана с соответствующим тегом, связанным с полем ввода.2. Способ по п. 1, в котором каждый из упомянутого множества тегов предоставляет семантическое описание для соответствующего поля ввода.3. Способ по п. 1, в котором упомянутое приложение включает в себя веб-приложение, упомянутое веб-приложение включает в себя множество веб-страниц, каждая страница включает в себя по меньшей мере одно поле ввода, множество упомянутых полей ввода обладает соответствующими тегами.4. Способ по п. 3, в котором по меньшей мере одна из упомянутых веб-страниц включает в себя определение потока операций, и это определение указывает на последовательность страниц, включая упомянутое веб-приложение, и для каждой страницы - набор идентификаторов для каждого поля ввода упомянутой страницы.5. Способ по п. 4, в котором упомянутое определение потока операций включает в себя логику определения условной последовательности страниц в рамках упомянутого веб-приложения.6. Способ по п. 4, в котором упомянутые идентификаторы включают в себя теги для упомянутых полей ввода.7. Способ по п. 1, в котором на

Claims (25)

1. Способ ввода данных в электронное устройство, включающий в себя:
получение голосового запроса через голосовой интерфейс электронного устройства;
получение множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, относящегося к приложению на упомянутом электронном устройстве;
получение по меньшей мере одной части текста, связанной с соответствующим тегом, который является производным от упомянутого голосового запроса;
заполнение по меньшей мере одного поля ввода упомянутого приложения с помощью соответствующей части текста, которая связана с соответствующим тегом, связанным с полем ввода.
2. Способ по п. 1, в котором каждый из упомянутого множества тегов предоставляет семантическое описание для соответствующего поля ввода.
3. Способ по п. 1, в котором упомянутое приложение включает в себя веб-приложение, упомянутое веб-приложение включает в себя множество веб-страниц, каждая страница включает в себя по меньшей мере одно поле ввода, множество упомянутых полей ввода обладает соответствующими тегами.
4. Способ по п. 3, в котором по меньшей мере одна из упомянутых веб-страниц включает в себя определение потока операций, и это определение указывает на последовательность страниц, включая упомянутое веб-приложение, и для каждой страницы - набор идентификаторов для каждого поля ввода упомянутой страницы.
5. Способ по п. 4, в котором упомянутое определение потока операций включает в себя логику определения условной последовательности страниц в рамках упомянутого веб-приложения.
6. Способ по п. 4, в котором упомянутые идентификаторы включают в себя теги для упомянутых полей ввода.
7. Способ по п. 1, в котором на упомянутом этапе получения по меньшей мере одной части текста выполняют предоставление упомянутого голосового запроса, а также индикатора упомянутого множества тегов, связанных с соответствующими полями ввода упомянутого приложения, серверу преобразования речи в текст и получают упомянутую по меньшей мере одну часть текста, связанную с соответствующим тегом, от упомянутого сервера преобразования речи в текст.
8. Способ по п. 7, в котором упомянутый индикатор включает в себя URL веб-приложения.
9. Способ по п. 7, в котором упомянутый индикатор включает в себя упомянутые теги.
10. Способ по п. 1, в котором дополнительно:
выполняют поиск семантической пользовательской информации, доступной на упомянутом электронном устройстве в ответ на получение части текста с нулевым значением текста, связанной с соответствующим тегом для поля ввода упомянутого приложения;
заполняют упомянутое поле ввода упомянутого приложения, связанного с упомянутым тегом, с помощью упомянутой семантической пользовательской информации в ответ на получение семантической пользовательской информации, совпадающей с упомянутым соответствующим тегом с частью текста с нулевым значением текста.
11. Способ по п. 10, в котором упомянутая семантическая пользовательская информация включает одно из: личную информацию пользователя; контактную информацию пользователя; информацию о местонахождении пользователя; историю браузера пользователя; избранные веб-страницы пользователя.
12. Способ обработки голосового запроса, включающий в себя:
получение голосового запроса через голосовой интерфейс электронного устройства;
получение множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, для приложения на упомянутом электронном устройстве;
перевод голосового запроса в текст;
анализ текста для предоставления по меньшей мере одной части текста;
установление связи по меньшей мере одной части текста с соответствующим тегом из множества тегов;
передачу электронному устройству по меньшей мере части текста с указанием соответствующего тега.
13. Способ по п. 12, в котором каждый из упомянутого множества тегов предоставляет семантическое описание для соответствующего поля ввода.
14. Способ по п. 12, в котором упомянутое приложение включает в себя веб-приложение, упомянутое веб-приложение включает в себя множество веб-страниц, каждая страница включает в себя по меньшей мере одно поле ввода, множество упомянутых полей обладает соответствующими тегами.
15. Способ по п. 14, в котором по меньшей мере одна из упомянутых веб-страниц включает в себя определение потока операций, и это определение указывает на последовательность страниц, включая упомянутое веб-приложение, и для каждой страницы - набор идентификаторов для каждого поля ввода упомянутой страницы.
16. Способ по п. 15, в котором упомянутое определение потока операций включает в себя логику определения условной последовательности страниц в рамках упомянутого веб-приложения.
17. Способ по п. 15, в котором упомянутые идентификаторы включают в себя теги для упомянутых полей ввода.
18. Способ по п. 12, в котором на упомянутом этапе анализа текста используют понимание естественного языка для предоставления упомянутой по меньшей мере одной части текста.
19. Способ по п. 12, в котором на упомянутом этапе получения упомянутого множества тегов выполняют: получение URL веб-приложения от упомянутого электронного устройства, извлечение веб-страницы из упомянутого URL, и извлечение упомянутых тегов от упомянутой веб-страницы.
20. Способ по п. 12, в котором на упомянутом этапе получения упомянутого множества тегов выполняют: получение упомянутого множества тегов от упомянутого электронного устройства.
21. Машиночитаемый носитель, включающий в себя программные инструкции, выполненные с возможностью инициирования выполнения электронным устройством:
получения голосового запроса через голосовой интерфейс электронного устройства;
получения множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, относящегося к приложению на упомянутом электронном устройстве;
получения по меньшей мере одной части текста, связанной с соответствующим тегом, который является производным от упомянутого голосового запроса;
заполнения по меньшей мере одного поля ввода упомянутого приложения с помощью соответствующей части текста, которая связана с соответствующим тегом, связанным с полем ввода.
22. Машиночитаемый носитель, включающий в себя программные инструкции, выполненные с возможностью инициирования выполнения сервером:
получения голосового запроса через голосовой интерфейс электронного устройства;
получения множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, для приложения на упомянутом электронном устройстве;
перевода голосового запроса в текст; анализа текста для предоставления по меньшей мере одной части текста;
установления связи по меньшей мере одной части текста с соответствующим тегом из множества тегов; и передачи электронному устройству по меньшей мере части текста с указанием соответствующего тега.
23. Электронное устройство, включающее в себя компонент, работающий в сочетании с пользовательским интерфейсом приложения, и выполнено с возможностью:
получения голосового запроса через голосовой интерфейс электронного устройства;
получения множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, относящегося к приложению на упомянутом электронном устройстве;
получения по меньшей мере одной части текста, связанной с соответствующим тегом, который является производным от упомянутого голосового запроса;
заполнения по меньшей мере одного поля ввода упомянутого приложения с помощью соответствующей части текста, которая связана с соответствующим тегом, связанным с полем ввода.
24. Сервер, связанный с одним или несколькими электронными устройствами в сети передачи данных и выполненный с возможностью:
получения голосового запроса через голосовой интерфейс электронного устройства;
получения множества тегов, каждый из которых связан с соответствующим полем ввода пользовательского интерфейса, для приложения на упомянутом электронном устройстве;
перевода голосового запроса в текст;
анализа текста для предоставления по меньшей мере одной части текста;
установления связи по меньшей мере одной части текста с соответствующим тегом из множества тегов;
передачи электронному устройству по меньшей мере части текста с указанием соответствующего тега.
25. Система, включающая в себя множество электронных устройств в соответствии с п. 23, связанных с сервером по п. 24 в сети передачи данных.
RU2015102279A 2015-01-27 2015-01-27 Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система RU2646350C2 (ru)

Priority Applications (4)

Application Number Priority Date Filing Date Title
RU2015102279A RU2646350C2 (ru) 2015-01-27 2015-01-27 Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система
EP15879783.7A EP3251113A4 (en) 2015-01-27 2015-05-22 Method of entering data in an electronic device
PCT/IB2015/053789 WO2016120675A1 (en) 2015-01-27 2015-05-22 Method of entering data in an electronic device
US15/525,614 US20170372700A1 (en) 2015-01-27 2015-05-22 Method of entering data in an electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015102279A RU2646350C2 (ru) 2015-01-27 2015-01-27 Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система

Publications (2)

Publication Number Publication Date
RU2015102279A true RU2015102279A (ru) 2016-08-20
RU2646350C2 RU2646350C2 (ru) 2018-03-02

Family

ID=56542514

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015102279A RU2646350C2 (ru) 2015-01-27 2015-01-27 Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система

Country Status (4)

Country Link
US (1) US20170372700A1 (ru)
EP (1) EP3251113A4 (ru)
RU (1) RU2646350C2 (ru)
WO (1) WO2016120675A1 (ru)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10581989B2 (en) * 2015-07-30 2020-03-03 Nasdaq, Inc. Application logging framework
JP6762819B2 (ja) * 2016-09-14 2020-09-30 株式会社東芝 入力支援装置およびプログラム
US11861298B1 (en) * 2017-10-20 2024-01-02 Teletracking Technologies, Inc. Systems and methods for automatically populating information in a graphical user interface using natural language processing
CN111324213A (zh) * 2018-12-13 2020-06-23 青岛海信移动通信技术股份有限公司 终端的信息输入方法和终端
CN113795821A (zh) * 2019-05-06 2021-12-14 谷歌有限责任公司 用于响应于来自用户的请求而使用来自其它源的应用数据生成应用输入内容的自动化助理
KR20210016739A (ko) * 2019-08-05 2021-02-17 삼성전자주식회사 전자 장치 및 전자 장치의 입력 방법
US10915227B1 (en) * 2019-08-07 2021-02-09 Bank Of America Corporation System for adjustment of resource allocation based on multi-channel inputs
RU2757264C2 (ru) 2019-12-24 2021-10-12 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для обработки пользовательского разговорного речевого фрагмента
US11289095B2 (en) 2019-12-30 2022-03-29 Yandex Europe Ag Method of and system for translating speech to text
US11425075B2 (en) * 2020-07-29 2022-08-23 Vmware, Inc. Integration of client applications with hosted applications

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998020434A2 (en) * 1996-11-07 1998-05-14 Vayu Web, Inc. System and method for displaying information and monitoring communications over the internet
US20020062342A1 (en) * 2000-11-22 2002-05-23 Sidles Charles S. Method and system for completing forms on wide area networks such as the internet
US7003464B2 (en) * 2003-01-09 2006-02-21 Motorola, Inc. Dialog recognition and control in a voice browser
US7158779B2 (en) * 2003-11-11 2007-01-02 Microsoft Corporation Sequential multimodal input
US7660400B2 (en) * 2003-12-19 2010-02-09 At&T Intellectual Property Ii, L.P. Method and apparatus for automatically building conversational systems
US7739117B2 (en) * 2004-09-20 2010-06-15 International Business Machines Corporation Method and system for voice-enabled autofill
US20070130134A1 (en) * 2005-12-05 2007-06-07 Microsoft Corporation Natural-language enabling arbitrary web forms
US8060371B1 (en) * 2007-05-09 2011-11-15 Nextel Communications Inc. System and method for voice interaction with non-voice enabled web pages
EP4318463A3 (en) * 2009-12-23 2024-02-28 Google LLC Multi-modal input on an electronic device
US8255218B1 (en) * 2011-09-26 2012-08-28 Google Inc. Directing dictation into input fields
US9148499B2 (en) * 2013-01-22 2015-09-29 Blackberry Limited Method and system for automatically identifying voice tags through user operation
US9111546B2 (en) * 2013-03-06 2015-08-18 Nuance Communications, Inc. Speech recognition and interpretation system

Also Published As

Publication number Publication date
US20170372700A1 (en) 2017-12-28
EP3251113A1 (en) 2017-12-06
EP3251113A4 (en) 2018-07-25
WO2016120675A1 (en) 2016-08-04
RU2646350C2 (ru) 2018-03-02

Similar Documents

Publication Publication Date Title
RU2015102279A (ru) Способ ввода данных в электронное устройство, способ обработки голосового запроса, машиночитаемый носитель (варианты), электронное устройство, сервер и система
US10430255B2 (en) Application program interface mashup generation
US20210232761A1 (en) Methods and systems for improving machine learning performance
US10620945B2 (en) API specification generation
JP6440732B2 (ja) 機械学習に基づく自動タスク分類
RU2012144644A (ru) Определение намерения пользователя на основе онтологий предметных областей
EA201300375A1 (ru) Способ организации поисковой базы данных с использованием нечетких критериев
US10832012B2 (en) Method executed in translation system and including generation of translated text and generation of parallel translation data
US9235569B1 (en) Techniques for on-the-spot translation of web-based applications without annotating user interface strings
US9619850B2 (en) Identifying word-senses based on linguistic variations
JP2020030408A (ja) オーディオにおける重要語句を認識するための方法、装置、機器及び媒体
US20200372088A1 (en) Recommending web api's and associated endpoints
US20190171713A1 (en) Semantic parsing method and apparatus
US20160071511A1 (en) Method and apparatus of smart text reader for converting web page through text-to-speech
US9697466B2 (en) Automated opinion prediction based on indirect information
JP2015523623A5 (ru)
CN109190123B (zh) 用于输出信息的方法和装置
RU2013156495A (ru) Разрешение семантической неоднозначности при помощи семантического классификатора
RU2016139613A (ru) Верификация контента собственного приложения
CN109710634B (zh) 用于生成信息的方法及装置
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system
CN114201376A (zh) 基于人工智能的日志解析方法、装置、终端设备及介质
US9495147B2 (en) Method and apparatus for obtaining context information for a software development task
CN114661746A (zh) 语句转换方法、装置、电子设备及存储介质
JP2015103101A (ja) テキスト要約装置、方法、及びプログラム

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20170127

FZ9A Application not withdrawn (correction of the notice of withdrawal)

Effective date: 20171206