RU2605361C2 - Способ и устройство воспроизведения мультимедиа - Google Patents

Способ и устройство воспроизведения мультимедиа Download PDF

Info

Publication number
RU2605361C2
RU2605361C2 RU2015105625/08A RU2015105625A RU2605361C2 RU 2605361 C2 RU2605361 C2 RU 2605361C2 RU 2015105625/08 A RU2015105625/08 A RU 2015105625/08A RU 2015105625 A RU2015105625 A RU 2015105625A RU 2605361 C2 RU2605361 C2 RU 2605361C2
Authority
RU
Russia
Prior art keywords
utterance
time
accordance
data
subtitle
Prior art date
Application number
RU2015105625/08A
Other languages
English (en)
Other versions
RU2015105625A (ru
Inventor
Бинь Ван
Чжигуан ЧЖЭН
Дунфан ЦЗИ
Original Assignee
Сяоми Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сяоми Инк. filed Critical Сяоми Инк.
Publication of RU2015105625A publication Critical patent/RU2015105625A/ru
Application granted granted Critical
Publication of RU2605361C2 publication Critical patent/RU2605361C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/22Means responsive to presence or absence of recorded information signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing
    • G11B19/022Control panels
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Studio Circuits (AREA)

Abstract

Изобретение относится к области воспроизведения мультимедиа. Техническим результатом является снижение потерь смысловой нагрузки аудиоданных при продолжении воспроизведения после приостановки. Способ содержит получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа, определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров и продолжение воспроизведения мультимедиа в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа. 3 н. и 14 з.п. ф-лы, 16 ил.

Description

[0001] Настоящая заявка основана на приоритете и испрашивает приоритет относительно китайской заявки на патент №2014102508009, названием изобретения является «СПОСОБ И УСТРОЙСТВО ВОСПРОИЗВЕДЕНИЯ МУЛЬТИМЕДИА», поданной 6 июня 2014 г., все содержимое которой включено в настоящее описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] Настоящее раскрытие относится к области технологии обработки мультимедиа и, более конкретно, к способу и устройству воспроизведения мультимедиа.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
[0003] В соответственной области техники, когда воспроизводится видео, иногда возникает пауза, которая включает в себя активную приостановку вследствие субъективных причин пользователя, а также может случаться вследствие причин сети, может возникать короткая пауза. Поскольку маневренность предварительного момента является большей, при продолжении воспроизведения речь, возникающая в видео, всегда начинается с середины предложения, даже начинается с половины букв или слов, таким образом, человеку постоянно неудобно понимать сюжет.
[0004] В соответственной области техники, что касается некоторого программного обеспечения или web-страницы воспроизведения мультимедиа, когда программное обеспечение или web-страница закрывается во время процесса воспроизведения и опять открывается, чтобы воспроизводить то же самое видео, или последняя закрытая web-страница вновь открывается, потребуется способ воспроизведения с возвратом, возвращающий назад на фиксированное количество времени от позиции паузы. Например, значение времени возврата фиксировано устанавливается в 5 секунд, при продолжении воспроизведения первоначального видео после прерывания или повторного открытия программного обеспечения или web-страницы, оно начинает воспроизводиться за 5 секунд от точки прерывания, таким образом, что пользователь может продолжать смотреть последнее сохраненное в памяти.
[0005] Что касается способа воспроизведения с возвратом, значение времени возврата является фиксированным значением, установленным заранее. Несмотря на то, что пользователю дается определенное время возврата, момент времени включения является резким и отрицательно воздействует на пользователя. Поскольку возвращаются ровно 5 секунд, может также возникать случай, что имеет место постоянное воспроизведение с середины предложения, что не является благоприятным для пользователя, чтобы понимать все высказывание.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0006] Для того чтобы преодолеть проблемы в соответственной области техники, настоящее раскрытия предоставляет способ и устройство воспроизведения мультимедиа.
[0007] В соответствии с первым аспектом вариантов осуществления настоящего раскрытия, предоставлен способ воспроизведения мультимедиа, содержащий:
[0008] получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа,
[0009] определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров и
[0010] продолжение воспроизведения мультимедиа в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
[0011] В вариантах осуществления настоящего раскрытия начальная позиция высказывания для всего высказывания определяется с помощью анализа аудиоданных и/или данных субтитров, видео или аудио непрерывно воспроизводится в соответствии с определенной начальной позицией высказывания, так что пользователь может уловить и понять все высказывание при продолжении воспроизведения после приостановки, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[0012] В качестве альтернативы, определение начальной позиции высказывания всего высказывания в соответствии с аудиоданными содержит:
[0013] обнаружение интервала времени между соседними двумя аудиосигналами в аудиоданных и
[0014] определение любой из позиций времени между этими соседними двумя аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя аудиосигналами больше, чем первый предварительно установленный интервал.
[0015] В качестве альтернативы, определение начальной позиции высказывания для всего высказывания в соответствии с данными субтитров содержит:
[0016] получение начального времени отображения и/или конечного времени отображения каждого субтитра в данных субтитров и
[0017] определение начальной позиции высказывания в соответствии с начальным временем отображения и/или конечным временем отображения субтитра.
[0018] В качестве альтернативы, определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров содержит:
[0019] обнаружение времени воспроизведения каждого аудиосигнала аудиоданных,
[0020] получение начального времени отображения и/или конечного времени отображения субтитра, соответствующего соседним аудиосигналам, когда интервал времени между соседними двумя аудиосигналами больше, чем первый предварительно установленный интервал, и
[0021] определение начальной позиции высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующим этим соседним аудиосигналам.
[0022] В альтернативных решениях при определении начальной позиции высказывания в соответствии с интервалом времени между соседними аудиосигналами или интервалом времени между соседними субтитрами, следующие высказывания могут продолжаться, чтобы воспроизводить аудио или видео в соответствии с начальной позицией высказывания, пользователь может уловить или понять все высказывание при продолжении воспроизведения, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, таким образом, улучшается впечатление пользователя в течение воспроизведения видео или аудио. Кроме того, в то же самое время анализируются аудиоданные и данные субтитров и определяется позиция интервала между двумя полными высказываниями, таким образом, чтобы более точно получить начальную точку всего высказывания, что не влияет ни на понимание пользователем высказывания, ни на просмотр пользователем субтитра.
[0023] В качестве альтернативы, определение начальной позиции высказывания всего высказывания в соответствии с аудиоданными содержит:
[0024] фильтрацию аудиоданных в соответствии с частотой речи, чтобы получить речевые аудиоданные,
[0025] обнаружение интервала времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных и
[0026] определение любой из позиций времени между соседними двумя речевыми аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя речевыми аудиосигналами больше, чем первый предварительно установленный интервал.
[0027] В альтернативных решениях аудиоданные сначала фильтруются обычно в соответствии с частотой речи, таким образом, чтобы просто анализировать речевой аудиосигнал, начальная позиция высказывания определяется в соответствии с интервалом времени между речевыми аудиосигналами, таким образом, что определение начальной позиции высказывания является более четким.
[0028] В качестве альтернативы, продолжение воспроизведения мультимедиа в соответствии с начальной позицией высказывания, когда начальные позиции высказываний, по меньшей мере, двух полных высказываний определяются в соответствии с аудиоданными и/или данными субтитров, содержит:
[0029] продолжение воспроизведения мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, или
[0030] продолжение воспроизведения мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое, большее или равное 2.
[0031] В альтернативных решениях, когда определены множество начальных позиций высказываний, одна из них гибко выбирается как начальная точка, чтобы продолжать воспроизведение аудио и видео после приостановки, таким образом, что пользователь может уловить и понять все высказывание при продолжении воспроизведения, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[0032] В качестве альтернативы, когда начальная позиция высказывания всего высказывания не определена в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа, способ дополнительно содержит:
[0033] получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, расположено до времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз,
[0034] определение начальной позиции высказывания для всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, и
[0035] продолжение получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени и определение начальной позиции высказывания всего высказывания в соответствии с обратной последовательностью времени до тех пор, пока не будет определена, по меньшей мере, одна начальная позиция высказывания для всего высказывания, если начальная позиция высказывания для всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент.
[0036] В качестве альтернативы, получение аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа содержит:
[0037] получение позиции времени, расположенной до позиции паузы мультимедиа и отстоящей от позиции паузы на вторую предварительно установленную длительность времени,
[0038] получение аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до позиции времени и
[0039] определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров содержит:
[0040] определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции времени.
[0041] В альтернативных решениях сначала может быть выбрана позиция времени для периода времени до позиции паузы, беря позицию времени как начальную точку начальной позиции высказывания для обратного нахождения всего высказывания в обратном направлении, таким образом, что пользователь может получить больше дополнительного времени, чтобы войти в сюжет видео.
[0042] В соответствии со вторым аспектом вариантов осуществления настоящего раскрытия, предоставлено устройство воспроизведения мультимедиа, содержащее:
[0043] модуль получения, сконфигурированный с возможностью получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа,
[0044] модуль анализа, сконфигурированный с возможностью определения начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров полученными модулем получения, и
[0045] модуль воспроизведения, сконфигурированный с возможностью продолжения воспроизведения мультимедиа в соответствии с начальной позицией высказывания, определенной модулем анализа, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
[0046] Модуль анализа содержит:
[0047] блок обнаружения, сконфигурированный с возможностью обнаружения интервала времени между соседними двумя аудиосигналами в аудиоданных, полученных модулем получения, и
[0048] блок определения анализа, сконфигурированный с возможностью определения любой из позиций времени между соседними двумя аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя аудиосигналами, обнаруженный блоком обнаружения, больше, чем первый предварительно установленный интервал.
[0049] Модуль анализа содержит:
[0050] блок получения, сконфигурированный с возможностью получения начального времени отображения и/или конечного времени отображения каждого субтитра в данных субтитров, полученных из модуля получения, и
[0051] блок определения анализа, сконфигурированный с возможностью определения начальной позиции высказывания в соответствии с начальным временем отображения и/или конечным временем отображения субтитра, полученным блоком получения.
[0052] Модуль анализа содержит:
[0053] блок обнаружения, сконфигурированный с возможностью обнаружения времени воспроизведения каждого аудиосигнала аудиоданных полученных модулем получения,
[0054] блок получения, сконфигурированный с возможностью получения начального времени отображения и/или конечного времени отображения субтитра, соответствующего соседним аудиосигналам, когда интервал времени между соседними двумя аудиосигналами, обнаруженный блоком обнаружения, больше, чем первый предварительно установленный интервал, и
[0055] блок определения анализа, сконфигурированный с возможностью определения начальной позиции высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующим этим соседним аудиосигналам, полученным блоком получения.
[0056] Модуль анализа дополнительно содержит:
[0057] блок фильтрации, сконфигурированный с возможностью фильтрации аудиоданных, полученных модулем получения, в соответствии с частотой речи, чтобы получить речевые аудиоданные,
[0058] при этом блок обнаружения сконфигурирован с возможностью обнаружения интервала времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных, отфильтрованных блоком фильтрации, и
[0059] блок определения анализа сконфигурирован с возможностью определения любой из позиций времени между соседними двумя речевыми аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя речевыми аудиосигналами, обнаруженный блоком обнаружения, больше, чем первый предварительно установленный интервал.
[0060] Модуль воспроизведения сконфигурирован с возможностью продолжения воспроизведения мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, когда начальные позиции высказываний, по меньшей мере, двух полных высказываний определяются модулем анализа, или продолжения воспроизведения мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое, большее или равное 2.
[0061] Модуль получения сконфигурирован с возможностью получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, расположено до времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз, когда начальная позиция высказывания всего высказывания не определена модулем анализа в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа, и
[0062] модуль анализа сконфигурирован с возможностью определения начальной позиции высказывания для всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент модулем получения, и продолжения получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени и определения начальной позиции высказывания для всего высказывания в соответствии с обратной последовательностью времени, до тех пор, пока не будет определена, по меньшей мере, одна начальная позиция высказывания для всего высказывания, если начальная позиция высказывания всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент
[0063] Модуль получения сконфигурирован с возможностью получения позиции времени, расположенной до позиции паузы мультимедиа и отстоящей от позиции паузы на вторую предварительно определенную длительность времени, и получения аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до данной позиции времени, и
[0064] модуль анализа сконфигурирован с возможностью определения начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до упомянутой позиции времени.
[0065] В соответствии с третьим аспектом вариантов осуществления настоящего раскрытия, предоставлено устройство воспроизведения мультимедиа, содержащее:
[0066] процессор и
[0067] память для хранения инструкций, исполняемых процессором,
[0068] причем процессор сконфигурирован с возможностью:
[0069] получения аудиоданных и/или данных субтитров первой предварительно установленное длительности времени до позиции паузы мультимедиа,
[0070] определения начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров, и
[0071] продолжения воспроизведения мультимедиа в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
[0072] Следует понимать, что как предыдущее общее описание, так и последующее подробное описание являются только иллюстративными и пояснительными, а не ограничительными настоящего раскрытия.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0073] Сопровождающие чертежи, которые включены в это описание и составляют его часть, иллюстрируют варианты осуществления, согласующиеся с изобретением, и вместе с описанием служат в целях пояснения принципов изобретения.
[0074] Фиг. 1 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0075] Фиг. 2 - схематическая диаграмма, изображающая ось времени между позицией паузы и начальной позицией высказывания в соответствии с иллюстративным вариантом осуществления.
[0076] Фиг. 3 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0077] Фиг. 4 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0078] Фиг. 5 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0079] Фиг. 6 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0080] Фиг. 7 - схематическая диаграмма, изображающая ось времени между позицией паузы и начальной позицией высказывания в соответствии с иллюстративным вариантом осуществления.
[0081] Фиг. 8 - схематическая диаграмма, изображающая ось времени между позицией паузы и начальной позицией высказывания в соответствии с иллюстративным вариантом осуществления.
[0082] Фиг. 9 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0083] Фиг. 10 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0084] Фиг. 11 - блок-схема, изображающая устройство воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
[0085] Фиг. 12а - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления.
[0086] Фиг. 12b - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления.
[0087] Фиг. 12с - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления.
[0088] Фиг. 12d - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления.
[0089] Фиг. 13 - блок-схема, изображающая устройство 1300 для воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0090] Теперь будет сделана ссылка подробно на иллюстративные варианты осуществления, примеры которых проиллюстрированы на сопровождающих чертежах. Нижеследующее описание ссылается на сопровождающие чертежи, на которых одинаковые номера на разных чертежах представляют одинаковые или подобные элементы, если не представлено иначе. Реализации, приведенные в следующем описании иллюстративных вариантов осуществления, не представляют все реализации, согласующиеся с изобретением. Вместо этого они являются только примерами устройств и способов, согласующихся с аспектами, связанными с изобретением, как перечислено в прилагаемой формуле изобретения.
[0091] Мультимедиа в вариантах осуществления настоящего раскрытия содержит видео, аудио и тому подобное. При воспроизведении мультимедиа случается пауза, которая может быть активно инициирована пользователем, а также может случаться из-за сети. Ситуация, в которой пользователь активно приостанавливает воспроизведение мультимедиа, узнается с помощью инструкций управления. Пауза воспроизведения мультимедиа из-за сети может узнаваться с помощью обнаружения оставшегося объема данных, который не был воспроизведен в буферной зоне видео, и воспроизведение видео будет остановлено, когда нет буферных данных, доступных для воспроизведения.
[0092] В вариантах осуществления настоящего раскрытия после того, как воспроизведение мультимедиа приостанавливается, непрерывное воспроизведение мультимедиа может начаться с полного высказывания с помощью анализа начальной точки высказывания всего высказывания в аудиоданных и/или в данных субтитров в мультимедиа, при этом решая проблему нанесения вреда пользователю в понимании высказывания из-за воспроизведения в фиксированное время.
[0093] Фиг. 1 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 1, способ воспроизведения мультимедиа используется в терминале и содержит следующие этапы.
[0094] На этапе S13 получаются аудиоданные и/или данные субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа.
[0095] На этапе S12 определяется начальная позиция высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров.
[0096] На этапе S13 мультимедиа непрерывно воспроизводится в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
[0097] В вариантах осуществления начальная позиция высказывания всего высказывания определяется с помощью анализа аудиоданных и/или данных субтитров, видео или аудио непрерывно воспроизводится в соответствии с определенной начальной позицией высказывания, таким образом, что пользователь может уловить и понять все высказывание при продолжении воспроизведения, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[0098] Как правило, длительность времени всего высказывания обычно не более 66 секунд. В реальном применении на этапе S13 первая предварительно установленная длительность времени может быть установлена в 16 секунд. Например, Фиг. 2 - схематическая диаграмма, изображающая ось времени между позицией паузы и начальной позицией высказывания в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 2, когда пользователь воспроизводит видео, позиция паузы находится в 3 минутах 20 секундах, аудиоданные и/или данные субтитров могут быть получены в 16 секундах до позиции паузы, а именно от 3 минут 4 секунд до 3 минут 20 секунд, так чтобы определить начальную позицию высказывания всего высказывания в этих данных.
[0099] Фиг. 3 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 3, в качестве альтернативы, на этапе S12 определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными содержит следующие этапы.
[00100] На этапе S31 обнаруживается интервал времени между соседними двумя аудиосигналами в аудиоданных.
[00101] На этапе S32 любая из позиций времени между смежными двумя аудиосигналами определяется как начальная позиция высказывания, когда интервал времени между смежными двумя аудиосигналами больше, чем первый предварительно установленный интервал.
[00102] Фиг. 4 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 4, в качестве альтернативы, на этапе S12 определение начальной позиции высказывания для всего высказывания в соответствии с данными субтитров содержит следующие этапы.
[00103] На этапе S41 получается начальное время отображения и/или конечное время отображения каждого субтитра в данных субтитров.
[00104] На этапе S42 определяется начальная позиция высказывания в соответствии с начальными временем отображения и/или конечным временем отображения субтитра. Поскольку имеется интервал времени между двумя высказываниями, например, 0,1 секунды, и, таким образом, полное высказывание может быть определено в соответствии с длительностью интервала времени между аудиосигналами. Аналогично, полное высказывание также может быть определено в соответствии с интервалом времени между соседними субтитрами, когда аудиофайл, воспроизводимый пользователем, имеет субтитры. Например, конечное время отображения полученного предыдущего субтитра равно 3 минутам 4 секундам и 160 миллисекундам, начальное время отображения последнего субтитра равно 3 минутам 4 секундам и 290 миллисекундами, интервал между двумя субтитрами равен 130 миллисекундам, а именно, 0,13 секунды, и равен более 0,1 секунды и, таким образом, может оцениваться, что начальная позиция высказывания существует между двумя субтитрами.
[0105] Или в некоторых аудио- и видеофайлах сам субтитр соответствует всему высказыванию и, таким образом, начальная позиция высказывания может быть определена в соответствии с начальным временем отображения текущего субтитра или конечным временем отображения предыдущего субтитра.
[0106] В альтернативных решениях при определении начальной позиции высказывания в соответствии с интервалом времени между соседними аудиосигналами или интервалом времени между соседними субтитрами, следующие высказывания могут продолжаться, чтобы воспроизводить аудио или видео в соответствии с начальной позицией высказывания, пользователь может уловить или понять все высказывание при продолжении воспроизведения, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, таким образом, улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[0107] Фиг. 5 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 5, в качестве альтернативы, на этапе S12 определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров содержит следующие этапы.
[00108] На этапе S51 обнаруживается время воспроизведения каждого аудиосигнала аудиоданных.
[00109] На этапе S52 получается начальное время отображения и/или конечное время отображения субтитра, соответствующее соседним аудиосигналам, когда интервал времени между соседними двумя аудиосигналами больше первого предварительно установленного интервала.
[00110] На этапе S53 определяется начальная позиция высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующего соседним аудиосигналам.
[00111] Например, время воспроизведения соседних двух аудиосигналов, полученное с помощью анализа аудиоданных, равно 3 минутам 9 секундам и 3 минутам 12 секундам. Интервал времени между двумя соседними аудиосигналами равен 3 секундам, и больше 0,1 секунды, установленной заранее, однако, время изображения соседних двух субтитров, соответствующих двум соседним аудиосигналам, равно 3 минутам 8 секундам и 3 минутам 11 секундам, и интервал времени также больше 0,1 секунды. Следовательно, можно определить, что пропуск аудиосигналов и субтитров возникает в одно и то же время, по меньшей мере, в 3 минуты 10 секунд, и 3 минуты 10 секунд могут использоваться как начальная точка продолжения воспроизведения мультимедиа.
[00112] В альтернативных решениях аудиоданные и данные субтитров анализируются в одно и то же время, и позиция интервала между двумя полными высказываниями определяется таким образом, чтобы получить начальную точку всего высказывания более точно, что не влияет ни на понимание пользователем высказывания, ни на просмотр пользователем субтитра.
[00113] Фиг. 6 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 6, в качестве альтернативы, на этапе S12 определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными содержит следующие этапы.
[00114] На этапе S61 аудиоданные фильтруются в соответствии с частотой речи, чтобы получить речевые аудиоданные.
[00115] На этапе S62 определяется интервал времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных.
[00116] На этапе S63 любая из позиций времени между смежными двумя речевыми аудиосигналами определяется как начальная позиция высказывания, когда интервал времени между смежными двумя речевыми аудиосигналами больше, чем первый предварительно установленный интервал.
[00117] В альтернативных решениях, когда фоновая музыка (музыка, окружающий звук и т.д.), за исключением речи, также существует в аудиоданных, поэтому аудиоданные сначала фильтруются в соответствии с основной частотой речи, с тем, чтобы анализировать речевой аудиосигнал, и начальная позиция высказывания определяется в соответствии с интервалом времени между речевыми аудиосигналами, так, что начальная позиция высказывания определяется более точно.
[00118] В качестве альтернативы, когда начальные позиции высказываний, по меньшей мере, двух полных высказываний определены в соответствии с аудиоданными и/или данным субтитров, этап S13 содержит: продолжение воспроизведения мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, или продолжение воспроизведения мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое большее или равное 2.
[00119] Например, как изображено на Фиг. 2, две начальные позиции высказываний, полученные с помощью анализа аудиоданных, находятся в 3 минутах 10 секундах и 3 минутах 18 секундах, позиция паузы находится в 3 минутах 20 секундах. 3 минуты 18 секунд, ближайшие к позиции паузы, могут быть выбраны как позиция, с которой видео продолжает воспроизводиться, или, если число высказываний в обратном направлении предварительно установлено как 2, а именно, видео продолжает воспроизводиться с помощью обращения двух высказываний, тогда 3 минуты 10 секунд могут быть выбраны как позиция, с которой видео продолжает воспроизводиться.
[00120] В альтернативных решениях, когда определены множество начальных позиций высказываний, одна из них гибко выбирается как начальная точка, чтобы продолжать воспроизведение аудио и видео после приостановки, таким образом, что пользователь может уловить и понять все высказывание при продолжении воспроизведения, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[00121] В качестве альтернативы, на этапе S13 и этапе S12, когда начальная позиция высказывания всего высказывания не определена в соответствии с аудиоданными и/или данными субтитров в течение предварительно установленной длительности времени до позиции паузы мультимедиа, способ дополнительно содержит:
[00122] получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, расположено до времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз,
[00123] определение начальной позиции высказывания всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, и
[0124] продолжение получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени и определение начальной позиции высказывания всего высказывания в соответствии с обратной последовательностью времени до тех пор, пока не будет определена, по меньшей мере, одна начальная позиция высказывания всего высказывания, если начальная позиция высказывания всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент.
[00125] Например, Фиг. 7 - схематическая диаграмма, изображающая ось времени между позицией паузы и начальной позицией высказывания в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 7, когда пользователь воспроизводит видео, позиция паузы находится в 3 минутах 20 секундах, и никакая начальная позиция высказывания всего высказывания не получается в соответствии с полученными аудиоданными и/или данными субтитров из 16 секунд до позиции паузы, а именно с 3 минут 4 секунд до 3 минут 20 секунд. Тогда, аудиоданные и/или данные субтитров из 16 секунд до 3 минут 4 секунд, а именно от 2 минут 48 секунд до 3 минут 4 секунд, могут быть получены опять и проанализированы до тех пор, пока не будет определена одна начальная позиция высказывания всего высказывания.
[00126] В альтернативных решениях, данные в течение периода времени до позиции паузы в соответствии с последовательностью времени получаются и анализируются и, если никакая начальная позиция высказывания всего высказывания не получена, данные периода времени получаются дальше и анализируются до тех пор, пока начальная позиция высказывания не будет определена как начальная точка, с которой аудио и видео продолжает воспроизводиться после того, как приостановлены, таким образом, что пользователь может уловить и понять все высказывание при продолжении воспроизведения аудио или видео, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[00127] В качестве альтернативы, на этапе S11 получается позиция времени до позиции паузы мультимедиа и отстоящая от позиции паузы на вторую предварительно установленную длительность времени: получаются аудиоданные и/или данные субтитров в течение первой предустановленной длительности времени до позиции паузы.
[00128] На этапе S12 определяется начальная позиция высказывания всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предустановленной длительности времени до позиции паузы.
[00129] Например, Фиг. 8 - схематическая диаграмма, изображающая ось времени между позицией паузы и начальной позицией высказывания в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 8, позиция паузы находится в 3 минутах 20 секундах, первая предварительно установленная длительность времени равна 16 секундам, вторая предварительно установленная длительность времени равна 5 секундам, аудиоданные и/или данные субтитров получены из 16 секунд до 3 минут 15 секунд, а именно, от 2 минут 59 секунд до 3 минут 15 секунд. Начальная позиция высказывания, полученная с помощью анализа, находится в 3 минутах 18 секундах.
[01330] В альтернативных решениях сначала может быть выбрана позиция времени в течение периода времени, например, 5 секунд до позиции паузы, и затем она берется как начальная точка для нахождения начальной позиции высказывания всего высказывания в обратном направлении, таким образом, что пользователь может получить больше дополнительного времени, чтобы войти в сюжет видео.
[00131] Например, как изображено на Фиг. 8, две начальные позиции высказываний, полученные с помощью анализа, находятся в 3 минутах 10 секундах и 3 минутах 18 секундах, которые находятся, соответственно, до верхней позиции времени (3 минуты 15 секунд) и между верхней позицией времени и позицией паузы (3 минуты 20 секунд), обе из двух начальных позиций высказываний используются как начальная точка, с которой продолжается воспроизведение аудио или видео после, того как они приостановлены.
[00132] В альтернативных решениях, по меньшей мере, одна часть аудиоданных и/или данных субтитров в течение 16 секунд до верхней позиции времени (3 минуты 15 секунд) может быть получена в соответствии с обратной последовательностью времени, и начальная позиция высказывания всего высказывания определяется из полученных аудиоданных и/или данных субтитров в течение 16 секунд каждый раз, когда получается часть аудиоданных и/или данных субтитров в течение 16 секунд, до тех пор, пока не будет определена, по меньшей мере, одна начальная позиция высказывания всего высказывания.
[00133] В альтернативных решениях, при взятии позиции времени в течение периода времени до позиции паузы в качестве начальной точки для нахождения начальной позиции высказывания в обратном направлении определенная начальная позиция высказывания может быть до позиции паузы и может также быть между позицией времени и позицией паузы. Следовательно, выбор начальной точки для продолжения воспроизведения аудио и видео после паузы является более гибким, таким образом, что пользователь может уловить и понять все высказывание при продолжении воспроизведения аудио или видео, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[00134] Далее в настоящем раскрытии будут, соответственно, перечислены два специфических примера, чтобы описать способ воспроизведения мультимедиа настоящего раскрытия.
[00135] Первый вариант осуществления
[00136] Фиг. 9 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 9, способ содержит следующие этапы.
[00137] На этапе S91 пауза случается при воспроизведении видео, и позиция паузы находится в 5 минутах и 36 секундах.
[00138] На этапе S92 считываются аудиоданные из 16 секунд до позиции паузы, а именно, аудиоданные между 5 минутами 20 секундами и 5 минутами 36 секундами.
[00139] На этапе S93 аудиоданные фильтруются в соответствии с частотой речи, чтобы получить речевые аудиоданные.
[00140] На этапе S94 обнаруживается интервал времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных.
[00141] На этапе S95, оценивается то, больше ли интервал времени между соседними двумя речевыми аудиосигналами чем 0,1 секунды, если да, процесс переходит на этап S96, если нет, позиция между соседними двумя речевыми аудиосигналами не является начальной позицией высказывания.
[00142] На этапе S96 любая из позиций времени между смежными двумя речевыми аудиосигналами определяется как начальная позиция высказывания, и имеются две полученные начальные позиции высказываний: 5 минут 29 секунд и 5 минут 33 секунды.
[00143] На этапе S97 5 минут 33 секунды, ближайшая к позиции паузы, выбирается, чтобы продолжать воспроизведение видео.
[00144] Второй варианта осуществления
[00145] Фиг. 10 - блок-схема последовательности этапов, изображающая способ воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 10, способ содержит следующие этапы.
[00146] На этапе S101 пауза случается в процессе воспроизведении видео, и позиция паузы находится в 5 минутах и 36 секундах.
[00147] На этапе S102 данные субтитров из 16 секунд до позиции паузы (а именно, 5 минут 31 секунда) в 5 секундах до позиции паузы считываются в соответствии с обратной последовательностью времени.
[00148] На этапе S103 оценивается то, имеется ли начальная позиция высказывания, в соответствии со считанными данными субтитров из 16 секунд, если да, процесс переходит на этап S104, если нет, процесс возвращается на этап S102 считывания данных субтитров из 16 секунд до 5 минут 15 секунд.
[00149] На этапе S104 получаются три начальные позиции высказываний: 5 минут 2 секунды, 5 минут 9 секунд и 5 минут 11 секунд.
[00150] На этапе S105, если число обращенных высказываний предварительно установлено как 2, видео возвращается в позицию (а именно, 5 минут 9 секунд) двух высказывания до 5 минут 31 секунды, а затем продолжает воспроизводиться в этой позиции.
[00151] В вышеописанных специфических примерах аудио и видео могут продолжаться гибко воспроизводится в соответствии с определенной начальной позицией высказывания с помощью анализа аудиоданных и/или данных субтитров, таким образом, что пользователь может уловить и понять все высказывание при продолжении воспроизведения аудио или видео после приостановки, диалоги в видео или в аудио являются более естественными, и сюжеты являются более непрерывными, при этом улучшается впечатление пользователя в течение воспроизведения видео или аудио.
[00152] Фиг. 11 - блок-схема, изображающая устройство воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Ссылаясь на Фиг. 11, устройство содержит модуль 111 получения, модуль 112 анализа и модуль 113 воспроизведения.
[00153] Модуль 111 получения сконфигурирован с возможностью получения аудио данных и/или данных субтитров первой предварительно установленное длительности времени до позиции паузы мультимедиа
[00154] Модуль 112 анализа сконфигурирован с возможностью определения начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров полученными модулем получения.
[00155] Модуль 113 воспроизведения сконфигурирован с возможностью продолжения воспроизведения мультимедиа в соответствии с начальной позицией высказывания, полученной модулем анализа, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
[00156] Фиг. 12а - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 12а, в качестве альтернативы, модуль 112 анализа содержит: блок 1121 обнаружения и блок 1122 определения анализа.
[00157] Блок 1121 обнаружения сконфигурирован с возможностью обнаружения интервала времени между соседними двумя аудиосигналами в аудиоданных, полученных модулем получения.
[00158] Блок 1122 определения анализа сконфигурирован с возможностью определения любой из позиций времени между соседними двумя аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя аудиосигналами, обнаруженный блоком обнаружения, больше, чем первый предварительно установленный интервал.
[00159] Фиг. 12b - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 12b, в качестве альтернативы, модуль 112 анализа содержит: блок 1123 получения и блок 1122 определения анализа.
[00160] Блок 1123 получения сконфигурировано с возможностью получения начального времени отображения и/или конечного времени отображения каждого субтитра в данных субтитров, полученных из модуля 111 получения.
[00161] Блок 1122 определения анализа сконфигурирован с возможностью определения начальной позиции высказывания в соответствии с начальным временем отображения и/или конечным временем отображения субтитра, полученным блоком 1123 получения.
[00162] Фиг. 12с - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 12с, в качестве альтернативы, модуль 112 анализа содержит: блок 1121 обнаружения, блок 1123 получения и блок 1122 определения анализа.
[00163] Блок 1121 обнаружения сконфигурирован с возможностью обнаружения времени воспроизведения каждого аудиосигнала аудиоданных, полученных модулем 111 получения.
[00164] Блок 1123 получения сконфигурирован с возможностью получения начального времени отображения и/или конечного времени отображения субтитра, соответствующего соседними аудиосигналам, когда интервал времени между соседними двумя аудиосигналами, обнаруженный блоком 1121 обнаружения, больше, чем первый предварительно установленный интервал.
[00165] Блок 1122 определения анализа сконфигурирован с возможностью определения начальной позиции высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующим соседним двум аудиосигналам, полученным блоком 1123 получения.
[00166] Фиг. 12d - блок-схема, изображающая модуль анализа в соответствии с иллюстративным вариантом осуществления. Как изображено на Фиг. 12d, в качестве альтернативы, модуль 112 анализа содержит: блок 1124 фильтрации.
[00167] Блок 1124 фильтрации сконфигурирован с возможностью фильтрации аудиоданных, полученных модулем 111 получения, в соответствии с частотой речи, чтобы получить речевые аудиоданные.
[00168] Блок 1121 обнаружения сконфигурирован с возможностью обнаружения интервала времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных, отфильтрованных блоком 1124 фильтрации.
[00169] Блок 1122 определения анализа сконфигурирован с возможностью определения любой из позиций времени между соседними двумя речевыми аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя речевыми аудиосигналами, обнаруженный блоком 1121 обнаружения, больше, чем первый предварительно установленный интервал.
[00170] В качестве альтернативы, модуль 113 воспроизведения сконфигурирован с возможностью продолжения воспроизведения мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, когда начальные позиции высказываний, по меньшей мере, двух полных высказываний определяются модулем 112 анализа, или продолжения воспроизведения мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое, большее или равное 2.
[00171] В качестве альтернативы, модуль 111 получения сконфигурирован с возможностью получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, расположено до времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз, когда начальная позиция высказывания всего высказывания не определена модулем 112 анализа в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа.
[00172] Модуль 112 анализа сконфигурирован с возможностью определения начальной позиции высказывания всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент модулем 111 получения, и продолжения получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени и определения начальной позиции высказывания всего высказывания в соответствии с обратной последовательностью времени, до тех пор пока не будет определена, по меньшей мере, одна начальная позиция высказывания всего высказывания, если начальная позиция высказывания всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент.
[00173] В качестве альтернативы, модуль 111 получения сконфигурирован с возможностью получения позиции времени, расположенной до позиции паузы мультимедиа и отстоящей от позиции паузы на вторую предварительно определенную длительность времени, и получения аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до позиции паузы.
[00174] Модуль 112 анализа сконфигурирован с возможностью определения начальной позиции высказывания всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени сначала может быть выбрана позиция времени для периода времени до позиции паузы.
[00175] Относительно устройства в вышеупомянутых вариантах осуществления, специфические операции, выполняемые каждым модулем, были описаны подробно в вариантах осуществления соответственного способа, и подробное описание не будет повторено в настоящем раскрытии.
[00176] Фиг. 1 - блок-схема, изображающая устройство 1300 для воспроизведения мультимедиа в соответствии с иллюстративным вариантом осуществления. Например, устройство 1300 может быть мобильным телефоном, компьютером, цифровым широковещательным терминалом, устройством обмена сообщениями, игровой консолью, планшетным устройством, медицинским устройством, тренировочным оборудованием, персональным цифровым ассистентом и тому подобным.
[00177] Ссылаясь на Фиг. 11, устройство 1300 может включать в себя один или множество из следующих компонентов: компонент 1302 обработки, память 1304, компонент 1306 источника питания, компонент 1308 мультимедиа, аудиокомпонент 1310, интерфейс 1312 ввода/вывода (I/O), компонент 1314 датчика и компонент 1316 связи.
[00178] Компонент 1302 обработки обычно управляет общими операциями устройства 1300, такими как операции, ассоциированные с отображением, телефонными вызовами, передачами данных, операциями камеры и операциями записи. Компонент 1302 обработки может включать в себя один или множество процессоров 1320, чтобы исполнять инструкции для выполнения части или всех этапов в описанных выше способах. Кроме того, компонент 1302 обработки может включать в себя один или множество модулей, которые обеспечивают взаимодействие между компонентом 1302 обработки и другими компонентами. Например, компонент 1302 обработки может включать в себя модуль мультимедиа, чтобы обеспечивать взаимодействие между компонентом 1308 мультимедиа и компонентом 1302 обработки.
[00179] Память 1304 сконфигурирована для сохранения данных различных типов данных, чтобы поддерживать работу устройства 1300. Примеры таких данных включают в себя инструкции для любого приложения или способа, управляемого в устройстве 800, контактные данные, данные телефонной книги, сообщение, изображение, видео и т.д. Память 1304 может быть осуществлена с использованием любого типа энергозависимого или энергонезависимого устройства памяти или их комбинации, такого как статическая память произвольного доступа (SRAM), электрически стираемая программируемая постоянная память (EEPROM), стираемая программируемая постоянная память (EPROM), программируемая постоянная память (PROM), постоянная память (ROM), магнитная память, флэш-память, магнитный или оптический диск.
[00180] Компонент 1306 питания подает питание в различные компоненты устройства 1300. Компонент 130 питания может включать в себя систему управления питанием, один или более источников питания и другие компоненты, ассоциированные с генерацией, управлением и распределением питания в устройстве 1300.
[00181] Компонент 1308 мультимедиа включает в себя экран, обеспечивающий интерфейс вывода между устройством 1300 и пользователем. В некоторых вариантах осуществления экран может включать в себя жидкокристаллический дисплей (LCD) и сенсорную панель (ТР). Если экран включает в себя сенсорную панель, экран может быть осуществлен как сенсорный экран, чтобы принимать входные сигналы от пользователя. Сенсорная панель включает в себя один или более датчиков касания, чтобы считывать касания, скольжения и жесты на сенсорной панели. Датчики касания могут не только считывать границу действия касания или скольжения, но также считывают период времени и давление, ассоциированные с действием касания или скольжения. В некоторых вариантах осуществления компонент 1308 мультимедиа включает в себя переднюю камеру и/или заднюю камеру. Передняя камера и/или задняя камера могут принимать внешние данные мультимедиа, когда устройство 1300 находится в рабочем режиме, таком как режим фотографирования или режим видео. Каждая из передней камеры и задней камеры может быть системой фиксированного оптического объектива или может иметь функциональную возможность фокусировки и оптического масштабирования.
[00182] Аудиокомпонент 1310 сконфигурирован с возможностью вывода и/или ввода аудиосигнала. Например, аудиокомпонент 1310 включает в себя микрофон (MIC), сконфигурированный с возможностью приема внешнего аудиосигнала, когда устройство 1300 находится в рабочем режиме, таком как режим вызова, режим записи и режим распознавания речи. Принятый аудиосигнал может быть дополнительно сохранен в памяти 1304 или передан с помощью компонента 1316 связи. В некоторых вариантах осуществления аудиокомпонент 1310 дополнительно включает в себя громкоговоритель, чтобы выводить аудиосигналы.
[00183] Интерфейс 1312 I/O обеспечивает интерфейс между компонентом 1302 обработки и модулями периферийного интерфейса, такими как клавиатура, колесико мыши выбора щелчком, кнопка и тому подобные. Кнопка может включать в себя, но не ограничена: кнопку возврата в исходное положение, кнопку уровня громкости, кнопку запуска и кнопку блокировки.
[00184] Компонент 1314 датчика включает в себя один или более датчиков, чтобы предоставлять оценки состояния различных аспектов устройства 1300. Например, компонент 1314 датчика может обнаруживать открытое/закрытое состояние устройства 1300, относительное расположение компонентов, например, дисплея и клавиатуры устройства 1300, изменение позиции устройства 1300 или компонента устройства 1300, присутствие или отсутствие контакта пользователя с устройством 1300, ориентацию или ускорение/замедление устройства 1300 и изменение температуры устройства 1300. Компонент 1314 датчика может включать в себя датчик близости, сконфигурированный с возможностью обнаружения присутствия близлежащих объектов без какого-либо физического контакта. Компонент 1314 датчика может также включать в себя датчик света, такой как датчик изображения CMOS или CCD, используемый для формирования изображений. В некоторых вариантах осуществления компонент 1314 датчика может также включать в себя датчик акселерометра, гироскопический датчик, магнитный датчик, датчик давления или датчик температуры.
[00185] Компонент 1316 связи сконфигурирован с возможностью обеспечения связи, проводным способом или беспроводным способом, между устройством 1300 и другими устройствами. Устройство 1300 может осуществлять доступ к беспроводной сети на основе стандартов связи, таких как Wi-Fi, 2G или 3G, или их комбинации. В одном иллюстративном варианте осуществления компонент 1316 связи принимает широковещательный сигнал или информацию, связанную с широковещательной связью, из внешних систем управления широковещательной связью через широковещательный канал. В одном иллюстративном варианте осуществления компонент 1316 связи дополнительно включает в себя модуль близкой области связи (NFC), чтобы облегчать связи ближнего действия. Например, модуль NFC может быть осуществлен на основе технологии радиочастотной идентификации (RFID), технологии ассоциации данных инфракрасного излучения (IrDA), технологии сверхширокой ширины полосы частот (UWB), технологии Bluetooth (BT) и других технологий.
[00186] В иллюстративных вариантах осуществления устройство 1300 может быть осуществлено с помощью одной или множества прикладных интегральных схем (ASIC), процессоров цифровых сигналов (DSP), устройств обработки цифровых сигналов (DSPD), программируемых логических устройств (PLD), вентильных матриц, программируемых в условиях эксплуатации (FPGA), контроллеров, микроконтроллеров, микропроцессоров или других электронных компонентов, сконфигурированных для выполнения вышеупомянутого способа.
[00187] В иллюстративных вариантах осуществления также предоставлен постоянный читаемый компьютером запоминающий носитель, включающий в себя инструкции, такие как включенные в память 1304, исполняемые процессором 1320 в устройстве 1300, для выполнения вышеупомянутого способа. Например, постоянный читаемый компьютером запоминающий носитель может быть ROM, памятью произвольного доступа (RAM), CD-ROM, магнитной лентой, флоппи-диском и оптическим запоминающим устройством данных и тому подобным.
[00188] Постоянный читаемый компьютером запоминающий носитель, когда инструкции в запоминающем носителе исполняются процессором мобильного терминала, мобильный терминал может выполнять способ воспроизведения мультимедиа, причем способ содержит:
[00189] получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа,
[00190] определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров и
[00191] продолжение воспроизведения мультимедиа в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
[00192] В качестве альтернативы, определение начальной позиции высказывания всего высказывания в соответствии с аудиоданными содержит:
[00193] обнаружение интервала времени между соседними двумя аудиосигналами в аудиоданных и
[00194] определение любой из позиций времени между соседними двумя аудиосигналами как начальной позиции высказывания, когда интервал времени между соседними двумя аудиосигналами больше, чем первый предварительно установленный интервал.
[00195] В качестве альтернативы, определение начальной позиции высказывания всего высказывания в соответствии с данными субтитров содержит:
[00196] получение начального времени отображения и/или конечного времени отображения каждого субтитра в данных субтитров, и
[00197] определение начальной позиции высказывания в соответствии с начальным временем отображения и/или конечным временем отображения субтитра.
[00198] В качестве альтернативы, определение начальной позиции высказывания всего высказывания в соответствии с аудиоданными и данными субтитров содержит:
[00199] обнаружение времени воспроизведения каждого аудиосигнала аудиоданных,
[00200] получение начального времени отображения и/или конечного времени отображения субтитра, соответствующего соседними аудиосигналам, когда интервал времени между соседними двумя аудиосигналами больше, чем первый предварительно установленный интервал, и
[00201] определение начальной позиции высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующим соседним двум аудиосигналам.
[00202] В качестве альтернативы, определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными содержит:
[00203] фильтрацию аудиоданных в соответствии с частотой речи, чтобы получить речевые аудиоданные,
[00204] обнаружение интервала времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных и
[00205] определение любой из позиций времени между соседними двумя речевыми аудиосигналами в качестве начальной позиции высказывания, когда интервал времени между соседними двумя речевыми аудиосигналами больше, чем первый предварительно установленный интервал.
[00206] В качестве альтернативы, продолжение воспроизведения мультимедиа в соответствии с начальной позицией высказывания, когда начальные позиции высказываний, по меньшей мере, двух полных высказываний определяются в соответствии с аудиоданными и/или данными субтитров, содержит:
[00207] продолжение воспроизведения мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, или
[00208] продолжение воспроизведения мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое, большее или равное 2.
[00209] В качестве альтернативы, когда начальная позиция высказывания всего высказывания не определена в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа, способ дополнительно включает в себя этапы:
[00210] получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, расположено до времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз,
[00211] определение начальной позиции высказывания всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, и
[00212] продолжение получения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени и определение начальной позиции высказывания для всего высказывания в соответствии с обратной последовательностью времени до тех пор, пока не будет определена, по меньшей мере, одна начальная позиция высказывания всего высказывания, если начальная позиция высказывания всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент.
[00213] В качестве альтернативы, получение аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа содержит:
[00214] получение позиции времени, расположенной до позиции паузы мультимедиа и отстоящей от позиции паузы на вторую предварительно установленную длительность времени,
[00215] получение аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до позиции паузы и
[00216] определение начальной позиции высказывания всего высказывания в соответствии с аудиоданными и/или данными субтитров содержит:
[00217] определение начальной позиции высказывания всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы.
[00218] После рассмотрения этого описания и выполнения вариантов осуществления, раскрытых в настоящем описании, специалисты в данной области техники могут без труда предвидеть другие аспекты осуществления настоящего раскрытия. Подразумевается, что настоящее раскрытие охватывает любые изменения, использование или адаптивное изменение этих вариантов осуществления, и эти изменения, использование или адаптивное изменение следуют общей концепции настоящего раскрытия и включают в себя общие сведения или обычные технические средства в технической области, которые не раскрыты в настоящем раскрытии. Описание и варианты осуществления являются только иллюстративными, и действительные рамки объема и сущности настоящего раскрытия определены следующей формулой изобретения.
[00219] Следует понимать, что настоящее раскрытие не ограничено точными структурами, которые описаны выше и изображены на сопровождающих чертежах, и могут быть модифицированы и изменены, не выходя за рамки объема настоящего раскрытия. Рамки объема настоящего раскрытия ограничены только прилагаемой формулой изобретения.

Claims (17)

1. Способ воспроизведения мультимедиа, отличающийся тем, что содержит этапы, на которых:
получают аудиоданные и/или данные субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа;
определяют начальную позицию высказывания для всего высказывания в соответствии с:
интервалом времени между соседними двумя аудиосигналами в аудиоданных и/или
начальным временем отображения и/или конечным временем отображения по меньшей мере одного субтитра в данных субтитров; и
продолжают воспроизведение мультимедиа в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
2. Способ по п. 1, отличающийся тем, что определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными содержит этапы, на которых:
обнаруживают интервал времени между соседними двумя аудиосигналами в аудиоданных; и
определяют любую из позиций времени между этими соседними двумя аудиосигналами как начальную позицию высказывания, когда интервал времени между этими соседними двумя аудиосигналами больше, чем первый предварительно установленный интервал.
3. Способ по п. 1, отличающийся тем, что определение начальной позиции высказывания для всего высказывания в соответствии с данными субтитров содержит этапы, на которых:
получают начальное время отображения и/или конечное время отображения каждого субтитра в данных субтитров; и
определяют начальную позицию высказывания в соответствии с начальным временем отображения и/или конечным временем отображения субтитра.
4. Способ по п. 1, отличающийся тем, что определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и данными субтитров содержит этапы, на которых:
обнаруживают время воспроизведения каждого аудиосигнала аудиоданных;
получают начальное время отображения и/или конечное время отображения субтитра, соответствующее соседним аудиосигналам, когда интервал времени между соседними двумя аудиосигналами больше, чем первый предварительно установленный интервал; и
определяют начальную позицию высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующим соседним аудиосигналам.
5. Способ по любому из пп. 2-4, отличающийся тем, что определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными содержит этапы, на которых:
фильтруют аудиоданные в соответствии с частотой речи, чтобы получить речевые аудиоданные;
обнаруживают интервал времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных; и
определяют любую из позиций времени между соседними двумя речевыми аудиосигналами как начальную позицию высказывания, когда интервал времени между соседними двумя речевыми аудиосигналами больше, чем первый предварительно установленный интервал.
6. Способ по любому из пп. 1-4, отличающийся тем, что, когда начальные позиции высказываний по меньшей мере двух полных высказываний определены в соответствии с аудиоданными и/или данными субтитров, то продолжение воспроизведения мультимедиа в соответствии с начальной позицией высказывания содержит этап, на котором:
продолжают воспроизводить мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, или
продолжают воспроизводить мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое, большее или равное 2.
7. Способ по любому из пп. 1-4, отличающийся тем, что, когда начальная позиция высказывания для всего высказывания не определена в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа, способ дополнительно содержит этапы, на которых:
получают аудиоданные и/или данные субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, предшествует времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз;
определяют начальную позицию высказывания для всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент; и
продолжают получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени и определяют начальную позицию высказывания для всего высказывания в соответствии с обратной последовательностью времени до тех пор, пока не будет определена по меньшей мере одна начальная позиция высказывания для всего высказывания, если начальная позиция высказывания для всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент.
8. Способ по любому из пп. 1-4, отличающийся тем, что получение аудиоданных и/или данных субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа содержит этапы, на которых:
получают позицию времени, расположенную до позиции паузы мультимедиа и отстоящую от позиции паузы на вторую предварительно установленную длительность времени;
получают аудиоданные и/или данные субтитров в течение первой предварительно установленной длительности времени до этой позиции времени, и
при этом определение начальной позиции высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров содержит этап, на котором определяют начальную позицию высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до упомянутой позиции времени.
9. Устройство воспроизведения мультимедиа, отличающееся тем, что содержит:
модуль получения, сконфигурированный получать аудиоданные и/или данные субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа;
модуль анализа, сконфигурированный определять начальную позицию высказывания для всего высказывания в соответствии с:
интервалом времени между соседними двумя аудиосигналами в аудиоданных, полученных модулем получения, и/или
начальным временем отображения и/или конечным временем отображения по меньшей мере одного субтитра в данных субтитров, полученных модулем получения; и
модуль воспроизведения, сконфигурированный продолжать воспроизведение мультимедиа в соответствии с начальной позицией высказывания, полученной модулем анализа, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
10. Устройство по п. 9, отличающееся тем, что модуль анализа содержит:
блок обнаружения, сконфигурированный обнаруживать интервал времени между соседними двумя аудиосигналами в аудиоданных, полученных модулем получения; и
блок определения при анализе, сконфигурированный определять любую из позиций времени между соседними двумя аудиосигналами как начальную позицию высказывания, когда интервал времени между соседними двумя аудиосигналами, обнаруженный блоком обнаружения, больше, чем первый предварительно установленный интервал.
11. Устройство по п. 9, отличающееся тем, что модуль анализа содержит:
блок получения, сконфигурированный получать начальное время отображения и/или конечное время отображения каждого субтитра в данных субтитров, полученных из модуля получения; и
блок определения при анализе, сконфигурированный определять начальную позицию высказывания в соответствии с начальным временем отображения и/или конечным временем отображения субтитра, полученным блоком получения.
12. Устройство по п. 9, отличающееся тем, что модуль анализа содержит:
блок обнаружения, сконфигурированный обнаруживать время воспроизведения каждого аудиосигнала аудиоданных, полученных модулем получения;
блок получения, сконфигурированный получать начальное время отображения и/или конечное время отображения субтитра, соответствующее соседним аудиосигналам, когда интервал времени между соседними двумя аудиосигналами, обнаруженный устройством обнаружения, больше, чем первый предварительно установленный интервал; и
блок определения при анализе, сконфигурированный определять начальную позицию высказывания в соответствии с временем воспроизведения соседних двух аудиосигналов и начальным временем отображения и/или конечным временем отображения субтитра, соответствующим соседним двум аудиосигналам, полученным блоком получения.
13. Устройство по любому из пп. 9-12, отличающееся тем, что модуль анализа дополнительно содержит блок фильтрации, сконфигурированный фильтровать аудиоданные, полученные модулем получения, в соответствии с частотой речи, с тем чтобы получить речевые аудиоданные, при этом
блок обнаружения сконфигурирован обнаруживать интервал времени между соседними двумя речевыми аудиосигналами в речевых аудиоданных, отфильтрованных блоком фильтрации, и
блок определения при анализе сконфигурирован с возможностью определять любую из позиций времени между соседними двумя речевыми аудиосигналами как начальную позицию высказывания, когда интервал времени между соседними двумя речевыми аудиосигналами, обнаруженный блоком обнаружения, больше, чем первый предварительно установленный интервал.
14. Устройство по любому из пп. 9-12, отличающееся тем, что модуль воспроизведения сконфигурирован продолжать воспроизведение мультимедиа с начальной позиции высказывания, ближайшей к позиции паузы, когда начальные позиции высказываний по меньшей мере двух полных высказываний определены модулем анализа, или продолжать воспроизведение мультимедиа с N-й начальной позиции высказывания до позиции паузы, когда число высказываний в обратном направлении предварительно установлено как N, где N - целое, большее или равное 2.
15. Устройство по любому из пп. 9-12, отличающееся тем, что
модуль получения сконфигурирован получать аудиоданные и/или данные субтитров первой предварительно установленной длительности времени в соответствии с обратной последовательностью времени, причем время воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент, предшествует времени воспроизведения аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных последний раз, когда начальная позиция высказывания для всего высказывания не определена модулем анализа в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до позиции паузы мультимедиа, и
модуль анализа сконфигурирован определять начальную позицию высказывания для всего высказывания из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент модулем получения; и продолжать получение аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, и определять начальную позицию высказывания для всего высказывания в соответствии с обратной последовательностью времени до тех пор, пока не будет определена по меньшей мере одна начальная позиция высказывания для всего высказывания, если начальная позиция высказывания для всего высказывания не определена из аудиоданных и/или данных субтитров первой предварительно установленной длительности времени, полученных в текущий момент.
16. Устройство по любому из пп. 9-12, отличающееся тем, что модуль получения сконфигурирован получать позицию времени, расположенную до позиции паузы мультимедиа и отстоящую от позиции паузы на вторую предварительно определенную длительность времени, и получать аудиоданные и/или данные субтитров в течение первой предварительно установленной длительности времени до этой позиции времени,
при этом модуль анализа сконфигурирован определять начальную позицию высказывания для всего высказывания в соответствии с аудиоданными и/или данными субтитров в течение первой предварительно установленной длительности времени до упомянутой позиции паузы.
17. Устройство воспроизведения мультимедиа, отличающееся тем, что содержит:
процессор и
память для хранения инструкций, исполняемых процессором,
причем процессор сконфигурирован:
получать аудиоданные и/или данные субтитров первой предварительно установленной длительности времени до позиции паузы мультимедиа,
определять начальную позицию высказывания для всего высказывания в соответствии с:
интервалом времени между соседними двумя аудиосигналами в аудиоданных и/или
начальным временем отображения и/или конечным временем отображения по меньшей мере одного субтитра в данных субтитров, и
продолжать воспроизведение мультимедиа в соответствии с начальной позицией высказывания, когда обнаруживается инструкция продолжения воспроизведения мультимедиа или выполняется условие продолжения воспроизведения мультимедиа.
RU2015105625/08A 2014-06-06 2014-11-20 Способ и устройство воспроизведения мультимедиа RU2605361C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410250800.9A CN104038827B (zh) 2014-06-06 2014-06-06 多媒体播放方法及装置
CN201410250800.9 2014-06-06
PCT/CN2014/091757 WO2015184738A1 (zh) 2014-06-06 2014-11-20 多媒体播放方法及装置

Publications (2)

Publication Number Publication Date
RU2015105625A RU2015105625A (ru) 2016-09-10
RU2605361C2 true RU2605361C2 (ru) 2016-12-20

Family

ID=51469394

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015105625/08A RU2605361C2 (ru) 2014-06-06 2014-11-20 Способ и устройство воспроизведения мультимедиа

Country Status (9)

Country Link
US (2) US9589596B2 (ru)
EP (1) EP2953133B1 (ru)
JP (1) JP2016525765A (ru)
KR (1) KR101657913B1 (ru)
CN (1) CN104038827B (ru)
BR (1) BR112015003350A2 (ru)
MX (1) MX352076B (ru)
RU (1) RU2605361C2 (ru)
WO (1) WO2015184738A1 (ru)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104038827B (zh) 2014-06-06 2018-02-02 小米科技有限责任公司 多媒体播放方法及装置
CN107181986A (zh) * 2016-03-11 2017-09-19 百度在线网络技术(北京)有限公司 视频与字幕的匹配方法和装置
WO2017157428A1 (en) * 2016-03-16 2017-09-21 Sony Mobile Communications Inc Controlling playback of speech-containing audio data
CN105959829A (zh) * 2016-06-24 2016-09-21 封雷迅 一种用于逐句复读的视频播放方法及工具
CN106373598B (zh) * 2016-08-23 2018-11-13 珠海市魅族科技有限公司 音频重播的控制方法和装置
CN107886939B (zh) * 2016-09-30 2021-03-30 北京京东尚科信息技术有限公司 一种在客户端的中止-接续式文本语音播放方法和装置
CA3041611C (en) * 2016-10-25 2023-02-28 Rovi Guides, Inc. Systems and methods for resuming a media asset
US10893319B2 (en) 2016-10-25 2021-01-12 Rovi Guides, Inc. Systems and methods for resuming a media asset
WO2019084181A1 (en) * 2017-10-26 2019-05-02 Rovi Guides, Inc. SYSTEMS AND METHODS FOR RECOMMENDING PAUSE POSITION AND RESUME READING MULTIMEDIA CONTENT
US10362354B2 (en) 2017-10-26 2019-07-23 Rovi Guides, Inc. Systems and methods for providing pause position recommendations
CN108156514B (zh) * 2017-12-27 2020-07-07 Oppo广东移动通信有限公司 媒体文件的播放方法、装置及存储介质
CN108830551A (zh) * 2018-05-25 2018-11-16 北京小米移动软件有限公司 日程提示方法及装置
CN108989897A (zh) * 2018-08-13 2018-12-11 封雷迅 一种按字幕逐句复读的视频播放方法、存储设备及终端
US11113229B2 (en) * 2019-06-03 2021-09-07 International Business Machines Corporation Providing a continuation point for a user to recommence consuming content
CN110598012B (zh) * 2019-09-23 2023-05-30 听典(上海)教育科技有限公司 一种音视频播放的方法及多媒体播放装置
CN111128254B (zh) * 2019-11-14 2021-09-03 网易(杭州)网络有限公司 音频播放方法、电子设备及存储介质
US11514938B2 (en) * 2020-08-19 2022-11-29 Western Digital Technologies, Inc. Data storage device reducing wake latency for magnetic tape
US11647257B2 (en) 2020-10-29 2023-05-09 International Business Machines Corporation Pause playback of media content based on closed caption length and reading speed
CN113886612A (zh) * 2020-11-18 2022-01-04 北京字跳网络技术有限公司 一种多媒体浏览方法、装置、设备及介质
CN112309427B (zh) * 2020-11-26 2024-05-14 北京达佳互联信息技术有限公司 语音回退方法及其装置
CN112712825B (zh) * 2020-12-30 2022-09-23 维沃移动通信有限公司 音频处理方法、装置及电子设备
CN112822552B (zh) * 2021-01-11 2023-06-09 湖南新云网科技有限公司 多媒体资源加载方法、装置、设备及计算机存储介质
US20240236438A1 (en) * 2021-06-02 2024-07-11 Lg Electronics Inc. Display apparatus and operating method therefor
CN113656550A (zh) * 2021-08-19 2021-11-16 中国银行股份有限公司 一种智能外呼方法及装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001003387A1 (en) * 1999-07-06 2001-01-11 At & T Laboratories Cambridge Ltd A thin multimedia communication device and method
EP2246857A2 (en) * 2002-09-12 2010-11-03 Panasonic Corporation Recording medium, playback device, program, playback method, and recording method
EP0737016B1 (en) * 1995-04-03 2010-12-08 Sony Corporation Subtitle colorwiping and positioning
US20110301728A1 (en) * 2010-06-03 2011-12-08 Google Inc. Continuous audio interaction with interruptive audio
RU2512135C2 (ru) * 2008-11-18 2014-04-10 Панасоник Корпорэйшн Устройство воспроизведения, способ воспроизведения и программа для стереоскопического воспроизведения

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3754269B2 (ja) * 2000-04-18 2006-03-08 三洋電機株式会社 映像信号再生装置
US20090282444A1 (en) * 2001-12-04 2009-11-12 Vixs Systems, Inc. System and method for managing the presentation of video
KR100456441B1 (ko) * 2002-01-18 2004-11-09 주식회사 휴맥스 저장 매체에 저장된 서비스의 중지 시점부터 서비스를제공하는 방법 및 장치
JP2003307997A (ja) * 2002-04-15 2003-10-31 Sony Corp 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体
JP2004157457A (ja) * 2002-11-08 2004-06-03 Nissan Motor Co Ltd 音声提示装置
TW200537941A (en) * 2004-01-26 2005-11-16 Koninkl Philips Electronics Nv Replay of media stream from a prior change location
JP4247626B2 (ja) * 2005-01-20 2009-04-02 ソニー株式会社 再生装置および再生方法
JP2006208866A (ja) * 2005-01-28 2006-08-10 Sun Corp 再生装置
JP4622728B2 (ja) * 2005-08-03 2011-02-02 カシオ計算機株式会社 音声再生装置および音声再生処理プログラム
CN1956504A (zh) * 2005-10-26 2007-05-02 其乐达科技股份有限公司 影音播放系统的句子分离方法
US8731914B2 (en) * 2005-11-15 2014-05-20 Nokia Corporation System and method for winding audio content using a voice activity detection algorithm
US9411781B2 (en) * 2006-01-18 2016-08-09 Adobe Systems Incorporated Rule-based structural expression of text and formatting attributes in documents
JP2007235543A (ja) * 2006-03-01 2007-09-13 Funai Electric Co Ltd 光ディスク装置
DE602006020188D1 (de) * 2006-05-08 2011-03-31 Thomson Licensing Verfahren zur wiederaufnahme der inhaltswiedergabe über einrichtungen hinweg mittels lesezeichen.
JP4875752B2 (ja) * 2006-11-22 2012-02-15 マルチモーダル・テクノロジーズ・インク 編集可能なオーディオストリームにおける音声の認識
JP5026294B2 (ja) 2008-01-29 2012-09-12 京セラ株式会社 コンテンツ再生装置
CN101588470B (zh) * 2008-05-20 2013-05-29 深圳市同洲电子股份有限公司 一种ip-qam视频点播系统的时移暂停方法、系统及设备
JP5121937B2 (ja) 2008-11-13 2013-01-16 三菱電機株式会社 再生装置及び再生方法
CN101963968A (zh) * 2009-07-24 2011-02-02 艾比尔国际多媒体有限公司 多媒体辨识系统与方法,及其应用的多媒体客制化方法
JP2012004722A (ja) 2010-06-15 2012-01-05 Panasonic Corp コンテンツ再生装置、コンテンツ再生方法、およびコンテンツ再生プログラム
US9355683B2 (en) * 2010-07-30 2016-05-31 Samsung Electronics Co., Ltd. Audio playing method and apparatus
US20130103770A1 (en) * 2011-10-25 2013-04-25 Microsoft Corporation Distributed semi-synchronized event driven playback of multimedia
KR101830656B1 (ko) * 2011-12-02 2018-02-21 엘지전자 주식회사 이동 단말기 및 이의 제어방법
US20140253702A1 (en) * 2013-03-10 2014-09-11 OrCam Technologies, Ltd. Apparatus and method for executing system commands based on captured image data
US9462032B2 (en) * 2013-07-24 2016-10-04 Google Inc. Streaming media content
CN104038827B (zh) * 2014-06-06 2018-02-02 小米科技有限责任公司 多媒体播放方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0737016B1 (en) * 1995-04-03 2010-12-08 Sony Corporation Subtitle colorwiping and positioning
WO2001003387A1 (en) * 1999-07-06 2001-01-11 At & T Laboratories Cambridge Ltd A thin multimedia communication device and method
EP2246857A2 (en) * 2002-09-12 2010-11-03 Panasonic Corporation Recording medium, playback device, program, playback method, and recording method
RU2512135C2 (ru) * 2008-11-18 2014-04-10 Панасоник Корпорэйшн Устройство воспроизведения, способ воспроизведения и программа для стереоскопического воспроизведения
US20110301728A1 (en) * 2010-06-03 2011-12-08 Google Inc. Continuous audio interaction with interruptive audio

Also Published As

Publication number Publication date
KR20160003619A (ko) 2016-01-11
CN104038827A (zh) 2014-09-10
WO2015184738A1 (zh) 2015-12-10
US20170133060A1 (en) 2017-05-11
BR112015003350A2 (pt) 2017-07-04
EP2953133A1 (en) 2015-12-09
US9589596B2 (en) 2017-03-07
US20150356997A1 (en) 2015-12-10
RU2015105625A (ru) 2016-09-10
KR101657913B1 (ko) 2016-09-19
US9786326B2 (en) 2017-10-10
MX352076B (es) 2017-11-08
MX2015002051A (es) 2016-10-28
EP2953133B1 (en) 2019-08-07
CN104038827B (zh) 2018-02-02
JP2016525765A (ja) 2016-08-25

Similar Documents

Publication Publication Date Title
RU2605361C2 (ru) Способ и устройство воспроизведения мультимедиа
EP3125530B1 (en) Video recording method and device
CN106911961B (zh) 多媒体数据播放方法及装置
KR101992676B1 (ko) 영상 인식을 이용하여 음성 인식을 하는 방법 및 장치
RU2656691C2 (ru) Способ и клиентский терминал для удаленной поддержки
RU2628473C2 (ru) Способ и устройство для оптимизации звукового сигнала
CN105828101B (zh) 生成字幕文件的方法及装置
RU2656693C2 (ru) Способ и устройство подсказывания события
KR20170061102A (ko) 음량 조절 방법, 장치 및 단말기
US20170126801A1 (en) Method, apparatus, and storage medium for performing media synchronization
US20140247368A1 (en) Ready click camera control
JPWO2015198488A1 (ja) 電子機器、方法およびプログラム
CN107743244B (zh) 视频直播方法及装置
CN105210364A (zh) 在视频回放期间的动态音频空间感改变
JP2019521440A (ja) 装置および関連する方法
CN111836062A (zh) 视频播放方法、装置及计算机可读存储介质
CN113259776A (zh) 字幕与音源的绑定方法及装置
CN110019936A (zh) 一种媒体文件播放过程中的注释方法和装置
US20160142885A1 (en) Voice call prompting method and device
JP2009260718A (ja) 画像再生装置及び画像再生処理プログラム
CN114464186A (zh) 关键词确定方法及装置
KR20120050764A (ko) 카메라를 구비한 휴대 단말기의 연속 자동 초점 조절 방법 및 장치
CN106919395B (zh) 应用通知显示方法及装置
CN106791077B (zh) 即时通讯软件中多媒体留言的处理方法和装置
KR101755120B1 (ko) 음성 제어를 위한 장치 및 방법