CN104834750B - 一种文字曲线生成方法 - Google Patents

一种文字曲线生成方法 Download PDF

Info

Publication number
CN104834750B
CN104834750B CN201510282624.1A CN201510282624A CN104834750B CN 104834750 B CN104834750 B CN 104834750B CN 201510282624 A CN201510282624 A CN 201510282624A CN 104834750 B CN104834750 B CN 104834750B
Authority
CN
China
Prior art keywords
word
curve
text message
font size
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510282624.1A
Other languages
English (en)
Other versions
CN104834750A (zh
Inventor
刘希斌
郑亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CIENET TECHNOLOGIES (BEIJING) Co Ltd
Original Assignee
CIENET TECHNOLOGIES (BEIJING) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CIENET TECHNOLOGIES (BEIJING) Co Ltd filed Critical CIENET TECHNOLOGIES (BEIJING) Co Ltd
Priority to CN201510282624.1A priority Critical patent/CN104834750B/zh
Publication of CN104834750A publication Critical patent/CN104834750A/zh
Priority to PCT/CN2016/083910 priority patent/WO2016188493A1/zh
Priority to US15/576,876 priority patent/US10311133B2/en
Application granted granted Critical
Publication of CN104834750B publication Critical patent/CN104834750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • G06F16/3328Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30241Trajectory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • User Interface Of Digital Computer (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种文字曲线生成方法,包括如下步骤:(1)输入文本信息,所述文本信息包括m个字;(2)输入语音生成音频文件,语音中的内容与文本信息的内容对应;(3)将音频文件划分为m个等长的时间段,计算每个时间段的对应音量;(4)根据音频文件中不同时间段的音量计算出与文本信息中每个文字对应的尺寸信息;(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。这种由具有不同字体尺寸的多个文字组成的文字曲线,相对于现有即时通信系统中使用的具有单一字体尺寸的文本信息,画面更为有趣,信息量多,可以更准确、充分地表达出用户的情感和意愿。

Description

一种文字曲线生成方法
技术领域
本发明涉及一种文字曲线生成方法,尤其涉及一种基于语音输入或触摸屏绘制曲线输入实现的文字曲线生成方法。
背景技术
近年来,随着即时通信系统的普及推广,例如QQ、微信、MSN等应用软件已经逐渐被大部分用户所接受。用户在使用这些应用软件时,通常需要在应用软件中输入大量文字,为了增加输入内容的趣味性,表达特殊含义,丰富输入内容,有时用户希望可以插入形象的表情图标进行输出,而在部分时刻,为了明确表达重点,用户还希望可以调整字体大小进行输出。
在现有技术中,当需要调整文本信息中的字体尺寸时,通常需要用户选择不同的字号对文本的大小尺寸进行设置,当用户希望将一句话中的不同部分以不同字体尺寸显示时,通常需要分别对不同的文本进行字号设置,需要重复字号设置操作多次,无法一次完成。
而且,在现有即时通信系统中,当从格式设置中调整字体大小时,通常只能调整输入窗口中整个文本信息的大小尺寸,即对整个文本信息的尺寸进行更改,而无法单独更改部分词语的尺寸大小,无法使用户的表达重点突出。
发明内容
本发明所要解决的技术问题在于提供一种文字曲线生成方法。
为了实现上述发明目的,本发明采用下述技术方案:
一种文字曲线生成方法,所述文字曲线是指由具有不同尺寸大小的文字组成的文本,包括如下步骤:
(1)输入文本信息,所述文本信息包括m个字;
(2)输入语音生成音频文件,语音中的内容与文本信息的内容对应;
(3)将音频文件划分为m个等长的时间段,计算每个时间段的对应音量;
(4)根据音频文件中不同时间段的音量计算出与文本信息中每个文字对应的尺寸信息;
(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。
其中较优地,所述步骤(3)中每个时间段对应多个采样值,将所有采样值转化为PCM码,比较这组PCM码的绝对值,找出其最大值并保存,作为该时间段的音量。
其中较优地,在所述步骤(4)中,根据m个时间段的音量计算文本信息中的文字的尺寸信息,包括如下步骤:
(41)读取构成文字曲线的q种字体尺寸;
(42)使最小PCM值为Pmin,最大PCM值为Pmax
(43)利用下式计算出q种字体尺寸分别对应的PCM值Pn
Pn=Pmin+(n-1)*d,
其中,d=(Pmax-Pmin)/(q-1),n=1……q;
(44)根据与每个文字对应的时间段的PCM值计算字体尺寸:
当对应PCM值介于Pn和Pn-1时,如果PCM值≥(Pn-Pn-1)/2时,该文字使用Pn相对应的字体尺寸;如果PCM值<(Pn-Pn-1)/2时,该文字使用Pn-1相对应的字体尺寸。
其中较优地,在所述步骤(41)中,包括设置文字曲线的最小字体尺寸、以及设置两种相邻尺寸的相差字号的步骤。
其中较优地,在所述步骤(2)中,用户通过触摸录音图钮,录制简短语音生成音频文件。
其中较优地,在所述步骤(2)中,音频文件的存储类型是AMR格式文件或者G.711格式文件。
一种文字曲线生成方法,所述文字曲线是指由具有不同尺寸大小的文字组成的文本,包括如下步骤:
(1)输入文本信息,所述文本信息包括m个字;
(2)通过触划触摸屏绘制曲线输入,并记录整个曲线的像素点(x,y)轨迹;
(3)将曲线划分为m个等长的区间,计算每个区间中所有像素点的y坐标值的平均值,作为该区间的高度值;
(4)根据不同区间的高度值,计算出与文本信息中每个文字对应的尺寸信息;
(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。
其中较优地,在所述步骤(4)中,根据m个区间的高度值计算文本信息中的文字的尺寸信息,包括如下步骤:
(41)读取构成文字曲线的q种字体尺寸;
(42)使最小y平均值为Ymin,最大y平均值为Ymax
(43)利用下式计算出q种字体尺寸分别对应的y值Yn
Yn=Ymin+(n-1)*d,
其中,d=(Ymax-Ymin)/(q-1),n=1……q;
(44)根据与每个文字对应的区间的y平均值计算字体尺寸:
当对应y平均值介于Yn和Yn-1时,如果y平均值≥(Yn-Yn-1)/2时,该文字使用Yn相对应的字体尺寸;如果y平均值<(Yn-Yn-1)/2时,该文字使用Yn-1相对应的字体尺寸。
其中较优地,在所述步骤(41)中,包括设置文字曲线的最小字体尺寸、以及设置两种相邻尺寸的相差字号的步骤。
本发明公开的文字曲线生成方法,可以基于语音输入实现,也可以基于触摸屏绘制曲线输入实现。它可以一次性形成由具有不同字体尺寸的多个文字组成的文字曲线,相对于现有即时通信系统中使用的具有单一字体尺寸的文本信息,画面更为有趣,重点突出,信息量多,可以更准确、充分地表达出用户的情感和意愿。
附图说明
图1是基于语音输入或触摸屏绘制曲线输入形成的文字曲线的示例;
图2是图1所示文字曲线对应的文本信息和尺寸信息示例;
图3是用于实现文字曲线生成方法的应用界面的示例;
图4是第一实施例中,基于语音输入生成文字曲线的客户端界面示例;
图5是组成G.711A律编码格式的PCM采样示意图;
图6是从语音文件生成尺寸信息的处理流程图;
图7是根据尺寸信息生成文字曲线的对应关系示例;
图8是第二实施例中,基于触摸屏绘制曲线输入生成文字曲线的客户端界面示例;
图9是从曲线像素坐标生成尺寸信息的处理流程图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容做进一步的详细说明。
本发明提供的文字曲线生成方法,用于在客户端一次性形成如图1所示的由具有不同尺寸大小的多个文字组成的文本,即文字曲线。与具有单一尺寸的文本相比,本发明提供的文字曲线的表现形式更为形象,且重点突出,便于用户理解和接受。如图1所示的文字曲线由如图2所示的文本信息和尺寸信息组成,当不同客户端通过服务器进行交互时,可以以文本信息+尺寸信息的格式进行数据传输,而在客户端显示时,可以直接显示为由具有不同尺寸的多个文字组成的文字曲线。
本发明提供的文字曲线生成方法,基于语音输入或触摸屏绘制曲线输入实现。当在图3所示的即时通信信息界面输入文本信息之后,首先通过触摸录音图钮1进行录音生成音频文件,或者通过触摸触划图钮2后进行触屏划线输入曲线,然后从音频文件或曲线信息中获取文字的尺寸信息,最后结合文本信息和尺寸信息生成文字曲线。相对于通过一一设置字体尺寸获得类似文本的输入方式,通过语音输入或触摸屏绘制曲线输入的方式一次性形成文字曲线的输入方式更简便快捷。
第一实施例
具体来说,基于语音输入的文字曲线生成方法包括如下步骤:(1)输入文本信息,文本信息包括m个字(m为正整数,下同);(2)输入语音生成音频文件;(3)将音频文件划分为m个等长的时间段,计算每个时间段的对应音量;(4)根据音频文件中不同时间段的音量计算出与文本信息中每个文字对应的尺寸信息;(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。
以图4中右侧屏幕中所示的文字曲线为例进行详细说明。在步骤(1)中,输入文本信息“宝贝!我很爱你。么么哒!”共12个字符,m=12,此时,12个文字以相同尺寸显示于即时通信界面;在步骤(2)中,通过长按录音图钮1进行录音,录音过程中,即时通信界面显示如左图所示的录音状态,松开录音图钮1,停止录音。录音的内容可以与文本信息的内容对应,例如,录入用户逐字读出文本信息的语音。假设录音时长为6秒,平均每秒录制2个文字(x=2)。移动终端机会自动把此语音生成一语音文件。语音文件编码格式可以灵活选用,如AMR格式,G.711格式等。
为了描述方便,本发明以G.711A律编码格式为例进行说明。G.711A律编码会产生采样频率为8kHz的64kbit/s的比特流,即每秒有8000次的声音采样。那么每一个文字平均有4000次的采样,(8000/x=4000)。每个采样是由PCM采样值转化而来的。PCM声音采样原理如图5所示,声音音量的大小是由PCM采样的波形的振幅决定的,因此,通过如图6所示的算法可以获得每个文字对应的波形振幅,并将其转化为每个文字对应的尺寸。
如图6所示,在步骤(3)中每个文字对应N个采样值(N为正整数;在该实施例中,N=4000),将对应于同一文字的所有采样值转化为PCM码,比较这组PCM码的绝对值,找出其最大值并保存,作为该时间段的音量,即对应于同一文字的音量。依次处理音频文件中的数据,获得所有文字对应的时间段的音量,然后进入步骤(4)。步骤(4)中,根据12个时间段的音量计算文本信息中的每个文字的尺寸信息。
下面结合图7所示的文字曲线对步骤(4)中计算每个文字的尺寸信息的详细过程进行说明。(41)读取构成文字曲线的q种(q为正整数,下同)字体尺寸;在该过程中,还可以包括设置最小字体尺寸和设置两种相邻字体相差字号的步骤;假设文字曲线是由q种字体尺寸组成,每个字体尺寸相差x号,最小字体尺寸可以随机取值,例如可以直接使用用户在即时通信界面设定的默认字号,或者由用户重新设置;在图7所示的实施例中,文字曲线由6种字体尺寸组成,最小字体尺寸为12,每个字体尺寸相差4号,则6种字体尺寸分别为12、16、20、24、28、32;(42)使步骤(3)中计算出的最小PCM值为Pmin,最大PCM值为Pmax;在图7中,Pmin=3,Pmax=18;(43)使用下式计算出q种字体尺寸分别对应的PCM值Pn:Pn=Pmin+(n-1)*d,其中,d=(Pmax-Pmin)/(q-1),n=1……q;在该实施例中,q=6,P1=3,P2=6,P3=9,P4=12;P5=15;P6=18,上述6个PCM值分别与6种字体尺寸对应;(44)根据每个文字对应的PCM值计算相应的字体尺寸:当对应PCM值介于Pn和Pn-1时,如果PCM值≥(Pn-Pn-1)/2时,该文字使用Pn相对应的字体尺寸;如果PCM值<(Pn-Pn-1)/2时,该文字使用Pn-1相对应的字体尺寸。在图7中,12个文字的尺寸分别为16、24、16、16、24、32、16、12、12、20、24、28。对比图2和图7所示的文字曲线可知,图2和图7分别是基于同一段录音获得的文字曲线,其中使用的最小字体尺寸不同;在图2所示的文字曲线中,最小字体尺寸为24,在图7所示的文字曲线中,最小字体尺寸为12。
第二实施例
基于触摸屏绘制曲线输入的文字曲线生成方法包括如下步骤:(1)输入文本信息,文本信息包括m个字;(2)通过触划触摸屏绘制曲线输入,并记录整个曲线的像素点(x,y)轨迹;(3)将曲线划分为m个等长的区间,计算每个区间中所有像素点的y坐标值的平均值,作为该区间的高度值;(4)根据不同区间的高度值,计算出与文本信息中每个文字对应的尺寸信息;(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。
用于实现文字曲线生成方法的通信界面如图8所示,通过触摸触划图钮2进行触屏划线输入曲线。结合图9所示的处理流程图可知,通过采集曲线中各点的像素坐标生成文字的尺寸信息。
以图8中右侧屏幕中所示的文字曲线为例进行说明。在步骤(1)中,输入文本信息“宝贝!我很爱你。么么哒!”共12个字符,m=12,此时,12个文字以相同尺寸显示于即时通信界面;在步骤(2)中,触摸触划图钮2,在给定的曲线框内,触划输入曲线,移动终端机会将整个曲线的像素点(x,y)轨迹记录下来。假定曲线长度为480个像素,平均每40个像素的曲线对应于一个文字。在步骤(3)中,读取对应于同一文字的40个像素坐标,并取所有40个像素点的y坐标值的平均值,保存该平均值作为该区间的高度值,即计算文字的尺寸的对应值;在步骤(4)中,根据12个区间的高度值计算文本信息中的每个文字的尺寸信息。在步骤(4)中根据曲线中不同区间的高度值计算每个文字的尺寸信息的详细过程与第一实施例中从音量计算字体尺寸信息的过程类似。
以图8所示的文字曲线为例,(41)读取构成文字曲线的q种字体尺寸,不同字体尺寸对应于不同的y平均值;在该过程中,还可以包括设置最小字体尺寸和设置两种相邻字体相差字号的步骤;假设文字曲线是由q种字体尺寸组成,每个字体尺寸相差x号,最小字体尺寸可以随机取值,例如可以直接使用用户在即时通信界面设定的默认字号,或者由用户重新设置;则可获得q种字体尺寸;(42)使步骤(3)中计算出的最小y平均值为Ymin,最大y平均值为Ymax;(43)使用下式计算出q种字体尺寸分别对应的y值Yn:Yn=Ymin+(n-1)*d,其中,d=(Ymax–Ymin)/(q-1),n=1……q;(44)根据每个文字对应的y平均值计算相应的字体尺寸:当对应y平均值介于Yn和Yn-1时,如果y平均值≥(Yn-Yn-1)/2时,该文字使用Yn相对应的字体尺寸;如果y平均值<(Yn-Yn-1)/2时,该文字使用Yn-1相对应的字体尺寸。
上面对本发明提供的文字曲线的两种生成方法进行了介绍,通过语音输入或触摸屏绘制曲线输入,可以一次性形成由不同字体尺寸的文字形成的文本信息,其中,使用较大的字体显示较为重要、用户进行强调的内容,用户编辑体验好,输入效率高。上述文字曲线生成方法,相对于现有即时通信系统中广泛使用的,只能统一调整即时通信界面中的显示字体,并且单次只能输入具有同一字号的文本信息的输入方式,具有更丰富的表现形式,可以更准确地表达出用户的真实情感和意愿。
此外,当在客户端界面形成文字曲线后,可以将组成文字曲线的文本信息和尺寸信息关联发送至服务器,并通过服务器发送至其他客户端,实现不同用户之间的交互过程。
上面对本发明所提供的文字曲线生成方法进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质精神的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。

Claims (9)

1.一种文字曲线生成方法,所述文字曲线是指由具有不同尺寸大小的文字组成的文本,其特征在于包括如下步骤:
(1)输入文本信息,所述文本信息包括m个字,所述m为正整数;
(2)输入语音生成音频文件,语音中的内容与文本信息的内容对应;
(3)将音频文件划分为m个等长的时间段,计算每个时间段的对应音量;
(4)根据音频文件中不同时间段的音量计算出与文本信息中每个文字对应的尺寸信息;
(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。
2.如权利要求1所述的文字曲线生成方法,其特征在于:
所述步骤(3)中每个时间段对应多个采样值,将所有采样值转化为PCM码,比较这组PCM码的绝对值,找出其最大值并保存,作为该时间段的音量。
3.如权利要求2所述的文字曲线生成方法,其特征在于在所述步骤(4)中,根据m个时间段的音量计算文本信息中的文字的尺寸信息,包括如下步骤:
(41)读取构成文字曲线的q种字体尺寸,所述q为正整数;
(42)使最小PCM值为Pmin,最大PCM值为Pmax
(43)使用下式计算出q种字体尺寸分别对应的PCM值Pn
Pn=Pmin+(n-1)*d,
其中,d=(Pmax-Pmin)/(q-1),n=1……q;
(44)根据与每个文字对应的时间段的PCM值计算字体尺寸:
当对应PCM值介于Pn和Pn-1时,如果PCM值≥(Pn-Pn-1)/2时,该文字使用Pn相对应的字体尺寸;如果PCM值<(Pn-Pn-1)/2时,该文字使用Pn-1相对应的字体尺寸。
4.如权利要求3所述的文字曲线生成方法,其特征在于:
在所述步骤(41)中,包括设置文字曲线的最小字体尺寸、以及设置两种相邻尺寸的相差字号的步骤。
5.如权利要求1所述的文字曲线生成方法,其特征在于:
在所述步骤(2)中,用户通过触摸录音图钮,录制简短语音生成音频文件。
6.如权利要求1所述的文字曲线生成方法,其特征在于:
在所述步骤(2)中,音频文件的存储类型是AMR格式文件或者G.711格式文件。
7.一种文字曲线生成方法,所述文字曲线是指由具有不同尺寸大小的文字组成的文本,其特征在于包括如下步骤:
(1)输入文本信息,所述文本信息包括m个字,所述m为正整数;
(2)通过触划触摸屏绘制曲线输入,并记录整个曲线的像素点(x,y)轨迹;
(3)将曲线划分为m个等长的区间,计算每个区间中所有像素点的y坐标值的平均值,作为该区间的高度值;
(4)根据不同区间的高度值,计算出与文本信息中每个文字对应的尺寸信息;
(5)根据步骤(4)得到的尺寸信息改变文本信息中m个文字的显示尺寸,形成文字曲线。
8.如权利要求7所述的文字曲线生成方法,其特征在于在所述步骤(4)中,根据m个区间的高度值计算文本信息中的文字的尺寸信息,包括如下步骤:
(41)读取构成文字曲线的q种字体尺寸,所述q为正整数;
(42)使最小y平均值为Ymin,最大y平均值为Ymax
(43)使用下式计算出q种字体尺寸分别对应的y值Yn
Yn=Ymin+(n-1)*d,
其中,d=(Ymax-Ymin)/(q-1),n=1……q;
(44)根据与每个文字对应的区间的y平均值计算字体尺寸:
当对应y平均值介于Yn和Yn-1时,如果y平均值≥(Yn-Yn-1)/2时,该文字使用Yn相对应的字体尺寸;如果y平均值<(Yn-Yn-1)/2时,该文字使用Yn-1相对应的字体尺寸。
9.如权利要求8所述的文字曲线生成方法,其特征在于:
在所述步骤(41)中,包括设置文字曲线的最小字体尺寸、以及设置两种相邻尺寸的相差字号的步骤。
CN201510282624.1A 2015-05-28 2015-05-28 一种文字曲线生成方法 Active CN104834750B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510282624.1A CN104834750B (zh) 2015-05-28 2015-05-28 一种文字曲线生成方法
PCT/CN2016/083910 WO2016188493A1 (zh) 2015-05-28 2016-05-30 文字曲线生成方法及其装置
US15/576,876 US10311133B2 (en) 2015-05-28 2016-05-30 Character curve generating method and device thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510282624.1A CN104834750B (zh) 2015-05-28 2015-05-28 一种文字曲线生成方法

Publications (2)

Publication Number Publication Date
CN104834750A CN104834750A (zh) 2015-08-12
CN104834750B true CN104834750B (zh) 2018-03-02

Family

ID=53812636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510282624.1A Active CN104834750B (zh) 2015-05-28 2015-05-28 一种文字曲线生成方法

Country Status (3)

Country Link
US (1) US10311133B2 (zh)
CN (1) CN104834750B (zh)
WO (1) WO2016188493A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834750B (zh) 2015-05-28 2018-03-02 瞬联软件科技(北京)有限公司 一种文字曲线生成方法
CN104850335B (zh) * 2015-05-28 2018-01-23 瞬联软件科技(北京)有限公司 基于语音输入的表情曲线生成方法
CN109462768A (zh) * 2018-10-25 2019-03-12 维沃移动通信有限公司 一种字幕显示方法及终端设备
CN113221510A (zh) * 2021-04-20 2021-08-06 北京邮电大学 一种基于触控和声控的异形文字排版输入装置和方法
CN112989779B (zh) * 2021-05-20 2021-08-10 北京世纪好未来教育科技有限公司 一种表格生成方法、电子设备及其存储介质
CN113345439B (zh) * 2021-05-28 2024-04-30 北京达佳互联信息技术有限公司 字幕生成方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1892817A (zh) * 2005-06-28 2007-01-10 阿瓦雅技术公司 语音识别辅助的合成字符的自动完成
CN102609969A (zh) * 2012-02-17 2012-07-25 上海交通大学 基于汉语文本驱动的人脸语音同步动画的处理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69836393T2 (de) * 1997-09-30 2007-09-06 Yamaha Corp., Hamamatsu Verfahren, Vorrichtung und maschineslesbares Speichermedium zur Klangsynthesierung
US6785649B1 (en) * 1999-12-29 2004-08-31 International Business Machines Corporation Text formatting from speech
US7640293B2 (en) * 2002-07-17 2009-12-29 Research In Motion Limited Method, system and apparatus for messaging between wireless mobile terminals and networked computers
EP1666967B1 (en) * 2004-12-03 2013-05-08 Magix AG System and method of creating an emotional controlled soundtrack
US8612384B2 (en) * 2008-04-02 2013-12-17 Michael Andrew Hall Methods and apparatus for searching and accessing multimedia content
US8896633B2 (en) * 2010-08-17 2014-11-25 Apple Inc. Adjusting a display size of text
CN104834750B (zh) 2015-05-28 2018-03-02 瞬联软件科技(北京)有限公司 一种文字曲线生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1892817A (zh) * 2005-06-28 2007-01-10 阿瓦雅技术公司 语音识别辅助的合成字符的自动完成
CN102609969A (zh) * 2012-02-17 2012-07-25 上海交通大学 基于汉语文本驱动的人脸语音同步动画的处理方法

Also Published As

Publication number Publication date
US10311133B2 (en) 2019-06-04
WO2016188493A1 (zh) 2016-12-01
CN104834750A (zh) 2015-08-12
US20180165256A1 (en) 2018-06-14

Similar Documents

Publication Publication Date Title
CN104834750B (zh) 一种文字曲线生成方法
JP5097198B2 (ja) テキスト文書に画像アーティファクトを挿入する装置および方法
CN104850335B (zh) 基于语音输入的表情曲线生成方法
US9361282B2 (en) Method and device for user interface
CN104424165B (zh) 一种文本文档乱码检测方法及系统
KR20040071720A (ko) 텍스트 메시지내에 감정을 표현하는 방법
CN104240703A (zh) 语音信息处理方法和装置
JP2004145832A5 (zh)
CN106486126A (zh) 语音识别纠错方法及装置
CN113748425A (zh) 针对视频数据中表达的内容的自动完成
US11763103B2 (en) Video translation method and apparatus, storage medium, and electronic device
KR20150000566A (ko) 텍스트 입력에 따른 실시간 이미지 출력 장치 및 방법
US20170084201A1 (en) Braille generator and converter
KR20220034070A (ko) 모델 훈련 및 폰트 라이브러리 구축 방법, 장치, 설비 및 저장 매체
WO2023016391A1 (zh) 多媒体数据的生成方法、装置、可读介质及电子设备
CN102736821A (zh) 基于滑动轨迹确定候选词的方法和装置
CN103546623A (zh) 用于发送语音信息及其文本描述信息的方法、装置与设备
CN111046252B (zh) 一种信息处理的方法、装置、介质、电子设备和系统
EP2120156A3 (en) Character input program, character input device, and character input method
CN104239018A (zh) 一种演示、生成演示脚本的方法及系统
CN102591851B (zh) 一种用于基于键盘按键对目标文本进行编辑的方法与设备
CN111753147A (zh) 相似度处理方法、装置、服务器及存储介质
CN110851564A (zh) 一种语音数据处理方法和相关装置
WO2018124209A1 (ja) デジタルインクの符号化方法、復号化方法
CN104574474A (zh) 一种通过字幕生成动画角色语言口型的匹配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant