十个以下特征便可生成一个语音

一个话音由不同频率波组成,更主要是频率改变的状态所表现的(称其为特征)组成,并且不一定是连续的但是有规律的。反过来生成一个语音,只要有规律地出现类正弦波数据,并规律改变波状态,不同规律则会是不同的声音,大多数的人讲话的语音的这个变化是有一定范围的,这就是几个特征便可以生成一个语音,端到端地学习征,不须要大数据超复杂算法,只对每一个语音去提取其中变化的规则的特征,与之对应生成(或者说还原)规律变化的波形数据。语音(特征)与字对应的识别,正在研究。

本人学历低,只能用图说话。

黑色是录取得(粤语‘饼’字)语音数据,红色是去丢高频数。下图的下部分是基于上图数据获得特征值直接输生成,

生成音时长是可调的与原音时长是不同。下图的上部数据是基于获得的特征数据,调整过编入去生成,播放出来的

郊果,原音与两个生成音大至相同。

上面第三个生成的语声与前两个相比,象是上了年纪有点宏厚语声。

若想知道效果是什么程度。我有一个App在百度网盘上,是出于好奇将字句编成说唱声来的app.若好奇可下载体验。

声明:本App是我边研究,边更改重编测试软件,或有漏洞故障,只是想说明用几个特征可生成一个语音,在App里

面有大部分汉字对应的普通话音和粤语音的特征记录,同一音的特征会有多个同音汉字,说话音的时长可编长短,说

话人可选年少或年长些的,是男是女暂时还在研究。到这下载https://pan.baidu.com/s/1ZT-L-K6zE0SI12MGcD-LHA

提取码:meee

啰哩啰唆只想说明的是,语声主成,并非要由大数据复杂的算法才学习得到,不同语种的单个音与几个特征对应,几个单音又组成字词,它不须要每一语种都要大量数据学习才得出参数,并生成语音也是大概率下单调声,或者清析些,但决少灵活的张池缓急,长短说唱的要求。

下图是由原数据(黑色)提取主要频率在其本位置上编写半波数据红色部分,将其播放,郊果与原音大至相同(即使只用大

于0的数据下图2),只是音质有相差,

————————————————
版权声明:本文为CSDN博主「lu6200」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lu6200/article/details/106305578

来源:普通网友

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年6月20日
下一篇 2020年6月20日

相关推荐