十个以下特征便可生成一个语音

一个话音由不同频率波组成，更主要是频率改变的状态所表现的（称其为特征）组成，并且不一定是连续的但是有规律的。反过来生成一个语音，只要有规律地出现类正弦波数据，并规律改变波状态，不同规律则会是不同的声音，大多数的人讲话的语音的这个变化是有一定范围的，这就是几个特征便可以生成一个语音，端到端地学习征，不须要大数据超复杂算法，只对每一个语音去提取其中变化的规则的特征，与之对应生成（或者说还原）规律变化的波形数据。语音（特征）与字对应的识别，正在研究。

本人学历低，只能用图说话。

黑色是录取得（粤语‘饼’字）语音数据，红色是去丢高频数。下图的下部分是基于上图数据获得特征值直接输生成，

生成音时长是可调的与原音时长是不同。下图的上部数据是基于获得的特征数据，调整过编入去生成，播放出来的

郊果，原音与两个生成音大至相同。

上面第三个生成的语声与前两个相比，象是上了年纪有点宏厚语声。

若想知道效果是什么程度。我有一个App在百度网盘上，是出于好奇将字句编成说唱声来的app.若好奇可下载体验。

声明：本App是我边研究，边更改重编测试软件，或有漏洞故障，只是想说明用几个特征可生成一个语音，在App里

面有大部分汉字对应的普通话音和粤语音的特征记录，同一音的特征会有多个同音汉字，说话音的时长可编长短，说

话人可选年少或年长些的，是男是女暂时还在研究。到这下载https://pan.baidu.com/s/1ZT-L-K6zE0SI12MGcD-LHA

提取码：meee

啰哩啰唆只想说明的是，语声主成，并非要由大数据复杂的算法才学习得到，不同语种的单个音与几个特征对应，几个单音又组成字词，它不须要每一语种都要大量数据学习才得出参数，并生成语音也是大概率下单调声，或者清析些，但决少灵活的张池缓急，长短说唱的要求。

下图是由原数据（黑色）提取主要频率在其本位置上编写半波数据红色部分，将其播放，郊果与原音大至相同（即使只用大

于0的数据下图2），只是音质有相差，

————————————————
版权声明：本文为CSDN博主「lu6200」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/lu6200/article/details/106305578

来源：普通网友

声明：本站部分文章及图片转载于互联网，内容版权归原作者所有，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

十个以下特征便可生成一个语音

相关推荐