Liufeng's Blogs

基于统计方法确定F0提取上下限参数

在语音任务中，f0(pitch) 提取是必不可少的重要一环。常见的 pitch 提取算法，包括 praat/Sptk 等praat/pyworld/sptk f0提取算法的python脚本。在提取过程中，重要的两个参数是 f0_min 和 f0_max，上下限设置错误会导致基频提取发生 “倍频” or “半频” 错误。

2021/08/02 语音信号处理
深度学习模型方法论相关经验总结

接触深度学习四年来，大概工作中有六成以上的时间都在写模型/调模型/分析模型为什么好或不好。这个过程中总结来一些经验，特此记录。

2021/07/17 深度学习与机器学习
中文不同发音单元对语音任务的影响

最近发现 ASR/VC/TTS 三个不同的项目中都会有所涉及中文不同发音单元所造成的影响，这篇笔记总结一下相关经验。

2021/07/08 语音合成
代码测试

代码测试

2021/06/30 其他
Pitch Tuner

基于 Psola 采样点级别的 Pitch 调整算法。

2021/06/30 语音信号处理
Kaldi笔记-Tdnnf模型

最近在某个任务上，尝试对seq进行帧级别的分类，回去仔细研究了一下kaldi中的tdnnf结构，感觉模型设计非常精巧，对后续学习和帮助很有帮助。

2021/06/01 语音识别
基于cpu的Wavernn网络模型的推理优化

神经网络模型在云端的优化技巧。

2021/05/05 c++与高性能计算
Energy Based Vad 原理与应用

update(20210810): 补充了自适应vad参数的相关内容

2021/04/19 语音信号处理
start-my-blog

快速搭建博客，与写作规范。

2021/04/01 其他