Преобразование голоса с использованием сглаженной GMM и адаптации к MAP

Опубликовано в выпуске: 4/2018 (22) , 31.12.2018
В большинстве современных системах преобразования голоса качество конвертируемой речи по-прежнему неудовлетворительно. В данной статье для улучшения качества преобразованной речи будет использоваться структура анализа STRAIGHT. Для преобразования спектра используется сглаживание адаптации GMM и MAP, чтобы избежать чрезмерной плавности в традиционном методе GMM. Поскольку кадры обрабатываются независимо, функция преобразования на основе GMM может генерировать прерывистые функции. Поэтому на этапе преобразования применяется фильтр нижних частот во временной области. Результаты показывают, что качество речи, с использованием предложенного метода, значительно лучше, чем традиционный метод GMM.

Новости

Полезные ресурсы