ПОДГОТОВКА ДАННЫХ ДЛЯ ОБУЧЕНИЯ МОДЕЛИ РАСПОЗНАВАНИЯ РЕЧИ
Опубликовано: 17.10.2024
Опубликовано в выпуске:
СВ2/2024 (КНИИТМУ) (49)
Рассмотрены методы аугментации аудиоданных, разработана библиотека функций для расширения данных в речевом анализе. Проведена оценка скорости формирования примеров с аугментацией и сформированы датасеты аугментированных данных в соответствии с требованиями прикладной задачи. Предложены методы ускорения работы процедуры аугментации. В работе использованы датасеты Dusha, RESD и датасет шумов разного типа. Всё формируемые примеры гарантировано содержат речь человека и контролируемый уровень зашумления