Применение сверточной нейронной сети для определения начала музыки в потоке аудиоданных
В настоящее время задача по определению границ музыки являются популярной и требующей улучшения. Обнаружение начала музыки в аудио потоке является первым шагом для нескольких задач анализа более высокого уровня, таких как определение ритма, оценка темпа и транскрибирование. В данной статье представлены архитектура и модификации сверточной нейронной сети для определения начала музыки. Обучение сети происходит с помощью ограниченных отрезков мел-спектрограмм. Результаты сравниваются между сверточной нейронной сетью (CNN), простым многослойным персептроном (MLP) и рекуррентной нейронной сетью (RNN) по точности, полноте и F-оценке.