基于一维卷积Conv1D实现猫狗叫声语音识别前言一、基于一维卷积实现音频猫狗叫声分类二、数据集介绍

23-07-24 11:52

1248

10588

blog.csdn.net

前言

大家好，我是阿光。

本专栏整理了《PyTorch深度学习项目实战100例》，内包含了各种不同的深度学习项目，包含项目原理以及源码，每一个项目实例都附带有完整的代码+数据集。

正在更新中~ ✨

? 我的项目环境：

平台：Windows10
语言环境：python3.7
编译器：PyCharm
PyTorch版本：1.8.1

? 项目专栏：【PyTorch深度学习项目实战100例】

一、基于一维卷积实现音频猫狗叫声分类

本文我们将介绍如何使用Pytorch训练一个网络模型用来进行语音识别，由于语音是属于时序信息，所以本项目主要使用一维卷积来进行建模，本任务数据集使用的是猫和狗叫声的音频数据，我们将建立一个识别猫和狗叫声的音频分类模型。

在这里插入图片描述

二、数据集介绍

数据集包含很多“wav”文件，用于猫类和狗类：

在这里插入图片描述

cat有164个WAV文件，对应1323秒的音频
狗有

注：本文转载自blog.csdn.net的海洋.之心的文章"https://weibaohang.blog.csdn.net/article/details/127405308"。版权归原作者所有，此博客不拥有其著作权，亦不承担相应法律责任。如有侵权，请联系我们删除。

复制链接

发表评论

注册

评论记录：

未查询到任何数据！