小叶の博客
HW4-Self-Attention HW4-Self-Attention
作业描述本作业的目标是利用transformer中self-attention部分做一个多元分类,即从给定的语音中预测说话者的类别。利用的数据是从Voxceleb1中挑选的一部分,数据如下: 训练数据:69438条处理过的带标签音频特征
HW6-GAN HW6-GAN
作业描述这部分我将用GAN实现一个动画人脸的生成,利用的模型是DCGAN,它在原始GAN模型的基础上,将生成器和判别器的网络结构换成了当时已经十分成熟的卷积神经网络结构,并对卷积神经网络结构进行一定的调整,克服了原始GAN训练不稳定和梯度消
HW2-Classifier HW2-Classifier
作业描述本作业处理的是一个phoneme分类,是一个多元分类问题。phoneme是语言的一种语音的一种语音单位,可以用来区分一个词和另一个词,如下面黑体部分。 bat / pat , bad / bed 作业使用的数据集是TIMIT A
HW3-CNN HW3-CNN
作业介绍作业的目标是使用卷积神经网络(我用的是VGG)解决图像分类问题,并用数据扩充的技术提高模型的性能。 使用的数据集是一个关于食物分类的dataset:food-11。如名字所示,食物的种类有11种,分别为面包、乳制品、甜点、鸡蛋、 油
HW1-Regression HW1-Regression
目标:用深度神经网络(DNN)解决一个回归问题,了解训练基础DNN的技巧 任务描述: 给定美国特定州过去三天有关COVID-19的调查,然后预测第3天新检测阳性病例的百分比 导入一些包# PyTorch import torch imp