神经网络与深度学习
有监督学习是利用一组已知输入x和输出y的数据来学习模型的参数,使得模型预测的输出标记和真实标记尽可能的一致。有监督学习根据输出类型又可以分为回归和分类两类。回归(Regression) 如果输出y是连续值(实数或连续整数),f(x)的输出也是连续值。这种类型的问题就是回归问题。对于所有已知或未知的(x;y),使得f(x; )和y尽可能地一致。损失函数通常定义为平方误差。分类(Classication) 如果输出y是离散的类别标记(符号),就是分类问题。损失函数有一般用0-1损失函数或负对数似然函数等。在分类问题中,通过学习得到的决策函数f(x; )也叫分类器。
无监督学习(Unsupervised Learning) 无监督学习是用来学习的数据不包含输出目标,需要学习算法自动学习到一些有价值的信息。一个典型的无监督学习问题就是㚐类(Clustering)。
增强学习(Reinforcement Learning) 增强学习也叫强化学习,强调如何基于环境做出一系列的动作,以取得最大化的累积收益。每做出一个动作,并不一定立刻得到收益。增强学习和有监督学习的不同在于增强学习不需要显式地以输入/输出对的方式给出训练样本,是一种在线的学习机制。
在梯度下降训练的过程中,由于过拟合的原因,在训练样本上收敛的参数,并不一定在测试集上最优。因此,我们使用一个验证集(Validation Dataset)(也叫开发集(Development Dataset))来测试每一次迭代的参数在验证集上是否最优。如果在验证集上的错误率不再下降,就停止迭代。这种策略叫Early-Stop。如果没有验证集,可以在训练集上进行交叉验证。
全部资料51hei下载地址:
《神经网络与深度学习》邱锡鹏讲义.pdf
(687.64 KB, 下载次数: 40)
《神经网络与深度学习》邱锡鹏PPT.pdf
(1.17 MB, 下载次数: 34)
|