循环神经网络

概述

image.png

特点:不同于在样本上做多个独立预测,而是假设样本之间存在关联,进而在样本序列上做预测

采用链式法则表示一个观测序列的联合概率:
image.png
考虑一个观测和所有历史观测之间的依赖关系复杂度随着观测个数指数级增长

马尔可夫模型:
image.png
马尔可夫模型假设当前观察只和较近的观测有关

考虑两个不同的序列(如输入和输出序列),可以使用隐马尔可夫模型:
image.png

联合分布为:
image.png

最可能的隐状态为:
image.png

循环神经网络(Recurrent neural networks,RNN):

  • HMM是一个生成模型,RNN是一个判别模型

循环神经网络(RNN)

image.png
RNN可以被认为是同一网络的多个副本,每个副本都将消息传递给后者
image.png
可以保留序列前面的特征,但无法建立与序列后面的联系

双向RNN(BRNN)除了前向建模,还添加了一层后向建模
image.png

形式化表示

在每个时间步应用递归公式:
image.png

T个时间步的递归:
image.png

随时间反向传播(BPTT)

image.png

image.png

image.png
image.png
用链式法则:
image.png
一直传播到t=0
image.png

梯度弥散和梯度爆炸

长短时记忆网络(LSTM)

image.png

遗忘门

image.png

输入门

image.png

单元状态更新

image.png

输出门

image.png


循环神经网络
http://example.com/2024/11/27/Notes/课程/大三(上)/神经网络与深度学习/循环神经网络/
许可协议