tensorflow2.0(2)-自定义Dense层以及训练过程

如题所述

第1个回答 2022-07-30

之前展示了tensorflow2.0的一个初级的实用例子作为开始，对比1.x版本操作还是有好很多的。接下来也将继续从比较基础的层面去了解tf2.0的各种实现
tensorflow2.0在上以keras去搭建网络，这种封装好的基础/高级api在使用上无疑更便捷，但在学习的过程中也不妨自己去实现一些功能，加深理解。
以实现最简单的全连接层和训练过程为例，

简单搭个网络：

我们可以用类去自定义Dense的功能，也是非常简单的

这一样来，就可以直接用自定义的类DenseLayer去替换keras的全连接层

对于实现分类的损失函数而言，也是简单粗暴的，对于标签的格式是one_hot的，用 tf.nn.softmax_cross_entropy_with_logits ，
反之 tf.nn.sparse_softmax_cross_entropy_with_logits ，本文自然用到了后者。

关于tf2.0，貌似 tf.GradientTape() 保留了下来，自定义梯度计算这一部分可以作为一个篇章去讲述，以后也会去探索
所以把单步训练和梯度更新过程写在一起

因为在loss_func的计算里包含了softmax，所以在最后一层不添加激活函数

参考上一篇文章，但也有不一样的地方，其中没用到测试集，只关注训练时loss的变化过程

最终可以看到loss是降得很快的

end.

相似回答

在tensorflow中搭建神经网络,为什么要建很多dense层?有什么作用?_百度...答：dense层的目的，是将前面提取的特征，在dense经过非线性变化，提取这些特征之间的关联，最后映射到输出空间上。理论上，一层dense足够，但这只是理论上，因为你不清楚这一层dense需要多少个节点的,也不知道需要多少次的训练，加更多的dense,能更快的收敛。

大家正在搜

tensorflow2.0教程 tensorflow2.0 tensorflow2中文教程 tensorflow2教程 tensorflow caffe tensorflow中文教程 tensorflow安装whl p106 tensorflow tensorflow2安装