深度神经网络论文摘要

深度神经网络论文摘要

问:【Tensorflow】深度神经网络原理
  1. 答:函数定义 输入:X (Original Input)
    参数:W、B
    预测值:y
    标签值:Y (Original Input 的实际值)
    意思是:starter_learning_rate 开始的学习率,global_step:到达的步速,每隔:100000 步,学习率减少到原来的94%。
    注意:学利率的设置具有经验性,并且需要重复设置。已达到速度快但又不会略过最优解。
    由单层的神经网络有自己的缺陷,那就是解决的都是一些线性的问题,遇到了非线性的问题就束手无策了,所以就引入了多层的神经网络,去解决线性问题,当然多层的神经网络也能兼顾解决线性问题。下图就是多层神经网络的示意图:
    ConventJS例子:
    那么为什么层数增加而精度提高没有提高呢?
    那就是下一个与精度相关的内容:激活函数。
问:深度学习如何和管理学结合发论文
  1. 答:深度学习如何管理学结合发论文。你这个要求太高了,完完全全是150个字解决不了的,因为你这个深度学习和管理学结合的话,那就相当于是什么,相当于是把两个学科弄在一起啊,开玩笑呢,这150个字哪能说得清楚。
  2. 答:首先,题主的问题是需要哪些方面的基础知识,可以看懂深度学习理论方面论文的数学推导。
    这个问题的答案其实非常宽泛,这里我默认题主已经熟练掌握了数分,高代,概率论,必要的统计知识和贝叶斯方面的理论基础。除此以外,近年来ICLR,ICML上的一些论文中用到的数学知识越来越深,包括但不限于实变,泛函,点集拓扑,微分几何,抽象代数。工科出身的话往往上去一看人家定义一堆希腊字母一堆花写字母就头大了,想要补一些数学基础也不知道该从哪里下手。
    我个人的体会是,做深度学习方向的工科生想要把这些课全部学一遍,既不现实又浪费时间。但是,以下这些内容即使是工科生也建议去学一下:
    实变函数(这个是论文里出现最多的部分。至少要知道什么是可测集,什么是不可测集,什么是可积,进一步的黎曼可积和勒贝格可积;理解下测度的概念)
    泛函,变分法(这门课真的难,我也只学了一部分,但是做机器学习的,变分法Euler-Lagrange方程必须得会吧)
    基础的拓扑概念(现在的论文里大家都喜欢用manifold这个词,只要说到高维数据就manifold,源头在这里。再比如WGAN里面那个完美分类器的证明,其实就是教科书里面度量空间和Hausdorff空间的一个很基础的证明)
    一点基础的度量知识(论文中出现的也非常多,不过感觉知道度量张量,知道指数映射,知道测地线方程就差不多了,更深的一些几何概念很少出现)
    再往下更深的数学,我也没学过。比如今年ICLR那篇球面CNN的文章我也是一脸懵逼一头雾水,不过上面那些基本上足以让你以高屋建瓴的视角看大多数深度方面的理论文章了。
  3. 答:当然这个深度信息化管理可以结合着一些实际情况出发
  4. 答:您好,深度学习其实就是在学习的时候心无旁骛。那么无论你是学习管理学还是其他的专业,都是可以与它结合的。
深度神经网络论文摘要
下载Doc文档

猜你喜欢