深度学习实践

Index

加速训练的方法

内部方法

  • 网络结构

    • 比如 CNN 与 RNN,前者更适合并行架构

  • 优化算法的改进:动量、自适应学习率

    ./专题-优化算法

  • 减少参数规模

    • 比如使用 GRU 代替 LSTM

  • 参数初始化

    • Batch Normalization

外部方法

深度学习训练加速方法 - CSDN博客

  • GPU 加速

  • 数据并行

  • 模型并行

  • 混合数据并行与模型并行

  • CPU 集群

  • GPU 集群

最后更新于