加速训练的方法
内部方法
外部方法
网络结构
比如 CNN 与 RNN,前者更适合并行架构
优化算法的改进:动量、自适应学习率
./专题-优化算法
减少参数规模
比如使用 GRU 代替 LSTM
参数初始化
Batch Normalization
深度学习训练加速方法 - CSDN博客GPU 加速数据并行模型并行混合数据并行与模型并行CPU 集群GPU 集群
深度学习训练加速方法 - CSDN博客
GPU 加速
数据并行
模型并行
混合数据并行与模型并行
CPU 集群
GPU 集群
最后更新于5年前