Update README_DISTRIBUTED.md
This commit is contained in:
parent
ca4b5a9067
commit
f0d3e87e16
|
@ -114,6 +114,11 @@ for i in {1..3};do
|
||||||
done
|
done
|
||||||
```
|
```
|
||||||
|
|
||||||
|
## dockers上的多机提交任务
|
||||||
|
dockers 容器上的多机任务和在主机上是相同的,只需要再其基础上满足两个要求
|
||||||
|
- 在每个机器上拉取同样的docker和激活同样的训练环境,在docker共享的路径、数据、代码都一致
|
||||||
|
- 在docker启动的时候保障 --network=host,和主机共享网络通信,只要机器之间能通信,在dockers中也可以通信和训练
|
||||||
|
|
||||||
|
|
||||||
#### TODOs
|
#### TODOs
|
||||||
1 完善dockers、K8s集群的分布式多机任务训练
|
1 完善K8s集群的分布式多机任务训练
|
Loading…
Reference in New Issue