集群是否可以进行predict #599

333caowei · 2016-11-24T08:43:16Z

集群版demo中只有任务提交的例子，单机版的demo提供了predict.sh的demo，但在数据量很大的情况下单机版执行predict.sh会很慢，不知道mpi版本是否可以执行类似demo中的predict.sh的操作呢

backyes · 2016-11-24T09:30:03Z

predict 过程是一个高度可并行的过程，因此你可以将predict封装为一个mpi任务、一个spark任务，甚至一个特殊的hadoop任务，例如

一个mpi封装：

mpirun download.sh # download several data
mpirun predict.sh  #do predict

原理上，就像实现一个多机word count 一样的逻辑。

目前，paddle官方未维护多机predict平台。

333caowei · 2016-11-24T09:37:38Z

@backyes 集群训练时候需要将train文件分割，mpi文件粒度并行，请问predict的执行过程是否需要将test文件也进行分割呢

backyes · 2016-11-24T09:43:51Z

@333caowei
理论上要的。简单理解， predict过程就是一个forward获取output 激活的过程，所以你想要的结果一定是不同样本对应的不同的输出，所以你并行跑的predict的时候，也应该是不同并发任务运行不同的样本数据part，否则就没有意义了。

hphp · 2016-11-24T10:11:52Z

@333caowei hi, caowei~ 我提供一下我的方法哈，正如backyes所说，prediction的过程应该是可高度并行的，所以大数据量时，我直接在hadoop集群上进行prediction，只需要将相应的依赖（包括库和predict及相应conf）上传即可，非常方便~

* inference_en * Review

Develop ipu merge dev

optimize fast_index_map_helpers C++ compile

* Update README_cn.md * Update README_cn.md * Update README.md * Update README_cn.md * Update README_cn.md * Update README_cn.md * Create config_doc.md * Create apps.md * Update README_cn.md

* fix prune doc * fix prune demo batchsize * fix lr (PaddlePaddle#593) * fix lr schedule in prune demo (PaddlePaddle#595) * fix prune demo batchsize * fix lr shcedule in prune demo ; Co-authored-by: wanghaoshuang <[email protected]> * remove softmax from demo/models (PaddlePaddle#596) * fix prune demo batchsize * fix lr shcedule in prune demo ; * remove softmax from demo/models Co-authored-by: wanghaoshuang <[email protected]> * fix prune demo log Co-authored-by: wanghaoshuang <[email protected]>

luotao1 assigned backyes Nov 24, 2016

backyes closed this as completed Nov 24, 2016

zhhsplendid pushed a commit to zhhsplendid/Paddle that referenced this issue Sep 25, 2019

inference_en (PaddlePaddle#599)

75d7772

* inference_en * Review

yaozhixin pushed a commit to graphcore/Paddle-fork that referenced this issue Apr 28, 2022

Merge pull request PaddlePaddle#599 from graphcore/develop-ipu_merge_dev

6ebd884

Develop ipu merge dev

heavengate pushed a commit to heavengate/Paddle that referenced this issue Aug 24, 2022

Merge pull request PaddlePaddle#599 from GuoxiaWang/data_tool_compile

fc54444

optimize fast_index_map_helpers C++ compile

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

集群是否可以进行predict #599

集群是否可以进行predict #599

333caowei commented Nov 24, 2016

backyes commented Nov 24, 2016

333caowei commented Nov 24, 2016

backyes commented Nov 24, 2016

hphp commented Nov 24, 2016

集群是否可以进行predict #599

集群是否可以进行predict #599

Comments

333caowei commented Nov 24, 2016

backyes commented Nov 24, 2016

333caowei commented Nov 24, 2016

backyes commented Nov 24, 2016

hphp commented Nov 24, 2016