forked from PulseFocusPlatform/PulseFocusPlatform
2.1 KiB
2.1 KiB
自定义OP的编译过程
注意: 编译自定义OP使用的gcc版本须与Paddle编译使用gcc版本一致,Paddle develop每日版本目前采用gcc 4.8.2版本编译,若使用每日版本,请使用gcc 4.8.2版本编译自定义OP,否则可能出现兼容性问题。
代码结构
- src: 扩展OP C++/CUDA 源码
- cornerpool_lib.py: Python API封装
- tests: 各OP单测程序
编译自定义OP
自定义op需要将实现的C++、CUDA代码编译成动态库,src/mask.sh
中通过g++/nvcc编译,当然您也可以写Makefile或者CMake。
编译需要include PaddlePaddle的相关头文件,链接PaddlePaddle的lib库。 头文件和lib库可通过下面命令获取到:
# python
>>> import paddle
>>> print(paddle.sysconfig.get_include())
/paddle/pyenv/local/lib/python2.7/site-packages/paddle/include
>>> print(paddle.sysconfig.get_lib())
/paddle/pyenv/local/lib/python2.7/site-packages/paddle/libs
我们提供动态库编译脚本如下:
cd src
sh make.sh
最终编译会产出cornerpool_lib.so
说明: 若使用源码编译安装PaddlePaddle的方式,编译过程中cmake
未设置WITH_MKLDNN
的方式,
编译自定义OP时会报错找不到mkldnn.h
等文件,可在make.sh
中删除编译命令中的-DPADDLE_WITH_MKLDNN
选项。
设置环境变量
需要将Paddle的核心库设置到LD_LIBRARY_PATH
里, 先运行下面程序获取路径:
import paddle
print(paddle.sysconfig.get_lib())
可通过如下方式添加动态库路径:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:`python -c 'import paddle; print(paddle.sysconfig.get_lib())'`
执行单测
执行下列单测,确保自定义算子可在网络中正确使用:
# 回到 ext_op 目录,运行单测
cd ..
python test/test_corner_pool.py
单测运行成功会输出提示信息,如下所示:
.
----------------------------------------------------------------------
Ran 4 test in 2.858s
OK
更多关于如何在框架外部自定义 C++ OP,可阅读官网说明文档