InfiniTensor/test/kernels/bang/test_bang_mseloss.cc

#include "bang/bang_runtime.h"
#include "core/graph.h"
#include "core/kernel.h"
#include "core/runtime.h"
#include "operators/element_wise.h"

#include "test.h"

namespace infini {

template <class T>
void testMSELoss(const std::function<void(void *, size_t, DataType)> &generator,
                 const Shape &shape) {
    // Runtime
    Runtime cpuRuntime = NativeCpuRuntimeObj::getInstance();
    auto bangRuntime = make_ref<BangRuntimeObj>();

    // Build input data on CPU
    Tensor inputCpu1 =
        make_ref<TensorObj>(shape, DataType::Float32, cpuRuntime);
    inputCpu1->dataMalloc();
    inputCpu1->setData(generator);
    Tensor inputCpu2 =
        make_ref<TensorObj>(shape, DataType::Float32, cpuRuntime);
    inputCpu2->dataMalloc();
    inputCpu2->setData(generator);

    // GPU
    Graph bangGraph = make_ref<GraphObj>(bangRuntime);
    auto inputGpu1 = bangGraph->cloneTensor(inputCpu1);
    auto inputGpu2 = bangGraph->cloneTensor(inputCpu2);
    auto gpuOp1 =
        bangGraph->addOp<T>(inputGpu1, inputGpu2, MSELossObj::None, nullptr);
    auto gpuOp2 =
        bangGraph->addOp<T>(inputGpu1, inputGpu2, MSELossObj::Sum, nullptr);
    auto gpuOp3 =
        bangGraph->addOp<T>(inputGpu1, inputGpu2, MSELossObj::Mean, nullptr);
    bangGraph->dataMalloc();
    bangRuntime->run(bangGraph);
    auto outputGpu1 = gpuOp1->getOutput();
    auto outputGpu2 = gpuOp2->getOutput();
    auto outputGpu3 = gpuOp3->getOutput();
    auto outputGpu2Cpu1 = outputGpu1->clone(cpuRuntime);
    auto outputGpu2Cpu2 = outputGpu2->clone(cpuRuntime);
    auto outputGpu2Cpu3 = outputGpu3->clone(cpuRuntime);
    // Check
    outputGpu2Cpu1->printData();
    outputGpu2Cpu2->printData();
    outputGpu2Cpu3->printData();
    EXPECT_TRUE(1);
}

TEST(cnnl_MSELoss, run) {
    testMSELoss<MSELossObj>(IncrementalGenerator(), Shape{1, 2, 2, 3});
}

} // namespace infini
Dev for 202303ddl (#66) * add activation operatiopn relu, tanh, sigmoid on mlu * commit for format * add activation backward operation * add test for activation_backward * add test * add convbpfilter * fix * add transpsoe code and test * add trigon function operation on mlu: sin,cos,tan,asin,sinh,asinh * add copy operation on mlu * add ceil operation and floor operation * add operation clip * add operation cnnl div, test and test for divdemo bangc kernel * add divnonan operation and test * add erf operation * add exp operation * add operation fill * add log operation * add log1p operation * add l2loss operation * add maximum and minimum operation * add mseloss operation * add negTensor operation * add power operation * add reciprocal operation * add sqrt and rsqrt operation * add transform operation * add addn operation * add muln operation * cherrry pick some operation * add floordiv operation and floordivtrunc operation * add floormod operation * add cumsum operation * add det operation * add pad operation * format * add concat operation * format * add split operation * fix concat and split operation * add round operation * add pooling operation * add square operation * add squaredDifference operation * code format fix * add flip operation * code format fix * add hardtanh operation * add logic operation * add addcdiv and addcmul operation * add arange operation * add bitcompute operation * add net test * fmt Signed-off-by: YdrMaster <ydrml@hotmail.com> * style: rename Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: 用 NativeCpuRuntime 替换 CpuRuntime Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix code * fix code * fix code by review suggestion * remove operation which is not the onnx operation * fix format * clang format * refactor: tensor 的 print 加一层模板的 dataToString Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: onnx 导出 Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 增加计算图优化接口 Signed-off-by: YdrMaster <ydrml@hotmail.com> * add clip operation * feat: 支持导入 clip Signed-off-by: YdrMaster <ydrml@hotmail.com> * test: 导入导出测试加入 ci Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix batch norm * feat: 增加 Shape 算子 Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 支持导入 unsqueeze Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: 修正 clip 接口 feat: 支持导入 transpose Signed-off-by: YdrMaster <ydrml@hotmail.com> * add broadcast operation * fix elementwise-broadcast * fix elementwise broadcast * add broadcast for gpu elementsie * feat: pad 支持 axes 负数 feat: 不支持的 padding 导出为独立的 pad 算子 feat: 支持导入 onnxsim 过的 inception Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: 修正池化的测试 Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 导出 pads，支持 inception 导入导出，已加入 ci Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 支持 densenet 导入导出，并加入 ci Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 导入 squeeze Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix softmax * feat: 导出 clip 和 transpose Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 支持 Conv 的 bias Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: bias of conv Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: bias of conv Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 导入 split Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 导出 split Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: conv Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: conv group Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: matmul 的 bias 没有放在输入里，修正 Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix exmaple * fix: 改正 reduce_mean 导出 Signed-off-by: YdrMaster <ydrml@hotmail.com> * refactor: 修改 slice 实现与 onnx 一致 Signed-off-by: YdrMaster <ydrml@hotmail.com> * style: 不导出两个 runtime 函数 Signed-off-by: YdrMaster <ydrml@hotmail.com> * doc: 中文使用指南 Signed-off-by: YdrMaster <ydrml@hotmail.com> * doc: 补全指南 Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: 修复导入数据的问题 Signed-off-by: YdrMaster <ydrml@hotmail.com> * fmt Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 添加 Dropout 基本结构，但不支持两个输出是不同的类型 Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 重新导出优化接口 feat: dropout 导入 Signed-off-by: YdrMaster <ydrml@hotmail.com> * build: BANG 选项加入 Makefile Signed-off-by: YdrMaster <ydrml@hotmail.com> * fxi code, change of test/kernels/bang/test* is use NativeCpuRuntime. chaneg of include/bang/bang_runtime is for the cntoolkit upgrade. * feat: 导出 bang runtime Signed-off-by: YdrMaster <ydrml@hotmail.com> * add USE_BANG=1 * fix matmul * fix reshape * fix * fix activation * fix transpose * format * format * update Makefile Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 支持导入导出 ConvTranspose Signed-off-by: YdrMaster <ydrml@hotmail.com> * add prelu on mlu * fix: ConvTranspose Signed-off-by: YdrMaster <ydrml@hotmail.com> * feat: 支持导入导出 PRelu Signed-off-by: YdrMaster <ydrml@hotmail.com> * add convtrans on mlu * fmt Signed-off-by: YdrMaster <ydrml@hotmail.com> * docs: 更新 README_CN.md Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix code by review suggestions * style Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix: Softmax 的 axis 可以用默认值？感觉是 onnx 不标准 Signed-off-by: YdrMaster <ydrml@hotmail.com> * fix cuda & intelcpu bugs after merging --------- Signed-off-by: YdrMaster <ydrml@hotmail.com> Co-authored-by: wanghailu <wanghailu0717@163.com> Co-authored-by: wanghailu <wanghailu@qiyuanlab.com> Co-authored-by: whjthu <haojie0429@gmail.com> 2023-04-18 15:10:33 +08:00			`#include "bang/bang_runtime.h"`
			`#include "core/graph.h"`
			`#include "core/kernel.h"`
			`#include "core/runtime.h"`
			`#include "operators/element_wise.h"`

			`#include "test.h"`

			`namespace infini {`

			`template <class T>`
			`void testMSELoss(const std::function<void(void *, size_t, DataType)> &generator,`
			`const Shape &shape) {`
			`// Runtime`
			`Runtime cpuRuntime = NativeCpuRuntimeObj::getInstance();`
			`auto bangRuntime = make_ref<BangRuntimeObj>();`

			`// Build input data on CPU`
			`Tensor inputCpu1 =`
			`make_ref<TensorObj>(shape, DataType::Float32, cpuRuntime);`
			`inputCpu1->dataMalloc();`
			`inputCpu1->setData(generator);`
			`Tensor inputCpu2 =`
			`make_ref<TensorObj>(shape, DataType::Float32, cpuRuntime);`
			`inputCpu2->dataMalloc();`
			`inputCpu2->setData(generator);`

			`// GPU`
			`Graph bangGraph = make_ref<GraphObj>(bangRuntime);`
			`auto inputGpu1 = bangGraph->cloneTensor(inputCpu1);`
			`auto inputGpu2 = bangGraph->cloneTensor(inputCpu2);`
			`auto gpuOp1 =`
			`bangGraph->addOp<T>(inputGpu1, inputGpu2, MSELossObj::None, nullptr);`
			`auto gpuOp2 =`
			`bangGraph->addOp<T>(inputGpu1, inputGpu2, MSELossObj::Sum, nullptr);`
			`auto gpuOp3 =`
			`bangGraph->addOp<T>(inputGpu1, inputGpu2, MSELossObj::Mean, nullptr);`
			`bangGraph->dataMalloc();`
			`bangRuntime->run(bangGraph);`
			`auto outputGpu1 = gpuOp1->getOutput();`
			`auto outputGpu2 = gpuOp2->getOutput();`
			`auto outputGpu3 = gpuOp3->getOutput();`
			`auto outputGpu2Cpu1 = outputGpu1->clone(cpuRuntime);`
			`auto outputGpu2Cpu2 = outputGpu2->clone(cpuRuntime);`
			`auto outputGpu2Cpu3 = outputGpu3->clone(cpuRuntime);`
			`// Check`
			`outputGpu2Cpu1->printData();`
			`outputGpu2Cpu2->printData();`
			`outputGpu2Cpu3->printData();`
			`EXPECT_TRUE(1);`
			`}`

			`TEST(cnnl_MSELoss, run) {`
			`testMSELoss<MSELossObj>(IncrementalGenerator(), Shape{1, 2, 2, 3});`
			`}`

			`} // namespace infini`