InfiniTensor/test/kernels/kunlun/test_kunlun_split.cc

#include "core/graph.h"
#include "core/kernel.h"
#include "core/runtime.h"
#include "kunlun/kunlun_runtime.h"
#include "operators/split.h"

#include "test.h"

namespace infini {

template <class T>
void testSplit(const std::function<void(void *, size_t, DataType)> &generator,
               const Shape &shape) {
    // Runtime
    Runtime cpuRuntime = NativeCpuRuntimeObj::getInstance();
    auto xpuRuntime = make_ref<KUNLUNRuntimeObj>();

    // Build input data on CPU
    Tensor inputCpu1 =
        make_ref<TensorObj>(shape, DataType::Float32, cpuRuntime);
    inputCpu1->dataMalloc();
    inputCpu1->setData(generator);
    // GPU
    Graph xpuGraph = make_ref<GraphObj>(xpuRuntime);
    auto inputGpu1 = xpuGraph->cloneTensor(inputCpu1);
    auto gpuOp = xpuGraph->addOp<T>(inputGpu1, std::nullopt, 3, 3);
    xpuGraph->dataMalloc();
    xpuRuntime->run(xpuGraph);
    auto o0Cpu = gpuOp->getOutput(0)->clone(cpuRuntime);
    auto o1Cpu = gpuOp->getOutput(1)->clone(cpuRuntime);
    auto o2Cpu = gpuOp->getOutput(2)->clone(cpuRuntime);
    // Check
    inputCpu1->print();
    inputCpu1->printData();
    o0Cpu->print();
    o0Cpu->printData();
    o1Cpu->print();
    o1Cpu->printData();
    o2Cpu->print();
    o2Cpu->printData();
    EXPECT_TRUE(1);
}

TEST(xpu_Split, run) {
    testSplit<SplitObj>(IncrementalGenerator(), Shape{1, 2, 2, 3});
}

} // namespace infini