_nvidia_kernel_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include "CudaMgr/CudaMgr.h"

 #include "QueryEngine/CompilationContext.h"


 #ifdef HAVE_CUDA

 #include <cuda.h>

 #else

 #include "../Shared/nocuda.h"

 #endif  // HAVE_CUDA

 #include <string>

 #include <vector>


 struct CubinResult {

   void* cubin;

   std::vector<CUjit_option> option_keys;

   std::vector<void*> option_values;

   CUlinkState link_state;

   size_t cubin_size;


   std::string info_log;

   std::string error_log;

   size_t jit_wall_time_idx;


   CubinResult();

   inline float jitWallTime() const {

     return *reinterpret_cast<float const*>(&option_values[jit_wall_time_idx]);

   }

 };


 void nvidia_jit_warmup();


 CubinResult ptx_to_cubin(const std::string& ptx,

                          const CudaMgr_Namespace::CudaMgr* cuda_mgr);


 class GpuDeviceCompilationContext {

  public:

   GpuDeviceCompilationContext(const void* image,

                               const size_t module_size,

                               const std::string& kernel_name,

                               const int device_id,

                               const void* cuda_mgr,

                               unsigned int num_options,

                               CUjit_option* options,

                               void** option_vals);

   ~GpuDeviceCompilationContext();

   CUfunction kernel() { return kernel_; }

   CUmodule module() { return module_; }

   std::string const& name() const { return kernel_name_; }

   size_t getModuleSize() const { return module_size_; }


  private:

   CUmodule module_;

   size_t module_size_;

   CUfunction kernel_;

   std::string const kernel_name_;

 #ifdef HAVE_CUDA

   const int device_id_;

   const CudaMgr_Namespace::CudaMgr* cuda_mgr_;

 #endif  // HAVE_CUDA

 };


 class GpuCompilationContext : public CompilationContext {

  public:

   GpuCompilationContext() {}


   void addDeviceCode(std::unique_ptr<GpuDeviceCompilationContext>&& device_context) {

     contexts_per_device_.push_back(std::move(device_context));

   }


   std::pair<void*, void*> getNativeCode(const size_t device_id) const {

     CHECK_LT(device_id, contexts_per_device_.size());

     auto device_context = contexts_per_device_[device_id].get();

     return std::make_pair<void*, void*>(device_context->kernel(),

                                         device_context->module());

   }


   std::vector<void*> getNativeFunctionPointers() const {

     std::vector<void*> fn_ptrs;

     for (auto& device_context : contexts_per_device_) {

       CHECK(device_context);

       fn_ptrs.push_back(device_context->kernel());

     }

     return fn_ptrs;

   }


   std::string const& name(size_t const device_id) const {

     CHECK_LT(device_id, contexts_per_device_.size());

     return contexts_per_device_[device_id]->name();

   }


   size_t getMemSize() const {

     return contexts_per_device_.begin()->get()->getModuleSize();

   }


  private:

   std::vector<std::unique_ptr<GpuDeviceCompilationContext>> contexts_per_device_;

 };


 #ifdef HAVE_CUDA

 inline std::string ourCudaErrorStringHelper(CUresult error) {

   char const* c1;

   CUresult res1 = cuGetErrorName(error, &c1);

   char const* c2;

   CUresult res2 = cuGetErrorString(error, &c2);

   std::string text;

   if (res1 == CUDA_SUCCESS) {

     text += c1;

     text += " (";

     text += std::to_string(error);

     text += ")";

   }

   if (res2 == CUDA_SUCCESS) {

     if (!text.empty()) {

       text += ": ";

     }

     text += c2;

   }

   if (text.empty()) {

     text = std::to_string(error);  // never return an empty error string

   }

   return text;

 }


 #define checkCudaErrors(ARG)                                                \

   if (CUresult const err = static_cast<CUresult>(ARG); err != CUDA_SUCCESS) \

   CHECK_EQ(err, CUDA_SUCCESS) << ourCudaErrorStringHelper(err)

 #endif  // HAVE_CUDA

CubinResult::CubinResult
CubinResult()

CubinResult::jitWallTime
float jitWallTime() const
Definition: NvidiaKernel.h:42

CubinResult::info_log
std::string info_log
Definition: NvidiaKernel.h:37

CUjit_option
int CUjit_option
Definition: nocuda.h:26

GpuDeviceCompilationContext::getModuleSize
size_t getModuleSize() const
Definition: NvidiaKernel.h:74

GpuCompilationContext
Definition: NvidiaKernel.h:87

CudaMgr.h

GpuDeviceCompilationContext::name
std::string const & name() const
Definition: NvidiaKernel.h:73

nvidia_jit_warmup
void nvidia_jit_warmup()

GpuCompilationContext::getNativeCode
std::pair< void *, void * > getNativeCode(const size_t device_id) const
Definition: NvidiaKernel.h:95

CubinResult::cubin
void * cubin
Definition: NvidiaKernel.h:31

to_string
std::string to_string(char const *&&v)
Definition: StringTransform.cpp:128

CubinResult::option_keys
std::vector< CUjit_option > option_keys
Definition: NvidiaKernel.h:32

CudaMgr_Namespace::CudaMgr
Definition: CudaMgr.h:84

GpuCompilationContext::name
std::string const & name(size_t const device_id) const
Definition: NvidiaKernel.h:111

GpuDeviceCompilationContext::kernel_name_
std::string const kernel_name_
Definition: NvidiaKernel.h:80

GpuCompilationContext::addDeviceCode
void addDeviceCode(std::unique_ptr< GpuDeviceCompilationContext > &&device_context)
Definition: NvidiaKernel.h:91

GpuCompilationContext::getNativeFunctionPointers
std::vector< void * > getNativeFunctionPointers() const
Definition: NvidiaKernel.h:102

CUfunction
void * CUfunction
Definition: nocuda.h:25

ptx_to_cubin
CubinResult ptx_to_cubin(const std::string &ptx, const CudaMgr_Namespace::CudaMgr *cuda_mgr)

GpuCompilationContext::contexts_per_device_
std::vector< std::unique_ptr< GpuDeviceCompilationContext > > contexts_per_device_
Definition: NvidiaKernel.h:121

CubinResult
Definition: NvidiaKernel.h:30

GpuDeviceCompilationContext::GpuDeviceCompilationContext
GpuDeviceCompilationContext(const void *image, const size_t module_size, const std::string &kernel_name, const int device_id, const void *cuda_mgr, unsigned int num_options, CUjit_option *options, void **option_vals)

CubinResult::option_values
std::vector< void * > option_values
Definition: NvidiaKernel.h:33

CUlinkState
int CUlinkState
Definition: nocuda.h:27

CubinResult::jit_wall_time_idx
size_t jit_wall_time_idx
Definition: NvidiaKernel.h:39

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

CubinResult::cubin_size
size_t cubin_size
Definition: NvidiaKernel.h:35

GpuDeviceCompilationContext::kernel
CUfunction kernel()
Definition: NvidiaKernel.h:71

CUresult
int CUresult
Definition: nocuda.h:21

GpuDeviceCompilationContext::module_size_
size_t module_size_
Definition: NvidiaKernel.h:78

CompilationContext
Definition: CompilationContext.h:25

GpuDeviceCompilationContext::module_
CUmodule module_
Definition: NvidiaKernel.h:77

CompilationContext.h

CHECK
#define CHECK(condition)
Definition: Logger.h:291

CubinResult::link_state
CUlinkState link_state
Definition: NvidiaKernel.h:34

GpuDeviceCompilationContext
Definition: NvidiaKernel.h:60

CubinResult::error_log
std::string error_log
Definition: NvidiaKernel.h:38

GpuCompilationContext::getMemSize
size_t getMemSize() const
Definition: NvidiaKernel.h:116

GpuDeviceCompilationContext::module
CUmodule module()
Definition: NvidiaKernel.h:72

GpuCompilationContext::GpuCompilationContext
GpuCompilationContext()
Definition: NvidiaKernel.h:89

GpuDeviceCompilationContext::kernel_
CUfunction kernel_
Definition: NvidiaKernel.h:79

CUmodule
void * CUmodule
Definition: nocuda.h:24

GpuDeviceCompilationContext::~GpuDeviceCompilationContext
~GpuDeviceCompilationContext()
Definition: NvidiaKernel.cpp:218