_rel_alg_execution_descriptor_8h_source.html

 /*

  * Copyright 2022 HEAVY.AI, Inc.

  *

  * Licensed under the Apache License, Version 2.0 (the "License");

  * you may not use this file except in compliance with the License.

  * You may obtain a copy of the License at

  *

  *     http://www.apache.org/licenses/LICENSE-2.0

  *

  * Unless required by applicable law or agreed to in writing, software

  * distributed under the License is distributed on an "AS IS" BASIS,

  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

  * See the License for the specific language governing permissions and

  * limitations under the License.

  */


 #pragma once


 #include <boost/graph/adjacency_list.hpp>


 #include "QueryEngine/Descriptors/QueryMemoryDescriptor.h"

 #include "QueryEngine/JoinFilterPushDown.h"

 #include "QueryEngine/ResultSet.h"

 #include "Shared/TargetInfo.h"

 #include "Shared/toString.h"


 class ResultSet;


 class ExecutionResult {

  public:

   ExecutionResult();


   ExecutionResult(const std::shared_ptr<ResultSet>& rows,

                   const std::vector<TargetMetaInfo>& targets_meta);


   ExecutionResult(ResultSetPtr&& result, const std::vector<TargetMetaInfo>& targets_meta);


   ExecutionResult(const ExecutionResult& that);


   ExecutionResult(ExecutionResult&& that);


   ExecutionResult(const std::vector<PushedDownFilterInfo>& pushed_down_filter_info,

                   bool filter_push_down_enabled);


   ExecutionResult& operator=(const ExecutionResult& that);


   const std::shared_ptr<ResultSet>& getRows() const { return result_; }


   bool empty() const { return !result_; }


   const ResultSetPtr& getDataPtr() const { return result_; }


   const std::vector<TargetMetaInfo>& getTargetsMeta() const { return targets_meta_; }


   const std::vector<PushedDownFilterInfo>& getPushedDownFilterInfo() const;


   const bool isFilterPushDownEnabled() const { return filter_push_down_enabled_; }


   void setQueueTime(const int64_t queue_time_ms) {

     CHECK(result_);

     result_->setQueueTime(queue_time_ms);

   }


   std::string toString() const {

     return ::typeName(this) + "(" + ::toString(result_) + ", " +

            ::toString(targets_meta_) + ")";

   }


   enum RType { QueryResult, SimpleResult, Explanation, CalciteDdl };


   std::string getExplanation();

   void updateResultSet(const std::string& query_ra, RType type, bool success = true);

   RType getResultType() const { return type_; }

   void setResultType(RType type) { type_ = type; }

   int64_t getExecutionTime() const { return execution_time_ms_; }

   void setExecutionTime(int64_t execution_time_ms) {

     execution_time_ms_ = execution_time_ms;

   }

   void addExecutionTime(int64_t execution_time_ms) {

     execution_time_ms_ += execution_time_ms;

   }


  private:

   ResultSetPtr result_;

   std::vector<TargetMetaInfo> targets_meta_;

   // filters chosen to be pushed down

   std::vector<PushedDownFilterInfo> pushed_down_filter_info_;

   // whether or not it was allowed to look for filters to push down

   bool filter_push_down_enabled_;


   bool success_;

   uint64_t execution_time_ms_;

   RType type_;

 };


 class RelAlgNode;


 class RaExecutionDesc {

  public:

   RaExecutionDesc(const RelAlgNode* body)

       : body_(body)

       , result_(std::make_shared<ResultSet>(std::vector<TargetInfo>{},

                                             ExecutorDeviceType::CPU,

                                             QueryMemoryDescriptor(),

                                             nullptr,

                                             0,

                                             0),

                 {}) {}


   const ExecutionResult& getResult() const { return result_; }


   void setResult(const ExecutionResult& result);


   const RelAlgNode* getBody() const;


  private:

   const RelAlgNode* body_;

   ExecutionResult result_;

 };


 using DAG = boost::

     adjacency_list<boost::setS, boost::vecS, boost::bidirectionalS, const RelAlgNode*>;

 using Vertex = DAG::vertex_descriptor;


 class RaExecutionSequence {

  public:

   RaExecutionSequence(const RelAlgNode*, Executor*, const bool build_sequence = true);

   RaExecutionSequence(std::unique_ptr<RaExecutionDesc> exec_desc);


   RaExecutionDesc* next();


   RaExecutionDesc* prev();


   std::optional<size_t> nextStepId(const bool after_broadcast) const;


   bool executionFinished() const;


   void extractQueryStepSkippingInfo();


   void skipQuerySteps();


   std::vector<Vertex> mergeSortWithInput(const std::vector<Vertex>& vertices,

                                          const DAG& graph);


   const std::unordered_map<int, QueryPlanHash> getSkippedQueryStepCacheKeys() const {

     return cached_resultset_keys_;

   }


   RaExecutionDesc* getDescriptor(size_t idx) const {

     CHECK_LT(idx, descs_.size());

     return descs_[idx].get();

   }


   RaExecutionDesc* getDescriptorByBodyId(unsigned const body_id,

                                          size_t const start_idx) const;


   size_t size() const { return descs_.size(); }

   bool empty() const { return descs_.empty(); }


   size_t totalDescriptorsCount() const;


   const bool hasQueryStepForUnion() const { return has_step_for_union_; }


  private:

   DAG graph_;

   Executor* executor_;


   std::unordered_set<Vertex> joins_;

   std::vector<Vertex> ordering_;  // reverse order topological sort of graph_

   size_t current_vertex_ = 0;

   size_t scan_count_ = 0;


   std::unordered_map<const RelAlgNode*, int> node_ptr_to_vert_idx_;

   std::unordered_map<int, std::unordered_set<int>> skippable_steps_;

   // a set of query steps that their result sets are cached

   std::unordered_set<int> cached_query_steps_;

   std::unordered_map<int, QueryPlanHash> cached_resultset_keys_;

   bool has_step_for_union_{false};

   bool has_limit_clause_{false};


   size_t stepsToNextBroadcast() const;


   // The execution descriptors hold the pointers to their results. We need to push them

   // back into this vector as they are created, so we don't lose the intermediate results

   // later.

   std::vector<std::unique_ptr<RaExecutionDesc>> descs_;

 };

RaExecutionDesc::QueryMemoryDescriptor
QueryMemoryDescriptor()

ExecutionResult::getResultType
RType getResultType() const
Definition: RelAlgExecutionDescriptor.h:73

ExecutionResult::getExplanation
std::string getExplanation()
Definition: RelAlgExecutionDescriptor.cpp:117

RaExecutionSequence::getDescriptor
RaExecutionDesc * getDescriptor(size_t idx) const
Definition: RelAlgExecutionDescriptor.h:180

ExecutionResult::execution_time_ms_
uint64_t execution_time_ms_
Definition: RelAlgExecutionDescriptor.h:92

RaExecutionSequence::mergeSortWithInput
std::vector< Vertex > mergeSortWithInput(const std::vector< Vertex > &vertices, const DAG &graph)
Definition: RelAlgExecutionDescriptor.cpp:288

RaExecutionSequence::hasQueryStepForUnion
const bool hasQueryStepForUnion() const
Definition: RelAlgExecutionDescriptor.h:193

TargetInfo
Definition: TargetInfo.h:49

ExecutionResult::operator=
ExecutionResult & operator=(const ExecutionResult &that)
Definition: RelAlgExecutionDescriptor.cpp:87

RaExecutionSequence::getSkippedQueryStepCacheKeys
const std::unordered_map< int, QueryPlanHash > getSkippedQueryStepCacheKeys() const
Definition: RelAlgExecutionDescriptor.h:176

ExecutionResult::setQueueTime
void setQueueTime(const int64_t queue_time_ms)
Definition: RelAlgExecutionDescriptor.h:59

RaExecutionDesc::body_
const RelAlgNode * body_
Definition: RelAlgExecutionDescriptor.h:117

ExecutionResult::CalciteDdl
Definition: RelAlgExecutionDescriptor.h:69

RaExecutionSequence::skipQuerySteps
void skipQuerySteps()
Definition: RelAlgExecutionDescriptor.cpp:379

ExecutionResult::getDataPtr
const ResultSetPtr & getDataPtr() const
Definition: RelAlgExecutionDescriptor.h:51

ResultSetPtr
std::shared_ptr< ResultSet > ResultSetPtr
Definition: RelAlgExecutionUnit.h:231

RaExecutionSequence::joins_
std::unordered_set< Vertex > joins_
Definition: RelAlgExecutionDescriptor.h:199

RaExecutionSequence::empty
bool empty() const
Definition: RelAlgExecutionDescriptor.h:189

ExecutionResult::Explanation
Definition: RelAlgExecutionDescriptor.h:69

RaExecutionSequence::has_limit_clause_
bool has_limit_clause_
Definition: RelAlgExecutionDescriptor.h:210

ExecutionResult::SimpleResult
Definition: RelAlgExecutionDescriptor.h:69

ExecutionResult::addExecutionTime
void addExecutionTime(int64_t execution_time_ms)
Definition: RelAlgExecutionDescriptor.h:79

report.rows
tuple rows
Definition: report.py:114

TargetInfo.h

ExecutionResult
Definition: RelAlgExecutionDescriptor.h:29

RaExecutionSequence::cached_query_steps_
std::unordered_set< int > cached_query_steps_
Definition: RelAlgExecutionDescriptor.h:207

RaExecutionSequence::current_vertex_
size_t current_vertex_
Definition: RelAlgExecutionDescriptor.h:201

RaExecutionSequence::prev
RaExecutionDesc * prev()
Definition: RelAlgExecutionDescriptor.cpp:322

ExecutionResult::QueryResult
Definition: RelAlgExecutionDescriptor.h:69

ExecutionResult::ExecutionResult
ExecutionResult()
Definition: RelAlgExecutionDescriptor.cpp:26

ExecutionResult::success_
bool success_
Definition: RelAlgExecutionDescriptor.h:91

RaExecutionSequence::descs_
std::vector< std::unique_ptr< RaExecutionDesc > > descs_
Definition: RelAlgExecutionDescriptor.h:225

RaExecutionSequence
A container for relational algebra descriptors defining the execution order for a relational algebra ...
Definition: RelAlgExecutionDescriptor.h:133

ExecutionResult::getTargetsMeta
const std::vector< TargetMetaInfo > & getTargetsMeta() const
Definition: RelAlgExecutionDescriptor.h:53

ExecutionResult::getRows
const std::shared_ptr< ResultSet > & getRows() const
Definition: RelAlgExecutionDescriptor.h:47

ExecutionResult::filter_push_down_enabled_
bool filter_push_down_enabled_
Definition: RelAlgExecutionDescriptor.h:89

RaExecutionSequence::executionFinished
bool executionFinished() const
Definition: RelAlgExecutionDescriptor.cpp:437

ExecutionResult::updateResultSet
void updateResultSet(const std::string &query_ra, RType type, bool success=true)
Definition: RelAlgExecutionDescriptor.cpp:107

RaExecutionDesc::RaExecutionDesc
RaExecutionDesc(const RelAlgNode *body)
Definition: RelAlgExecutionDescriptor.h:100

RaExecutionSequence::extractQueryStepSkippingInfo
void extractQueryStepSkippingInfo()
Definition: RelAlgExecutionDescriptor.cpp:334

RaExecutionSequence::executor_
Executor * executor_
Definition: RelAlgExecutionDescriptor.h:197

ExecutionResult::toString
std::string toString() const
Definition: RelAlgExecutionDescriptor.h:64

ExecutionResult::pushed_down_filter_info_
std::vector< PushedDownFilterInfo > pushed_down_filter_info_
Definition: RelAlgExecutionDescriptor.h:87

RaExecutionSequence::stepsToNextBroadcast
size_t stepsToNextBroadcast() const
Definition: RelAlgExecutionDescriptor.cpp:490

ExecutionResult::setResultType
void setResultType(RType type)
Definition: RelAlgExecutionDescriptor.h:74

CHECK_LT
#define CHECK_LT(x, y)
Definition: Logger.h:303

RelAlgNode
Definition: RelAlgDag.h:828

RaExecutionSequence::node_ptr_to_vert_idx_
std::unordered_map< const RelAlgNode *, int > node_ptr_to_vert_idx_
Definition: RelAlgExecutionDescriptor.h:204

RaExecutionSequence::has_step_for_union_
bool has_step_for_union_
Definition: RelAlgExecutionDescriptor.h:209

RaExecutionSequence::RaExecutionSequence
RaExecutionSequence(const RelAlgNode *, Executor *, const bool build_sequence=true)
Definition: RelAlgExecutionDescriptor.cpp:209

ExecutionResult::getPushedDownFilterInfo
const std::vector< PushedDownFilterInfo > & getPushedDownFilterInfo() const
Definition: RelAlgExecutionDescriptor.cpp:102

RaExecutionSequence::ordering_
std::vector< Vertex > ordering_
Definition: RelAlgExecutionDescriptor.h:200

RaExecutionDesc::result_
ExecutionResult result_
Definition: RelAlgExecutionDescriptor.h:118

RaExecutionSequence::scan_count_
size_t scan_count_
Definition: RelAlgExecutionDescriptor.h:202

QueryMemoryDescriptor.h
Descriptor for the result set buffer layout.

ExecutorDeviceType::CPU

typeName
std::string typeName(const T *v)
Definition: toString.h:106

RaExecutionDesc
Definition: RelAlgExecutionDescriptor.h:98

JoinFilterPushDown.h

RaExecutionSequence::size
size_t size() const
Definition: RelAlgExecutionDescriptor.h:188

ExecutionResult::isFilterPushDownEnabled
const bool isFilterPushDownEnabled() const
Definition: RelAlgExecutionDescriptor.h:57

RaExecutionSequence::graph_
DAG graph_
Definition: RelAlgExecutionDescriptor.h:196

CHECK
#define CHECK(condition)
Definition: Logger.h:291

ExecutionResult::setExecutionTime
void setExecutionTime(int64_t execution_time_ms)
Definition: RelAlgExecutionDescriptor.h:76

RaExecutionDesc::getBody
const RelAlgNode * getBody() const
Definition: RelAlgExecutionDescriptor.cpp:129

ExecutionResult::type_
RType type_
Definition: RelAlgExecutionDescriptor.h:93

ResultSet.h
Basic constructors and methods of the row set interface.

ExecutionResult::RType
RType
Definition: RelAlgExecutionDescriptor.h:69

ExecutionResult::empty
bool empty() const
Definition: RelAlgExecutionDescriptor.h:49

DAG
boost::adjacency_list< boost::setS, boost::vecS, boost::bidirectionalS, const RelAlgNode * > DAG
Definition: RelAlgExecutionDescriptor.h:122

Vertex
DAG::vertex_descriptor Vertex
Definition: RelAlgExecutionDescriptor.h:123

RaExecutionSequence::totalDescriptorsCount
size_t totalDescriptorsCount() const
Definition: RelAlgExecutionDescriptor.cpp:472

toString.h

RaExecutionSequence::next
RaExecutionDesc * next()
Definition: RelAlgExecutionDescriptor.cpp:242

ExecutionResult::targets_meta_
std::vector< TargetMetaInfo > targets_meta_
Definition: RelAlgExecutionDescriptor.h:85

ExecutionResult::getExecutionTime
int64_t getExecutionTime() const
Definition: RelAlgExecutionDescriptor.h:75

RaExecutionSequence::getDescriptorByBodyId
RaExecutionDesc * getDescriptorByBodyId(unsigned const body_id, size_t const start_idx) const
Definition: RelAlgExecutionDescriptor.cpp:462

ResultSet::ResultSet
ResultSet(const std::vector< TargetInfo > &targets, const ExecutorDeviceType device_type, const QueryMemoryDescriptor &query_mem_desc, const std::shared_ptr< RowSetMemoryOwner > row_set_mem_owner, const unsigned block_size, const unsigned grid_size)
Definition: ResultSet.cpp:64

RaExecutionSequence::skippable_steps_
std::unordered_map< int, std::unordered_set< int > > skippable_steps_
Definition: RelAlgExecutionDescriptor.h:205

RaExecutionSequence::cached_resultset_keys_
std::unordered_map< int, QueryPlanHash > cached_resultset_keys_
Definition: RelAlgExecutionDescriptor.h:208

RaExecutionSequence::nextStepId
std::optional< size_t > nextStepId(const bool after_broadcast) const
Definition: RelAlgExecutionDescriptor.cpp:424

ExecutionResult::result_
ResultSetPtr result_
Definition: RelAlgExecutionDescriptor.h:84

run_benchmark_import.type
type
Definition: run_benchmark_import.py:89

run_benchmark_import.result
dictionary result
Definition: run_benchmark_import.py:441