// RUN: %hc %s -o %t.out && %t.out #include #include #define TEST_DEBUG (0) // loop to deliberately slow down kernel execution #define LOOP_COUNT (1024) #define GRID_SIZE (32) /// test fetching the number of async operations associated with one accelerator_view int main() { bool ret = true; std::vector table1(GRID_SIZE); std::vector table2(GRID_SIZE); std::vector table3(GRID_SIZE); std::vector table4(GRID_SIZE); std::vector table5(GRID_SIZE); for (int i = 0; i < GRID_SIZE; ++i) { table1[i] = i; table2[i] = i; } hc::array_view av1(GRID_SIZE, table1); hc::array_view av2(GRID_SIZE, table2); hc::array_view av3(GRID_SIZE, table3); hc::array_view av4(GRID_SIZE, table4); hc::array_view av5(GRID_SIZE, table5); hc::accelerator_view accelerator_view = hc::accelerator().get_default_view(); // do 3 kernel dispatches + 3 barriers hc::parallel_for_each(hc::extent<1>(GRID_SIZE), [=](hc::index<1>& idx) [[hc]] { for (int i = 0; i < LOOP_COUNT; ++i) av3(idx) = av1(idx) + av2(idx); }); accelerator_view.create_marker(); hc::parallel_for_each(hc::extent<1>(GRID_SIZE), [=](hc::index<1>& idx) [[hc]] { for (int i = 0; i < LOOP_COUNT; ++i) av4(idx) = av1(idx) + av2(idx); }); accelerator_view.create_marker(); hc::parallel_for_each(hc::extent<1>(GRID_SIZE), [=](hc::index<1>& idx) [[hc]] { for (int i = 0; i < LOOP_COUNT; ++i) av5(idx) = av1(idx) + av2(idx); }); accelerator_view.create_marker(); // wait for async operations to complete hc::accelerator().get_default_view().wait(); // now there must be 0 pending async operations for the accelerator_view ret &= (accelerator_view.get_pending_async_ops() == 0); return !(ret == true); }