#!/bin/bash

./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 192 -k 1280 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 1280 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 192 -k 2048 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 2048 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 256 -k 1536 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 1536 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 320 -k 1280 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 1280 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 320 -k 2048 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 2048 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 384 -k 1280 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 1280 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 384 -k 1536 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 1536 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 384 -k 2048 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 2048 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 448 -k 1280 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 1280 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 4096 -n 448 -k 2048 --alpha 1 --a_type f32_r --lda 4096 --b_type f32_r --ldb 2048 --beta 0 --c_type f32_r --ldc 4096 --d_type f32_r --ldd 4096 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0

./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 128 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 192 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 256 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 384 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1280 -n 192 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 1280 --d_type f32_r --ldd 1280 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1280 -n 320 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 1280 --d_type f32_r --ldd 1280 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1280 -n 384 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 1280 --d_type f32_r --ldd 1280 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1280 -n 448 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 1280 --d_type f32_r --ldd 1280 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1536 -n 256 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 1536 --d_type f32_r --ldd 1536 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1536 -n 384 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 1536 --d_type f32_r --ldd 1536 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 160 -n 64 -k 5329 --alpha 1 --a_type f32_r --lda 5329 --b_type f32_r --ldb 5329 --beta 1 --c_type f32_r --ldc 160 --d_type f32_r --ldd 160 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 192 -n 32 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 192 --d_type f32_r --ldd 192 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 192 -n 48 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 192 --d_type f32_r --ldd 192 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 192 -n 64 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 192 --d_type f32_r --ldd 192 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 2048 -n 192 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 2048 --d_type f32_r --ldd 2048 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 2048 -n 320 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 2048 --d_type f32_r --ldd 2048 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 2048 -n 384 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 2048 --d_type f32_r --ldd 2048 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 2048 -n 448 -k 64 --alpha 1 --a_type f32_r --lda 64 --b_type f32_r --ldb 64 --beta 1 --c_type f32_r --ldc 2048 --d_type f32_r --ldd 2048 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 256 -n 48 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 256 -n 64 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 288 -n 48 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 288 --d_type f32_r --ldd 288 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 288 -n 64 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 288 --d_type f32_r --ldd 288 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 384 -n 192 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 384 --d_type f32_r --ldd 384 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 384 -n 64 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 384 --d_type f32_r --ldd 384 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 384 -n 96 -k 1225 --alpha 1 --a_type f32_r --lda 1225 --b_type f32_r --ldb 1225 --beta 1 --c_type f32_r --ldc 384 --d_type f32_r --ldd 384 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 64 -n 80 -k 5329 --alpha 1 --a_type f32_r --lda 5329 --b_type f32_r --ldb 5329 --beta 1 --c_type f32_r --ldc 64 --d_type f32_r --ldd 64 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 768 -n 128 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 768 --d_type f32_r --ldd 768 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 768 -n 160 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 768 --d_type f32_r --ldd 768 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 768 -n 192 -k 289 --alpha 1 --a_type f32_r --lda 289 --b_type f32_r --ldb 289 --beta 1 --c_type f32_r --ldc 768 --d_type f32_r --ldd 768 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 --workspace_size 0
