 #!/bin/bash
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 1024 -n 4096 -k 1024 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 1024 -n 4096 -k 512 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 1024 -n 6912 -k 1024 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 1024 -n 6912 -k 512 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 256 -n 32768 -k 128 --alpha 1.0 --a_type f32_r --lda 256 --b_type f32_r --ldb 128 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 256 -n 55296 -k 128 --alpha 1.0 --a_type f32_r --lda 256 --b_type f32_r --ldb 128 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 480 -n 4096 -k 1024 --alpha 1.0 --a_type f32_r --lda 480 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 480 --d_type f32_r --ldd 480 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 480 -n 6912 -k 1024 --alpha 1.0 --a_type f32_r --lda 480 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 480 --d_type f32_r --ldd 480 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 512 -n 32768 -k 256 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 512 -n 4096 -k 256 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 512 -n 55296 -k 256 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB N -m 512 -n 6912 -k 256 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 1024 -n 1024 -k 4096 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 1024 -n 1024 -k 6912 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 1024 -n 512 -k 4096 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 1024 -n 512 -k 6912 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 13 -n 512 -k 32768 --alpha 1.0 --a_type f32_r --lda 13 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 13 --d_type f32_r --ldd 13 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 13 -n 512 -k 55296 --alpha 1.0 --a_type f32_r --lda 13 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 13 --d_type f32_r --ldd 13 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 256 -n 128 -k 32768 --alpha 1.0 --a_type f32_r --lda 256 --b_type f32_r --ldb 128 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 256 -n 128 -k 55296 --alpha 1.0 --a_type f32_r --lda 256 --b_type f32_r --ldb 128 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 480 -n 1024 -k 4096 --alpha 1.0 --a_type f32_r --lda 480 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 480 --d_type f32_r --ldd 480 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 480 -n 1024 -k 6912 --alpha 1.0 --a_type f32_r --lda 480 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 480 --d_type f32_r --ldd 480 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 512 -n 256 -k 32768 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 512 -n 256 -k 4096 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 512 -n 256 -k 55296 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA N --transposeB T -m 512 -n 256 -k 6912 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 4096 -k 1024 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 4096 -k 480 --alpha 1.0 --a_type f32_r --lda 480 --b_type f32_r --ldb 480 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 6912 -k 1024 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 6912 -k 480 --alpha 1.0 --a_type f32_r --lda 480 --b_type f32_r --ldb 480 --beta 0.0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 128 -n 32768 -k 256 --alpha 1.0 --a_type f32_r --lda 256 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 128 --d_type f32_r --ldd 128 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 128 -n 55296 -k 256 --alpha 1.0 --a_type f32_r --lda 256 --b_type f32_r --ldb 256 --beta 0.0 --c_type f32_r --ldc 128 --d_type f32_r --ldd 128 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 256 -n 32768 -k 512 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 256 -n 4096 -k 512 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 256 -n 55296 -k 512 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 256 -n 6912 -k 512 --alpha 1.0 --a_type f32_r --lda 512 --b_type f32_r --ldb 512 --beta 0.0 --c_type f32_r --ldc 256 --d_type f32_r --ldd 256 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 512 -n 32768 -k 13 --alpha 1.0 --a_type f32_r --lda 13 --b_type f32_r --ldb 13 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 512 -n 4096 -k 1024 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 512 -n 55296 -k 13 --alpha 1.0 --a_type f32_r --lda 13 --b_type f32_r --ldb 13 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 512 -n 6912 -k 1024 --alpha 1.0 --a_type f32_r --lda 1024 --b_type f32_r --ldb 1024 --beta 0.0 --c_type f32_r --ldc 512 --d_type f32_r --ldd 512 --compute_type f32_r --algo 0 --solution_index 0 --flags 0 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 256 -n 4096 -k 1 --alpha 1.0 --lda 256 --ldb 1 --beta 0.0 --ldc 256 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 256 -n 6912 -k 1 --alpha 1.0 --lda 256 --ldb 1 --beta 0.0 --ldc 256 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 256 -n 1 -k 4096 --alpha 1.0 --lda 256 --ldb 1 --beta 0.0 --ldc 256 -i 10 --initialization rand_int
 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 256 -n 1 -k 6912 --alpha 1.0 --lda 256 --ldb 1 --beta 0.0 --ldc 256 -i 10 --initialization rand_int
