#!/bin/bash

./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 86432 --alpha 1.0 --lda 86432 --stride_a 5531648 --ldb 86432 --stride_b 5531648 --beta 0.0 --ldc 64 --stride_c 4096 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 128 -n 128 -k 4896 --alpha 1.0 --lda 4896 --stride_a 626688 --ldb 4896 --stride_b 626688 --beta 0.0 --ldc 128 --stride_c 16384 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 128 -k 4896 --alpha 1.0 --lda 4896 --stride_a 940032 --ldb 4896 --stride_b 626688 --beta 0.0 --ldc 192 --stride_c 24576 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 4896 --alpha 1.0 --lda 4896 --stride_a 783360 --ldb 4896 --stride_b 783360 --beta 0.0 --ldc 160 --stride_c 25600 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 160 -k 4896 --alpha 1.0 --lda 4896 --stride_a 940032 --ldb 4896 --stride_b 783360 --beta 0.0 --ldc 192 --stride_c 30720 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 192 -k 4896 --alpha 1.0 --lda 4896 --stride_a 940032 --ldb 4896 --stride_b 940032 --beta 0.0 --ldc 192 --stride_c 36864 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 192 -k 4896 --alpha 1.0 --lda 4896 --stride_a 1096704 --ldb 4896 --stride_b 940032 --beta 0.0 --ldc 224 --stride_c 43008 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 224 -k 4896 --alpha 1.0 --lda 4896 --stride_a 1096704 --ldb 4896 --stride_b 1096704 --beta 0.0 --ldc 224 --stride_c 50176 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 224 -k 4896 --alpha 1.0 --lda 4896 --stride_a 1253376 --ldb 4896 --stride_b 1096704 --beta 0.0 --ldc 256 --stride_c 57344 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 256 -k 4896 --alpha 1.0 --lda 4896 --stride_a 1253376 --ldb 4896 --stride_b 1253376 --beta 0.0 --ldc 256 --stride_c 65536 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 320 -n 256 -k 4896 --alpha 1.0 --lda 4896 --stride_a 1566720 --ldb 4896 --stride_b 1253376 --beta 0.0 --ldc 320 --stride_c 81920 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 172864 --alpha 1.0 --lda 172864 --stride_a 11063296 --ldb 172864 --stride_b 11063296 --beta 0.0 --ldc 64 --stride_c 4096 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 128 -k 9792 --alpha 1.0 --lda 9792 --stride_a 1880064 --ldb 9792 --stride_b 1253376 --beta 0.0 --ldc 192 --stride_c 24576 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 9792 --alpha 1.0 --lda 9792 --stride_a 1566720 --ldb 9792 --stride_b 1566720 --beta 0.0 --ldc 160 --stride_c 25600 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 160 -k 9792 --alpha 1.0 --lda 9792 --stride_a 1880064 --ldb 9792 --stride_b 1566720 --beta 0.0 --ldc 192 --stride_c 30720 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 192 -k 9792 --alpha 1.0 --lda 9792 --stride_a 1880064 --ldb 9792 --stride_b 1880064 --beta 0.0 --ldc 192 --stride_c 36864 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 192 -k 9792 --alpha 1.0 --lda 9792 --stride_a 2193408 --ldb 9792 --stride_b 1880064 --beta 0.0 --ldc 224 --stride_c 43008 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 224 -k 9792 --alpha 1.0 --lda 9792 --stride_a 2193408 --ldb 9792 --stride_b 2193408 --beta 0.0 --ldc 224 --stride_c 50176 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 224 -k 9792 --alpha 1.0 --lda 9792 --stride_a 2506752 --ldb 9792 --stride_b 2193408 --beta 0.0 --ldc 256 --stride_c 57344 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 256 -k 9792 --alpha 1.0 --lda 9792 --stride_a 2506752 --ldb 9792 --stride_b 2506752 --beta 0.0 --ldc 256 --stride_c 65536 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 320 -n 256 -k 9792 --alpha 1.0 --lda 9792 --stride_a 3133440 --ldb 9792 --stride_b 2506752 --beta 0.0 --ldc 320 --stride_c 81920 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 345728 --alpha 1.0 --lda 345728 --stride_a 22126592 --ldb 345728 --stride_b 22126592 --beta 0.0 --ldc 64 --stride_c 4096 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 128 -n 128 -k 19584 --alpha 1.0 --lda 19584 --stride_a 2506752 --ldb 19584 --stride_b 2506752 --beta 0.0 --ldc 128 --stride_c 16384 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 128 -k 19584 --alpha 1.0 --lda 19584 --stride_a 3760128 --ldb 19584 --stride_b 2506752 --beta 0.0 --ldc 192 --stride_c 24576 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 19584 --alpha 1.0 --lda 19584 --stride_a 3133440 --ldb 19584 --stride_b 3133440 --beta 0.0 --ldc 160 --stride_c 25600 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 160 -k 19584 --alpha 1.0 --lda 19584 --stride_a 3760128 --ldb 19584 --stride_b 3133440 --beta 0.0 --ldc 192 --stride_c 30720 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 192 -k 19584 --alpha 1.0 --lda 19584 --stride_a 4386816 --ldb 19584 --stride_b 3760128 --beta 0.0 --ldc 224 --stride_c 43008 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 224 -k 19584 --alpha 1.0 --lda 19584 --stride_a 4386816 --ldb 19584 --stride_b 4386816 --beta 0.0 --ldc 224 --stride_c 50176 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 224 -k 19584 --alpha 1.0 --lda 19584 --stride_a 5013504 --ldb 19584 --stride_b 4386816 --beta 0.0 --ldc 256 --stride_c 57344 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 256 -k 19584 --alpha 1.0 --lda 19584 --stride_a 5013504 --ldb 19584 --stride_b 5013504 --beta 0.0 --ldc 256 --stride_c 65536 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 320 -n 256 -k 19584 --alpha 1.0 --lda 19584 --stride_a 6266880 --ldb 19584 --stride_b 5013504 --beta 0.0 --ldc 320 --stride_c 81920 --batch 9
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 58400 --alpha 1.0 --lda 58400 --stride_a 3737600 --ldb 58400 --stride_b 3737600 --beta 0.0 --ldc 64 --stride_c 4096 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 128 -k 3264 --alpha 1.0 --lda 3264 --stride_a 626688 --ldb 3264 --stride_b 417792 --beta 0.0 --ldc 192 --stride_c 24576 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 3264 --alpha 1.0 --lda 3264 --stride_a 522240 --ldb 3264 --stride_b 522240 --beta 0.0 --ldc 160 --stride_c 25600 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 160 -k 3264 --alpha 1.0 --lda 3264 --stride_a 626688 --ldb 3264 --stride_b 522240 --beta 0.0 --ldc 192 --stride_c 30720 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 192 -k 3264 --alpha 1.0 --lda 3264 --stride_a 626688 --ldb 3264 --stride_b 626688 --beta 0.0 --ldc 192 --stride_c 36864 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 192 -k 3264 --alpha 1.0 --lda 3264 --stride_a 731136 --ldb 3264 --stride_b 626688 --beta 0.0 --ldc 224 --stride_c 43008 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 224 -k 3264 --alpha 1.0 --lda 3264 --stride_a 731136 --ldb 3264 --stride_b 731136 --beta 0.0 --ldc 224 --stride_c 50176 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 224 -k 3264 --alpha 1.0 --lda 3264 --stride_a 835584 --ldb 3264 --stride_b 731136 --beta 0.0 --ldc 256 --stride_c 57344 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 256 -k 3264 --alpha 1.0 --lda 3264 --stride_a 835584 --ldb 3264 --stride_b 835584 --beta 0.0 --ldc 256 --stride_c 65536 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 320 -n 256 -k 3264 --alpha 1.0 --lda 3264 --stride_a 1044480 --ldb 3264 --stride_b 835584 --beta 0.0 --ldc 320 --stride_c 81920 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 116800 --alpha 1.0 --lda 116800 --stride_a 7475200 --ldb 116800 --stride_b 7475200 --beta 0.0 --ldc 64 --stride_c 4096 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 128 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1253376 --ldb 6528 --stride_b 835584 --beta 0.0 --ldc 192 --stride_c 24576 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1044480 --ldb 6528 --stride_b 1044480 --beta 0.0 --ldc 160 --stride_c 25600 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 160 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1253376 --ldb 6528 --stride_b 1044480 --beta 0.0 --ldc 192 --stride_c 30720 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 192 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1253376 --ldb 6528 --stride_b 1253376 --beta 0.0 --ldc 192 --stride_c 36864 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 192 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1462272 --ldb 6528 --stride_b 1253376 --beta 0.0 --ldc 224 --stride_c 43008 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 224 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1462272 --ldb 6528 --stride_b 1462272 --beta 0.0 --ldc 224 --stride_c 50176 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 224 -k 6528 --alpha 1.0 --lda 6528 --stride_a 1671168 --ldb 6528 --stride_b 1462272 --beta 0.0 --ldc 256 --stride_c 57344 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 320 -n 256 -k 6528 --alpha 1.0 --lda 6528 --stride_a 2088960 --ldb 6528 --stride_b 1671168 --beta 0.0 --ldc 320 --stride_c 81920 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 233600 --alpha 1.0 --lda 233600 --stride_a 14950400 --ldb 233600 --stride_b 14950400 --beta 0.0 --ldc 64 --stride_c 4096 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 128 -k 13056 --alpha 1.0 --lda 13056 --stride_a 2506752 --ldb 13056 --stride_b 1671168 --beta 0.0 --ldc 192 --stride_c 24576 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 13056 --alpha 1.0 --lda 13056 --stride_a 2088960 --ldb 13056 --stride_b 2088960 --beta 0.0 --ldc 160 --stride_c 25600 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 160 -k 13056 --alpha 1.0 --lda 13056 --stride_a 2506752 --ldb 13056 --stride_b 2088960 --beta 0.0 --ldc 192 --stride_c 30720 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 192 -n 192 -k 13056 --alpha 1.0 --lda 13056 --stride_a 2506752 --ldb 13056 --stride_b 2506752 --beta 0.0 --ldc 192 --stride_c 36864 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 192 -k 13056 --alpha 1.0 --lda 13056 --stride_a 2924544 --ldb 13056 --stride_b 2506752 --beta 0.0 --ldc 224 --stride_c 43008 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 224 -n 224 -k 13056 --alpha 1.0 --lda 13056 --stride_a 2924544 --ldb 13056 --stride_b 2924544 --beta 0.0 --ldc 224 --stride_c 50176 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 224 -k 13056 --alpha 1.0 --lda 13056 --stride_a 3342336 --ldb 13056 --stride_b 2924544 --beta 0.0 --ldc 256 --stride_c 57344 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 256 -n 256 -k 13056 --alpha 1.0 --lda 13056 --stride_a 3342336 --ldb 13056 --stride_b 3342336 --beta 0.0 --ldc 256 --stride_c 65536 --batch 11
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 320 -n 256 -k 13056 --alpha 1.0 --lda 13056 --stride_a 4177920 --ldb 13056 --stride_b 3342336 --beta 0.0 --ldc 320 --stride_c 81920 --batch 11
