#!/bin/bash

./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 1424 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 1184 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 1808 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 1984 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 1296 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 1680 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 1552 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 1088 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 992 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 2176 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 896 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 2336 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 2512 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 2720 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 2976 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 85 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 85 --stride_b 7225 --beta 0.0 --ldc 64 --stride_c 5440 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 3264 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 3440 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 3632 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 3840 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 4096 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 4368 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 4672 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 5040 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 11 -k 11 --alpha 1.0 --lda 64 --stride_a 704 --ldb 11 --stride_b 121 --beta 0.0 --ldc 64 --stride_c 704 --batch 5456 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 7 -k 7 --alpha 1.0 --lda 64 --stride_a 448 --ldb 7 --stride_b 49 --beta 0.0 --ldc 64 --stride_c 448 --batch 8192 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 111 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 111 --stride_b 12321 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 10 -k 10 --alpha 1.0 --lda 64 --stride_a 640 --ldb 10 --stride_b 100 --beta 0.0 --ldc 64 --stride_c 640 --batch 5952 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 92 -k 92 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 92 --stride_b 8464 --beta 0.0 --ldc 64 --stride_c 5888 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4992 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 147 -k 147 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 147 --stride_b 21609 --beta 0.0 --ldc 64 --stride_c 9408 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 9 -k 9 --alpha 1.0 --lda 64 --stride_a 576 --ldb 9 --stride_b 81 --beta 0.0 --ldc 64 --stride_c 576 --batch 6544 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 8 -k 8 --alpha 1.0 --lda 64 --stride_a 512 --ldb 8 --stride_b 64 --beta 0.0 --ldc 64 --stride_c 512 --batch 7280 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 193 -k 193 --alpha 1.0 --lda 64 --stride_a 12352 --ldb 193 --stride_b 37249 --beta 0.0 --ldc 64 --stride_c 12352 --batch 320 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 177 -k 177 --alpha 1.0 --lda 64 --stride_a 11328 --ldb 177 --stride_b 31329 --beta 0.0 --ldc 64 --stride_c 11328 --batch 352 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 92 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 92 --stride_b 8556 --beta 0.0 --ldc 64 --stride_c 5952 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 159 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 159 --stride_b 25281 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 148 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 148 --stride_b 21904 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 134 --stride_b 17956 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 132 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17424 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 122 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15006 --beta 0.0 --ldc 64 --stride_c 7808 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 122 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 122 --stride_b 14884 --beta 0.0 --ldc 64 --stride_c 7808 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 112 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 111 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 101 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 101 --stride_b 10201 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 100 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 100 --stride_b 10000 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 99 -k 99 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 99 --stride_b 9801 --beta 0.0 --ldc 64 --stride_c 6336 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 85 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7140 --beta 0.0 --ldc 64 --stride_c 5440 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 84 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7056 --beta 0.0 --ldc 64 --stride_c 5376 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 232 -k 232 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 232 --stride_b 53824 --beta 0.0 --ldc 64 --stride_c 14848 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 232 -k 228 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 228 --stride_b 52896 --beta 0.0 --ldc 64 --stride_c 14848 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 228 -k 228 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 228 --stride_b 51984 --beta 0.0 --ldc 64 --stride_c 14592 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 162 -k 162 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 162 --stride_b 26244 --beta 0.0 --ldc 64 --stride_c 10368 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 162 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 159 --stride_b 25758 --beta 0.0 --ldc 64 --stride_c 10368 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 160 -k 160 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 160 --stride_b 25600 --beta 0.0 --ldc 64 --stride_c 10240 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 159 -k 160 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 160 --stride_b 25440 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 148 -k 143 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 143 --stride_b 21164 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 147 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 148 --stride_b 21756 --beta 0.0 --ldc 64 --stride_c 9408 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 143 -k 143 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 143 --stride_b 20449 --beta 0.0 --ldc 64 --stride_c 9152 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 133 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 133 --stride_b 17955 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17820 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18090 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17688 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 133 -k 133 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 133 --stride_b 17689 --beta 0.0 --ldc 64 --stride_c 8512 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 111 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 99 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 99 --stride_b 10098 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 101 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 100 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 101 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 100 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 1424 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 1184 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 1808 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 1984 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 1296 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 1680 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 1552 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 1088 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 992 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 2176 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 896 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 2336 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 2512 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 2720 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 2976 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 85 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 85 --stride_b 7225 --beta 0.0 --ldc 64 --stride_c 5440 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 3264 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 3440 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 3632 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 3840 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 4096 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 4368 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 4672 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 5040 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 11 -k 11 --alpha 1.0 --lda 64 --stride_a 704 --ldb 11 --stride_b 121 --beta 0.0 --ldc 64 --stride_c 704 --batch 5456 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 7 -k 7 --alpha 1.0 --lda 64 --stride_a 448 --ldb 7 --stride_b 49 --beta 0.0 --ldc 64 --stride_c 448 --batch 8192 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 111 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 111 --stride_b 12321 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 10 -k 10 --alpha 1.0 --lda 64 --stride_a 640 --ldb 10 --stride_b 100 --beta 0.0 --ldc 64 --stride_c 640 --batch 5952 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 92 -k 92 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 92 --stride_b 8464 --beta 0.0 --ldc 64 --stride_c 5888 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 77 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4928 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 147 -k 147 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 147 --stride_b 21609 --beta 0.0 --ldc 64 --stride_c 9408 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 9 -k 9 --alpha 1.0 --lda 64 --stride_a 576 --ldb 9 --stride_b 81 --beta 0.0 --ldc 64 --stride_c 576 --batch 6544 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 8 -k 8 --alpha 1.0 --lda 64 --stride_a 512 --ldb 8 --stride_b 64 --beta 0.0 --ldc 64 --stride_c 512 --batch 7280 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 193 -k 193 --alpha 1.0 --lda 64 --stride_a 12352 --ldb 193 --stride_b 37249 --beta 0.0 --ldc 64 --stride_c 12352 --batch 320 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 177 -k 177 --alpha 1.0 --lda 64 --stride_a 11328 --ldb 177 --stride_b 31329 --beta 0.0 --ldc 64 --stride_c 11328 --batch 352 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 92 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 92 --stride_b 8556 --beta 0.0 --ldc 64 --stride_c 5888 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 159 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 159 --stride_b 25281 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 148 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 148 --stride_b 21904 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 134 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 134 --stride_b 17956 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 132 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17424 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 123 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 123 --stride_b 15006 --beta 0.0 --ldc 64 --stride_c 7872 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 122 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 122 --stride_b 14884 --beta 0.0 --ldc 64 --stride_c 7808 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 111 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 111 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 101 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 101 --stride_b 10201 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 100 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 100 --stride_b 10000 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 99 -k 99 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 99 --stride_b 9801 --beta 0.0 --ldc 64 --stride_c 6336 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 99 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 99 --stride_b 10098 --beta 0.0 --ldc 64 --stride_c 6336 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 84 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 84 --stride_b 7140 --beta 0.0 --ldc 64 --stride_c 5376 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 84 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7056 --beta 0.0 --ldc 64 --stride_c 5376 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 232 -k 232 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 232 --stride_b 53824 --beta 0.0 --ldc 64 --stride_c 14848 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 228 -k 232 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 228 --stride_b 52896 --beta 0.0 --ldc 64 --stride_c 14592 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 228 -k 228 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 228 --stride_b 51984 --beta 0.0 --ldc 64 --stride_c 14592 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 162 -k 162 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 162 --stride_b 26244 --beta 0.0 --ldc 64 --stride_c 10368 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 160 -k 160 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 160 --stride_b 25600 --beta 0.0 --ldc 64 --stride_c 10240 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 160 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 160 --stride_b 25440 --beta 0.0 --ldc 64 --stride_c 10240 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 159 -k 162 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 159 --stride_b 25758 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 148 -k 147 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 148 --stride_b 21756 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 143 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 143 --stride_b 21164 --beta 0.0 --ldc 64 --stride_c 9152 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 143 -k 143 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 143 --stride_b 20449 --beta 0.0 --ldc 64 --stride_c 9152 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 135 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 135 --stride_b 18090 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 133 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 133 --stride_b 17955 --beta 0.0 --ldc 64 --stride_c 8512 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 133 -k 133 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 133 --stride_b 17689 --beta 0.0 --ldc 64 --stride_c 8512 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 132 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 132 --stride_b 17820 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 132 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 132 --stride_b 17688 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 112 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 112 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 102 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 102 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 101 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 101 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 100 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 100 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 45 -n 45 -k 64 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 64 --stride_b 2880 --beta 0.0 --ldc 45 --stride_c 2025 --batch 1424 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 54 -n 54 -k 64 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 64 --stride_b 3456 --beta 0.0 --ldc 54 --stride_c 2916 --batch 1184 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 35 -n 35 -k 64 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 64 --stride_b 2240 --beta 0.0 --ldc 35 --stride_c 1225 --batch 1808 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 32 -n 32 -k 64 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 64 --stride_b 2048 --beta 0.0 --ldc 32 --stride_c 1024 --batch 1984 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 49 -n 49 -k 64 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 64 --stride_b 3136 --beta 0.0 --ldc 49 --stride_c 2401 --batch 1296 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 38 -n 38 -k 64 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 64 --stride_b 2432 --beta 0.0 --ldc 38 --stride_c 1444 --batch 1680 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 41 -n 41 -k 64 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 64 --stride_b 2624 --beta 0.0 --ldc 41 --stride_c 1681 --batch 1552 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 59 -n 59 -k 64 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 64 --stride_b 3776 --beta 0.0 --ldc 59 --stride_c 3481 --batch 1088 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 65 -n 65 -k 64 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 65 --stride_c 4225 --batch 992 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 29 -n 29 -k 64 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 64 --stride_b 1856 --beta 0.0 --ldc 29 --stride_c 841 --batch 2176 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 71 -n 71 -k 64 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 64 --stride_b 4544 --beta 0.0 --ldc 71 --stride_c 5041 --batch 896 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 27 -n 27 -k 64 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 64 --stride_b 1728 --beta 0.0 --ldc 27 --stride_c 729 --batch 2336 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 25 -n 25 -k 64 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 64 --stride_b 1600 --beta 0.0 --ldc 25 --stride_c 625 --batch 2512 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 23 -n 23 -k 64 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 64 --stride_b 1472 --beta 0.0 --ldc 23 --stride_c 529 --batch 2720 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 78 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 78 --stride_c 6084 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 21 -n 21 -k 64 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 64 --stride_b 1344 --beta 0.0 --ldc 21 --stride_c 441 --batch 2976 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 85 -n 85 -k 64 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 64 --stride_b 5440 --beta 0.0 --ldc 85 --stride_c 7225 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 93 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 93 --stride_c 8649 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 19 -n 19 -k 64 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 64 --stride_b 1216 --beta 0.0 --ldc 19 --stride_c 361 --batch 3264 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 18 -n 18 -k 64 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 64 --stride_b 1152 --beta 0.0 --ldc 18 --stride_c 324 --batch 3440 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 17 -n 17 -k 64 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 64 --stride_b 1088 --beta 0.0 --ldc 17 --stride_c 289 --batch 3632 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 102 --stride_c 10404 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 16 -n 16 -k 64 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 64 --stride_b 1024 --beta 0.0 --ldc 16 --stride_c 256 --batch 3840 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 15 -n 15 -k 64 --alpha 1.0 --lda 64 --stride_a 960 --ldb 64 --stride_b 960 --beta 0.0 --ldc 15 --stride_c 225 --batch 4096 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 14 -n 14 -k 64 --alpha 1.0 --lda 64 --stride_a 896 --ldb 64 --stride_b 896 --beta 0.0 --ldc 14 --stride_c 196 --batch 4368 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 112 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7168 --beta 0.0 --ldc 112 --stride_c 12544 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 13 -n 13 -k 64 --alpha 1.0 --lda 64 --stride_a 832 --ldb 64 --stride_b 832 --beta 0.0 --ldc 13 --stride_c 169 --batch 4672 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 123 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7872 --beta 0.0 --ldc 123 --stride_c 15129 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 12 -n 12 -k 64 --alpha 1.0 --lda 64 --stride_a 768 --ldb 64 --stride_b 768 --beta 0.0 --ldc 12 --stride_c 144 --batch 5040 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 11 -n 11 -k 64 --alpha 1.0 --lda 64 --stride_a 704 --ldb 64 --stride_b 704 --beta 0.0 --ldc 11 --stride_c 121 --batch 5456 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 7 -n 7 -k 64 --alpha 1.0 --lda 64 --stride_a 448 --ldb 64 --stride_b 448 --beta 0.0 --ldc 7 --stride_c 49 --batch 8192 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 111 -n 111 -k 64 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 64 --stride_b 7104 --beta 0.0 --ldc 111 --stride_c 12321 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 10 -n 10 -k 64 --alpha 1.0 --lda 64 --stride_a 640 --ldb 64 --stride_b 640 --beta 0.0 --ldc 10 --stride_c 100 --batch 5952 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 92 -n 92 -k 64 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 64 --stride_b 5888 --beta 0.0 --ldc 92 --stride_c 8464 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 77 --stride_c 6006 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 77 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4928 --beta 0.0 --ldc 77 --stride_c 5929 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 147 -n 147 -k 64 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 64 --stride_b 9408 --beta 0.0 --ldc 147 --stride_c 21609 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 9 -n 9 -k 64 --alpha 1.0 --lda 64 --stride_a 576 --ldb 64 --stride_b 576 --beta 0.0 --ldc 9 --stride_c 81 --batch 6544 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 8 -n 8 -k 64 --alpha 1.0 --lda 64 --stride_a 512 --ldb 64 --stride_b 512 --beta 0.0 --ldc 8 --stride_c 64 --batch 7280 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 193 -n 193 -k 64 --alpha 1.0 --lda 64 --stride_a 12352 --ldb 64 --stride_b 12352 --beta 0.0 --ldc 193 --stride_c 37249 --batch 320 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 177 -n 177 -k 64 --alpha 1.0 --lda 64 --stride_a 11328 --ldb 64 --stride_b 11328 --beta 0.0 --ldc 177 --stride_c 31329 --batch 352 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 135 --stride_c 18225 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 92 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 92 --stride_c 8556 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 159 -n 159 -k 64 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 64 --stride_b 10176 --beta 0.0 --ldc 159 --stride_c 25281 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 148 -n 148 -k 64 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 64 --stride_b 9472 --beta 0.0 --ldc 148 --stride_c 21904 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 134 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 134 --stride_c 17956 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 132 -n 132 -k 64 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 64 --stride_b 8448 --beta 0.0 --ldc 132 --stride_c 17424 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 122 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7808 --beta 0.0 --ldc 123 --stride_c 15006 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 122 -n 122 -k 64 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 64 --stride_b 7808 --beta 0.0 --ldc 122 --stride_c 14884 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 111 -n 112 -k 64 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 64 --stride_b 7168 --beta 0.0 --ldc 111 --stride_c 12432 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 101 -n 101 -k 64 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 64 --stride_b 6464 --beta 0.0 --ldc 101 --stride_c 10201 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 100 -n 100 -k 64 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 64 --stride_b 6400 --beta 0.0 --ldc 100 --stride_c 10000 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 99 -n 99 -k 64 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 64 --stride_b 6336 --beta 0.0 --ldc 99 --stride_c 9801 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 99 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 99 --stride_c 10098 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 84 -n 85 -k 64 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 64 --stride_b 5440 --beta 0.0 --ldc 84 --stride_c 7140 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 84 -n 84 -k 64 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 64 --stride_b 5376 --beta 0.0 --ldc 84 --stride_c 7056 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 232 -n 232 -k 64 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 64 --stride_b 14848 --beta 0.0 --ldc 232 --stride_c 53824 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 228 -n 232 -k 64 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 64 --stride_b 14848 --beta 0.0 --ldc 228 --stride_c 52896 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 228 -n 228 -k 64 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 64 --stride_b 14592 --beta 0.0 --ldc 228 --stride_c 51984 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 162 -n 162 -k 64 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 64 --stride_b 10368 --beta 0.0 --ldc 162 --stride_c 26244 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 64 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 64 --stride_b 10240 --beta 0.0 --ldc 160 --stride_c 25600 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 159 -k 64 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 64 --stride_b 10176 --beta 0.0 --ldc 160 --stride_c 25440 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 159 -n 162 -k 64 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 64 --stride_b 10368 --beta 0.0 --ldc 159 --stride_c 25758 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 148 -n 147 -k 64 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 64 --stride_b 9408 --beta 0.0 --ldc 148 --stride_c 21756 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 143 -n 148 -k 64 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 64 --stride_b 9472 --beta 0.0 --ldc 143 --stride_c 21164 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 143 -n 143 -k 64 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 64 --stride_b 9152 --beta 0.0 --ldc 143 --stride_c 20449 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 135 --stride_c 18090 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 133 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 133 --stride_c 17955 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 133 -n 133 -k 64 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 64 --stride_b 8512 --beta 0.0 --ldc 133 --stride_c 17689 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 132 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 132 --stride_c 17820 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 132 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 132 --stride_c 17688 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 111 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7104 --beta 0.0 --ldc 112 --stride_c 12432 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 101 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6464 --beta 0.0 --ldc 102 --stride_c 10302 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 100 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6400 --beta 0.0 --ldc 102 --stride_c 10200 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 101 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 101 --stride_c 10302 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 100 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 100 --stride_c 10200 --batch 624 -i 5
