#!/bin/bash

./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 32 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 32 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 32 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 32 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 128 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 128 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 128 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 35 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 35 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 96 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 96 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 64 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 91 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 49 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 25 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 64 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 49 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 91 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 24 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 29 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 29 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 63 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 35 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 1 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 63 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 25 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 50 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 96 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 24 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 50 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 1 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 64 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 25 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 25 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 49 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 91 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 86 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 27 -k 3072 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 24 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 24 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 29 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 86 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 27 -k 2048 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 63 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 50 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1 -k 21 --alpha 1.0 --lda 1024 --ldb 21 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3712 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2432 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 2432 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 3712 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 86 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 27 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1 -k 13 --alpha 1.0 --lda 1024 --ldb 13 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4992 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 4992 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1 -k 14 --alpha 1.0 --lda 1024 --ldb 14 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 6272 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 6272 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1408 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1152 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1792 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1760 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1152 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1824 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2496 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2240 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 12928 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1856 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1280 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1376 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1728 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2464 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2400 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1984 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2016 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2048 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1568 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2528 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 774 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2880 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2176 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2272 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2624 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2401 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2304 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 950 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 2401 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 950 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1216 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 774 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4459 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 243 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1015 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1536 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 4459 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1216 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1015 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 2496 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2144 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1184 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2208 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1131 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1664 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1696 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1440 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1827 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1472 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1504 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2336 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 15744 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1600 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 17024 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 15232 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1827 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2368 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2656 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 4235 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3808 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3360 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3200 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2688 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3232 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 243 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 21 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1073 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 14 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4655 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 13440 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1344 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 13184 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 13 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1764 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 3584 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 3185 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 992 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 11424 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4256 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1102 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1120 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1102 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1088 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 1131 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 10176 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 13824 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 10080 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 14080 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 14976 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 15488 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4445 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4064 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2080 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1764 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2592 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 216 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2000 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2720 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1952 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1920 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1888 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2752 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2784 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2816 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2912 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2944 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 14720 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3008 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2560 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3220 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3296 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1632 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 9120 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3392 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 1560 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 36548 -n 9216 -k 1024 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3936 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 3072 -k 128 --alpha 1.0 --lda 4096 --ldb 3072 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 2048 -k 128 --alpha 1.0 --lda 4096 --ldb 2048 --beta 0.0 --ldc 4096
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 128 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 36548 -n 1024 -k 3712 --alpha 1.0 --lda 36548 --ldb 1024 --beta 0.0 --ldc 36548
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3712 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 3072 -n 128 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 3072
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 128 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 128 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3712 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3712 -k 36548 --alpha 1.0 --lda 36548 --ldb 36548 --beta 0.0 --ldc 1024
