#!/bin/bash

./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3996 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4005 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3969 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3968 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3955 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3990 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3977 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4012 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4030 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3978 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3944 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3976 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3942 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3925 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3910 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3906 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3995 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3840 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3999 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3876 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3870 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3859 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3822 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4032 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3996 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3996 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4005 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4005 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4059 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3796 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3969 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3969 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3968 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3955 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3968 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3955 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3990 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3990 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3977 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3977 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4012 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4012 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3780 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4030 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4030 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3978 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3978 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3944 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3944 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3976 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3942 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3976 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3942 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3751 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3925 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3925 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3910 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3910 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3906 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3906 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4050 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3956 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3927 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3720 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3584 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3995 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3995 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3999 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3840 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3999 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3840 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3876 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4026 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4020 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3975 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3960 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3939 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3900 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3894 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3876 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3861 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3860 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3681 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3640 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3870 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3870 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3996 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4005 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3859 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3859 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3969 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3968 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3955 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3990 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3444 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3444 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3977 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4012 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3505 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3416 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3382 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3505 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3416 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3382 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4030 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4032 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3822 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3535 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3510 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3495 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3479 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3461 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3447 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3424 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3404 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4032 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3978 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3822 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3535 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3510 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3495 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3479 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3461 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3447 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3424 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3404 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3944 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3508 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3503 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3497 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3485 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3483 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3482 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3480 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3467 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3465 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3457 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3456 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3453 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3435 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3422 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3413 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4000 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3976 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3948 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3942 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3508 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3503 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3497 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3485 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3483 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3482 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3480 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3467 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3465 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3457 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3456 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3453 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3435 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3422 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3413 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3925 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3910 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3796 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3528 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3514 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3512 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3511 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3502 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3500 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3490 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3484 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3477 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3475 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3466 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3458 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3450 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3449 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3445 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3428 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3427 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3406 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3796 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3528 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3514 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3512 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3511 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3502 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3500 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3490 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3484 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3477 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3475 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3466 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3458 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3450 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3449 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3445 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3428 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3427 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3406 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3906 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4059 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3780 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3559 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3550 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3547 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3544 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3542 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3541 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3540 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3536 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3534 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3531 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3519 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3517 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3516 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3515 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3498 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3496 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3491 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3488 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3481 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3478 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3476 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3468 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3460 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3459 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3455 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3454 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3451 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3441 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3436 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3431 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3421 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3417 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3411 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3405 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3386 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3384 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3367 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3352 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3337 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3295 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3293 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4059 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3780 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3559 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3550 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3547 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3544 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3542 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3541 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3540 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3536 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3534 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3531 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3519 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3517 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3516 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3515 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3498 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3496 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3491 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3488 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3481 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3478 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3476 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3468 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3460 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3459 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3455 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3454 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3451 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3441 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3436 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3431 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3421 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3417 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3411 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3405 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3386 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3384 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3367 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3352 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3337 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3295 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3293 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3995 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4050 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3751 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3585 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3572 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3566 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3552 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3545 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3543 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3539 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3526 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3518 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3513 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3506 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3504 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3499 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3494 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3492 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3489 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3473 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3463 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3452 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3448 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3446 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3440 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3434 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3433 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3432 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3430 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3426 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3425 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3418 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3410 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3409 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3402 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3401 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3397 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3394 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3385 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3383 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3375 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3372 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3369 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3368 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3365 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3359 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3354 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3353 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3336 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3303 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3296 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3271 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3244 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3236 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3235 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3221 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3209 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4050 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3751 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3585 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3572 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3566 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3552 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3545 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3543 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3539 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3526 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3518 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3513 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3506 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3504 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3499 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3494 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3492 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3489 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3473 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3463 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3452 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3448 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3446 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3440 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3434 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3433 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3432 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3430 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3426 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3425 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3418 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3410 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3409 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3402 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3401 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3397 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3394 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3385 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3383 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3375 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3372 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3369 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3368 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3365 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3359 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3354 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3353 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3336 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3303 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3296 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3271 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3244 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3236 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3235 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3221 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3209 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3999 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3840 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4026 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 4020 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3720 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3584 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3579 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3564 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3563 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3562 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3558 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3557 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3555 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3554 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3548 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3546 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3533 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3532 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3527 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3525 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3524 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3523 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3520 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3501 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3487 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3486 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3470 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3469 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3464 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3462 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3443 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3442 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3437 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3419 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3414 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3412 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3408 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3399 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3398 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3393 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3391 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3389 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3388 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3387 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3380 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3379 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3376 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3366 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3364 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3361 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3360 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3351 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3345 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3344 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3340 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3320 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3318 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3312 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3308 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3304 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3302 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3301 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3291 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3290 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3280 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3276 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3270 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3263 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3259 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3257 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3256 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3247 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3233 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3226 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3224 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3215 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3213 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3205 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3176 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3168 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3162 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3137 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3121 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3072 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2499 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4026 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4020 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3876 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3720 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3584 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3579 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3564 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3563 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3562 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3558 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3557 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3555 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3554 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3548 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3546 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3533 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3532 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3527 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3525 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3524 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3523 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3520 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3501 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3487 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3486 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3470 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3469 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3464 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3462 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3443 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3442 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3437 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3419 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3414 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3412 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3408 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3399 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3398 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3393 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3391 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3389 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3388 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3387 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3380 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3379 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3376 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3366 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3364 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3361 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3360 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3351 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3345 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3344 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3340 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3320 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3318 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3312 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3308 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3304 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3302 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3301 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3291 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3290 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3280 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3276 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3270 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3263 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3259 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3257 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3256 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3247 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3233 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3226 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3224 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3215 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3213 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3205 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3176 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3168 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3162 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3137 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3121 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3072 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2499 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3870 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3859 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4032 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3822 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3975 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3956 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3939 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3900 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3894 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3860 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3681 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3640 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3616 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3594 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3593 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3582 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3581 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3574 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3573 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3565 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3561 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3560 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3549 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3538 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3530 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3529 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3522 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3509 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3493 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3474 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3472 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3471 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3439 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3438 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3423 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3415 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3403 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3400 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3396 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3395 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3392 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3390 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3381 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3378 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3377 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3374 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3371 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3363 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3362 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3358 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3357 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3356 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3355 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3350 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3349 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3348 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3346 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3343 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3342 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3341 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3339 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3335 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3334 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3332 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3328 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3325 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3322 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3321 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3319 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3315 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3314 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3311 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3306 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3300 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3299 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3298 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3297 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3294 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3292 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3289 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3288 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3287 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3286 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3282 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3277 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3273 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3272 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3267 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3266 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3265 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3262 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3248 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3245 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3232 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3231 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3230 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3222 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3216 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3214 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3211 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3207 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3191 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3190 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3189 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3186 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3184 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3183 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3182 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3181 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3180 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3169 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3166 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3165 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3163 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3154 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3147 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3145 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3144 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3143 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3141 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3140 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3139 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3138 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3136 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3130 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3126 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3110 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3103 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3101 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3098 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3095 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3093 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3088 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3079 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3064 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3063 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3057 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3055 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3046 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 3014 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2985 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2984 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2977 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2967 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2935 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2918 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2917 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2765 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2736 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 4096 -n 2505 -k 1024 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3975 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3956 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3939 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3900 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3894 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3860 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3681 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3640 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3616 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3594 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3593 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3582 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3581 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3574 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3573 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3565 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3561 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3560 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3549 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3538 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3530 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3529 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3522 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3509 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3493 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3474 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3472 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3471 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3439 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3438 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3423 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3415 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3403 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3400 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3396 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3395 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3392 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3390 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3381 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3378 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3377 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3374 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3371 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3363 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3362 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3358 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3357 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3356 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3355 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3350 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3349 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3348 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3346 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3343 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3342 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3341 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3339 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3335 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3334 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3332 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3328 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3325 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3322 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3321 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3319 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3315 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3314 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3311 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3306 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3300 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3299 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3298 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3297 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3294 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3292 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3289 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3288 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3287 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3286 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3282 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3277 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3273 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3272 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3267 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3266 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3265 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3262 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3248 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3245 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3232 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3231 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3230 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3222 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3216 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3214 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3211 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3207 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3191 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3190 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3189 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3186 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3184 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3183 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3182 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3181 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3180 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3169 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3166 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3165 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3163 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3154 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3147 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3145 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3144 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3143 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3141 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3140 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3139 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3138 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3136 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3130 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3126 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3110 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3103 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3101 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3098 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3095 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3093 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3088 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3079 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3064 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3063 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3057 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3055 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3046 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3014 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2985 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2984 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2977 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2967 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2935 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2918 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2917 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2765 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2736 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 2505 -k 4096 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3796 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4059 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3780 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4050 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3751 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4026 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 4020 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3720 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3584 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3975 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3956 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3939 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3900 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3894 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3860 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3681 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 1024 -n 3640 -k 33708 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3996 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4005 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3969 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3968 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3955 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3990 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3977 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4012 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4030 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3978 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3944 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3976 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3942 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3925 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3910 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3906 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3995 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3840 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3999 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3876 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3870 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3859 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3822 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4032 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3996 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3996 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4005 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4005 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4059 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3796 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3969 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3969 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3968 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3955 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3968 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3955 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3990 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3990 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3977 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3977 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4012 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4012 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3780 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4030 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4030 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3978 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3978 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3944 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3944 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3976 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3942 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3976 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3942 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3751 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3925 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3925 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3910 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3910 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3906 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3906 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4050 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3956 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3927 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3720 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3584 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3995 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3995 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3999 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3840 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3999 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3840 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3876 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3876 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4026 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4020 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3975 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3960 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3939 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3900 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3894 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3861 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3860 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3681 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3640 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3870 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3870 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3996 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4005 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3859 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3859 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3969 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3968 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3955 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3990 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3444 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3444 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3977 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4012 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3505 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3416 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3382 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3505 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3416 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3382 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4030 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4032 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3822 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3535 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3510 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3495 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3479 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3461 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3447 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3424 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3404 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4032 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3822 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3535 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3510 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3495 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3479 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3461 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3447 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3424 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3404 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3978 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3944 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3508 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3503 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3497 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3485 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3483 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3482 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3480 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3467 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3465 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3457 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3456 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3453 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3435 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3422 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3413 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3508 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3503 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3497 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3485 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3483 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3482 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3480 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3467 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3465 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3457 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3456 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3453 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3435 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3422 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3413 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3976 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3942 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 4000 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 1024 -k 3948 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3925 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3910 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3796 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3528 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3514 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3512 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3511 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3502 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3500 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3490 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3484 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3477 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3475 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3466 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3458 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3450 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3449 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3445 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3428 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3427 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3406 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3796 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3528 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3514 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3512 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3511 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3502 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3500 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3490 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3484 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3477 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3475 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3466 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3458 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3450 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3449 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3445 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3428 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3427 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3406 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3906 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4059 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3780 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3559 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3550 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3547 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3544 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3542 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3541 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3540 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3536 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3534 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3531 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3519 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3517 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3516 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3515 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3498 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3496 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3491 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3488 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3481 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3478 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3476 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3468 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3460 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3459 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3455 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3454 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3451 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3441 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3436 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3431 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3421 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3417 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3411 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3405 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3386 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3384 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3367 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3352 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3337 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3295 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3293 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4059 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3780 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3559 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3550 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3547 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3544 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3542 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3541 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3540 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3536 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3534 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3531 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3519 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3517 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3516 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3515 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3498 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3496 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3491 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3488 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3481 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3478 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3476 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3468 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3460 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3459 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3455 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3454 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3451 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3441 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3436 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3431 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3421 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3417 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3411 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3405 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3386 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3384 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3367 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3352 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3337 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3295 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3293 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3995 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4050 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3751 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3585 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3572 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3566 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3552 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3545 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3543 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3539 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3526 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3518 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3513 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3506 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3504 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3499 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3494 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3492 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3489 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3473 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3463 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3452 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3448 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3446 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3440 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3434 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3433 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3432 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3430 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3426 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3425 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3418 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3410 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3409 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3402 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3401 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3397 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3394 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3385 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3383 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3375 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3372 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3369 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3368 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3365 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3359 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3354 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3353 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3336 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3303 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3296 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3271 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3244 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3236 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3235 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3221 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3209 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4050 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3751 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3585 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3572 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3566 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3552 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3545 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3543 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3539 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3526 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3518 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3513 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3506 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3504 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3499 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3494 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3492 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3489 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3473 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3463 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3452 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3448 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3446 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3440 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3434 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3433 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3432 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3430 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3426 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3425 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3418 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3410 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3409 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3402 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3401 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3397 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3394 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3385 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3383 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3375 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3372 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3369 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3368 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3365 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3359 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3354 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3353 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3336 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3303 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3296 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3271 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3244 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3236 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3235 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3221 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3209 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3999 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3840 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4026 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 4020 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3720 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3584 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3579 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3564 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3563 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3562 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3558 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3557 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3555 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3554 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3548 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3546 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3533 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3532 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3527 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3525 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3524 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3523 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3520 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3501 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3487 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3486 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3470 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3469 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3464 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3462 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3443 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3442 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3437 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3419 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3414 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3412 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3408 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3399 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3398 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3393 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3391 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3389 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3388 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3387 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3380 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3379 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3376 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3366 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3364 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3361 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3360 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3351 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3345 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3344 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3340 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3320 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3318 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3312 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3308 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3304 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3302 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3301 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3291 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3290 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3280 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3276 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3270 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3263 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3259 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3257 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3256 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3247 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3233 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3226 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3224 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3215 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3213 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3205 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3176 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3168 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3162 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3137 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3121 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3072 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2499 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4026 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 4020 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3720 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3584 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3579 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3564 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3563 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3562 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3558 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3557 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3555 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3554 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3548 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3546 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3533 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3532 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3527 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3525 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3524 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3523 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3520 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3501 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3487 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3486 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3470 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3469 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3464 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3462 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3443 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3442 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3437 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3419 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3414 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3412 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3408 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3399 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3398 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3393 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3391 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3389 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3388 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3387 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3380 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3379 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3376 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3366 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3364 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3361 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3360 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3351 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3345 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3344 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3340 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3320 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3318 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3312 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3308 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3304 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3302 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3301 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3291 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3290 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3280 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3276 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3270 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3263 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3259 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3257 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3256 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3247 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3233 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3226 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3224 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3215 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3213 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3205 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3176 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3168 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3162 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3137 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3121 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3072 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2499 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3876 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3870 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3859 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4032 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3822 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3975 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3956 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3939 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3900 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3894 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3860 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3681 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3640 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3616 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3594 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3593 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3582 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3581 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3574 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3573 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3565 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3561 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3560 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3549 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3538 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3530 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3529 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3522 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3509 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3493 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3474 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3472 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3471 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3439 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3438 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3423 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3415 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3403 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3400 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3396 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3395 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3392 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3390 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3381 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3378 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3377 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3374 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3371 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3363 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3362 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3358 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3357 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3356 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3355 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3350 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3349 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3348 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3346 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3343 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3342 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3341 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3339 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3335 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3334 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3332 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3328 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3325 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3322 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3321 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3319 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3315 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3314 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3311 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3306 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3300 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3299 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3298 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3297 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3294 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3292 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3289 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3288 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3287 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3286 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3282 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3277 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3273 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3272 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3267 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3266 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3265 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3262 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3248 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3245 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3232 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3231 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3230 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3222 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3216 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3214 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3211 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3207 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3191 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3190 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3189 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3186 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3184 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3183 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3182 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3181 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3180 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3169 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3166 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3165 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3163 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3154 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3147 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3145 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3144 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3143 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3141 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3140 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3139 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3138 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3136 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3130 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3126 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3110 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3103 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3101 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3098 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3095 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3093 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3088 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3079 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3064 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3063 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3057 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3055 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3046 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 3014 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2985 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2984 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2977 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2967 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2935 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2918 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2917 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2765 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2736 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 4096 -n 1024 -k 2505 --alpha 1.0 --lda 4096 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3975 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3956 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3939 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3900 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3894 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3860 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3681 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3640 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3616 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3594 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3593 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3582 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3581 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3574 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3573 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3565 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3561 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3560 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3549 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3538 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3530 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3529 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3522 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3509 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3493 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3474 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3472 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3471 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3439 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3438 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3423 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3415 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3403 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3400 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3396 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3395 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3392 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3390 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3381 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3378 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3377 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3374 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3371 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3363 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3362 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3358 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3357 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3356 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3355 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3350 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3349 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3348 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3346 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3343 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3342 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3341 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3339 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3335 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3334 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3332 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3328 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3325 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3322 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3321 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3319 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3315 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3314 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3311 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3306 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3300 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3299 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3298 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3297 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3294 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3292 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3289 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3288 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3287 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3286 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3282 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3277 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3273 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3272 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3267 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3266 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3265 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3262 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3248 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3245 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3232 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3231 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3230 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3222 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3216 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3214 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3211 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3207 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3191 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3190 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3189 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3186 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3184 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3183 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3182 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3181 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3180 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3169 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3166 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3165 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3163 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3154 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3147 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3145 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3144 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3143 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3141 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3140 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3139 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3138 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3136 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3130 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3126 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3110 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3103 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3101 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3098 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3095 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3093 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3088 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3079 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3064 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3063 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3057 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3055 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3046 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 3014 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2985 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2984 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2977 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2967 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2935 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2918 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2917 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2765 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2736 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 4096 -k 2505 --alpha 1.0 --lda 1024 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3796 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4059 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3780 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4050 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3751 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4026 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 4020 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3720 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3584 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3975 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3956 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3939 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3900 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3894 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3860 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3681 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 1024 -n 33708 -k 3640 --alpha 1.0 --lda 1024 --ldb 33708 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3996 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4005 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3969 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3968 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3955 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3990 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3977 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4012 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4030 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3978 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3944 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3976 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3942 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3925 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3910 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3906 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3995 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3840 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3999 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3876 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3870 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3859 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3822 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4032 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3996 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3996 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4005 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4005 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4059 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3796 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3969 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3969 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3968 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3955 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3968 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3955 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3990 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3990 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3977 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3977 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4012 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4012 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3780 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4030 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4030 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3978 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3978 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3944 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3944 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3976 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3942 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3976 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3942 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3751 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3925 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3925 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3910 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3910 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3906 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3906 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4050 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3956 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3927 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3720 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3584 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3995 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3995 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3999 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3840 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3999 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3840 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3876 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4026 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4020 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3975 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3960 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3939 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3900 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3894 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3876 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3861 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3860 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3681 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3640 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3870 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3870 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3996 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4005 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3859 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3859 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3969 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3968 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3955 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3990 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3444 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3444 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3977 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4012 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3505 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3416 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3382 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3505 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3416 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3382 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4030 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4032 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3822 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3535 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3510 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3495 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3479 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3461 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3447 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3424 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3404 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3978 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4032 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3822 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3535 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3510 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3495 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3479 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3461 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3447 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3424 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3404 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3944 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3508 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3503 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3497 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3485 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3483 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3482 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3480 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3467 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3465 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3457 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3456 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3453 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3435 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3422 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3413 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3976 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3942 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4000 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3948 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3508 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3503 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3497 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3485 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3483 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3482 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3480 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3467 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3465 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3457 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3456 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3453 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3435 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3422 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3413 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3925 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3910 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3796 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3528 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3514 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3512 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3511 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3502 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3500 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3490 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3484 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3477 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3475 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3466 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3458 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3450 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3449 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3445 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3428 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3427 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3406 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3796 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3528 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3514 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3512 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3511 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3502 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3500 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3490 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3484 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3477 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3475 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3466 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3458 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3450 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3449 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3445 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3428 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3427 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3406 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3906 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4059 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3780 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3559 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3550 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3547 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3544 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3542 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3541 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3540 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3536 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3534 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3531 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3519 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3517 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3516 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3515 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3498 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3496 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3491 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3488 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3481 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3478 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3476 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3468 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3460 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3459 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3455 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3454 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3451 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3441 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3436 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3431 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3421 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3417 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3411 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3405 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3386 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3384 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3367 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3352 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3337 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3295 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3293 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4059 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3780 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3559 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3550 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3547 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3544 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3542 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3541 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3540 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3536 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3534 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3531 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3519 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3517 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3516 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3515 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3498 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3496 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3491 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3488 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3481 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3478 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3476 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3468 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3460 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3459 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3455 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3454 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3451 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3441 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3436 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3431 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3421 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3417 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3411 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3405 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3386 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3384 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3367 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3352 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3337 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3295 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3293 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3995 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4050 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3751 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3585 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3572 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3566 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3552 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3545 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3543 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3539 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3526 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3518 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3513 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3506 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3504 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3499 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3494 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3492 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3489 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3473 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3463 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3452 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3448 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3446 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3440 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3434 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3433 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3432 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3430 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3426 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3425 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3418 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3410 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3409 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3402 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3401 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3397 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3394 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3385 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3383 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3375 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3372 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3369 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3368 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3365 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3359 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3354 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3353 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3336 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3303 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3296 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3271 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3244 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3236 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3235 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3221 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3209 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4050 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3751 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3585 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3572 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3566 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3552 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3545 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3543 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3539 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3526 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3518 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3513 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3506 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3504 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3499 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3494 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3492 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3489 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3473 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3463 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3452 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3448 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3446 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3440 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3434 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3433 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3432 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3430 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3426 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3425 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3418 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3410 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3409 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3402 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3401 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3397 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3394 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3385 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3383 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3375 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3372 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3369 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3368 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3365 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3359 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3354 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3353 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3336 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3303 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3296 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3271 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3244 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3236 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3235 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3221 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3209 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3999 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3840 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4026 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 4020 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3720 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3584 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3579 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3564 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3563 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3562 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3558 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3557 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3555 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3554 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3548 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3546 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3533 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3532 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3527 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3525 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3524 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3523 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3520 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3501 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3487 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3486 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3470 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3469 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3464 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3462 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3443 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3442 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3437 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3419 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3414 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3412 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3408 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3399 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3398 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3393 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3391 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3389 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3388 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3387 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3380 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3379 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3376 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3366 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3364 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3361 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3360 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3351 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3345 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3344 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3340 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3320 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3318 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3312 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3308 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3304 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3302 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3301 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3291 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3290 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3280 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3276 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3270 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3263 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3259 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3257 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3256 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3247 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3233 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3226 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3224 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3215 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3213 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3205 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3176 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3168 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3162 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3137 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3121 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3072 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2499 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3876 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4026 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 4020 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3720 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3584 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3579 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3564 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3563 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3562 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3558 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3557 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3555 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3554 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3548 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3546 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3533 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3532 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3527 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3525 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3524 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3523 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3520 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3501 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3487 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3486 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3470 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3469 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3464 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3462 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3443 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3442 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3437 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3419 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3414 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3412 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3408 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3399 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3398 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3393 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3391 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3389 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3388 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3387 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3380 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3379 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3376 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3366 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3364 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3361 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3360 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3351 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3345 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3344 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3340 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3320 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3318 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3312 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3308 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3304 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3302 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3301 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3291 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3290 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3280 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3276 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3270 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3263 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3259 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3257 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3256 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3247 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3233 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3226 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3224 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3215 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3213 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3205 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3176 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3168 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3162 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3137 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3121 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3072 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2499 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3870 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3859 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4032 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3822 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3975 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3956 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3939 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3900 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3894 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3860 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3681 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3640 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3616 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3594 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3593 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3582 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3581 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3574 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3573 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3565 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3561 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3560 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3549 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3538 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3530 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3529 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3522 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3509 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3493 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3474 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3472 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3471 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3439 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3438 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3423 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3415 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3403 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3400 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3396 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3395 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3392 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3390 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3381 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3378 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3377 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3374 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3371 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3363 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3362 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3358 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3357 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3356 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3355 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3350 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3349 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3348 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3346 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3343 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3342 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3341 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3339 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3335 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3334 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3332 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3328 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3325 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3322 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3321 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3319 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3315 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3314 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3311 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3306 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3300 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3299 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3298 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3297 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3294 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3292 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3289 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3288 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3287 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3286 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3282 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3277 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3273 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3272 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3267 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3266 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3265 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3262 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3248 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3245 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3232 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3231 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3230 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3222 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3216 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3214 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3211 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3207 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3191 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3190 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3189 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3186 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3184 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3183 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3182 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3181 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3180 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3169 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3166 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3165 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3163 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3154 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3147 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3145 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3144 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3143 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3141 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3140 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3139 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3138 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3136 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3130 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3126 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3110 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3103 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3101 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3098 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3095 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3093 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3088 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3079 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3064 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3063 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3057 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3055 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3046 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 3014 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2985 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2984 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2977 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2967 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2935 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2918 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2917 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2765 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2736 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 4096 -n 2505 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 4096 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3975 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3956 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3939 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3900 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3894 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3860 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3681 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3640 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3616 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3594 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3593 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3582 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3581 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3574 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3573 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3565 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3561 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3560 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3549 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3538 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3530 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3529 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3522 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3509 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3493 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3474 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3472 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3471 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3439 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3438 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3423 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3415 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3403 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3400 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3396 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3395 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3392 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3390 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3381 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3378 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3377 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3374 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3371 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3363 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3362 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3358 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3357 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3356 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3355 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3350 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3349 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3348 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3346 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3343 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3342 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3341 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3339 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3335 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3334 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3332 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3328 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3325 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3322 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3321 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3319 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3315 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3314 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3311 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3306 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3300 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3299 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3298 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3297 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3294 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3292 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3289 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3288 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3287 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3286 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3282 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3277 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3273 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3272 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3267 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3266 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3265 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3262 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3248 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3245 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3232 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3231 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3230 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3222 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3216 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3214 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3211 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3207 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3191 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3190 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3189 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3186 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3184 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3183 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3182 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3181 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3180 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3169 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3166 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3165 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3163 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3154 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3147 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3145 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3144 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3143 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3141 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3140 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3139 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3138 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3136 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3130 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3126 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3110 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3103 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3101 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3098 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3095 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3093 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3088 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3079 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3064 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3063 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3057 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3055 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3046 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 3014 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2985 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2984 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2977 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2967 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2935 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2918 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2917 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2765 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2736 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 1024 -n 2505 -k 4096 --alpha 1.0 --lda 4096 --ldb 4096 --beta 0.0 --ldc 1024 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3796 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4059 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3780 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4050 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3751 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4026 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4020 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3720 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3584 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3975 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3956 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3939 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3900 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3894 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3860 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3681 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3640 -k 1024 --alpha 1.0 --lda 1024 --ldb 1024 --beta 0.0 --ldc 33708 -i 5
