#!/bin/bash

./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1139 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1184 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1186 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1232 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1279 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1290 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1327 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1331 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1341 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1350 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1359 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1391 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1424 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1458 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1462 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1467 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1472 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1520 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1596 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1599 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 160 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1615 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1680 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1709 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 174 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 184 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 189 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1902 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 1917 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 198 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 207 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2076 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 208 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2195 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2205 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2418 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 245 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 246 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2496 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 264 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2790 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 2864 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3092 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3113 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3137 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3165 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3166 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3194 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3219 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3222 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3234 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3237 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3242 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3246 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3249 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3251 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3257 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3262 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3268 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3282 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3286 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3287 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3293 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3297 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3307 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3314 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3315 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3319 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3322 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3323 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3324 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3325 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3327 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3329 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3332 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3336 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3339 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3342 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3344 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3358 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3360 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3364 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3365 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3369 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3370 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3371 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3374 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3376 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3377 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3378 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3381 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3382 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3383 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3384 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3385 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3386 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3388 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3390 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3391 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3396 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3399 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3402 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3410 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3412 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3414 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3415 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3418 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3420 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3422 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3425 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3426 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3427 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3428 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3430 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3431 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3432 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3433 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3438 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3439 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3440 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3443 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3445 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3447 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3448 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3450 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3451 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3452 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3453 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3455 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3456 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3457 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3458 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3459 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3460 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3461 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3462 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3466 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3467 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3468 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3470 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3471 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3472 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3475 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3476 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3477 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3478 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3479 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3480 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3481 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3483 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3484 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3487 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3489 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3490 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3491 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3493 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3494 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3495 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3497 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3498 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3499 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3501 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3503 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3505 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3507 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3508 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3509 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3510 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3511 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3513 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3514 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3515 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3517 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3518 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3519 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3520 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3523 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3528 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3529 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3530 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3531 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3532 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3533 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3534 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3538 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3539 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3540 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3541 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3547 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3548 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3552 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3564 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3575 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3598 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3599 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3608 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3776 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3780 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3796 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3822 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3835 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3840 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3859 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3864 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3870 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3876 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3906 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3910 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3925 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3942 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3944 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3955 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3968 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3969 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3976 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3977 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3978 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3990 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3995 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3996 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 3999 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 4005 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 401 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 4012 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 4020 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 4026 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 4030 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 4032 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 439 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 443 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 446 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 465 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 468 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 493 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 495 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 511 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 512 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 540 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 550 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 560 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 600 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 644 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 668 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 714 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 720 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 722 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 781 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 848 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 872 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 936 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 2048 -n 980 -k 512 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1139 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1184 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1186 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1232 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1232 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1279 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1290 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1290 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1327 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1331 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1341 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1350 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1350 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1359 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1391 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1424 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1424 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1458 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1458 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1462 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1462 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1467 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1472 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1520 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1520 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1596 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1596 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1599 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1599 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 160 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1615 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1615 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1680 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1680 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1709 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 174 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 182 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 184 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 184 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 189 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 189 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1890 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1902 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1917 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 1917 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 198 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 206 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 207 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2076 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 208 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 208 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2195 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2205 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2205 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 224 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2387 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2418 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2418 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 245 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 246 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 246 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2496 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2496 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 264 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 264 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2790 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 2864 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3092 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3113 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3137 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3165 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3166 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3194 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3219 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3222 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3234 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3237 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3242 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3246 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3249 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3251 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3257 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3262 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3268 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3282 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3286 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3287 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3293 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3297 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3307 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3314 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3315 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3319 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3322 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3323 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3324 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3325 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3327 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3329 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3332 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3336 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3339 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3342 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3344 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3358 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3360 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3364 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3365 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3369 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3370 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3371 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3374 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3376 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3377 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3378 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3381 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3382 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3383 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3384 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3385 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3386 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3388 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3390 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3391 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3396 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3399 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3402 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3410 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3412 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3414 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3415 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3418 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3420 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3422 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3425 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3426 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3427 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3428 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3430 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3431 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3432 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3433 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3438 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3439 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3440 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3443 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3445 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3447 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3448 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3450 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3451 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3452 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3453 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3455 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3456 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3457 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3458 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3459 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3460 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3461 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3462 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3466 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3467 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3468 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3470 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3471 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3472 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3475 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3476 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3477 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3478 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3479 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3480 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3481 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3483 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3484 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3487 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3489 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3490 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3491 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3493 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3494 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3495 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3497 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3498 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3499 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3501 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3503 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3505 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3507 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3508 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3509 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3510 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3511 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3513 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3514 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3515 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3517 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3518 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3519 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3520 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3523 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3528 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3529 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3530 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3531 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3532 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3533 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3534 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3538 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3539 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3540 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3541 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3547 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3548 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3552 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3564 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3575 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3598 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3599 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3608 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3776 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3776 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3780 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3780 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3780 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3796 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3796 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3796 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3822 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3822 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3822 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3835 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3835 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3840 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3840 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3840 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3859 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3859 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3859 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3864 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3864 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3870 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3870 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3870 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3876 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3876 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3876 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3906 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3906 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3906 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3910 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3910 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3910 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3925 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3925 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3925 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3927 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3942 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3942 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3942 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3944 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3944 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3944 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3955 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3955 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3955 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3968 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3968 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3968 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3969 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3969 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3969 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3976 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3976 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3976 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3977 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3977 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3977 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3978 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3978 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3978 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3990 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3990 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3990 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3995 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3995 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3995 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3996 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3996 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3996 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3999 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3999 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 3999 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4005 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4005 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4005 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 401 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4012 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4012 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4012 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4020 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4020 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4020 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4026 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4026 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4026 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4030 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4030 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4030 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4032 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4032 -k 33708 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4032 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4050 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 4059 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 439 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 443 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 446 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 455 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 465 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 465 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 468 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 468 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 476 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 493 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 493 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 495 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 511 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 512 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 540 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 540 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 550 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 550 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 560 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 560 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 600 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 644 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 644 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 668 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 714 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 714 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 720 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 720 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 722 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 781 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 781 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 848 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 872 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 936 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 936 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 980 -k 2048 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 980 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 10 -k 10 --alpha 1.0 --lda 64 --stride_a 640 --ldb 10 --stride_b 100 --beta 0.0 --ldc 64 --stride_c 640 --batch 448
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 312
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 103 -k 103 --alpha 1.0 --lda 64 --stride_a 6592 --ldb 103 --stride_b 10609 --beta 0.0 --ldc 64 --stride_c 6592 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 104 -k 103 --alpha 1.0 --lda 64 --stride_a 6592 --ldb 103 --stride_b 10712 --beta 0.0 --ldc 64 --stride_c 6656 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 104 -k 104 --alpha 1.0 --lda 64 --stride_a 6656 --ldb 104 --stride_b 10816 --beta 0.0 --ldc 64 --stride_c 6656 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 11 -k 11 --alpha 1.0 --lda 64 --stride_a 704 --ldb 11 --stride_b 121 --beta 0.0 --ldc 64 --stride_c 704 --batch 568
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 288
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 119 -k 119 --alpha 1.0 --lda 64 --stride_a 7616 --ldb 119 --stride_b 14161 --beta 0.0 --ldc 64 --stride_c 7616 --batch 32
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 2520
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 480
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 122 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 122 --stride_b 14884 --beta 0.0 --ldc 64 --stride_c 7808 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 122 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15006 --beta 0.0 --ldc 64 --stride_c 7808 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 123 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 13776 --beta 0.0 --ldc 64 --stride_c 7872 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 2336
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 576
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 134 --stride_b 17956 --beta 0.0 --ldc 64 --stride_c 8576 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18090 --beta 0.0 --ldc 64 --stride_c 8576 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 119 --alpha 1.0 --lda 64 --stride_a 7616 --ldb 119 --stride_b 16065 --beta 0.0 --ldc 64 --stride_c 8640 --batch 32
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 32
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 2184
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 704
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 2048
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 688
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 1920
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 712
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 1816
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 688
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 1720
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 648
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 1632
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 680
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 1472
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 1488
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 1360
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 64
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 1256
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 176
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 26 -k 26 --alpha 1.0 --lda 64 --stride_a 1664 --ldb 26 --stride_b 676 --beta 0.0 --ldc 64 --stride_c 1664 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 27 -k 26 --alpha 1.0 --lda 64 --stride_a 1664 --ldb 26 --stride_b 702 --beta 0.0 --ldc 64 --stride_c 1728 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 1168
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 1088
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 136
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 624
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 992
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 384
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 904
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 320
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 840
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 312
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 776
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 392
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 712
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 160
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 648
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 200
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 592
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 512
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 544
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 64 -k 64 --alpha 1.0 --lda 64 --stride_a 4096 --ldb 64 --stride_b 4096 --beta 0.0 --ldc 64 --stride_c 4096 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 65 -k 64 --alpha 1.0 --lda 64 --stride_a 4096 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 64 --stride_c 4160 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 472
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 7 -k 7 --alpha 1.0 --lda 64 --stride_a 448 --ldb 7 --stride_b 49 --beta 0.0 --ldc 64 --stride_c 448 --batch 736
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 70 -k 70 --alpha 1.0 --lda 64 --stride_a 4480 --ldb 70 --stride_b 4900 --beta 0.0 --ldc 64 --stride_c 4480 --batch 216
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 71 -k 70 --alpha 1.0 --lda 64 --stride_a 4480 --ldb 70 --stride_b 4970 --beta 0.0 --ldc 64 --stride_c 4544 --batch 216
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 216
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 448
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 248
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4992 --batch 248
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4992 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 248
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 8 -k 8 --alpha 1.0 --lda 64 --stride_a 512 --ldb 8 --stride_b 64 --beta 0.0 --ldc 64 --stride_c 512 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 80 -k 80 --alpha 1.0 --lda 64 --stride_a 5120 --ldb 80 --stride_b 6400 --beta 0.0 --ldc 64 --stride_c 5120 --batch 152
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 84 -k 80 --alpha 1.0 --lda 64 --stride_a 5120 --ldb 80 --stride_b 6720 --beta 0.0 --ldc 64 --stride_c 5376 --batch 152
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 84 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7056 --beta 0.0 --ldc 64 --stride_c 5376 --batch 152
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 85 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 85 --stride_b 7225 --beta 0.0 --ldc 64 --stride_c 5440 --batch 376
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 9 -k 9 --alpha 1.0 --lda 64 --stride_a 576 --ldb 9 --stride_b 81 --beta 0.0 --ldc 64 --stride_c 576 --batch 416
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 91 -k 91 --alpha 1.0 --lda 64 --stride_a 5824 --ldb 91 --stride_b 8281 --beta 0.0 --ldc 64 --stride_c 5824 --batch 40
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 91 --alpha 1.0 --lda 64 --stride_a 5824 --ldb 91 --stride_b 8463 --beta 0.0 --ldc 64 --stride_c 5952 --batch 40
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 344
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 40
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 2790 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 2864 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3092 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3113 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3137 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3165 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3166 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3194 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3219 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3222 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3234 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3237 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3242 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3246 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3249 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3251 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3257 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3262 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3268 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3282 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3286 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3287 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3293 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3297 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3307 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3314 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3315 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3319 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3322 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3323 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3324 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3325 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3327 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3329 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3332 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3336 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3339 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3342 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3344 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3358 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3360 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3364 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3365 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3369 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3371 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3374 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3376 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3377 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3378 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3381 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3382 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3383 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3384 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3385 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3386 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3388 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3390 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3391 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3396 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3399 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3402 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3410 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3412 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3414 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3415 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3418 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3420 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3422 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3425 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3426 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3427 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3428 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3430 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3431 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3432 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3438 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3439 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3440 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3443 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3445 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3447 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3448 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3450 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3451 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3452 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3453 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3455 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3456 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3457 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3458 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3459 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3460 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3461 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3462 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3466 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3467 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3468 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3470 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3471 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3472 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3475 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3476 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3477 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3478 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3479 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3480 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3481 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3483 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3484 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3487 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3489 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3490 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3491 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3493 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3494 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3495 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3497 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3498 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3499 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3501 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3503 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3507 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3508 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3509 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3511 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3514 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3515 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3517 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3518 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3519 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3520 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3523 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3528 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3529 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3530 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3532 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3533 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3534 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3538 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3539 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3541 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3547 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3548 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3552 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3564 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3575 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3598 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3599 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3608 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3780 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3796 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3822 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3840 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3859 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3870 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3876 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3906 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3910 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3925 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3942 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3944 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3955 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3968 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3969 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3976 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3977 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3978 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3990 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3995 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3996 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 3999 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 4005 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 4012 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 4020 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 4026 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 4030 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 2048 -n 512 -k 4032 --alpha 1.0 --lda 2048 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 2790 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 2864 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3092 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3113 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3137 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3165 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3166 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3194 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3219 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3222 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3234 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3237 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3242 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3246 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3249 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3251 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3257 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3262 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3268 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3282 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3286 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3287 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3293 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3297 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3307 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3314 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3315 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3319 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3322 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3323 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3324 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3325 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3327 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3329 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3332 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3336 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3339 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3342 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3344 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3358 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3360 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3364 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3365 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3369 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3371 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3374 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3376 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3377 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3378 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3381 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3382 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3383 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3384 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3385 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3386 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3388 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3390 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3391 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3396 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3399 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3402 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3410 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3412 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3414 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3415 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3418 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3420 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3422 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3425 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3426 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3427 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3428 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3430 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3431 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3432 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3438 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3439 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3440 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3443 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3445 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3447 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3448 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3450 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3451 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3452 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3453 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3455 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3456 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3457 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3458 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3459 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3460 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3461 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3462 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3466 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3467 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3468 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3470 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3471 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3472 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3475 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3476 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3477 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3478 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3479 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3480 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3481 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3483 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3484 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3487 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3489 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3490 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3491 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3493 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3494 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3495 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3497 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3498 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3499 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3501 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3503 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3507 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3508 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3509 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3511 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3514 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3515 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3517 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3518 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3519 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3520 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3523 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3528 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3529 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3530 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3532 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3533 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3534 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3538 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3539 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3541 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3547 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3548 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3552 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3564 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3575 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3598 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3599 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3608 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3780 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3796 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3822 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3840 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3859 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3870 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3876 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3906 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3910 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3925 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3942 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3944 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3955 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3968 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3969 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3976 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3977 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3978 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3990 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3995 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3996 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 3999 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 4005 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 4012 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 4020 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 4026 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 4030 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 2048 -k 4032 --alpha 1.0 --lda 512 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3780 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3796 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3822 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3840 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3859 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3870 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3876 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3906 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3910 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3925 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3942 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3944 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3955 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3968 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3969 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3976 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3977 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3978 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3990 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3995 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3996 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 3999 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 4005 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 4012 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 4020 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 4026 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 4030 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 33708 -k 4032 --alpha 1.0 --lda 512 --ldb 33708 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3780 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3796 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3822 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3840 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3859 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3870 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3876 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3906 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3910 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3925 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3927 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3942 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3944 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3955 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3968 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3969 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3976 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3977 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3978 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3990 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3995 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3996 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 3999 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4005 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4012 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4020 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4026 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4030 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4032 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4050 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 512 -k 4059 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 312
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 288
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 2520
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 122 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 122 --stride_b 14884 --beta 0.0 --ldc 64 --stride_c 7808 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 123 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 123 --stride_b 15006 --beta 0.0 --ldc 64 --stride_c 7872 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 2336
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 134 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 134 --stride_b 17956 --beta 0.0 --ldc 64 --stride_c 8576 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 135 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 135 --stride_b 18090 --beta 0.0 --ldc 64 --stride_c 8640 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 2184
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 2048
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 1920
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 1816
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 1720
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 1632
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 1488
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 1360
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 1256
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 1168
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 1088
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 992
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 904
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 840
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 776
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 712
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 648
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 592
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 544
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 64 -k 64 --alpha 1.0 --lda 64 --stride_a 4096 --ldb 64 --stride_b 4096 --beta 0.0 --ldc 64 --stride_c 4096 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 64 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 64 --stride_c 4096 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 448
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 77 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4928 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 85 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 85 --stride_b 7225 --beta 0.0 --ldc 64 --stride_c 5440 --batch 376
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 344
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 2790 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 2864 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3092 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3113 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3137 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3165 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3166 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3194 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3219 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3222 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3234 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3237 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3242 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3246 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3249 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3251 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3257 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3262 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3268 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3282 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3286 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3287 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3293 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3297 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3307 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3314 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3315 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3319 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3322 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3323 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3324 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3325 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3327 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3329 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3332 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3336 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3339 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3342 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3344 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3358 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3360 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3364 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3365 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3369 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3371 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3374 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3376 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3377 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3378 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3381 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3382 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3383 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3384 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3385 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3386 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3388 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3390 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3391 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3396 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3399 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3402 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3410 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3412 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3414 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3415 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3418 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3420 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3422 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3425 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3426 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3427 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3428 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3430 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3431 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3432 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3438 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3439 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3440 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3443 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3445 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3447 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3448 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3450 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3451 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3452 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3453 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3455 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3456 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3457 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3458 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3459 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3460 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3461 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3462 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3466 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3467 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3468 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3470 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3471 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3472 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3475 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3476 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3477 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3478 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3479 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3480 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3481 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3483 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3484 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3487 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3489 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3490 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3491 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3493 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3494 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3495 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3497 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3498 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3499 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3501 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3503 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3507 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3508 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3509 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3511 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3514 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3515 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3517 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3518 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3519 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3520 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3523 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3528 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3529 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3530 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3532 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3533 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3534 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3538 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3539 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3541 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3547 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3548 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3552 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3564 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3575 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3598 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3599 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3608 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3780 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3796 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3822 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3840 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3859 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3870 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3876 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3906 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3910 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3925 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3942 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3944 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3955 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3968 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3969 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3976 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3977 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3978 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3990 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3995 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3996 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 3999 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 4005 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 4012 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 4020 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 4026 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 4030 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 2048 -n 4032 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 2048
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1232 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1290 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1350 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1424 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1458 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1462 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1520 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1596 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1599 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1615 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1680 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 184 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 189 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 1917 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 208 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 2205 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 2418 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 246 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 2496 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 264 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3776 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3780 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3796 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3822 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3835 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3840 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3859 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3864 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3870 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3876 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3906 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3910 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3925 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3942 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3944 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3955 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3968 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3969 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3976 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3977 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3978 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3990 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3995 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3996 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 3999 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4005 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4012 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4020 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4026 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4030 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 4032 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 465 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 468 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 493 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 540 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 550 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 560 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 644 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 714 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 720 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 781 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 936 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 33708 -n 980 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 33708
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 2790 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 2864 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3092 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3113 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3137 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3165 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3166 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3194 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3219 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3222 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3234 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3237 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3242 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3246 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3249 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3251 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3257 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3262 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3268 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3282 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3286 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3287 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3293 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3297 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3307 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3314 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3315 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3319 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3322 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3323 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3324 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3325 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3327 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3329 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3332 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3336 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3339 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3342 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3344 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3358 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3360 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3364 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3365 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3369 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3371 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3374 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3376 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3377 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3378 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3381 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3382 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3383 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3384 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3385 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3386 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3388 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3390 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3391 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3396 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3399 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3402 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3410 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3412 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3414 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3415 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3418 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3420 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3422 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3425 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3426 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3427 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3428 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3430 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3431 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3432 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3438 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3439 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3440 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3443 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3445 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3447 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3448 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3450 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3451 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3452 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3453 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3455 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3456 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3457 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3458 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3459 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3460 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3461 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3462 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3466 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3467 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3468 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3470 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3471 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3472 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3475 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3476 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3477 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3478 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3479 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3480 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3481 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3483 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3484 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3487 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3489 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3490 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3491 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3493 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3494 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3495 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3497 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3498 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3499 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3501 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3503 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3507 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3508 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3509 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3511 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3514 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3515 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3517 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3518 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3519 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3520 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3523 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3528 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3529 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3530 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3532 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3533 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3534 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3538 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3539 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3541 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3547 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3548 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3552 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3564 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3575 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3598 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3599 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3608 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3780 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3780 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3796 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3796 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3822 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3822 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3840 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3840 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3859 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3859 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3870 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3870 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3876 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3876 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3906 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3906 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3910 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3910 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3925 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3925 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3927 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3942 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3942 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3944 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3944 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3955 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3955 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3968 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3968 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3969 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3969 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3976 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3976 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3977 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3977 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3978 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3978 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3990 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3990 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3995 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3995 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3996 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3996 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3999 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 3999 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4005 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4005 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4012 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4012 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4020 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4020 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4026 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4026 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4030 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4030 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4032 -k 2048 --alpha 1.0 --lda 2048 --ldb 2048 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4032 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4050 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 4059 -k 512 --alpha 1.0 --lda 512 --ldb 512 --beta 0.0 --ldc 512
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 10 -n 10 -k 64 --alpha 1.0 --lda 64 --stride_a 640 --ldb 64 --stride_b 640 --beta 0.0 --ldc 10 --stride_c 100 --batch 448
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 102 --stride_c 10404 --batch 312
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 102 --stride_c 10404 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 103 -n 103 -k 64 --alpha 1.0 --lda 64 --stride_a 6592 --ldb 64 --stride_b 6592 --beta 0.0 --ldc 103 --stride_c 10609 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 103 -n 104 -k 64 --alpha 1.0 --lda 64 --stride_a 6592 --ldb 64 --stride_b 6656 --beta 0.0 --ldc 103 --stride_c 10712 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 104 -n 104 -k 64 --alpha 1.0 --lda 64 --stride_a 6656 --ldb 64 --stride_b 6656 --beta 0.0 --ldc 104 --stride_c 10816 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 11 -n 11 -k 64 --alpha 1.0 --lda 64 --stride_a 704 --ldb 64 --stride_b 704 --beta 0.0 --ldc 11 --stride_c 121 --batch 568
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 112 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7168 --beta 0.0 --ldc 112 --stride_c 12544 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 112 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7168 --beta 0.0 --ldc 112 --stride_c 12544 --batch 288
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 123 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7872 --beta 0.0 --ldc 112 --stride_c 13776 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 119 -n 119 -k 64 --alpha 1.0 --lda 64 --stride_a 7616 --ldb 64 --stride_b 7616 --beta 0.0 --ldc 119 --stride_c 14161 --batch 32
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 119 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 7616 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 119 --stride_c 16065 --batch 32
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 12 -n 12 -k 64 --alpha 1.0 --lda 64 --stride_a 768 --ldb 64 --stride_b 768 --beta 0.0 --ldc 12 --stride_c 144 --batch 2520
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 12 -n 12 -k 64 --alpha 1.0 --lda 64 --stride_a 768 --ldb 64 --stride_b 768 --beta 0.0 --ldc 12 --stride_c 144 --batch 480
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 122 -n 122 -k 64 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 64 --stride_b 7808 --beta 0.0 --ldc 122 --stride_c 14884 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 122 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7808 --beta 0.0 --ldc 123 --stride_c 15006 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 123 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7872 --beta 0.0 --ldc 123 --stride_c 15129 --batch 16
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 123 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7872 --beta 0.0 --ldc 123 --stride_c 15129 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 13 -n 13 -k 64 --alpha 1.0 --lda 64 --stride_a 832 --ldb 64 --stride_b 832 --beta 0.0 --ldc 13 --stride_c 169 --batch 2336
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 13 -n 13 -k 64 --alpha 1.0 --lda 64 --stride_a 832 --ldb 64 --stride_b 832 --beta 0.0 --ldc 13 --stride_c 169 --batch 576
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 134 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 134 --stride_c 17956 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 135 --stride_c 18090 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 135 --stride_c 18225 --batch 240
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 135 --stride_c 18225 --batch 32
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 14 -n 14 -k 64 --alpha 1.0 --lda 64 --stride_a 896 --ldb 64 --stride_b 896 --beta 0.0 --ldc 14 --stride_c 196 --batch 2184
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 14 -n 14 -k 64 --alpha 1.0 --lda 64 --stride_a 896 --ldb 64 --stride_b 896 --beta 0.0 --ldc 14 --stride_c 196 --batch 704
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 15 -n 15 -k 64 --alpha 1.0 --lda 64 --stride_a 960 --ldb 64 --stride_b 960 --beta 0.0 --ldc 15 --stride_c 225 --batch 2048
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 15 -n 15 -k 64 --alpha 1.0 --lda 64 --stride_a 960 --ldb 64 --stride_b 960 --beta 0.0 --ldc 15 --stride_c 225 --batch 688
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 16 -n 16 -k 64 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 64 --stride_b 1024 --beta 0.0 --ldc 16 --stride_c 256 --batch 1920
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 16 -n 16 -k 64 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 64 --stride_b 1024 --beta 0.0 --ldc 16 --stride_c 256 --batch 712
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 17 -n 17 -k 64 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 64 --stride_b 1088 --beta 0.0 --ldc 17 --stride_c 289 --batch 1816
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 17 -n 17 -k 64 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 64 --stride_b 1088 --beta 0.0 --ldc 17 --stride_c 289 --batch 688
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 18 -n 18 -k 64 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 64 --stride_b 1152 --beta 0.0 --ldc 18 --stride_c 324 --batch 1720
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 18 -n 18 -k 64 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 64 --stride_b 1152 --beta 0.0 --ldc 18 --stride_c 324 --batch 648
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 19 -n 19 -k 64 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 64 --stride_b 1216 --beta 0.0 --ldc 19 --stride_c 361 --batch 1632
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 19 -n 19 -k 64 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 64 --stride_b 1216 --beta 0.0 --ldc 19 --stride_c 361 --batch 680
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 21 -n 21 -k 64 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 64 --stride_b 1344 --beta 0.0 --ldc 21 --stride_c 441 --batch 1472
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 21 -n 21 -k 64 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 64 --stride_b 1344 --beta 0.0 --ldc 21 --stride_c 441 --batch 1488
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 23 -n 23 -k 64 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 64 --stride_b 1472 --beta 0.0 --ldc 23 --stride_c 529 --batch 1360
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 23 -n 23 -k 64 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 64 --stride_b 1472 --beta 0.0 --ldc 23 --stride_c 529 --batch 64
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 25 -n 25 -k 64 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 64 --stride_b 1600 --beta 0.0 --ldc 25 --stride_c 625 --batch 1256
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 25 -n 25 -k 64 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 64 --stride_b 1600 --beta 0.0 --ldc 25 --stride_c 625 --batch 176
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 26 -n 26 -k 64 --alpha 1.0 --lda 64 --stride_a 1664 --ldb 64 --stride_b 1664 --beta 0.0 --ldc 26 --stride_c 676 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 26 -n 27 -k 64 --alpha 1.0 --lda 64 --stride_a 1664 --ldb 64 --stride_b 1728 --beta 0.0 --ldc 26 --stride_c 702 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 27 -n 27 -k 64 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 64 --stride_b 1728 --beta 0.0 --ldc 27 --stride_c 729 --batch 1168
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 27 -n 27 -k 64 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 64 --stride_b 1728 --beta 0.0 --ldc 27 --stride_c 729 --batch 56
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 29 -n 29 -k 64 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 64 --stride_b 1856 --beta 0.0 --ldc 29 --stride_c 841 --batch 1088
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 29 -n 29 -k 64 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 64 --stride_b 1856 --beta 0.0 --ldc 29 --stride_c 841 --batch 136
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 32 -n 32 -k 64 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 64 --stride_b 2048 --beta 0.0 --ldc 32 --stride_c 1024 --batch 624
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 32 -n 32 -k 64 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 64 --stride_b 2048 --beta 0.0 --ldc 32 --stride_c 1024 --batch 992
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 35 -n 35 -k 64 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 64 --stride_b 2240 --beta 0.0 --ldc 35 --stride_c 1225 --batch 384
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 35 -n 35 -k 64 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 64 --stride_b 2240 --beta 0.0 --ldc 35 --stride_c 1225 --batch 904
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 38 -n 38 -k 64 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 64 --stride_b 2432 --beta 0.0 --ldc 38 --stride_c 1444 --batch 320
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 38 -n 38 -k 64 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 64 --stride_b 2432 --beta 0.0 --ldc 38 --stride_c 1444 --batch 840
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 41 -n 41 -k 64 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 64 --stride_b 2624 --beta 0.0 --ldc 41 --stride_c 1681 --batch 312
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 41 -n 41 -k 64 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 64 --stride_b 2624 --beta 0.0 --ldc 41 --stride_c 1681 --batch 776
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 45 -n 45 -k 64 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 64 --stride_b 2880 --beta 0.0 --ldc 45 --stride_c 2025 --batch 392
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 45 -n 45 -k 64 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 64 --stride_b 2880 --beta 0.0 --ldc 45 --stride_c 2025 --batch 712
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 49 -n 49 -k 64 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 64 --stride_b 3136 --beta 0.0 --ldc 49 --stride_c 2401 --batch 160
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 49 -n 49 -k 64 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 64 --stride_b 3136 --beta 0.0 --ldc 49 --stride_c 2401 --batch 648
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 54 -n 54 -k 64 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 64 --stride_b 3456 --beta 0.0 --ldc 54 --stride_c 2916 --batch 200
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 54 -n 54 -k 64 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 64 --stride_b 3456 --beta 0.0 --ldc 54 --stride_c 2916 --batch 592
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 59 -n 59 -k 64 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 64 --stride_b 3776 --beta 0.0 --ldc 59 --stride_c 3481 --batch 512
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 59 -n 59 -k 64 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 64 --stride_b 3776 --beta 0.0 --ldc 59 --stride_c 3481 --batch 544
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 64 -k 64 --alpha 1.0 --lda 64 --stride_a 4096 --ldb 64 --stride_b 4096 --beta 0.0 --ldc 64 --stride_c 4096 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 64 -n 65 -k 64 --alpha 1.0 --lda 64 --stride_a 4096 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 64 --stride_c 4160 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 65 -n 65 -k 64 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 65 --stride_c 4225 --batch 472
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 65 -n 65 -k 64 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 65 --stride_c 4225 --batch 496
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 7 -n 7 -k 64 --alpha 1.0 --lda 64 --stride_a 448 --ldb 64 --stride_b 448 --beta 0.0 --ldc 7 --stride_c 49 --batch 736
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 70 -n 70 -k 64 --alpha 1.0 --lda 64 --stride_a 4480 --ldb 64 --stride_b 4480 --beta 0.0 --ldc 70 --stride_c 4900 --batch 216
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 70 -n 71 -k 64 --alpha 1.0 --lda 64 --stride_a 4480 --ldb 64 --stride_b 4544 --beta 0.0 --ldc 70 --stride_c 4970 --batch 216
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 71 -n 71 -k 64 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 64 --stride_b 4544 --beta 0.0 --ldc 71 --stride_c 5041 --batch 216
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 71 -n 71 -k 64 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 64 --stride_b 4544 --beta 0.0 --ldc 71 --stride_c 5041 --batch 448
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 77 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4928 --beta 0.0 --ldc 77 --stride_c 5929 --batch 248
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 77 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4928 --beta 0.0 --ldc 77 --stride_c 5929 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 77 --stride_c 6006 --batch 248
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 77 --stride_c 6006 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 78 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 78 --stride_c 6084 --batch 248
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 78 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 78 --stride_c 6084 --batch 408
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 8 -n 8 -k 64 --alpha 1.0 --lda 64 --stride_a 512 --ldb 64 --stride_b 512 --beta 0.0 --ldc 8 --stride_c 64 --batch 264
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 80 -n 80 -k 64 --alpha 1.0 --lda 64 --stride_a 5120 --ldb 64 --stride_b 5120 --beta 0.0 --ldc 80 --stride_c 6400 --batch 152
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 80 -n 84 -k 64 --alpha 1.0 --lda 64 --stride_a 5120 --ldb 64 --stride_b 5376 --beta 0.0 --ldc 80 --stride_c 6720 --batch 152
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 84 -n 84 -k 64 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 64 --stride_b 5376 --beta 0.0 --ldc 84 --stride_c 7056 --batch 152
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 85 -n 85 -k 64 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 64 --stride_b 5440 --beta 0.0 --ldc 85 --stride_c 7225 --batch 376
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 9 -n 9 -k 64 --alpha 1.0 --lda 64 --stride_a 576 --ldb 64 --stride_b 576 --beta 0.0 --ldc 9 --stride_c 81 --batch 416
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 91 -n 91 -k 64 --alpha 1.0 --lda 64 --stride_a 5824 --ldb 64 --stride_b 5824 --beta 0.0 --ldc 91 --stride_c 8281 --batch 40
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 91 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5824 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 91 --stride_c 8463 --batch 40
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 93 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 93 --stride_c 8649 --batch 344
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 93 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 93 --stride_c 8649 --batch 40
