#!/bin/bash

./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 40 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 40 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 1024 -n 1024 -k 96 --alpha 1.0 --lda 1024 --stride_a 98304 --ldb 96 --stride_b 98304 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 96 -n 1024 -k 1024 --alpha 1.0 --lda 96 --stride_a 98304 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 96 --stride_c 98304 --ldd 96 --stride_d 98304 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 1024 -n 1024 -k 96 --alpha 1.0 --lda 1024 --stride_a 98304 --ldb 96 --stride_b 98304 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 96 -n 1024 -k 1024 --alpha 1.0 --lda 96 --stride_a 98304 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 96 --stride_c 98304 --ldd 96 --stride_d 98304 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 1024 -n 1024 -k 64 --alpha 1.0 --lda 1024 --stride_a 65536 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 1024 -n 1024 -k 64 --alpha 1.0 --lda 1024 --stride_a 65536 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 32 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 32 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 1024 -n 1024 -k 64 --alpha 1.0 --lda 1024 --stride_a 65536 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB N -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 64 -i 10

./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 512 -n 64 -k 512 --alpha 1.0 --lda 512 --stride_a 262144 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 32768 --ldd 512 --stride_d 32768 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 512 -n 64 -k 512 --alpha 1.0 --lda 512 --stride_a 262144 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 32768 --ldd 512 --stride_d 32768 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 512 -n 64 -k 512 --alpha 1.0 --lda 512 --stride_a 262144 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 32768 --ldd 512 --stride_d 32768 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 512 -n 64 -k 512 --alpha 1.0 --lda 512 --stride_a 262144 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 32768 --ldd 512 --stride_d 32768 --batch_count 40 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 512 -k 512 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 40 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 1024 -n 96 -k 1024 --alpha 1.0 --lda 1024 --stride_a 1048576 --ldb 96 --stride_b 98304 --beta 0.0 --ldc 1024 --stride_c 98304 --ldd 1024 --stride_d 98304 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 96 -n 1024 -k 1024 --alpha 1.0 --lda 96 --stride_a 98304 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 96 --stride_c 98304 --ldd 96 --stride_d 98304 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 1024 -n 96 -k 1024 --alpha 1.0 --lda 1024 --stride_a 1048576 --ldb 96 --stride_b 98304 --beta 0.0 --ldc 1024 --stride_c 98304 --ldd 1024 --stride_d 98304 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 96 -n 1024 -k 1024 --alpha 1.0 --lda 96 --stride_a 98304 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 96 --stride_c 98304 --ldd 96 --stride_d 98304 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 1024 -n 64 -k 1024 --alpha 1.0 --lda 1024 --stride_a 1048576 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 65536 --ldd 1024 --stride_d 65536 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 1024 -n 64 -k 1024 --alpha 1.0 --lda 1024 --stride_a 1048576 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 65536 --ldd 1024 --stride_d 65536 --batch_count 32 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 32 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 1024 -n 64 -k 1024 --alpha 1.0 --lda 1024 --stride_a 1048576 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 65536 --ldd 1024 --stride_d 65536 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA N --transposeB T -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 64 -i 10

./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 512 -n 512 -k 64 --alpha 1.0 --lda 64 --stride_a 32768 --ldb 64 --stride_b 32768 --beta 0.0 --ldc 512 --stride_c 262144 --ldd 512 --stride_d 262144 --batch_count 40 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 512 -k 512 --alpha 1.0 --lda 512 --stride_a 32768 --ldb 512 --stride_b 262144 --beta 0.0 --ldc 64 --stride_c 32768 --ldd 64 --stride_d 32768 --batch_count 40 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 1024 -n 1024 -k 96 --alpha 1.0 --lda 96 --stride_a 98304 --ldb 96 --stride_b 98304 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 96 -n 1024 -k 1024 --alpha 1.0 --lda 1024 --stride_a 98304 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 96 --stride_c 98304 --ldd 96 --stride_d 98304 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 1024 -n 1024 -k 96 --alpha 1.0 --lda 96 --stride_a 98304 --ldb 96 --stride_b 98304 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 96 -n 1024 -k 1024 --alpha 1.0 --lda 1024 --stride_a 98304 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 96 --stride_c 98304 --ldd 96 --stride_d 98304 --batch_count 128 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 1024 -n 1024 -k 64 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 1024 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 256 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 1024 -n 1024 -k 64 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 32 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 1024 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 32 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 1024 -n 1024 -k 64 --alpha 1.0 --lda 64 --stride_a 65536 --ldb 64 --stride_b 65536 --beta 0.0 --ldc 1024 --stride_c 1048576 --ldd 1024 --stride_d 1048576 --batch_count 64 -i 10
./rocblas-bench -f gemm_strided_batched -r h --transposeA T --transposeB N -m 64 -n 1024 -k 1024 --alpha 1.0 --lda 1024 --stride_a 65536 --ldb 1024 --stride_b 1048576 --beta 0.0 --ldc 64 --stride_c 65536 --ldd 64 --stride_d 65536 --batch_count 64 -i 10
