sysbench是一个开源的、基于LuaJIT(LuaJIT 是 Lua 的即时编译器,可将代码直接翻译成机器码,性能比原生 lua 要高) 的、可自定义脚本的多线程基准测试工具,也是目前用得最多的 MySQL 性能压测工具。
基于 sysbench,我们可以对比 MySQL 在不同版本、不同硬件配置、不同参数(操作系统和数据库)下的性能差异。
下面会从 sysbench 的基本用法出发,逐渐延伸到 sysbench 的一些高级玩法,譬如如何阅读自带的测试脚本、如何自定义测试项等。除此之外,使用 sysbench 对 CPU 进行测试,网上很多资料都语焉不详,甚至是错误的,所以这次也会从源码的角度分析 CPU 测试的实现逻辑及 --cpu-max-prime 选项的具体含义。
本文主要包括以下几部分:
- 安装sysbench
- sysbench用法讲解
- 对MySQL进行基准测试的基本步骤
- 如何分析MySQL基准测试结果
- 如何使用sysbench对服务器进行测试
- MySQL常见测试场景及对应的 SQL 语句
- 如何自定义sysbench测试脚本
安装 sysbench
下面是 sysbench 源码包的安装步骤。
# yum -y install make automake libtool pkgconfig libaio-devel openssl-devel mysql-devel<br/># cd /usr/src/<br/># wget https://github.com/akopytov/sysbench/archive/refs/tags/1.0.20.tar.gz<br/># tar xvf 1.0.20.tar.gz<br/># cd sysbench-1.0.20/<br/># ./autogen.sh<br/># ./configure<br/># make -j<br/># make install<br/>
安装完成后,压测脚本默认会安装在 /usr/local/share/sysbench
目录下。
我们看看该目录的内容。
# ls /usr/local/share/sysbench/<br/>bulk_insert.lua oltp_insert.lua oltp_read_write.lua oltp_write_only.lua tests<br/>oltp_common.lua oltp_point_select.lua oltp_update_index.lua select_random_points.lua<br/>oltp_delete.lua oltp_read_only.lua oltp_update_non_index.lua select_random_ranges.lua<br/>
除了oltp_common.lua
是个公共模块,其它每个 lua 脚本都对应一个测试场景。
sysbench 用法讲解
sysbench 命令语法如下:
sysbench [options]... [testname] [command]<br/>
命令中的testname
是测试项名称。sysbench 支持的测试项包括:
-
*.lua:数据库性能基准测试。
-
fileio:磁盘 IO 基准测试。
-
cpu:CPU 性能基准测试。
-
memory:内存访问基准测试。
-
threads:基于线程的调度程序基准测试。
-
mutex:POSIX 互斥量基准测试。
command
是 sysbench 要执行的命令,支持的选项有:prepare
,prewarm
,run
,cleanup
,help
。注意,不是所有的测试项都支持这些选项。
options
是配置项。sysbench 中的配置项主要包括以下两部分:
1. 通用配置项。这部分配置项可通过 sysbench --help
查看。例如,
# sysbench --help<br/>...<br/>General options:<br/> --threads=N number of threads to use [1]<br/> --events=N limit for total number of events [0]<br/> --time=N limit for total execution time in seconds [10]<br/> ...<br/>
2. 测试项相关的配置项。各个测试项支持的配置项可通过 sysbench testname help
查看。例如,
# sysbench memory help<br/>sysbench 1.0.20 (using bundled LuaJIT 2.1.0-beta2)<br/><br/>memory options:<br/> --memory-block-size=SIZE size of memory block for test [1K]<br/> --memory-total-size=SIZE total size of data to transfer [100G]<br/> --memory-scope=STRING memory access scope {global,local} [global]<br/> --memory-hugetlb[=on|off] allocate memory from HugeTLB pool [off]<br/> --memory-oper=STRING type of memory operations {read, write, none} [write]<br/> --memory-access-mode=STRING memory access mode {seq,rnd} [seq]<br/>
对 MySQL 进行基准测试的基本步骤
下面以oltp_read_write
为例,看看使用 sysbench 对 MySQL 进行基准测试的四个标准步骤:
prepare
生成压测数据。默认情况下,sysbench 是通过 INSERT INTO 命令来导入测试数据的。如果是使用 LOAD DATA LOCAL INFILE 命令来导入,sysbench 导数速度能提升30%,具体可参考:使用 LOAD DATA LOCAL INFILE,sysbench 导数速度提升30%
# sysbench oltp_read_write --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=30 prepare<br/>
命令中各个选项的具体含义如下:
- oltp_read_write:测试项,对应的是
/usr/local/share/sysbench/oltp_read_write.lua
。这里也可指定脚本的绝对路径名。 - --mysql-host、--mysql-port、--mysql-user、--mysql-password:分别代表 MySQL 实例的主机名、端口、用户名和密码。
- --mysql-db:库名。不指定则默认为
sbtest
。 - --tables :表的数量,默认为 1。
- --table-size :单表的大小,默认为 10000。
- --threads :并发线程数,默认为 1。注意,导入时,单表只能使用一个线程。
- prepare:执行准备工作。
oltp_read_write 用来压测 OLTP 场景。在 sysbench 1.0 之前, 该场景是通过 oltp.lua 这个脚本来测试的。不过该脚本在 sysbench 1.0 之后就被废弃了,但为了跟之前的版本兼容,该脚本放到了 /usr/local/share/sysbench/tests/include/oltp_legacy/
目录下。
鉴于 oltp_read_write.lua 和 oltp.lua 两者的压测内容完全一致。从 sysbench 1.0 开始,压测 OLTP 场景建议直接使用 oltp_read_write。
prewarm
预热。主要是将磁盘中的数据加载到内存中。
# sysbench oltp_read_write --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=30 prewarm<br/>
除了需要将命令设置为 prewarm
,其它配置与 prepare
中一样。
run
压测。
# sysbench oltp_read_write --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
其中,
-
--time :压测时间。不指定则默认为 10 秒。除了 --time,也可通过 --events 限制需要执行的 event 的数量。
-
--report-interval=10 :每 10 秒输出一次测试结果,默认为 0,不输出。
cleanup
清理数据。
# sysbench oltp_read_write --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 cleanup<br/>
这里只需指定 --tables ,sysbench 会串行执行 DROP TABLE IF EXISTS sbtest
操作。
如何分析 MySQL 基准测试结果
下面我们分析下 oltp_read_write 场景下的压测结果。注:右滑可以看到每个指标的具体含义。
Threads started!<br/><br/>[ 10s ] thds: 64 tps: 5028.08 qps: 100641.26 (r/w/o: 70457.59/20121.51/10062.16) lat (ms,95%): 17.32 err/s: 0.00 reconn/s: 0.00<br/># thds 是并发线程数。tps 是每秒事务数。qps 是每秒操作数,等于 r(读操作)加上 w(写操作)加上 o(其他操作,主要包括 BEGIN 和 COMMIT)。lat 是延迟,(ms,95%) 是 95% 的查询时间小于或等于该值,单位毫秒。err/s 是每秒错误数。reconn/s 是每秒重试的次数。<br/>[ 20s ] thds: 64 tps: 5108.93 qps: 102192.09 (r/w/o: 71533.28/20440.64/10218.17) lat (ms,95%): 17.32 err/s: 0.00 reconn/s: 0.00<br/>[ 30s ] thds: 64 tps: 5126.50 qps: 102505.50 (r/w/o: 71756.30/20496.60/10252.60) lat (ms,95%): 17.32 err/s: 0.00 reconn/s: 0.00<br/>[ 40s ] thds: 64 tps: 5144.50 qps: 102907.20 (r/w/o: 72034.07/20583.72/10289.41) lat (ms,95%): 17.01 err/s: 0.00 reconn/s: 0.00<br/>[ 50s ] thds: 64 tps: 5137.29 qps: 102739.80 (r/w/o: 71916.99/20548.64/10274.17) lat (ms,95%): 17.01 err/s: 0.00 reconn/s: 0.00<br/>[ 60s ] thds: 64 tps: 4995.38 qps: 99896.35 (r/w/o: 69925.98/19979.61/9990.75) lat (ms,95%): 17.95 err/s: 0.00 reconn/s: 0.00<br/>SQL statistics:<br/> queries performed:<br/> read: 4276622 # 读操作的数量<br/> write: 1221892 # 写操作的数量<br/> other: 610946 # 其它操作的数量<br/> total: 6109460 # 总的操作数量,total = read + write + other<br/> transactions: 305473 (5088.63 per sec.) # 总的事务数(每秒事务数)<br/> queries: 6109460 (101772.64 per sec.) # 总的操作数(每秒操作数)<br/> ignored errors: 0 (0.00 per sec.) # 忽略的错误数(每秒忽略的错误数)<br/> reconnects: 0 (0.00 per sec.) # 重试次数(每秒重试的次数)<br/><br/>General statistics:<br/> total time: 60.0301s # 总的执行时间<br/> total number of events: 305473 # 执行的 event 的数量<br/> # 在 oltp_read_write 中,默认参数下,一个 event 其实就是一个事务<br/><br/>Latency (ms):<br/> min: 5.81 # 最小耗时<br/> avg: 12.57 # 平均耗时<br/> max: 228.87 # 最大耗时<br/> 95th percentile: 17.32 # 95% event 的执行耗时<br/> sum: 3840044.28 # 总耗时<br/><br/>Threads fairness:<br/> events (avg/stddev): 4773.0156/30.77 # 平均每个线程执行 event 的数量<br/> # stddev 是标准差,值越小,代表结果越稳定。<br/> execution time (avg/stddev): 60.0007/0.01 # 平均每个线程的执行时间<br/>
输出中,重点关注三个指标:
- 每秒事务数,即我们常说的 TPS。
- 每秒操作数,即我们常说的 QPS。
- 95% event 的执行耗时。
TPS 和 QPS 反映了系统的吞吐量,越大越好。执行耗时代表了事务的执行时长,越小越好。在一定范围内,并发线程数指定得越大,TPS 和 QPS 也会越高。
使用 sysbench 对服务器进行测试
除了数据库基准测试,sysbench 还能对服务器的性能进行测试。服务器资源一般包括四大类:CPU、内存、IO和网络。sysbench 可对CPU、内存和磁盘IO进行测试。下面我们具体来看看。
cpu
CPU 性能测试。支持的选项只有一个,即--cpu-max-prime
。
CPU 测试的命令如下:
# sysbench cpu --cpu-max-prime=20000 --threads=32 run<br/>
输出中,重点关注events per second
。值越大,代表 CPU 的计算性能越强。
CPU speed:<br/> events per second: 25058.08<br/>
下面是 CPU 测试相关的代码,可以看到,sysbench 是通过计算--cpu-max-prime
范围内的质数来衡量 CPU 的计算能力的。
质数(prime number)又称素数,指的是大于 1,且只能被 1 和自身整除的自然数。在代码实现时,对于自然数 n,一般会用 2 到根号 n 之间的整数去除,如果都无法整除,则意味着 n 是个质数。
int cpu_execute_event(sb_event_t *r, int thread_id)<br/>{<br/> unsigned long long c;<br/> unsigned long long l;<br/> double t;<br/> unsigned long long n=0;<br/><br/> (void)thread_id; /* unused */<br/> (void)r; /* unused */<br/><br/> // max_prime 即命令行中指定的 --cpu-max-prime<br/> for(c=3; c < max_prime; c++)<br/> {<br/> t = sqrt((double)c);<br/> for(l = 2; l <= t; l++)<br/> if (c % l == 0)<br/> break;<br/> if (l > t )<br/> n++;<br/> }<br/><br/> return 0;<br/>}<br/>
memory
内存测试,支持的选项有:
- --memory-block-size:内存块的大小,默认为 1KB。测试时建议设置为 1MB。
- --memory-total-size:要传输的数据的总大小。默认为 100GB。
- --memory-scope:内存访问范围,可指定 global、local,默认为 global。
- --memory-hugetlb:是否从 HugeTLB 池中分配内存,默认为 off。
- --memory-oper:内存操作类型,可指定 read、write、none,默认为 write。
- --memory-access-mode:内存访问模式,可指定 seq(顺序访问)、rnd(随机访问),默认为 seq。
内存测试的命令如下:
# sysbench --test=memory --memory-block-size=1M --memory-total-size=100G --num-threads=1 run<br/>
输出中,重点关注以下部分:
102400.00 MiB transferred (23335.96 MiB/sec)<br/>
23335.96 MiB/sec 即数据在内存中的顺序写入速率。
fileio
磁盘 IO 测试。支持的选项有:
- --file-num:需要创建的文件数,默认为128。
- --file-block-size:数据块的大小,默认为16384,即16KB。
- --file-total-size:需要创建的文件总大小,默认为2GB。
- --file-test-mode:测试模式,可指定 seqwr(顺序写)、seqrewr(顺序重写)、seqrd(顺序读)、rndrd(随机读)、rndwr(随机写)、rndrw(随机读写)。
- --file-io-mode:文件的操作模式,可指定 sync(同步 IO)、async(异步 IO)、mmap,默认为 sync。
- --file-async-backlog:每个线程异步 IO 队列的长度,默认为 128。
- --file-extra-flags:打开文件时指定的标志,可指定 sync、dsync、direct,默认为空,没指定。
- --file-fsync-freq:指定持久化操作的频率,默认为 100,即每执行 100 个 IO 请求,则会进行一次持久化操作。
- --file-fsync-all:在每次写入操作后执行持久化操作,默认为 off。
- --file-fsync-end:在测试结束时执行持久化操作,默认为 on。
- --file-fsync-mode:持久化操作的模式,可指定 fsync、fdatasync,默认为 fsync。fdatasync 和 fsync类似,只不过 fdatasync 只会更新数据,而 fsync 还会同步更新文件的属性。
- --file-merged-requests:允许合并的最多 IO 请求数,默认为0,不合并。
- --file-rw-ratio:混合测试中的读写比例,默认为1.5。
磁盘 IO 测试主要分为以下三步:
# 准备测试文件<br/># sysbench fileio --file-num=1 --file-total-size=10G --file-test-mode=rndrw prepare<br/><br/># 测试<br/># sysbench fileio --file-num=1 --file-total-size=10G --file-test-mode=rndrw run<br/><br/># 删除测试文件<br/># sysbench fileio --file-num=1 --file-total-size=10G --file-test-mode=rndrw cleanup<br/>
输出中,重点关注以下两部分:
File operations:<br/> reads/s: 4978.26<br/> writes/s: 3318.84<br/> fsyncs/s: 83.07<br/><br/>Throughput:<br/> read, MiB/s: 77.79<br/> written, MiB/s: 51.86<br/>
其中,reads/s 加上 writes/s 即我们常说的 IOPS。read, MiB/s 加上 written, MiB/s 即我们常说的吞吐量。
MySQL 常见测试场景及对应的 SQL 语句
接下来会列举 MySQL 常见的测试场景及各个场景对应的 SQL 语句。
为了让大家清晰的知道 SQL 语句的含义,首先我们看看测试表的表结构。
除了 bulk_insert 会创建单独的测试表,其它场景都会使用下面的表结构。
mysql> show create table sbtest.sbtest1\G<br/>*************************** 1. row ***************************<br/> Table: sbtest1<br/>Create Table: CREATE TABLE `sbtest1` (<br/> `id` int NOT NULL AUTO_INCREMENT,<br/> `k` int NOT NULL DEFAULT '0',<br/> `c` char(120) NOT NULL DEFAULT '',<br/> `pad` char(60) NOT NULL DEFAULT '',<br/> PRIMARY KEY (`id`),<br/> KEY `k_1` (`k`)<br/>) ENGINE=InnoDB AUTO_INCREMENT=1000001 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci<br/>1 row in set (0.00 sec)<br/>
bulk_insert
批量插入测试。
# sysbench bulk_insert --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
下面是 bulk_insert 场景下创建的测试表。
mysql> show create table sbtest.sbtest1\G<br/>*************************** 1. row ***************************<br/> Table: sbtest1<br/>Create Table: CREATE TABLE `sbtest1` (<br/> `id` int NOT NULL,<br/> `k` int NOT NULL DEFAULT '0',<br/> PRIMARY KEY (`id`)<br/>) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci<br/>1 row in set (0.01 sec)<br/>
测试对应的 SQL 语句如下:
INSERT INTO sbtest1 VALUES(?, ?),(?, ?),(?, ?),(?, ?)...<br/>
oltp_delete
删除测试。
# sysbench oltp_delete --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
基于主键进行删除。测试对应的 SQL 语句如下:
DELETE FROM sbtest1 WHERE id=?<br/>
oltp_insert
插入测试。
# sysbench oltp_insert --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
INSERT INTO sbtest1 (id, k, c, pad) VALUES (?, ?, ?, ?)<br/>
oltp_point_select
基于主键进行查询。
# sysbench oltp_point_select --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
SELECT c FROM sbtest1 WHERE id=?<br/>
oltp_read_only
只读测试。
# sysbench oltp_read_only --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
SELECT c FROM sbtest1 WHERE id=? # 默认会执行 10 次,由 --point_selects 选项控制。<br/>SELECT c FROM sbtest1 WHERE id BETWEEN ? AND ?<br/>SELECT SUM(k) FROM sbtest1 WHERE id BETWEEN ? AND ?<br/>SELECT c FROM sbtest1 WHERE id BETWEEN ? AND ? ORDER BY c<br/>SELECT DISTINCT c FROM sbtest1 WHERE id BETWEEN ? AND ? ORDER BY c<br/>
oltp_read_write
读写测试。
测试对应的 SQL 语句如下:
SELECT c FROM sbtest1 WHERE id=? # 默认会执行 10 次,由 --point_selects 选项控制。<br/>SELECT c FROM sbtest1 WHERE id BETWEEN ? AND ?<br/>SELECT SUM(k) FROM sbtest1 WHERE id BETWEEN ? AND ?<br/>SELECT c FROM sbtest1 WHERE id BETWEEN ? AND ? ORDER BY c<br/>SELECT DISTINCT c FROM sbtest1 WHERE id BETWEEN ? AND ? ORDER BY c<br/>UPDATE sbtest1 SET k=k+1 WHERE id=?<br/>UPDATE sbtest1 SET c=? WHERE id=?<br/>DELETE FROM sbtest1 WHERE id=?<br/>INSERT INTO sbtest1 (id, k, c, pad) VALUES (?, ?, ?, ?)<br/>
oltp_update_index
基于主键进行更新,更新的是索引字段。
# sysbench oltp_update_index --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
UPDATE sbtest1 SET k=k+1 WHERE id=?<br/>
oltp_update_non_index
基于主键进行更新,更新的是非索引字段。
# sysbench oltp_update_non_index --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
UPDATE sbtest1 SET c=? WHERE id=?<br/>
oltp_write_only
只写测试。
# sysbench oltp_write_only --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
UPDATE sbtest1 SET k=k+1 WHERE id=?<br/>UPDATE sbtest1 SET c=? WHERE id=?<br/>DELETE FROM sbtest1 WHERE id=?<br/>INSERT INTO sbtest1 (id, k, c, pad) VALUES (?, ?, ?, ?)<br/>
select_random_points
基于索引进行随机查询。
# sysbench select_random_points --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
SELECT id, k, c, pad<br/> FROM sbtest1<br/> WHERE k IN (?, ?, ?, ?, ?, ?, ?, ?, ?, ?)<br/>
select_random_ranges
基于索引进行随机范围查询。
# sysbench select_random_ranges --mysql-host=10.0.0.64 --mysql-port=3306 --mysql-user=admin --mysql-password=Py@123456 --mysql-db=sbtest --tables=30 --table-size=1000000 --threads=64 --time=60 --report-interval=10 run<br/>
测试对应的 SQL 语句如下:
SELECT count(k)<br/> FROM sbtest1<br/> WHERE k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ? OR k BETWEEN ? AND ?<br/>
如何自定义 sysbench 测试脚本
下面通过 bulk_insert.lua 和 oltp_point_select.lua 这两个脚本分析下 sysbench 测试脚本的实现逻辑。
首先看看 bulk_insert.lua。
# cat bulk_insert.lua<br/>#!/usr/bin/env sysbench<br/><br/>cursize=0<br/>function thread_init()<br/> drv = sysbench.sql.driver()<br/> con = drv:connect()<br/>end<br/><br/>function prepare()<br/> local i<br/><br/> local drv = sysbench.sql.driver()<br/> local con = drv:connect()<br/><br/> for i = 1, sysbench.opt.threads do<br/> print("Creating table 'sbtest" .. i .. "'...")<br/> con:query(string.format([[<br/> CREATE TABLE IF NOT EXISTS sbtest%d (<br/> id INTEGER NOT NULL,<br/> k INTEGER DEFAULT '0' NOT NULL,<br/> PRIMARY KEY (id))]], i))<br/> end<br/>end<br/><br/>function event()<br/> if (cursize == 0) then<br/> con:bulk_insert_init("INSERT INTO sbtest" .. thread_id+1 .. " VALUES")<br/> end<br/><br/> cursize = cursize + 1<br/><br/> con:bulk_insert_next("(" .. cursize .. "," .. cursize .. ")")<br/>end<br/><br/>function thread_done(thread_9d)<br/> con:bulk_insert_done()<br/> con:disconnect()<br/>end<br/><br/>function cleanup()<br/> local i<br/><br/> local drv = sysbench.sql.driver()<br/> local con = drv:connect()<br/><br/> for i = 1, sysbench.opt.threads do<br/> print("Dropping table 'sbtest" .. i .. "'...")<br/> con:query("DROP TABLE IF EXISTS sbtest" .. i )<br/> end<br/>end<br/>
下面,我们看看这几个函数的具体作用:
- thread_init():线程初始化时调用。这个函数常用来创建数据库连接。
- prepare():指定 prepare 时调用。这个函数常用来创建测试表,生成测试数据。
- event():指定 run 时调用。这个函数会定义需要测试的 SQL 语句。
- thread_done():线程退出时调用。这个函数常用来关闭 Prepared Statements 和数据库连接。
- cleanup():指定 cleanup 时调用。这个函数常用来删除测试表。
如果我们要自定义测试脚本,只需实现这几个函数即可。
如果我们要基于 sbtest 表自定义测试项,就要分析 oltp*.lua 脚本的实现逻辑。
下面,以 oltp_point_select.lua 脚本为例。
#!/usr/bin/env sysbench<br/>...<br/>require("oltp_common")<br/><br/>function prepare_statements()<br/> -- point_selects 是 oltp_point_select 中支持的选项,默认为 10,这里调整为了 1。<br/> sysbench.opt.point_selects=1<br/><br/> prepare_point_selects()<br/>end<br/><br/>function event()<br/> execute_point_selects()<br/>end<br/>
与 bulk_insert.lua 不一样的是,oltp_point_select.lua 只简单的定义了两个函数:prepare_statements()
和event()
。实际上,不仅仅是 oltp_point_select.lua,其它 oltp*.lua 脚本也只定义了这两个函数。
虽然只定义了这两个函数,但脚本导入了 oltp_common 模块,所以实际上,脚本中的 prepare_point_selects(),execute_point_selects() 以及 bulk_insert.lua 中的 thread_init(),prepare(),thread_done(),cleanup() 都是在oltp_common.lua
这个公共模块中定义的。
接下来,我们看看 prepare_point_selects() 和 execute_point_selects() 这两个函数的实现逻辑。
首先看看prepare_point_selects()
。
它调用的是prepare_for_each_table()
。prepare_for_each_table()是一个基础函数。所有prepare 相关的函数都会调用prepare_for_each_table(), 只不过不同的 prepare 函数会传入不同的参数名。
prepare_for_each_table()
会填充两张表(Lua 中的表既可用来表示数组,也可用来表示集合):stmt 和 param。其中,stmt 用来存储 Prepared Statements 语句,param 用来存储 Prepared Statements 语句相关的参数类型。
填充完毕后,最后再通过 bind_param 函数将两者绑定在一起。
可以看到,无论是 Prepared Statements 语句还是相关的参数类型,都是在 stmt_defs 定义的。
function prepare_point_selects()<br/> prepare_for_each_table("point_selects")<br/>end<br/><br/>function prepare_for_each_table(key)<br/> for t = 1, sysbench.opt.tables do<br/> -- t 是表的序号,key 是测试项的名字<br/> stmt[t][key] = con:prepare(string.format(stmt_defs[key][1], t))<br/> <br/> local nparam = #stmt_defs[key] - 1<br/><br/> if nparam > 0 then<br/> param[t][key] = {}<br/> end<br/><br/> for p = 1, nparam do<br/> local btype = stmt_defs[key][p+1]<br/> local len<br/><br/> if type(btype) == "table" then<br/> len = btype[2]<br/> btype = btype[1]<br/> end<br/> if btype == sysbench.sql.type.VARCHAR or<br/> btype == sysbench.sql.type.CHAR then<br/> param[t][key][p] = stmt[t][key]:bind_create(btype, len)<br/> else<br/> param[t][key][p] = stmt[t][key]:bind_create(btype)<br/> end<br/> end<br/><br/> if nparam > 0 then<br/> stmt[t][key]:bind_param(unpack(param[t][key]))<br/> end<br/> end<br/>end<br/>
接下来,我们看看 stmt_defs 的内容。
local stmt_defs = {<br/> point_selects = {<br/> "SELECT c FROM sbtest%u WHERE id=?",<br/> t.INT},<br/> simple_ranges = {<br/> "SELECT c FROM sbtest%u WHERE id BETWEEN ? AND ?",<br/> t.INT, t.INT},<br/> sum_ranges = {<br/> "SELECT SUM(k) FROM sbtest%u WHERE id BETWEEN ? AND ?",<br/> t.INT, t.INT},<br/> order_ranges = {<br/> "SELECT c FROM sbtest%u WHERE id BETWEEN ? AND ? ORDER BY c",<br/> t.INT, t.INT},<br/> distinct_ranges = {<br/> "SELECT DISTINCT c FROM sbtest%u WHERE id BETWEEN ? AND ? ORDER BY c",<br/> t.INT, t.INT},<br/> index_updates = {<br/> "UPDATE sbtest%u SET k=k+1 WHERE id=?",<br/> t.INT},<br/> non_index_updates = {<br/> "UPDATE sbtest%u SET c=? WHERE id=?",<br/> {t.CHAR, 120}, t.INT},<br/> deletes = {<br/> "DELETE FROM sbtest%u WHERE id=?",<br/> t.INT},<br/> inserts = {<br/> "INSERT INTO sbtest%u (id, k, c, pad) VALUES (?, ?, ?, ?)",<br/> t.INT, t.INT, {t.CHAR, 120}, {t.CHAR, 60}},<br/>}<br/>
可以看到,stmt_defs 是一张表,里面定义了不同测试项对应的 Prepared Statements 语句和参数类型。
具体到 point_selects 这个测试项,它对应的 Prepared Statements 语句是SELECT c FROM sbtest%u WHERE id=?
,对应的参数类型是t.INT
。
梳理完 prepare_point_selects() 函数的实现逻辑。最后我们看看execute_point_selects()
函数的实现逻辑。
function execute_point_selects()<br/> local tnum = get_table_num()<br/> local i<br/> -- point_selects 对应命令行中的 --point_selects 选项,默认为 10。<br/> for i = 1, sysbench.opt.point_selects do<br/> param[tnum].point_selects[1]:set(get_id())<br/><br/> stmt[tnum].point_selects:execute()<br/> end<br/>end<br/>
逻辑也非常简单,先赋值,最后执行。
所以如果我们要基于 sbtest 表自定义测试项,最关键的一步其实就是在 stmt_defs 中定义 Prepared Statements 语句和相关的参数类型。至于 prepare_xxx 和 execute_xxx 函数,实现起来都非常简单。
总结
1. 基准测试一般会关注三个指标:TPS/QPS、响应耗时和并发量。
2. 只有进行全链路压测,我们才知道系统的瓶颈在哪里。不能想当然的以为,数据库不容易横向扩展,系统瓶颈就一定会出在数据库层。事实上,很多系统在设计之初就引入了缓存,而缓存会分担很大一部分读流量,这种架构下的数据库压力其实并不大。
3. 不能简单的将 sysbench 的测试结果(TPS/QPS) 作为业务系统的吞吐量指标,因为两者的业务模型并不一致。
4. 如果要自定义测试脚本,实现的方式有两种:
- 自己实现测试相关的所有函数,具体实现细节可参考 bulk_insert.lua。
- 基于 sbtest 表自定义测试项。实现过程中最关键的一步是在 stmt_defs 中定义 Prepared Statements 语句和相关的参数类型。
文章评论