可以帮助发现性能瓶颈,并及时采取措施来优化数据库性能。
序号 | 测试方法 | 描述 |
---|---|---|
1 | 基准测试(Benchmark Testing) | ①. 通过运行预定义的测试项目来测量数据库性能的方法 ②. 基准测试适用于比较不同数据库系统或不同硬件配置的性能 ③. 建议根据实际使用场景来选择最适合的基准测试工具,例如TPC-C、TPC-DS等 |
2 | 负载测试(Load Testing) | ①. 通过模拟实际业务场景下的访问量,来测试在高并发情况下的性能表现 ②. 可以使用压力测试工具,如JMeter等 |
3 | 实时监控(Real-time Monitoring) | ①. 可以使用实时监控工具来监控数据库的响应时间、CPU和内存使用情况、磁盘IO等性能指标 |
4 | 数据库执行计划(Execution Plan) | ①. 通过查看SQL语句的执行计划,确定查询的瓶颈在哪里 ②. 数据库自带的执行计划工具,如EXPLAIN命令 |
随着企业信息化的发展,数据量越来越庞大,对于数据分析和处理提出了更高的要求。在数据仓库中,联机分析处理(OLAP)和联机事务处理(OLTP)是常见的两种处理方式。
序号 | 技术指标 | OLTP | OLAP |
---|---|---|---|
1 | 应用类型 | 业务操作(应用) | 统计报表(分析) |
2 | 响应速度 | 快、短 | 一般 |
3 | 吞吐量 | 小 | 大 |
4 | 并发量 | 高 | 低 |
5 | 数据量规模 | 小 | 中大 |
6 | 场景 | 银行类、电子商务类的交易系统 | 数据仓库 |
数据仓库中的OLAP和OLTP是两种不同的数据处理方式,分别以数据分析和实时事务处理为核心。在实际应用中,我们针对不同的数据应用类型,可以选择不同的设计方案,以满足实际的业务需求。
序号 | 测试基准 | 数据应用类型 | 作用 | 测试工具 |
---|---|---|---|---|
1 | TPC-C | OLTP | ①. 用于在线事务处理(OLTP)数据库的性能测试 | sysbench测试工具就支持oltp测试 |
2 | TPC-H | OLAP | ①. 面向商品零售业的决策支持系统测试基准 ②. 定义了8张表,22个查询,遵循SQL92标准 | http://TPC.org官方提供测试包 |
3 | TPC-DS | OLAP | ①. 数据仓库的表结构,采用星型、雪花型等多维数据模式 ②. 包含7张事实表,17张纬度表 ③. 与大数据的分析挖掘应用非常类似 ④. 测试案例都有很高的IO负载和CPU计算需求 | http://TPC.org官方提供测试包 |
40张表,每张表25000条记录,测试数据量为10.62G左右。
Sysbench是一款基于LuaJIT的,模块化多线程基准测试工具,常用于数据库基准测试。
yum -y install epel-release yum -y install sysbench sysbench --version
压测脚本默认会安装在 /usr/share/sysbench 目录下,看看该目录的内容,除了oltp_common.lua是个公共模块,其它每个 lua 脚本都对应一个测试场景。
创建数据库实例后,并不能马上进行使用,需要大概等待6分钟左右才能进行使用。
创建数据库实例后,大概等待不到1分钟左右就能进行使用。
所以,我们选择的TDSQL-C MySQL Serverless的CCU算力是Min为4,Max为8。
command是 sysbench 要执行的命令,支持的选项有:prepare、run、cleanup
命令参数:
序号 | 选项 | 功能 |
---|---|---|
1 | prepare | ①. 生成压测数据 ②. 执行测试前的预备操作,如 创建文件、填充数据等 |
2 | run | 运行压测 |
3 | cleanup | 清理数据 |
# 准备数据 sysbench --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 oltp_write_only prepare # 运行 workload sysbench --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 --events=0 --time=30 --threads=500 --percentile=95 --report-interval=1 oltp_write_only run # 清理数据 sysbench --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 oltp_write_only cleanup
测试结果对比:
压测数据结果解释:
序号 | 参数值 | 描述 | 对比 |
---|---|---|---|
1 | thds:500 | 500个线程在压测 | |
2 | tps:1611.38 | 每秒执行了1611.38个事务 | TDSQL强 |
3 | qps: 10924.90 | 每秒可以执行10924.90个请求 | TDSQL强 |
4 | (r/w/o: 0/7263.12/3661.79) | ①. 在每秒10924.90个请求中,对QPS进行了拆解 ②. 有0个请求是读请求 ③. 有7263.12个写请求 ④. 有3661.79个其他的请求 | TDSQL强 |
5 | lat (ms, 95%): 325.98 | 95%的请求的延迟都在 97.55毫秒以下 | |
6 | err/s: 0.00 reconn/s: 0.00 | 每秒有0个请求是失败的,发生了0次网络重连 |
# 准备数据 sysbench --db-driver=mysql --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 oltp_read_only prepare # 运行 workload sysbench --db-driver=mysql --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 --events=0 --time=30 --threads=512 --percentile=95 --range_selects=0 --skip-trx=1 --report-interval=1 oltp_read_only run # 清理数据 sysbench --db-driver=mysql --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 oltp_read_only cleanup
# 准备数据 sysbench --db-driver=mysql --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 oltp_read_only prepare # 运行 workload sysbench --db-driver=mysql --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 --events=0 --time=30 --threads=512 --percentile=95 --skip-trx=1 --report-interval=1 oltp_read_only run # 清理数据 sysbench --db-driver=mysql --db-driver=mysql --mysql-host=rm-bp1i6ktwzqcs153neyo.mysql.rds.aliyuncs.com --mysql-port=3306 --mysql-user=root_123 --mysql-password=Testdb@123 --mysql-db=tpcc_test --table_size=25000 --tables=40 oltp_read_only cleanup
从上面测试的数据来看,可以看到大部分的场景下,压测的TDSQL-C MySQL Serverless的要比传统的MySQL的TPS和QPS要高一点,而且从CPU的的效率来看,也是节约了近一半的效率。
执行报错“Can’t create more than max_prepared_stmt_count statements (current value:16382)”,经过查询默认值为16382,将值改大。
执行报错“unable to connect to MySQL server on host”,将max_connections值改大。
TPC-DS是一个面向决策支持系统(decision support system)的包含多维度常规应用模型的决策支持基准,包括查询(queries)与数据维护,此基准对被测系统(System Under Test’s, SUT)在决策支持系统层面上的表现进行的评估具有代表性。
此基准体现决策支持系统以下特性:
下载地址
mysql -h gz-cynosdbmysql-grp-8zlf9ba7.sql.tencentcdb.com -P 27124 -u root -p -D tpcds < ./tpcds.sql
-SCALE 参数指定数据的大小,以G为单位
LOAD DATA LOCAL INFILE '/tmp/11/call_center.dat' INTO TABLE call_center FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/customer.dat' INTO TABLE customer FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/income_band.dat' INTO TABLE income_band FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/ship_mode.dat' INTO TABLE ship_mode FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/warehouse.dat' INTO TABLE warehouse FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/catalog_page.dat' INTO TABLE catalog_page FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/customer_demographics.dat' INTO TABLE customer_demographics FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/inventory.dat' INTO TABLE inventory FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/store.dat' INTO TABLE store FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/web_page.dat' INTO TABLE web_page FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/catalog_returns.dat' INTO TABLE catalog_returns FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/date_dim.dat' INTO TABLE date_dim FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/item.dat' INTO TABLE item FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/store_returns.dat' INTO TABLE store_returns FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/web_returns.dat' INTO TABLE web_returns FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/catalog_sales.dat' INTO TABLE catalog_sales FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/dbgen_version.dat' INTO TABLE dbgen_version FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/promotion.dat' INTO TABLE promotion FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/store_sales.dat' INTO TABLE store_sales FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/web_sales.dat' INTO TABLE web_sales FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/customer_address.dat' INTO TABLE customer_address FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/household_demographics.dat' INTO TABLE household_demographics FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/reason.dat' INTO TABLE reason FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/time_dim.dat' INTO TABLE time_dim FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n'; LOAD DATA LOCAL INFILE '/tmp/11/web_site.dat' INTO TABLE web_site FIELDS TERMINATED BY '|' LINES TERMINATED BY '\n';
序号 | MySQL执行时间 | TDSQL执行时间 | 结果对比 |
---|---|---|---|
SQL3 | 73ms | 26 ms | 2.81倍 |
SQL 6 | 914520ms | 162820ms | 5.62倍 |
SQL 7 | 69830ms | 12673ms | 5.51倍 |
SQL 9 | 56670ms | 19113ms | 2.96倍 |
TDSQL-C MySQL Serverless版(TDSQL-C for MySQL Serverless)是腾讯云自研的新一代云原生关系型数据库。
Serverless数据库是一种基于Serverless架构的数据库服务,结合了云数据库和Serverless 两者的优势。
Serverless 数据库更加适用于 IoT 边缘计算、开发测试、无法预估负载等场景,这些场景平均负载比较低,资源大部分时间可能都是闲置的,使用Serverless后,可以节约大量成本,最高可节约 90%左右。
Serverless 服务是腾讯云自研的新一代云原生关系型数据库 TDSQL-C MySQL 版的无服务器架构版,是全 Serverless 架构的云原生数据库。Serverless 服务支持按实际计算和存储资源使用量收取费用,不用不付费,将腾讯云云原生技术普惠用户。
TDSQL-C MySQL 版提供 Serverless 服务以满足企业对特定业务场景的数据库服务要求,助力企业降本增效,介绍 Serverless 服务的几大特性。
序号 | 特性项 | 说明 |
---|---|---|
1 | 自动启停 | ①. Serverless 服务支持自定义实例自动暂停时间,无连接时实例会自动暂停 ②. 当有任务连接接入时,实例会秒级无间断自动唤醒 |
2 | 资源扩缩范围(CCU) | ①. 可调整 CCU 弹性扩缩容的范围 ②. Serverless 集群会在该范围内根据实际业务压力自动增加或减少 CCU |
3 | 弹性策略 | ①. Serverless 集群会持续监控用户的 CPU、内存等 workload 负载情况,根据一定的规则触发自动扩缩容策略 |
下面我们将针对这3个场景来测试一下数据库的特性。
您可根据业务需要,自助开启或关闭自动暂停设置。
关闭状态下,数据库会保持持续运行,在没有连接和 CPU 使用时,按用户配置的最小 CCU 算力进行计费,适用于业务有心跳连接的应用场景。
写一个.sql的文件,里面是查看所有的表,使用Linux的time命令可以用来统计命令的执行时间。
当然,这个实际时间也可能跟网速、存储数据量(我这里是近10TB数据)等因素相关,所以,只能根据实际的业务场景进行衡量。
Serverless 服务的弹性策略是利用监控计算层实现的。通过监控业务负载情况,系统对计算资源进行自动扩缩容,并对该时刻所消耗的资源进行计费。
Serverless 服务的弹性策略一开始会根据用户购买时选择的容量范围,将 CPU、内存资源限制到最大规格,极大程度降低因 CPU 和内存扩容带来的时间影响和使用限制。
如下,为了方便的进行阶梯式的压测变化,开通了3台服务器,再加自己本地,一共4台设备进行阶段性压测,看一下服务的弹性策略变化。
如下是4台设备进行压测的截图,分别为压测的进程Threads数为200、300、400、300,前面三台机器可以正常使用,到了第4台设备机器,资源不足,导致所有压测中断。
序号 | 机器标识 | Threads数 | 时间阶梯 | 结果 |
---|---|---|---|---|
1 | 第一台机器 | 200 | 第一批(间隔5min) | CPU负载在0-20左右 |
2 | 第二台机器 | 300 | 第二批(间隔5min) | CPU负载在20-60左右 |
3 | 第三台机器 | 400 | 第三批(间隔5min) | CPU负载在60-100左右 |
4 | 第四台机器 | 300 | 第四批(间隔5min) | 报错,导致所有脚本退出 |
以下是具体的性能监控图,我们来对比一下各个阶段的不同指标有什么变化。
内存的使用量和使用率在三个周期中,也是发生了递归上升的变化。内存最大使用率为91.76%,内存最大使用量约6G。
下面来重点分析一下CCU的算力,由于最开始设置的算力区间是0.5 – 1,但是第一批次压测发现:
第二次压测发现:
第三次压测发现:
第四次压测发现:
以下为CPU、内存、InnoDB Buffer Pool Pages、InnoDB Row Operations等参数的变化图。
execution plan主要负责生成执行计划的组件就是优化器,优化器利用表结构、字段、索引、查询条件、数据库的统计信息和配置参数决定 SQL 语句的最佳执行方式。如果想要解决慢查询的性能问题,首先应该查看它的执行计划。
可以分析如下SQL语句中,在store_sales这张表中,是进行了扫表的操作,大概扫了3190062行数据,可以进行一些索引的优化、或者语句的优化,防止产生慢查询,拖垮数据库的性能。
伴随着云原生概念的迅速发展,未来 Serverless 的数据库服务对中小用户还是很有吸引力的,因为 Serverless 模式大大简化了数据库运维管理工作,用户的 DBA 的工作负担大幅降低,可以专注于查询性能优化,Serverless 服务状态监控,数据访问控制机制管理等工作。用户的数据库使用成本也会相应大幅降低。
从性能也有很大的提升,事务内路由优化,大幅降低事务整体执行延迟,TP业务分布式事务较多的场景,可大幅降低整个事务的整体执行延迟,TP性能显著提升,4核小规格部署环境下,sysbench综合读写能力相比提升最高40%。
同时,也对Serverless 服务的自动启停、弹性策略和资源扩缩范围(CCU)进行了实际的测试,Serverless 服务支持按实际计算和存储资源使用量收取费用,不用不付费,将腾讯云云原生技术普惠用户。而且,充分了利用了云计算的弹性能力。