测试动态 / 测试知识 / 软件数据库测试读写超时、性能卡顿报错排查指南
软件数据库测试读写超时、性能卡顿报错排查指南
2026-05-09 作者:cwb 浏览次数:8

一、自查真正的超时发生在哪层

先排除假性超时。

客户端超时配置过短:JDBC/连接池的 connectTimeout、socketTimeout 或框架的慢查询阈值设得过低(如200ms),此时数据库本身负载很低,单纯是配置和正常响应时间不一致。

网络层问题:应用和数据库之间有防火墙、安全组方法,或网络抖动、丢包、带宽打满。从应用服务器 telnet <db_ip> 3306 或 ping 检查连通性和延迟。

连接池耗尽导致排队:业务线程在等待连接池返回连接,达到配置的 maxWait 时间后抛出“获取连接超时”错误。这时问题不在数据库处理慢,而在连接不够或连接泄漏。


二、数据库诊断

登录数据库主机或云监控确定四大资源是不是被打满。

CPU:危险阈值是 %usr + %sys 大于 85% 并不断。常见原因为慢查询大量思路读/排序、高并发、计算密集型函数。紧急动作是杀掉最慢的查询,并立即开启慢查询日志。

内存:危险阈值是 %used 大于 90% 且有 SWAP 使用。常见原因是缓冲池不足、连接数过多或内存泄漏。紧急动作是检查最大连接数,适当降低除innodb_buffer_pool_size之外的非重要内存占比。

磁盘 IO:危险阈值是 %util 接近 100%,且 await 值剧增。常见原因是大量随机写、日志同步、缺少索引导致的全表扫描。紧急动作可临时关闭binlog/redo log的强刷方法(如危急只读场景下暂时设 sync_binlog=0),并立即优化慢查询。

磁盘空间:危险阈值是数据目录或日志目录使用率超过 95%。常见原因是大事务生成超大undo log、binlog积压或备份文件堆积。紧急动作是清理无用日志,调整binlog_expire_logs_seconds等参数。


常用排查命令MySQL示例:

全局状态:show global status like '%Threads_connected%'; 和 show global status like '%Questions%'; 查看当前连接和QPS。

进程列表:show full processlist; 观察大量处于 Sending data、Locked、Waiting for... 的线程。

InnoDB 状态:SHOW ENGINE INNODB STATUS\G 查看死锁、锁等待、事务历史、IO 吞吐等。

三、问题排查

按照慢查询 -锁冲突 - 连接管理 - 配置不当的顺序排查能解决90%的问题。


1. 慢查询:

开启慢查询日志:

sql

SET GLOBAL slow_query_log = ON;

SET GLOBAL long_query_time = 0.5; -- 根据业务调整

SET GLOBAL log_queries_not_using_indexes = ON;


分析工具:用 pt-query-digest(Percona Toolkit)或 mysqldumpslow 统计 Top N 最慢 SQL 及执行频率。

定位单条SQL:拿到SQL后,用EXPLAIN或EXPLAIN ANALYZE(8.0.18+) 分析执行计划。

观察:type(ALL 全表扫描)、rows(预估扫描行数极大)、Extra(Using filesort, Using temporary)、是不是使用索引、过滤比。

优化:加复合索引、避免函数操作索引列、减少SELECT * 回表、改写子查询为 JOIN、控制分页深翻。


2. 锁冲突和事务阻塞

行锁/表锁等待:

MySQL 5.7+ 可用 select * from sys.innodb_lock_waits; 查看锁等待关系,谁阻塞了谁。

或手动查:show engine innodb status 的 LATEST DETECTED DEADLOCK 和 TRANSACTIONS 段落。

现象:大量线程处于 updating 或 insert 时卡死,TPS 归零。

元数据锁 (MDL):DDL 操作或未提交事务导致 Waiting for table metadata lock。

死锁:日志会记录,需要检查业务事务顺序是不是一致,是不是使用了 SELECT ... FOR UPDATE 后锁范围过大。


优化方向:

缩短事务:拆大事务为小事务,不在事务中做 RPC 调用、文件 I/O。

调整隔离级别:读多写少可考虑 RC(读已提交)替代 RR,降低间隙锁。

冷热数据分离,避免单行热点更新(库存扣减改用队列串行或 INSERT ... ON DUPLICATE KEY UPDATE 配合缓存)。


3. 连接和线程管理

连接数上限被打满:

show variables like 'max_connections'; 和 show status like 'Threads_connected'; 对比,如果已满,应用报“too many connections”。

原因:连接池配置过大、连接未释放、大量空闲连接。

连接创建开销:高并发短连接频繁 TCP 握手和线程创建,启用连接池并且设置合理的 wait_timeout 回收空闲连接。

线程缓存:Threads_created 增长过快,需加大 thread_cache_size。


4. 配置和缓存命中

InnoDB 缓冲池:

show status like 'Innodb_buffer_pool_read_requests'; 和 Innodb_buffer_pool_reads(物理读),命中率应 > 99%。低了说明内存不够,要扩大 innodb_buffer_pool_size 或优化 SQL。

查询缓存(MySQL 5.7 以前):主流高并发场景下建议禁用(query_cache_size=0),因为其全局锁会引发严重争用。

临时表:如果磁盘临时表比 Created_tmp_disk_tables 增长快,需增大 tmp_table_size 或优化索引避免创建临时表。

双1配置和组提交:

在数据安全性允许时,调整 sync_binlog 和 innodb_flush_log_at_trx_commit 可大幅提升写TPS,但可能丢失部分事务。理解风险后再操作。


四、不同数据库的排查工具

MySQL:充分利用 performance_schema 和 sys schema。sys.statement_analysis 可做全量 SQL 统计,sys.io_global_by_file_by_bytes 能查看磁盘热点文件。

PostgreSQL:pg_stat_statements 扩展用于定位最耗时的查询和读写块命中率;pg_stat_activity 配合 pg_locks 可查看当前活动连接、等待事件(wait_event_type)以及锁持有和等待状态;auto_explain 模块能自动记录超过阈值并包含执行计划的慢查询。

Oracle:AWR/ASH 报告、v$session_wait 是历史和实时性能分析、等待事件定位的重要手段。

MongoDB:currentOp() 和 mongostat 可分别查看当前操作、锁等待以及实时读写吞吐量。


五、排查实战

当接到告警,可以按以下步骤执行:

看监控大盘:CPU/IO/Memory 谁高?高并发下 CPU 高加服务器,IO 高则优化 SQL 或扩容磁盘。

抓当前活动查询:show full processlist 或 pg_stat_activity,找出执行时间 > 5 秒的 SQL,同时观察状态栏(Lock, Sorting, Sending data)。

看锁等待:用工具(sys 库或 pg_locks)查出阻塞者,立刻考虑是不是可kill。

拉慢查询日志:分析最近一段时间的聚合报告,不要只看单条,要看执行频率高但稍慢的积少成多型 SQL。

检查事务:找到长时间未提交的 BEGIN,可能造成undo堆积和锁持有。

检查计划变更:突然卡顿,可能是统计信息过时导致执行计划变差。执行ANALYZE TABLE后看是不是好转。

配置和容量对比:确定连接数、缓冲池、临时表大小等重点配置是不是被意外修改,并和历史健康值对比。


六、非数据库的问题

云数据库主动隔离:云厂商可能对资源限制(如 IOPS、连接数、带宽),超限会被主动限速,表现为规律性性能毛刺。检查云监控中的配额和限流日志。

备份和定时任务:备份(mysqldump, xtrabackup)、统计任务(ANALYZE) 会占用 IO,如果和业务高峰重叠则卡顿。

读写分离延迟:主库写后立刻从库读,读到了旧数据并继续写入导致思路错乱,但表现可能是“锁超时”,需在代码层强制读主或加缓存补偿。

大事务和DDL:一个不经意的大事务(如 UPDATE ... WHERE 未走索引更新了千万行)或在线 DDL 会导致长锁,需审查所有变更。



CPU 高看 SQL 执行,IO 高看 SQL 扫描行数/日志刷盘,连接满看连接池和锁。

在重启/升级配置前,先收集 show engine innodb status 和 show full processlist 的快照,这是查找原因最重要的证据。


文章标签: 软件测试 数据库测试 软件数据库测试
热门标签 换一换
第三方软件国产化测试 第三方信创测试 CNAS软件测评报告 CMA软件测评报告 首版次软件认定 软件结题验收 软件测试报告书 软件质量检测 数据库测试 H5应用测试 软件质检机构 第三方质检机构 第三方权威质检机构 信创测评机构 信息技术应用创新测评机构 信创测试 软件信创测试 软件系统第三方测试 软件系统测试 软件测试标准 工业软件测试 软件应用性能测试 应用性能测试 可用性测试 软件可用性测试 软件可靠性测试 可靠性测试 系统应用测试 软件系统应用测试 软件应用测试 软件负载测试 API自动化测试 软件结题测试 软件结题测试报告 软件登记测试 软件登记测试报告 软件测试中心 第三方软件测试中心 应用测试 第三方应用测试 软件测试需求 软件检测报告定制 软件测试外包公司 第三方软件检测报告厂家 CMA资质 软件产品登记测试 软件产品登记 软件登记 CNAS资质 cma检测范围 cma检测报告 软件评审 软件项目评审 软件项目测试报告书 软件项目验收 软件质量测试报告书 软件项目验收测试 软件验收测试 软件测试机构 软件检验 软件检验检测 WEB应用测试 API接口测试 接口性能测试 第三方系统测试 第三方网站系统测试 数据库系统检测 第三方数据库检测 第三方数据库系统检测 第三方软件评估 课题认证 第三方课题认证 小程序测试 app测试 区块链业务逻辑 智能合约代码安全 区块链 区块链智能合约 软件数据库测试 第三方数据库测试 第三方软件数据库测试 软件第三方测试 软件第三方测试方案 软件测试报告内容 网站测试报告 网站测试总结报告 信息系统测试报告 信息系统评估报告 信息系统测评 语言模型安全 语言模型测试 软件报告书 软件测评报告书 第三方软件测评报告 检测报告厂家 软件检测报告厂家 第三方网站检测 第三方网站测评 第三方网站测试 检测报告 软件检测流程 软件检测报告 第三方软件检测 第三方软件检测机构 第三方检测机构 软件产品确认测试 软件功能性测试 功能性测试 软件崩溃 稳定性测试 API测试 API安全测试 网站测试测评 敏感数据泄露测试 敏感数据泄露 敏感数据泄露测试防护 课题软件交付 科研经费申请 软件网站系统竞赛 竞赛CMA资质补办通道 中学生软件网站系统CMA资质 大学生软件网站系统CMA资质 科研软件课题cma检测报告 科研软件课题cma检测 国家级科研软件CMA检测 科研软件课题 国家级科研软件 web测评 网站测试 网站测评 第三方软件验收公司 第三方软件验收 软件测试选题 软件测试课题是什么 软件测试课题研究报告 软件科研项目测评报告 软件科研项目测评内容 软件科研项目测评 长沙第三方软件测评中心 长沙第三方软件测评公司 长沙第三方软件测评机构 软件科研结项强制清单 软件课题验收 软件申报课题 数据脱敏 数据脱敏传输规范 远程测试实操指南 远程测试 易用性专业测试 软件易用性 政府企业软件采购验收 OA系统CMA软件测评 ERP系统CMA软件测评 CMA检测报告的法律价值 代码原创性 软件著作登记 软件著作权登记 教育APP备案 教育APP 信息化软件项目测评 信息化软件项目 校园软件项目验收标准 智慧软件项目 智慧校园软件项目 CSRF漏洞自动化测试 漏洞自动化测试 CSRF漏洞 反序列化漏洞测试 反序列化漏洞原理 反序列化漏洞 命令执行 命令注入 漏洞检测 文件上传漏洞 身份验证 出具CMA测试报告 cma资质认证 软件验收流程 软件招标文件 软件开发招标 卓码软件测评 WEB安全测试 漏洞挖掘 身份验证漏洞 测评网站并发压力 测评门户网站 Web软件测评 XSS跨站脚本 XSS跨站 C/S软件测评 B/S软件测评 渗透测试 网站安全 网络安全 WEB安全 并发压力测试 常见系统验收单 CRM系统验收 ERP系统验收 OA系统验收 软件项目招投 软件项目 软件投标 软件招标 软件验收 App兼容性测试 CNAS软件检测 CNAS软件检测资质 软件检测 软件检测排名 软件检测机构排名 Web安全测试 Web安全 Web兼容性测试 兼容性测试 web测试 黑盒测试 白盒测试 负载测试 软件易用性测试 软件测试用例 软件性能测试 科技项目验收测试 首版次软件 软件鉴定测试 软件渗透测试 软件安全测试 第三方软件测试报告 软件第三方测试报告 第三方软件测评机构 湖南软件测评公司 软件测评中心 软件第三方测试机构 软件安全测试报告 第三方软件测试公司 第三方软件测试机构 CMA软件测试 CNAS软件测试 第三方软件测试 移动app测试 软件确认测试 软件测评 第三方软件测评 软件测试公司 软件测试报告 跨浏览器测试 软件更新 行业资讯 软件测评机构 大数据测试 测试环境 网站优化 功能测试 APP测试 软件兼容测试 安全测评 第三方测试 测试工具 软件测试 验收测试 系统测试 测试外包 压力测试 测试平台 bug管理 性能测试 测试报告 测试框架 CNAS认可 CMA认证 自动化测试
专业测试,找专业团队,请联系我们!
咨询软件测试 400-607-0568