首页 > IT知识 > Oracle迁移到MySQL性能下降的注意点

Oracle迁移到MySQL性能下降的注意点

2017年08月01日11:25:25来源:海文国际         83
分享到:
IT知识文章: 


最近有较多的客户系统由原来由Oracle改造到MySQL后出现了性能问题CPU100%,或是后台的CRM系统复杂SQL在业务高峰的时候出现堆积导致业务故障。

在我的记忆里面淘宝最初从Oracle迁移到MySQL期间也遇到了很多SQL的性能问题,记忆最为深刻的子查询,当初的版本是MySQL5.1,这个版本对子查询的优化较差,导致了很多从Oracle迁移到MySQL的系统出现过性能问题,所以后面的开发规范中规定前台交易系统不要有复杂的表join。

接下来我将列举一些常见从Oracle迁移到MySQL过程中可能出现问题的点:

1).当客户进行去O数据迁移时,存在必须改、不用改和可改可不改的三大类SQL。对于可改可不改的,我们应提供一些指导性的建议,帮助用户规避将来碰到可能存在的问题。

2).指导数据库研发人员、数据库管理员合理使用MySQL,发挥MySQL最优性能。

1并行处理

1.1背景介绍

Oracle能够将一个大型串行任务(任何DML,一般的DDL)物理的划分为叫多个小的部分,这些较小的部分可以同时得到处理,最后将每个较小部分得到的结果组合起来得到最终结果,所以Oracle在OLAP的应用场景中可以利用并行处理技术来运行非常复杂的SQL查询。

启动并行查询几种方式:

(1)、在查询中使用一个hint提示:select/*+parallel(4)/count()fromtest_a;—指定一个并行度为4的并行查询。

(2)、利用altertable修改表:altertabletest_aparallel4;–告诉oracle,在创建这个表的执行计划时,使用并行度4。

1.2改造建议

由于MySQL不支持并行处理,所以当应用从Oracle迁移到MySQL后,需要特别注意使用了并行处理的SQL语句。处理建议:

(1)、在阿里云平台上可以使用ADS这样的分析型数据库产品来处理Oracle中的并行分析查询。

(2)、将复杂SQL语句进行业务分解,拆解为单条的SQL语句,将计算结果放到应用中进行处理。

2SQL执行逻辑读,物理读,消耗时间

2.1背景介绍

对比MySQL的优化器,Oracle的优化器有着丰富和完善的优化算法,仅表连接上Oracle支持nestedloop、hashjoin、sort-mergejoin三种算法,而MySQL仅仅支持其中的nestedloop算法,所以在一些大表关联以及多表关联的复杂查询中MySQL的处理能力会明显下降。那该如何去鉴别一些不适合迁移到MySQL的查询?可以根据SQL执行中的一些关键数据:逻辑读,物理读,消耗时间来判断。

物理读:把数据从数据块读取到buffercache中。

逻辑读:指从BufferCache中读取数据块。

执行时间:Oracle执行一条SQL所消耗的时间。

(1)、第一次查询一个表t

select*fromt;

(2)、第二次查询:

select*fromt;

第一次查询有6次物理读,第二次查询有0个物理读,6个逻辑读。当数据块第一次读取到,就会缓存到buffercache中,而第二次读取和修改该数据块时就在内存buffercache了。

Oracle性能调优中,逻辑读是个很重要的度量值,它不仅容易收集,而且能够告诉我们许多关于数据库引擎工作量的信息。逻辑读是在执行SQL语句的时候从高速缓存中读取的块数。

2.2改造建议

MySQL对于简单的SQL语句执行是非常快的,对于Oracle应用中逻辑读,物理读或者执行时间非常高的SQL迁移到MySQL后则不在适合了,需要进行改造:

(1)、单表查询逻辑读,物理读和执行时间比较长的情况,SQL可能发生了全表扫描(dump需求)或者索引不优,可以使用只读节点来承受dump或者对索引进行优化。

(2)、多表查询逻辑读,物理读和执行时间比较长的情况,可以使用ADS分析型数据库产品来处理;

(3)、多表查询逻辑读,物理读和执行时间比较长的情况,可以进行业务分解,拆解为单条的SQL语句,将计算结果放到应用中进行处理。

备注:逻辑读和物理读如果超过100W,执行时间超过5S,则属于较大的SQL查询。

3.In(…..)

3.1背景介绍

Oracle中对in(….)的参数限制是1000个,在MySQL中虽然没有个数限制但有SQL长度的限制,同时优化器在对in(…)的查询进行优化的时候采用二分查找,所以in(…)的个数越多性能会越差,所以建议控制in的数目,不要超过100个。

3.2改造建议

Oracle:select*fromtwhereidin(id1,id2…..id1000);

MySQL:select*fromtwhereidin(id1,id2…..id100);

4子查询

4.1背景介绍

MySQL在5.6版本以前处理子查询的时候由于优化器只支持nestedloop算法,所以当关联表较大的时候会带来性能瓶颈。笔者曾经参加过一次大型项目从Oracle迁移的MySQL的迁移,当时数据库的版本是5.5,原Oracle应用中存在大量的子查询,当迁移到MySQL后SQL执行出现堆积,连接数打满,数据库的cpu很快耗完,最后将子查询修改后系统才恢复。

典型子查询

SELECTfirst_name

FROMemployees

WHEREemp_noIN

(SELECTemp_noFROMsalaries_2000WHEREsalary=5000);

MySQL的处理逻辑是遍历employees表中的每一条记录,代入到子查询中中去

4.2改造建议

改写子查询

SELECTfirst_name

FROMemployeesemp,

(SELECTemp_noFROMsalaries_2000WHEREsalary=5000)sal

WHEREemp.emp_no=sal.emp_no;

备注:子查询在5.1,5.5版本中都存在较大风险,将子查询改为关联。

使用Mysql5.6的版本,可以避免麻烦的子查询改写的问题。

5视图优化

5.1背景介绍

普通的视图并没有存储实际的信息,它所操作的数据来自于基本表,所以在普通视图上不可以创建索引。那当需要对视图进行大量查询,而查询效率较低时,如何处理呢?Oracle中有物化视图,物化视图是物理真实存在的,可以创建索引。而MySQL并不支持物化视图,所以当Oracle中的视图迁移到MySQL后由于没有物化视图,可能导致性能下降。

5.2改造建议

将视图进行业务拆分,由应用进行实现。

6函数索引

6.1背景介绍

基于函数的索引,类似于普通的索引,只是普通的索引是建立在列上,而它是建立在函数上。当然这回对插入数据有一定影响,因为需要通过函数计算一下,然后生成索引。但是插入数据一般都是少量插入,而查询数据一般数据量比较大。为了优化查询速度,稍微降低点插入速度是可以承担的。

MySQL并不支持函数索引,所以当Oracle中有使用函数索引的SQL语句迁移到MySQL后,由于无法使用索引导致全表扫描会出现性能下降。

比如执行如下一条SQL语句:

select*fromempwheredate(gmt_create)=‘2017-02-20’

即使在gmt_create上建立了索引,还是会全表扫描emp表,将里面的gmt_create字段去除掉时分秒后进行比较。如果我们建立一个基于函数的索引,比如:createindexemp_upper_idxonemp(date(gmt_create));这个时候,我们只需要按区间扫描小部分数据,然后获取rowid取访问表中的数据,这个速度是比较快的。

6.2改造建议

通过SQL改写去除字段上的函数,从而可以使用字段上的索引:

select*fromempwheregmt_create>=’2017-01-2000:00:00’andgmt_created<’2017-01-2100:00:00’

7总结

(1).MySQL不支持并行查询,需要进行改造(关键字:parallel)。

(2).MySQL优化器较弱,对于逻辑读,物理读和执行时间较长的SQL需要注意。

(3).MySQL对于in(…)参数数目建议不要超过100个。

(4).MySQL对于子查询优化不是很好,建议改造子查询或者使用5.6数据库版本。

(5).MySQL不支持物化视图,建议应用改造视图。

(6).MySQL不支函数索引,建议应用改写SQL避免索引无法使用。

本文来自阿里云数据库团队内核组