`

数据库性能调优技术系列文章(1)--索引调优(摘自老杨)

阅读更多

一、概述

  随着数据库在各个领域的使用不断增长,越来越多的应用提出了高性能的要求。数据库性能调优是知识密集型的学科,需要综合考虑各种复杂的因素:数据库缓冲区的大小、索引的创建、语句改写等等。总之,数据库性能调优的目的在于使系统运行得更快。

  调优需要有广泛的知识,这使得它既简单又复杂。

  说调优简单,是因为调优者不必纠缠于复杂的公式和规则。许多学术界和业界的研究者都在尝试将调优和查询处理建立在数学基础之上。

  称调优复杂,是因为如果要完全理解常识所依赖的原理,还需要对应用、数据库管理系统、操作系统以及硬件有广泛而深刻的理解。

  数据库调优技术可以在不同的数据库系统中使用。如果需要调优数据库系统,最好掌握如下知识:1)查询处理、并发控制以及数据库恢复的知识;2)一些调优的基本原则。

  这里主要描述索引调优。

  二、索引调优

  索引是建立在表上的一种数据组织,它能提高访问表中一条或多条记录的特定查询效率。因此,适当的索引调优是很重要的。

  对于索引调优存在如下的几个误区:

  误区1:索引创建得越多越好?

  实际上:创建的索引可能建立后从来未使用。索引的创建也是需要代价的,对于删除、某些更新、插入操作,对于每个索引都要进行相应的删除、更新、插入操作。从而导致删除、某些更新、插入操作的效率变低。

  误区2:对于一个单表的查询,可以索引1进行过滤再使用索引2进行过滤?

  实际上:假设查询语句如下select * from t1 where c1=1 and c2=2,c1列和c2列上分别建有索引ic1、ic2。先使用ic1(或ic2)进行过滤,产生的结果集是临时数据,不再具有索引,所以不可使用ic2(或ic1)进行再次过滤。

  索引优化的基本原则:

  1.将索引和数据存放到不同的文件组

  没有将表数据和索引数据存储到不同的文件组,而不加区别地将它们存储到同一文件组。这样,不但会造成I/O竞争,也为数据库的维护工作带来不变。

  2.组合索引的使用

  假设存在组合索引it1c1c2(c1,c2),查询语句select * from t1 where c1=1 and c2=2能够使用该索引。查询语句select * from t1 where c1=1也能够使用该索引。但是,查询语句select * from t1 where c2=2不能够使用该索引,因为没有组合索引的引导列,即,要想使用c2列进行查找,必需出现c1等于某值。

  根据where条件的不同,归纳如下:

  1) c1=1 and c2=2:使用索引it1c1c2进行等值查找。

  2) c1=1 and c2>2:使用索引it1c1c2进行范围查找,可以有两种方法。

  方法1,使用通过索引键(1,2)在B树中命中一条记录,然后向后扫描找出 第一条符合条件的记录,从此记录往后的每一条记录都是符合条件的。这种方法的弊端在于:如果c1=1 and c2=2对应的记录数很多,会产生很多无效的扫描。

  方法2,如果c2对应的int型数据,可以使用索引键(1,3)在B树中命中一条记录,从此记录往后的每一条记录都是符合条件的。

  本文中的例子均采用方法1。

  3)c1>1 and c2=2:因为索引的第一个列不是等于号的,索引即使后面出现了c2=2,也不能将c2=2应用于索引查找。这里,通过索引键(1,- ∞)在B树中命中一条记录,向后扫描找出第一条符合c1>1的记录,此后的每一条记录判断是否符合c2=2,如果符合则输出,否则过滤掉。这里我们称c2=2没有参与到索引运算中去。这种情况在实际应用中经常出现。

  4)c1>1:通过索引键(1,- ∞) 在B树中命中一条记录,以此向后扫描找出第一条符合c1>1的记录,此后的每条记录都是符合条件的。

  3.唯一索引与非唯一索引的差异

  假设索引int1c1(c1)是唯一索引,对于查询语句select c1 from t1 where c1=1,数据库使用索引键(1)命中B树中一条记录,命中之后直接返回该记录(因为是唯一索引,所以最多只能有一条c1=1的记录)。

  假设索引it1c2(c2)是非唯一索引,对于查询语句select c2 from t2 where c2=2,数据库使用索引键(2)命中B树中一条记录,返回该记录,并继续向后扫描,如果该记录是满足c=2,返回该记录,继续扫描,直到遇到第一条不符合条件c2=2的记录。

  于是,我们可以得知,对于不存在重复值的列,创建唯一索引优于创建非唯一索引。

  4.非聚集索引的作用

  每张表只可能一个聚集索引,聚集索引用来组织真实数据。语句“create table employee (id int cluster primary key,name varchar(20),addr varchar(20))”。表employee的数据用id来组织。如果要查找id=1000的员工记录,只要用索引键(1000)命中该聚集索引。但是,对于要查找name=’张三’的员工记录就不能使用该索引了,需要进行全表扫描,对于每一条记录判断是否满足name=’张三’,这样会导致查询效率非常低。

  要使用聚集索引,必需提供id,我们只能提供name,于是需要引入一个辅助结构实现name到id的转换,这就是非聚集索引的作用。该非聚集索引的键是name,值是id。于是语句“select * from employee where name=’张三’”的执行流程是:通过键(’张三’)命中非聚集索引,得到对应的id值3(假设’张三’对应的id为3),然后用键(3)命中聚集索引,得到相应的记录。

  5.是不是使用非聚集索引的查询都需要进行聚集的查询?

  不是的,虽然在上一点中查询转换为聚集索引的查找,有时候可以只需要使用非聚集索引。

  创建表并创建相应的索引:create table t1(c1 int,c2 int,c3 int);create index it1c2c3 on t1(c2,c3)。查询语句为:select c3 from t1 where c2=1。

  因为索引it1c2c3(c2,c3)覆盖查询语句中的列(c2,c3)。所以,该查询语句的执行流程为:通过索引键(1,- ∞)命中索引it1c2c3,对于该记录直接返回c3对应的值,继续向后扫描,如果索引记录中c1还是等于1,那么输出c3,以此类推,直到出现第一条c1不等于1的索引记录,结束查询。

  6.创建索引的规则

  创建索引首先要考虑的是列的可选择性。比较一下列中唯一键的数量和表中记录的行数,就可以判断该列的可选择性。如果该列的“唯一键的数量/表中记录行数”的比值越接近于1,则该列的可选择行越高。在可选择性高的列上进行查询,返回的数据就较少,比较适合索引查询。相反,比如性别列上只有两个值,可选择行就很小,不适合索引查询。

分享到:
评论

相关推荐

    数据库性能调优技术--索引调优

    数据库性能调优技术--索引调优 作者:杨万富

    数据库性能调优.原理与技术2 - 中文电子书

    数据库性能调优.原理与技术 - 中文电子书 第1章 基本原理 1.1 原理的作用 1.2 个基本原理 1.3 基本原理和知识 第2章 事务处理调优 2.1 本章目标 2.2 封锁和并发控制 2.3 日志和恢复子系统 2.4 操作...

    数据库性能调优技术1索引调优.pdf

    数据库性能调优技术1索引调优,详细讲述了关于索引调优的方法建议

    数据库性能调优技术系列

    数据库性能调优技术系列说明手册,主要是索引方面的相关优化。

    数据库性能调优.原理与技术3 - 中文电子书

    数据库性能调优.原理与技术 - 中文电子书 第1章 基本原理 1.1 原理的作用 1.2 个基本原理 1.3 基本原理和知识 第2章 事务处理调优 2.1 本章目标 2.2 封锁和并发控制 2.3 日志和恢复子系统 2.4 操作...

    数据库 性能调优 技术

    数据库性能调优是知识密集型的学科,需要综合考虑各种复杂的因素:数据库缓冲区的大小、索引的创建、语句改写等等。总之,数据库性能调优的目的在于使系统运行得更快。 调优需要有广泛的知识,这使得它既简单又复杂...

    oracle数据库性能调优(1)

    数据库性能调优是知识密集型的学科,需要综合考虑各种复杂的因素:数据库缓冲区的大小、索引的创建、语句改写等等。总之,数据库性能调优的目的在于使系统运行得更快。数据库调优技术可以在不同的数据库系统中使用。...

    oracle数据库性能调优(2)

    数据库性能调优是知识密集型的学科,需要综合考虑各种复杂的因素:数据库缓冲区的大小、索引的创建、语句改写等等。总之,数据库性能调优的目的在于使系统运行得更快。数据库调优技术可以在不同的数据库系统中使用。...

    mysql面试题-mysql经典面试题目-数据库的基本概念-SQL语法-事务处理-索引优化-性能调优-mysql-面试题目

    什么是数据库?什么是关系数据库管理系统(RDBMS)? 什么是SQL?列举一些常见的SQL命令。...什么是数据库性能监控和调优工具?列举一些常用的工具。 什么是数据库连接字符串?它的格式和参数有哪些

    SQL 数据库性能调优方面的总结

    数据库调优可以使数据库应用运行...数据库调优技术可以在不同的数据库系统中使用,它不必纠缠于复杂的公式和规则,然而它需要对程序的应用、数据库管理系统、查询处理、并发控制、操作系统以及硬件有广泛而深刻的理解。

    DB2数据库性能调整和优化 牛新庄 PDF

    DB2数据库性能调整和优化(第2版)侧重于介绍DB2数据库的性能调优。性能调优是一个系统工程:全面监控分析操作系统、I/O性能、内存、应用及数据库才能快速找到问题根源;深刻理解DB2的锁及并发机制、索引原理、数据库...

    大型数据库系统技术课程 5-1-ORACLE_index Oracle索引 共38页.pptx

    大型数据库系统技术课程 5-1-ORACLE_index Oracle索引 共38页.pptx

    mysql数据库的性能调优方法

    mysql数据库的性能调优方法.之前介绍了相关mysql的性能调优,针对innodb存储引擎的使用进行性能调优的方法,Jason也留下点Memory。首先当然要提到的是innodb的关键特性:插入缓冲,两次写。  之前介绍了相关mysql的...

    DB2数据库调优索引

    DB2数据库的索引调优,保证大家看了不觉得后悔

    SQL Server 数据库技术---基础篇、数据库安全、SQL开发、数据库性能优化

    SQL Server 数据库技术---基础篇(T-SQL基础、数据库几本操作、SQL Server 2008新特性)、数据库安全(SQL Server 2008 安全数据...、数据库性能优化(数据库存储与索引、数据查询、事务处理、数据库系统调优 工具)

    SQL-Server程序性能调优

    SQL Server硬件配置、选择硬件、调优服务器、优化SQL Server配置、SQL Server设计优化、优化数据库的设计、SQL Server调优SQL编程、如何优化你的T-SQL代码、谨慎使用触发器、 避免使用游标(Cursors)、合理使用联合...

Global site tag (gtag.js) - Google Analytics