程序员经典面试题mysql 索引(运维dba经典面试题)
程序员经典面试题mysql 索引(运维dba经典面试题)3>.InnoDB支持MVCC 而MyISAM不支持2>.InnoDB支持行级锁,而MyISAM支持表级锁(3)从:sql执行线程——执行relay log中的语句;(1)、问5点不同:1>.InnoDB支持事物,而MyISAM不支持事物
概述想知道MySQL dba运维面试时都会被问到哪些问题吗?特整理出20个运维经典面试题供大家参考学习,据说知道一半答案的人,月薪能过万~
1、mysql的复制原理以及流程
基本原理流程,3个线程以及之间的关联;
(1)主:binlog线程——记录下所有改变了数据库数据的语句,放进master上的binlog中;
(2)从:io线程——在使用start slave 之后,负责从master上拉取 binlog 内容,放进 自己的relay log中;
(3)从:sql执行线程——执行relay log中的语句;
2、MySQL中MyISAM与innodb的区别,至少5点
(1)、问5点不同:
1>.InnoDB支持事物,而MyISAM不支持事物
2>.InnoDB支持行级锁,而MyISAM支持表级锁
3>.InnoDB支持MVCC 而MyISAM不支持
4>.InnoDB支持外键,而MyISAM不支持
5>.InnoDB不支持全文索引,而MyISAM支持。
(2)、innodb引擎的4大特性:
插入缓冲(insert buffer);
二次写(double write);
自适应哈希索引(ahi);
预读(read ahead)。
(3)、2者select count(*)哪个更快,为什么
myisam更快,因为myisam内部维护了一个计数器,可以直接调取。
3、MySQL中varchar与char的区别以及varchar(50)中的50代表的含义
(1)、varchar与char的区别
char是一种固定长度的类型,varchar则是一种可变长度的类型。
(2)、varchar(50)中50的含义
最多存放50个字符,varchar(50)和(200)存储hello所占空间一样,但后者在排序时会消耗更多内存,因为order by col采用fixed_length计算col长度(memory引擎也一样)。
(3)、int(20)中20的含义
是指显示字符的长度
但要加参数的,最大为255,比如它是记录行数的id 插入10笔资料,它就显示00000000001 ~~~00000000010,当字符的位数超过11 它也只显示11位,如果你没有加那个让它未满11位就前面加0的参数,它不会在前面加0
20表示最大显示宽度为20,但仍占4字节存储,存储范围不变;
(4)、mysql为什么这么设计
对大多数应用没有意义,只是规定一些工具用来显示字符的个数;int(1)和int(20)存储和计算均一样。
4、innodb的事务与日志的实现方式
(1)、有多少种日志:
错误日志:记录出错信息,也记录一些警告信息或者正确的信息。
查询日志:记录所有对数据库请求的信息,不论这些请求是否得到了正确的执行。
慢查询日志:设置一个阈值,将运行时间超过该值的所有SQL语句都记录到慢查询的日志文件中。
二进制日志:记录对数据库执行更改的所有操作。
中继日志。
事务日志。
(2)、事物的4种隔离级别
mysql默认的事务隔离级别为repeatable-read
(3)、事务是如何通过日志来实现的
事务日志是通过redo和innodb的存储引擎日志缓冲(Innodb log buffer)来实现的,当开始一个事务的时候,会记录该事务的lsn(log sequence number)号; 当事务执行时,会往InnoDB存储引擎的日志缓存里面插入事务日志;当事务提交时,必须将存储引擎的日志缓冲写入磁盘(通过innodb_flush_log_at_trx_commit来控制),也就是写数据前,需要先写日志。这种方式称为“预写日志方式”。
5、sql优化
(1)、explain出来的各种item的意义;
select_type:表示查询中每个select子句的类型
type:表示MySQL在表中找到所需行的方式,又称“访问类型”
possible_keys:指出MySQL能使用哪个索引在表中找到行,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用
key:显示MySQL在查询中实际使用的索引,若没有使用索引,显示为NULL
key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度
ref:表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值
Extra:包含不适合在其他列中显示但十分重要的额外信息。
(2)、profile的意义以及使用场景;
查询到 SQL 会执行多少时间 并看出 CPU/Memory 使用量 执行过程中 Systemlock Table lock 花多少时间等等。
6、备份计划,mysqldump以及xtranbackup的实现原理
(1)、备份计划;
这里每个公司都不一样,别说那种1小时1全备什么的就行,建议根据数据量来说。
(2)、备份恢复时间;
这里跟机器,尤其是硬盘的速率有关系,以下列举几个仅供参考
20G的2分钟(mysqldump)
80G的30分钟(mysqldump)
111G的30分钟(mysqldump)
288G的3小时(xtra)
3T的4小时(xtra)
逻辑导入时间一般是备份时间的5倍以上
(3)、xtrabackup实现原理
在InnoDB内部会维护一个redo日志文件,我们也可以叫做事务日志文件。事务日志会存储每一个InnoDB表数据的记录修改。当InnoDB启动时,InnoDB会检查数据文件和事务日志,并执行两个步骤:它应用(前滚)已经提交的事务日志到数据文件,并将修改过但没有提交的数据进行回滚操作。
7、innodb的读写参数优化
(1)、读取参数
global buffer pool以及 local buffer;
(2)、写入参数;
innodb_flush_log_at_trx_commit
innodb_buffer_pool_size
(3)、与IO相关的参数;
innodb_write_io_threads = 8
innodb_read_io_threads = 8
innodb_thread_concurrency = 0
(4)、缓存参数以及缓存的适用场景。
query cache/query_cache_type
并不是所有表都适合使用query cache。造成query cache失效的原因主要是相应的table发生了变更
- 第一个:读操作多的话看看比例,简单来说,如果是用户清单表,或者说是数据比例比较固定,比如说商品列表,是可以打开的,前提是这些库比较集中,数据库中的实务比较小。
- 第二个:我们“行骗”的时候,比如说我们竞标的时候压测,把query cache打开,还是能收到qps激增的效果,当然前提示前端的连接池什么的都配置一样。大部分情况下如果写入的居多,访问量并不多,那么就不要打开,例如社交网站的,10%的人产生内容,其余的90%都在消费,打开还是效果很好的,但是你如果是qq消息,或者聊天,那就很要命。
第三个:小网站或者没有高并发的无所谓,高并发下,会看到 很多 qcache 锁 等待,所以一般高并发下,不建议打开query cache。
8、你是否做过主从一致性校验,如果有,怎么做的,如果没有,你打算怎么做?
主从一致性校验有多种工具 例如checksum、mysqldiff、pt-table-checksum等。
9、表中有大字段X(例如:text类型),且字段X不会经常更新,以读为为主,请问
(1)、选择拆成子表,还是继续放一起;
(2)、写出这样选择的理由。
答:拆带来的问题:连接消耗 存储拆分空间;不拆可能带来的问题:查询性能;
如果能容忍拆分带来的空间问题 拆的话最好和经常要查询的表的主键在物理结构上放置在一起(分区) 顺序IO 减少连接消耗 最后这是一个文本列再加上一个全文索引来尽量抵消连接消耗。
如果能容忍不拆分带来的查询性能损失的话:上面的方案在某个极致条件下肯定会出现问题 那么不拆就是最好的选择。
10、MySQL中InnoDB引擎的行锁是通过加在什么上完成(或称实现)的?
答:InnoDB是基于索引来完成行锁
例: select * from tab_with_index where id = 1 for update;
for update 可以根据条件来完成行锁锁定 并且 id 是有索引键的列
如果 id 不是索引键那么InnoDB将完成表锁 并发将无从谈起
11、如何从mysqldump产生的全库备份中只恢复某一个库、某一张表?
在Mysqldump官方工具中,如何只恢复某个库呢?
全库备份
# mysqldump -uroot -p --single-transaction -A --master-data=2 >dump.sql
只还原erp库的内容
# mysql -uroot -pMANAGER erp --one-database <dump.sql
可以看出这里主要用到的参数是--one-database简写-o的参数,极大方便了我们的恢复灵活性。
那么如何从全库备份中抽取某张表呢,全库恢复,再恢复某张表小库还可以,大库就很麻烦了,那我们可以利用正则表达式来进行快速抽取,具体实现方法如下:
从全库备份中抽取出t表的表结构
# sed -e'/./{H;$!d;}' -e 'x;/CREATE TABLE `t`/!d;q' dump.sql DROP TABLE IF EXISTS`t`; /*!40101 SET@saved_cs_client =@@character_set_client */; /*!40101 SETcharacter_set_client = utf8 */; CREATE TABLE `t` ( `id` int(10) NOT NULL AUTO_INCREMENT `age` tinyint(4) NOT NULL DEFAULT '0' `name` varchar(30) NOT NULL DEFAULT '' PRIMARY KEY (`id`) ) ENGINE=InnoDBAUTO_INCREMENT=4 DEFAULT CHARSET=utf8; /*!40101 SETcharacter_set_client = @saved_cs_client */;
从全库备份中抽取出t表的内容
# grep'INSERT INTO `t`' dump.sql INSERT INTO `t`VALUES (0 0 '') (1 0 'aa') (2 0 'bbb') (3 25 'helei');
12、开放性问题:据说是腾讯的
一个6亿的表a,一个3亿的表b,通过外间tid关联,你如何最快的查询出满足条件的第50000到第50200中的这200条数据记录。
1、如果A表TID是自增长 并且是连续的 B表的ID为索引
select * from a b where a.tid = b.id and a.tid>500000 limit 200;
2、如果A表的TID不是连续的 那么就需要使用覆盖索引.TID要么是主键 要么是辅助索引 B表ID也需要有索引。
select * from b (select tid from a limit 50000 200) a where b.id = a .tid;
后面会分享更多DBA方面的内容,感兴趣的朋友可以关注一下~