李炳辰 发表于 2023-10-10 21:38:37

数据库分区

1.数据库分区

分区优点

1、与单个磁盘或文件系统分区相比,可以存储更多的数据。
2、通过删除与增加那些数据有关的分区,很容易地删除或增加那些数据。
3、一些查询可以得到极大的优化。
4、通过跨多个磁盘甚至服务器来分散数据查询,来获得更大询吞吐量。
5、MySQL5.5之后支持所有函数的分区优化。限定只查询有效的分区。
Range分区

基于属于一个给定连续区间的列值,把多行分配给分区。
ALTER TABLE titles
//分区语句   range
partition by range (year(from_date))// year(from_date)分区的依据
(
    partition po1 values less than (1985), 小于不包含[-无穷,1985)
    partition po2 values less than (1986),
    partition po3 values less than (1987),
    partition p04 values less than (1988),
    partition p15 values less than (1999),
    partition p16 values less than (MAXVALUE)
);list分区

类以于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。
create table t2 (id int,cid int,name varchar(20),pos_date datetime)
partition by list (cid)       
(
    partition po1 values in (1,2,3),
    partition p02 values in (4,5,6),
    partition po3 values in (7,8,9)
);Hash分区
基于用户定义的表达式的返回值来进行选择的分区,基于插入的行的列信息通过表达式计算返回非负整数来确定分区
使用HASH分区的优点在于数据分布较为均匀
create table t3 (id int,cid int,name varchar(20),pos_date datetime)
partition by hash(cid)
partitions 4;Linear Hash分区
1.缺点
数据分布不均衡(有的分区数据多,有的分区数据少)
2.优点

[*]增加、删除、合并和拆分分区快捷
[*]有利于处理大量数据表
create table t3 (id int,cid int,name varchar(20),pos_date datetime)
partition by linear hash(cid)
partitions 4;key分区

create table t3 (id int,cid int,name varchar(20),pos_date datetime)
partition by key(cid)
partitions 4;添加功能(mysql 5.5版本以上)

多列分区columns    (string date)

create table t4(a int,b int,c int)
partition by range columns(a,b)   //插入时按从左往右进行对比
(
   partition po1 values less than (10,20),
   partition p02 values less than (10,30),
   partition po3 values less than (10,maxvalue)
);子分区

子分区是分区表中每个分区的再次分割。
子分区可以用于特别大的表,在多个磁盘间分配数据和索引。
CREATE TABLE t5 (id INT,udate DATE)
PARTITION BY RANGE(YEAR(udate))
SUBPARTITION BY HASH(TO_DAYS(udate))
SUBPARTITIONS 2
(
    PARTITION PO VALUES LESS THAN(1990)
    PARTITION p1 VALUES LESS THAN (2000),
    PARTITION p2 VALUES LESS THAN MAXVALUE
);子分区将数据和索引分配到不同文件夹下,减轻单个I/O压力
CREATE TABLE t5 (id INT,udate DATE)
PARTITION BY RANGE(YEAR(udate))
SUBPARTITION BY HASH(TO_DAYS(udate))
(
   partition p0l values less than (1999)
    (
      subpartition s0
      data directory='/var/a/data'
      inde× directory="/var/a/idx',
      subpartition s1
      data directory='/var/b/data'
      index directory='/var/b/idx'
    ),
        partition p02 values less than (2000)
    (
      subpartition s2
      data directory='/var/c/data'
      index directory='/var/c/idx',
      subpartition s3
      data directory='/var/d/data'
      index directory='/var/d/idx'
    )
);分区管理和维护

1.alter进行简单修改分区

ALTER语句简单修改了分区。效果和先删除原表再按新的分区方式重新建表效果相同。
alter table t3 partition by key() partitions 22.删除分区

alter table t3 drop partitionp02//删除本分区结构和数据
alter table t3 truncate partition p01 //不删除本分区结构,只删除本分区数据3.range添加分区

partition by range (year(from_date))// year(from_date)分区的依据
(
    partition po1 values less than (1985), 小于不包含[-无穷,1985)
    partition po2 values less than (1986)
)
alter table t1 add partition (partition p02 values less than("date"))
注意
        "date"填写的数据必须高于上次创建分区的最大值4.list添加分区

partition by list (cid)       
(
    partition po1 values in (1,2,3),
    partition p02 values in (4,5,6),
    partition po3 values in (7,8,9)
);
alter table t1 add partition (partition p02 values in ("date"))
注意
"date"填写的数据不能包含原有的数据5.分区重组

ALTER TABLE t1 REORGANIZE PARTITION pO1 INTO(
PARTITION sO VALUES LESS THAN(5)
PARTITION s1 VALUES LESS THAN(10));
注意
        1.range分区重组 只能相邻的分区 不能跳过分区重组
        2.list分区重组,重组的必须覆盖原有区间6.hash和key分区数量

alter table t3 coalesce partition 2//在原有的分区数量上减少2个
alter table t3 add partition partitions 2 //在原有的分区数量上增加2个分片


[*]垂直分片
业务维度将表拆分到不同的数据库中,专库专用,分担数据库压力。

[*]水平分片
解决单表数据过大的问题
数据库索引



[*]按数据结构分类:B+tree索引 Hash索引Full-text索引,
[*]按物理存储分类: 聚集索引、非聚集索引。
[*]按字段特性分类:主键索引(PRIMARY KEY)、唯一索引(UNIQUE)、普通索 (INDEX)、全文索引(FULLTEXT)。
[*]按字段个数分类:单列索引、联合索引(也叫复合索引、组合索引)

来源:https://www.cnblogs.com/darkerKing/p/17752913.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: 数据库分区