Skip to content

Latest commit

 

History

History
551 lines (393 loc) · 65.9 KB

release-7.1.0.md

File metadata and controls

551 lines (393 loc) · 65.9 KB
title summary
TiDB 7.1.0 Release Notes
了解 TiDB 7.1.0 版本的新功能、兼容性变更、改进提升,以及错误修复。

TiDB 7.1.0 Release Notes

发版日期:2023 年 5 月 31 日

TiDB 版本:7.1.0

试用链接:快速体验 | 生产部署 | 下载离线包

TiDB 7.1.0 为长期支持版本 (Long-Term Support Release, LTS)。

相比于前一个 LTS(即 6.5.0 版本),7.1.0 版本包含 6.6.0-DMR7.0.0-DMR 中已发布的新功能、提升改进和错误修复,并引入了以下关键特性:

分类 功能 描述
可扩展性与性能 TiFlash 支持存储计算分离和 S3 共享存储(实验特性,从 v7.0.0 开始引入) TiFlash 增加云原生架构的支持作为可选项:
  • 支持存算分离架构,提升 HTAP 资源的弹性能力。
  • 支持基于 S3 的存储引擎,以更低的成本提供共享存储。
TiKV 支持批量聚合数据请求(从 v6.6.0 开始引入) TiDB 支持将发送到相同 TiKV 实例的数据请求部分合并,减少子任务的数量和 RPC 请求的开销。在数据离散分布且 gRPC 线程池资源紧张的情况下,批量化请求能够提升性能超 50%。
基于负载的副本读取 在读热点场景中,TiDB 可以将热点 TiKV 节点的读请求转发到副本。该功能有效地打散了读热点并优化了集群资源的利用。你可以通过调整系统变量 tidb_load_based_replica_read_threshold 控制基于负载的副本读取的触发阈值。
TiKV 支持 Partitioned Raft KV 存储引擎 (实验特性) TiKV 引入新一代存储引擎 Partitioned Raft KV,通过每个数据 Region 独享 RocksDB 实例,可将集群的存储能力从 TB 级扩展到 PB 级,并提供更稳定的写入延迟和更强大的扩容能力。
稳定性与高可用 资源管控 (GA) 支持基于资源组的资源管控,为同一集群中的不同工作负载分配并隔离资源。该功能显著提升了多应用集群的稳定性,并为多租户奠定了基础。在 v7.1.0 中,资源管控引入了根据实际负载或硬件部署估算集群容量的能力。
TiFlash 支持数据落盘(从 v7.0.0 开始引入) TiFlash 支持将中间结果落盘,以缓解数据密集型操作(如聚合、排序和 Hash Join)中的 OOM 问题。
SQL 多值索引 (GA) 引入 MySQL 兼容的多值索引,增强 JSON 类型,提升 TiDB 对 MySQL 8.0 的兼容性。该功能提升了对多值列进行成员检查的效率。
行级 TTL(从 v7.0.0 开始 GA) 支持通过后台任务自动删除超过生命周期 (Time to live) 的数据,并以此来自动管理数据规模并提高性能。
生成列 (GA) 生成列 (Generated Columns) 的值是通过实时计算列定义中的 SQL 表达式得到的。该功能将一些应用逻辑推向数据库层,从而提升查询效率。
安全 LDAP 身份认证 TiDB 支持与 MySQL 8.0 兼容的 LDAP 身份认证。
增强数据库审计功能(企业版 TiDB 企业版增强了数据库审计功能,通过更细粒度的事件过滤控制、更友好的过滤条件设置方式、新增的 JSON 文件输出格式、审计日志的生命周期管理,大幅提升了系统的审计能力。

功能详情

性能

  • 增强 Partitioned Raft KV 存储引擎(实验特性)#11515 #12842 @busyjay @tonyxuqqi @tabokie @bufferflies @5kbpers @SpadeA-Tang @nolouch

    TiDB v6.6.0 引入了 Partitioned Raft KV 存储引擎作为实验特性,该引擎使用多个 RocksDB 实例存储 TiKV 的 Region 数据,每个 Region 的数据都独立存储在单独的 RocksDB 实例中。Partitioned Raft KV 能够更好地控制 RocksDB 实例的文件数和层级,实现 Region 间数据操作的物理隔离,并支持平稳管理更多的数据。与原 TiKV 存储引擎相比,使用 Partitioned Raft KV 引擎在相同硬件条件和读写混合场景下,可以实现大约两倍的写入吞吐并缩短大约 4/5 的弹性扩展时间。

    在 TiDB v7.1.0 中,Partitioned Raft KV 引擎支持 TiDB Lightning、BR 和 TiCDC 等工具。

    该功能目前是实验特性,不推荐在生产环境中使用。目前仅支持在新集群中使用新引擎,暂不支持从原 TiKV 存储引擎直接升级到该引擎。

    更多信息,请参考用户文档

  • TiFlash 查询支持延迟物化功能 (GA) #5829 @Lloyd-Pottiger

    在 v7.0.0 中,TiFlash 引入了延迟物化实验特性,用于优化查询性能。该特性默认关闭(系统变量 tidb_opt_enable_late_materialization 默认为 OFF)。当 SELECT 语句中包含过滤条件(WHERE 子句)时,TiFlash 默认会先读取该查询所需列的全部数据,然后再根据查询条件对数据进行过滤、聚合等计算任务。开启该特性后,TiFlash 支持下推部分过滤条件到 TableScan 算子,即先扫描过滤条件相关的列数据,过滤得到符合条件的行后,再扫描这些行的其他列数据,继续后续计算,从而减少 IO 扫描和数据处理的计算量。

    从 v7.1.0 开始,TiFlash 延迟物化功能正式 GA,默认开启(系统变量 tidb_opt_enable_late_materialization 默认为 ON),TiDB 优化器会根据统计信息和查询的过滤条件,决定哪些过滤条件会被下推到 TableScan 算子。

    更多信息,请参考用户文档

  • TiFlash 支持根据网络交换数据量自动选择 MPP 模式的 Join 算法 #7084 @solotzg

    TiFlash MPP 模式有多种 Join 算法。在 v7.1.0 之前的版本中,TiDB 根据变量 tidb_broadcast_join_threshold_counttidb_broadcast_join_threshold_size 以及实际数据量决定 TiFlash MPP 模式是否使用 Broadcast Hash Join 算法。

    在 v7.1.0 中,TiDB 引入变量 tidb_prefer_broadcast_join_by_exchange_data_size,控制是否基于最小网络数据交换策略选择 MPP Join 算法。该变量默认关闭,表示默认保持 v7.1.0 之前的算法选择策略。如需开启,请设置该变量为 ON。开启后,你无需再手动调整 tidb_broadcast_join_threshold_counttidb_broadcast_join_threshold_size 的阈值(此时这两个变量将不再生效),TiDB 会自动估算不同 Join 算法所需进行网络交换的数据量,然后选择综合开销较小的算法,从而减少网络流量,提升 MPP 查询性能。

    更多信息,请参考用户文档

  • 支持自适应副本读取缓解读热点 #14151 @sticnarf @you06

    在读热点场景中,热点 TiKV 无法及时处理读请求,导致读请求排队。但是,此时并非所有 TiKV 资源都已耗尽。为了降低延迟,TiDB v7.1.0 引入了负载自适应副本读取功能,允许从其他有可用资源的 TiKV 节点读取副本,而无需在热点 TiKV 节点排队等待。你可以通过 tidb_load_based_replica_read_threshold 系统变量控制读请求的排队长度。当 leader 节点的预估排队时间超过该阈值时,TiDB 会优先从 follower 节点读取数据。在读热点的情况下,与不打散读热点相比,该功能可提高读取吞吐量 70%~200%。

    更多信息,请参考用户文档

  • 增强缓存非 Prepare 语句执行计划的能力(实验特性)#36598 @qw4990

    TiDB v7.0.0 引入了非 Prepare 语句的执行计划缓存作为实验特性,以提升在线交易场景的并发处理能力。在 v7.1.0 中,TiDB 继续增强非 Prepare 语句执行计划,支持缓存更多模式的 SQL。

    为了提升内存利用率,TiDB v7.1.0 将非 Prepare 与 Prepare 语句的缓存池合并。你可以通过系统变量 tidb_session_plan_cache_size 设置缓存大小。原有的系统变量 tidb_prepared_plan_cache_sizetidb_non_prepared_plan_cache_size 被废弃。

    为了保持向前兼容,从旧版本升级到 v7.1.0 时,缓存池大小 tidb_session_plan_cache_size 的值与 tidb_prepared_plan_cache_size 保持一致,tidb_enable_non_prepared_plan_cache 保持升级前的设置。经过性能测试后,你可通过 tidb_enable_non_prepared_plan_cache 开启非 Parepare 语句的执行计划缓存功能。

    非 Prepare 语句执行计划缓存默认不支持 DML 语句,若要启用支持,你可以将 tidb_enable_non_prepared_plan_cache_for_dml 系统变量设置为 ON

    更多信息,请参考用户文档

  • DDL 支持分布式并行执行框架(实验特性)#41495 @benjamin2037

    TiDB v7.1.0 之前的版本中,在同一时间只有一个 TiDB 节点能够担任 DDL Owner 并执行 DDL 任务。从 TiDB v7.1.0 开始,在新的分布式并行执行框架下,多个 TiDB 节点可以并行执行同一项 DDL 任务,从而更好地利用 TiDB 集群的资源,大幅提升 DDL 的性能。此外,你还可以通过增加 TiDB 节点来线性提升 DDL 的性能。需要注意的是,该特性是实验性特性,目前仅支持 ADD INDEX 操作。

    如果要使用分布式并行执行框架,只需将 tidb_enable_dist_task 的值设置为 ON

    SET GLOBAL tidb_enable_dist_task = ON;

    更多信息,请参考用户文档

稳定性

  • 资源管控成为正式功能 (GA) #38825 @nolouch @BornChanger @glorv @tiancaiamao @Connor1996 @JmPotato @hnes @CabinfeverB @HuSharp

    TiDB 持续增强资源管控能力,在 v7.1.0 该功能正式 GA。该特性将极大地提升 TiDB 集群的资源利用率和性能表现。资源管控特性的引入对 TiDB 具有里程碑的意义,你可以将一个分布式数据库集群划分成多个逻辑单元,将不同的数据库用户映射到对应的资源组中,并根据实际需求设置每个资源组的配额。当集群资源紧张时,同一资源组内的会话所使用的全部资源将受到配额限制,防止某一资源组的过度消耗对其他资源组的会话造成影响。

    该特性也可以将多个来自不同系统的中小型应用整合到同一个 TiDB 集群中。即使某个应用的负载增加,也不会影响其他应用的正常运行。而在系统负载较低的时候,繁忙的应用即使超出设定的配额,仍可获得所需系统资源,实现资源的最大化利用。此外,合理利用资源管控特性可以减少集群数量,降低运维难度及管理成本。

    在 TiDB v7.1.0 中,该特性增加了基于实际负载和硬件部署来估算系统容量上限的能力,为你进行容量规划提供更准确的参考。这有助于你更好地管理 TiDB 的资源分配,从而满足企业级场景的稳定性需求。

    为了更好的用户体验,TiDB Dashboard 增加了资源管控的管理页面。你可以在该页面查看资源组配置,并通过可视化的方式进行容量预估,便于合理配置资源。

    更多信息,请参考用户文档

  • 支持 Fast Online DDL 的检查点机制,提升容错性和自动恢复能力 #42164 @tangenta

    TiDB v7.1.0 引入 Fast Online DDL 的检查点机制,可以大幅提升 Fast Online DDL 的容错性和自动恢复能力。即使 TiDB owner 因故障重启或者切换,TiDB 也能够通过自动定期保存的检查点恢复部分进度,从而让 DDL 执行更加稳定高效。

    更多信息,请参考用户文档

  • BR 备份恢复工具支持断点恢复 #42339 @Leavrth

    快照恢复或日志恢复会因为一些可恢复性错误导致提前结束,例如硬盘空间占满、节点宕机等突发情况。在 TiDB v7.1.0 之前,即使错误被及时处理,之前恢复的进度也会作废,你需要重新进行恢复。对大规模集群来说,会造成大量额外成本。

    为了尽可能继续上一次的恢复,从 TiDB v7.1.0 起,备份恢复特性引入了断点恢复的功能。该功能可以在意外中断后保留上一次恢复的大部分进度。

    更多信息,请参考用户文档

  • 优化统计信息缓存加载策略 #42160 @xuyifangreeneyes

    TiDB v7.1.0 引入了轻量级的统计信息初始化功能作为实验特性。轻量级的统计信息初始化可以大幅减少启动时必须加载的统计信息的数量,从而提升启动过程中统计信息的加载速度。该功能提升了 TiDB 在复杂运行环境下的稳定性,并降低了部分 TiDB 节点重启对整体服务的影响。你可以通过修改 TiDB 配置参数 lite-init-statstrue 来开启该特性。

    在 TiDB 启动阶段,如果在初始统计信息加载完成之前执行 SQL,可能会产生不合理的执行计划,进而造成性能问题。为了避免这种情况,TiDB v7.1.0 引入了配置项 force-init-stats。你可以控制 TiDB 是否在统计信息初始化完成后再对外提供服务。该配置项默认关闭。

    更多信息,请参考用户文档

  • TiCDC 支持单行数据正确性校验功能 #8718 #42747 @3AceShowHand @zyguan

    从 v7.1.0 开始,TiCDC 引入了单行数据正确性校验功能。该功能基于 Checksum 算法对单行数据的正确性进行校验,可以校验一行数据从 TiDB 写入、通过 TiCDC 同步,到写入 Kafka 集群的过程中是否出现错误。TiCDC 数据正确性校验功能仅支持下游是 Kafka 的 Changefeed,目前支持 Avro 协议。

    更多信息,请参考用户文档

  • TiCDC 优化 DDL 同步操作 #8686 @hi-rustin

    在 v7.1.0 之前,当用户在一个大表上进行 DDL 操作时,如果 DDL 操作影响该表中的所有行(例如添加或删除列),TiCDC 的同步延迟会显著增加。从 v7.1.0 开始,TiCDC 对此进行了优化,减轻 DDL 操作对下游延迟的影响。

    更多信息,请参考用户文档

  • 提升 TiDB Lightning 导入 TiB 级别数据时的稳定性 #43510 #43657 @D3Hunter @lance6716

    从 v7.1.0 开始,TiDB Lightning 增加了四个配置项,可以提升在导入 TiB 级数据时的稳定性。

    • tikv-importer.region-split-batch-size 用于控制批量 split Region 时的 Region 个数,默认值为 4096
    • tikv-importer.region-split-concurrency 用于控制 Split Region 时的并发度,默认值为 CPU 核心数。
    • tikv-importer.region-check-backoff-limit 用于控制 split 和 scatter 操作后等待 Region 上线的重试次数,默认值为 1800。重试符合指数回退策略,最大重试间隔为 2 秒。若两次重试之间有任何 Region 上线,该次操作不会被计为重试次数。
    • tikv-importer.pause-pd-scheduler-scope 控制 TiDB Lightning 暂停 PD 调度的范围。默认值为 "table",可选值为 "table""global"。对于 TiDB v6.1.0 之前的版本,只能配置 "global" 选项,即导入数据过程中暂停全局调度。从 v6.1.0 开始,支持 "table" 选项,表示仅暂停目标表数据范围所在 Region 的调度。建议在数据量较大的场景将该配置项设置为 "global",以提升稳定性。

    更多信息,请参考用户文档

SQL 功能

  • 支持通过 INSERT INTO SELECT 语句保存 TiFlash 查询结果 (GA) #37515 @gengliqi

    从 v6.5.0 起,TiDB 支持下推 INSERT INTO SELECT 语句中的 SELECT 子句(分析查询)到 TiFlash,你可以将 TiFlash 的查询结果方便地保存到 INSERT INTO 指定的 TiDB 表中供后续分析使用,起到了结果缓存(即结果物化)的效果。

    在 v7.1.0 版本中,该功能正式 GA。当 TiDB 执行 INSERT INTO SELECT 语句中的 SELECT 子句时,优化器将根据 SQL 模式及 TiFlash 副本的代价估算自行决定是否将查询下推至 TiFlash。因此,在实验特性阶段引入的系统变量 tidb_enable_tiflash_read_for_write_stmt 将被废弃。需要注意的是,TiFlash 对于 INSERT INTO SELECT 语句的计算规则不满足 STRICT SQL Mode 要求,因此只有当前会话的 SQL 模式为非严格模式(即 sql_mode 值不包含 STRICT_TRANS_TABLESSTRICT_ALL_TABLES),TiDB 才允许将 INSERT INTO SELECT 语句中的 SELECT 子句下推至 TiFlash。

    更多信息,请参考用户文档

  • MySQL 兼容的多值索引 (Multi-Valued Indexes) 成为正式功能 (GA) #39592 @xiongjiwei @qw4990 @YangKeao

    过滤 JSON 列中某个数组的值是一种常见操作,但使用普通索引无法加速此过程。在数组上创建多值索引可以大幅提升过滤性能。如果 JSON 列中的某个数组上存在多值索引,则函数 MEMBER OF()JSON_CONTAINS()JSON_OVERLAPS() 的检索条件可以利用该多值索引进行过滤,从而减少大量的 I/O 消耗,提升执行速度。

    在 v7.1.0 中,TiDB 多值索引成为正式功能 (GA),支持更完整的数据类型,并与 TiDB 的工具链兼容。你可以在生产环境利用多值索引来加速对 JSON 数组的检索操作。

    更多信息,请参考用户文档

  • 完善 Hash 分区表和 Key 分区表的分区管理功能 #42728 @mjonss

    在 v7.1.0 之前,TiDB 中的 Hash 分区表和 Key 分区表只支持 TRUNCATE PARTITION 分区管理。从 v7.1.0 开始,Hash 分区表和 Key 分区表新增支持 ADD PARTITIONCOALESCE PARTITION 分区管理。你可以根据需要灵活调整 Hash 分区表和 Key 分区表的分区数量。例如,通过 ADD PARTITION 语句增加分区数量,或通过 COALESCE PARTITION 语句减少分区数量。

    更多信息,请参考用户文档

  • Range INTERVAL 分区定义语法成为正式功能 (GA) #35683 @mjonss

    在 v6.3.0 中引入的 Range INTERVAL 的分区定义语法成为正式功能 (GA)。通过该语法,你可以根据所需的间隔 (interval) 定义 Range 分区,不需要枚举所有分区,可大幅度缩短 Range 分区表的定义语句长度。语义与原有 Range 分区等价。

    更多信息,请参考用户文档

  • 生成列 (Generated Columns) 成为正式功能 (GA) @bb7133

    生成列是数据库中非常有价值的一个功能。在创建表时,可以定义一列的值由表中其他列的值计算而来,而不是由用户显式插入或更新。这个生成列可以是虚拟列 (Virtual Column) 或存储列 (Stored Column)。TiDB 在早期版本就提供了与 MySQL 兼容的生成列功能,在 v7.1.0 中这个功能正式 GA。

    使用生成列可以提升 TiDB 对 MySQL 的兼容性,方便从 MySQL 平滑迁移到 TiDB,同时也能简化数据维护复杂度,增强数据一致性并提高查询效率。

    更多信息,请参考用户文档

数据库管理

  • 支持无需手动取消 DDL 的平滑升级集群功能(实验特性) #39751 @zimulala

    在 TiDB v7.1.0 之前的版本中,升级集群时需要先手动取消正在运行或排队的 DDL 任务,并在升级完成后再手动添加这些任务。

    为了提供更平滑的升级体验,TiDB v7.1.0 引入了自动暂停和恢复 DDL 任务的功能。从 v7.1.0 开始,你在升级集群前无需手动取消 DDL 任务。系统会自动暂停正在执行或排队的用户 DDL 任务,等待整个集群完成滚动升级后再自动恢复这些任务,让你可以更加轻松地升级 TiDB 集群。

    更多信息,请参考用户文档

可观测性

安全

  • 更换 TiFlash 系统表信息的查询接口 #6941 @flowbehappy

    从 v7.1.0 起,TiFlash 在向 TiDB 提供 INFORMATION_SCHEMA.TIFLASH_TABLESINFORMATION_SCHEMA.TIFLASH_SEGMENTS 系统表的查询服务时,不再使用 HTTP 端口,而是使用 gRPC 端口,从而避免 HTTP 服务的安全风险。

  • 支持 LDAP 身份认证 #43580 @YangKeao

    从 v7.1.0 起,TiDB 支持 LDAP 身份认证,并提供了两种认证插件:authentication_ldap_saslauthentication_ldap_simple

    更多信息,请参考用户文档

  • 增强数据库审计功能(企业版)

    在 v7.1.0 中,TiDB 企业版增强了数据库审计功能,大幅提升了能力范围,改善了使用体验,以满足企业对数据库安全合规的需要:

    • 引入“过滤器” (Filter) 与“规则” (Rule) 的概念,提供了更细分的审计事件定义,并支持更细粒度的审计设置。
    • 支持 JSON 格式的规则定义,提供了更加友好的设置方式。
    • 新增自动日志轮替 (Log Rotation) 和空间管理功能,支持保存时间和日志大小两个维度的设置。
    • 支持输出 TEXT 和 JSON 两种格式的审计日志,便于集成第三方工具。
    • 支持日志内容脱敏,可以替换所有字面值以增强安全性。

    数据库审计是 TiDB 企业版的重要功能之一,为企业提供了强大的监管和审计工具,以保证数据安全和合规性。TiDB 企业版的数据库审计功能可以帮助企业管理人员追踪数据库操作的来源和影响,确保数据不被非法窃取或篡改。同时,数据库审计还可以帮助企业遵守各种法规和合规要求,确保企业在法律和道德方面的合规性。该功能对企业信息安全具有非常重要的应用价值。

    该功能为企业版特性,要获取数据库审计功能及其文档,请在 TiDB 产品页面企业版区域点击立即咨询联系 PingCAP。

兼容性变更

注意:

以下为从 v7.0.0 升级至当前版本 (v7.1.0) 所需兼容性变更信息。如果从 v6.6.0 或之前版本升级到当前版本,可能也需要考虑和查看中间版本 Release Notes 中提到的兼容性变更信息。

行为变更

  • 为了提高安全性,TiFlash 废弃了 HTTP 服务端口(默认 8123),采用 gRPC 端口作为替代

    如果你已经将 TiFlash 升级到 v7.1.0,那么在升级 TiDB 到 v7.1.0 的过程中,TiDB 无法读取 TiFlash 系统表(INFORMATION_SCHEMA.TIFLASH_TABLESINFORMATION_SCHEMA.TIFLASH_SEGMENTS)。

  • TiDB v6.2.0 ~ v7.0.0 版本的 TiDB Lightning 会根据 TiDB 集群的版本决定是否暂停全局调度。当 TiDB 集群版本 >= v6.1.0 时,TiDB Lightning 只会暂停目标表数据范围所在 Region 的调度,并在目标表导入完成后恢复调度。其他版本的 TiDB Lightning 则会暂停全局调度。自 TiDB v7.1.0 开始,你可以通过 pause-pd-scheduler-scope 来控制是否暂停全局调度,默认暂停目标表数据范围所在 Region 的调度。如果目标集群版本低于 v6.1.0 则报错,此时将参数取值改为 "global" 后重试即可。

  • 在 TiDB v7.1.0 中使用 FLASHBACK CLUSTER TO TIMESTAMP 功能可能会出现 FLASHBACK 完成后部分 Region 仍处于 FLASHBACK 过程中的问题。请尽量避免在 v7.1.0 中使用该功能。详情可见 #44292。如果已经出现该问题,可以使用 TiDB 快照备份与恢复功能进行数据恢复。

系统变量

变量名 修改类型 描述
tidb_enable_tiflash_read_for_write_stmt 废弃 从 v7.1.0 开始,该变量废弃并且默认值从 OFF 修改为 ON。当 tidb_allow_mpp = ON 时,优化器将根据 SQL 模式及 TiFlash 副本的代价估算自行决定是否将查询下推至 TiFlash。
tidb_non_prepared_plan_cache_size 废弃 从 v7.1.0 起,该变量被废弃,你可以使用 tidb_session_plan_cache_size 控制 Plan Cache 最多能够缓存的计划数量。
tidb_prepared_plan_cache_size 废弃 从 v7.1.0 起,该变量被废弃,你可以使用 tidb_session_plan_cache_size 控制 Plan Cache 最多能够缓存的计划数量。
tidb_ddl_distribute_reorg 删除 重命名为 tidb_enable_dist_task
default_authentication_plugin 修改 扩展可选值范围:增加 authentication_ldap_saslauthentication_ldap_simple
tidb_load_based_replica_read_threshold 修改 该变量从 v7.1.0 开始生效,用于设置基于负载的 replica read 的触发阈值。经进一步的测试后,该变量默认值从 "0s" 修改为 "1s"
tidb_opt_enable_late_materialization 修改 默认值从 OFF 修改为 ON,代表 TiFlash 延迟物化功能默认开启。
authentication_ldap_sasl_auth_method_name 新增 在 LDAP SASL 身份验证中,验证方法的名称。
authentication_ldap_sasl_bind_base_dn 新增 在 LDAP SASL 身份验证中,搜索用户的范围。如果创建用户时没有通过 AS ... 指定 dn,TiDB 会自动在 LDAP Server 的该范围中根据用户名搜索用户 dn
authentication_ldap_sasl_bind_root_dn 新增 在 LDAP SASL 身份验证中,TiDB 登录 LDAP Server 搜索用户时使用的 dn
authentication_ldap_sasl_bind_root_pwd 新增 在 LDAP SASL 身份验证中,TiDB 登录 LDAP Server 搜索用户时使用的密码。
authentication_ldap_sasl_ca_path 新增 在 LDAP SASL 身份验证中,TiDB 对 StartTLS 连接使用的 CA 证书的路径。
authentication_ldap_sasl_init_pool_size 新增 在 LDAP SASL 身份验证中,TiDB 与 LDAP Server 间连接池的初始连接数。
authentication_ldap_sasl_max_pool_size 新增 在 LDAP SASL 身份验证中,TiDB 与 LDAP Server 间连接池的最大连接数。
authentication_ldap_sasl_server_host 新增 在 LDAP SASL 身份验证中,LDAP Server 的主机名或地址。
authentication_ldap_sasl_server_port 新增 在 LDAP SASL 身份验证中,LDAP Server 的 TCP/IP 端口号。
authentication_ldap_sasl_tls 新增 在 LDAP SASL 身份验证中,是否使用 StartTLS 对连接加密。
authentication_ldap_simple_auth_method_name 新增 在 LDAP simple 身份验证中,验证方法的名称。现在仅支持 SIMPLE
authentication_ldap_simple_bind_base_dn 新增 在 LDAP simple 身份验证中,搜索用户的范围。如果创建用户时没有通过 AS ... 指定 dn,TiDB 会自动在 LDAP Server 的该范围中根据用户名搜索用户 dn
authentication_ldap_simple_bind_root_dn 新增 在 LDAP simple 身份验证中,TiDB 登录 LDAP Server 搜索用户时使用的 dn
authentication_ldap_simple_bind_root_pwd 新增 在 LDAP simple 身份验证中,TiDB 登录 LDAP Server 搜索用户时使用的密码。
authentication_ldap_simple_ca_path 新增 在 LDAP simple 身份验证中,TiDB 对 StartTLS 连接使用的 CA 证书的路径。
authentication_ldap_simple_init_pool_size 新增 在 LDAP simple 身份验证中,TiDB 与 LDAP Server 间连接池的初始连接数。
authentication_ldap_simple_max_pool_size 新增 在 LDAP simple 身份验证中,TiDB 与 LDAP Server 间连接池的最大连接数。
authentication_ldap_simple_server_host 新增 在 LDAP simple 身份验证中,LDAP Server 的主机名或地址。
authentication_ldap_simple_server_port 新增 在 LDAP simple 身份验证中,LDAP Server 的 TCP/IP 端口号。
authentication_ldap_simple_tls 新增 在 LDAP simple 身份验证中,是否使用 StartTLS 对连接加密。
tidb_enable_dist_task 新增 控制是否开启分布式执行框架。开启分布式执行后,DDL、Import 等支持的分布式执行框架任务将会由集群中多个 TiDB 节点共同完成。该变量由 tidb_ddl_distribute_reorg 改名而来。
tidb_enable_non_prepared_plan_cache_for_dml 新增 控制非 Prepare 语句执行计划缓存是否支持 DML 语句。
tidb_enable_row_level_checksum 新增 控制是否开启 TiCDC 单行数据正确性校验。
tidb_opt_fix_control 新增 通过设置该变量,你可以更细粒度地控制优化器的行为,并且避免集群升级后优化器行为变化导致的性能回退。
tidb_plan_cache_invalidation_on_fresh_stats 新增 控制当某张表上的统计信息更新后,与该表相关的 Plan Cache 是否自动失效。
tidb_plan_cache_max_plan_size 新增 控制可以缓存的 Prepare 或非 Prepare 语句执行计划的最大大小。
tidb_prefer_broadcast_join_by_exchange_data_size 新增 控制是否使用最小网络数据交换策略。使用该策略时,TiDB 会估算 Broadcast Hash Join 和 Shuffled Hash Join 两种算法所需进行网络交换的数据量,并选择网络交换数据量较小的算法。该功能开启后,tidb_broadcast_join_threshold_sizetidb_broadcast_join_threshold_count 将不再生效。
tidb_session_plan_cache_size 新增 控制 Plan Cache 最多能够缓存的计划数量。其中,Prepare 语句执行计划缓存和非 Prepare 语句执行计划缓存共用一个缓存。

配置文件参数

配置文件 配置项 修改类型 描述
TiDB performance.force-init-stats 新增 用于控制 TiDB 启动时是否在统计信息初始化完成后再对外提供服务。
TiDB performance.lite-init-stats 新增 用于控制 TiDB 启动时是否采用轻量级的统计信息初始化。
TiDB log.timeout 新增 用于控制 TiDB 写日志操作的超时时间,当磁盘故障导致日志无法写入时,该配置可以让 TiDB 进程崩溃而不是卡死。默认值为 0,即不设定超时时间。
TiKV region-compact-min-redundant-rows 新增 触发 RocksDB compaction 需要的冗余的 MVCC 数据行数。默认值为 50000
TiKV region-compact-redundant-rows-percent 新增 触发 RocksDB compaction 需要的冗余的 MVCC 数据行所占比例。默认值为 20
TiKV split.byte-threshold 修改 region-split-size 大于等于 4 GB 时,默认值从 30MiB 修改为 100MiB
TiKV split.qps-threshold 修改 region-split-size 大于等于 4 GB 时,默认值从 3000 修改为 7000
TiKV split.region-cpu-overload-threshold-ratio 修改 region-split-size 大于等于 4 GB 时,默认值从 0.25 修改为 0.75
TiKV region-compact-check-step 修改 当使用 Partitioned Raft KV (storage.engine="partitioned-raft-kv") 时,默认值从 100 修改为 5
PD store-limit-version 新增 用于设置 store limit 工作模式。可选值为 "v1""v2"
PD schedule.enable-diagnostic 修改 默认值从 false 修改为 true,默认打开调度器的诊断功能。
TiFlash http_port 删除 废弃 TiFlash HTTP 服务端口(默认 8123)。
TiDB Lightning tikv-importer.pause-pd-scheduler-scope 新增 用于控制 TiDB Lightning 暂停 PD 调度的范围。默认值为 "table",可选值为 "global""table"
TiDB Lightning tikv-importer.region-check-backoff-limit 新增 用于控制 split 和 scatter 操作后等待 Region 上线的重试次数,默认值为 1800。重试符合指数回退策略,最大重试间隔为 2 秒。若两次重试之间有任何 Region 上线,该次操作不会被计为重试次数。
TiDB Lightning tikv-importer.region-split-batch-size 新增 用于控制一个 batch 中执行 split 和 scatter 操作的最大 Region 数量,默认值为 4096
TiDB Lightning tikv-importer.region-split-concurrency 新增 用于控制 Split Region 时的并发度,默认值为 CPU 核心数。
TiCDC insecure-skip-verify 新增 用于控制在同步数据到 Kafka 的场景下,启用 TLS 时是否设置认证算法。
TiCDC sink.only-output-updated-columns 新增 用于控制是否是否只向下游同步有内容更新的列,默认值为 false
TiCDC integrity.corruption-handle-level 新增 用于控制当单行数据的 Checksum 校验失败时,Changefeed 打印错误行数据相关日志的级别。默认值为 "warn",可选值为 "warn""error"
TiCDC integrity.integrity-check-level 新增 用于控制是否开启单行数据的 Checksum 校验功能,默认值为 "none",即不开启。
TiCDC sink.enable-partition-separator 修改 默认值从 false 修改为 true,代表默认会将表中各个分区的数据分不同的目录来存储。建议保持该配置项为 true 以避免同步分区表到存储服务时可能丢数据的问题。

改进提升

  • TiDB

    • SHOW INDEX 结果的 Cardinality 列中展示统计信息中对应列的不同值的数量 #42227 @winoros
    • 使用 SQL_NO_CACHE 以避免 TTL Scan 查询对 TiKV block cache 造成影响 #43206 @lcwangchao
    • 改进 MAX_EXECUTION_TIME 相关错误信息使之与 MySQL 兼容 #43031 @dveeden
    • 在 IndexLookUp 中支持对分区表使用 MergeSort 算子 #26166 @Defined2014
    • 改进 caching_sha2_password 使之与 MySQL 兼容 #43576 @asjdf
  • TiKV

    • 降低使用 Partitioned Raft KV 时 Split 对写 QPS 的影响 #14447 @SpadeA-Tang
    • 优化使用 Partitioned Raft KV 时 Snapshot 占用的空间 #14581 @bufferflies
    • 为 TiKV 处理请求的各个阶段提供更详细的时间信息 #12362 @cfzjywxk
    • 在日志备份中使用 PD 作为元数据存储 #13867 @YuJuncen
  • PD

    • 新增基于 snapshot 执行细节来自动调整 store limit 大小的控制器。将 store-limit-version 设置为 v2 即可开启该控制器,开启后,用户无需手动调整 store limit 配置来控制扩缩容的速度 #6147 @bufferflies
    • 新增历史负载信息,避免了存储引擎为 raft-kv2 时,热点调度器对不稳定负载所在的 Region 进行频繁调度 #6297 @bufferflies
    • 新增 leader 健康检查机制,当 etcd leader 所在的 PD server 无法当选 leader 时,主动切换 etcd leader 来保证 PD leader 可用 #6403 @nolouch
  • TiFlash

    • 提升 TiFlash 在存算分离架构下的性能和稳定性 #6882 @JaySon-Huang @breezewish @JinheLin
    • 支持在 Semi Join 或 Anti Semi Join 中,通过选择较小的表作为 Build 端来优化查询性能 #7280 @yibin87
    • 提升默认参数下 BR 和 TiDB Lightning 向 TiFlash 导入数据的性能 #7272 @breezewish
  • Tools

    • Backup & Restore (BR)

      • 支持在备份日志时修改 TiKV 配置项 log-backup.max-flush-interval #14433 @joccau
    • TiCDC

      • 优化同步数据到对象存储的场景下发生 DDL 事件时的目录结构 #8890 @CharlesCheung96
      • 优化 TiCDC 在同步任务失败时对上游 GC TLS 的设置方法 #8403 @charleszheng44
      • 支持同步到 Kafka-on-Pulsar 下游 #8892 @hi-rustin
      • 在将数据同步到 Kafka 时,支持 open-protocol 协议在数据发生变更后只同步有变更的列 #8706 @sdojjy
      • 优化 TiCDC 在下游出现故障等场景中的错误处理方式 #8657 @hicqu
      • 增加一个配置项 insecure-skip-verify,控制在同步数据到 Kafka 的场景下启用 TLS 时是否设置认证算法 #8867 @hi-rustin
    • TiDB Lightning

      • 将关于 Region 分布不均的 Precheck 项的严重级别从 Critical 调整为 Warn,以避免阻塞用户导入数据 #42836 @okJiang
      • 在导入数据期间遇到 unknown RPC 错误时,增加了重试机制 #43291 @D3Hunter
      • 增强 Region Job 的重试机制 #43682 @lance6716

错误修复

  • TiDB

    • 修复重组分区后没有提示手动 ANALYZE TABLE 的问题 #42183 @CbcWestwolf
    • 修复对于执行中的 DROP TABLE 操作,ADMIN SHOW DDL JOBS 的结果中缺少表名的问题 #42268 @tiancaiamao
    • 修复 Ignore Event Per MinuteStats Cache LRU Cost 图表在 Grafana 监控面板中有时不可见的问题 #42562 @pingandb
    • 修复查询表 INFORMATION_SCHEMA.COLUMNS 时,ORDINAL_POSITION 列返回结果错误的问题 #43379 @bb7133
    • 修复权限表中一些列大小写敏感的问题 #41048 @bb7133
    • 修复缓存表执行新增列操作后,新增列值为 NULL 而非列的默认值的问题 #42928 @lqs
    • 修复在谓词下推的情况下 CTE 结果错误的问题 #43645 @winoros
    • 修复分区特别多并且带有 TiFlash 副本的分区表在执行 TRUNCATE TABLE 时,出现写冲突导致 DDL 重试的问题 #42940 @mjonss
    • 修复在创建分区表时使用 SUBPARTITION 没有警告提醒的问题 #41198 #41200 @mjonss
    • 修复生成列在处理值溢出问题时与 MySQL 不兼容的问题 #40066 @jiyfhust
    • 修复 REORGANIZE PARTITION 不能与其他 DDL 操作并发的问题 #42442 @bb7133
    • 修复在取消 DDL 的重组分区任务后可能导致后续其他 DDL 报错的问题 #42448 @lcwangchao
    • 修复某些情况下删除操作的断言不正确的问题 #42426 @tiancaiamao
    • 修复读取 cgroup 信息出错导致 TiDB Server 无法启动的问题,报错信息为 "can't read file memory.stat from cgroup v1: open /sys/memory.stat no such file or directory" #42659 @hawkingrei
    • 修复在包含全局索引的分区表上更新分区键数据时报 Duplicate Key 错误的问题 #42312 @L-maple
    • 修复 TTL 监控面板中 Scan Worker Time By Phase 图表不显示数据的问题 #42515 @lcwangchao
    • 修复在包含全局索引的分区表上进行某些查询时返回错误结果的问题 #41991 #42065 @L-maple
    • 修复在重组分区表的过程中会显示错误日志的问题 #42180 @mjonss
    • 修复 INFORMATION_SCHEMA.DDL_JOBS 表中 QUERY 列的数据长度可能超出列定义的问题 #42440 @tiancaiamao
    • 修复表 INFORMATION_SCHEMA.CLUSTER_HARDWARE 在容器中可能显示错误的值的问题 #42851 @hawkingrei
    • 修复通过 ORDER BY + LIMIT 的方式查询分区表时,返回结果错误的问题 #43158 @Defined2014
    • 修复可能出现多个使用 ingest 的方式的 DDL 任务同时运行的问题 #42903 @tangenta
    • 修复查询分区表时使用 Limit 返回错误值的问题 #24636 @winoros
    • 修复 IPv6 环境下显示错误的 TiDB 地址的问题 #43260 @nexustar
    • 修复系统变量 tidb_enable_tiflash_read_for_write_stmttidb_enable_exchange_partition 显示错误的值的问题 #43281 @gengliqi
    • 修复当 tidb_scatter_region 变量设置为开启时,对某个分区进行 TRUNCATE 操作后没有自动分裂 Region 的问题 #43174 #43028 @jiyfhust
    • 在具有生成列的表上增加检查,并对不支持的列的 DDL 操作报错 #38988 #24321 @tiancaiamao
    • 修复在某些类型转换出错的情况下报错信息不对的问题 #41730 @hawkingrei
    • 修复 TiDB 节点在正常 shutdown 后,在此节点上触发的 DDL 任务会被取消的问题 #43854 @zimulala
    • 修复当 PD 成员地址发生变化时,为 AUTO_INCREMENT 列分配 ID 会被长时间阻塞的问题 #42643 @tiancaiamao
    • 修复执行 DDL 期间报 GC lifetime is shorter than transaction duration 错误的问题 #40074 @tangenta
    • 修复元数据锁非预期地阻塞 DDL 执行的问题 #43755 @wjhuang2016
    • 修复 IPv6 环境下的集群无法查询部分系统视图的问题 #43286 @Defined2014
    • 修复动态裁剪模式下内连接表时找不到分区的问题 #43686 @mjonss
    • 修复 analyze 表时报语法错误的问题 #43392 @guo-shaoge
    • 修复在重命名表期间 TiCDC 可能丢失部分行变更的问题 #43338 @tangenta
    • 修复在客户端使用游标读导致 TiDB server 崩溃的问题 #38116 @YangKeao
    • 修复 ADMIN SHOW DDL JOBS LIMIT 返回错误结果的问题 #42298 @CbcWestwolf
    • 修复使用 UNION 查询联合视图和临时表时 TiDB panic 的问题 #42563 @lcwangchao
    • 修复在一个事务中提交多条语句时重命名表不生效的问题 #39664 @tiancaiamao
    • 修复时间转换时 Prepared Plan Cache 与 Non-Prepared Plan Cache 的行为不兼容性的问题 #42439 @qw4990
    • 修复 Plan Cache 导致 Decimal 类型的结果出错的问题 #43311 @qw4990
    • 修复 NAAJ (null-aware anti join) 中错误的类型检查导致 TiDB panic 的问题 #42459 @AilinKid
    • 修复 RC 隔离级别下悲观事务中执行失败的 DML 可能导致数据索引不一致的问题 #43294 @ekexium
    • 修复在一些极端情况下,悲观事务的第一条语句发生重试时,对该事务进行 resolve lock 可能影响事务正确性的问题 #42937 @MyonKeminta
    • 修复在一些罕见的情况下,悲观事务的残留悲观锁在 GC resolve lock 时可能影响数据正确性的问题 #43243 @MyonKeminta
    • 修复从 LOCK 转换为 PUT 的优化导致特定查询返回重复数据的问题 #28011 @zyguan
    • 修复当数据未变更时唯一索引的加锁行为与数据发生变更时不一致的问题 #36438 @zyguan
  • TiKV

    • 修复在启用 tidb_pessimistic_txn_fair_locking 时,在某些极端情况下,RPC 失败重试导致的过期请求可能在 Resolve Lock 时影响数据正确性的问题 #14551 @MyonKeminta
    • 修复在启用 tidb_pessimistic_txn_fair_locking 时,在某些极端情况下,RPC 失败重试导致的过期请求可能会造成事务冲突被忽略,从而影响事务一致性的问题 #14311 @MyonKeminta
    • 修复加密 Key ID 冲突会导致旧 Key 被删除的问题 #14585 @tabokie
    • 修复集群从较低版本升级到 v6.5 或更高版本时,由于累计的 Lock 记录可能导致性能下降的问题 #14780 @MyonKeminta
    • 修复 PITR 恢复过程中出现 raft entry is too large 的问题 #14313 @YuJuncen
    • 修复 PITR 恢复过程中由于 log_batch 超过 2 GB 导致 TiKV panic 的问题 #13848 @YuJuncen
  • PD

    • 修复 TiKV panic 后,PD 监控面板 low space store 数量异常的问题 #6252 @HuSharp
    • 修复在 PD leader 切换后 Region Health 监控数据被删除的问题 #6366 @iosmanthus
    • 修复 Rule checker 无法修复 label 为 schedule=deny 的不健康 Region 的问题 #6426 @nolouch
    • 修复 TiKV 或 TiFlash 重启后部分已有 label 丢失的问题 #6467 @JmPotato
    • 修复复制模式存在 learner 节点时可能无法切换复制状态的问题 #14704 @nolouch
  • TiFlash

    • 修复开启延迟物化 (Late Materialization) 后查询 TIMESTAMP 或者 TIME 类型的数据报错的问题 #7455 @Lloyd-Pottiger
    • 修复大的更新事务可能会导致 TiFlash 反复报错重启的问题 #7316 @JaySon-Huang
  • Tools

    • Backup & Restore (BR)

      • 修复集群中 TiKV 出现宕机导致备份速度降低的问题 #42973 @YuJuncen
      • 修复某些情况下备份失败会导致错误信息不准确的问题 #43236 @YuJuncen
    • TiCDC

      • 修复 TiCDC 的时区设置问题 #8798 @hi-rustin
      • 修复 PD 地址或 leader 出现故障时 TiCDC 不能自动恢复的问题 #8812 #8877 @asddongmen
      • 修复上游 TiKV 节点 crash 时 checkpoint lag 上升的问题 #8858 @hicqu
      • 修复当同步数据到对象存储时上游的 EXCHANGE PARTITION 操作没有正常同步到下游的问题 #8914 @CharlesCheung96
      • 修复在某些特殊场景下 sorter 组件内存使用过多导致 OOM 的问题 #8974 @hicqu
      • 修复下游 Kafka 滚动重启时 TiCDC 节点发生 panic 的问题 #9023 @asddongmen
    • TiDB Data Migration (DM)

      • 修复数据同步过程中,latin1 字符集数据可能损坏的问题 #7028 @lance6716
    • TiDB Dumpling

      • 修复 UNSIGNED INTEGER 类型的主键无法用于拆分 Chunk 的问题 #42620 @lichunzhu
      • 修复错误设置 --output-file-template 可能导致 TiDB Dumpling panic 的问题 #42391 @lichunzhu
    • TiDB Binlog

      • 修复当遇到失败的 DDL 语句时可能报错的问题 #1228 @okJiang
    • TiDB Lightning

      • 修复导入性能退化的问题 #42456 @lance6716
      • 修复大数据量导入时报 write to tikv with no leader returned 错误的问题 #43055 @lance6716
      • 修复导入期间输出过多 keys within region is empty, skip doIngest 日志的问题 #43197 @D3Hunter
      • 修复 Range 部分写入时可能出现 panic 的问题 #43363 @lance6716
      • 修复宽表导入时可能出现 OOM 的问题 #43728 @D3Hunter
      • 修复 TiDB Lightning Grafana 面板缺失数据的问题 #43357 @lichunzhu
      • 修复未正确设置 keyspace-name 导致数据导入失败的问题 #43684 @zeminzhou
      • 修复当 Range 部分写入时,在某些情况下会跳过数据导入的问题 #43768 @lance6716

性能测试

如需了解 TiDB v7.1.0 的性能表现,你可以参考 TiDB Dedicated 集群的 TPC-C 性能测试报告Sysbench 性能测试报告(英文版)。

贡献者

感谢来自 TiDB 社区的贡献者们: