MySQL运算符效率解析：IN、NOTIN、EXISTS与NOTEXISTS对比及优化策略

日期：2024-12-18 14:35:47 作者：创始人浏览：0

不要再问我in，exists走不走索引了...

前言在处理业务需求时，我们面临着将一条数据A存储到数据库B中，并知道与数据库B相比多出的部分。
为了简化问题，我用一个模型来解释这个过程。
在探索解决方案时，我们发现了与“notin”和“notexists”类似的逻辑。
然而，我们对“IN”、“NOTIN”、“EXISTS”和“NOTEXISTS”这四个运算符的使用和效率以及它们是否真的不使用索引存在疑问。
带着这些问题，本文将一一探讨。
使用说明为了方便理解，我们创建两个表t1和t2，并填充一些数据。
其中id为主键，name为公共索引。
针对当前问题，我们可以使用“NOTIN”或“NOTEXIST”来过滤表t1中多于表t2的数据。
对name字段进行匹配操作。
执行结果是一样的，但是请注意“NOTIN”和“NOTEXISTS”的用法是有区别的。
“NOTIN”要求子查询匹配字段不为空，否则可能返回空结果。
在表t2中添加具有空值的名称后，“NOTIN”将返回一个空集。
“NOTEXISTS”返回一个布尔值，不关心返回的具体数据。
在执行效率方面，根据MySQL版本的不同，“IN”和“EXISTS”索引的使用存在差异。
“IN”和“EXIST”的效率取决于对应字段的长度和数据量，并且存在一定的临界点。
其中，有一个执行过程，在执行“IN”查询时，MySQL会先执行子查询获取结果集，然后与外部表进行笛卡尔积运算，过滤出符合条件的数据。
“EXISTS”查询首先遍历外部表，判断内表中每条记录的匹配情况，只有在内表中找到匹配的情况下，才返回true。
指数？网上有一种说法是“IN”和“EXIST”不会被索引，但事实并非如此。
根据MySQL的版本和字段长度的不同，是否使用索引是有区别的。
通过实际测试验证，可以发现数据量和字段长度相关的规律。
效率如何？对于网上流传的“EXIST”比“IN”效率更高的说法，通过数据量测试发现实际情况并不一致。
在不同数据量的情况下，“IN”和“EXISTS”的执行效率是不同的，不同情况下优化器的处理也存在差异。
notin和notexists哪个更快或更慢？对于“NOTIN”和“NOTEXISTS”的对比，测试结果表明，在不同数据量和索引类型的条件下，执行效率存在差异。
一般来说，当小表用作外部表时，“NOTEXISTS”效率更高，而当大表用作外部表时，“NOTIN”与“NOTEXISTS”一样高效，或者“NOTIN”更快。
嵌套连接循环要理解为什么“IN”改为JOIN，有必要了解三个JOIN嵌套循环连接。
包括简单嵌套循环连接、索引嵌套循环连接和块索引嵌套连接。
这三种连接方式在复杂度和效率上都有差异，利用索引和缓存优化可以显着提高执行效率。

mysql使用索引和不使用索引的区别

所有理论均基于最左匹配原则。
如果多个字段同时匹配，则匹配最左边的字段。
首先介绍一下：这个表的主键是live_iduser_id（有序），

如果使用live_id查询，则使用索引，如果使用user_id，则不使用索引

2.当GROUPBY使用索引时，当字段在第一个字段时使用索引，当字段在第二个字段时不使用索引。

4．在查询操作中，当查询中的字段是第一个字段时，会使用索引。
当查询字段在另一个字段中时，不使用索引。
当表格中的问题数量超过30%时，使用整个表格。
已扫描且未使用索引，因此无法优化。
）

5.如果第一个字符不是正确的符号，则当查询字段在第一个字段时，使用索引，而当查询字段在第二个字段时，则不使用索引。
如果第一个字符是常规符号。
，两个索引都不使用。

6如果没有搜索条件、没有排序条件、也没有GROUPBY条件，则不会使用SEARCH。
引用

7.UNION查询操作中，哪个字段是第一个索引字段，则对该查询子句使用索引

orderby不使用索引

groupby使用索引。
当场如果索引出现在第一个字段中，则使用该索引。

在查询操作中，当查询字段在第一个字段时，使用索引；当查询字段在第二个字段时，使用索引；索引不要使用

类似查询操作，如果第一个字符不是常规符号，则查询字段在第一个字段，使用索引，并且在查询字段中使用第二个字段时，不使用索引

如果使用第一个字段如果字符是常规符号，则不使用索引

联合查询操作，哪个字段是第一个索引字段，对该查询子句使用索引

解决MySQL中IN不走索引问题的方法mysql中in不走索引

如何解决MySQLIN未建立索引的问题MySQL是常用的关系型数据库管理系统，但在使用过程中可能会遇到IN未建立索引的问题。
这是因为IN参数太多，MySQL选择扫描全表而不是使用索引。
如何解决这个问题呢？1、调整参数，提高IN运行效率。
具体在my.cnf文件中添加或修改以下参数：其中，innodb_stats_on_metadata在MySQL5.5中默认设置为1。
以后。
当您执行元数据操作（例如查询有关表和索引的信息）时，统计信息会更新。
如果表非常大，此操作可能会很慢，因此将其设置为0以禁用它。
优化器是MySQL的查询执行引擎。
通过将optimizer_search_Depth值设置为0，您可以限制其最大搜索深度，从而减少执行时间。
但是，这可能会导致索引无法使用。
2.调整SQL语句。
如果可调参数无效，则尝试调整SQL语句。
例如，将IN语句拆分为多个OR语句，如下所示：SELECT*FROMtable_nameWHEREcolumn_name=valueORcolumn_name=valueORcolumn_name=value;这样做的好处是MySQL可以独立执行多个小查询语句，使得查询更加高效。
但缺点是复杂的查询逻辑被分割成多个子查询。
另外，如果IN参数的个数固定的话，可以转化为多个相等的操作如：3.使用JOIN子句如果将IN语句转换为JOIN子句，则具有相同有效的解决方案。
例如：SELECT*FROMtable1LEFTJOINtable2ONtable1.column_name=table2.column_nameWHEREtable2.column_nameISNOTNULL;该语句根据JOIN子句关联两个表，并根据WHERE子句过滤结果。
当IN语句的参数列表是表中的列而不是直接硬编码的值时，此方法适用。
4.使用临时表的最终解决方案是将IN参数列表放入临时表中，并与查询表执行JOIN操作，如下所示：CREATETEMPORARYTABLEtemp_table(column_nameINT);INSERTINTOtemp_tableVALUES(value1),(value2),(value3);SELECT*FROMtable_nameJOINtemp_tableONtable_name.column_name=temp_table.column_name;该方法创建临时表，但避免了扫描全表或重复查询，变得更加高效。
综上所述，解决MySQLIN不索引问题的四种方法是调整参数、调整SQL语句、使用JOIN子句、使用临时表。
您可以根据自己的具体情况选择并优化一种或多种方法。
。

标签： IN EXISTS