sql查询出来有重复的数据

日期：2026-05-23 20:47:41 作者：创始人浏览：0

sql leftjoin多表查询，出现重复的数据，怎么处理

特异性复制效率低。
分组使用会更有效率。
例如订单表就是订单，客户表就是客户。
order_id重复，使用order_id group by。
在 Management Studio 中尝试一下。
差别是慢了三倍。
你自己掂量一下吧。

用sql语句进行多表连接查询出现重复数据

那天，我帮小李整理客户信息，电脑屏幕的光照在他的脸上，有些发亮。
电脑里一张叫user的表里存储着几千个客户，名字、电话、房间等等。
看着他，我感觉王五的身影出现了好几次，我的心猛地一跳，不得不赶紧去调查。

我在计算机上创建了一个名为“用户”的新表，并故意填写了一些重复的名称。
然后我输入 SQL 语句“SELECT (name) from musser field name (name)>1 )”并按 Enter 键。
张三等重复的名字在屏幕上出现了三遍。
小李睁大了眼睛，说：“哇，这么多份！”
我又输入了“deletefromuserwhere namein(selectnamefromusergroupbynamehavingcount(name)>1 )”，这次是删除它们。
屏幕上的张三和李四瞬间消失了大半。
如果在查看这些空行时突然出现另一个名为“注释”的字段，是否存在重复项？等等，还有一件事。
如果数据库很大的话，删除操作会不会特别慢？我看了看手表。
当时是下午三点。
阳光静静地照着，我可以清楚地看到键盘上的灰尘。

sql中查询重复数据怎么写

哎，你说这个SQL查询重复了，真是烦人。
有时这仅取决于具体情况。

比如我在2 02 2 年在一家叫北京的公司做一个项目，他们的订单表里有product_id，很乱而且总是重复。
我只需要弄清楚如何检查。

第一种方法，我一般用GROUP BY加HAVING。
这东西工作正常，请看这个 SQL：
sql SELECT Product_id, COUNT() AS 计数从订单按产品 ID 分组有 COUNT() > 1 ;
你看，这里的GROUP BY是product_id，HAVING后面的那个计数大于1 这样一查，发现北京表里有上百个重复的product_id。
这种方法很简单，只要保证product_id列有索引即可，否则会很慢。
我记得当时那个表有几十万条数据，没有索引，只有GROUP BY，惨不忍睹。

第二种方法，我也用过EXCEPT，尤其是使用PostgreSQL的时候。
这个东西比较特别，它是通过消除不重复来获得重复的。
请参阅：
sql 选择从订单除了选择不同的 FROM 订单；
我在北京的公司尝试过这个SQL。
它将删除所有唯一记录，其余的将是重复的，对吧？但我不经常使用这种方法，因为支持它的数据库不多，比如MySQL，它没有这种东西。
回到 MySQL，我必须使用 LEFT JOIN 和 ISNULL 来做到这一点，这有点不方便。

另外，NOT IN也可以用，但一般我不推荐，尤其是大表，效率低下。
我之前就尝试过，并且在某张桌子上使用过。
一旦数据量增加，就会卡住。

窗口功能，比较高级。
像这样：
sql 选择来自（ SELECT , COUNT() OVER（按产品 ID 分区）AS cnt 从订单）其中 cnt > 1 ;
我2 02 2 年在上海的一家公司看到别人在用这个，如果使用顺利的话，效率很高，但是写起来比较麻烦，一般人都看不懂。
当时我就一头雾水，后来才明白，这个东西就是统计分区，这个东西挺酷的。

自连接，我也用过，不过适合很简单的场景。
例如：
sql 选择不同的从订单 JOIN order b ON a.product_id = b.product_id AND a.id b.id;
这是为了查找具有相同product_id 但不同id 的记录。
简单就是简单，但是如果列表太多，就会很难管理。
我记得当时在北京，product_id是重复的，其他列都一样，所以就用了这个。

一般来说，GROUP BY HAVING是最常用的，简单高效。
如果你面临复杂的需求，比如多列重复或部分重复，你可能需要考虑窗口函数或自连接。
应根据实际情况而定，不要盲目使用。
我当时可能有点极端，认为GROUP BY是最好的，但后来发现它并不能适用于所有情况。
保持灵活性。

标签： sql leftjoin