Excel中重复数据的处理
浏览:587 更新:2018-08-28 11:11 标签:

Excel 中处理重复数据的 5 种方法

在 Excel 中,我们经常要处理数据清单,例如,员工档案,产品明细。这种数据中有可能存在重复的数据,需要进行处理。基于不同的情况,对重复数据的处理是不同的。一般来说,我们可以把实际工作中对重复数据的处理归结为以下五种情况 

前言

在 Excel 中,我们经常要处理数据清单,例如,员工档案,产品明细。这种数据中有可能存在重复的数据,需要进行处理。基于不同的情况,对重复数据的处理是不同的。一般来说,我们可以把实际工作中对重复数据的处理归结为以下五种情况:

1.                 识别重复数据(或者非重复数据)

2.                 删除重复数据(每条数据保留一条)

3.                 挑出不重复列表

4.                 计数(不重复数据的个数)

5.                 阻止重复数据的产生

我们分别来介绍如何处理这些情况。

1. 识别重复数据(或者非重复数据)

例如,在下面的表格中,我们记录了超市中所有销售的产品。

image001.jpg 

我们需要基于这个数据进行后续的数据分析。这就要求这个数据中每个数据只能出现一次(唯一性)。但是,仅仅是凭眼睛观察我们也可以发现里面的数据不唯一。这时,我们需要找出其中重复的数据,然后有针对行的进行分析,看看是什么原因导致了这些数据的重复。

这种需求就是重复数据的识别。这里就用到了 countif 函数。

在物品名称列后面添加一个辅助列,然后再单元格 C3 中数据公式:

=COUNTIF($B$3:$B$47,B3)

如下图:

image002.gif 

一定要注意其中的相对引用和绝对引用。

然后通过鼠标拖拽填充整个辅助列对应区域,将得到如下结果

image003.gif 

容易发现,辅助列中值为 1 的对应的是非重复数据,大于 1 的对应的是重复数据。 理解了这个方式,我们还可以用可视化的方法使所有重复数据变色显示,这样我们可以直接在表中找到这个数据。

方法是用条件格式。方法如下:

首先选中整个物品名称的数据,$B$3:$B$47。然后选择“开始”——>“条件格式”——>

“新建规则”,在新建规则对话框中,选择“使用公式确定要设置格式的单元格”,然后在

“为符合此公示的值设置格式”框中输入公式

=countif($B$3:$B$47,B3)>1

如下图:

image004.jpg 

点击确定后,你将得到如下的结果

image005.jpg 

可以看到,所有的重复数据都一目了然。

2.     删除重复数据

有时所有重复的数据是我们不需要的,我们需要删除重复数据,每条数据只保留一条。这时,最简单的方法就是使用 Excel 自带功能“删除重复项”。方法如下:

鼠标选中任意产品,然后点击“数据”菜单中的工具“删除重复项”  


image006.gif

得到如下对话框

image007.gif 

点击确定,Excel 会删除掉所有重复数据(只保留一条),并提示如下信息

image008.jpg 

3.     挑出不重复列表

在 2 的处理中,我们实际上得到了不重复列表。不过与此同时,我们删掉了其他的数据。但有时候,我们需要得到不重复列表,同时希望保留其他的信息。例如,在如下图所示的数据中,我们的原始数据是销售记录,我们希望得到所有产品的列表。

image009.gif 

我们就不能直接使用删除重复项得到不重复列表。

这时,最简单的方法就是数据透视表

我们在源数据中插入数据透视表,然后把“物品名称”放在行字段上,就可以得到一个不重复列表了

image010.jpg 

 

4.     不重复数据的计数

有时,我们不需要不重复列表,只希望得到所有的数据中有多少不重复的数据。例如,在上面的产品销售清单中,我们只希望知道共有多少种产品在销售。

这时,我们可以使用函数来解决。

还以 3 中的数据为例子,我们在数量后添加一个辅助列,并且在单元格 E3 中输入公式:

=1/COUNTIF($B$3:$B$47,B3)

通过鼠标拖拽,你可以得到如下图的结果

image011.gif 

在辅助列 1 的最后,输入公式

=sum(E3:E47)

可以得到结果 25,即数据中有 25 种不同的产品在销售。

5.     阻止重复数据的产生

尽管有各种方法,重复数据处理起来还是意见麻烦事。有时,我们希望在数据输入时就尽量避免重复数据的产生,这时,我们就可以用到数据有效性了(在最近几个版本中,这个功能叫做数据验证)。

方法如下:

选中单元格 B3:B27,然后依次点击“数据”——> “数据验证”,出现数据验证对话框,在其中的”允许“和“公式”处,分别按照下图输入:

image012.jpg 

点击确定后,数据有效性生效,你在其中输入任何一个重复的产品,都会得到如下的提示信

image013.jpg 

总结

重复数据的处理是数据处理中很典型的工作。许多人往往对之望而却步,希望学习复杂的技巧。其实,对他们的处理都是一些最基础功能的应用,条件格式,数据有效性,删除重复项是基本功能,数据透视表也只是用到了其中最简单地用法。函数更是只用了 countif,这是 Excel 中最基础的函数之一。实际上,Excel 中大部分数据处理问题都是这些基础知识的综合应用。只用多练习,你也可以成为 Excel 能手。

 


收藏
全部评论0
0.080776s