Hướng dẫn cách xóa dữ liệu trùng trong Excel có ví dụ minh họa cụ thể

Trong quá trình làm việc với Excel, chắc hẳn chúng ta sẽ không tránh khỏi việc trùng lặp dữ liệu trong bảng tính Excel và trong trường hợp nếu lượng dữ liệu trùng lặp không quá nhiều thì chúng ta có thể xử lý thủ công được, tuy nhiên khi số lượng dữ liệu bị trùng quá nhiều thì chúng ta cần phải tìm đến những công cụ nhằm để giải quyết triệt để hơn, hiệu quả hơn. Vậy cách xóa dữ liệu trùng trong Excel như thế nào? Trong bài viết hôm nay, mình sẽ chia sẻ kiến thức về các cách xóa dữ liệu trùng trong Excel một cách chi tiết và cụ thể nhất.

1. Cách xóa dữ liệu trùng trong Excel bằng cách thủ công

Cách xóa dữ liệu trùng nhau trong Excel bằng cách thủ công này tuy hơi tốn thời gian hơn một chút nhưng sẽ giúp chúng ta có thể kiểm tra những phần trùng lặp kỹ càng hơn. Chúng ta muốn kiểm tra lại nội dung trùng lặp trong bảng kỹ hơn thì có thể sử dụng cách đánh dấu dòng Highlight. Như vậy thì chúng ta sẽ có thể dễ dàng phân biệt được các nội dung bình thường và phần nội dung bị trùng lặp bởi những dòng hay nội dung trong bảng giống nhau sẽ có cùng màu sắc và khác màu với những nội dung còn lại. Do vậy, việc này giúp chúng ta kiểm tra kỹ càng toàn bộ các dữ liệu bị trùng trước khi quyết định sửa hoặc xóa đi.  

 

Để có thể xóa các dữ liệu bị trùng lặp bằng cách thủ công, chúng ta thực hiện theo cách bước sau đây:

 

Bước 1: Đầu tiên, chúng ta cần phải bôi đen nội dung trùng lặp cần xóa, tiếp đó chúng ta nhấn chọn tab “Home” rồi nhấn chọn “Conditional Formatting”, chọn “Highlight Cell Rules”, tiếp đó tiến hành nhấn chọn “Duplicate values…“.

 

Bước 2: Khi đó, hộp thoại sẽ xuất hiện trên thanh công cụ. Tiếp theo, chúng ta chọn mục màu Highlight để phân biệt dữ liệu bị trùng lặp bằng các màu khác nhau trong bảng.

 

 

xóa dữ liệu trùng trong excel

Hình ảnh minh họa về cách xóa dữ liệu trùng trong Excel bằng cách thủ công

 

Bước 3: Sau khi phân loại dữ liệu trùng lặp bằng các màu sắc khác nhau thì chúng ta sẽ thấy sự khác biệt, những nội dung từ bảng trùng nhau sẽ được bôi đậm bằng màu đã chọn, lúc này chúng ta có thể tiến hành kiểm tra lại các nội dung tùy chỉnh trong mục nếu muốn hoặc chúng ta có thể tiến hành xóa đi những dữ liệu trùng lặp này.

 

xóa dữ liệu trùng trong excel

 

2. Cách xóa dữ liệu trùng trong Excel bằng Remove Duplicate

 

Ngoài cách xóa các dữ liệu bị trùng lặp trong Excel bằng cách thủ công thì chúng ta có thể sử dụng tính năng “Remove Duplicates”. Để có thể  xóa các dữ liệu bị trùng lặp bằng tính năng “Remove Duplicate”, chúng ta cần thực hiện theo các bước dưới đây:

 

Bước 1: Đầu tiên, chúng ta cần bôi đen các phần dữ liệu bị trùng lặp, tiếp đó chúng ta vào tab “Data” trên thanh công cụ rồi nhấn chọn mục “Remove Duplicates“. Ngoài ra, chúng ta cũng có thể truy cập vào Remove Duplicates bên trong Table Tools – Design Ribbon tab nếu chúng ta đang thao tác với bảng.

 

xóa dữ liệu trùng trong excel

Hình ảnh minh họa về cách xóa dữ liệu trùng trong Excel bằng Remove Duplicate

 

 

Bước 2: Khi đó, một hộp thoại mới sẽ xuất hiện trên thanh công cụ. Trên giao diện của hộp thoại mới này, chúng ta hãy chọn tính năng thanh lọc để tìm những cột có dữ liệu trùng nhau. Tiếp theo chúng ta điền vào hộp thoại để xóa các dữ liệu trùng lặp tùy vào nhu cầu của mình. Sau khi hoàn thành thì chúng ta nhấn OK.

 

Bước 3: Sau khi chúng ta hoàn tất tất cả các bước trên thì chúng ta sẽ nhận được thông báo về số lượng nội dung bị trùng lặp trong Excel và những nội dung trùng lặp sẽ bị xóa khỏi bảng Excel. Sau đó chúng ta sẽ thấy những dòng trùng lặp trong Excel được xóa khỏi bảng và để lại những dòng trống ở vị trí cuối bảng. Nếu như chúng ta muốn xóa những dòng trống đó thì chỉ cần nhấn chuột phải chọn “Delete” 

 

 

xóa dữ liệu trùng trong excel

Hình ảnh minh họa về cách xóa dữ liệu trùng trong Excel bằng Remove Duplicate



3. Cách xóa dữ liệu trùng trong Excel bằng cách sử dụng lập trình VBA

 

Để có thể xóa dữ liệu trùng trong Excel bằng cách sử dụng lập trình VBA, chúng ta có thể nhập mã VBA dưới đây. Sau đó, chúng ta sẽ có thông báo được hỏi là có muốn xóa dữ liệu vĩnh viễn hay không

 

Sub DeleteDuplicates()

Dim rng As Range

Dim rngFind As Range

Dim cell As Range

Dim DupAddresses As String

Dim SearchList As String

Dim Delimiter As String

‘Setup Variables

Set rng = Selection

Delimiter = “-;;-“

‘Loop through each cell in selection

For Each cell In rng.Columns(1).Cells

‘Does cell have value?

If cell.Value <> “” Then

‘Has value been searched for yet?

If InStr(1, SearchList, cell.Value & Delimiter) = 0 Then

SearchList = SearchList & cell.Value & Delimiter

Set rngFind = rng.Find(what:=cell.Value, LookIn:=xlValues, _

lookat:=xlWhole, searchdirection:=xlNext)

If Not rngFind Is Nothing Then

‘Record first instance found

FirstAddress = rngFind.Address

‘Find any next instances of value

Do

Set rngFind = rng.FindNext(rngFind)

If rngFind.Address = FirstAddress Then Exit Do

Set rngFind = rngFind.Resize(1, rng.Columns.Count)

DupAddresses = DupAddresses & rngFind.Address & “,”

Loop

End If

End If

End If

Next cell

‘Report Results

If DupAddresses <> “” Then

Set rng = Range(Left(DupAddresses, Len(DupAddresses) – 1))

rng.Select

UserAnswer = MsgBox(rng.Count & ” duplicate values were found,” _

& ” would you like to delete any duplicate rows found?”, vbYesNo)

If UserAnswer = vbYes Then Selection.Delete Shift:=xlUp

Else

MsgBox “No duplicate cell values were found”

End If

End Sub

 

Trên đây là những chia sẻ về các cách xóa dữ liệu trùng trong Excel, hy vọng bài viết trên đây sẽ thực sự hữu ích đối với các bạn trong quá trình sử dụng phần mềm Excel.