Hướng dẫn cách xóa dữ liệu trùng trong Excel có ví dụ minh họa cụ thể
Trong quá trình làm việc với Excel, chắc hẳn chúng ta sẽ không tránh khỏi việc trùng lặp dữ liệu trong bảng tính Excel và trong trường hợp nếu lượng dữ liệu trùng lặp không quá nhiều thì chúng ta có thể xử lý thủ công được, tuy nhiên khi số lượng dữ liệu bị trùng quá nhiều thì chúng ta cần phải tìm đến những công cụ nhằm để giải quyết triệt để hơn, hiệu quả hơn. Vậy cách xóa dữ liệu trùng trong Excel như thế nào? Trong bài viết hôm nay, mình sẽ chia sẻ kiến thức về các cách xóa dữ liệu trùng trong Excel một cách chi tiết và cụ thể nhất.
1. Cách xóa dữ liệu trùng trong Excel bằng cách thủ công
Cách xóa dữ liệu trùng nhau trong Excel bằng cách thủ công này tuy hơi tốn thời gian hơn một chút nhưng sẽ giúp chúng ta có thể kiểm tra những phần trùng lặp kỹ càng hơn. Chúng ta muốn kiểm tra lại nội dung trùng lặp trong bảng kỹ hơn thì có thể sử dụng cách đánh dấu dòng Highlight. Như vậy thì chúng ta sẽ có thể dễ dàng phân biệt được các nội dung bình thường và phần nội dung bị trùng lặp bởi những dòng hay nội dung trong bảng giống nhau sẽ có cùng màu sắc và khác màu với những nội dung còn lại. Do vậy, việc này giúp chúng ta kiểm tra kỹ càng toàn bộ các dữ liệu bị trùng trước khi quyết định sửa hoặc xóa đi.
Để có thể xóa các dữ liệu bị trùng lặp bằng cách thủ công, chúng ta thực hiện theo cách bước sau đây:
Bước 1: Đầu tiên, chúng ta cần phải bôi đen nội dung trùng lặp cần xóa, tiếp đó chúng ta nhấn chọn tab “Home” rồi nhấn chọn “Conditional Formatting”, chọn “Highlight Cell Rules”, tiếp đó tiến hành nhấn chọn “Duplicate values…“.
Bước 2: Khi đó, hộp thoại sẽ xuất hiện trên thanh công cụ. Tiếp theo, chúng ta chọn mục màu Highlight để phân biệt dữ liệu bị trùng lặp bằng các màu khác nhau trong bảng.
Hình ảnh minh họa về cách xóa dữ liệu trùng trong Excel bằng cách thủ công
Bước 3: Sau khi phân loại dữ liệu trùng lặp bằng các màu sắc khác nhau thì chúng ta sẽ thấy sự khác biệt, những nội dung từ bảng trùng nhau sẽ được bôi đậm bằng màu đã chọn, lúc này chúng ta có thể tiến hành kiểm tra lại các nội dung tùy chỉnh trong mục nếu muốn hoặc chúng ta có thể tiến hành xóa đi những dữ liệu trùng lặp này.
2. Cách xóa dữ liệu trùng trong Excel bằng Remove Duplicate
Ngoài cách xóa các dữ liệu bị trùng lặp trong Excel bằng cách thủ công thì chúng ta có thể sử dụng tính năng “Remove Duplicates”. Để có thể xóa các dữ liệu bị trùng lặp bằng tính năng “Remove Duplicate”, chúng ta cần thực hiện theo các bước dưới đây:
Bước 1: Đầu tiên, chúng ta cần bôi đen các phần dữ liệu bị trùng lặp, tiếp đó chúng ta vào tab “Data” trên thanh công cụ rồi nhấn chọn mục “Remove Duplicates“. Ngoài ra, chúng ta cũng có thể truy cập vào Remove Duplicates bên trong Table Tools – Design Ribbon tab nếu chúng ta đang thao tác với bảng.
Hình ảnh minh họa về cách xóa dữ liệu trùng trong Excel bằng Remove Duplicate
Bước 2: Khi đó, một hộp thoại mới sẽ xuất hiện trên thanh công cụ. Trên giao diện của hộp thoại mới này, chúng ta hãy chọn tính năng thanh lọc để tìm những cột có dữ liệu trùng nhau. Tiếp theo chúng ta điền vào hộp thoại để xóa các dữ liệu trùng lặp tùy vào nhu cầu của mình. Sau khi hoàn thành thì chúng ta nhấn OK.
Bước 3: Sau khi chúng ta hoàn tất tất cả các bước trên thì chúng ta sẽ nhận được thông báo về số lượng nội dung bị trùng lặp trong Excel và những nội dung trùng lặp sẽ bị xóa khỏi bảng Excel. Sau đó chúng ta sẽ thấy những dòng trùng lặp trong Excel được xóa khỏi bảng và để lại những dòng trống ở vị trí cuối bảng. Nếu như chúng ta muốn xóa những dòng trống đó thì chỉ cần nhấn chuột phải chọn “Delete”
Hình ảnh minh họa về cách xóa dữ liệu trùng trong Excel bằng Remove Duplicate
3. Cách xóa dữ liệu trùng trong Excel bằng cách sử dụng lập trình VBA
Để có thể xóa dữ liệu trùng trong Excel bằng cách sử dụng lập trình VBA, chúng ta có thể nhập mã VBA dưới đây. Sau đó, chúng ta sẽ có thông báo được hỏi là có muốn xóa dữ liệu vĩnh viễn hay không
Sub DeleteDuplicates() Dim rng As Range Dim rngFind As Range Dim cell As Range Dim DupAddresses As String Dim SearchList As String Dim Delimiter As String ‘Setup Variables Set rng = Selection Delimiter = “-;;-“ ‘Loop through each cell in selection For Each cell In rng.Columns(1).Cells ‘Does cell have value? If cell.Value <> “” Then ‘Has value been searched for yet? If InStr(1, SearchList, cell.Value & Delimiter) = 0 Then SearchList = SearchList & cell.Value & Delimiter Set rngFind = rng.Find(what:=cell.Value, LookIn:=xlValues, _ lookat:=xlWhole, searchdirection:=xlNext) If Not rngFind Is Nothing Then ‘Record first instance found FirstAddress = rngFind.Address ‘Find any next instances of value Do Set rngFind = rng.FindNext(rngFind) If rngFind.Address = FirstAddress Then Exit Do Set rngFind = rngFind.Resize(1, rng.Columns.Count) DupAddresses = DupAddresses & rngFind.Address & “,” Loop End If End If End If Next cell ‘Report Results If DupAddresses <> “” Then Set rng = Range(Left(DupAddresses, Len(DupAddresses) – 1)) rng.Select UserAnswer = MsgBox(rng.Count & ” duplicate values were found,” _ & ” would you like to delete any duplicate rows found?”, vbYesNo) If UserAnswer = vbYes Then Selection.Delete Shift:=xlUp Else MsgBox “No duplicate cell values were found” End If End Sub |
Trên đây là những chia sẻ về các cách xóa dữ liệu trùng trong Excel, hy vọng bài viết trên đây sẽ thực sự hữu ích đối với các bạn trong quá trình sử dụng phần mềm Excel.