Googleスプレッドシートで重複データを削除する4つの方法

Googleスプレッドシートシートのあちこちに、同じ情報が重複したりして散らかって見えると、もどかしくイライラした気持ちになりませんか?

今回は、Googleスプレッドシートで重複データを見つけて削除する方法を紹介します。

1. 重複削除ツールを使う

[重複削除ツール]は、Googleスプレッドシートの重複を削除する、最も確実かつ実践的な方法です。まずはここから始めましょう。

例として、短い連絡先リストを用意してみました。連絡先リストは、重複データで混乱しがちなものの筆頭でしょう。

重複削除ツールを使って、シートから重複を削除する手順は以下の通りです。

1. Google スプレッドシートを開く。

2. シート内の重複を削除したい範囲を選択する。対象範囲の左上のセルから右下のセルまでマウスでクリック&ドラッグすると早い。

3. メニューバーから[データ]を選択する。

4. メニューオプションから[重複を削除]を選択する。

5. 重複をチェックする列を選択するプロンプトが表示される。列に入力されているデータに関わらず、行全体の重複をチェックすることも特定の項目(名前や住所など)だけをチェックすることもできる。

6. [重複を削除] をクリック。重複が削除された数を示すサマリーレポートが表示される。

2. 数式を使う

Googleスプレッドシートの数式を使って、重複のチェックと削除を行なうことができます。さまざまなやり方がありますが、簡単な方法をいくつか紹介します。

UNIQUE式を使う

この方法は、対象範囲内の各行を比較し、重複しているデータを削除します。 式も引数も1つしかないので、使い方はとても簡単です。手順は以下の通り。

1. Googleスプレッドシートを開く。

2. 空白のセルを選択する。

3. セルに数式 [ =UNIQUE(A2:D9) ] を入力し、対象範囲を指定する。

4.キーボードのEnterキーを押すか、ほかのセルをクリックすると、重複が削除されたデータセットが新たに作成される。

COUNTIFを使う

COUNTIF関数は、初めにデータ上の重複をハイライトしてくれます。データが1つしか存在しない場合は「1」の値が表示されますが、これは「false(論理値)」を意味します。一方、重複したデータがある場合、「true」を意味する「2」の値が表示されます。

この方法のメリットは、削除前に重複データを強調表示で確認できる点です。手順は以下の通り。

1. Google スプレッドシートを開く。

2. メニューの[挿入]にある[左に1列]を使って、重複をチェックしたいデータ列の横に新しい列を挿入する。

3. 挿入した列の一番上のセルに[ = COUNTIF(範囲, 基準)> 1 ]と入力する。 たとえば今回、重複する「last name」をチェックする式は[ =COUNTIF(B$2:B2,B2)>1 ]。

[B$2:B2]が対象範囲を示している。記号[$]は絶対参照を表し、この数式をC列の下の行にコピーしても、対象範囲の起点となるセルはB2に固定されたままとなる。

つまり、この数式は、B2を起点とし、現在のセルを終点とするデータセット内に、現在のセルと同じ値のセルが存在するかを調べるものである。