Googleスプレッドシートで重複データを削除する4つの方法
Googleスプレッドシートシートのあちこちに、同じ情報が重複したりして散らかって見えると、もどかしくイライラした気持ちになりませんか?
今回は、Googleスプレッドシートで重複データを見つけて削除する方法を紹介します。
1. 重複削除ツールを使う
[重複削除ツール]は、Googleスプレッドシートの重複を削除する、最も確実かつ実践的な方法です。まずはここから始めましょう。
例として、短い連絡先リストを用意してみました。連絡先リストは、重複データで混乱しがちなものの筆頭でしょう。
重複削除ツールを使って、シートから重複を削除する手順は以下の通りです。
1. Google スプレッドシートを開く。
2. シート内の重複を削除したい範囲を選択する。対象範囲の左上のセルから右下のセルまでマウスでクリック&ドラッグすると早い。
3. メニューバーから[データ]を選択する。
4. メニューオプションから[重複を削除]を選択する。
5. 重複をチェックする列を選択するプロンプトが表示される。列に入力されているデータに関わらず、行全体の重複をチェックすることも特定の項目(名前や住所など)だけをチェックすることもできる。
6. [重複を削除] をクリック。重複が削除された数を示すサマリーレポートが表示される。
2. 数式を使う
Googleスプレッドシートの数式を使って、重複のチェックと削除を行なうことができます。さまざまなやり方がありますが、簡単な方法をいくつか紹介します。
UNIQUE式を使う
この方法は、対象範囲内の各行を比較し、重複しているデータを削除します。 式も引数も1つしかないので、使い方はとても簡単です。手順は以下の通り。
1. Googleスプレッドシートを開く。
2. 空白のセルを選択する。
3. セルに数式 [ =UNIQUE(A2:D9) ] を入力し、対象範囲を指定する。
4.キーボードのEnterキーを押すか、ほかのセルをクリックすると、重複が削除されたデータセットが新たに作成される。
COUNTIFを使う
COUNTIF関数は、初めにデータ上の重複をハイライトしてくれます。データが1つしか存在しない場合は「1」の値が表示されますが、これは「false(論理値)」を意味します。一方、重複したデータがある場合、「true」を意味する「2」の値が表示されます。
この方法のメリットは、削除前に重複データを強調表示で確認できる点です。手順は以下の通り。
1. Google スプレッドシートを開く。
2. メニューの[挿入]にある[左に1列]を使って、重複をチェックしたいデータ列の横に新しい列を挿入する。
3. 挿入した列の一番上のセルに[ = COUNTIF(範囲, 基準)> 1 ]と入力する。 たとえば今回、重複する「last name」をチェックする式は[ =COUNTIF(B$2:B2,B2)>1 ]。
[B$2:B2]が対象範囲を示している。記号[$]は絶対参照を表し、この数式をC列の下の行にコピーしても、対象範囲の起点となるセルはB2に固定されたままとなる。
つまり、この数式は、B2を起点とし、現在のセルを終点とするデータセット内に、現在のセルと同じ値のセルが存在するかを調べるものである。
2021-02-21 22:30:10