members

members

スプレッドシートで列の最頻値や空セル数などを簡単に確認する方法!

Tweet

pc作業イメージ

参照元

GoogleスプレッドシートはGoogleAnalyticsやGoogleSearchConsoleといったGoogleの分析サービスからデータを落として加工する際によく利用するかと思います。今回は大量のデータの平均などを一括して表示し、データの概要を即座に把握するのに役立つ機能であるGoogleスプレッドシートの「列の統計情報」という機能についてご紹介します。

目次
1.普通に集計すると起こりがちなこと
2.「列の統計情報」とは?
3.実際に列の統計情報を使う方法
4.その他の機能
5.まとめ

 

普通に集計すると起こりがちなこと

普通にデータを集計すると平均値を見たいだけなのに重すぎてスクロールするだけでも大変なことや不用意に関数を入れると動作が停止してしまうこともあります。そういった場合に関数を追加せずに確認できるのが今回の方法です。

 

「列の統計情報」とは?

Googleスプレッドシートを使用するとExcelと違って、選択したセルの合計や平均をすぐに確認できる機能があることはご存知の方が多いかと思います。(下図の機能)
こちらの機能は列の統計情報という機能の一部を使ったものになります。

画像1

それでは実際に列の統計情報はどこから見ることができるのでしょうか。

 

実際に列の統計情報を使う方法

1.使用するデータをスプレッドシートで開く

下記のようなデータをGoogleスプレッドシートで開きます。
(今回はGoogleAnalyticsのデモアカウントのデータを使用します。)

画像2

2.「列の統計情報」を開く

列の情報を見たい列にセルをおきます。その後、「データ」の「列の統計情報」から列の統計情報を開きます。
(今回はページビュー数の列を見たいのでB列にセルを置いて開いていきます。)

画像3

こちらを開くと下図のように右手に列の統計情報を表している箇所が出てきます。

画像4

3.知りたいデータを見る

ここでは合計、平均、中央値、最大値、最小値といった基本的な数値から最頻値とその出現回数や空きセルの個数、一意の値の数まですぐに確認できます。

画像5

冒頭で紹介したスプレッドシートの右下の箇所では見られなかった空セルや一意の値の数、最頻値などが判明するとその後のデータの加工が楽になるケースや、加工時に間違っていないか確認するのに役立つことがあります。

 

その他の機能

「列の統計情報」の機能の中で上部数行を集計対象から弾くことができます。
今回、わたしが確認したいデータは8行目からですが、それより上に入っている数値は集計したくないとします。

このような場合に使用できるのが、「行を無視する」という機能です。
下図のように7行目まで無視する設定をしました。

画像6

このようにすることで下図のように集計対象が8行目からになります。(バックグラウンドカラーが緑の箇所が集計対象の範囲)

画像7

まとめ

いかがでしたでしょうか。
あまり使用機会は多くないですが、ちょっと重い数値集計やデータの加工をする際に全体感をイメージするために使ってみてください。

 

コラム執筆

鈴木 貴大(すずき たかひろ)

第3ビジネスユニット アカウントサービス第17ユニット所属

2018年4月入社。主にWeb広告運用・Webコンサル・解析設計に従事。
Excelやスプレッドシートの標準機能を用いて、自分の手を動かす業務を減らすように試行錯誤しながら業務に就いている。