SQL GROUP BY句でデータの集計・集約を行う

「社員マスタ」と「売上明細」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。

社員マスタ
社員コード 社員名 部署コード 年齢
1 テスト社員1 1 22
2 テスト社員2 2 30
3 テスト社員3 null 20
売上明細
売上NO 社員コード 売上日 売上金額
1 1 20150401 200
2 1 20150402 300
3 2 20150408 100
4 2 20150501 150
5 3 20150505 550

全社員の売上の合計を表示したい。

SQLは下記のようになります。

SELECT MAX(T1.社員名) AS 社員名
    ,SUM(T2.売上金額) AS 売上金額
FROM 社員マスタ AS T1
    LEFT JOIN 売上明細 AS T2
    ON T1.社員コード = T2.社員コード
GROUP BY T1.社員コード
実行結果
社員名 売上金額
テスト社員1 500
テスト社員2 250
テスト社員3 550

わかりやすくするために、GROUP BYSELECT句の集計関数を行わずに実行した場合の結果を下記に示します。

SELECT T1.社員コード
    ,T1.社員名
    ,T2.売上金額
FROM 社員マスタ AS T1
    LEFT JOIN 売上明細 AS T2
    ON T1.社員コード = T2.社員コード
実行結果
社員コード 社員名 売上金額
1 テスト社員1 200
1 テスト社員1 300
2 テスト社員2 100
2 テスト社員2 150
3 テスト社員3 550

売上明細テーブルには1社員につき、複数のデータが存在します。なので、同一社員で複数の明細が出力されてしまいます。

同一社員は1行に集約し、かつ売上金額は集約する行の合計値を表示する必要があります。

下記図のようなイメージです。

実行結果
社員コード 社員名 売上金額
1 テスト社員1 200+300
1 テスト社員1 200
1 テスト社員1 300
2 テスト社員2 100+150
2 テスト社員2 100
2 テスト社員2 150
3 テスト社員3 550
3 テスト社員3 550

行を集約するには、GROUP BY句を使用します。

GROUP BY句で指定したカラムの値が同じ行は、1行に集約されます。

複数のカラムを指定した場合は、すべてのカラムの値が同じ行をそれぞれ1行に集約します。

上記の例ではGROUP BY句で社員コードを指定しているので、同一社員(社員コードの値が同じデータ)が1行に集約されます。

GROUP BY句で指定したカラムは、集約する行の値はすべて同じなので、その値がそのまま出力されます。

GROUP BY句で指定したカラム以外のカラムはどのように集約するのかを、SELECT句で指定する必要があります。

集約方法を指定しないと、下記図のように何を出力するのか定まらないからです。

実行結果
社員コード 社員名 売上金額
1 テスト社員1?テスト社員1 200?300
1 テスト社員1 200
1 テスト社員1 300
2 テスト社員2?テスト社員2 100?150
2 テスト社員2 100
2 テスト社員2 150
3 テスト社員3 550
3 テスト社員3 550

集計方法の指定は集計関数(集約関数)を使用します。

主な集計関数
関数名 機能
COUNT 集計対象の行数を出力
MAX 集計対象のなかで最大のものを出力
MIN 集計対象のなかで最小のものを出力
SUM 集計対象の合計値を出力
AVG 集計対象の平均を出力

例題では、売上金額カラムは売上の合計なのでSUM関数を指定しています。

社員コードが同じなら、社員名も同じになるはずなので、社員名カラムにはMAX関数をしています。(最大値でも最小値でも平均値でも値はすべて同じなのでMIN関数やAVG関数でも可能)

もしくは上記と同じ理由でGROUP BY句に社員名も指定するやり方でもできます。

SELECT MAX(T1.社員名) AS 社員名
    ,SUM(T2.売上金額) AS 売上金額
FROM 社員マスタ AS T1
    LEFT JOIN 売上明細 AS T2
    ON T1.社員コード = T2.社員コード
GROUP BY T1.社員コード

--または

SELECT T1.社員名
    ,SUM(T2.売上金額) AS 売上金額
FROM 社員マスタ AS T1
    LEFT JOIN 売上明細 AS T2
    ON T1.社員コード = T2.社員コード
GROUP BY T1.社員コード, T1.社員名

関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句でVIEWを作成し重複するSQL文をまとめる方法を説明します。WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。


  • SQL OVER句の分析関数で効率よくデータを集計する

    分析関数を使用すれば、効率よく簡単にデータを集計することができます。集計関数COUNTの後にOVERを指定して、分析関数として集計します。OVERの中のPARTITION BYとORDER BYで分析...


  • SQL ORDER BY句で取得したデータを並び替える

    ORDER BY句で取得したデータを並び替える(ソート)方法について説明します。取得するデータを並び替えるには、ORDER BY句でソートしたいカラムを指定します。


  • SQL oracleでnullを比較する際の注意点

    oracleでnullを扱うときに注意する点をまとめました。値がnullのデータを取得したいときは、イコール(=)ではなくIS NULLで取得する必要があります。nullも含めて取得する場合は、NVL...


  • SQL MERGE文でINSERTとUPDATEを一回で行う

    テーブルにデータがすでに存在している場合は更新(UPDATE)、存在していない場合は登録(INSERT)をしたい場合があると思います。MERGE文を使えば一回のSQLで、INSERTとUPDATEの処...


  • SQL PARTITION BYで効率よくデータを取得する

    PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。PATITION BYで部署コード単位で集計することができるようになります。売上累計の降順で並...


  • SQL INSERT文でデータを登録する

    INSERT文でデータベースに新しいデータを登録する方法を紹介します。テーブルに新しいデータを登録したい場合、以下のようなSQLを実行します。


  • SQL インデックスが効かない場合の原因と対処法

    テーブルにインデックスを張っていても実行計画を見るとなぜかテーブルがフルスキャンされていて「なんで?」となった経験があるかと思います。せっかく張ったインデックスが効かないSQLの実装例と対処法を紹介し...


  • SQL IN句をEXISTS句に変換する方法

    IN句をEXISTS句に変換する方法を紹介します。IN句よりもEXISTS句のほうがパフォーマンスが良くなる場合が多いので、主にレスポンス対策としてこの書き換えを行うことが多いと思います。


  • SQL IN句に1000件以上要素を指定したときのエラーの対処法

    SQLのIN句に1000件以上指定するとORA-01795: リストに指定できる式の最大数は1000です。のエラーが発生してしまいます。EXISTS句に書き換えられる場合は書き換えてしまうのが一番簡単...