omachizura

SQLの基本的なことからスタートし、高度な検索・集計方法などの応用テクニックまでできるスキルを紹介します。


DISTINCT文で重複データをカウントせずに集計する

「社員マスタ」と「売上明細」と「会社マスタ」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。

「売上明細」は「会社コード」のカラムを持ち、どこの会社(取引先)からの売上か、という情報を持っています。

社員マスタ
社員コード社員名部署コード年齢
1テスト社員1122
2テスト社員2230
3テスト社員3null20
4テスト社員4130
売上明細
売上NO社員コード売上日売上金額会社コード
11201504012001
21201504023001
32201504081001
42201505011502
53201505055502
会社マスタ
会社コード会社名
1テスト会社1
2テスト会社2
3テスト会社3

課題

社員ごとに、売上のある会社の社数を表示したい。

SQLは下記のようになります。

SELECT MAX(T1.社員名) AS 社員名
  ,COUNT(DISTINCT T3.会社コード) AS 売上社数
FROM 社員マスタ AS T1
  LEFT JOIN 売上明細 AS T2
  ON T1.社員コード = T2.社員コード
  LEFT JOIN 会社マスタ AS T3
  ON T2.会社コード = T3.会社コード
GROUP BY T1.社員コード
実行結果
社員名売上社数
テスト社員11
テスト社員22
テスト社員31
テスト社員40

重複するデータを1カウントとして集計したい場合はCOUNTの集計関数にDISTINCTを追加します。

今回はCOUNTの集計関数でDISTINCTを使用しましたが、SUMなどの他の集計関数でも使用することができます。

試しにDISTINCTを使用せずに実行した場合を見てみます。

SELECT MAX(T1.社員名) AS 社員名
  ,COUNT(T3.会社コード) AS 売上社数
FROM 社員マスタ AS T1
  LEFT JOIN 売上明細 AS T2
  ON T1.社員コード = T2.社員コード
  LEFT JOIN 会社マスタ AS T3
  ON T2.会社コード = T3.会社コード
GROUP BY T1.社員コード
実行結果
社員名売上社数
テスト社員12
テスト社員22
テスト社員31
テスト社員40

テスト社員1の売上社数について、DISTINCTを使用せずに集計した場合、COUNTの集計関数は対象データ件数を出力するため、テスト社員1の売上明細は2件あるので、売上社数は2と表示されてしまいます。

テスト社員1の売上明細の会社コードは2件とも1なので、DISTINCTを使用してCOUNTすると、重複した値は1カウントとして扱われるため、売上社数が1と表示されます。





前へ
1

前へ
1