SQL OVER句の分析関数で効率よくデータを集計する

分析関数を使用すれば、効率よく簡単にデータを集計することができます。

例えば、社員一覧と社員の所属する部署の所属人数を取得したい場合、分析関数を使わない場合は下記のように取得していました。

SELECT
    T1.社員名
    ,T2.部署名
    ,(
        SELECT COUNT(*)
        FROM 社員マスタ S1
        WHERE S1.部署コード = T2.部署コード
    ) 所属人数
FROM
    社員マスタ T1
    INNER JOIN 部署マスタ T2
    ON T1.部署コード = T2.部署コード
実行結果
社員名部署名所属人数
テスト社員1営業部10
テスト社員2営業部10
テスト社員3開発部30
テスト社員4営業部10

やり方はいろいろあると思いますが、社員名と部門名は社員単位の値なのに対して、所属人数は部署単位の値なので、複雑な副問い合わせやグループ化などが必要になってくると思います。

分析関数を使用すれば下記のようにシンプルに取得することができます。

SELECT
    T1.社員名
    ,T2.部署名
    ,COUNT(*) OVER(PARTITION BY T2.部署コード) 所属人数
FROM
    社員マスタ T1
    INNER JOIN 部門マスタ T2
    ON T1.部署コード = T2.部署コード

集計関数COUNTの後にOVERを指定して、分析関数として集計します。

OVERの中のPARTITION BYORDER BYで分析方法を指定することができます。

今回はCOUNTで件数を取得したいだけなのでORDER BYは指定していません。

ROW_NUMBER()で行番号を取得したい場合はORDER BYで、ソート順を指定する必要があります。

今回は部署ごとの集計なのでPARTITION BYで部署コードを集計単位として指定します。部署コードが同じデータは全て同じ値が出力されるはずです。

PARTITION BYを指定しなかった場合は、社員全員の合計人数が出力されます。こちらの場合は全データ同じ値が出力されるはずです。

なので、ページング処理などで、データ全体の件数と、1ページ分のデータが必要な場合、別々にSQLを実行せずに1回のSQLで両方取得することができます。

SELECT
    T1.行番号
    ,T1.社員コード
    ,T1.社員名
    ,T1.全件数
FROM (
    SELECT
        ROW_NUMBER() OVER(ORDER BY T1.社員コード) 行番号
        ,COUNT(*) OVER() 全件数
        ,T1.社員コード
        ,T1.社員名
    FROM
        社員マスタ T1
) T1
WHERE
    T1.行番号 BETWEEN 11 AND 20
ORDER BY T1.行番号
実行結果
行番号社員コード社員名全件数
66テスト社員61500
77テスト社員71500
88テスト社員81500
99テスト社員91500
1010テスト社員101500

PARTITION BYを指定すれば、列ごとに集計単位を変えることができるので、例えば、社員一覧を取得するSQL(社員単位)で、部署内で最年長の年齢・所属人数(部署単位)や全社員で最年長の年齢・所属人数(単位なし)をシンプルに1回のSQLで取得することができます。


関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。例としてSQL 副問い合わせの基本を理解するで扱ったFROM句の副問い合わせのSQLをおさらいします。※今回は学習...


  • SQL WHERE句でデータを絞り込む

    「社員マスタ」と「部署マスタ」というテーブルがあります。今回は、社員マスタに「年齢」カラムを追加してあります。年齢が25歳以上で営業部に所属する社員を表示したい。SQLは下記のようになります。取得する...


  • SQL UPDATE文でデータを更新する

    UPDATE文でデータベースに新しいデータを更新する方法を紹介します。「社員マスタ」というテーブルがあります。カラムは下記のとおりです。テスト社員2の年齢を31歳に更新したい場合、以下のようなSQLを...


  • SQL 副問い合わせの基本を理解する

    副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。例えば下記のSQL文は副問い合わせを使用しています。副問い合わせはWHERE句だけでなく、SELECT句やFROM句でも使用する...


  • SQL SELECT句の基本的な使い方

    SELECT句ではデータベースの指定したテーブルからデータを取得する際に、どの項目を取得するか指定します。下記に具体的な使い方を紹介します。「商品マスタ」というテーブルがあります。カラムは下記のとおり...


  • SQL SELECTした結果をINSERTで登録する

    SELECTとINSERTを組み合わせて効率よくデータを登録することができます。SELECT文で取得したデータをINSERT文でデータベースに新しいデータを登録する方法を紹介します。「社員マスタ」とい...


  • SQL ORACLEのROWNUMで行番号を取得する際の注意点

    Oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • SQL ROLLUP文で小計行・合計行を出力する (oracle, sql server)

    「社員マスタ」と「売上明細」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。社員ごとに、会社ごとの売上合計を表示し、社員ごとにすべての会社の小計行も出力したい、また最...


  • SQL チューニングでレスポンス改善に効果のあったポイント

    SQLのレスポンス改善に効果のあった対応内容をまとめます。環境はOracleですが、他のデータベースでも参考になると思います。パフォーマンスは同じようなSQLでもテーブルのインデックスなどの構成やデー...


  • SQLとプログラミング言語の考え方の違い

    SQLは他のJAVAやC言語などのプログラミング言語とは異なる考え方で、実装を行う必要があります。プログラミング言語は基本的には上から順番に実行されていきます。これを手続き型言語と呼ぶことが多いのです...