SQL OVER句の分析関数で効率よくデータを集計する

分析関数を使用すれば、効率よく簡単にデータを集計することができます。

例えば、社員一覧と社員の所属する部署の所属人数を取得したい場合、分析関数を使わない場合は下記のように取得していました。

SELECT
    T1.社員名
    ,T2.部署名
    ,(
        SELECT COUNT(*)
        FROM 社員マスタ S1
        WHERE S1.部署コード = T2.部署コード
    ) 所属人数
FROM
    社員マスタ T1
    INNER JOIN 部署マスタ T2
    ON T1.部署コード = T2.部署コード
実行結果
社員名部署名所属人数
テスト社員1営業部10
テスト社員2営業部10
テスト社員3開発部30
テスト社員4営業部10

やり方はいろいろあると思いますが、社員名と部門名は社員単位の値なのに対して、所属人数は部署単位の値なので、複雑な副問い合わせやグループ化などが必要になってくると思います。

分析関数を使用すれば下記のようにシンプルに取得することができます。

SELECT
    T1.社員名
    ,T2.部署名
    ,COUNT(*) OVER(PARTITION BY T2.部署コード) 所属人数
FROM
    社員マスタ T1
    INNER JOIN 部門マスタ T2
    ON T1.部署コード = T2.部署コード

集計関数COUNTの後にOVERを指定して、分析関数として集計します。

OVERの中のPARTITION BYORDER BYで分析方法を指定することができます。

今回はCOUNTで件数を取得したいだけなのでORDER BYは指定していません。

ROW_NUMBER()で行番号を取得したい場合はORDER BYで、ソート順を指定する必要があります。

今回は部署ごとの集計なのでPARTITION BYで部署コードを集計単位として指定します。部署コードが同じデータは全て同じ値が出力されるはずです。

PARTITION BYを指定しなかった場合は、社員全員の合計人数が出力されます。こちらの場合は全データ同じ値が出力されるはずです。

なので、ページング処理などで、データ全体の件数と、1ページ分のデータが必要な場合、別々にSQLを実行せずに1回のSQLで両方取得することができます。

SELECT
    T1.行番号
    ,T1.社員コード
    ,T1.社員名
    ,T1.全件数
FROM (
    SELECT
        ROW_NUMBER() OVER(ORDER BY T1.社員コード) 行番号
        ,COUNT(*) OVER() 全件数
        ,T1.社員コード
        ,T1.社員名
    FROM
        社員マスタ T1
) T1
WHERE
    T1.行番号 BETWEEN 11 AND 20
ORDER BY T1.行番号
実行結果
行番号社員コード社員名全件数
66テスト社員61500
77テスト社員71500
88テスト社員81500
99テスト社員91500
1010テスト社員101500

PARTITION BYを指定すれば、列ごとに集計単位を変えることができるので、例えば、社員一覧を取得するSQL(社員単位)で、部署内で最年長の年齢・所属人数(部署単位)や全社員で最年長の年齢・所属人数(単位なし)をシンプルに1回のSQLで取得することができます。


関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句でVIEWを作成し重複するSQL文をまとめる方法を説明します。WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。


  • SQL OVER句の分析関数で効率よくデータを集計する

    分析関数を使用すれば、効率よく簡単にデータを集計することができます。集計関数COUNTの後にOVERを指定して、分析関数として集計します。OVERの中のPARTITION BYとORDER BYで分析...


  • SQL ORDER BY句で取得したデータを並び替える

    ORDER BY句で取得したデータを並び替える(ソート)方法について説明します。取得するデータを並び替えるには、ORDER BY句でソートしたいカラムを指定します。


  • SQL oracleでnullを比較する際の注意点

    oracleでnullを扱うときに注意する点をまとめました。値がnullのデータを取得したいときは、イコール(=)ではなくIS NULLで取得する必要があります。nullも含めて取得する場合は、NVL...


  • SQL MERGE文でINSERTとUPDATEを一回で行う

    テーブルにデータがすでに存在している場合は更新(UPDATE)、存在していない場合は登録(INSERT)をしたい場合があると思います。MERGE文を使えば一回のSQLで、INSERTとUPDATEの処...


  • SQL PARTITION BYで効率よくデータを取得する

    PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。PATITION BYで部署コード単位で集計することができるようになります。売上累計の降順で並...


  • SQL INSERT文でデータを登録する

    INSERT文でデータベースに新しいデータを登録する方法を紹介します。テーブルに新しいデータを登録したい場合、以下のようなSQLを実行します。


  • SQL インデックスが効かない場合の原因と対処法

    テーブルにインデックスを張っていても実行計画を見るとなぜかテーブルがフルスキャンされていて「なんで?」となった経験があるかと思います。せっかく張ったインデックスが効かないSQLの実装例と対処法を紹介し...


  • SQL IN句をEXISTS句に変換する方法

    IN句をEXISTS句に変換する方法を紹介します。IN句よりもEXISTS句のほうがパフォーマンスが良くなる場合が多いので、主にレスポンス対策としてこの書き換えを行うことが多いと思います。


  • SQL IN句に1000件以上要素を指定したときのエラーの対処法

    SQLのIN句に1000件以上指定するとORA-01795: リストに指定できる式の最大数は1000です。のエラーが発生してしまいます。EXISTS句に書き換えられる場合は書き換えてしまうのが一番簡単...