SQL PARTITION BYで効率よくデータを取得する

SQL OVER句の分析関数で効率よくデータを集計するで分析関数を使って効率よくデータを集計する方法を紹介しましたが、PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。

例えば、以下のようなデータがあるとします。(実際にはこのようなテーブル構成は考えにくいですが、わかりやすくするためにこのような例にしています。副問い合わせの結果や、VIEWなどで以下のテーブルを取得したと考えてください)

売上結果
部署コード部署名社員コード社員名年月売上金額
1営業部1テスト社員1201501500
1営業部1テスト社員12015021500
2開発部2テスト社員2201501100
2開発部2テスト社員22015021000
2開発部3テスト社員3201501200
2開発部3テスト社員3201502100
2開発部4テスト社員42015012000
2開発部4テスト社員42015021000
1営業部5テスト社員52015011500
1営業部5テスト社員52015022000

部署ごとに、売上金額の合計が一番多い社員を表示したい。

SQLは下記のようになります。

SELECT
    URI2.部署名
    ,URI2.社員名
    ,URI2.売上累計
FROM (
  SELECT
        URI1.部署名
        ,URI1.社員名
        ,URI1.売上累計
        ,ROW_NUMBER() OVER(PATITION BY URI1.部署コード ORDER BY URI1.売上累計 DESC, URI1.社員コード) 売上ランク
    FROM (
        --部署、社員、ごとに売上金額の合計を取得します
        SELECT
            T1.部署コード
            ,T1.部署名
            ,T1.社員コード
            ,T1.社員名
            ,SUM(T1.売上金額) AS 売上累計
        FROM
            売上結果 T1
        GROUP BY
            T1.部署コード
            ,T1.部署名
            ,T1.社員コード
            ,T1.社員名
    ) URI1
) URI2
WHERE
    URI2.売上ランク = 1
実行結果
部署名社員名売上累計
営業部テスト社員53500
開発部テスト社員43000

URI1を取得する副問い合わせは、年月ごとにあるデータを、グループ化して、社員ごとに全期間の売上の合計を取得しています。

URI1
部署コード部署名社員コード社員名売上金額
1営業部1テスト社員12000
2開発部2テスト社員21100
2開発部3テスト社員3300
2開発部4テスト社員43000
1営業部5テスト社員53500

営業部で一番売上が多いのはテスト社員5、開発部ではテスト社員4なので、この2社員だけ取得する必要があります。

URI2を取得する副問い合わせの結果は以下のようになります。

URI2
部署名社員名売上金額売上ランク
営業部テスト社員120002
開発部テスト社員211002
開発部テスト社員33003
開発部テスト社員430001
営業部テスト社員535001

ROW_NUMBER() OVER(PATITION BY URI1.部署コード DESC ORDER BY URI1.売上累計, URI1.社員コード)で、部署コードごとに売上累計の降順で行番号を取得しています(売上累計が同じ場合は社員コードの昇順に取得しています)。

PATITION BY URI1.部署コードで部署コード単位で集計することができるようになります。

売上累計の降順で並び替えたときの1行目が売上累計が最大のデータということになります。

よって、URI2テーブルをWHERE句で売上ランク=1で絞り込むと、部署ごとに売上累計が最大の社員のデータのみ取得することができます。


関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。例としてSQL 副問い合わせの基本を理解するで扱ったFROM句の副問い合わせのSQLをおさらいします。※今回は学習...


  • SQL WHERE句でデータを絞り込む

    「社員マスタ」と「部署マスタ」というテーブルがあります。今回は、社員マスタに「年齢」カラムを追加してあります。年齢が25歳以上で営業部に所属する社員を表示したい。SQLは下記のようになります。取得する...


  • SQL UPDATE文でデータを更新する

    UPDATE文でデータベースに新しいデータを更新する方法を紹介します。「社員マスタ」というテーブルがあります。カラムは下記のとおりです。テスト社員2の年齢を31歳に更新したい場合、以下のようなSQLを...


  • SQL 副問い合わせの基本を理解する

    副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。例えば下記のSQL文は副問い合わせを使用しています。副問い合わせはWHERE句だけでなく、SELECT句やFROM句でも使用する...


  • SQL SELECT句の基本的な使い方

    SELECT句ではデータベースの指定したテーブルからデータを取得する際に、どの項目を取得するか指定します。下記に具体的な使い方を紹介します。「商品マスタ」というテーブルがあります。カラムは下記のとおり...


  • SQL SELECTした結果をINSERTで登録する

    SELECTとINSERTを組み合わせて効率よくデータを登録することができます。SELECT文で取得したデータをINSERT文でデータベースに新しいデータを登録する方法を紹介します。「社員マスタ」とい...


  • SQL ORACLEのROWNUMで行番号を取得する際の注意点

    Oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • SQL ROLLUP文で小計行・合計行を出力する (oracle, sql server)

    「社員マスタ」と「売上明細」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。社員ごとに、会社ごとの売上合計を表示し、社員ごとにすべての会社の小計行も出力したい、また最...


  • SQL チューニングでレスポンス改善に効果のあったポイント

    SQLのレスポンス改善に効果のあった対応内容をまとめます。環境はOracleですが、他のデータベースでも参考になると思います。パフォーマンスは同じようなSQLでもテーブルのインデックスなどの構成やデー...


  • SQLとプログラミング言語の考え方の違い

    SQLは他のJAVAやC言語などのプログラミング言語とは異なる考え方で、実装を行う必要があります。プログラミング言語は基本的には上から順番に実行されていきます。これを手続き型言語と呼ぶことが多いのです...