SQL PARTITION BYで効率よくデータを取得する

SQL OVER句の分析関数で効率よくデータを集計するで分析関数を使って効率よくデータを集計する方法を紹介しましたが、PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。

例えば、以下のようなデータがあるとします。(実際にはこのようなテーブル構成は考えにくいですが、わかりやすくするためにこのような例にしています。副問い合わせの結果や、VIEWなどで以下のテーブルを取得したと考えてください)

売上結果
部署コード部署名社員コード社員名年月売上金額
1営業部1テスト社員1201501500
1営業部1テスト社員12015021500
2開発部2テスト社員2201501100
2開発部2テスト社員22015021000
2開発部3テスト社員3201501200
2開発部3テスト社員3201502100
2開発部4テスト社員42015012000
2開発部4テスト社員42015021000
1営業部5テスト社員52015011500
1営業部5テスト社員52015022000

部署ごとに、売上金額の合計が一番多い社員を表示したい。

SQLは下記のようになります。

SELECT
    URI2.部署名
    ,URI2.社員名
    ,URI2.売上累計
FROM (
  SELECT
        URI1.部署名
        ,URI1.社員名
        ,URI1.売上累計
        ,ROW_NUMBER() OVER(PATITION BY URI1.部署コード ORDER BY URI1.売上累計 DESC, URI1.社員コード) 売上ランク
    FROM (
        --部署、社員、ごとに売上金額の合計を取得します
        SELECT
            T1.部署コード
            ,T1.部署名
            ,T1.社員コード
            ,T1.社員名
            ,SUM(T1.売上金額) AS 売上累計
        FROM
            売上結果 T1
        GROUP BY
            T1.部署コード
            ,T1.部署名
            ,T1.社員コード
            ,T1.社員名
    ) URI1
) URI2
WHERE
    URI2.売上ランク = 1
実行結果
部署名社員名売上累計
営業部テスト社員53500
開発部テスト社員43000

URI1を取得する副問い合わせは、年月ごとにあるデータを、グループ化して、社員ごとに全期間の売上の合計を取得しています。

URI1
部署コード部署名社員コード社員名売上金額
1営業部1テスト社員12000
2開発部2テスト社員21100
2開発部3テスト社員3300
2開発部4テスト社員43000
1営業部5テスト社員53500

営業部で一番売上が多いのはテスト社員5、開発部ではテスト社員4なので、この2社員だけ取得する必要があります。

URI2を取得する副問い合わせの結果は以下のようになります。

URI2
部署名社員名売上金額売上ランク
営業部テスト社員120002
開発部テスト社員211002
開発部テスト社員33003
開発部テスト社員430001
営業部テスト社員535001

ROW_NUMBER() OVER(PATITION BY URI1.部署コード DESC ORDER BY URI1.売上累計, URI1.社員コード)で、部署コードごとに売上累計の降順で行番号を取得しています(売上累計が同じ場合は社員コードの昇順に取得しています)。

PATITION BY URI1.部署コードで部署コード単位で集計することができるようになります。

売上累計の降順で並び替えたときの1行目が売上累計が最大のデータということになります。

よって、URI2テーブルをWHERE句で売上ランク=1で絞り込むと、部署ごとに売上累計が最大の社員のデータのみ取得することができます。


関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句でVIEWを作成し重複するSQL文をまとめる方法を説明します。WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。


  • SQL WHERE句でデータを絞り込む

    WHERE句でデータを絞り込む方法について説明します。取得するデータを絞り込むには、WHERE句で条件を指定します。


  • SQL UPDATE文でデータを更新する

    UPDATE文でデータベースに新しいデータを更新する方法を紹介します。自身の値を参照する方法や、副問い合わせの結果をUPDATEする方法も合わせて紹介します。副問い合わせの結果を更新する場合、SETす...


  • SQL 副問い合わせの基本を理解する

    副問い合わせを説明します。副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。


  • SQL SELECT句の基本的な使い方

    SELECT句の基本的な使い方について説明します。


  • SQL SELECTした結果をINSERTで登録する

    SELECT-INSERT文なら、SELECTしたデータをそのまま一気にまとめて登録できるので、実装も簡単ですのでおすすめです。件数分ループでSQLを実行するよりも1回のSQLで一気にまとめて処理でき...


  • SQL ORACLEのROWNUMで行番号を取得する際の注意点

    oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • SQL ROLLUP文で小計行・合計行を出力する (oracle, sql server)

    「社員マスタ」と「売上明細」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。社員ごとに、会社ごとの売上合計を表示し、社員ごとにすべての会社の小計行も出力したい、また最...


  • SQL チューニングでレスポンス改善に効果のあったポイント

    1回のSQLで一気にまとめて取得したほうがレスポンスは早いイメージがありますが、あまり大量のデータを扱うSQLを実行するとサーバーに負荷がかかってしまい、遅くなってしまうことがあります。


  • SQLとプログラミング言語の考え方の違い

    SQLは手続き型言語のように、上から考えるのではなく、集合を操作するという感覚で実装するとうまくいくように思います。また、上からではなく、逆に下から考えるという発送も必要だと思います。1ステップずつ実...