omachizura

SQLの基本的なことからスタートし、高度な検索・集計方法などの応用テクニックまでできるスキルを紹介します。


PARTITION BYで効率よくデータを取得する

OVER句の分析関数で効率よくデータを集計する で分析関数を使って効率よくデータを集計する方法を紹介しましたが、PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。

例えば、以下のようなデータがあるとします。(実際にはこのようなテーブル構成は考えにくいですが、わかりやすくするためにこのような例にしています。副問い合わせの結果や、VIEWなどで以下のテーブルを取得したと考えてください)

売上結果
部署コード部署名社員コード社員名年月売上金額
1営業部1テスト社員1201501500
1営業部1テスト社員12015021500
2開発部2テスト社員2201501100
2開発部2テスト社員22015021000
2開発部3テスト社員3201501200
2開発部3テスト社員3201502100
2開発部4テスト社員42015012000
2開発部4テスト社員42015021000
1営業部5テスト社員52015011500
1営業部5テスト社員52015022000

課題

部署ごとに、売上金額の合計が一番多い社員を表示したい。

SQLは下記のようになります。

SELECT
  URI2.部署名
  ,URI2.社員名
  ,URI2.売上累計
FROM (
  SELECT
    URI1.部署名
    ,URI1.社員名
    ,URI1.売上累計
    ,ROW_NUMBER() OVER(PATITION BY URI1.部署コード ORDER BY URI1.売上累計 DESC, URI1.社員コード) 売上ランク
  FROM (
    --部署、社員、ごとに売上金額の合計を取得します
    SELECT
      T1.部署コード
      ,T1.部署名
      ,T1.社員コード
      ,T1.社員名
      ,SUM(T1.売上金額) AS 売上累計
    FROM
      売上結果 T1
    GROUP BY
      T1.部署コード
      ,T1.部署名
      ,T1.社員コード
      ,T1.社員名
  ) URI1
) URI2
WHERE
  URI2.売上ランク = 1
実行結果
部署名社員名売上累計
営業部テスト社員53500
開発部テスト社員43000

URI1を取得する副問い合わせは、年月ごとにあるデータを、グループ化して、社員ごとに全期間の売上の合計を取得しています。

URI1
部署コード部署名社員コード社員名売上累計
1営業部1テスト社員12000
2開発部2テスト社員21100
2開発部3テスト社員3300
2開発部4テスト社員43000
1営業部5テスト社員53500

営業部で一番売上が多いのはテスト社員5、開発部ではテスト社員4なので、この2社員だけ取得する必要があります。

URI2を取得する副問い合わせの結果は以下のようになります。

URI2
部署名社員名売上累計売上ランク
営業部テスト社員120002
開発部テスト社員211002
開発部テスト社員33003
開発部テスト社員430001
営業部テスト社員535001

ROW_NUMBER() OVER(PATITION BY URI1.部署コード DESC ORDER BY URI1.売上累計, URI1.社員コード)で、部署コードごとに売上累計の降順で行番号を取得しています(売上累計が同じ場合は社員コードの昇順に取得しています)。PATITION BY URI1.部署コードで部署コード単位で集計することができるようになります。売上累計の降順で並び替えたときの1行目が売上累計が最大のデータということになります。

よって、URI2テーブルをWHERE句で売上ランク=1で絞り込むと、部署ごとに売上累計が最大の社員のデータのみ取得することができます。






  • CASE文で効率よく集計する

    CASE文を使い、効率よく集計するテクニックを説明します。SUMで集計する際に集計したいデータの場合のみ、そのデータの売上金額を足し、それ以外は0を足すという方法で効率よく集計できます。


  • ROLLUP文で小計行・合計行を出力する

    ROLLUP文で小計行・合計行を出力する方法を説明します。ROLLUPという文をGROUP BY句で指定すると、小計行や合計行を出力することができます。


  • 副問い合わせを理解する

    副問い合わせを説明します。副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。


  • DISTINCT文で重複行を1行で表示する方法

    DISTINCT文で重複行を1行で表示する方法を説明します。SELECT句でSELECTのあとにDISTINCTを指定すると、重複した列は1行のみ出力するようになります。


  • WITH句を使い重複するSQL文をまとめる方法

    WITH句でVIEWを作成し重複するSQL文をまとめる方法を説明します。WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。


  • ROWNUMで行番号を取得する際の注意点

    oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • OVER句の分析関数で効率よくデータを集計する

    分析関数を使用すれば、効率よく簡単にデータを集計することができます。集計関数COUNTの後にOVERを指定して、分析関数として集計します。OVERの中のPARTITION BYとORDER BYで分析...


  • PARTITION BYで効率よくデータを取得する

    PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。PATITION BYで部署コード単位で集計することができるようになります。売上累計の降順で並...


  • IN句をEXISTS句に変換する方法

    IN句をEXISTS句に変換する方法を紹介します。IN句よりもEXISTS句のほうがパフォーマンスが良くなる場合が多いので、主にレスポンス対策としてこの書き換えを行うことが多いと思います。


  • チューニングでレスポンス改善に効果のあったポイント

    1回のSQLで一気にまとめて取得したほうがレスポンスは早いイメージがありますが、あまり大量のデータを扱うSQLを実行するとサーバーに負荷がかかってしまい、遅くなってしまうことがあります。