omachizura

SQLの基本的なことからスタートし、高度な検索・集計方法などの応用テクニックまでできるスキルを紹介します。


OVER句の分析関数で効率よくデータを集計する

分析関数を使用すれば、効率よく簡単にデータを集計することができます。

例えば、社員一覧と社員の所属する部署の所属人数を取得したい場合、分析関数を使わない場合は下記のように取得していました。

SELECT
  T1.社員名
  ,T2.部署名
  ,(
    SELECT COUNT(*)
    FROM 社員マスタ S1
    WHERE S1.部署コード = T2.部署コード
  ) 所属人数
FROM
  社員マスタ T1
  INNER JOIN 部署マスタ T2
    ON T1.部署コード = T2.部署コード
実行結果
社員名部署名所属人数
テスト社員1営業部10
テスト社員2営業部10
テスト社員3開発部30
テスト社員4営業部10

やり方はいろいろあると思いますが、社員名と部門名は社員単位の値なのに対して、所属人数は部署単位の値なので、 複雑な副問い合わせやグループ化などが必要になってくると思います。

分析関数を使用すれば下記のようにシンプルに取得することができます。

SELECT
  T1.社員名
  ,T2.部署名
  ,COUNT(*) OVER(PARTITION BY T2.部署コード) 所属人数
FROM
  社員マスタ T1
  INNER JOIN 部門マスタ T2
    ON T1.部署コード = T2.部署コード

集計関数COUNTの後にOVERを指定して、分析関数として集計します。OVERの中のPARTITION BYORDER BYで分析方法を指定することができます。今回はCOUNTで件数を取得したいだけなのでORDER BYは指定していません。

ROW_NUMBER()で行番号を取得したい場合はORDER BYで、ソート順を指定する必要があります。

今回は部署ごとの集計なのでPARTITION BYで部署コードを集計単位として指定します。部署コードが同じデータは全て同じ値が出力されるはずです。

PARTITION BYを指定しなかった場合は、社員全員の合計人数が出力されます。こちらの場合は全データ同じ値が出力されるはずです。

なので、ページング処理などで、データ全体の件数と、1ページ分のデータが必要な場合、別々にSQLを実行せずに1回のSQLで両方取得することができます。

SELECT
  T1.行番号
  ,T1.社員コード
  ,T1.社員名
  ,T1.全件数
FROM (
  SELECT
    ROW_NUMBER() OVER(ORDER BY T1.社員コード) 行番号
    ,COUNT(*) OVER() 全件数
    ,T1.社員コード
    ,T1.社員名
  FROM
    社員マスタ T1
) T1
WHERE
  T1.行番号 BETWEEN 11 AND 20
ORDER BY T1.行番号
実行結果
行番号社員コード社員名全件数
66テスト社員61500
77テスト社員71500
88テスト社員81500
99テスト社員91500
1010テスト社員101500

PARTITION BYを指定すれば、列ごとに集計単位を変えることができるので、例えば、社員一覧を取得するSQL(社員単位)で、部署内で最年長の年齢・所属人数(部署単位)や全社員で最年長の年齢・所属人数(単位なし)をシンプルに1回のSQLで取得することができます。






  • CASE文で効率よく集計する

    CASE文を使い、効率よく集計するテクニックを説明します。SUMで集計する際に集計したいデータの場合のみ、そのデータの売上金額を足し、それ以外は0を足すという方法で効率よく集計できます。


  • ROLLUP文で小計行・合計行を出力する

    ROLLUP文で小計行・合計行を出力する方法を説明します。ROLLUPという文をGROUP BY句で指定すると、小計行や合計行を出力することができます。


  • 副問い合わせを理解する

    副問い合わせを説明します。副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。


  • DISTINCT文で重複行を1行で表示する方法

    DISTINCT文で重複行を1行で表示する方法を説明します。SELECT句でSELECTのあとにDISTINCTを指定すると、重複した列は1行のみ出力するようになります。


  • WITH句を使い重複するSQL文をまとめる方法

    WITH句でVIEWを作成し重複するSQL文をまとめる方法を説明します。WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。


  • ROWNUMで行番号を取得する際の注意点

    oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • OVER句の分析関数で効率よくデータを集計する

    分析関数を使用すれば、効率よく簡単にデータを集計することができます。集計関数COUNTの後にOVERを指定して、分析関数として集計します。OVERの中のPARTITION BYとORDER BYで分析...


  • PARTITION BYで効率よくデータを取得する

    PARTITION BYをうまく使用すれば、効率よく簡単にデータを集計だけでなく、取得することができます。PATITION BYで部署コード単位で集計することができるようになります。売上累計の降順で並...


  • IN句をEXISTS句に変換する方法

    IN句をEXISTS句に変換する方法を紹介します。IN句よりもEXISTS句のほうがパフォーマンスが良くなる場合が多いので、主にレスポンス対策としてこの書き換えを行うことが多いと思います。


  • チューニングでレスポンス改善に効果のあったポイント

    1回のSQLで一気にまとめて取得したほうがレスポンスは早いイメージがありますが、あまり大量のデータを扱うSQLを実行するとサーバーに負荷がかかってしまい、遅くなってしまうことがあります。