omachizura

SQLの基本的なことからスタートし、高度な検索・集計方法などの応用テクニックまでできるスキルを紹介します。


カンマ区切りの文字列を複数列に分割して取得する

csvの値など、カンマ区切りの文字列がそのままデータベースに登録されていて、その値をカンマ区切りに複数の列に分割して取得したい場合があります。

INSTRSUBSTRをうまく組み合わせれば取得することができます。

例えば以下のようなテーブルがあるとします。

CSVデータ
レコード
1,A,あ
2,B,い
3,C

以下のようなSQLを実行します。

SELECT
  CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN T1.レコード
    ELSE SUBSTR(T1.レコード, 1, INSTR(T1.レコード, ',', 1, 1) -1) END1
  ,CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN NULL
    WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1)
    ELSE SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1, INSTR(T1.レコード, ',', 1, 2) - INSTR(T1.レコード, ',', 1, 1) - 1) END2
  ,CASE WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN NULL
    WHEN INSTR(T1.レコード, ',', 1, 3) = 0 THEN SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 2) + 1)
    ELSE SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 2) + 1, INSTR(T1.レコード, ',', 1, 3) - INSTR(T1.レコード, ',', 1, 2) - 1) END3
FROM
  CSVデータ T1
CSVデータ
列1列2列3
1A
2B
3Cnull

INSTR関数

INSTR関数は文字を検索する関数です。

INSTR(対象の文字列, 検索する文字列, 検索の開始位置(1文字目が1), 出現回数)

のように引数を指定し、出現した位置を返します。出現しなかった場合は0を返します。

例えば、上記SQLの2行目の部分

CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN

は、T1.レコードの文字列から、カンマ1文字目から検索し、1回出現した位置が0、すなわちカンマがひとつも含まれていない場合という条件になります。

SUBSTR関数

SUBSTR関数は文字を切り出す関数です。

SUBSTR(対象の文字列, 開始位置, 切り出す文字数)

のように引数を指定し、切り取られた文字列を返します。

例えば、上記SQLの3行目の部分

SUBSTR(T1.レコード, 1, INSTR(T1.レコード, ',', 1, 1) -1)

は、T1.レコードの文字列を、1文字目から、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置-1文字を切り出します。

SQLの解説

列1

最初の項目(列1)を取得するSQLは上記で説明したとおりです。文字列にカンマが1つも含まれていない場合はT1.レコードをそのまま出力し、以外の場合は最初に出現したカンマまで(最初に出現したカンマの位置-1)の文字列を出力します。

列2

4行目のCASE文の条件は列1の条件と同様です。しかし、列1の場合とは異なり、列2の場合は、カンマがひとつも含まれていない場合はnullを出力します。

5行目について、

WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN

なので、T1.レコードの文字列から、カンマ1文字目から検索し、2回出現した位置が0、すなわちカンマが1つだけ含まれている場合という条件になります。

この条件を満たす場合は、

SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1)

なので、T1.レコードの文字列を、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置+1以降の文字列を切り出します。

6行目について、ELSEなので4行目、5行目の条件以外の場合、すなわちカンマが2つ以上含まれている場合の処理です。

SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1, INSTR(T1.レコード, ',', 1, 2) - INSTR(T1.レコード, ',', 1, 1) - 1)

なので、T1.レコードの文字列を、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置+1からT1.レコードの文字列から、カンマを1文字目から検索し、2回出現した位置-T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置(すなわちカンマの1つ目から2つ目の間の文字の数)文字を切り出します。

文章にしたらかなりややこしくなってしまいました...

列3以降は、列2のSQLのカンマの出現する回数INSTR(T1.レコード, ',', 1, X)を増やしていけば取得することができます。

無理にSQLで取得しようとするのではなく、普通に取得したあとにsplitなどで加工したほうが簡単で不具合も少なく済みそうです。






  • INSERT文でデータを登録する

    INSERT文でデータベースに新しいデータを登録する方法を紹介します。テーブルに新しいデータを登録したい場合、以下のようなSQLを実行します。


  • SQL SELECTした結果をINSERTで登録する

    SELECT-INSERT文なら、SELECTしたデータをそのまま一気にまとめて登録できるので、実装も簡単ですのでおすすめです。件数分ループでSQLを実行するよりも1回のSQLで一気にまとめて処理でき...


  • UPDATE文でデータを更新する

    UPDATE文でデータベースに新しいデータを更新する方法を紹介します。自身の値を参照する方法や、副問い合わせの結果をUPDATEする方法も合わせて紹介します。副問い合わせの結果を更新する場合、SETす...


  • カンマ区切りの文字列を複数列に分割して取得する

    csvの値など、カンマ区切りの文字列がそのままデータベースに登録されていて、その値をカンマ区切りに複数の列に分割して取得したい場合があります。INSTRとSUBSTRをうまく組み合わせれば取得すること...


  • プロシージャでSQL文の中で条件分岐を行う

    PL/SQLプロシージャで、パラメータなどの値によってSQLの条件を変更するとき、IF文で条件分岐をすることができますが、IFとELSEで同じようなSQLの場合は、同じようなSQLを複数箇所に記述しな...


  • SQLとプログラミング言語の考え方の違い

    SQLは手続き型言語のように、上から考えるのではなく、集合を操作するという感覚で実装するとうまくいくように思います。また、上からではなく、逆に下から考えるという発送も必要だと思います。1ステップずつ実...


  • MERGE文でINSERTとUPDATEを一回で行う

    テーブルにデータがすでに存在している場合は更新(UPDATE)、存在していない場合は登録(INSERT)をしたい場合があると思います。MERGE文を使えば一回のSQLで、INSERTとUPDATEの処...


  • oracleでnullを比較する際の注意点

    oracleでnullを扱うときに注意する点をまとめました。値がnullのデータを取得したいときは、イコール(=)ではなくIS NULLで取得する必要があります。nullも含めて取得する場合は、NVL...


  • SQL IN句に1000件以上要素を指定したときのエラーの対処法

    SQLのIN句に1000件以上指定するとORA-01795: リストに指定できる式の最大数は1000です。のエラーが発生してしまいます。EXISTS句に書き換えられる場合は書き換えてしまうのが一番簡単...


  • SQL インデックスが効かない場合の原因と対処法

    テーブルにインデックスを張っていても実行計画を見るとなぜかテーブルがフルスキャンされていて「なんで?」となった経験があるかと思います。せっかく張ったインデックスが効かないSQLの実装例と対処法を紹介し...