SQL カンマ区切りの文字列を複数列に分割して取得する

CSVの値など、カンマ区切りの文字列がそのままデータベースに登録されていて、その値をカンマ区切りに複数の列に分割して取得したい場合があります。

INSTRSUBSTRをうまく組み合わせれば取得することができます。

例えば以下のようなテーブルがあるとします。

CSVデータ
レコード
1,A,あ
2,B,い
3,C

以下のようなSQLを実行します。

SELECT
  CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN T1.レコード
    ELSE SUBSTR(T1.レコード, 1, INSTR(T1.レコード, ',', 1, 1) -1) END1
  ,CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN NULL
    WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1)
    ELSE SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1, INSTR(T1.レコード, ',', 1, 2) - INSTR(T1.レコード, ',', 1, 1) - 1) END2
  ,CASE WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN NULL
    WHEN INSTR(T1.レコード, ',', 1, 3) = 0 THEN SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 2) + 1)
    ELSE SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 2) + 1, INSTR(T1.レコード, ',', 1, 3) - INSTR(T1.レコード, ',', 1, 2) - 1) END3
FROM
  CSVデータ T1
CSVデータ
列1列2列3
1A
2B
3Cnull

INSTR関数

INSTR関数は文字を検索する関数です。

INSTR(対象の文字列, 検索する文字列, 検索の開始位置(1文字目が1), 出現回数)のように引数を指定し、出現した位置を返します。出現しなかった場合は0を返します。

例えば、上記SQLの2行目の部分CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN は、T1.レコードの文字列から、カンマ1文字目から検索し、1回出現した位置が0、すなわちカンマがひとつも含まれていない場合という条件になります。

SUBSTR関数

SUBSTR関数は文字を切り出す関数です。

SUBSTR(対象の文字列, 開始位置, 切り出す文字数)のように引数を指定し、切り取られた文字列を返します。

例えば、上記SQLの3行目の部分SUBSTR(T1.レコード, '1', 'INSTR(T1.レコード, ',', 1, 1) -1) は、T1.レコードの文字列を、1文字目から、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置-1文字を切り出します。

SQLの解説

列1

最初の項目(列1)を取得するSQLは上記で説明したとおりです。

文字列にカンマが1つも含まれていない場合はT1.レコードをそのまま出力し、以外の場合は最初に出現したカンマまで(最初に出現したカンマの位置-1)の文字列を出力します。

列2

4行目のCASE文の条件は列1の条件と同様です。

しかし、列1の場合とは異なり、列2の場合は、カンマがひとつも含まれていない場合はnullを出力します。

5行目について、WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THENなので、T1.レコードの文字列から、カンマ1文字目から検索し、2回出現した位置が0、すなわちカンマが1つだけ含まれている場合という条件になります。 この条件を満たす場合は、SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1)なので、T1.レコードの文字列を、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置+1以降の文字列を切り出します。

6行目について、ELSEなので4行目、5行目の条件以外の場合、すなわちカンマが2つ以上含まれている場合の処理です。

SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1, INSTR(T1.レコード, ',', 1, 2) - INSTR(T1.レコード, ',', 1, 1) - 1)なので、T1.レコードの文字列を、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置+1からT1.レコードの文字列から、カンマを1文字目から検索し、2回出現した位置-T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置(すなわちカンマの1つ目から2つ目の間の文字の数)文字を切り出します。

文章にしたらかなりややこしくなってしまいました...

列3以降は、列2のSQLのカンマの出現する回数INSTR(T1.レコード, ',', 1,X)を増やしていけば取得することができます。

無理にSQLで取得しようとするのではなく、普通に取得したあとにsplitなどで加工したほうが簡単で不具合も少なく済みそうです。


関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。例としてSQL 副問い合わせの基本を理解するで扱ったFROM句の副問い合わせのSQLをおさらいします。※今回は学習...


  • SQL WHERE句でデータを絞り込む

    「社員マスタ」と「部署マスタ」というテーブルがあります。今回は、社員マスタに「年齢」カラムを追加してあります。年齢が25歳以上で営業部に所属する社員を表示したい。SQLは下記のようになります。取得する...


  • SQL UPDATE文でデータを更新する

    UPDATE文でデータベースに新しいデータを更新する方法を紹介します。「社員マスタ」というテーブルがあります。カラムは下記のとおりです。テスト社員2の年齢を31歳に更新したい場合、以下のようなSQLを...


  • SQL 副問い合わせの基本を理解する

    副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。例えば下記のSQL文は副問い合わせを使用しています。副問い合わせはWHERE句だけでなく、SELECT句やFROM句でも使用する...


  • SQL SELECT句の基本的な使い方

    SELECT句ではデータベースの指定したテーブルからデータを取得する際に、どの項目を取得するか指定します。下記に具体的な使い方を紹介します。「商品マスタ」というテーブルがあります。カラムは下記のとおり...


  • SQL SELECTした結果をINSERTで登録する

    SELECTとINSERTを組み合わせて効率よくデータを登録することができます。SELECT文で取得したデータをINSERT文でデータベースに新しいデータを登録する方法を紹介します。「社員マスタ」とい...


  • SQL ORACLEのROWNUMで行番号を取得する際の注意点

    Oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • SQL ROLLUP文で小計行・合計行を出力する (oracle, sql server)

    「社員マスタ」と「売上明細」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。社員ごとに、会社ごとの売上合計を表示し、社員ごとにすべての会社の小計行も出力したい、また最...


  • SQL チューニングでレスポンス改善に効果のあったポイント

    SQLのレスポンス改善に効果のあった対応内容をまとめます。環境はOracleですが、他のデータベースでも参考になると思います。パフォーマンスは同じようなSQLでもテーブルのインデックスなどの構成やデー...


  • SQLとプログラミング言語の考え方の違い

    SQLは他のJAVAやC言語などのプログラミング言語とは異なる考え方で、実装を行う必要があります。プログラミング言語は基本的には上から順番に実行されていきます。これを手続き型言語と呼ぶことが多いのです...