SQL カンマ区切りの文字列を複数列に分割して取得する

CSVの値など、カンマ区切りの文字列がそのままデータベースに登録されていて、その値をカンマ区切りに複数の列に分割して取得したい場合があります。

INSTRSUBSTRをうまく組み合わせれば取得することができます。

例えば以下のようなテーブルがあるとします。

CSVデータ
レコード
1,A,あ
2,B,い
3,C

以下のようなSQLを実行します。

SELECT
  CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN T1.レコード
    ELSE SUBSTR(T1.レコード, 1, INSTR(T1.レコード, ',', 1, 1) -1) END1
  ,CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN NULL
    WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1)
    ELSE SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1, INSTR(T1.レコード, ',', 1, 2) - INSTR(T1.レコード, ',', 1, 1) - 1) END2
  ,CASE WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THEN NULL
    WHEN INSTR(T1.レコード, ',', 1, 3) = 0 THEN SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 2) + 1)
    ELSE SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 2) + 1, INSTR(T1.レコード, ',', 1, 3) - INSTR(T1.レコード, ',', 1, 2) - 1) END3
FROM
  CSVデータ T1
CSVデータ
列1列2列3
1A
2B
3Cnull

INSTR関数

INSTR関数は文字を検索する関数です。

INSTR(対象の文字列, 検索する文字列, 検索の開始位置(1文字目が1), 出現回数)のように引数を指定し、出現した位置を返します。出現しなかった場合は0を返します。

例えば、上記SQLの2行目の部分CASE WHEN INSTR(T1.レコード, ',', 1, 1) = 0 THEN は、T1.レコードの文字列から、カンマ1文字目から検索し、1回出現した位置が0、すなわちカンマがひとつも含まれていない場合という条件になります。

SUBSTR関数

SUBSTR関数は文字を切り出す関数です。

SUBSTR(対象の文字列, 開始位置, 切り出す文字数)のように引数を指定し、切り取られた文字列を返します。

例えば、上記SQLの3行目の部分SUBSTR(T1.レコード, '1', 'INSTR(T1.レコード, ',', 1, 1) -1) は、T1.レコードの文字列を、1文字目から、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置-1文字を切り出します。

SQLの解説

列1

最初の項目(列1)を取得するSQLは上記で説明したとおりです。

文字列にカンマが1つも含まれていない場合はT1.レコードをそのまま出力し、以外の場合は最初に出現したカンマまで(最初に出現したカンマの位置-1)の文字列を出力します。

列2

4行目のCASE文の条件は列1の条件と同様です。

しかし、列1の場合とは異なり、列2の場合は、カンマがひとつも含まれていない場合はnullを出力します。

5行目について、WHEN INSTR(T1.レコード, ',', 1, 2) = 0 THENなので、T1.レコードの文字列から、カンマ1文字目から検索し、2回出現した位置が0、すなわちカンマが1つだけ含まれている場合という条件になります。 この条件を満たす場合は、SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1)なので、T1.レコードの文字列を、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置+1以降の文字列を切り出します。

6行目について、ELSEなので4行目、5行目の条件以外の場合、すなわちカンマが2つ以上含まれている場合の処理です。

SUBSTR(T1.レコード, INSTR(T1.レコード, ',', 1, 1) + 1, INSTR(T1.レコード, ',', 1, 2) - INSTR(T1.レコード, ',', 1, 1) - 1)なので、T1.レコードの文字列を、T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置+1からT1.レコードの文字列から、カンマを1文字目から検索し、2回出現した位置-T1.レコードの文字列から、カンマを1文字目から検索し、1回出現した位置(すなわちカンマの1つ目から2つ目の間の文字の数)文字を切り出します。

文章にしたらかなりややこしくなってしまいました...

列3以降は、列2のSQLのカンマの出現する回数INSTR(T1.レコード, ',', 1,X)を増やしていけば取得することができます。

無理にSQLで取得しようとするのではなく、普通に取得したあとにsplitなどで加工したほうが簡単で不具合も少なく済みそうです。


関連記事

  • SQL WITH句でVIEWを作成し重複するSQL文をまとめる

    WITH句でVIEWを作成し重複するSQL文をまとめる方法を説明します。WITH句を使えば1つの副問い合わせ(SQL)を複数の箇所で使いまわすことができます。


  • SQL WHERE句でデータを絞り込む

    WHERE句でデータを絞り込む方法について説明します。取得するデータを絞り込むには、WHERE句で条件を指定します。


  • SQL UPDATE文でデータを更新する

    UPDATE文でデータベースに新しいデータを更新する方法を紹介します。自身の値を参照する方法や、副問い合わせの結果をUPDATEする方法も合わせて紹介します。副問い合わせの結果を更新する場合、SETす...


  • SQL 副問い合わせの基本を理解する

    副問い合わせを説明します。副問い合わせとはSQL文の中に入れ子でSQL文を指定することをいいます。


  • SQL SELECT句の基本的な使い方

    SELECT句の基本的な使い方について説明します。


  • SQL SELECTした結果をINSERTで登録する

    SELECT-INSERT文なら、SELECTしたデータをそのまま一気にまとめて登録できるので、実装も簡単ですのでおすすめです。件数分ループでSQLを実行するよりも1回のSQLで一気にまとめて処理でき...


  • SQL ORACLEのROWNUMで行番号を取得する際の注意点

    oracleで行番号を取得する際の基本的な考え方と注意点を紹介します。行番号はROWNUMで取得することができます。注意しなければならないのは、ORDER BYでソートする場合です。ORDER BYは...


  • SQL ROLLUP文で小計行・合計行を出力する (oracle, sql server)

    「社員マスタ」と「売上明細」というテーブルがあります。売上明細テーブルには、社員の売上情報が格納されています。社員ごとに、会社ごとの売上合計を表示し、社員ごとにすべての会社の小計行も出力したい、また最...


  • SQL チューニングでレスポンス改善に効果のあったポイント

    1回のSQLで一気にまとめて取得したほうがレスポンスは早いイメージがありますが、あまり大量のデータを扱うSQLを実行するとサーバーに負荷がかかってしまい、遅くなってしまうことがあります。


  • SQLとプログラミング言語の考え方の違い

    SQLは手続き型言語のように、上から考えるのではなく、集合を操作するという感覚で実装するとうまくいくように思います。また、上からではなく、逆に下から考えるという発送も必要だと思います。1ステップずつ実...