challenge RFC 4180対応版 CSVレコードの分解

ある関数(splitCSV)に渡された文字列を配列に分解して列ごとに表示してください。
渡される文字列は、CSVデータの1レコードが設定されているとします。

使用するデータはK3形式が元になっている仕様で
エクセルが出力しているような形式です。

書式には次のような特徴があります。
1. 各レコードは「改行」によって区切られている。
2. 各列は「,」によって区切られている。
3. 列のデータは「"」によって囲んでも良い。
4. 列に「,」「改行」「"」いずれかを含む場合「"」で
   囲わなければならない。
5. 列データに「"」を含める場合「""」とする。

本来、改行コードはCRLFですが今回は特に指定しません。

次の入力があった場合
"aaa","b
bb","ccc",zzz,"y""Y""y",xxx

出力は
1 => aaa
2 => b
bb
3 => ccc
4 => zzz
5 => y"Y"y
6 => xxx

となります。
このお題はraynstardさんの投稿によるものです。ご投稿ありがとうございます。助かります。

Posted feedbacks - Prolog

PrologでDCG使って書いてみました。

?- print_record('"aaa","b\nbb","ccc",zzz,"y""Y""y",xxx').
1 => aaa
2 => b
bb
3 => ccc
4 => zzz
5 => y"Y"y
6 => xxx
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
csv([R|Rs]) --> record(R), "\n", csv(Rs), !.
csv([R])    --> record(R), !.
csv([])     --> [].

record([D|Ds]) --> field(D), ",", record(Ds), !.
record([D])    --> field(D), !.
record([])     --> [].

field(D) --> "\"", quoted(D), "\"" ; naked(D).

naked([C|Cs]) --> [C], { \+ member(C, "\",\n") }, naked(Cs), !.
naked([])     --> [].

quoted([0'"|Cs]) --> "\"\"", quoted(Cs), !.
quoted([C|Cs])   --> [C], { C \==  0'" }, quoted(Cs), !.
quoted([])       --> [].

print_record(Atom) :-
	name(Atom, CSV),
	phrase(csv([Record]), CSV),
	forall(nth1(N, Record, Data), writef('%w => %s\n', [N, Data])).

Index

Feed

Other

Link

Pathtraq

loading...