固定長データを固定長CSVデータに変換するには、unpack関数を利用して、各項目に分解します。固定長データでは実際の項目の長さが指定した長さよりも短い項目は後ろにスペースが入っていますが、unpack関数のテンプレートで「axx」と指定すると、スペースを残したままCSVデータに変換します(テンプレートで「Axx」と指定すると、スペースは削除されてしまいます)。
なお、固定長ファイルから固定長CSVファイルに変換したときに、漢字などの全角文字が含まれていると、文字化けを起こすことがあります。下記のスクリプトでは、これに対応するため、Encodeモジュールを使っています。この場合、漢字などの全角文字は文字数にあわせた値を設定する必要があります(たとえば、ファイルレイアウトで20バイトある項目に漢字などの全角文字が最大10文字入る場合は、文字数の10を指定します。下記の例では$fieldsの2番目の項目に全角文字が入っていますが、バイト数の「10」ではなく、文字数の「5」となっている点に注意してください)。
Encodeモジュールについては、[3-5-1.文字コードの変換(Encodeモジュール利用)]を参照してください。
実際に利用するには、入出力のファイル名と「$fields = "10,5,7,1,1,1,8,8,8,2,2,4"」の部分を実際のファイルレイアウトにあわせて変更します。
# fix2fcsv.pl # 内容 : 固定長ファイルをCSVファイルに変換する # 前提 :入力ファイルとスクリプトはshift_jisとする。 # :(入力ファイルに漢字などの全角文字を含む場合) # Copyright (c) 2002-2012 Mitsuo Minagawa, All rights reserved. # (minagawa@fb3.so-net.ne.jp) # 使用方法 : c:\>perl fix2fcsv.pl # use Encode; open(IN1,"fix.txt"); open(OUT1,">output.txt"); $fields = "10,5,7,1,1,1,8,8,8,2,2,4"; $fields =~ s/,/a/g; $fields = "a".$fields; while ($line1 = <IN1>) { # shift_jis から utf-8(Perlの内部コード) に変換 $line1 = decode('cp932', $line1); chomp($line1); @out1 = unpack($fields, $line1); $out1 = join(",",@out1); # utf-8(Perlの内部コード) から shift_jis に変換 $out1 = encode('cp932', $out1); print OUT1 "$out1\n"; } close(IN1); close(OUT1);
上記のスクリプトは入力ファイルに漢字などの全角文字を含む場合ですが、全角文字を含まない場合は下記のようになります。
# fix2fcsv_2.pl # 内容 : 固定長ファイルをCSVファイルに変換する # 前提 :入力ファイルとスクリプトはshift_jisとする。 # :(入力ファイルに漢字などの全角文字を含まない場合) # Copyright (c) 2002-2012 Mitsuo Minagawa, All rights reserved. # (minagawa@fb3.so-net.ne.jp) # 使用方法 : c:\>perl fix2fcsv_2.pl # open(IN1,"fix.txt"); open(OUT1,">output.txt"); $fields = "10,10,7,1,1,1,8,8,8,2,2,4"; $fields =~ s/,/a/g; $fields = "a".$fields; while ($line1 = <IN1>) { chomp($line1); @out1 = unpack($fields, $line1); print OUT1 join(",",@out1),"\n"; } close(IN1); close(OUT1);
スクリプトはこちらにあります(入力ファイルに全角文字を含む場合)。
スクリプトはこちらにあります(入力ファイルに全角文字を含まない場合)。
11111 1−2−3ABCDEF 12320011001200202282002013101059999 22222 ABC BCDEFG 55520011001200202282002013101058888 33333 αβ CDEFGH 34220011001200202282002013101057777 44444 abc EFGHIJ 22220011001200202282002013101056666 55555 貸借対照表EFGHIJ 22220011001200202282002013101056666 66666 航空機 EFGHIJ 22220011001200202282002013101056666 77777 山﨑髙彦 FGHIJK 12820011001200202282002013101055555 88888 ①②③④ GHIJKL 24920011001200202282002013101054444 99999 漢字 LMNOPQ 38520011001200202282002013101053333
11111 ,1−2−3,ABCDEF ,1,2,3,20011001,20020228,20020131,01,05,9999 22222 ,ABC ,BCDEFG ,5,5,5,20011001,20020228,20020131,01,05,8888 33333 ,αβ ,CDEFGH ,3,4,2,20011001,20020228,20020131,01,05,7777 44444 ,abc ,EFGHIJ ,2,2,2,20011001,20020228,20020131,01,05,6666 55555 ,貸借対照表,EFGHIJ ,2,2,2,20011001,20020228,20020131,01,05,6666 66666 ,航空機 ,EFGHIJ ,2,2,2,20011001,20020228,20020131,01,05,6666 77777 ,山﨑髙彦 ,FGHIJK ,1,2,8,20011001,20020228,20020131,01,05,5555 88888 ,①②③④ ,GHIJKL ,2,4,9,20011001,20020228,20020131,01,05,4444 99999 ,漢字 ,LMNOPQ ,3,8,5,20011001,20020228,20020131,01,05,3333