■Windows版Rubyの細道・けもの道

■ナビゲータ

[南北館(最初のメニュー)]

  1. [Windows版Rubyの細道・けもの道]
    1. [1.準備編]
    2. [2.基本編]
    3. [3.応用編]
      1. [3-1.固定長データとCSVデータとの変換]
        1. [3-1-1.固定長データとCSVデータ]
        2. [3-1-2.固定長データをCSVデータに変換する]
        3. [3-1-3.CSVデータを固定長データに変換する]
        4. [3-1-4.固定長CSVデータを固定長データに変換する]
        5. [3-1-5.固定長データを固定長CSVデータに変換する]
        6. [3-1-6.固定長CSVデータをCSVデータに変換する]
        7. [3-1-7.CSVデータを固定長CSVデータに変換する]
      2. [3-2.重複データの処理]
      3. [3-3.フォルダ内の一括処理]
      4. [3-4.1つのファイルを複数のファイルに分割する]
      5. [3-5.文字コードの変換]
      6. [3-6.半角全角変換]
      7. [3-7.多次元配列の処理]
      8. [3-9.その他]
    4. [スクリプトと入力データのサンプル]
Perlではどう処理する?
同じことをPerlではこうしています。

3.応用編

3-1.固定長データとCSVデータとの変換

3-1-4.固定長CSVデータを固定長データに変換する

固定長CSVデータとは、通常のCSVデータが可変長であるのに対し、各項目の長さがすべて最大の長さになっているようなCSVデータです。実際の項目の長さよりも長い分については、スペースが入っています。言い換えれば、固定長データを項目ごとに区切り文字(ここでは、カンマ)で区切ったデータであるということもできます。

具体的には、区切り文字をはずして、すべての項目を結合させれば固定長データになるので、項目ごとに結合しているだけです。したがって、入力ファイルに漢字などの全角文字が含まれているかどうかによって、スクリプトが変わることはありません。

【スクリプト】
# coding:windows-31j    
# fcsv2fix.rb   
# 内容 :固定長CSVファイル(一定の箇所に「,」があるテキスト形式)を固定長ファイルにする  
# 前提 :入力ファイルとスクリプトはshift_jisとする。 
# Copyright (c) 2002-2015 Mitsuo Minagawa, All rights reserved. 
# (minagawa@fb3.so-net.ne.jp)   
# 使用方法 : c:\>ruby fcsv2fix.rb   
#   

# 入力ファイル  
in1_file    =   open("fcsv.txt","r")    
# 出力ファイル  
out1_file   =   open("output.txt","w")  
#   
out1        =   nil 

# 主処理    
while   (line1  =   in1_file.gets)      
    line1.chomp!        
# CSV形式の line1 から値を取り出して Arrayクラスのオブジェクト in1 に入れる     
#カンマ区切りのとき     
    in1 =   (line1 + ',')   
            .scan(/"([^"\\]*(?:\\.[^"\\]*)*)",|([^,]*),/)   
            .collect{|x,y| y || x.gsub(/(.)/, '\1')}    
#       
    out1    =   in1.join("")    

    out1_file.print out1,"\n"   
    out1    =   nil 
end     

# ファイルのクローズ    
in1_file.close  
out1_file.close 
   
【スクリプトとデータのサンプル】

スクリプトはこちらにあります。

入力データのサンプルはこちらにあります。

【入力データ】
11111     ,1−2−3,ABCDEF ,1,2,3,20011001,20020228,20020131,01,05,9999
22222     ,ABC  ,BCDEFG ,5,5,5,20011001,20020228,20020131,01,05,8888
33333     ,αβ   ,CDEFGH ,3,4,2,20011001,20020228,20020131,01,05,7777
44444     ,abc  ,EFGHIJ ,2,2,2,20011001,20020228,20020131,01,05,6666
55555     ,貸借対照表,EFGHIJ ,2,2,2,20011001,20020228,20020131,01,05,6666
66666     ,航空機  ,EFGHIJ ,2,2,2,20011001,20020228,20020131,01,05,6666
77777     ,山﨑髙彦 ,FGHIJK ,1,2,8,20011001,20020228,20020131,01,05,5555
88888     ,①②③④ ,GHIJKL ,2,4,9,20011001,20020228,20020131,01,05,4444
99999     ,漢字   ,LMNOPQ ,3,8,5,20011001,20020228,20020131,01,05,3333
   
【出力データ】
11111     1−2−3ABCDEF 12320011001200202282002013101059999
22222     ABC  BCDEFG 55520011001200202282002013101058888
33333     αβ   CDEFGH 34220011001200202282002013101057777
44444     abc  EFGHIJ 22220011001200202282002013101056666
55555     貸借対照表EFGHIJ 22220011001200202282002013101056666
66666     航空機  EFGHIJ 22220011001200202282002013101056666
77777     山﨑髙彦 FGHIJK 12820011001200202282002013101055555
88888     ①②③④ GHIJKL 24920011001200202282002013101054444
99999     漢字   LMNOPQ 38520011001200202282002013101053333
   



Copyright (c) 2004-2015 Mitsuo Minagawa, All rights reserved.