これまで解説してきたキーブレイク処理やマッチング(照合)処理では、キー項目の順に(通常は)昇順で各レコードが並んでいることが前提となっています。しかし、Windowsでは、Unixと異なり、シェルコマンドに「sort」という便利なプログラムは存在しませんし、そもそも大艦巨砲主義のWindwosでは、小さなプログラムをパイプでつなげて処理していくという発想がないため、今後も開発される可能性は少ないと考えられます。
したがって、一般的には、Excel等の表計算ソフトを利用して、ソート(sort:並べ替え)処理を行うことになりますが、並べ替えのキーが一度に3項目までしか指定できないため、操作性は必ずしも良くありません。また、Excelはファイルを開いたときに数値項目等を勝手に変換してしまうのも、使い勝手を悪くしている原因です。
そこで、Perlを使ってソート(sort:並べ替え)処理を行う方法を以下、説明します。なお、この基本編では、キーブレイク処理やマッチング(照合)処理で利用するためにソート(sort:並べ替え)処理を行う場合を想定し、データ型が文字列型で、昇順で並べ替えるケースだけでなく、数値項目を並べ替えるケースや降順で並べ替えるケースについても説明していきます。
ソート(並べ替え)処理の具体的な内容については、以下の各項目を参照してください。
レコード全体を対象に並べ替えを行う簡易的なソート(並べ替え)処理について解説します。
CSVファイルの文字列型データを昇順に並べ替える方法について解説します。
CSVファイルのソート処理(文字列型・数値型の昇順・降順あり)について解説します。こちらはPerlにあるsort関数を利用しています。
CSVファイルのソート処理(文字列型・数値型の昇順・降順あり)について解説します。こちらは挿入ソートのロジックを利用しています。
大量のCSVファイルのソート(並べ替え)処理する場合の手順とソート(並べ替え)処理するための準備処理として、ソート(並べ替え)キーごとの件数と累計件数を出力するスクリプトについて解説します。
大量のCSVファイルの文字列型データを昇順に並べ替える方法について解説します。
大量のCSVファイルのソート(並べ替え)処理(文字列型・数値型の昇順・降順あり)について解説します。こちらはPerlにあるsort関数を利用しています。