ワープロ専用機の時代には、全角文字とその半分の幅の半角文字がありましたが、パソコンに変わるようになって、いわゆる「半角」文字は欧文のプロポーショナルフォント(「MS P明朝」や「MS Pゴシック」など)に変わるようになりました。これにより、全角文字や半角文字という言葉は必ずしも適切ではなくなり、「1バイト文字」と「2バイト文字」などとも呼ばれることもあります。shift_jisではこの名称でもいいのですが、Unicodeの採用が増えてくるにつれて、これも適切とは言えなくなっています(Unicodeでは文字によって3バイトや4バイトになることがあります)。
そこで、必ずしも適切な名称ではありませんが、ここでは「全角文字」や「半角文字」といった名称で以下、説明していきます。
半角文字の中でも、半角の英数字には何の問題もないのですが、半角カタカナは文字化けの原因になったりしますので、本格的な処理を行う前に全角カタカナに変換しておくことがあります。具体的には、以下のような方法があります。
このうち、4番目のJcodeモジュールはActivePerlでは通常のインストールには含まれていませんので、PPM(Perl Package Manager)というプログラムであらかじめインストールしておきます。PPMによるインストール方法については、[2-1-5.PPM(Perl Package Manager)によるモジュールのインストール]を参照してください。
以下、半角カタカナを全角カタカナに変換したり、逆に全角カタカナを半角カタカナに変換する方法を個別に説明していきます。
JPerl.exeというプログラムを使って、半角カタカナを全角カタカナに変換するスクリプトについて解説します。
Encodeモジュールを使って、半角カタカナを全角カタカナに変換するスクリプトについて解説します。
Jcodeモジュールを使って、半角カタカナを全角カタカナに変換するスクリプトについて解説します。
Unicodeモジュールを使って、半角文字を全角文字に変換するスクリプトについて解説します。
JPerl.exeというプログラムを使って、全角カタカナを半角カタカナに変換するスクリプトについて解説します。
Encodeモジュールを使って、全角カタカナを半角カタカナに変換するスクリプトについて解説します。
Jcodeモジュールを使って、全角カタカナを半角カタカナに変換するスクリプトについて解説します。
Unicodeモジュールを使って、全角文字を半角文字に変換するスクリプトについて解説します。