Casual Developers Note

エンジニアやデザイナー向けの技術情報・英語学習情報・海外留学情報・海外旅行情報を提供中。世界を旅して人生を楽しもう。

  • ホーム
  • 技術 Tips & Tutorials
  • 技術塾
  • ライフハック
  • 海外留学
  • 英語学習
  • コラム
  • お問い合わせ
現在の場所:ホーム / アーカイブperl

2013年12月9日 By KD コメントを書く

[tips][perl] Perlのサブルーチン呼び出しにアンパーサンドは必要か?

[tips][perl] Perlのサブルーチン呼び出しにアンパーサンドは必要か?

Perlでサブルーチンを呼び出す方法はいくつかあります。ググっても正確な情報がヒットしなかったので、自分でまとめておきます。

Perlのサブルーチンの呼び出し方は以下です。

1. アンパーサンドとカッコを付けて呼び出す。

# サブルーチン呼び出し
my $max = &max(1, 2, 3, 4, 5);

# 最大値を求めるサブルーチン
sub max {
    my ($max) = shift @_;
    foreach (@_) {
        if ($_ > $max) {
            $max = $_;
        }
    }
    $max;
}

教科書的な基本の書き方です。この書き方で正解です。

ググっていると、アンパーサンドなしが当たり前的な表現をしている人がいますが、『初めてのPerl』でも書かれている正解です(笑)

アンパーサンドを用いることで、自前のサブルーチンを明示的に呼び出していることになるので、安全にサブルーチンを呼び出せます。

サブルーチンが呼び出しの前後のどちらにあっても動作します。

2. アンパーサンドを省略して呼び出す。

これは以下の2つの条件のどちらか満たしている場合にのみ動作します。

(1)コンパイラがサブルーチンの呼び出しの前に、そのサブルーチンの定義を見ている場合→アンパーサンドがなくても、それは定義済みの関数と判断。

# 最大値を求めるサブルーチン ←呼び出し前に発見!
sub max {...} 

# サブルーチン呼び出し
my $max = max(1, 2, 3, 4, 5);

(2)サブルーチンの呼び出しの構文から、明らかにサブルーチンの呼び出しだと分かる場合→アンパーサンドがなくても、カッコがあれば関数と判断。

# サブルーチン呼び出し ←カッコがあるから関数だと判断!
my $max = max(1, 2, 3, 4, 5);

# 最大値を求めるサブルーチン
sub max {...}

3. カッコを省略して呼び出す。

# 最大値を求めるサブルーチン
sub max {...}

# サブルーチン呼び出し
my $max = max 1, 2, 3, 4, 5;

2に加えて、省略してもコードの意味が変わらない場合はカッコを省略できます。

この書き方は2(1)の条件上でOKです。

この場合、サブルーチンは必ず呼び出しより前になければいけません。

注意点は、2および3のようなアンパーサンドなしでサブルーチンを呼び出す場合、もしそのサブルーチン名がPerlの組み込み関数と同じ名前ならば、自前のサブルーチンは呼ぶことができず、Perlの組み込み関数が呼ばれてしまいます。

逆に言えば、Perlに確実に自前のサブルーチンを呼び出してもらうには、アンパーサンドが必要になります。

カテゴリ : 技術 Tips & Tutorials タグ : perl, tips, tumblr-imported

2013年11月19日 By KD コメントを書く

[tips][perl] Perlで文字コードをいい感じに処理する方法

[tips][perl] Perlで文字コードをいい感じに処理する方法

日頃のつまらないルーチンワークは全てスクリプト化している俺です。スクリプトは動的言語であれば気楽にかけるので何でもよいのですが、うちの会社の場合だと、ローカル環境はWindows、商用環境はLinuxなので、どちらでもそれなりに動くPerlをよく使います。スクリプティングでよくやるのは「ファイルを読み込み→いい感じの処理→ファイルを出力」だと思うので、そこら辺の注意点を忘れないように書いておきます。

Perlの文字コード

Perlは内部で「内部文字列(flagged utf8)」というUTF-8によくわからないフラグがついた文字コードとして扱います。そのため、外部からの文字列のやり取りには、文字コード変換が不可欠です。文字コードを考えずに扱っていると、日本語を使った瞬間に文字化けです。

#1. まずは「use utf8;」を付けて、UTF-8で保存する。

# Perlファイル (UTF-8で保存されている)
# 始めにutf8プラグマを設定する。
use utf8;

# 日本語の文字数(3文字)が表示される。
my $japanese = '日本語';

print length($japanese);

utf8プラグマを設定することで、「UTF-8の文字列→内部文字列」に自動変換してくれるようになります。ファイル内でPerlの関数呼び出しが正確に行われるので、日本語書き放題です。

#2. 標準入出力は「binmode」で文字コード変換する。

# 標準入出力の文字コード設定
# Windowsなら'cp932'、Linuxならだいたい'UTF-8'
my $enc_os = 'cp932';
binmode STDIN, ":encoding($enc_os)";
binmode STDOUT, ":encoding($enc_os)";
binmode STDERR, ":encoding($enc_os)";

# 標準出力しても文字化けしない。
my $japanese = '日本語';

print "$japanesen";

これで、「標準入力の文字列→内部文字列→標準出力の文字列」に自動変換してくれます。OSの文字コードを指定しておけば、標準入出力を文字化けせずに扱えます。

#3. 「Encode」モジュールで入出力をデコード・エンコードする。

# 文字コード変換モジュール
use Encode qw/encode decode/;
sub d($) { decode($enc_os, shift) }
sub e($) { encode($enc_os, shift) }

# ARGVの値を受け取り、出力しても文字化けしない。
# デコード(標準入力の文字列→内部文字列)
my $user_input = d(shift);

# エンコード(内部文字列→標準出力の文字列)
print "e($user_input)n";

例はbinmodeを使わずに、Encodeモジュールを使った場合です。デコードにより、「外部から入力された文字列→内部文字列」に変換します。エンコードにより、「内部文字列→外部に出力する文字列」に変換します。結局、「use utf8;」でも「binmode標準入出力」でも処理できない文字コード変換のために使うとよいと思います。例えば、例のARGVはデコードしなければいけません。

文字化けしないファイル入出力

それでは、文字コード変換のやり方が分かったところで、ファイル入出力の3つの方法を書きます。俺が勝手に3つに分けてみただけなので、あしからず。

#1. Encodeモジュールで文字コード変換をした場合のファイル入出力

# 文字コードがShift_JISのファイルを扱う
my $enc_io = 'Shift_JIS';
sub dio($) { decode($enc_io, shift) }
sub eio($) { encode($enc_io, shift) }

# ファイルパス
my $path = './ファイル.txt’;

# ファイル入力
open my $in, "<", e($path) or die "Can't open $path : $!";
while(my $line = <$in>){
  push(@data, dio($line) );
}
close $in;

# 何か処理する。

# ファイル出力
open my $out, ">", e($path) or die "Can't open $path : $!";
foreach my $data (@data) {
  print $out eio($data);
}
close $out;

やや長いですが、Encodeモジュールを使って確実に文字コード変換をしながら、ファイル入出力を行う方法です。OSの文字コードとファイルの文字コードが同じということはあまりないので、ファイル用に文字コードを定義しています。

また、ファイルパスからファイルハンドルを得る際に、ファイルパスをエンコードしていることにも着目してください。ファイルパスを日本語で書いても動くってことです。

#2. binmodeで文字コード変換した場合のファイル入出力

# 文字コードがShift_JISのファイルを扱う
my $enc_io = 'Shift_JIS';

# ファイルパス
my $path = './ファイル.txt’;

# ファイル入力
open my $in, "<", e($path) or die "Can't open $path : $!";
binmode $in, ":encoding($enc_io)";
@data = <$in>;
close $in;

# 何か面白いことする。

# ファイル出力
open my $out, ">", e($path) or die "Can't open $file_path : $!";
binmode $out, ":encoding($enc_io)";
print $out @data;
close $out;

「binmode」は標準入出力以外にもファイルハンドルに対しても使用できます。Encodeモジュールをガッツリ使うよりもコンパクトになりました。

#3. encodingで文字コード変換した場合のファイル入出力

# 文字コードがShift_JISのファイルを扱う
my $enc_io = 'Shift_JIS';

# ファイルパス
my $path = './ファイル.txt’;

# ファイル入力
open my $in, "<:encoding($enc_io)", e($path) or die "Can't open $path : $!";
@data = <$in>;
close $in;

# 何か世界を変えることをする。

# ファイル出力
open my $out, ">:encoding($enc_io)", e($path) or die "Can't open $path : $!";
print $out @data;
close $out;

「encoding」を使用することで、ファイル入出力の文字列を読み込んだり書き込んだ時点で内部文字列に変換してくれます。個人的には一番スマートな気がします。

はい、これで誰でもPerlで文字化けしないいい感じの処理が書けますね。

ARGVは自分でデコードしないといけない。

最後におまけです。

ここまで文字コードを処理してきて、ふと思うのが、ARGV(コマンドの引数の配列)もbinmodeとかで自動的に内部文字列に変換できないのか?という疑問です。答えは残念ながらNOのようです。ですから、せめて、シンプルにデコードしましょう。

ARGVのシンプルなデコード方法

# @ARGVのデコード
@ARGV = map { d($_) } @ARGV;

うん、いい感じ。ARGVはencodingプラグマは効果がないので、Encodeモジュールで愚直にデコードしましょう。

ちなみに、ファイルハンドルをスカラー変数に入れて使っていることに気づきましたか?Perl5.6より前のバージョンでは、ファイルハンドルをベアワード(bareword)としてしか使えませんでしたが、Perl5.6以降ではスカラー変数に代入できるようになりました。ファイルハンドルをスカラー変数として扱えば、ファイルハンドルのスコープ管理ができるので、安全なコードになります。簡単なスクリプトならベアワードでいいでしょ、という意見もありますが、私は、そんな無駄な区別をするぐらいだったら全部レキシカルなスカラー変数でいいでしょ、と思います。

初の技術投稿ということで真面目に整理して書きました。次からはこんなに整理して書くことはないでしょう(笑)

環境

OS : Windows7
Perl : Perl5.16.3

カテゴリ : 技術 Tips & Tutorials タグ : perl, tips, tumblr-imported, windows

  • « 前のページ
  • 1
  • 2

ブログ更新情報や海外の関連情報などを配信する無料メルマガ

Sponsored Links

About Author

KD

世界を旅し日本を愛するエンジニア。大学でコンピュータサイエンスの楽しさを学び、日本の大手IT企業で働く中で、新しい技術やスケールするビジネスが北米にある事に気づく。世界に挑戦するための最大の壁が英語であったため、フィリピン留学およびカナダ留学を経て英語を上達させた。現在は日本在住でエンジニアとして働きつつ、次の挑戦に備えて世界の動向を注視している。挑戦に終わりはない。このブログでは、エンジニアやデザイナー向けの技術情報から、海外に留学したい人向けの留学情報、海外に興味がある人向けの海外旅行情報など、有益な情報を提供しています。

https://casualdevelopers.com/

最近の投稿

  • 2020年JS周辺のバックエンド寄りの注目技術!ネクストNodeJSの「Deno」と分散型パッケージレジストリの「Entropic」の紹介

    2020年JS周辺のバックエンド寄りの注目技術!ネクストNodeJSの「Deno」と分散型パッケージレジストリの「Entropic」の紹介

    2020年1月13日
  • 今さら聞けないJavaによる関数型プログラミング入門 ~ラムダ式、ストリーム、関数型インターフェース~

    今さら聞けないJavaによる関数型プログラミング入門 ~ラムダ式、ストリーム、関数型インターフェース~

    2019年11月4日
  • ReactのためのEslintおよびPrettierの設定方法 ~Airbnb JavaScript Style Guideの適用~

    ReactのためのEslintおよびPrettierの設定方法 ~Airbnb JavaScript Style Guideの適用~

    2019年10月30日
  • BashからZshに移行する方法(Mac編)

    BashからZshに移行する方法(Mac編)

    2019年10月21日
  • Create React Appを使わないでゼロからReactの開発環境を構築する方法(Webpack/Docker編)

    Create React Appを使わないでゼロからReactの開発環境を構築する方法(Webpack/Docker編)

    2019年9月30日

カテゴリ

  • 技術 Tips & Tutorials (100)
  • 技術塾 (6)
  • ライフハック (26)
  • 海外留学 (12)
  • 英語学習 (3)
  • コラム (6)

アーカイブ

最高の学習のために

人気記事ランキング

  • MySQLで「ERROR 2003 (HY000): Can't connect to MySQL server」と怒られた時の対処法
    MySQLで「ERROR 2003 (HY000): Can't connect to MySQL server」と怒られた時の対処法
  • Expressで「Cannot set headers after they are sent to the client」と怒られた時の対処法
    Expressで「Cannot set headers after they are sent to the client」と怒られた時の対処法
  • SAKURAのメールボックスで独自ドメインのメールを設定し、Gmail経由で送受信する方法
    SAKURAのメールボックスで独自ドメインのメールを設定し、Gmail経由で送受信する方法
  • AWS ECRとECSの入門(EC2編) ~ ECSのEC2版を使ってReactのDockerアプリケーションをAWS上で稼働させる方法 ~
    AWS ECRとECSの入門(EC2編) ~ ECSのEC2版を使ってReactのDockerアプリケーションをAWS上で稼働させる方法 ~
  • 爆速でJenkinsをマスターしよう(GitHubアカウント統合編) ~ JenkinsのGitHub Organizationの設定方法 ~
    爆速でJenkinsをマスターしよう(GitHubアカウント統合編) ~ JenkinsのGitHub Organizationの設定方法 ~
  • Amazon EC2インスタンスにSSHできなくなった時の対処法
    Amazon EC2インスタンスにSSHできなくなった時の対処法
  • Jupyter Notebookで「The kernel appears to have died. It will restart automatically.」というエラーが出た場合の原因と対処法
    Jupyter Notebookで「The kernel appears to have died. It will restart automatically.」というエラーが出た場合の原因と対処法
  • バンクーバー留学豆知識:バンクーバーのATMで日本の銀行のキャッシュカードを使ってお得にお金を引き出す方法
    バンクーバー留学豆知識:バンクーバーのATMで日本の銀行のキャッシュカードを使ってお得にお金を引き出す方法
  • [tips][bat] バッチで明日の日付を計算する。
    [tips][bat] バッチで明日の日付を計算する。
  • [tips][perl] Perlで文字コードをいい感じに処理する方法
    [tips][perl] Perlで文字コードをいい感じに処理する方法

Bitcoin寄付 / BTC Donation

Bitcoinを寄付しよう

BTC
Select Payment Method
Personal Info

Donation Total: BTC 0.0010

このブログの運営のためにBitcoinでの寄付を募集しています。お気持ち程度の寄付を頂けると管理者の励みになります。

Bitcoin寄付について知りたい方はこちらの記事へ

ビットコイン取引ならここ

  • ホーム
  • 技術 Tips & Tutorials
  • 技術塾
  • ライフハック
  • 海外留学
  • 英語学習
  • コラム
  • サイトマップ
  • タグ一覧
  • プライバシーポリシー
  • お問い合わせ

Copyright © 2023 KD - Casual Developers Notes