スキップしてメイン コンテンツに移動

「Perlにもしあったらいいなぁと思う機能」は大体Perl6にあると思う

2011-03-19: 複数行コメントについて加筆しました。

背景

Perlにもしあったらいいなぁと思う機能 - サンプルコードによるPerl入門を読んでて「それPerl6でできるよ」と思ったので。一応Perlです。一応。

1. ダブルクォーテーションの中で関数が展開できる機能

ダブルクォート(qq演算子)はエスケープシーケンス、スカラ、配列、ハッシュ、関数、クロージャを展開します:

"aaa { $book.title } bbb"

Qクォート演算子でオレオレ展開ルールも作れます(Rakudoだとまだ動きませんが):

Q:function/funcall: &func()/;
Q:closure/closure: { ucfirst('hello') ~ ', world' }/;

# qq//と同じ
Q:qq/$scalar, @array[], %hash{}, &subroutine(), { 'closure' }/;

2. メソッドにおけるオブジェクトの名前

自身をselfで参照できます:

class Foo {
  has Str $.objective = 'world';
  method greet {
    say "Hello, { self.objective }";
  }
}
Foo.new.greet; # Hello, world
Foo.new(:objective<Perl6>).greet; # Hello, Perl6

3. データを簡単にダンプする標準関数

オブジェクトをPerl6コードにダンプする.perlメソッドがあります:

say 42.perl; # 42
say { foo => 'bar', hoge => qw/fuga piyo/ }.perl; # {"foo" => "bar", "hoge" => ("fuga", "piyo")}

デバッグ用には変数名が分かり易いようにペア記法を組み合わせて、noteで標準エラー出力に書き出します(warnは例外を投げるので注意):

my $obj = Foo.new(:objective<Perl6>);
note :$obj.perl; # "obj" => Foo.new(objective => "Perl6")

4. ファイルの内容を一度に読み込むモジュール

slurpが組み込み関数(と組み込みオブジェクトのメソッド)です。ファイルオープンに失敗すると例外を投げます:

open('filename').slurp;
slurp 'filename';

でもこれってPerl5でもFile::Slurpとか色々ある気がする

5. Mojo::Base程度の小さなクラスビルダー

最初からまともなOO機能が付いてきます:

class Vector2D {
  has Num $.x = 0;
  has Num $.y = 0;
  method squared_norm() { [+] ($.x, $.y).map: (* ** 2) }
  method norm() { self.squared_norm.sqrt }
}

class Vector3D is Vector2D {
  has Num $.z = 0;
  method squared_norm() { [+] ($.x, $.y, $.z).map: (* ** 2) }
}

multi sub prefix:<~>(Vector3D $v --> Str) { "<{ $v.x }, { $v.y }, { $v.z }>" }
multi sub infix:<->(Vector3D $v, Vector3D $u --> Vector3D) {
  my ($x, $y, $z) = ($v.x, $v.y, $v.z) Z- ($u.x, $u.y, $u.z);
  Vector3D.new(:$x, :$y, :$z);
}

my $v = Vector3D.new(:x(1), :y(3.sqrt));
my $u = Vector3D.new(:x(1), :z(1));
my $delta = $v - $u;
say "{ ~$v } norm: { $v.norm }"; # <1, 1.73205080756888, 0> norm: 2
say "{ ~$u } norm: { $u.norm }"; # <1, 0, 1> norm: 1.4142135623731
say "{ ~$delta } norm: { $delta.norm }"; # <0, 1.73205080756888, -1> norm: 2

6. Net::FTPのコマンドが失敗したときは自動的に例外を投げてほしい

好みの問題なのでパス。サブクラス作ってオーバーライドするのがセオリーでしょうか。

7. ハッシュスライスと配列スライスのための関数

リファレンスはAutovivifyされるので必要ありません:

my %hash = foo => 'hoge', bar => qw/hoge fuga/, baz => 'piyopiyo';
my $hash_ref = %hash;
my @slice = $hash_ref<foo bar>; # ('hoge', ('hoge', 'fuga'))

8. Perlの最新の機能とstrictとwarningsとutf8とautodieをレキシカルに有効にするプラグマ

strict/warnings/autodie相当はデフォルト。Unicode関連はまだ策定中のようですが、Rakudoだと文字列はUTF-8です。

9. 複数行コメント

これはPerl6でもPODで書くことになっています(S02)。=begin comment=end commentで囲むか、=for commentで空行までをコメントにします。 POD処理系は知らない(あるいはコメントだと知っている)フォーマットの内容は出力しないので、ドキュメントと混ざるとかそういう心配はありません。

ちなみに=cutは必要なくなりました(というか、なくなりました)。

もう1つ、埋め込みコメント(Embedded comment)という範囲を指定したコメントも利用できます。#`に続けて好きな区切り子を使って囲みます(ただし#は駄目):

say 'hello, ' ~ #`( コメントは空白扱いなので文中に出現しても構わない ) 'world';
$obj\ #`( 空白が許されない場所ではUnspaceで取り除く必要がある ).method;

#`{{
  複数行コメントの例。カッコは重ね打ちもできる。
  この場合数と種類が対応した閉じカッコが出現するまでがコメントとして扱われる。
  } まだ閉じない。
  } ここもまだコメントの中。
}} # ここで閉じられる

#`/* Cっぽくしたいならこう書ける(*は単なるコメントの一部) */
#`「Unicodeでカッコとして定義された文字なら何でも使える。誰得」

埋め込みコメントの区切り子の扱いはQクォート演算子と同じです。

蛇足ですが2つめの例で$obj\ #`( ... )`.sayとあるのはPerl6がオペランドと後置演算子(ここではメソッド呼び出しの.)の間に空白の出現を許していないためで、バックスラッシュは余分な空白を取り除くためのものです。 この機能はUnspaceと呼ばれています。Cプリプロセッサやシェルで行末に置くバックスラッシュを他の空白やコメントにも一般化したものと思えば大体合ってます。

SEE ALSO

コメント

このブログの人気の投稿

京大テキストコーパスのパーサを書いた

要旨CaboCha やなんかの出力形式であるところの京大テキストコーパス形式のパーサモジュールを Perl で書いたので紹介します。GithubTarball on Github Ppagesこれを使うと例えば CaboCha の出力した係り受け関係を Perl のオブジェクトグラフとして取得できます。使用例単なる文節区切りの例。#!/usr/bin/env perl use v5.18; use utf8; use IPC::Open3; use Parse::KyotoUniversityTextCorpus; use Parse::KyotoUniversityTextCorpus::MorphemeParser::MeCab; use Symbol qw//; my ($in, $out, $err); my $pid; BEGIN { ($in, $out, $err) = (Symbol::gensym, Symbol::gensym, Symbol::gensym); $pid = open3($in, $out, $err, cabocha => '-f1'); } END { close $out; close $err; waitpid $pid => 0 if defined $pid; } binmode STDOUT, ':encoding(utf8)'; binmode $in, ':encoding(utf8)'; binmode $out, ':encoding(utf8)'; my $parser = Parse::KyotoUniversityTextCorpus->new( morpheme_parser => Parse::KyotoUniversityTextCorpus::MorphemeParser::MeCab->new, ); say $in '星から出るのに、その子は渡り鳥を使ったんだと思う。'; say $in '出る日の朝、自分の星の片付けをした。'; close $in; my $sentence_trees = $parser->…

Algorithm::LibLinear の紹介

Notice: This article is outdated. Please refer an updated English tutorial. 要旨かなり前になりますが、Algorithm::LibLinear という Perl モジュールを書きました。CPANGithubこれを使うと線形分類器などが高速に学習できます。テキストや画像の分類が応用として期待されます。LIBLINEAR についてLIBLINEARLIBSVM と同じ台湾国立大学の Chih-Jen Lin 教授のチームが公開しているオープンソースの機械学習パッケージです。 関数のロジスティック回帰、サポートベクター回帰及び線形 SVM による多クラス分類を行うことができます。LIBSVM と違ってカーネル関数を使うことはできませんが、はるかに高速に動作します。Algorithm::LibLinear についてLIBLINEAR には C++ で書かれたライブラリと、その機能を使って機械学習と分類・関数回帰を行うコマンドラインユーティリティが含まれています。 Algorithm::LibLinear はライブラリの機能を Perl からオブジェクト指向的に利用できるようにした上で、コマンドラインユーティリティの一部機能をライブラリ化して Perl で再実装したものです。使い方分類問題を解くときは、訓練データセットの読み込み・スケーリング学習器パラメータの設定分類器の訓練実データの分類という手順で行います。訓練データセットの読み込み正解ラベルのついたデータを大量に用意して学習させます。LIBSVM 形式のデータを読み込むか:my $data_set = Algorithm::LibLinear::DataSet->load(string => <<'EOD'); 1 1:0.1 2:0.1 4:0.1 -1 1:0.1 2:-0.1 3:0.1 ... EOD HashRef として表現されたデータを使います:my $data_set = Algorithm::LibLinear::DataSet->new(data_set => [ +{ feature => +{ 1 => 0.1, 2 => 0.1, 4 =…

OCaml で Web フロントエンドを書く

要旨フロントエンド開発に Elm は堅くて速くてとても良いと思う。昨今の Flux 系アーキテクチャは代数的データ型と相性が良い。ところで工数を減らすためにはバックエンドも同じ言語で書いてあわよくば isomorphic にしてしまいたいところだが、Elm はバックエンドを書くには現状適していない。OCaml なら js_of_ocaml でエコシステムを丸ごとブラウザに持って来れるのでフロントエンドもバックエンドも無理なく書けるはずである。まず The Elm Architecture を OCaml で実践できるようにするため Caelm というライブラリを書いている。俺の野望はまだまだこれからだ (未完)Elm と TEA についてElm というプログラミング言語がある。いわゆる AltJS の一つである。 ミニマリスティクな ML 系の関数言語で、型推論を持ち、型クラスを持たず、例外機構を持たず、変数の再代入を許さず、正格評価され、代数的データ型を持つ。 言語も小綺麗で良いのだが、何より付属のコアライブラリが体現する The Elm Architecture (TEA) が重要である。TEA は端的に言えば Flux フロントエンド・アーキテクチャの変種である。同じく Flux の派生である Redux の README に TEA の影響を受けたと書いてあるので知っている人もいるだろう。 ビューなどから非同期に送信される Message (Redux だと Action) を受けて状態 (Model; Redux だと State) を更新すると、それに対応して Virtual DOM が再構築されビューがよしなに再描画され人生を書き換える者もいた——という一方向の流れはいずれにせよ同じである。 差異はオブジェクトではなく関数で構成されていることと、アプリケーション外部との入出力は非同期メッセージである Cmd / Sub を返す規約になっていることくらいだろうか。後者は面白い特徴で、副作用のある処理はアプリケーションの外で起きて結果だけが Message として非同期に飛んでくるので、内部は純粋に保たれる。つまり Elm アプリケーションが相手にしないといけない入力は今現在のアプリケーションの完全な状態である Model と、時系列イベントである Me…