TAKENAKA's Web Page: meshcode

Perl, R, Ruby, C++ で作成したプログラムの実行速度の比較

from 2013-01-24
updated on 2013-09-30

はじめに

コンピュータにやって欲しい仕事を指示するため、人はプログラムを書きます。そのための言語にはさまざまなものがあります。目的に応じて書きやすいものを使えばよいのですが、多量の計算が必要な場合、計算のスピードも気になります。私自身、および私の周囲に使用者がいる言語４つ（Perl, R, Ruby, C++) で、簡単な比較（ベンチマークテスト）をしてみました。

R ではデータの処理方法によって大きく計算時間が変わるといわれていますので、データ構造やデータの処理法間の比較もしてみました。

なお、この結果は実行するプログラムの内容によって大きく変わりますし、処理系によっても変わります。あくまで参考程度の情報です。

言語の選び方については、このページ末尾の補足もご覧ください。

要点

最初に結果の注目ポイントを示します。

言語間の全体的な比較

期待通り、C++ が一番速い。Perl とRuby は、単純計算の場合で２ケタぐらい遅い。
数値計算関数を使った場合は、言語間の差は小さくなる（関数計算に時間がかかるようになり、繰り返し、データアクセスなどの効率の差は見えにくくなる。関数計算の速度は、言語というよりも計算ライブラリの性能の問題）。
Perl と Ruby はあまり差がないが、条件によっては Ruby のほうがやや遅めのこともある。
R で大量データを処理するときは、ベクトルまるごとで処理すると、うまくすると C++ に見劣りしない。愚直に for で各要素にアクセスすると、３ケタ以上遅くなり得る。

「キーと値のペア」の取り扱いの比較

「キーと値のペア」を扱えるハッシュ（マップ）データの処理は、C++ と比べて Perl や Ruby だと数倍遅い程度。
R で「キーと値のペア」を表現するのに、名前付きのリストを使うと C++ より３ケタ遅い。キーの列と値の列を持つデータフレームとして扱うと２ケタ遅い。 hash ライブラリだと、データフレームを利用するよりやや遅い。

R のデータ構造とアクセス方法による速度の違い

R の行列の要素に for ループで順次アクセスするとかなり遅い。apply が使えれば数十倍早くなる。
データフレームの場合、lapply を使えば、行列＋apply とほぼ同等の速度。
データフレームの各要素に for ループで順次アクセスすると、lapply とくらべて３ケタ遅い。

プログラムと実行結果

以下は、テストにつかったプログラムと、実行時間の測定結果です。実行時間は、もっとも速い場合に対する相対値で示しています。計算速度に応じて繰り返し回数やデータ数を調整して実行し、所要時間を計算量で割って標準化してから言語間の比較をしました。

要素数１万個の配列の各要素に、何回も値を足す

変数の値をそのまま足していく場合と、対数をとってから足していく場合、それぞれで試行。後者では対数を取る関数の実行時間が上乗せされる。
C++で、変数の値をそのまま足す場合、手元の環境（CPU は 2.4GHz) で、１秒で約10億回の足し算が実行される。
C++で、対数をとって積算する場合の所要時間は、対数をとらない場合の約30倍。

実行時間（C++ に対する比）
言語	変数の値をそのまま足す	変数の値の対数を足す
C++	1.0	1.0
Perl	136	8.3
Ruby	246	38.6
R (ベクトル処理)	3.9	1.2
R (要素逐次処理)	3270	155

// C++ 版

#include <iostream.h>
#include <time.h>
#include <math.h>

void main (void) 
{
     clock_t start = clock();

    int rep = 1000000; // 足し算の回数
    int n   = 10000;   // 変数の数（配列の要素数）

    double* x = new double[n];  // 一万個の変数（配列）の初期化
    for (int i = 0; i < n; ++i) {
    	x[i] = 0;
    }

    for (int j = 0; j < rep; ++j) {     // rep 回の繰り返し
        for (int i = 0; i < n; ++i) {   // 一万個の変数それぞれに値を加える
            x[i] += 1; // 数値計算ライブラリのテストでは、x[i] += log(i + 1)
        }	
    }

    delete [] x;              // 変数のメモリを解放
    cout << clock() - start;  // 経過時間を出力
}

# Perl 版

my $start = time;

my $rep = 100000;   # 足し算の回数
my $n   = 10000;    # 変数の数（配列の要素数）

my @x;              # 配列を用意

for (my $j = 0; $j < $rep; ++$j) {    # rep 回の繰り返し
    for (my $i = 0; $i < $n; ++$i) {  # 一万個の変数それぞれに値を加える
        $x[$i] += $i;  # 数値計算ライブラリのテストでは、$x[$i] += log($i + 1)
    }
}

print time -  $start;  # 経過時間を出力

# Ruby 版

t1 = Time.now

rep = 1000  # 足し算の回数
n   = 10000 # 変数の数（配列の要素数）

x = Array.new(n, 0)

for j in 1..rep         # rep 回の繰り返し
    for i in 0..(n-1){  # 一万個の変数それぞれに値を加える
        x[i] += i       # 数値計算ライブラリのテストでは、x[i] += log(i + 1)
    end
end

puts(Time.now - t1)     # 経過時間を出力

# R版 （ベクトル処理）

start <- proc.time()

rep <- 10000   # 足し算の回数
n   <- 10000   # 変数の数（配列の要素数）

x <- rep(0, n)  # 一万個の変数（配列）の初期化

for (j in (1:rep) ) {   # rep 回の繰り返し
    # 一万個の変数に、一度に値を加える
    x <- x + (1:n)   # 数値計算ライブラリのテストでは、x <- x + log(1:n)
}

print(proc.time() - start)

# R版 （要素逐次処理）

start <- proc.time()

rep <- 10000   # 足し算の回数
n   <- 10000   # 変数の数（配列の要素数）

x <- rep(0, n)  # 一万個の変数（配列）の初期化

for (j in (1:rep) ) {    # rep 回の繰り返し
    for (i in (1:n)) {   # 一万個の変数それぞれに値を加える
        x[i] <- x[i] + i   # 数値計算ライブラリのテストでは、x[i] <- x[i] + log(i + 1)
    }
}

print(proc.time() - start)     # 経過時間を出力

キーと値のペア１万個を記憶し、キーを指定して値を取り出し合計する

キーと値のペアを記憶するデータ構造は、 C++ では標準ライブラリの map、Perl や Rubyではハッシュとして提供されている。
R の場合、リストの各要素に名前を付ける、データフレームにキーの列と値の列を作る、hash ライブラリを使うの３つの方法で実現した。

言語	C++ に対する比
C++	1.0
Perl	3.1
Ruby	3.5
R (データフレーム）	182
R (名前付きリスト）	1590
R (hash ライブラリ）	320

※以下のコードでは、計時部分は省略しています。

// C++ 版

#include <iostream.h>
#include <time.h>
#include <map.h>

typedef map<int, int> my_map;
typedef my_map::iterator my_itr;

void main (void) 
{
    int rep = 10000;  // 繰り返し回数
    int n   = 10000;  // 「キーと値」のペアの数

    for (int j = 0; j < rep; ++j) {  // 繰り返し
        my_map x;
        for (int i = 0; i < n; ++i) {  // マップにキーと値のペアをしまう
            x[i] = i * 10;
        }

        int sum = 0;
        for (my_itr itr = x.begin() ;itr != x.end(); ++itr) {  // マップの全要素にアクセスする
            sum += (*itr).second;
        }
    }
}

# Perl 版

my $rep = 10000;  # 繰り返し回数
my $n   = 10000;  # 「キーと値」のペアの数

for (my $j = 0; $j < $rep; ++$j) {  #  繰り返し
    my @hash = ();;
    for (my $i = 0; $i < $n; ++$i) {  # ハッシュにキーと値のペアをしまう
        $hash{$i} = $i * 10;
    }

    my $sum = 0;
    foreach my $key (keys %hash) {  # ハッシュの全要素にアクセスする。
        $sum += $hash{$key};
    }
}

# Ruby 版

rep = 10000  # 繰り返し回数
n   = 10000  # 「キーと値」のペアの数

for j in 1..rep  #  繰り返し
    x = Hash.new
    for i in 0..(n-1)  #  ハッシュにキーと値のペアをしまう
        x[i] = 10 * i
    end

    sum = 0
    x.each_key do |key|  # ハッシュの全要素にアクセスする。
        sum += x[key]
    end
end

# R, データフレーム版  

rep <- 100;      # 繰り返し回数
n   <- 10000;    # 「キーと値」のペアの数

for (j in (1:rep)) { #  繰り返し
    d <- data.frame();
    for (i in (1:n)) {  # データフレームに行を足していく
        d <- rbind(i, i * 10)
    }
    sum <- 0;
    for (key in d[[1]]) { # 一列目の値をキーにして、全データにアクセス
        dd <- d[d[[1]] == key, ]
        sum  <- sum +  dd[[2]]
    }
}

# R, 名前付きリスト版  

rep <- 10;       # 繰り返し回数
n   <- 10000;    # 「キーと値」のペアの数

for (j in (1:rep)) { #  繰り返し
    d <- list()
    for (i in (1:n)) {   #  リストに名前付きの要素を加えていく
        d[[as.character(i)]] <- i * 10
    }

    sum <- 0
    for (key in names(d)) { # 名前をキーとして全要素にアクセス
        sum <- sum + d[[key]]
    }
}

# R, hash ライブラリ版  

library(hash)

rep <- 10;       # 繰り返し回数
n   <- 10000;    # 「キーと値」のペアの数

for (j in (1:rep)) {
    d <- hash()
    for (i in (1:n)) { #  ハッシュにキーと値のペアを加えていく
        d[[as.character(i)]] <- i * 10
    }

    sum <- 0
    for (key in keys(d)) {  # ハッシュの全要素にアクセスする。
        sum <- sum + d[[key]]
    }
}

R で、大きな行列（1000行）の、列ごとの合計値を計算する

データの処理方法	行列+apply版に対する比
行列を apply で処理	1.0
データフレームを lapply で処理	1.0
行列を逐次要素アクセスで処理	26.5
データフレームを逐次要素アクセスで処理	904

※以下のコードでは、計時部分は省略しています。

# 行列 + apply 版

nc <- 10000;  # 列数
nr <- 10000;  # 行数

m <- matrix(1, nr, nc)  # 行列

s <- apply(m, 2, sum)  # 各列について、sum を実行

# 行列 + for ループ 版

nc <- 10000;  # 列数
nr <-  1000;  # 行数

m <- matrix(1, nr, nc)  # 行列

for (i in 1:nc) {        # 各列について
    s <- 0
    for (j in 1:nr) {    # 各行について
        s = s + m[j, i]  # 各要素にアクセス
    }
}

# データフレーム + lapply 版

nc <- 10000;  # 列数
nr <- 10000;  # 行数

m <- data.frame( matrix(1, nr, nc) )  # データフレーム

s <- lapply(m,  sum)  # 各列について、sum を実行

# データフレーム + for ループ 版

nc <- 10000;  # 列数
nr <- 10;     # 行数

m <- data.frame( matrix(1, nr, nc) )  # データフレーム

for (i in 1:nc) {        # 各列について
    s <- 0
    for (j in 1:nr) {    # 各行について
        s = s + m[j, i]  # 各要素にアクセス
    }
}

実験の環境・処理系

C++のコードは、フリーで提供されている Borland C++ Compiler 5.5 でコンパイルし、作成した実行ファイルを Windows 7 のコマンドプロンプトで実行。
Perlのスクリプトは、MSWin32-x64-multi-thread 用にコンパイルされた perl v5.14.2 を使って Windows 7 のコマンドプロンプトで実行。
Rubyのスクリプトは、ruby 1.9.2p290 (2011-07-09 revision 32553) [i386-mswin32_100] を使って、 Windows 7 のコマンドプロンプトで実行。
R のコードは、Windows 7 上にインストールした R 2.13.2 for Windows (64 bit) を使い、RGui 上で実行。

（やや長い）補足

言語を選ぶ基準は、速度だけではありません。自分がやりたいことを助けてくれるライブラリ（人が書いてくれた部品）があるか、自分がやりたいことを表現しやすい文法構造か、開発がしやすいか（試行錯誤が簡単にできるか）、前処理、後処理との連携はしやすいかなどを総合的に考えて選びます。たとえば、統計解析ライブラリや描画ライブラリが充実していることは、R の選択理由となります。

また、これ以上速くする必要がない状況で、いたずらに速度にこだわるのには意味がありません。一日の実験データを処理する計算の所要時間を10秒から 0.1 秒に短縮できても、ほとんど得るものはありません。また、１時間かかる計算でも、一回やれば終わりなら、一時間かけて計算すればよいだけのことです。１時間を1分に短縮するためだけに、新しい言語を勉強する必要はないでしょう。

一方、パラメータ設定をいろいろ変えてシミュレーション計算をしたい場合、一回の設定で１時間かかるのか１分で済むのかによって、どのぐらいの設定を試せるかが変わってきます。また、コンピュータを対話形式で使うような場合（たとえば交通機関の予約システム）には、反応時間が５秒か２秒かはユーザにとって大きな違いです。速度アップの意味を十分に考えて、あまり得るのものない高速化のためにコストを投じないように注意します。

もうひとつ重要なポイントは、プログラムのコード自体の効率です。同じ結果を出すのに、非効率的なアルゴリズムだと簡単に100倍も1,000倍も遅くなります。結果を記憶しておいて使い回せばよいはずの計算を、何万回も繰り返してしまうようなコードはその典型です。理詰めでプログラムの論理構造を練ることが大切です。ただし、あとで見ても理解できないようなトリッキーな高速化をすると、トータルではデメリットのほうが大きくなるので注意が必要です。

なお、複数の言語を勉強することには大きなメリットがあります。その理由は２つあります。ひとつめは、言語それぞれに得意なこと、不得意なことがあることです。複数の言語を知っていれば、目的によって適した言語を使い分けることができます。たとえば、高速演算が必要なシミュレーションプログラムは C++ で作る、柔軟なデータ処理が必要な仕事では Perl を使う、大規模なシミュレーションプログラムを、最初は Ruby で試行錯誤しながら作ってから C++ に移植する、統計解析やグラフ化は R に任せる、といった使い分けが考えられます。

もうひとつの理由は、複数の言語を勉強するとプログラミングの本質に近づけることです。たとえば、上の２番めの例では、キーと値のペアという形でデータを管理するという共通の考え方を、言語ごとに違ったかたちで表現しています。同じアイデアの別の表現を知ることで、個々の言語の文法と、その文法で表現されるデータ構造や処理の流れ・構造化の方法などを区別して理解を深めることができます。

| Top Page | プログラミング |