Flying Cat Penguin

ゆるゆる仕事、ソフトウェアテスティング関連のことについて綴ります。

アルゴリズム学習 #1 エラトステネスの篩(ふるい)

実装が弱い自負があるので、プログラミング勉強を再開しています。

特に、普通に実装するなら考えられないこともないのですが、性能面でいつも苦労したりします…。
これはアルゴリズムの思考や知識が弱いためです。
そのため、ちょっとずつ実装をして、実際の問題に当てはめたらどうなるかをメモって行きたいと思います。

今回は、「エラトステネスの篩(ふるい)」です。

これは、素数を効率的に求めるアルゴリズムです。
詳細は、下記の動画をご参照ください。
(僕より100…倍わかりやすいので…)

import math

def get_prime(n):
    if n<= 1:
        return []
    prime = [2]
    limit = int(math.sqrt(n))

    # 奇数のリストを作成
    data = [i + 1 for i in range(2,n,2)]
    while limit > data[0]:
        prime.append(data[0])
        # 割り切れない数だけを取り出す
        data = [j for j in data if j % data[0] ]

    return prime + data

print(get_prime(200))
$ time python eratosthenes.py
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199]

real    0m0.151s
user    0m0.030s
sys     0m0.000s

ちなみに、20000まででやってみました。

$ time python eratosthenes.py
[2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211, 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359, 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509, 521, 523, 541, 547, 557, 563, 569, 571, 577, 
・・・
19597, 19603, 19609, 19661, 19681, 19687, 19697, 19699, 19709, 19717, 19727, 19739, 19751, 19753, 19759, 19763, 19777, 19793, 19801, 19813, 19819, 19841, 19843, 19853, 19861, 19867, 19889, 19891, 19913, 19919, 19927, 19937, 19949, 19961, 19963, 19973, 19979, 19991, 19993, 19997]

real    0m0.106s
user    0m0.000s
sys     0m0.015s

[まとめ]
計算量についてはまだぜんぜんな感じですが、こういったアルゴリズムはユニークな文字列の絞り込みに使えそうですね。

[参考]

  • 書籍

  • 動画

www.youtube.com