FilePathのHashとコリジョン
FilePathをHash値に変換する時の、各種アルゴリズムのコリジョンについて書かれた同僚のブログを紹介。
http://www.irrelevantconclusion.com/2013/07/hashing-file-paths/
もっともコリジョンが少なかったアルゴリズムが驚きの内容!!
なんとほぼK&Rのサンプル実装そのまま!
本人も超驚いたって言ってた。
理由を仲間内で推測したんだけど、ファイルパスと言うのは、前から後ろに掛けて、ユニークさを増していく構造となっており、最後の数文字がHash値の決定的な要素となる。
その構造が、K&RのHashと物凄くマッチしたのでは無いかと言う事になった。
Hashアルゴリズムは、ソースによってキチンとしたものを選択する。
そんな当たり前のことを再認識した。