Comment detail

続・ファイル内の重複行削除 (Nested Flatten)

This comment is reply for 3484 rucker: ファイルシステムってでっかい連想記憶装置...(続・ファイル内の重複行削除). Go to thread root.

基本は同じ発想なのだと思われ、でもそうすると
MD5等のメッセージダイジェストはつかっちゃだめだとおもいます。
衝突する確率がごくわずかなので
単純にファイル総なめにするよりも効率悪くなってします。
ある程度衝突させることで比較する行数を
へらすのが目的だと思うので。。。。
ディレクトリエントリの更新にはえらくコストがかかるのですね。
ここまでとは…。
ファイルの数は開いたままに出来る範囲がいいんでしょうかね。
リネームどころか、140万個のファイルを消すのにまだあと何時間か
かかりそうです(^_^;)
という訳で、やり方を変えてみたのですが、まるっきり別物になったので
別スレッドに…。

Index

Feed

Other

Link

Pathtraq

loading...