site navigation:
Description
|
整理が下手なせいでファイルサーバやメールサーバ等に散らばったファイルや DB の中の情報探しが面倒なので、全文検索エンジンが欲しかったのですが、 どこかの HP で見た記事に感化され、自分で作ってみる気になってしまいました。
方式的には、N-gram を使用してプロトタイプを作成してみたところ、
検索のロジックを組み立てること自体は案外何とかなりそうな気がしてきました。
ただ、RDB では、ドキュメント量が多くなれば当然レスポンスもどんどん悪くなりそうなので、
ここは流行の NoSQL かも知れません。
と言うことで、とりあえず Cassandra を試してみました。
その結果、何となくではありますが、使い方が分かってきましたので、
このまま Cassandra で実装してみようと思います。
#HBase でも実現できそうですが、Cassandra が気に入ってしまいました。
一生掛かっても納得のいくものにはならないような気もしますが、
何となくこれはこれで行けそうな気がしてきました。
#おもしろくなってきましたので、その他が完全にストップしてしまいました。
Status: under prototyping
|
Helium の画面から使用できて、更にクローラーでは Borium とも連携する仕組みにした方が良さそうなので検討中なのと、 Cassandra を使用しても結局は性能面が気になるところですので、プロトタイプを作って 実用に耐え得るものかどうかを確認しようと思っております。