実用に耐えるオープンソースの検索エンジン BEST3

【(注) このコンテンツはすでに古い可能性があります。ご注意ください。】

オープンソースの検索エンジンというのが幾つかあります。オープンソース、つまり無料の検索エンジンですね。
ほとんどは目的がニッチに特化したものが多く、ウェブで一般的に使えそうなものはあまり多くはないのですが、それでもちゃんと実用に使える、使っているものもあります。今回、テコラボでそういった使えるオープンソースの検索エンジンとして選んだものを載せておきます。

なんらかの理由でGoogleやBingを使えない、且つ、初期投資としてお金をかけられない、といったサイト開発やアプリケーション開発の場合に有効です。

BEST1 : [ Fess(Solr)]

http://fess.codelibs.org/ja/index.html
fess

  • 検索エンジンにSolrを、クローラーにS2Robotを使う検索システムパッケージ。
  • 5 分で簡単に構築可能な全文検索サーバー!
  • ウェブ、ファイルシステム、データベースのクロール、検索が可。
  • MS OfficeやPDF、画像、zipなど多くのファイル形式で検索が可能。
  • JavaアプリケーションフレームワークのSeasar2で構築。
  • モバイル対応可能。

今でも活発に開発が進められています。
これならタダで簡単に検索サイトを立ち上げられます。

BEST2 : [ Groonga ]

http://groonga.org/
groonga-logo

  • 未来検索ブラジルによる全文検索エンジン。カラムストア機能付き。
  • リアルタイム性の高い、超高速・高精度な検索エンジン、とのこと。
  • トークナイザは、形態素方式と N-gram 方式の両方に対応。
  • C ライブラリとして提供されている。
  • サーバー機能あり。

デキがよく、開発も活発でとても使える検索エンジンです。
有料のエンジンと同じように使えます。

BEST 3 :  [ Hyper Estraier ]

http://fallabs.com/hyperestraier/
hyperestraier

  • C言語で日本人個人が作成した全文検索エンジン。
  • ウェブ、データベース、デスクトップなどのクロール、検索が可能。
  • MS OfficeやPDF、画像、zipなど多くのファイル形式で検索が可能。
  • コアの部分はQDBMというデータベースライブラリ。
  • 形態素解析とN-gram方式の両方に対応。
  • フレーズ検索や正規表現検索や属性検索や類似検索をサポート。
  • 分散処理や大規模検索にも対応。

機会があれば是非使ってみたい検索エンジンです。
こんなデキのいいものを一人で作られたとは、敬服します!
ちょっと名前がゲームっぽいけどオッケー!

以上、
他にも幾つかありますけど、現在、日本語を扱うサイトで検索エンジンを採用する場合は、これら3つのどれかを選ぶことになるでしょう。

サイトに検索を付けたいけど、何をどうすればいいか分からない方は、テコラボまでお気軽にご相談ください。