オープンソースの検索エンジンというのが幾つかあります。オープンソース、つまり無料の検索エンジンですね。
ほとんどは目的がニッチに特化したものが多く、ウェブで一般的に使えそうなものはあまり多くはないのですが、それでもちゃんと実用に使える、使っているものもあります。今回、テコラボでそういった使えるオープンソースの検索エンジンとして選んだものを載せておきます。
なんらかの理由でGoogleやBingを使えない、且つ、初期投資としてお金をかけられない、といったサイト開発やアプリケーション開発の場合に有効です。
BEST1 : [ Fess(Solr)]
http://fess.codelibs.org/ja/index.html
- 検索エンジンにSolrを、クローラーにS2Robotを使う検索システムパッケージ。
- 5 分で簡単に構築可能な全文検索サーバー!
- ウェブ、ファイルシステム、データベースのクロール、検索が可。
- MS OfficeやPDF、画像、zipなど多くのファイル形式で検索が可能。
- JavaアプリケーションフレームワークのSeasar2で構築。
- モバイル対応可能。
今でも活発に開発が進められています。
これならタダで簡単に検索サイトを立ち上げられます。
BEST2 : [ Groonga ]
- 未来検索ブラジルによる全文検索エンジン。カラムストア機能付き。
- リアルタイム性の高い、超高速・高精度な検索エンジン、とのこと。
- トークナイザは、形態素方式と N-gram 方式の両方に対応。
- C ライブラリとして提供されている。
- サーバー機能あり。
デキがよく、開発も活発でとても使える検索エンジンです。
有料のエンジンと同じように使えます。
BEST 3 : [ Hyper Estraier ]
http://fallabs.com/hyperestraier/
- C言語で日本人個人が作成した全文検索エンジン。
- ウェブ、データベース、デスクトップなどのクロール、検索が可能。
- MS OfficeやPDF、画像、zipなど多くのファイル形式で検索が可能。
- コアの部分はQDBMというデータベースライブラリ。
- 形態素解析とN-gram方式の両方に対応。
- フレーズ検索や正規表現検索や属性検索や類似検索をサポート。
- 分散処理や大規模検索にも対応。
機会があれば是非使ってみたい検索エンジンです。
こんなデキのいいものを一人で作られたとは、敬服します!
ちょっと名前がゲームっぽいけどオッケー!
以上、
他にも幾つかありますけど、現在、日本語を扱うサイトで検索エンジンを採用する場合は、これら3つのどれかを選ぶことになるでしょう。
サイトに検索を付けたいけど、何をどうすればいいか分からない方は、テコラボまでお気軽にご相談ください。