2017年7月7日金曜日

Nyafoo!の掲載基準

こんばんは。nyafooです。
今日はNyafoo!の掲載基準の考え方についてお話します。

まず、Nyafoo!はホワイトリスト方式の検索エンジンです。
登録したURLが検索対象になります。
発想は新しくありません。
むしろ、最古の検索エンジンの復刻版とも言えるものです。

Nyafoo!の掲載基準を考えるにあたり、「ネットらしくない」方針を取ることにしました。
具体的には、業界団体や国の許認可、株式の上場の有無など、既存の価値観にのっとって巡回先を決めています。

例えば、「新聞」カテゴリの巡回先は、原則として日本新聞協会の加盟紙を選んでいます。
まったくネットらしくありません。

これは、「ネットらしい」やりかたでは、GoogleやAmazon、Facebookのような巨大資本に勝ち目がないと考えたからです。
彼らと違う発想でサービスを組み立てたら、今までと違う価値観のモノが生み出せるのではないかと考えています。

逆に、Nyafoo!の技術的基盤は、まったく「ネットらしい」作りになっています。
基盤のFess、elasticsearch、Linuxはオープンソースですし、実行環境はAWSです。
基盤をネットらしくすることで、サービスの構築コストや運用コストを下げ、見捨てられた方法にも活路が見いだせるのではないでしょうか。

Nyafoo!が脚光を浴びたのと同時期に、Yahoo! JAPANがディレクトリ検索の閉鎖を発表しました。

残り物には福があると言いますし、温故知新でどこまで行けるか、頑張ってみたいと思います。

FESSとkuromoji.txt

FESSのtakenizerは、ユーザーが辞書を拡張できるようになっています。 UIの「システム」→「辞書」から「ja/kuromoji.txt」を選ぶと、トークンの登録画面になります。 作業は簡単ですが、同じトークンを多重に登録すると、インデックスが更新できなくなる、けっ...