« May 2005 | Main | February 2009 »

2005.07.30

最新のNamazuセットアップとWindowsデスクトップサーチ

『ナレッジマネジメントのすすめ』を出してから
PerlやNamazuは着実にバージョンアップしており、
その動向についてフォローアップしようと思い
半年ほど前、画像もちゃんと記録して、ここに
アップロードする準備を進めていた時期があったが
ちょうど本業が忙しくなってドキュメント化する
時間がとれず、今となっては画像がどこにあるか
もわからなくなってしまった。

今回、ある仕事で担当の引継ぎがあり、膨大な
ドキュメント群と過去メールの内容を早急に把握
する必要があり、急遽Namazuをインストールする
ことにした。
このためNamazu環境を現在の最新のライブラリを
ダウンロードしてセットアップした。

ActivePerl 5.8.7 build 813
Kakasi 4.3.4(以前と変わらず)
Namazu 2.0.14 for Win32 β版
Search-S 0.9.2(以前と変わらず)
OE2 1.1.0(以前と変わらず)

メールはOutlookのpstファイルの形式で受け渡さ
れたが、Outlookでは個々のメールに切り出せない
らしいということがわかった為、Outlookから
Outlook Expressへデータをインポートで移行させ
Outlook Expressのdbxファイルの単位でOE2を使って
メールごとeml形式のファイルに切り出して
Namazuに読み込ませた。
まあ、このあたりは本に書いてあるとおりに
すんなり終わったが
Namazu2.0.14をベースにSearch-Sでインデックス
を作成しようとしたところ、mknmzファイルがない
というPerlのエラーが出た。
試しに、namazu\bin\mknmz.batをmknmzにコピー
したところ問題なく動くようになった。
とりあえず、一晩でインデックス作成し、翌日から
使い始めたかったため、これが正式かどうかは確認
を取っていない。

また、これは仕様だとおもうのだが、Word文書を
一つでも開いている状態でインデックス作成を行うと、
Wordファイルのインデックス作成ごとに勝手に該当の
Wordファイルがオープンされ、膨大なWordファイルが
開かれてしまい、まるで「もぐらたたき」みたいに
開く先からどんどん閉じていったが、Word文書が
まったく開かれていない状態にしておけば以降は
問題なかった。

セットアップが終わったところで、一括で27000文書の
インデックスを夜仕掛けて、翌朝結果を見ると
25000位のところでPerlエラーで終了していた。
欲張らずに、こまめにフォルダを選んでインデックス
を作成することにした。

今話題のデスクトップ検索ツールも併用してみようと
思い立ち、「Googleデスクトップ」と「マイクロソフト
Windowsデスクトップサーチ」の比較記事を雑誌で読んで
結局、オフィス文書との親和性の高そうなマイクロソフト
の側を使うことにした。

Namazuを使ってきた感覚からすると、デスクトップ
サーチの印象はインストールも簡単でもちろんメール、
オフィス文書、PDF(アドイン追加)など横断的にサーチ
でき超安定しているし、インデックス作成の負荷が低く、
スピードが速い。空き時間に自動で勝手に作ってくれ、
何か作業が始まると、自動で停止するという具合。
インデックス作成を何時間休止させるとか、強制的に
開始させるとかも簡単にできる。
インデックス検索という点に限って考えると超お手軽
便利なもので、Vistaに標準搭載され、今後はこうした
ことが一般化していくでしょうね。

幾つか、気がかりな点を列記しておくと
デスクトップサーチの売りであるプレビューが実は非常
に遅い点。このプレビューは、いちいちファイルを開か
なくてもプレビューだけでスクロールできて、内容が
ちゃんと見れるので便利なのだが・・・
普通に開けるファイルなのにプレビューができないとき
も結構ある。
また、デスクトップサーチを入れてから、XPを終了する
際にかならず#gen_windows#とかのプロセスが応答しない
というポップアップがあがってくる。
Windowsデスクトップサーチをタスクバーの「スポットラ
イト」アイコンで終了させてからWindowsをシャットダウ
ンすると綺麗に落とせるときもあるが、それでも駄目な
ときもある。
それと、複数のキーワードでの検索結果が思わしくない
印象を受ける。検索の切れ味ということでは、ひょっと
すると、Googleの方が上なのだろうか・・・
(Googleはデスクトップの場合、関連性の高い順を
どういうアルゴリズムで計算するのだろうと、ふと思った。
WebのSEOと同じではデスクトップでは成立しないはずなので)
これは、機会があれば(というかデスクトップサーチの
結果に嫌気が差したら)比較してみたいと思う。
あと、予期せぬ結果として、IEがタブブラウザに変更
された。これはMSNサーチツールバーが入るから。

今は、Namazuとデスクトップサーチを併用しているが、
デスクトップサーチの方はインデックスの更新が
常時行われているため、だんだん検索のメインが
Namazuからデスクトップサーチに移ってきた気がする。
こと検索に限って言えば、デスクトップサーチの方が
使いやすいのは確かだ。しかし、その長所が逆に弱点
でもあって、完結したクローズな仕組みで、まとまり
はよいが検索目的以外では使うことができない。
例えば、『ナレッジマネジメントのすすめ』のなか
で試行していたようなシソーラスとの連動とか、
インデックスを読み込んでクラスタリングしたり
検索以外の表現方法(まだ中途半端だが)などの
発展した使い方ができない。
今後はこうしたツールが出てくるかもしれない。
そうすれば、本当に私が願っていた個人が
ナレッジを駆使して気づきを得られる環境が
手に入れられる時代が到来するかもしれない。

最後に、こうしたインデックス情報などは
インターネット経由で本人が知らないうちに
吸い上げられるとか言うことは本当にないん
でしょうかね?

| | TrackBack (0)

« May 2005 | Main | February 2009 »