Namazu 2.0 入門
 本文書の目的
 2.0.12 版
 簡単・組立済
  NetBSD/pkgsrc
  FreeBSD/Ports
  RedHat Linux/RPM
  Debian
  MacOS X
お急ぎのあなたに
  準備
  configure, make
  make install
  動作確認
始める前に
 mknmz と namazu(.cgi)
 make に必要なもの
 upgrade 更新
  索引の互換性
mknmz
 configure と make
  File-MMagic
  ./configure, make
  make check
 make install 前に
 make install
 --help の表示
 動作確認 mknmz
 URL を合わせる
  --replace
  .namazurc(Replace)
 検索を作る対象
  ~/.mknmzrc での設定
  操作行での指定
 ~/.mknmzrc
  1. 書き方
  2. 位置
  3. .mknmzrc 内変数
 新規と更新
 Filter(前処理)
 各種文書形式
 EXCLUDE_PATH
  最初に | は不可
namazu
 .namazurc
 動作確認
 namazu.cgi
 日本語処理
 環境変数の設定
 --indexing-lang 引数
  環境変数
  日本語表示
  日本語の文字を変える
 型紙(template)のこと
  参照指定 (mknmz)
  参照指定 (namazurc)
  型紙図示
応用編
 項目(field)検索
 複数索引
 窓を付ける
 日記
 Wanderlust
 mhonarc
 表示を自分用に変更
 検索結果の画面を変更
用語
 索引
 kakasi(他)
参照 (URL's)
 他の方の TIPS
その他
 Namazu で出来ること
 出来ないこと
 歴史など
 資源について(準備中)
  最大インデックス
  Out of memory!
  Benchmark
 dbname -> idxname
 チェックポイント機構
 同じ文章を検索対象から外す
 更なる情報源
 うまく行かない
  設置が正しく
  設定
  参照されているか
  索引すべき譜はありません
  FAQ
  情報検索
  バグ追跡システム
  文字化け
 Namazu 採用地点
  番外
  私家版修正
 質問の仕方
  自分の環境を伝えるには
 被参照地点
  UTF-8

Software 入口 | Hardware | NetBSD 解説 | packages | macppc | TsubaiBSD 絹/software/全文検索

kakasi(他)

Kakasi
本来は「漢字で書かれたもの」を「ひらがな・カタカナ・roma-ji 」 などに変換する系。しかしここでは次々項の「わかち書き」をする道具とし て使う。
Chasen (茶筌)
「日本語形態素分析器」であるが、やはり同様に「わかち書き」 (正確には日本語の単語の切出し)に使っている。
わかち書き
日本語 は (英語 と 違って)単語 の 区切り に 空白 を 書いたり は しない。 そのまま では 計算機 の 処理 に 不都合 が ある ので、単語毎 に 分けて、 間 に 空白 を 入れて 書いた もの を 利用する。 そういう書き方を「わかち書き」と言う。 (用語としては計算機用語として以外にも同じ意味で使われる)

例えば kakasi -w < 何か日本語の譜 として見ると、分けてくれる様子が分ると思います。

フレーズ検索
フレーズとは phrase, 熟語の意味。"このまま の 順序 で検索" のように " " でくくって 検索文字を入力することを言う。
Namazu の検索の基本は単語の組合せである。その場合、 "単語 and 組合せ" と(順を逆にした) "組合せ and 単語" は区別しない。
これに対して"単語 組合せ"という 文字列がそのままの順で出現するものを探す機能のこと。 世の中にあるいろいろな検索機
conf.pl (/usr/local/share/namazu/pl/conf.pl
~/.mknmzrc でも変更が可能な mknmz 実行時の Perl の変数を設定している。
通常参考にする必要はない。
mknmzrc (/usr/local/etc/namazu/mknmzrc-sample)
mknmz の基本設定を行なう。 ~/.mknmzrc に写して、必要な部分だけ変更する
namazurc(/usr/local/etc/namazu/namazurc-sample)
Namazu の動作を make 時から変更したいというような時に、その 設定が書ける。 説明は次のところにある。 http://www.namazu.org/doc/manual.html#namazurc
Index         /usr/local/var/namazu/index
Template      /usr/local/var/namazu/index
Replace       /home/foo/public_html/  http://www.foo.bar.jp/~foo/
Logging       off
Lang          ja
Scoring       tfidf
EmphasisTags  ""   ""
MaxHit 10000
MaxMatch       1000
の設定が出来る。
Perl 部品化 ( Perl module)
program を単体としてではなく、 Perl の部品として起動 出来るしくみ
nkf, kakasi, chasen などは以前は Namazu から外部 process として呼出さ れるようになっていた。この場合、process を別に起動するということで 時間がかかる。 現在では、これらの perl 部品が用意されて、 perl から部品(module)として呼出されるように出来る。 そうすると process を起動しないで済む分、実行速度が有利になる。
この機能は Namazu-1.3 以前では提供されていない。 1.4 以降の機能である。

Namazu に必要な Perl の部品が入っているかどうかは
perl -MText::Kakasi -e ''
perl -MText::ChaSen -e ''
perl -MNKF -e ''
のように入力した時に、何も表示されなければ良い。
検索

この画面は jeedosaquin を使って表示している。

Last Update: Tue, 22 Apr 2008 21:33:00 GMT 1.1.1.1 2008/03/12