最終更新日

これは、fjの記事を卒研のために転載したものです。

ZWAISE の紹介記事


Xref: bach.ulis.ac.jp fj.sources:4192 fj.net.infosystems.wais:255
Path: bach.ulis.ac.jp!hagi!chiba-ns!news.kek.jp!wsclark!kuis-news!kuee-news!tamaru-news!Q.T.Honey!news01.so-net.or.jp!news01.sinfony.ad.jp!news-jp-0.abone.net!np0.iij.ad.jp!news.iij.ad.jp!triton.ad.jp!noc.intec.co.jp!ishida
From: ishida@isl.intec.co.jp (Shigeru Ishida)
Newsgroups: fj.sources,fj.net.infosystems.wais
Subject: ZWAIS: freeWAIS-sf-2.1.2-z3950-1995-target
Followup-To: fj.sources
Date: 08 Sep 1997 13:06:57 GMT
Organization: INTEC Systems Laboratory Inc., Japan
Lines: 156
Message-ID: 
NNTP-Posting-Host: manta.isl.intec.co.jp
X-Trace: pickles.noc.intec.co.jp 873723917 17980 (None) 10.50.64.11
X-Complaints-To: usenet@noc.intec.co.jp

石田@インテック・システム研究所と申します。


26-Aug-1997 に、fj.net.infosystems.wais においてアナウンスした通り、
Ulrich Pfeifer さんによって開発されたインターネット対応の全文テキスト
検索システムである freeWAIS-sf-2.1.2 で作成したインデックス情報を、
情報検索プロトコルである Z39.50-1995/1992に載せて発信するサーバソフト
ウエア ZWAIS (version 0.1) を公開します。


  ftp://paprika.noc.intec.co.jp/pub/ishida/freeware/zwais/zwais-0.1.tar.gz


o 開発背景

WAIS は、90 年代に入りインターネット上のテキストベースの情報検索の
手段として、US-ASCII 圏で広く使用されてきました。フリーソフトウエア
として無料で入手でき、オープンな検索プロトコルに基づいた検索処理を
分散した検索サーバに対して等しい手順で依頼することができます。

このように US-ASCII 圏で広く使用されている WAIS ですが、セッション
に用いられている検索プロトコルは、製品となった WAIS を除いて、初期の
バージョンからフリーで入手可能で現在もメンテナンスが続けられている
freeWAIS-sf-2.1.2 に至るまで、Z39.50-1988 (V1) という古いバージョン
に留まっています。この Z39.50-1988 は、その後バージョンアップした
1992 (V2) / 1995(V3) とは互換性がないため、バージョンアップした
プロトコルを利用する情報検索の community と連携することができません。

特に、1988 (V1) vs 1992 (V2) の隔たりには、V2 で ISO SR プロトコル
である ISO 10162/10163 (the Search and Retrieval Service Definition
and Protocol Definition) を内部にサブセットとして包含し、また
ASN.1-1990 の採用による異機種間のデータ転送が保証される仕様となった
点が上げられます。

しかし、WAIS はこの検索プロトコルの普及に大きく貢献しており、実際に
広範囲で(あるいは最も?)利用されていると思われます。

そこで、Z39.50-1988 を用いている freeWAIS-sf-2.1.2 を、国際標準化が
進められている現行のバージョンへ対応することで、1992 (V2) / 1995 (V3)
community との連携を図り、新しいプロトコルへの移行とその普及を考えて
います。# 個人的に... :)


o ZWAIS とは

ZWAIS とは、現在の freeWAIS-sf-2.1.2 (日本語対応化されたものを含む)
の waisindex で作成したインデックス情報を、Z39.50-1995 (V3) で発信
できるようにするサーバソフトウエア (zwaisserver) です。なお、
クライアントから 1992 (V2) でネゴシエーションしてきた場合は、これに
対応します。ただし、1988 (V1) には対応していません。1988 (V1) を使用
する場合は、これまでのサーバ (waisserver) を使用することになります。

ZWAIS (zwaisserver) の主な機能は以下の通りです。

  o Initialization Facility -- 1992 (V2) / 1995 (V3)
  o Search Facility
  o Retrieval Facility
  o Mapping File: Bib1 Use Type vs Field Name
  o Query Type 1/101
    Full Operator and Proximity (pre/, w/) except (atleast/)
  o Record Syntax -- SUTRS
  o Element Set Name -- `B' and `F'
    B -- Score, DocID, Size, Type, Headline
    F -- Content
    other -- B
  o Japanese Option
    In server side, convert Query Term to EUC Term in charactor set.


o ZWAIS 開発方針

・freeWAIS-sf-2.1.2 の検索エンジン部に対する改変は極力行わない。
・freeWAIS-sf-2.1.2 のプロトコル処理部は使用しない。代わりに、
  Index Data 社 (http://www.indexdata.dk/) で開発されている Z39.50/SR
  プロトコルアクセス用ツールキット (YAZ-1.3) を使用する。
・US-ASCII 版を基本とし、日本語(EUC)対応はこれへのパッチの形態を採る。


o 必要なソフトウエア

・ZWAIS-0.1 (本ソフトウエアです)

  ftp://paprika.noc.intec.co.jp/pub/ishida/freeware/zwais/zwais-0.1.tar.gz

・freeWAIS-sf-2.1.2

  ftp://ftp.wsct.wsc.com/pub/freeWAIS-sf/freeWAIS-sf-2.1/freeWAIS-sf-2.1.2.tar.gz

・YAZ-1.3

  ftp://ftp.indexdata.dk/index/yaz/yaz-1.3.tar.gz

・GNU readline 2.0 (option)

  そこかしこの GNU ソフトウエアのミラーサイトから取得します。


o ドキュメント

・README.jp

・INSTALL.jp

・QUERY.jp

  実装した、Query Type 1/101 と freeWAIS-sf-2.1.2 検索式との対応を
  記述しています。


o 動作確認環境

・Solaris 2.5.1 (SS20, gcc-2.7.2)
・SunOS 4.1.4 (IPX, gcc-2.7.2.1)

当方の環境です。


o 今後の予定

・Explain Facility の実装
・Schema の導入
・ユーザ認証の実装
・wais@wsct.wsc.com メーリングリストへのお知らせ。(^^;


o 今後の予定 (その2)

・使用例の紹介
  WWW サーバとの連携など(サーバサイド、また SFgate のような CGI 形態)。


o 利用制限

本ソフトウエアは、GNU GENERAL PUBLIC LICENSE Version 2
(GPL2) にしたがいます。COPYING ファイルを参照して下さい。


o 最後に

このソフトウエアが、情報検索プロトコルである Z39.50-1995 の普及の
きっかけと、インターネットあるいはイントラネットにおける情報検索環境
の構築の一助になれれば幸いです。


P.S.

皆さまからのご意見をお待ちしております。ishida@isl.intec.co.jp 宛、
あるいは fj.net.infosystems.wais にメール/ポストして頂けると、
すちゃっと返答できないこともあるかと思いますが、なるべくご返答して
行きたいと考えています。よろしくお願いいたします。


--
株式会社 インテック・システム研究所
情報応用研究部 石田 茂 (Shigeru Ishida)
E-Mail: ishida@isl.intec.co.jp



作成者:江草由佳
URL:http://momiji.mimoza.jp/
Email to:yuka@nier.go.jp