最終更新日: Wed May 10 17:07:42 2000


システム基礎論III(数値演算)

Netlibについて調べる

NetlibのWWWサイト http://www.netlib.org (ミラーサイト:http://phase.etl.go.jp

1. Netlib[1]

Netlibレポジトリには 自由に利用できる ソフトウエア、ドキュメント、データベースがある。 それらは、数学やコンピュータ科学やその他の業界に関連するものである。 Netlib は AT&T Bell 研究所とテネシー大学とOak Ridge National研究所と 世界各地の有志によって管理維持されている。 Netlibの収集物(コレクション)は世界各地のいくつかのサイトで 自動的に同期をとって複製されている。

2. 配布方法[ 2]

World Wide Web (WWW)、電子メール、ftp、gopher、xnetlib、CD-ROM の6つの方法でソフトウエアやドキュメントを Netlibから取り寄せることができる。

3. 量

データ

計算方法
  1. Netlibで % ls -lR をしたファイル ls-lRを ftpで持ってくる。
  2. ファイルだけを ls-LR から抽出。
    % cat ls-lR | grep "^-" | awk '{print $4;}' > zzz
  3. 行数を数えるとファイルの数がわかる。
    % wc -l zzz
  4. ファイルサイズを足しこむとNetlibのファイルの総容量がわかる。
    % cat zzz | perl -e 'while(<>){$total+=$_;}print $total,"\n";'

4. どんな形式で

どのような形式のファイルがあるか調べる。 2通りのやり方を試した。

4.1拡張子あるない関わらず、1つずつ中身を確かめて形式を調べる。(始めの5エントリー)

エントリー Fortran 文章つき C 文章つき makefile shar 文章つき sh html tex テキスト ps ps.gz pdf tar.gz tgz uu exe .doc その他
a 6 3 - 1 - 5 - - 1 - 2 1 1 1 2 2 2 - 1 -
access - - 2 - - 2 - - - - - - - - - - - 2 - -
aicm 2 - - - - 1 - - - 2 - - - - - - - - - -
alliant 86 - - - 10 3 7 1 - - 2 - - - - 1 - - - 2
amos 16 - - - - - - - - - 1 - - - - - - - - -

4.2 全てのファイルの中から拡張子のあるものを抜きとり、多くある拡張子を調べる。

4.2.1 拡張子が多いもの TOP 20

1  4081 f         Fortranのソースコード    
2  2942 gif       画像ファイル
3  2757 c         C 言語のソースコード
4  1007 html      HTMLファイル
5   332 ps        PostScriptファイル
6   182 in        Data file for testing CGEBAK
7   154 pdf       PDFファイル
8   141 tgz       .tar.gz と同じ。tarファイルをgzipで圧縮したファイル
9   135 ps.gz     PostScript を gzipで圧縮したファイル
10   109 bib
11   102 sok       
12    98 twx
13    96 ltx
14    95 dvi       dviファイル文書整形texから作られる
15    93 pdf.gz    PDFファイルを gzipで圧縮したファイル
16    88 shar      いくつかのファイルが1つにまとまったsh スクリプト
17    76 tex       texファイル
18    76 mod
19    68 ppm
20    60 doc

   4.2.2 拡張子を数えた方法
  1. 拡張子がついているファイルを、ファイルリストから抜き出す。
    % grep '\.[a-z]' filename > kakutyousi.all
  2. 拡張子のみのファイルリストを作る。
    % cat kakutyousi.all | perl -e 'while(<>){if(/^(.[^\.]*)\.(.*)$/){print $2,"\n";}}' > kakutyousiOnly.all
  3. ソートして、重複したものを数えながら、重複を消す。
    % sort kakutyousiOnly.all | uniq -c > kakutyousiUniq
  4. 数でソートする。
    % sort -rn kakutyousiUniq

5. どのようなソフトウエアやドキュメントがあるか

Netlib Master Index[ 4] をみると簡単な説明が載っている。

6. 利用者についての情報


参照文献

  1. Frequently Asked Questions (FAQ)
    2.1) What is Netlib?
    http://www.netlib.org/misc/faq.html#2.1
  2. Frequently Asked Questions (FAQ)
    2.2) How do I retrieve software or documents from Netlib?
    http://www.netlib.org/misc/faq.html#2.2
  3. Frequently Asked Questions (FAQ)
    2.8) What is Xnetlib?
    http://www.netlib.org/misc/faq.html#2.8
  4. Netlib Master Index
    http://www.netlib.org/master/expanded_liblist.html

作成者:江草由佳
URL:http://momiji.mimoza.jp/
Email to:yuka@nier.go.jp