1. はじめに
  2. 計量書誌学とは
  3. 目的別
    1. 研究者の評価をしたい
      1. h指数 最近良く聞くh指数を解説
      2. g指数 h指数と並ぶもうひとつの指標
    2. 雑誌の評価をしたい
      1. インパクトファクター 誰のためのインパクトファクター?
      2. 5年インパクトファクター 5年インパクトファクターとは何か?
      3. アイゲンファクター アイゲンファクターとは何か?
    3. ウェブページの評価をしたい
      1. Google PageRank Google PageRankとは何か?
      2. Hitsアルゴリズムによる権威得点とハブ得点 もうひとつのページ評価指標
    4. テキスト(シークエンス)の特徴を解析したい
      1. フーリエ解析 バイオインフォマティクスでも使われる
        フーリエ解析
    5. ふたつのテキスト(データ/データ集合)間の類似度(距離)を知りたい
      1. 編集距離 編集距離とは?
      2. blast
      3. 非階層クラスタ構造親和性指標 クラスタリングに関する指標
    6. テキスト(データ)をクラス分けしたい
      1. k-means (非階層) 教師なしでデータを自動分類
    7. テキスト(データ)をクラス分けした場合の妥当性を知りたい
      1. 非階層クラスタ構造適性性指標 クラスタリングに関する指標
      2. 非階層クラスタ構造親和性指標 クラスタリングに関する指標
  4. カテゴリ別
    1. 現象/効果/概念/仮説
      1. 共引用 共引用と書誌結合
      2. 書誌結合 共引用と書誌結合
      3. 相互引用
      4. マタイ効果
      5. デルファイ効果
      6. スモールワールド現象
      7. ガーフィールドの集中則
      8. 系の状態 (収束、発散、振動、カオス、複雑、未定義)
      9. 物質の状態 (個体(>粉体)、液体(>ガラス)、(臨界状態)、
        気体、プラズマ(>イオンプラズマ、>クオーク-グルーオンプラズマ)、
        ボーズ-アインシュタイン凝縮体)
      10. Digital physics
    2. モデル/関数
      1. (確率)分布
        1. Zipf分布
        2. 正規分布
        3. Γ関数
        4. δ関数
      2. ネットワークモデル
        1. ランダムサーファーモデル Google PageRankに使われている
          ランダムサーファーモデルを解説!
        2. Knowredge Pool (KP)モデル
        3. スモールワールドネットワーク
        4. ニューラルネットワーク
      3. 動的モデル
        1. チューリングマシン
        2. セルオートマトン
    3. 指標
      1. 文献(集合)評価指標
        1. インパクトファクター
          1. インパクトファクターの説明 何のためのインパクトファクター?
          1. インパクトファクターの算出 インパクトファクターとは何か?
          1. 5年インパクトファクターの説明 5年インパクトファクターとは何か?
        2. Google PageRank
          1. Google PageRankの説明 Google PageRankとは何か?
          1. Google PageRank算出の概要 Google PageRankの計算概要を解説!
          1. Google PageRank算出の詳細 Google PageRankの計算詳細を解説!
        3. アイゲンファクター
          1. アイゲンファクターの説明 アイゲンファクターとは何か?
        4. Hitsアルゴリズム
          1. 権威得点とハブ得点 もうひとつのページ評価指標
      2. 著者評価指標
        1. h指数 最近良く聞くh指数を解説
        2. g指数 h指標と並ぶもうひとつの指標
      3. 特徴量(ベクトル)
        1. tfidf
        2. オリゴヌクレオチド頻度ベクトル
      4. 類似度/距離
        1. コサイン距離
        2. 相互情報量
        3. 非階層クラスタ構造親和性指標 クラスタリングに関する指標
      5. 集中度/分散度
        1. Gini係数
        2. エントロピー
      6. 適性性(妥当性)評価
        1. 非階層クラスタ構造適性性指標 クラスタリングに関する指標
    4. テキスト/データマイニングの手法/技術
      1. 周波数解析
        1. フーリエ解析
          1. DNA塩基配列中の繰り返しパターンの強度の例 バイオインフォマティクスでも使われる
            フーリエ解析
        2. wavelet解析
        3. Allan Variance Plot
      2. クラスタリング
        1. k-means 教師なしでデータを自動分類
      3. 検索/探索/マッチング
        1. n-gram検索/マッチング
      4. データタイプ変換
        1. テキスト->数値変換
        2. テキスト集合->ベクトル変換
      5. データ構造(化)/データ構造解析
        1. 計算機で扱われるデータ構造
        2. 引用被引用行列
        3. Latent Semantic Analysis

当室では、情報解析の手法に計量書誌学(bibliometrics)を取り入れ、
様々なデータ解析への適応を模索しています。
計量書誌学は、より広義には科学計量学(scientometrics)とも言われ、科学を科学する方法として注目されている分野です。

計量書誌学の手法を用いる我々のチャレンジのひとつに、生物学的データと社会的データとを結びつけ、
生物学的データを介した社会構造の解明や、社会的データを介した生物(学)の解明があります。
しかしながら、計量書誌学は、科学社会学や言語学等様々な分野とクロスリンクする分野であり、
その手法やツールを使いやすくまとめた情報源が乏しいのが現状です。

そこで、我々は、そのような情報源そのものを構築することを目的とし、当サイトを開設いたしました。
当サイトでは、ツールとしての手法に焦点を絞り、様々な解析メソッドを紹介いたします。
当サイトの情報が計量書誌学をはじめとする様々な分野に有効な解析手法を提供できればと、願っています。

計量書誌学とは、英語ではBibliometricsと言われ、書籍の文献や雑誌の記事に対する書誌を構成する要素を計量的に研究する学問です。
上位の学問領域は図書館情報学、および、科学計量学です。(ウィキペディアより)

学問の歴史としては浅く、Nalinによれば「文献の統計解析」(Cole and Eales, 1917) がこの分野の最初の業績とされています。また、計量書誌学と呼ばれるようになったのは1969年以降です。

この学問領域を有名(まだそれほど知られてはいませんが)にしたのは、”インパクトファクター”や、”ページランク”といった言葉でしょう。前者は1955年にEugene Garfieldにより、後者は1998年にSergey BrinとLarry Pageにより、考案されました。

近年、計量書誌学は、科学者や研究者、研究機関、あるいはその成果を”定量的に”評価する手法を提案/開発/分析する領域、つまり、科学を科学する領域として注目され始めています。