研究関係情報

英文校正業者

論文等原稿で用いた英文校正業者

  • Editage
    遅いのが難点.1ランク高い(速い)ので申し込むと,1ランク自動的に落とされて普通の速さになってしまったりする(もちろん,お金は余分には取られない).安いのはメリット.質は普通.校正者ごとの質のばらつきが大きめ.latex 入稿可.word 入稿に比べると少し高くはなるようだが.

  • ELSS
    latex 入稿不可.ただ,pdf をWordにてきとうに直し(数式とかは崩れるけど)て出すことはできる.Editage よりも高い質で速くやってくれる.その分若干高いかも.生物分野でしか頼んだことないので,物理系を出した場合どう振る舞うかはまだ知らない.

  • エナゴも,結構よい.latex入稿可.

  • textcheck
    latex 入稿可.tex原稿 を word.doc に貼り,プリアンブル・個人情報・その他コメントアウトしている箇所を消去して提出する.ワードファイル化して校正してくれて返してくれる.数式は見てくれない.その場合 pdf 添付入稿が推奨されているとのこと(今回はそうしなかった.そうすれば,数式とかも見てくれる??).納期早い.安め.1回使った限りはやや雑だった.

データ等へのリンク

static network のデータ

temporal network のデータ

フリーソフト

  • UCINET
    社会学から来てる.こてこてで使いにくい.遅いらしい.有料? よく知りません.
  • Pajek
    UCINET と同様の批判.無料(以下も全部無料だと思います).
  • gephi
    有名になりつつあるようです.
  • igraph
    R と関係? 私はRを使えないので,よくは知りませんが.
  • Graphviz
    可視化用だと書いてありますね.使ったことないので何とも言えない.
  • cytoscape
    生物ネットワーク用ではあるが,汎用でも使える.gephi より若干使いにくい印象.
    自分の HP にそれなりの情報:
    https://sites.google.com/site/teammasuda/social-simulations
  • Indiana 大学のもの
    よく知らないけど,たまに見かけます:
  • LGL
    大きいネットワークを描くには良いらしいです.私は中身を知りません.
  • mfinder
    network motif 解析。左の "Network Motif Software" をクリックすれば行ける。コマンドラインからの入力でがりがり解析してくれる。
  • FANMOD
    network motif 解析。私は使ったことないが、mfinder よりもグラフィカルインターフェイスなどよいらしい。

公開されているコミュニティ検出アルゴリズム

  • Clauset のもの
  • Rosvall のもの
    下の方の PNAS 2007, PNAS 2008 という論文に対応するものです.
  • Blondel のもの
    一番上の Louvain という項目です.
  • 他にも公開されているのはあるはずで,Fortunato, Physics Reports (2010) に詳しい.私の赤い本 (近代科学社,2010) の第二章にもイントロと Fortunato 論文等の情報が書いてあります.

Tips集

gnuplot

  • Installation:
    1. MacPorts の HP から MacPorts をインストール。
    2. MacPorts の HP に書いてあるように Xcode が必要なので、Xcode をインストール。"Command Line Developer Tools" はこの HP からたどってインストールしようとすると、使用目的などを尋ねられて大変そうで、そうする必要はない。また、昔のように mac のインストール DVD から Xcode をインストールする必要はない(上記のようにオンラインでできる)。
    3. Xcode はダウンロードしても、その後にアプリケーションフォルダから実行しないとインストール(実行?)されないので注意。
    4. Xcodeを起動し、Preferences → Downloadsに進み「Command Line Tools」をインストール。すると、gcc, g++ もインストールされる。
    5. sudo port install gnuplot
    6. ~/.gnuplot に "set terminal X11" と書いておく。
    7. XQuarts をインストール(apple のサイトから簡単にできる)。すると、 X11 が使えるようになる。X11 は、gnuplot の terminal X11 や、tgif で必要(なお、tgif は sudo port install tgif で OK)。
  • gnuplot pm3d map : デフォルトでは,各正方形セルの輝度は,正方形の4隅に対応するパラメータ値における輝度の平均値.

    set pm3d corners2color c1

    とすると,各正方形の輝度が,正方形の左下のパラメータ値における輝度の値になる.

    c2: 左上,c3: 右下,c4:右上

  • dyld: Library not loaded: /opt/local/lib/libintl.8.dylib
    Referenced from: /opt/local/lib/libgd.2.dylib
    Reason: image not found

    と言われたら

    sudo port uninstall subversion
    sudo port install subversion

    をやると直った(よく内容を理解してないが)。

R

  • インストール
    R公式の日本のミラーサイトから "Download R for MacOS X" の項目を選んで最新版の R-*.*.*.pkg をダウンロードし、通常の Mac 用ソフトウェアと同様にインストールすればよい(fink は必要ない)らしい。

  • ファイルの読み込み

    setwd("homedirectoryname")

    getwd()

    などを使いつつ

    data <- read.table(file="directoryname/filename.txt", header=T)

    tab 区切りの場合は

    data <- read.table(file="directoryname/filename.csv", header=T,sep="\t")
    注:拡張子が .txt か .csv は関係ない.

  • 相関係数

    cor(data$label1, data$label2, method="pearson")

    ただし,元データは
    -------
    label1 label2
    0 1
    2 3
    4 2
    ...
    -------
    の形式とする.1行目は header(変数名)で,ファイルは,header=T オプションをつけて read.table コマンドで読まれたとする.

    pairs(data)
    pairs(data[c(3,4,5,6,11,12)])

  • histogram

    hist(data[,2])

    で data の2列目のデータのヒストグラムが描ける.

  • [やめる時]

    quit();

cytoscape(東工大の授業の資料)

  • データ読み込み
    • "file - open" では session ファイルを読む (sampleData/ に1,2ある.ウインドウズなら Program Files の下).
    • "file - import - Network from Table (Text/MS Excel)" で通常のネットワークデータを読む.
    • 枝を表す2列ということで,source interaction の列番号と target interaction の列番号を正しく選ぶ.
    • interaction type はいじらなくてよい.
    • advanced "Show Text File Import Options" をクリックしていじると,例えば最初の指定した数行を除去したりできる ("Start Import Row").右にある "Refresh Preview" で確認しながらできる.
    • 例 "pajek dataset" の .net のデータ
      • 2 or 3 列にうまくなってるものを用いる.例: yeast
      • 頂点のデータは捨てる(上記 advanced をクリックして捨ててもよい).
      • Arcs : 方向付きの枝
      • Edges : 方向なしの枝
  • 描画
    • データを読み込むと,多分自動になされる.
    • "Layout - Cytoscape Layouts - Edge-Weighted Spring Embedded - All Nodes - (unweighted)" できれいなレイアウトにできる."Layout" 以下の他のコマンドも試してみよ.ネットワークごとに,見やすいレイアウトの種類というものがある.
    • 頂点サイズが次数に比例(?)するようなレイアウトの種類がいくつかある.これを試した後,頂点サイズを次数によらず同じサイズにするにはどうしたらよいか?
    • "Layout - yFiles" 以下のレイアウトも可.
    • "Layout - JGraph Layouts" 以下のレイアウトも可.ただし,"Simulated Annealing Layout" は凄く遅い.また,よいレイアウトがあまりないように思える.
    • マウスで頂点をつかんで動かすこともできる.
    • 頂点の見栄え(大きさ,色,ラベルなど)は,VizMapper にして "Defaults" のところをいじると変えられる.ただ,枝の方向の矢印挿入など,やってみてもなぜかうまくいかない操作もある.これらは,"Defaults" でいじっておいて,データファイルを再読み込みするとうまくいくようだ.
    • 頂点を右クリックすると,頂点のサイズや色などを個別に変えることができる.除去したりもできる.
    • 枝の色なども変えられる.
  • 解析
    "Plugins - Network Analysis - Analyze Network" で一挙にいろいろ求まる.
    • plugin の NetworkAnalyzer をインストールする方がよい。
    • 頂点数
    • 枝数
    • 平均次数
    • L (characteristic path length)
    • ある特定の点から,もう1つの特定の点への距離?
    • その分布 "Shortest Path Length Distribution"
    • C, C_i (局所的なクラスター係数) "Avg. Clustering Coefficient Distribution" で次数を横軸,その次数について平均化したクラスター係数を縦軸として図示してくれる.
    • k_i(各頂点の次数)"Node Degree Distribution" で分布を図示してくれる.
    • 近接中心性 "Closeness Centrality"
    • 媒介中心性 "Betweenness Centrality" → 横軸を次数として図示してくれる.
    • "Export Chart" で保存できる(他の図示についても同様)
    • 次数相関 "Neighborhood Connectivity Distribution"
    • 上の右の矢印をクリックすると次数分布とか見える.
    • "Visualize Parameters" で,計算された統計量を,頂点の大きさ,色などに反映して図示できる.

Pajek (ちょっと古いかも)

  • 本体:Pajek wiki からダウンロードして,ウイルスチェックをかけて,実行ファイル (.exe かな)を実行すると,簡単にインストールされる.
  • 注:マニュアルはわかりにくい.
  • File - Network - Read でデータを読む.
    サンプルデータの在処は,
    • pajek のディレクトリの中
    • pajek のサイトに置いてあるデータセット
    • インターネット上のその他のサイト
    • 読むと同時に,枝数 (xx lines) が表示される.
  • Draw - Draw で描画
    • Layout - Energy - Kamada-Kawai - Free で位置の調整をできる.
    • Kamada-Kawai 以外のアルゴリズムでもよい.
    • 同じアルゴリズムでも,描画の結果は毎回異なる.
    • マウスで頂点を引きずることによっても頂点を移動することができる.← 稲水らの解説参照
    • 頂点や枝の太さ,色,名前表示の有無などをいじって遊べる. ← 稲水らの解説参照
  • Net - Paths between 2 vertices - Distribution of Distances - From All Vertices で 2 点間距離の分布を求める.
    • Report に平均距離 (Average distance among reachable pairs) が表示される.
    • メイン画面の Vectors に,距離分布の結果が格納される.表示するには,フロッピーディスクアイコンの右隣にある Edit Vector を押す.
    • 距離 1 のペア数は,ネットワークの枝数に等しいことを確認する.
  • Net - Paths between 2 vertices - One Shortest / All Shortest で指定した2点間の距離の最短路を 1つ/全て 求める(らしい).
    • From と To で頂点対を指定する.頂点数を N として,1 から N の数を入れる.枝に方向がなければ,どちらを From にしてもよい.
    • Forget values of lines ? → Yes
    • Identify vertices in source network? → Yes (意味はわからない)
    • Report に結果(2点間距離)が出てくる.
    • なお,メイン画面の "Networks" 変数に上書きされる.これを Draw してみるとわかるが,From から To への最短路が 1つ/全て 出てくる.経由頂点もわかる.右の▼をクリックして元のネットワークを選択すれば,元のネットワークに戻れる.
  • Net - Vector - Clustering Coefficients - CC1 でクラスター係数を求める.
    • メインの Vectors に,各頂点のクラスター係数が格納される.次数が 1 以下だとその頂点のクラスター係数は 0 と出力される.
    • メインの Partitions には,各頂点のクラスター係数計算の際に使われる「分子」の値が格納される.これを k_i * (k_i - 1 ) / 2 でわった値が,その頂点のクラスター係数と一致することを確かめたい.
    • ネットワーク全体のクラスター係数は,どうやったらわかる?
  • random graph と BA model (scale-free network) : 増田,今野.「複雑ネットワーク」とは何か,を参照.random graph なら,
    • Net - Random Network - Erdos-Renyi - Undirected - General とし,How many vertices? と聞かれたら頂点数を入力し,Average degree of vertices と聞かれたら平均次数を入力する.
    • BA model は,初期状態は m0 個の孤立点集合かもしれない(完全グラフではなくて).確認する必要がある.p や q の入力値に依る?
  • Info - Network - General - 0 を入力,で平均次数を求める.
    • 頂点数, 枝数なども出てくる.
    • 結果は Reports 画面に出る.情報にスクロールバックしないと見えないかも.
  • Net - Partition - Degree - All で,各頂点の次数を求める.
    • All は,枝の方向を無視することを意味する.
    • 結果は,メインの Partitions に格納される.
    • 結果は,次数分布ではなく,各頂点の次数であるが,情報としてはより多いのでよかろう.
  • Net - Vector - Centrality - Betweenness で媒介中心性を求める
    • 結果は,メインの Vectors に格納される.
    • 結果を外にコピペすることはできないようだが,フロッピーディスクのボタンを押すと,ファイルに保存できる.
  • Net - Vector - Centrality - Closeness - All で近接中心性を求める
    • 結果は,メインの Vectors に格納される.
    • All は,枝の方向を無視することを意味する.
  • 枝に方向つき(矢印)のネットワークを使っている場合は,方向なしにして解析する(ことにする). Net - Transform - Arcs→Edges - All として,
    • Make new network? → Yes.
    •   Remove multiple lines? → 5:Single
    とすると,新しい(枝の方向を無視した)ネットワークができる.
  • 図の保存 ← 稲水も参照
    • Draw ウインドウで,Export - 2D - EPS/PS または Export - 2D - Bitmap
    • Bitmap は重いことに注意.他のフォーマットに(他のソフト)で変換してしまってやりとりする方がよい.
    • Export - Option で,保存用の色などの設定を変更できる.デフォルトでは,Pajek の画面に表示される色などと,保存用の色などは,異なる.多分 Bitmap に対しては,設定変更できない.
  • データの .net 形式での保存 → 稲水を参照
  • 動画? → 稲水らの解説参照
  • 特定の)頂点の色の変え方.稲水を参照.ic Blue などとする.
    • ある頂点について ic Blue としたら,それ以降の頂点は指定しない限り,全て青になってしまうことに注意.
    • (場合によっては)稲水 p.17 の 3 にあるような Options の設定をする必要があることに注意.
    • お絵描きソフトに読み込んで色や大きさを変えてもよい.
  • 一般的なこととして、同一のコマンドが色々なコマンドグループの下にあるようだ.紛らわしい.

公開セミナー(東大)の記録

Luncheon Seminar 開催記録