DAVIDを使ってマイクロアレイデータを解析する 調査2〜4

3回分です。

DAVID で使える解析ツールのまとめ。

Functional Annotation Tool
・Functional Annotation Clustering
リスト中の遺伝子が持っているアノテーションクラスタリングしたものを表示。リストの遺伝子の機能を概観できる。クラスタリング手法は下記。
・Functional Annotation Chart
リスト中で出現する回数に有意性が高い(大雑把に言えば、リスト中の多くの遺伝子が持っている)アノテーションを順に表示。
・Functional Annotation Table
リストの各遺伝子の持っているアノテーションを遺伝子ごとに一覧

Gene Functional Classification Tool
アノテーションをもとにリストの遺伝子をクラスタリング。"RG" (Related Genes) をクリックすることで、リスト中での有無にかかわらずそのクラスタの機能に関連する遺伝子を表示できる。

Gene ID Conversion Tool
リストの遺伝子 ID を、別の ID に変換 (Affymetrix ID から DAVID の ID に変換、など)

Gene Name Batch Viewer
リストの遺伝子 ID を遺伝子名に変換

NIAID Pathogen Annotation Browser
病原体の遺伝子検索。病原体のリストからいくつか選んでキーワードを入れると、キーワードに関連した遺伝子のリストを表示する。このリストを DAVID の他の解析に用いることができる。

アノテーションのリストでの出現回数の有意性を示すのに使われている P-value は modified Fischer exact p-value です。
http://david.abcc.ncifcrf.gov/helps/functional_annotation.html#fisher
全遺伝子の中であるアノテーションを持っているものの割合をバックグラウンドに、リスト中でのそのアノテーションの出現回数の有意性を計算します。
クラスタには、その有意性を表す指標として enrichment score が定義されています。所属する各アノテーションの p-value の、-log の幾何平均です。

クラスタリングについて。
2 遺伝子間または 2 アノテーション間の距離はκ係数というもので定義しています。
http://david.abcc.ncifcrf.gov/helps/linear_search.html#kappa
http://www.med.osaka-u.ac.jp/pub/kid/clinicaljournalclub12.html
持っているアノテーションが似ている遺伝子同士は近い
持たれている遺伝子が似ているアノテーション同士は近い
というのが大雑把なところ。

クラスタリングアルゴリズムは独自のものを使っており、
・各属性が複数のクラスタに所属しうる
クラスタの個数を自動決定
などの特徴があります。
 詳細についてはこちら。
http://david.abcc.ncifcrf.gov/helps/functional_classification.html#clustering
各点間のκ係数を計算する
κ係数が閾値(例えば 0.35)以上の点が、閾値(例えば 2 個)以上個存在する点を initial seed とする
ただし、クラスタ内の seed でない点同士の距離が閾値に満たないものが半数を超える場合は除外する
閾値(例えば 50%) 以上のメンバーを共有するクラスタをマージする

50% 以上のメンバーを共有するってどういうことでしょう。誰にとっての 50% なのか。

A∩B / A >= 0.5 かつ A∩B / B >= 0.5

なのかそれとも

A∩B / A∪B >= 0.5

なのか。
A={a, b, c, d}, B={c, d, e, f} に対して、前者ならA, B はマージされ後者ならされない。

また、いずれにしても順序に依存があります。
前者なら
{a, b, c}
{b, c, d}
{c, d, e}
{d, e, f}
から最終的にできるクラスタが、{a, b, c, d, e, f} だけになる場合と {a, b, c, d, e} と {d, e, f} などのようになる場合があります。

後者なら
{a, b, c}
{b, c, d}
{c, d, e}
から {a, b, c, d} {c, d, e} もしくは {a, b, c} {b, c, d, e} ができます。

ヘルプにはこの辺のことが書かれていないようです。うーん。