NCBI GEOの使い方3 データセットブラウザの使い方 下調べ5・6, 動画編集1
先週のぶんと昨日のぶんです。「毎回更新します」がもう崩れましたね。
まずはHeatmap以外のツールのやや詳細。
・Find genes
Find gene name or symbol
キーワード入力によりデータセット中の遺伝子をシンプルに検索。
Find genes that are up/down for this condition(s)
サンプルごとに変えている条件を選択、その条件によって変動のある遺伝子のみを表示。
今回例として用いるデータではProtocol(controlとmiR-124過剰発現のどちらか)とtime(処理時間)から選択する。なお複数にチェックを入れるとOR検索になる。
あまりrobustではないので、ちゃんと解析したい場合は次の項を使うことが推奨される。
・Compare 2 sets of samples
サンプル群の中から自分で好きに2つのサンプルセットを設定。そのサンプルセット間で発現に有意差がある遺伝子を検索する。検定の方法も自分で選択でき、両側/片側t検定、value/rank means fold difference が使える。
・Experiment design and value distribution
箱ひげ図による、各サンプルの正規化後のデータ分布。正規化できていればサンプル間で差のない形を示すはず。
まだ書いていなかったみたいですが、これらの説明を行う二本目の動画では、例として用いるデータセットを1本目と変え、GDS2657, miR-124 overexpression: time course (HepG2 cells(ヒト肝がん細胞)でmiR-124を最大120時間までサンプルごと時間を変えて過剰発現させた。miR-124のターゲットを推測するための実験) としています。Factor(サンプルごとに変えている条件)が複数あるものにしたかったためです。
動画の途中遺伝子の検索をするところがありますが、GPC3を例に用いています。GPC3(グリピカン3)は細胞膜表面上に存在する糖タンパク質、肝がん細胞で高発現していることがわかっており、治療の際のターゲットとして期待されています。
以上で動画の編集を開始しました。1本目と2本目のバランスが云々という話を前回の日記で書いていますが、とりあえず撮って長さの様子を見たいと思います。多分予定通りで大丈夫のはず。