Cytoscapeを使って公共のデータベースからネットワークを作成する①
Cytoscapeを使って実験データを可視化するではSampleDataの中に入っているマイクロアレイの実験データを作成したネットワークに入れ、さらにその結果を可視化しました。
次は、Cytoscapeを使って公共のデータベースからデータを取得してネットワークを作成する方法を紹介する動画を作成します。
元々は前回の動画の一部として2分程度で紹介するものを作りました。しかし、もっと深く踏み込めるということで、
・取得するデータベースによって(種類、数)、どのように結果が変わるか
・得られたネットワークはそれらしいか(ちゃんとクラスターの中心は検索した遺伝子(HDAC1)か。他の遺伝子はHDAC1と関係する遺伝子か)
というのを調べます。
データベースの選択の仕方によるネットワークの違い
HDAC1からいくつかのネットワークを作ってみました。
(ネットワーク作成→"Apply Prefered Layout")
なお、
ノード色
- オレンジ→マウス
- 青→ヒト
- 紫→ショウジョウバエ
- 緑→ラット
- 白→その他
です。
Stringのみ
各種ごとにきれいに分かれました。
各集団で中央にあるのが
- マウス→HDAC1
- ヒト→HDAC2
- アフリカツメガエル、アメリカムラサキウニ、ニワトリ→HDAC1
です(見えにくいですが、白も下の方にあります)。
BioGridのみ
生物種がいくつか変わりましたが、Stringと同じような感じになりました。
中央にあるのはやはりHDAC1ですが、Stringの場合と異なりノードの情報としてIDしか入っていないので、HDAC1で検索しても引っかかりません。
String+BioGrid
前述の二つからネットワークを作成しました。
その結果ネットワークが大幅に増加したように見えます。
しかし、実際のところこれらは先程の2つのネットワークを合わせただけです。
全部入れたもの
こうなりました。
いくらかいじったところ、同じものを示すノードが複数あり、種名もIDだったり動物名だったり学名だったり統一されていません。
結論
ただ沢山入れればいいということはなさそうです。
少なくともどのようなデータが取得されているかを確認し、目的に合わせて調整することが必要だろうと思いました。
できたネットワークのノードの中身
Stringから作ったネットワークの中身を見てみました。
「HDAC1」でラベルを検索したところ、各塊の中心のノードが選択されました。
HDAC1とその周辺のノードが無事インポートされたようです。
ここで「Human Readable Gene Name」がヒトのものだけ「HDAC2」になっていました。
「String」のラベルで確認したところ、このノードにはHDAC1とHDAC2がまとめられていることがわかりました。
これはHDAC1とHDAC2がHDAC複合体を形成して機能するためのようです。
実際にStringで見たところ、HDAC1とHDAC2はこのようになっていました。
ストーリー案
「Cytoscapeを使って公共のデータベースからネットワークを作成する(仮)」
Stringからデータを取得してネットワーク作成
→VizMapperで各ノード色の意味を確認
→中央にあるノードをクリック、また検索して中央にあるのがHDAC1であることを確認
→HDAC1とHDAC2は複合体を形成して云々(イマココ)
→いくつか試してみた
→String+BioGridの中身をチェック
メモ
BioGrid: http://thebiogrid.org/
taxonomy ID検索: http://resourcedb.nbrp.jp/top/topTaxonomy.jsp
関係無いですが、Twitter ID変わりました。
am_takahiro_26→am_takahiro
こちらとおなじになりました。