Cytoscapeを使って公共のデータベースからネットワークを作成する①

Cytoscapeを使って実験データを可視化するではSampleDataの中に入っているマイクロアレイの実験データを作成したネットワークに入れ、さらにその結果を可視化しました。

次は、Cytoscapeを使って公共のデータベースからデータを取得してネットワークを作成する方法を紹介する動画を作成します。

元々は前回の動画の一部として2分程度で紹介するものを作りました。しかし、もっと深く踏み込めるということで、

・取得するデータベースによって(種類、数)、どのように結果が変わるか

・得られたネットワークはそれらしいか(ちゃんとクラスターの中心は検索した遺伝子(HDAC1)か。他の遺伝子はHDAC1と関係する遺伝子か)

というのを調べます。

データベースの選択の仕方によるネットワークの違い

HDAC1からいくつかのネットワークを作ってみました。

(ネットワーク作成→"Apply Prefered Layout")

なお、

ノード色

オレンジ→マウス
青→ヒト
紫→ショウジョウバエ
緑→ラット
白→その他

です。

Stringのみ

f:id:am_takahiro:20131211152151p:plain

各種ごとにきれいに分かれました。

各集団で中央にあるのが

マウス→HDAC1
ヒト→HDAC2
アフリカツメガエル、アメリカムラサキウニ、ニワトリ→HDAC1

です(見えにくいですが、白も下の方にあります)。

BioGridのみ

f:id:am_takahiro:20131211152141p:plain

生物種がいくつか変わりましたが、Stringと同じような感じになりました。

中央にあるのはやはりHDAC1ですが、Stringの場合と異なりノードの情報としてIDしか入っていないので、HDAC1で検索しても引っかかりません。

String+BioGrid

f:id:am_takahiro:20131211152145p:plain

前述の二つからネットワークを作成しました。

その結果ネットワークが大幅に増加したように見えます。

しかし、実際のところこれらは先程の2つのネットワークを合わせただけです。

全部入れたもの

f:id:am_takahiro:20131211152559p:plain

こうなりました。

いくらかいじったところ、同じものを示すノードが複数あり、種名もIDだったり動物名だったり学名だったり統一されていません。

結論

ただ沢山入れればいいということはなさそうです。

少なくともどのようなデータが取得されているかを確認し、目的に合わせて調整することが必要だろうと思いました。

できたネットワークのノードの中身

Stringから作ったネットワークの中身を見てみました。

f:id:am_takahiro:20131211152151p:plain

「HDAC1」でラベルを検索したところ、各塊の中心のノードが選択されました。

HDAC1とその周辺のノードが無事インポートされたようです。

ここで「Human Readable Gene Name」がヒトのものだけ「HDAC2」になっていました。

「String」のラベルで確認したところ、このノードにはHDAC1とHDAC2がまとめられていることがわかりました。

これはHDAC1とHDAC2がHDAC複合体を形成して機能するためのようです。

f:id:am_takahiro:20131211180823p:plain

実際にStringで見たところ、HDAC1とHDAC2はこのようになっていました。

ストーリー案

「Cytoscapeを使って公共のデータベースからネットワークを作成する(仮)」

Stringからデータを取得してネットワーク作成

→VizMapperで各ノード色の意味を確認

→中央にあるノードをクリック、また検索して中央にあるのがHDAC1であることを確認

→HDAC1とHDAC2は複合体を形成して云々(イマココ)

→いくつか試してみた

→String+BioGridの中身をチェック

メモ

BioGrid: http://thebiogrid.org/

taxonomy ID検索: http://resourcedb.nbrp.jp/top/topTaxonomy.jsp

関係無いですが、Twitter ID変わりました。

am_takahiro_26→am_takahiro

こちらとおなじになりました。