大規模並列分散処理のイメージがわかない

大規模データマイニングとか、BigTableMapReduceクラウド、負荷分散ってようするにどういこと?

従来のインターネット



大規模、クラウドgoogleとかFacebook


こういうこと?バックグラウンドで昼夜問わずにindexingしているの?
そのためにクラウドサーバを地球規模で置いてる?
昼間は休んでいるデータセンターが夜になると稼動する?

googleさんはなんとなく大量データをインデクシングしないといけないのでわかるけど、

TwitterFacebookのリアルタイム性はどうやって実現しているの?


via:Hadoop Conference Japan 2011 参加メモ - 科学と非科学の迷宮