2011-02-24 大規模並列分散処理のイメージがわかない 大規模データマイニングとか、BigTable、MapReduce、クラウド、負荷分散ってようするにどういこと? 従来のインターネット 大規模、クラウド、googleとかFacebook こういうこと?バックグラウンドで昼夜問わずにindexingしているの? そのためにクラウドサーバを地球規模で置いてる? 昼間は休んでいるデータセンターが夜になると稼動する?googleさんはなんとなく大量データをインデクシングしないといけないのでわかるけど、TwitterやFacebookのリアルタイム性はどうやって実現しているの? via:Hadoop Conference Japan 2011 参加メモ - 科学と非科学の迷宮