台灣最大程式設計社群網站
線上人數
1941
 
會員總數:245256
討論主題:189112
歡迎您免費加入會員
討論區列表 >> 其他DB >> 請問google資料庫的架構
[]  
[我要回覆]
1
回應主題 加入我的關注話題 檢舉此篇討論 將提問者加入個人黑名單
請問google資料庫的架構
價值 : 120 QP  點閱數:4684 回應數:2

樓主

一個頭兩個大
初級專家
1530 29
1014 297
發送站內信

一般資料庫的筆數達一千萬筆,執行起來就巳慢到不行...

而google的筆數巳遠超一千萬,但作然能非常快的把結果呈現,
而且還能用intitle, site等來指定哪些字要出現在哪些欄位

請問是否有前輩知道或能告知哪裡有這問題答案的參考資料?

搜尋相關Tags的文章: [ google ] , [ 資料庫 ] , [ 架構 ] ,
本篇文章發表於2006-09-19 19:31
別忘捐VP感謝幫助你的人 新手會員瞧一瞧
1樓
不錯的參考

Jerry Lai
檢舉此回應
這問題很難回答耶
你要找的資料很多, 我猜應該有用到這幾種: Grid Computing, Cluster, SAN/NAS, Load Balancing,...

http://labs.google.com/papers/index.html
這裡有部分有用的資訊
本篇文章回覆於2006-09-20 04:34
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
2樓
最有價值解答

溫子
捐贈 VP 給 溫子 檢舉此回應
溫子盡量用白話點的方式來回答這個問題~~~

Google 是多點叢集資料庫的架構存在,也就是說"叢集"只是一個點的基本,
多點才是他分擔運算的大前提...

有一種 DNS 重新導向的網路設備不知道你之不知道,也就是 DNS 會由你是從哪個地區來的,
自動給予最近端的伺服IP,這樣就可以做到第一階段的索求分流,
並且該資料叢集盡可能的只放該負責區域的資料,達到第二階段加快搜尋的速度,
當發現筆數沒達到一個水準的時候,再由該地的資料叢集去問其他的叢集是否有相關資料,
並且在去紀錄這個"字串"是否在該地區尋找頻率是否很高,再由系統判斷是否要將相關資料搬移一份到本地資料叢集中,
這就是第三階段的應用...

當然這些只是表面上看的到的應用架構,實際上 Google 所用的 磁碟格式( FAT & NTFS 這就是磁碟格式),
完全都是自己的格式,就是為了更適合搜尋資料用,包括常見的 Oracle 也是要用自己的磁碟格式,
才會發揮最大效能是一樣的意思~~~

以上只是粗淺的說明 Google 所公佈架構,看看有沒有人還要繼續補充...
本篇文章回覆於2006-09-23 03:24
== 簽名檔 ==
--未登入的會員無法查看對方簽名檔--
   
1

回覆
如要回應,請先登入.