下一代共享數據分散平臺供應商Fusion-io (NYSE: FIO)日前在德國的超級計算大會上宣布,在圣地亞哥加州福尼亞大學Fusion-io同圣地亞哥超級計算機中心(SDSC)合作進行的Protein Data Bank(PDB)研究中,Fusion-io的技術用在生物信息領域,實現了MySQL數據庫查詢性能的顯著提升。SDSC的研究人員表示,在他們的數據庫基礎設施上使用Fusion-io技術替換硬盤(HDDs)之后,數據庫的查詢時間從30分鐘縮短到3分鐘。
SDSC是一家美國圣地亞哥加州大學的一個調研機構,該機構將Fusion的 ioMemory技術用于其數據密集型計算。作為這一舉措的一部分,研究人員正使用該技術來推進Protein Data Bank的研究,這是世界上最大的存儲大型分子和核酸三維結構的儲存庫。該研究的實施能夠加快救生藥物用于藥物和對疾病的其它療效的開發。
SDSC的Allan Snavely表示:“由于SDSC致力于成為具有卓越研究成果的研發中心,所以我們更注重評估基于閃存的技術如何改進科學探索。通過研究,我們發現Fusion-io所提供的存儲產品比硬盤的處理速度更快,能夠滿足很多大容量內存和密集型數據的處理需求,并且基于閃存的存儲內存能夠實現超高的計算性能!
使用部署了Fusion技術的服務器,研究人員能夠縮短復雜的MySQL數據庫的查詢時間,而這能夠確定蛋白質和目標蛋白質相互作用的關系。使用傳統的硬盤,對超過2億個蛋白質結構的一次查詢分析要花費30分鐘的時間。
SDSC計算科學家和Gordon Applications 的負責人Robert Sinkovits表示:“采用Fusion的共享數據分散技術,存儲內存介質就能夠恰好位于處理器的附近,從而極大地降低了延遲并提高了處理速度,處理上述同樣的查詢只花費3分鐘!
與Allen Snavely一起開展研究工作的Spencer Bliven(畢業于加州大學圣地亞哥分校的生物信息學和系統生物學學院)表示,“PBD幫助我們對生物科學的基礎課程獲得了更加理論和實際地認識和理解。在測試中我看到,使用Fusion的ioMemory技術大大減少了查詢時間,這樣我就能夠將精力更多的關注于研究。這就使得科學探索的過程更加具有自發性,并且有助于我們顯著消除潛在的錯誤!
用于實現性能提升的計算機包含兩個四核Intel Xeon E5530 2.40 GHz處理器和48 GB的DDR3-1066內存。安裝有4個320 GB的ioDrives和配置了運行XFS文件系統的單個1.2 TB RAID 0設備。
Fusion-io的首席技術官Neil Carson表示:“將關鍵數據存儲到處理這些數據的服務器上能夠極大的提升大型數據集的分析,從而促進新的科學探索。我們很高興,SDSC利用Fusion-io的技術顯著提升了性能和降低延遲,從而推進了復雜的生物研究!