微軟 HPC 存儲專家Glenn K. Lockwood注意到,美國國家能源研究科學計算中心正在以 50% 的折扣租用 Perlmutter 超級計算機的基于 Nvidia A100 的計算 GPU 節點,直至 9 月底。這一優惠是在全行業對人工智能訓練的計算能力的需求稀缺的情況下提出的。同時,該提案僅適用于 NERSC 用戶。
“現在利用您的時間有利于整個 NERSC 社區,并在全年中更均勻地分配需求,因此為了鼓勵現在使用,我們將從明天開始一直到 9 月底,將在 Perlmutter GPU 節點上運行的所有作業打折 50%,” NERSC 用戶參與小組負責人 Rebecca Hartman-Baker 在給 NERSC 用戶的電子郵件中寫道。“今晚午夜到 10 月 1 日午夜(太平洋時間)之間運行的任何作業(或作業的一部分)將僅收取平常費用的一半,例如,在 7 個節點上執行 3 小時的作業,這將通常會產生 21 個 GPU 節點小時的費用,現在將收取 10.5 個 GPU 節點小時的費用。”
在生成式人工智能熱潮中,有數十家公司愿意租用 Nvidia 基于 GPU 的計算節點來訓練他們的大型語言模型。據媒體報道,商業數據中心仍在以最大容量運行,并且 Nvidia 的計算 GPU 在未來幾個季度內都已售罄。NERSC 的提供無疑是慷慨的,如果將其能力提供商業化,該科學中心可以輕松賺錢。
然而,問題是他們只將其提供給使用 Perlmutter 超級計算機進行科學研究的現有 NERSC 用戶。由于這些用戶正在放暑假,他們可能不會在超級計算機上運行工作負載,而且要到年底才會運行;至少有一些 GPU 節點閑置了一段時間,這就引出了一個問題:為什么該組織不用商業工作負載回填其閑置容量。
雖然使用美國政府為商業人工智能和高性能計算工作負載建造的超級計算機會帶來大量資金,可用于提升美國超級計算機的實力,但這并不是像 NERSC 這樣的機構所做的事情。
美國能源部的超級計算機主要用于涉及國家安全問題的事物或由預先選定的用戶使用,包括那些使用這些機器進行可用于商業應用的研究的用戶。因此,這些機器并不適合所有人。
共0條 [查看全部] 網友評論