微軟 HPC 存儲專家Glenn K. Lockwood注意到,美國國家能源研究科學(xué)計(jì)算中心正在以 50% 的折扣租用 Perlmutter 超級計(jì)算機(jī)的基于 Nvidia A100 的計(jì)算 GPU 節(jié)點(diǎn),直至 9 月底。這一優(yōu)惠是在全行業(yè)對人工智能訓(xùn)練的計(jì)算能力的需求稀缺的情況下提出的。同時,該提案僅適用于 NERSC 用戶。
“現(xiàn)在利用您的時間有利于整個 NERSC 社區(qū),并在全年中更均勻地分配需求,因此為了鼓勵現(xiàn)在使用,我們將從明天開始一直到 9 月底,將在 Perlmutter GPU 節(jié)點(diǎn)上運(yùn)行的所有作業(yè)打折 50%,” NERSC 用戶參與小組負(fù)責(zé)人 Rebecca Hartman-Baker 在給 NERSC 用戶的電子郵件中寫道。“今晚午夜到 10 月 1 日午夜(太平洋時間)之間運(yùn)行的任何作業(yè)(或作業(yè)的一部分)將僅收取平常費(fèi)用的一半,例如,在 7 個節(jié)點(diǎn)上執(zhí)行 3 小時的作業(yè),這將通常會產(chǎn)生 21 個 GPU 節(jié)點(diǎn)小時的費(fèi)用,現(xiàn)在將收取 10.5 個 GPU 節(jié)點(diǎn)小時的費(fèi)用。”
在生成式人工智能熱潮中,有數(shù)十家公司愿意租用 Nvidia 基于 GPU 的計(jì)算節(jié)點(diǎn)來訓(xùn)練他們的大型語言模型。據(jù)媒體報道,商業(yè)數(shù)據(jù)中心仍在以最大容量運(yùn)行,并且 Nvidia 的計(jì)算 GPU 在未來幾個季度內(nèi)都已售罄。NERSC 的提供無疑是慷慨的,如果將其能力提供商業(yè)化,該科學(xué)中心可以輕松賺錢。
然而,問題是他們只將其提供給使用 Perlmutter 超級計(jì)算機(jī)進(jìn)行科學(xué)研究的現(xiàn)有 NERSC 用戶。由于這些用戶正在放暑假,他們可能不會在超級計(jì)算機(jī)上運(yùn)行工作負(fù)載,而且要到年底才會運(yùn)行;至少有一些 GPU 節(jié)點(diǎn)閑置了一段時間,這就引出了一個問題:為什么該組織不用商業(yè)工作負(fù)載回填其閑置容量。
雖然使用美國政府為商業(yè)人工智能和高性能計(jì)算工作負(fù)載建造的超級計(jì)算機(jī)會帶來大量資金,可用于提升美國超級計(jì)算機(jī)的實(shí)力,但這并不是像 NERSC 這樣的機(jī)構(gòu)所做的事情。
美國能源部的超級計(jì)算機(jī)主要用于涉及國家安全問題的事物或由預(yù)先選定的用戶使用,包括那些使用這些機(jī)器進(jìn)行可用于商業(yè)應(yīng)用的研究的用戶。因此,這些機(jī)器并不適合所有人。










共0條 [查看全部] 網(wǎng)友評論