7月27日,2025語料數(shù)據(jù)智能創(chuàng)意大賽(CICC)獲獎榜單在世界人工智能大會上揭曉。寶信軟件“鋼鐵行業(yè)高質(zhì)量多模態(tài)數(shù)據(jù)集筑基企業(yè)AI+應(yīng)用”課題斬獲一等獎,研究成果成功入選2025年語料風(fēng)云榜,在鋼鐵行業(yè)數(shù)字化轉(zhuǎn)型領(lǐng)域具有重大意義,為行業(yè)發(fā)展注入了新動能。


語料數(shù)據(jù)(Corpus Data)指為語言分析、模型訓(xùn)練等目的系統(tǒng)化收集的真實文本或語音材料的集合,是自然語言處理(NLP)領(lǐng)域的核心資源,相當(dāng)于AI學(xué)習(xí)語言的“教材”。在AI時代,語料是人工智能發(fā)展的核心基礎(chǔ)之一,甚至被譽(yù)為AI產(chǎn)業(yè)的“金礦”,是決定模型能力上限的核心要素。上海作為中國人工智能發(fā)展的前沿陣地,已采取一系列措施來加強(qiáng)語料庫的建設(shè)和應(yīng)用。
此次大賽由上海市經(jīng)信委指導(dǎo),旨在面向全社會尋找“好語料、好技術(shù)、好場景”,為上海“模塑申城”工程筑牢語料基石,打通高質(zhì)量語料數(shù)據(jù)采集、標(biāo)注、共享、應(yīng)用全鏈路。大賽吸引了150余支高水平團(tuán)隊參賽,競爭異常激烈。經(jīng)過賽事組委會及多家權(quán)威支持單位從方案完整性、領(lǐng)域適配性、技術(shù)創(chuàng)新性等多維度的多輪嚴(yán)格評審,寶信軟件參賽項目最終脫穎而出,體現(xiàn)了在數(shù)據(jù)智能領(lǐng)域的深厚積累與創(chuàng)新突破。
該獲獎?wù)n題致力于構(gòu)建鋼鐵行業(yè)高質(zhì)量多模態(tài)數(shù)據(jù)集,以推動AI技術(shù)在鋼鐵企業(yè)經(jīng)營管理及生產(chǎn)制造中的深度應(yīng)用。鋼鐵行業(yè)作為典型的流程制造業(yè),生產(chǎn)環(huán)節(jié)復(fù)雜,涵蓋煉鐵、煉鋼、軋鋼等數(shù)十個工序,數(shù)據(jù)類型龐雜,既有設(shè)備傳感器的實時數(shù)據(jù),也有生產(chǎn)報表、質(zhì)檢圖像等非結(jié)構(gòu)化信息,長期面臨“數(shù)據(jù)孤島”“標(biāo)準(zhǔn)不一”“質(zhì)量參差”三大問題,導(dǎo)致AI技術(shù)難以深度滲透。該課題通過“規(guī)范制定-平臺研發(fā)-應(yīng)用支撐”三位一體的實施路徑,有效解決了這些行業(yè)痛點問題。

該項目有著諸多核心創(chuàng)新點。在全模態(tài)數(shù)據(jù)覆蓋方面,整合OT/IT數(shù)據(jù)與文本、圖像/視頻等非結(jié)構(gòu)化數(shù)據(jù),支撐審計監(jiān)督、質(zhì)量預(yù)測、智能煉鋼等關(guān)鍵場景;在技術(shù)閉環(huán)構(gòu)建方面,集成數(shù)據(jù)采集、清洗標(biāo)注及知識圖譜技術(shù),融合大模型能力,形成“數(shù)據(jù)-模型-應(yīng)用”協(xié)同體系。輸出11項行業(yè)標(biāo)準(zhǔn),其中《鋼鐵企業(yè)多模態(tài)數(shù)據(jù)采集規(guī)范》《缺陷圖像標(biāo)注指南》等填補(bǔ)了行業(yè)空白,為行業(yè)數(shù)字化轉(zhuǎn)型奠定了堅實基礎(chǔ)。
共0條 [查看全部] 網(wǎng)友評論