2023年,雖然工業機器人版塊并沒有迎來業內期盼已久的“行業大復蘇”,但在“機器人+”政策以及人形機器人、GPT大模型、具身智能等各種概念的利好之下,工業機器人的熱度有增無減,甚至在今年上半年還實現了銷量上的正增長。
據高工機器人產業研究所(GGII)數據顯示,2023年H1,工業機器人銷量15.19萬臺,同比增長10.98%。GGII預計,2023年中國工業機器人全年銷量約33.3萬臺,同比增長9.90%。
不僅在銷量上保住了正增長趨勢,在融資層面也仍舊強勢,尤其是機器視覺領域。
據高工機器人產業研究所(GGII)數據顯示,2023年Q2,中國工業機器人領域融資事件23例,涉及融資金額約14億元人民幣;按融資案例分布來看,2023年Q2融資案例數量最多的是工業機器人本體(26%),其次是機器視覺和零部件領域(22%);融資金額最大的領域主要是核心零部件(33.57%)和機器視覺(23.43%)領域。
然而,在機器視覺持續火熱的背后,國內機器視覺市場規模正在逐步擴大,國產機器視覺企業也憑借新的差異化發展路徑,逐步崛起。
GGII數據顯示,2022年中國機器視覺市場規模170.65 億元(該數據未包含自動化集成設備規模),同比增長23.51%。其中,2D視覺市場規模約為152.24億元,同比增長20.21%,3D 視覺市場約為18.40億元,同比增長59.90%。
GGII預測,至2027年我國機器視覺市場規模將超過560億元,其中,2D視覺市場規模將超過400億元,3D視覺市場規模將接近160億元。
面對機器視覺領域的持續火熱,有企業負責人卻表示:“其實,我覺得行業前兩年是有‘虛火’的,但是任何一個行業都類似,這個‘虛火’本身代表了對于賽道的認可。而這兩年的‘虛火’有一個很大的好處,就是基本上大家認為人工智能與3D視覺在機器視覺解決方案中已經走通,技術上已經不存在問題,當前的要務就是如何才能把方案落地,并更加突出性價比。”
也正是在這樣的背景之下,跨維智能憑借創始人的“熱愛”與深厚的技術優勢成功脫穎而出,并為機器視覺領域注入全新的發展思路。
跨維智能創始人賈奎博士的一句話,更是直接道出了當下3D視覺領域的問題核心:“我們需要用AI的能力解決物理世界三維的感知問題。”
“AI+3D”的技術路徑,在業內并不算是新鮮的名詞,但AI對3D視覺算法的漸進式優化并沒有解決行業痛點,項目的非標定制化問題仍然存在。跨維智能倡導一條基于100%合成數據和AI能力平臺的新一代3D視覺算法生產模式,以無人化、標準化的視覺算法生產流程打破了視覺項目非標定制的瓶頸,產品化的交付能力讓行業看到了3D視覺技術普及的希望。跨維智能作為一家以AI為內核的企業,其新一代3D視覺解決方案已經成功落地在越來越多的具體案例中,而且還提出了基于物理世界模擬的生成式AI 2.0的概念。
那么究竟何為“生成式AI 2.0”?又有何魔力?要想揭開個中奧秘,或許還需從跨維智能本身來尋找答案。
躬身入局
據悉,跨維智能是一家專注于3D視覺軟硬件產品研發的高科技人工智能企業,其致力于將先進的三維幾何深度學習技術應用于工業智能化領域,為客戶提供AI視覺算法、3D智能相機和高性價比的軟硬件一體化3D視覺解決方案,讓機器人以靈活主動的方式完成復雜環境下基于3D視覺的定位、識別、引導等任務。
成立一年內,跨維智能就成功完成兩輪近億元融資,目前已獲得來自松禾資本、真格基金、聯創資本等知名機構投資,并由此引發了資本圈以及業界的高度關注。
那么,當初跨維智能是基于何種初衷選擇了AI作為入局3D視覺的主要方向?據賈奎博士透露,2016年回國后,其在華南理工大學便選擇用新型AI作為攻克三維感知的研究方向,彼時該校還建立了“幾何感知與智能”實驗室。
也正是基于這樣的長期技術積累,讓賈奎博士看到了AI在三維感知層面的商業化潛在機會。
賈奎博士表示:“用AI來做三維感知,它本身有兩大應用方向,第一是泛機器人的感知,其次是虛擬現實的增強,不管是前者還是后者都存在著現實三維空間中的感知問題。而經過了前期的技術沉淀,我們需要考慮從興趣到產業化的機會,為此,選擇了與機器人相關,譬如機械臂、無人車、人形機器人等。如何讓這些機器人能夠真正具備智能決策的能力,這就涉及到眼和腦的協同,倘若缺乏對三維世界的感知,那么機器人相關產品便不能做出相應的決策,它也就不是一個智能體。當然,這里面還有很多的應用方向,但為何跨維偏偏選擇去賦能機械臂相關的操作感知決策?關鍵一點就是我們要垂直打穿一個業務落地方向。”
正是基于這樣的發展方向,跨維智能在產品層面也屢獲突破。今年5月底,跨維智能發布了一款專為工業生產領域設計的Xema系列3D相機產品,該款產品一經推出在業界就引發了巨大關注。
技術開源
“我們此次推出的產品為Xema北極鷗系列開源相機,在小/中/大不同的工作視野下,跨維智能Xema系列劃分了Xema-P/S/L三款相機,以合適的價格、優質的技術方案,為不同的工業應用場景提供可靠的相機硬件方案。用戶可根據實際應用場景及使用需求,選擇相應的相機型號。”跨維智能相機部負責人吳迪介紹道。
據了解,跨維智能Xema北極鷗系列開源相機不僅提供先進的API接口和SDK二次開發軟件包,使用戶能夠以極大的靈活性進行二次開發。同時,通過開源平臺,用戶還將獲得對3D相機的完全掌控權。
“我們其實是希望通過開源的模式,來降低整個工業界對3D成像硬件的研發成本。因為當下普遍存在著這樣一個現象——每家企業都希望自己研發而不是采購別人的3D相機,如此,每家企業勢必就得從零開始研發,這對整個社會而言是巨大的浪費,與其如此,大家還不如把力量合在一起,研發出最通用、效果最好的3D相機。現在,我們在技術上有一些優勢,所有我們把自己的代碼、設計圖紙通過開源的方式,向整個工業界揭開,希望通過這樣的方式來促進行業乃至社會的發展進步。”談及開源的初衷時,吳迪如此說道。
對于跨維智能而言,開源只是邁向理想路上的第一步,打造3D視覺大模型實現“降本增效”方為其真正目的。
生成式AI 2.0
目前,3D視覺在工業制造的落地方面,依舊存在著諸多難點和痛點,譬如碎片化、多變等需求。以拆垛為例,可能是拆箱子、拆帶子,也可能是混合的拆垛、拆木板、拆電器門板等;還有工件,可能是半無序的工件,也可能是完全無序的工件,高反的工件或者是異形工件和大長寬比,所有的這些需求也就決定了場景定制化落地,縱然有些軟件產品的輔助,但仍存在著不同程度的定制調優。
面對這樣的復雜情況,在賈奎博士眼里,生成式AI無疑是最優解。
但當前的生成式AI本身也有局限性,以圖文為主,側重通過對自然語言的理解嘗試對需求做出示意性的反饋,但無法保證精度,因而在科技、工程等領域應用受到諸多限制,要想打破這樣的局限,就必須將生成式AI與物理世界結合,為此賈奎博士認為:“基于物理世界模擬的生成式AI,是生成式AI 2.0”。通過這樣組合,生成式 AI便可預測物理世界中的千萬種、甚至上億種可能性,形成有價值的合成數據。
以機械臂的抓取為例,通過仿真模擬平臺掌握了“光線對場景目標的反射、折射影響”等物理規律,生成式 AI就能預測模擬出一個瓶子,在不同場景光照下,周身不同的反光程度;一堆釘子,所有可能出現的散落狀態等。
而這也恰恰是跨維智能的優勢所在,通過生成式AI不僅能夠輕松解決了業內普遍存在的痛點和難點——據了解,目前業內大多數企業都是采用自行采集真實樣本的方式來開發或訓練算法,但自采的方式不僅成本高、效率低,加上終端應用場景碎片化,數據通用的概率相對較低,需要經過一系列的優化,這無形之中又增加了數道工序,性價比極低。
對此,賈奎博士曾表示:“用五六年、上千個案例積累的真實數據,通過合成數據,幾天就能完成。相比于人工采集與標注數據,合成數據的成本能夠實現幾個數量級的降低。”
最關鍵的還是,在訓練效果上,合成數據能夠更優于真實數據。由于本身就是基于物理規律合成,合成數據天生自帶絕對精確的標注,這就意味著,AI學習起來效率非常高。另外,合成數據的“全面性”是真實數據難以比擬的。
“跨維智能其實就是用新型的AI對物理規律進行建模,讓機器人的感知更智能、更精確,然后做出更好的決策,從而賦能到垂直場景,解決工業制造等領域所需的柔性抓取操作需求。”
據介紹,跨維智能旗下的生成式AI產品,目前,無需使用一張真實圖片就可完成機械臂復雜場景作業的3D視覺模型訓練,僅通過使用合成數據訓練的模型引導機械臂的柔性操作,便可以實現現場99.9%以上的穩定抓取。
相較于行業傳統定制化開發的模式,企業基于生成式AI 2.0,就可以利用通用大模型,實現產品模塊化開發,做到開箱即用的部署,進而實現同行業直接拓展,不同行業也能有效復用,3D視覺行業的商業化難題也就迎刃而解。而這恰恰是跨維智能所憧憬的行業未來,賈奎博士承諾,跨維智能從3D合成數據到基于AI平臺的3D視覺算法等中臺能力未來也將向行業開放。
雖為新生代企業,但跨維智能的大局觀、長期主義及開放性,都為行業帶來了全新氣象。俗語有云:“相聚為始,并行乃濟,無欲則成”。只有足夠開放,才能聚眾智、合眾力,從而推動3D視覺行業的全面繁榮發展。
共0條 [查看全部] 網友評論