
7月4日在百度AI開發(fā)者大會上,百度大腦3.0全新登場,它的核心是‘多模態(tài)深度語義理解’”。百度高級副總裁、AI技術平臺體系(AIG)總負責人王海峰用一段視頻完整地呈現(xiàn)了視覺語義化技術在無人超市中的落地應用。視頻中,實現(xiàn)了如電影般的場景,顧客購物過程輕松便捷,實現(xiàn)即拿即走。
王海峰介紹到,無人超市便捷的背后,是百度全新推出的視覺語義化技術。此次百度大腦3.0的核心技術突破是“多模態(tài)深度語義理解”,它指對文字、聲音、圖片、視頻等多模態(tài)的數(shù)據(jù)和信息進行深層次多維度的語義理解,視覺語義化技術便是其中之一。
在運用了視覺語義化技術的無人超市購物,完全擺脫在傳統(tǒng)超市購物時,在貨架上尋找商品、推購物車、排隊結賬等復雜繁瑣流程,就跟從自家柜子里拿出物品一樣方便。王海峰表示,百度對無人超市中的人、貨、場進行識別,再進行時序化和結構化,形成顧客在超市里全程的完整語義理解?;诖耍粌H能實現(xiàn)無人超市購物的完整體驗,也可以進一步對這些語義數(shù)據(jù)進行分析,從而提升商超運營效率。
在無人超市購物,只需簡單三個步驟。首先,通過具備活體檢測功能的boteyeR紅外深度相機即可實現(xiàn)刷臉進店。進店后,人體檢測跟蹤就開始工作運行,系統(tǒng)會隨著你的移動位置鎖定你的行動軌跡。及時你把不同貨架的商品混淆擺放,Xeye嵌入式AI視覺模組都會看的清清楚楚,算的明明白白。
在店內(nèi)的每一分鐘,系統(tǒng)都在實時識別你所選的商品,走出店門,視覺語義化技術早已摸透對你的購物行,并給出了購物清單,實現(xiàn)瞬間刷臉,取貨離開。
機器能看“懂”世界,無疑是AI能力的上的一次突破,也將帶來新的風口。尤其是在時下最火熱的“新零售”場景中,視覺語義化技術將帶來巨大的想象空間。比如:人臉識別、刷臉支付自然不在話下;精準追蹤并分析用戶在店內(nèi)的行為不僅能保障運營穩(wěn)定,更是日后精準營銷的基礎;最IN的商品識別算法能實時將所選商品加入購物清單,支付時真正做到隨拿隨走……而在未來,我們還能夠在第一時間知道補貨需求,補貨周期甚至可以縮減到秒;還能知道什么樣的商品是客戶最喜歡的。
百度的視覺語義化技術是百度AI沃土中生長出的全新視覺感知和理解能力,是一次質(zhì)的飛躍。同時,百度的視覺語義化技術提供的是軟硬一體的解決方案。而之前新零售場景下較為常用的RFID技術,無法識別用戶的動作,只是可以檢測到商品,來完成最后的支付環(huán)節(jié)。如今的技術能夠檢測到商品、用戶,并捕捉它們之間的關系,用以預測更多用戶的行為和喜好。它不僅在技術上值得信賴,更在落地上充滿想象。
視覺語義化技術實現(xiàn)了從看“清”到看“懂”巨大進步,不斷創(chuàng)造更大的價值,也為我們的生活帶來更多美好和便捷。未來,視覺語義化技術不僅能運用于無人超市,還能在各行各業(yè)“生根發(fā)芽”,讓我們近距離體驗百度AI的美好。