無人超市藏1000個印度人...亞馬遜來了波神操作

網上流傳一個段子,每臺ATM裡都藏了個人,你取錢的時候裡面的人把鈔票點好之後送出來。

誰能想到,這樣一個段子竟然真實地發生在當下,甚至發生在被冠以“智能、前沿”的AI領域。

最近,科技巨頭亞馬遜旗下的生鮮門店,突然停用了零售支付技術 “Just Walk Out”。這項技術此前被一些人捧上天,被視爲零售業的未來。

簡單說,就是你在生鮮門店買完東西無需一樣樣結算,可以直接走出門。“Just Walk Out”技術會通過AI視頻識別出你買的東西,然後給你發送賬單進行支付。

亞馬遜生鮮雜貨店

這聽起來有些類似國內的無人超市,省去了排隊結賬的繁瑣流程。而且“出門後再結賬”的操作,隱隱之中還有吃霸王餐的爽感。

然而,這樣高大上的人工智能,最近卻被爆出實際要靠人工來實現“智能”。有美國媒體指出,“Just Walk Out”技術背後有1000多個印度工在人眼驗貨。他們在監控器後面,手動審查賬單與貨品是否匹配。

想想這幅畫面,跟ATM裡藏人沒啥區別。彼時的人工智能,如今更像是人工智障。

無獨有偶,最近初創公司Cognition AI號稱的“全球首個AI程序員”Devin,被曝存在造假。此前的AI建模軟件公司Kaedim,也被爆出產品背後是人工在操作。

這種“掛羊頭賣狗肉”的戲碼,爲何在AI圈越來越多?

亞馬遜:理想很飽滿,現實很骨感

“Just Walk Out”技術,並不複雜。亞馬遜的零售藍圖,也很美好。

2016年,亞馬遜在公佈“Just Walk Out”技術的時候,曾描述了這樣一幅藍圖:“如果我們能夠將最先進的機器學習、計算機視覺和人工智能融入到商店的結構中,這樣你就不用排隊等候了。”

的確,對於很多人來說,購物總是興奮的,排隊總是痛苦的。如果能拎包就走,無疑是快樂的。

爲了實現這幅藍圖,亞馬遜專門爲門店設計了一套流程框架:

顧客在進入門店之前,需要提前下載並安裝一個名爲“Amazon Go”的手機App,註冊並錄入個人資料,包括個人ID、支付賬戶等等,隨後平臺會創建一個“虛擬購物車”。

另外,顧客在進店時還會經過類似於地鐵站的閘口。

進入商店之後,顧客可以隨意購物。同時,亞馬遜在門店裡配置的攝像頭和傳感器會實時捕獲這些購物行爲,然後將視頻發送到亞馬遜雲端進行處理,這些統稱爲“流媒體服務”。

流媒體服務的核心就是“Just Walk Out”技術,它相當於整個商店的大腦,包含了對象識別、人員檢測、姿勢預估、活動分析,傳感器融合以及校準等一系列技術,目的就是解決一個問題:

誰?拿了什麼商品?

首先是“誰”的問題,即如何定位顧客的軌跡。

如果商店只有一個人,那麼就很好進行定位。但是如果擠滿了人就會導致彼此遮擋,定位的難度就會大大提升。“Just Walk Out”的解決方案是通過定位器、鏈接器和複雜狀態解析器三個模塊,持續跟蹤顧客路線。

其次就是“顧客拿了什麼商品“的問題。

一些商品在外觀上看起來非常相似,僅僅通過攝像頭還難以辨認。爲解決這個問題,“Just Walk Out”結合了所謂“基於殘差網絡的細粒度計算機視覺算法”,能夠更精準地識別商品。

顧客選購完畢之後,“Just Walk Out”的AI系統會計算好貨款,直接從顧客提供的賬戶上扣款。

這麼看下來,亞馬遜描述的零售藍圖的確具備吸引力,也被業內不少人極力吹捧,認爲其降低了人力成本,提升了零售體驗和效率。此後,“Just Walk Out”技術被部署在20家Amazon Go 商店、40家Amazon Fresh雜貨店和兩家Whole Foods商店。

然而,理想很飽滿,現實卻很骨感。亞馬遜滿心歡喜地推廣“Just Walk Out”後發現,事情越來越不對勁。總結下來,就是:

低估了流程和人性的複雜度。

要知道,顧客在商店裡購物,並不是如同機器一樣執行死板的程序,而是會產生更爲複雜和多變的場景。

比如,你買了二十樣商品放在購物車裡,但臨時決定不買其中的十件,其中五件在放回的時候放錯了貨架。同時,你跟愛人分別有一個購物車,買完東西后彙總到了同一個購物車......

要處理這些複雜場景,估計攝像頭背後的AI系統已經燒冒煙了......經常有顧客吐槽,走出商店後幾個小時後才收到賬單。

爲了進一步提高效率,亞馬遜嘗試開發更高效的傳感器,然而成本太高。其目標是將一個傳感器的價格降低到100美元,但工程團隊只能降到350美元。

在效率和成本之間,亞馬遜最終找到了一個平衡——印度人。面對複雜場景,亞馬遜招聘了1000多個印度人,讓他們看着攝像頭連接的監控屏幕,用人眼來驗貨、結賬。

據The Information報告,2022年中期亞馬遜無人商店裡70%的結算需要人工審覈,如今這一數字仍高達20%~50%,遠高於亞馬遜的內部目標。

因此,有人調侃亞馬遜的AI其實是“All Indians”。這種AI屬於勞動密集型科技,不僅不會搶走人類的工作,還能創造更多的就業。

除了低估流程的繁瑣度,亞馬遜還低估了人性的複雜度。

在此次停用“Just Walk Out”的公告中,亞馬遜表示雖然“Just Walk Out”能帶來無需排隊結賬的體驗,但顧客還是希望在購物時就能看到產品的總價、折扣、以及能省多少錢。

說白了,一些人在購物時都有“佔便宜”的心理。他們並不是只在意排隊結賬,還在乎能優惠多少。

這次亞馬遜停用“Just Walk Out”背後,顯露出它的兩個短板:既沒搞好科技,也沒搞懂人性。

亞馬遜的“同路人”:造假花樣,各有不同

跟亞馬遜一樣,深陷“AI造假”風波的科技企業,不在少數。

前不久,AI初創公司Cognition 宣稱,自家推出的Devin是全球首位完全自主的AI程序員。它不僅能自主學習陌生的技術,構建和部署應用程序,還能自己改bug、訓練和微調AI模型。

爲了讓公衆更清晰地看到Devin如何工作,Cognition還專門用視頻Demo進行演示,賺足了高人氣。

然而,高光時刻還沒持續多久,Cognition就迎來了打臉。最近,油管程序員博主Internet of Bugs對Devin的視頻進行了逐幀分析,發現它並不如演示中那般神奇,甚至存在造假的可能,這在網上引起輿論漩渦。

該博主的“打假過程”太長就不展開講,總結下來就是在“智商”方面,該博主不相信Devin真如Cognition宣傳的那樣能夠理解任何事物。並且他認爲軟件開發者的工作中最難的、最關鍵的、最耗時的一部分,主要就是:溝通。

在這一點上,Devin的表現並不像視頻演示中的那樣出色。

幹活效率方面,該博主自己複製了Devin做的任務,花費了大約36分鐘,而Devin用了至少6個小時,甚至超過一天。

因此,很多網友開始質疑Devin的誕生更多是在炒作。視頻裡演示的Devin,實際上是人工操作的結果。

跟Cognition 、亞馬遜一樣深陷造假風波的,還有Kaedim。

最近,硅谷風險投資巨頭a16z又一次進軍AI領域,領投了一家名爲Kaedim的AI建模軟件公司,金額達到1500萬美元,這家公司被a16z稱爲“3D世界的下一代合作開發平臺”。

此前,Kaedim宣稱自己的AI技術,可以將二維圖像轉換爲三維模型。用戶僅需上傳一張圖片,Kaedim就能將圖片中的2D物體生成爲3D形態。該公司還對公衆宣傳,不要再把時間浪費在建模工具上。

Kaedim的創始人康斯坦蒂娜·普索瑪入選了《福布斯》歐洲30位30歲以下精英榜,她曾對《福布斯》表示:

自家產品全程不需要人工參與,完全實現自動化。

不過,很快有人發現Kaedim的產品有貓膩。比如,產品太像人類了,創建的模型線條太過流暢,而且還會犯下建模師纔會犯的錯誤,響應時間也比較長。

另外,還有眼尖網友發現Kaedim在招聘啓事上有這樣的要求:應聘者在接到客戶要求後15分鐘內,能夠製作出“低質量”3D圖像。

種種跡象表明,Kaedim產品背後可能是人工主導,而非AI。不過,Kaedim方面此前一直矢口否認。

後來,技術門戶網站404 Media發佈一項調查顯示,Kaedim產品背後藉助了大量的人工操作。有的3D建模全部由人類完成,沒有使用任何AI。

調查還指出,Kaedim從世界各地招聘衆多建模人員,全天候待命爲用戶服務。這些建模人員所得報酬僅爲每個模型1美元~4美元,而Kaedim向用戶收取的費用達到15美元。

這樣來看,Kaedim並非屬於AI圈,而是屬於外包圈。

在調研報告和用戶輿論的高壓下,Kaedim最終承認人工參與了3D建模工作,原因是產品質量遠達不到實用,需要人工去不斷調整修正。

前不久,Kaedim又發佈新產品幫助用戶3D建模,這次它只是說明新產品旨在:

增強而不是取代建模師。

求生欲滿滿。

很多用戶其實很納悶,明明都是科技巨頭或者明星創業公司,可以做點坦蕩大氣一點的事,爲何在打造AI產品上要“掛羊頭賣狗肉”呢?

這要從當下的AI競爭環境說起。

爲何要“掛羊頭賣狗肉”?

對於大部分科技企業而言,AI無疑是新的風口和掘金地。不過,這片掘金地裡的競爭是極爲殘酷的。

在頭部的科技企業行列,你追我趕的角逐態勢愈演愈烈,競爭更加白熱化。微軟、蘋果、谷歌、Meta、亞馬遜等幾大科技巨頭中,微軟憑藉手握OpenAI這張王牌和微軟雲的充沛算力,走在隊伍前列。

谷歌正通過大模型重塑旗下所有業務,跟微軟在AI上的明爭暗鬥從未停止。Meta很早就在AI上進行佈局,實力不俗。蘋果如今放棄造車,也要全力進軍AI。

反觀亞馬遜,其坐擁AWS這樣的老牌雲廠商,卻沒有在此次生成式AI浪潮中做出驚豔的成績,市場對亞馬遜的AI能力存在一定的擔憂。

爲了在AI浪潮中成爲衝在前列的弄潮兒,亞馬遜的步子可以說邁得相當大,在各個領域都想嘗試,但在部分領域走得過於激進,零售板塊裡的“Just Walk Out”就是一個典型。它用在小型商店尚可,用在大型商超很難落地。

吹出去的牛不好收回,只能用人工替代人工智能硬扛了,反正地主家餘糧夠多,試錯成本低。

不過,對於Cognition這樣的AI初創企業來說,試錯成本越來越高。

風投公司Theory Ventures調查數據顯示,在所有AIGC公司中,95%的公司年收入平均還不到500萬美元,一些估值達到數億美元的初創公司甚至還未有收入進賬。

今年以來,AI賽道上賺錢難的問題仍在繼續。入不敷出的形勢下,一些AI初創企業開始承受巨大經營壓力,甚至走向被收購或者倒閉的結局。

比如,此前不屑於賣廣告,並且批評谷歌廣告太多的AI搜索引擎Perplexity,最近也迫於經營壓力賣起了廣告。

主打AI個性化新聞推薦的Artifact,一度成爲市場焦點。但是由於始終未能找到足夠多的受衆,導致其業績不振現金流告急,無奈在今年1月關停,前不久被雅虎收購。

在趨於嚴峻的行業形勢下,AI初創企業首先要做的是吸引資本、備足糧草,保證現金流安全。然而,經歷狂熱期後,資本對於AI初創公司的態度逐漸趨於冷靜和理性。

研究機構CB Insights發佈《2023年人工智能(AI)行業現狀報告》,2023年全球AI初創公司融資總額比2022年下降10%,融資交易量創下了自2017年以來行業新低。

當資本變得愈發有限和理性,要想獲得投資機構的注意,就必須會講故事,讓資本覺得有利可圖。哪怕這個故事是摻了水分的。

Cognition,就是很會講故事的那一個。

自其宣佈推出全球首個AI程序員後,就吸引了大量資本注意。華爾街日報報道,今年3月31日Cognition在與投資者洽談,目標以最高20億美元的估值募集資金。

要知道,Cognition剛剛宣佈完成A輪融資,估值僅爲3.5億美元。如果新一輪融資完成,Cognition估值在幾周內就翻了6倍,堪比火箭速度。

可見,Cognition不一定掌握了AI的核心技術,但一定掌握了吸引資本的能力。

歷史似乎總是輪迴的。

21世紀這些科技企業“掛羊頭賣狗肉”的神操作,在18世紀也同樣上演過。當時,有人發明了一種能夠自動下棋的機器,被稱爲“土耳其行棋傀儡”。這個機器在歐美地區打敗了許多棋手,吸引眼球的同時賺得盆滿鉢滿。

結果,幾十年後人們才發現機器裡藏着一位真正的棋手。

幾百年過去,科技在進步在改變,但人類賺錢的方式卻沒怎麼變。