沒有什麼能攔住生成式AI落地了
題圖|視覺中國
經歷過年初大模型風口的狂熱之後,越來越多從業者意識到,生成式AI的商業化落地並不如預期中順利。
在工業、金融、醫療、教育等行業,生成式AI都擁有足夠的想象空間,但很多企業在面對新技術時的第一反應卻是保持觀望。尤其在傳統行業,一些企業主在面對生成式AI和專業人員的選擇題時,他們更願意選擇人工。
技術門檻是企業用戶對生成式AI保持謹慎的主要因素之一。這些垂直行業的企業對本行業的理解非常深刻,但從0到1開發AI應用並不是他們擅長的,這個過程中還存在數據安全和隱私等問題,背後的挑戰和風險都讓他們難以放開手腳。
成本是企業用戶保持謹慎的另外一個因素。大多數企業每年的IT支出都是根據企業已有業務規劃好的,而企業固有的IT基礎設施,在大模型時代,很難支持需要大算力、大存儲的生成式AI應用,自然也就無法應對突然增加的生成式AI業務需求。再加上全球缺“芯”潮的影響,訓練、推理的算力成本不斷上漲,企業使用生成式AI的成本難以控制,他們只能觀望。
在多重不利因素影響下,生成式AI在垂直行業的商業化落地比較緩慢,一些從業者甚至開始質疑當下生成式AI技術是否具備賺錢的能力。
其實大可不必。困難和挑戰都是暫時的,生成式AI只要突破技術和成本的瓶頸就會獲得快速落地的機遇期。當下,掃清生成式AI落地障礙的關鍵就在於降低開發AI應用的技術門檻和成本,而以亞馬遜雲科技爲代表的雲計算企業率先給出瞭解決方案。
在生成式AI落地應用過程中,一個值得關注的現象是,IT基礎設施比較固定的“雲下”企業更爲普遍地陷入技術和成本困境,這些企業以傳統企業爲主。相比之下,用雲程度比較高的企業試錯成本更低。
差異背後的主要原因就在於技術積累。在企業數字化的進程中,用雲程度比較高也意味着對新技術的接受程度比較高,對各項技術能力的積累也比較多,而以傳統企業爲主的“雲下”企業則與之相反。開發生成式AI應用,需要的技術能力比“上雲”更爲複雜,技術積累薄弱的傳統企業面對的挑戰也更爲棘手。
如果把生成式AI應用開發看作一個複雜拼圖的組裝,其需要的數據科學、機器學習、編程等每一項技術能力就相當於拼圖的每一塊。沒有技術積累的企業理解這些拼圖塊本身就已經是很困難的事,將它們組合在一起就變成了一項更爲艱鉅的任務。但如果有服務方能給這些技術能力薄弱的傳統企業提供一些預拼好的拼圖部分,這些傳統企業就能夠更容易、更快速地完成整幅拼圖。
亞馬遜雲科技正是採用這種思路來降低技術能力薄弱的部分企業開發生成式AI應用的門檻,讓他們獲得AI應用快速落地的“超能力”。在2023亞馬遜雲科技re:Invent中國行北京站巡展日上,亞馬遜雲科技公佈了多項新服務、新功能和新應用來降低企業的開發門檻。
亞馬遜雲科技大中華區產品部總經理陳曉建
具體來說,亞馬遜雲科技在推出一套新的生成式AI基礎設施,由基礎設施層、基礎模型服務層和AI應用層三層技術堆棧組成。堆棧第一層是存儲和計算的革新,屬於底層基礎設施,包括機器學習訓練設計的雲端AI芯片Amazon Trainium2,以及第四代自研服務器CPU芯片Amazon Graviton4。而堆棧第二層Amazon Bedrock平臺以及第三層的Amazon Q分別從基礎模型服務層和AI應用層降低企業用戶的開發和使用生成式AI的成本。
Amazon Bedrock服務爲企業用戶搭建生成式AI開發的“快速通道”。在大語言模型開發過程中,模型本身不擅長跨公司系統和數據源執行具體的任務,企業的開發人員必須編寫代碼來協調模型、系統和用戶之間的交互,以便應用程序可以按邏輯順序執行一系列 API 調用,同時還要制定數據安全和隱私策略,這些步驟非常耗時且需要專業知識,都會增加生成式 AI 應用程序開發的時間成本。Amazon Bedrock把這些複雜的過程標準化,企業用戶甚至不寫一行代碼就可以完成部署。同時,企業用戶可直接利用Amazon Bedrock調用Amazon Titan Family、 Anthropic Claude 2.1、Meta Llama 2 70B和Stability AI Stable Diffusion XL 1.0等幾乎所有業界領先模型的最新版本,以及構建生成式AI所需要的廣泛功能。
在應用層,亞馬遜雲科技推出了企業級生成式 AI 助手 Amazon Q。在Amazon Q的幫助下,企業用戶無需去浩如煙海的工作文檔中檢索和業務相關的各種數據,而可以直接通過問詢實現。比如,開發者可通過問詢Amazon Q查詢其他工程師的代碼來維護應用程序。
同時,Amazon Q具有非常大的靈活性。當前,開發者爲跟上生成式AI技術迭代的速度,快速設計和交付新功能,管理應用程序和工作負載端到端的生命週期,並在維護既有產品和構建新功能之間平衡優先級,往往需要投入大量的精力,做大量的工作。Amazon Q完全支持根據客戶業務定製,以幫助企業級開發者專注於開發本身。
簡而言之,亞馬遜雲科技通過多個產品和服務爲想要開發生成式AI應用但面臨種種挑戰的企業提供了開箱即用的工具和服務,包括機器學習、大數據分析以及應用開發環境等,把原本複雜的生成式AI應用開發標準化與模塊化。只要企業有意願開發生成式AI應用,各種複雜的技術問題,不再是阻礙他們行動攔路石。
從生成式AI應用在垂直行業已有的落地應用看,性價比問題是企業繼續擴大應用範圍的最大障礙。
比如在營銷行業,成本的大頭主要來自營銷素材製作。生成式AI可將一條營銷視頻製作的時間從10小時縮短至5分鐘,相當於效率提升了上百倍,但視頻素材中使用的數字人成本從客單價百萬元到千萬元不等,超寫實數字人視頻成本則在萬元/秒左右。綜合覈算下來,使用生成式AI製作的視頻營銷素材成本未必比人工製作低。
這背後,一方面是生成式AI平臺的訓練、推理本身非常燒錢,這些成本最後都由應用方買單。當下最熱門的生成式AI平臺ChatGPT單次訓練成本就高達140萬美元,用知名計算機專家吳軍的話來形容,就是“ChatGPT每訓練一次,相當於報廢了3000輛特斯拉汽車。”
在鉅額成本中,算力佔最大頭。因爲大模型的火爆,算力在今年成爲了稀缺品,主要原因就是提供算力的GPU產能無法跟上需求,價格持續暴漲,這相當於又額外增加了生成式AI的訓練成本。
在生成式AI成本和收益的鴻溝之下,亞馬遜雲科技試圖通過在自研芯片、存儲、無服務器等方面的創新重塑雲計算的成本結構,讓算力更有性價比。在芯片上,其中,亞馬遜雲科技採取自研以及和英偉達合作“兩條腿”走路的模式,降低芯片短缺帶來的不確定性,以優化成本。
其中,Trainium2芯片專爲具有數萬億個參數或變量的基礎模型和大語言模型而構建,第一代Trainium芯片相比,性能提升4倍,內存提升3倍,能源效率(每瓦性能)提升2倍。而在和英偉達的合作上,亞馬遜雲科技成爲第一家在雲端配備英偉達GH200 Grace Hopper超級芯片的雲廠商,雙方合作的平臺可讓共同客戶能擴展至數千個GH200超級芯片。
亞馬遜雲科技在re:Invent 2023上推出的處理器Amazon Graviton4、雲存儲服務Amazon S3 Express One Zone以及三款無服務器服務創新,均可幫助企業用戶實現高性價比的目標。和上一代產品相比,Amazon Graviton4性能提升高達30%,獨立核心增加50%以上,內存帶寬提升75%,Amazon S3 Express One Zone數據訪問速度提高至多10倍,數據請求成本降低50%。
企業用戶追求應用的穩健性、經濟性、安全性和可用性,這和大語言模型等生成式AI在訓練過程中不惜花費高昂算力成本達成更高的能力是完全不同的路徑。面對企業用戶更爲務實的需求,亞馬遜雲科技試圖通過重塑雲計算的成本結構,從平衡成本和收益的角度提升生成式AI的實用性,滿足企業用戶的需求。
從國內市場真實的情況來看,生成式AI的發展既不像年初追風口的從業者預估的那樣樂觀,也沒有唱衰者形容的那麼悲觀。
這背後一個核心的問題是,在想象空間更大的企業級生成式AI領域,最重要的不是大模型能力有多強,而是如何能夠從基礎模型演變成各個領域中的具體應用,從而賦能整個經濟社會的發展。
在生成式AI從技術能力轉化爲具體應用的過程中,作爲雲計算企業的亞馬遜雲科技提供了一個破解現有難題的思路。簡單來說,亞馬遜雲科技通過自研芯片提供更好的性價比通過各種豐富的計算、網絡、存儲等各種產品的組合應對突發的算力需求,通過Serverless有效降低運維的複雜性,從而簡化算力的使用,全面滿足用戶的多樣化的算力需求。
作爲支撐算力的底層平臺,亞馬遜雲科技提供的解題思路也給國內生成式AI的發展模式提供了一個更爲清晰可行的路徑:作爲底層算力支撐的雲計算企業,可以爲生成式AI應用的落地掃清技術和成本障礙,在加速行業發展的同時,也讓自己獲得更多商業收益;模型層公司專注於生成式AI能力的訓練,通過開源的方式構建開發者生態;真正通過生成式AI賦能經濟社會發展的應用層公司,可以把更多精力放在自己的業務領域,去思考如何讓生成式AI爲工作和生活帶來更多便利,而不用花費太多精力思考如何用更低的成本以及更先進的技術實現其想法。
更通俗地說,作爲一個新物種的生成式AI能夠快速落地,關鍵在於產業鏈上各個環節的企業各司其職、協同配合,即專業的人幹專業的事。
比如,整合營銷和技術服務提供商電通致力於把生成式AI等新技術和營銷、諮詢整合起來爲客戶提供服務。在應用新技術的過程中,電通通過Amazon Bedrock的企業級控制能力和部署第三方模型能力讓新技術快速被營銷人員所用,爲客戶打造創新機遇;AI 客戶關係管理(CRM)平臺Salesforce的開放模型生態戰略通過Amazon Bedrock落地,能夠將模型與客戶的數據無縫整合,並集成到Salesforce工作流程當中,讓模型落地變得前所未有的簡單、快捷。
在各行各業企業客戶應用生成式AI等新技術的過程中,亞馬遜雲平臺通過三層技術堆棧的創新設計讓新技術在業務落地變得更高效便捷,而相關企業只需要把精力更加集中在自己的業務端。可以預見,未來將有更多的企業通過這種模式把新技術落地,讓原有業務獲得新的發展機遇。
當企業級生成式AI面臨的技術和成本障礙被掃清,相關的應用勢必將迎來爆發式增長。根據中信建投的測算,生成式AI在國內的市場空間超過1000億元。其中,生成式AI在工業、自動駕駛、醫療等領域的想象空間巨大。如果生成式AI商業化落地的障礙被掃清,這個領域的發展有望呈現早期移動互聯網的繁榮景象——衆多應用層創業公司涌現,人們日常工作生活的各種痛點將被解決,生產力和生活的便捷程度將進一步提升。
在巨大的想象空間之下,亞馬遜雲科技已經在積極行動幫助各類企業解決生成式AI落地過程中的實際問題。除了北京站的活動之外,2023 re:Invent中國行城市巡展活動還將覆蓋上海、廣州、深圳、成都、青島、南京、西安、杭州、長沙 9座城市。亞馬遜雲科技大中華區產品部總經理陳曉建在北京站巡展日上明確表態,希望通過這些技術創新,幫助更多企業加快創新速度,利用生成式AI重塑未來。