宋繼強:20年後來看今天 人工智能還是早期階段

本站科技訊12月17日消息,由中國人工智能學會主辦,本站科技承辦的2016中國人工智能產業大會暨第六屆吳文俊人工智能科學技術獎頒獎盛典今日在深圳登喜路國際大酒店舉行。

本次大會以“AI新時代·產業新動能”爲主題,會上英特爾中國研究院院長宋繼強發表名爲“英特爾人工智能賦予明日精彩體驗”的主題報告,從英特爾佈局人工智能產業的大背景,詳解人工智能時代面臨的新挑戰和發展機遇。

宋繼強認爲人工智能雖然已經發展了60年,但如果再發展20年後來看,今天的人工智能仍然是處於早期階段,從以下三點可以看出:第一,人工智能的應用是否已經普及到各行各業,而不僅僅是在一小塊產業裡去提供價值,這是技術應用的廣泛度。第二,人工智能是否已經有標準,不管是國家標準還是行業標準,是否已經有標準開始在制定和落地。第三,人工智能是否已經有專用的硬件開始在市面上使用,這也是比較重要的。

宋繼強認爲人工智能雖然已經發展了60年,但仍處於早期階段,從以下三點可以看出:第一,人工智能的應用是否已經普及到各行各業,而不僅僅是在一小塊產業裡去提供價值,這是技術應用的廣泛度。第二,人工智能是否已經有標準,不管是國家標準還是行業標準,是否已經有標準開始在制定和落地。第三,人工智能是否已經有專用的硬件開始在市面上使用,這也是比較重要的。

宋繼強同時還表示,雖然人工智能還處於嬰兒期,但是人工智能市場的參與者還是有很大機會,英特爾將在英特爾會在智能製造、智慧零售、無人駕駛、精準醫療、智慧城市、互聯網金融、體育等方面爲用戶提供各種支持。

最後,宋繼強提到英特爾在收購Nervana後成立的人工智能學院,將聯合人工智能的行業領袖和學術精英,不僅爲用戶提供計算、存儲等底層硬件的支持,還將提供平臺應用層的解決方案,更廣泛地支持行業裡各種開源的深度學習框架,爲開發人員和科研人員提供平臺支持,通過主流應用平臺來共同提高人工智能推動行業應用的普及率和速度。(Sherwood)

以下是演講實錄:

非常感謝楊校長的介紹,給我們鋪了一個很好的路。咱們知道人工智能最近是一個非常非常火的詞,從通過人工智能去玩遊戲,到通過人工智能下象棋,從無人駕駛到智能機器人,這些都是人工智能非常火的。我們知道人工智能突然變到一個非常高的高度,實際上跟數據是有很大的關係。我們知道目前來講,我們處在一個數據的洪流中,到2020年會有500億的智能設備連入互聯網,這其中包括我們個人使用,也包括我們日常生活的周遭,環境中車裡面,我們去的醫院裡,我們的交通工具,我們所需要的產品工廠裡面,他們都在大量使用智能設備,這些智能設備會產生各種各樣的數據,這些數據促使了我們有更好的數據去訓練人工智能的算法,同時這些數據也可以讓我們通過訓練好的人工智能算法,產生更大的增值價值,這也是爲什麼人工智能吸引了這麼多的科研人員和企業,大家一起把資源貢獻出來。如何把握好人工智能的應用,跟怎麼能夠駕馭這個數據的洪流非常有關係。我們認爲,這裡面的關鍵是怎麼搞好端到端的集成,因爲我們知道,那麼多不同種類的設備,他們個頭有的很小,有的很大,他們採集來的數據種類很多,通常不是傳統的結構化數據,是非結構化的數據,你怎麼樣能夠很好的利用雲端和終端協同計算能力和他們之間無縫並且高速的傳輸能力、存儲能力,構建端到端的解決方案,構成一個良性循環。也就是我採購了數據,做了處理,我送到了雲端以後,在雲端繼續分析它,去提取出中間有用的價值,並且能夠有一些是可以增值,讓終端更智能的再下發到終端,這樣一個反覆的循環,是一個最優的途徑,這是我們深刻相信的未來的場景。

同時,英特爾也在爲這件大事在進行佈局,我們從終端到雲端,包括中間的通訊鏈路、存儲都有解決方案,我們收購了前端的視覺芯片深度學習公司,也有在雲端,這種專門根據人工智能做定製芯片加速的公司,後面我會逐步介紹一下。

目前我們知道人工智能已經發展了60年,現在很火,但是20年後再來看,歷史的發展長河裡面,仍然處在一個早期階段。我們怎麼看一個技術是否已經達到了成熟階段?至少有三個點可以看。第一,看它的應用是否已經普及到各行各業,還是你只在一小塊產業裡去提供價值,所以一個是應用的廣泛度。第二,是否已經有標準,不管是國家標準還是行業標準,是否已經有標準開始在制定和落地。第三,是否已經有專用的硬件開始在市面上使用,而且第三點也是比較重要的,大家知道做硬件,第一個花錢,第二個週期長,產業沒起來之前,硬件廠商是不會鋪進去的。ROBERT是我們的創始人之一,也是硅谷之父,他很早就研究腦科學,那時候的計算機技術都用來建模腦,看看人腦是怎麼工作的,反過來,怎麼利用我們在腦科學上得到的一些認知和新奇的想法,去促進計算機科學或者計算架構的發展,爲這個領域提供更好的計算能力,這也是我們新的考慮。

通常我們在做硬件的時候,必須要走這樣的過程,拿深度學習做一個例子,比較複雜,我們訓練出一個深度學習模型,是一個很廣很深的模型,這樣的一個模型,直接變成一個硬件,是不太可能的,而且也是低效的,高效的辦法是什麼?我去分析這個模型,我必須找到懂這個模型的人,懂我爲什麼產生這種模型,然後把這個模型通過硬件的描述給描述出來,然後我產生硬件的抽象,抽象出裡面的數據流,數據是怎麼流的,中間的流水線上有哪些重要處理模塊,他們各自的時間、帶寬要求是怎麼樣,有哪些計算的語言,就是裡面的計算內核是非常重要的,而且是否大規模運行和反覆運用的機會。在這樣的基礎上,在怎麼做硬件芯片有很好的認識,同時我們看哪些放在硬件裡面固化,哪些讓他去靈活使用,有這樣的認知以後,我們纔到了第三步,可以產生出一個針對這種工作,這種工作負載優化的硬件,這個硬件也不是很快達到要求,一個很有用的例子,大家都很熟悉的就是,我們做視頻加速芯片,你會看到從早期的標準以後,一代一代過來,每一代都有專用芯片,都是有專用的認知,但這個過程是一樣的,如果這個產業真的發展到了一個普及,到各行各業都要去使用,那這個行業就需要專業模型,而不是在通用的芯片上做模擬,這還屬於學科界的研究範疇。

現在看到做人工智能的應用,或者說部署人工智能的計算在雲端還是很少,通過英特爾的分析,現在是雲端提供絕大部分的計算資源的,目前這部分的份額還是在10%,還是比較少,但是這一塊是非常大飛速發展的,但是到2020年,AI計算量將會增長12倍,我要節省電力、體積和資源,這都是重要的,所以我們要不斷推動技術創新,我們不能停留在今天這個階段,後面有更多的優化方案等着我們。

從我們做人工智能的分析來看,因爲英特爾不是人工智能專家,但是我們跟很多學界一起合作,也有一個對人工智能分類的認識,人工智能從在學術界開始,定義學科來講,它的目標是爲了讓機器具備人的智能處理的能力,剛好跟徐揚生院士講的第一條非常相似,哪些能力很重要?三大能力,感知能力、推理能力和行動能力,這三大能力是決定了你這個機器人能不能根據外界環境,做一個很好很智能的決策,同時把他反饋到外部世界,而且比較穩定。另外還有一個徐院士沒有講到的,就是適應性,而不是這個設計好了就只有當初的能力,而是要有適應不停變化的環境,要有持續的學習,自主的學習,不斷增強的能力,這裡橫向化的內條非常重要,記憶是目前大家還想得比較少的,但是在一個真正的自主系統裡,能夠讓人去滿意使用它的話非常重要,它實際上是讓你能夠把感知推理行動串起來,去適應新的環境。下面這個就是具體的方法工具,這麼多都是專家學者,就不需要多講。首先要有大量的數據,才能把知識和規則提取出來,才能爲我們所用,處理新的數據。第二類是知識驅動,不在乎你有多大的數據,可能用很少的數據,但是那些數據非常關鍵和精準,你只要從小數據裡,就能推出一個完備的系統,能夠做事。所以這兩塊,是應該齊頭並進的,不能說哪一塊優於另外一塊,而是應該互相結合的去做。

深度學習目前來講非常火,他火的原因是什麼?因爲最近這幾年,我們首先有大量的數據,像ImageNet,提供了大量的數據,計算的能力也大幅提升,我們知道摩爾定律在過去這些年給我們提升更多的計算能力,存儲能力也大幅度提升。過去二十年來,我們的計算能力提升了上百倍都不止,我是90年代讀大學的,用的是286,386,現在二十年後,是百倍級的提升,機器你的主屏強,內存小,性能還是不夠。1995年的時候,一個GB的存儲一千美金,現在0.03美金,這都是通過過去的摩爾定律推動到現在,纔有這個爆發點。這個爆發導致我們可以通過深度學習,在某些領域取得比較大的突破,有些領域比如說做視覺識別,特定的人臉識別,已經可以超過人,他犯的錯誤比人的少,因爲人是生物,人會疲勞,人會走神,機器不會。所以目前在語音的識別和視覺的物體識別兩個領域有非常大的突破。我們也看到了這個突破,通過深度學習可以通過增加它的訓練數據增加性能,意味着我要增加訓練能力,來支持這些訓練,而不是把數據增加一百倍,把訓練時間增加一百倍,我增加這些處理數量,是希望大幅度縮減我的訓練時間,但是光增加處理數量行嗎?不行,你會遇到一個平臺,因爲處理器與處理器之間需要有通訊,這些通訊有時候是數據通訊,有時候是控制通訊,當你通訊的瓶頸達到的時候,你再增加處理器,你也縮短不了。所以這就是目前來講,爲什麼你在使用某些架構的時候,你再增加處理器,也不見得訓練時間減少了,而這時候需要有更高效的技術,能夠同時增加你計算的密度,同時也能夠大幅度增加你的通訊帶寬,這樣才能達到線性的增長。

Lake crest是今年剛剛發佈,是今年11月份剛剛對全球發佈的英特爾的代號,這個代號是專門爲深度學習定製的一款芯片,這款芯片有幾大特色。第一,它裡面的運算設計是爲了深度學習量身定製,同時它的計算密度也非常高,這個待會兒也會講到。第二,它把數據訪問,剛纔我們講到的多節點之間的數據訪問的瓶頸,給優化掉了,並且能夠支持高速的內存,這個高速內存是使用HBM2的內存,直接分裝在一個芯片的裡邊,所以這樣的效果是非常的好。這樣會給我們帶來什麼好處?我們知道,在做深度學習訓練的時候,即使你的模型,我們知道人工智能做神經網絡的時候,它的每一個節點裡面既有計算也有數據,而且數據有的還是浮點的,希望是每個計算節點有自己的內存接口,這個要求還不是那麼容易滿足,現在我們可以通過這個硬件技術支持到這一點,你有了這個支持,意味着我首先設計的模型,我在做很多算法訓練的時候,我的尺寸大小不受太大的限制。因爲很多人在初始設計的時候不考慮功耗,不考慮代價成本,去做出來,但是這時候是需要允許你去做這麼大模型的平臺的,同時IO增加,你也可以知道是多少增加,所以我們可以很好支持新模型的探索,這是怎麼實現的呢?

這是它的一張架構圖,中間那些綠色的實際上是計算處理單元,提供了我們稱爲基於張量架構的單元,我們做很多塊運算,張量計算架構可以很快速直接進行快運算,比用處理器快很多,而且我們看到這裡面有個Flexpoint技術,以前有定點數,有浮點數,但這都是固定的告訴你,你用了多少,Flexpoint是介於這兩者之間,是可以動態變化的,也就是你在做的初期,你不需要那麼高的精度,你可以用廣的精度做,運算到後期,你需要越來越多進度的時候,再增長爲它提供很好計算的密度。同時還有一個好處,這四個黃塊,是直接就在一個芯片裡面分裝在一起,有各自獨立的IO接口,而且距離主芯片非常近。第三個好處,我設計了一款芯片之後,其實總值是有一個上限,怎麼樣去突破這個上限,你是否能容易構成節點。這上面的藍塊ICL,是私有定製芯片間的通訊鏈路,這個鏈路的速度非常快,帶寬也很高,而且它的12個意味着什麼?一個芯片可以跟12個芯片連接,可以構成一個12維的超網絡支持你的運算,現在大家可能還用不到這麼多。這就是它有一定靈活性的深度學習計算的架構。

這是我們收購了很多公司帶來的新技術,我們之前的技術仍然存在,包括至強融核的技術,去做通用計算的加速。Arria FPGA可以做在功耗和性能優化的情況下做加速,這也是非常好的,這在2016年就有。2017年,這些繼續往前推進,同時我們會增加在特定優化的時候,增加Lake Crest架構,我們會把這些人工智能的硬件和方案統稱爲Nervana平臺產品組合,這是我們的商標,而不只是收購過來的一款芯片。

有了硬件,我們還要注意,不能放鬆對算法的研究,因爲硬件很好,但是你可以用很爛的算法把它用得很差。所以在這裡,英特爾內部也和外面的學術界一起合作,在這幾個前沿的領域在快速推進深度學習領域的算法和研究,這裡麪包括我們怎麼更快的訓練,怎麼更好的利用少一些的數據和少一些的監督,去達到訓練的特性,並且我怎麼把記憶元素加進去,記憶其實是通過對歷史數據的一些分析和挖掘,找出來的開展的模式,這些模式是利用來大幅提高對訓練的指導。第二,怎麼把大模型稀疏化和修剪,因爲現在模型和參數非常多,千萬級別,上億級別的都有,這麼多裡面,有用的沒有那麼多,大量的是爲零的,爲零你還爲他存儲和計算不是浪費資源嗎?所以怎麼做好大量模型的稀疏化,重要的留下,讓我的硬件利用效率最高。另外就是我們看怎麼支持更大規模的計算,包括在雲端我們有更多的批量,可以同時做運算,在每個節點可以用更高階的方法做處理。

通過我們這些技術,我們可以大幅增加這些模型的並行化計算能力,到了2020年,我們要在英特爾這個軟硬件方案集成下,把訓練時間相對於今天這個節點提高到100倍。這是我們的目標。剛纔講的是雲端,雲端你訓練得非常好,這個模型有了,但是我們在使用的時候,大家接觸到的是終端的設備,我們怎麼在終端設備上去部署?去使用這些能力呢?這個非常重要,如果我雲端的東西做得非常好,我任何一個數據都需要終端設備採集送到雲端,再回來,只有對我們的網絡有非常大的依賴,對實時交互是不可以接受的。我們另外一個殺手鐗就是在終端這一側也有很好的硬件方案,我們最近收購了一家Movidius的公司,它的特點是我有一定定製度又保留了一定的可編程能力的硬件芯片解決方案,這個就是低功耗版本的解決方案,他們的平臺是比信用卡還小的板子,他們是可以把開源的這兩個比較主流的訓練出來的模型,通過他們的Fathom工具轉化成嵌入式的深度學習模型,放在他們的硬件上很好的運行,硬件裡面的東西也很多,有兩個亮點。第一,上面這些橘黃色的塊,是一些做好的硬件電路支持某些功能,這是不變的。另外可以編程是底下的SHAVE,它是一個流式的處理器,而且是混合架構,是很適合你去處理一些需要變的工作,而且更好的是因爲它部署在前端,前端有時候工作量大,有時候小,這12個單元可以各自它上不上電,現在只用6個的話,可以把另6個關掉,不費電。

終端嵌入AI的優勢,有更高能效,更低寬帶需求,同時,延遲更少了,對存儲開銷也少了,容錯連續性也好了。

剛纔講的主要是深度學習,推理這一塊也很重要,而且是未來越來越依賴它,降低對大數據的依賴,因爲在現實生活中不可能各個應用都有大數據,我還是需要一些人的支持,逐步去個性化收集來的記憶,一些規則,去做對人工智能應用的增強。

我們也有一個Saffron的方案,這在美國還是比較有名氣,它是一個自然智能平臺,主要的特色,這個公司的主要能力,英特爾收購他之前的能力,是給波音這種大企業提供一些零件維修庫,你這個零件壞了,還有什麼零件可能很快就要壞了,你可能每年要定時間去檢測幾個東西,是預防性的提供很多知識支持,他們有一個自己獨特的,能夠去記錄很多事件的數,這個數據庫不光可以去很好記錄這些事件,分門別類做表述,同時在上面也有統計量,這樣可以利用機器學習、數據挖掘的辦法,提取出你稱之爲記憶的東西,怎麼找出它的相似性和關聯性,相似性可以做一些自動的分類,關聯性可以用來去看,什麼是一些趨勢、規則、模式也好,利用這些趨勢,我們就可以做預測了,我看到了前面這個事情發生,我就知道後面這個事情在未來的什麼時間點很有可能發生,如果發生了,那就是預測成功,如果沒發生,這又做成一次異常。比如說你吃藥的這個動作,你這時候吃藥是對的,如果你沒吃,就是一個異常,就要提醒你。所以它實際上是在提供基於記憶的一整套方法。

剛纔講的都是一些技術,對於市場來講,AI的整個市場仍然處於嬰兒期,想投身於利用AI做後面的各種產業的公司和學者來講,時尤未晚,還有很多事情可以做。目前從英特爾看來,我們覺得會重度利用AI的行業零用有這麼幾個,一個是智能製造,會對AI有很大的需求,它的數據量產生得太多了,第二是智能零售,這裡面有人消費的記錄,也有商品之間關聯被購買的信息,有很多的數據。無人駕駛也是非常大的一塊,英特爾把無人駕駛也是提升到很高的高度,我們認爲無人駕駛是幾年後一個最大的智能平臺,這上面可以承載很多種不同業務,但是首要是要把車做出來,讓它安全可以用,這裡面也會用到很多人工智能技術。同時精準醫療、智慧城市、互聯網金融、體育這一塊,都是非常多擁有人工智能的。

舉兩個例子,一個是零售,我們知道零售業是端到端的產業,從生產、倉儲到中間你去發佈一些廣告做推銷、推廣,去看用戶體驗的反饋到把貨物最後送到客戶手裡,這是一個很長的鏈條,而這整個鏈條裡都有人工智能可以去做加速的地方,在今年的雙十一我們和京東聯合一起在幾個方面做了一些試驗,發現這個效果還是很好,這裡還沒有用到之前說的至強融核的新東西,就是在英特爾至強處理器上做優化,一方面是在非法檢測圖片應用性能提升了4倍,圖片版權保護應用也提升了2倍,這是在智能零售這個行業有很好的應用,而這只是冰山一角而已。在另外一個領域,這是全球性的領域,而且英特爾發現在中國區有很好的市場可以做。在醫療行業其實也是數據非常多的行業,爲什麼說中國區有很好的機會呢?華大基因有很好的基因測序工作,而且這個工作目前來講在全世界是領先的,甚至在很多地方,像美國做得更好,因爲美國的監管還是很多的。英特爾的目標是把精準醫療這件事情大幅縮短使用週期和成本,現在我們知道,如果你有了一個類似於癌症的,要去給你定製一個個性化醫療方案,找到你需要的藥物,不光要花不少的錢做基因測序,至少1500美金,同時你要等一星期,這個結果才能出得來,我們的目標是到2020年,和這些行業夥伴一起,把這個時間縮短到一天,價格也大幅下降,這一天裡面,你做了基因測序,做了你的分析,把你的其他醫學影像處理業分析出來,根據這些數據做個性化診療,給你一個個性化的醫療方案,一天24小時搞定,這個對於大衆來講有非常重要的意義,這也需要很多的AI幫助去做。

目前英特爾推出了Nervana人工智能學院,我們是和全球領先的行業,行業的企業領袖和學術界的重要教授們一起合作,這裡面除了硬件方面的支持之外,還會給大家展示怎麼樣做解決方案,這個解決方案一定是端到端平臺支持的,不能只給他提供一個模塊,因爲這個模塊用戶很多不知道嵌入到系統裡怎麼弄,怎麼弄做到最好,所以端到端的方案是非常有用的。同時,你要對這個算法有一個廣泛的支持,你要能夠適應新算法,因爲我們知道,深度學習也好,人工智能也好,由於大量的精英人腦進來,算法更迭速度是很快的,通常一個星期就有一些新算法出來,你怎麼支持到這些廣泛算法,同時你要想到這是軟硬件系統的事,不是一個硬件公司自己推動,要結合產業界很多做軟件的思路,也要把它提供出來,跨行業合作。

爲了能夠更廣泛支持行業裡的各種開源的深度學習框架,我們通過Nervana做跟硬件無關的適配,可以利用它的圖編譯器。深度學習SDK是可以幫助到幾個層面的人,一個是你在訓練的時候,數據科學家可以利用SDK去分析哪些數據比較有用,怎麼產生一個好的模型,同時我們可以支持到,它不是深度學習的專家,他怎麼把好的模型整合到方案去,並且最終我們支持在部署裡很方便測試,去看部署以後的效果,並且形成一個好的迭代。在這幾個方面都是我們非常想去整個生態一起合作供應的事情,對英特爾來講,我們主要提供的是兩層東西,最底層就是我們的硬件支持,我們會長期提供各種層級的硬件支持,端到端的,而且不只是計算芯片,包括了存儲,也包括了網絡方面的能力。第二是我們會提供一箇中間層,保證現在開源的一些東西,在我們的底下的平臺上可以很容易使用起來,不會增加現在開發人員、研究人員重新學習平臺的負擔,有這樣的支持以後,我們相信再往上去做幾個比較主流的行業應用的時候,大家會更得心應手,也會提高整個人工智能去推動行業應用的普及率和速度。

希望大家有時間都去看一看我們的人工智能學院,這是最近纔開始上線的,裡面逐步會有更多東西放出來,也希望大家多關注英特爾在這方面的動向,我們既然承諾了到2020年要提升100倍,也歡迎大家來監督我們怎麼實現它,謝謝大家。

AI新時代-產業新動能,【點擊報名】參加2016中國人工智能產業大會,搶佔通往未來的年票!(如無法點擊請打開網址dwz.cn/4BYwdQ)