第773章 馬芸:我還有話說!
葉風講的雖然淺顯易懂,但確實精彩萬分。
「數據處理,必須經過這幾個步驟,完成之後才會有智慧。」
此時台前的葉風,像極了傳教老師。
下面的眾人,像極了專心聽弟子。
「第一個步驟是數據收集。這裡有兩個方式,第一個方式是拿,專業點的說法叫抓取或者爬取,例如萬象搜索就是這麼做的,它把網上的所有的信息都下載到它的數據中心,然後你一搜才能搜出來。比如你去搜索的時候,結果會是一個列表,這個列表為什麼會在搜索引擎的公司裡面呢,就是因為他把這個數據啊都拿下來了,但是你一點鏈接,點出來這個網站就不在搜索引擎它們公司了。」
「比如說網易有個新聞,你拿萬象搜出來,你不點的時候,那一頁在萬象數據中心,一點出來的網頁就是在網易的數據中心了。另外一個方式就是推送,有很多終端可以幫我們收集數據,比如說華風智能手機上面的健康管理應用,可以將你每天跑步的數據、心跳的數據、睡眠的數據都上傳到數據中心裏面。」
「第二個步驟是數據傳輸。一般會通過隊列方式進行,因為數據量實在是太大了,數據必須經過處理才會有用,可是系統處理不過來,只好排好隊,慢慢的處理。」
「第三個步驟是數據存儲。現在數據就是金錢,掌握了數據就相當於掌握了錢。要不然別人怎麼知道你想買什麼呢?就是因為它有你歷史的交易的數據,這個信息可不能給別人,十分寶貴,所以需要存儲下來。」
「第四個步驟是數據分析。剛才說的存儲數據是原始數據,原始數據多是雜亂無章的,有很多垃圾數據在裡面,因而需要清洗和過濾,得到一些高質量的數據。對於高質量的數據,就可以進行分析,從而對數據進行分類,或者發現數據之間的相互關係,得到知識。」
「比如90年代盛傳的沃爾瑪超市啤酒和尿布的故事。」
葉風剛剛舉了一個例子,還沒說完,大家就會心笑起來。
在坐的各位,都是精英,基本上都聽過這個故事。
尤其是紅旗大賣場的總裁曹世茹,她知道在美國有一個有趣的現象:尿布和啤酒赫然擺在一起出售。但是這個奇怪的舉措卻使尿布和啤酒的銷量雙雙增加了。這不是一個笑話,而是發生在美國沃爾瑪連鎖店超市的真實案例,並一直為她津津樂道,常常用來教育下面的員工。
沃爾瑪擁有世界上最大的數據倉庫系統,為了能夠準確了解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行購物籃分析,想知道顧客經常一起購買的商品有哪些。沃爾瑪數據倉庫里集中了其各門店的詳細原始交易數據。在這些原始交易數據的基礎上,沃爾瑪利用數據挖掘方法對這些數據進行分析和挖掘。
一個意外的發現是:「跟尿布一起購買最多的商品竟是啤酒!經過大量實際調查和分析,揭示了一個隱藏在「尿布與啤酒「背後的美國人的一種行為模式:在美國,一些年輕的父親下班后經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班後為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。
葉風笑道:「即然大家都知道,我就不多說了,這就是通過對購買數據進行分析,發現男人一般買尿布的時候,會同時購買啤酒,這樣就發現了啤酒和尿布之間的相互關係,獲得知識,然後應用到實踐中,將啤酒和尿布的櫃檯弄的很近,就獲得了智慧,讓啤酒和尿布銷量雙雙大增。」
「第五個步驟就是對於數據檢索和挖掘。檢索就是搜索,分析后的數據放入搜索引擎,從而人們想尋找信息的時候,一搜就有了。另外就是挖掘,僅僅搜索出來已經不能滿足人們的要求了,還需要從信息中挖掘出相互的關係。比如財經搜索,當搜索某個公司股票的時候,該公司的高管是不是也應該被挖掘出來呢?如果僅僅搜索出這個公司的股票發現漲的特別好,於是你就去買了,其實其高管發了一個聲明,對股票十分不利,第二天就跌了,這不坑害廣大股民么?所以通過各種演算法挖掘數據中的關係,形成知識庫,十分重要。」
聽葉風說得很有邏輯性,眾人都點頭連連。
這時,又聽葉風講到重點,說起雲計算、大數據、人工智慧的密切關係。
「當數據量很小的時候,很少的幾台機器就能解決。慢慢的當數據量越來越大,最牛的伺服器都解決不了問題的時候,就想怎麼辦呢?要聚合多台機器的力量,大家齊心協力一起把這個事搞定,眾人拾柴火焰高。」
「所以說大數據平台,什麼叫做大數據,說白了就是一台機器干不完,大家一起干。隨著數據量越來越大,很多不大的公司都需要處理相當多的數據,這些小公司沒有這麼多機器可怎麼辦呢?」
「說到這裡,大家想起雲計算了吧。當想要干這些活的時候,需要好多好多的機器一塊做,真的是想什麼時候要,想要多少就要多少。在以後,一個小公司需要大數據平台的時候,不需要採購一千台機器,只要到晴風雲平台上一點,這一千台機器都出來了,並且上面已經部署好了的大數據平台,只要把數據放進去算就可以了。」
「雲計算需要大數據,大數據需要雲計算,兩個人就這樣結合了。」
「雖說有了大數據,人的慾望總是這個不能夠滿足。雖說在大數據平台裡面有搜索引擎這個東西,想要什麼東西我一搜就出來了。但是也存在這樣的情況,我想要的東西不會搜,表達不出來,搜索出來的又不是我想要的。例如音樂軟體裡面推薦一首歌,這首歌我沒聽過,當然不知道名字,也沒法搜,但是軟體推薦給我,我的確喜歡,這就是搜索做不到的事情。當人們使用這種應用的時候,會發現機器知道我想要什麼,而不是說當我想要的時候,去機器裡面搜索。這個機器真像我的朋友一樣懂我,這就有點人工智慧的意思了。」
「人們很早就在想這個事情了。最早的時候,人們想象,如果要是有一堵牆,牆後面是個機器,我給它說話,它就給我回應,我如果感覺不出它那邊是人還是機器,那它就真的是一個人工智慧的東西了。」
葉風繼續講了一些讓機器學會推理、教給機器知識等高深的人工智慧見解,最後總結道:
「人工智慧可以做的事情非常多,例如可以鑒別垃圾郵件,鑒別黃色暴力文字和圖片等。這也是經歷了三個階段的。第一個階段依賴於關鍵詞黑白名單和過濾技術,包含哪些詞就是黃色或者暴力的文字。隨著這個網路語言越來越多,詞也不斷的變化,不斷的更新這個詞庫就有點顧不過來。第二個階段時,基於一些新的演算法,一些基於概率的演算法。第三個階段就是基於大數據和人工智慧,進行更加精準的用戶畫像和文本理解和圖像理解。」
「由於人工智慧演算法多是依賴於大量的數據的,這些數據往往需要面向某個特定的領域,例如電商,郵箱等等進行長期的積累,如果沒有數據,就算有人工智慧演算法也白搭。而雲計算廠商往往是積累了大量數據的,於是就需求在雲計算裡面裝一個人工智慧軟體即服務,就這樣,雲計算、大數據、人工智慧三兄弟湊齊了。」
「所以將來,只要在一個雲計算平台上面,雲、大數據、人工智慧都能找得到。對一個大數據公司,積累了大量的數據,也會使用一些人工智慧的演算法提供一些服務。對於一個人工智慧公司,也不可能沒有大數據平台支撐。所以雲計算,大數據,人工智慧就這樣整合起來,完成了相遇,相識,相知,過上了沒羞沒臊的美好生活。。
「哈哈哈哈!!!」
聽葉風說得基情四射,眾人哄然大笑。
說到這裡,不知不覺,已經快一個小時了。
就算葉風講得再精彩。
他也感覺到眾人的精神有些疲憊。
特別是的那幾名省里來的高官,本身年紀就大,又聽著自己一點兒也不懂的專業知識。
早就心不在焉了,只是跟隨眾人大笑而大笑。
葉風見狀,「啪啪」拍了拍手掌。
遊艇上面的美女服務員魚貫而入。
「美酒、咖啡、水果、餐點……」
紛紛獻上台前。
葉風笑道:「大家都有點累了吧,這次請大家來,最主要的目的是吃好玩好、放鬆心情。累壞了可真不值得呢。大家不要客氣,休息一會兒再說。」
「葉董客氣了!!」
「葉董有心了!!」
「葉董太體貼了!!」
底下陣陣笑聲傳來,不管是不是晴風集團的,都對葉風交首稱讚。
「大氣!」
「大格局!」
「大氣魄!」
眾人紛紛吃著點心,喝著紅酒,各自交談起來。
張若蘭聽著這些讚譽,含笑上台,挽著葉風手臂到到甲板看海去了。
過了一陣兒。
葉風和張若蘭出去了還沒見回來。
這時。
遊艇豪華大會客廳里傳來一陣嘈雜。
「下面,有請阿里巴巴董事局主席,馬芸先生給大家帶來演講——智能社區和數據時代!」
「呼拉呼拉!!」
一片掌聲。
馬芸帶著笑容打開話筒,感謝台下眾的的掌聲,還重重地看了葉風離去的地方,隨後展開了演講的內容。
他是師範大學畢業的,也曾當過老師。
早練就一副金口。
先前看葉風在台上講得風生水起,心裡早按奈不住了。
正好他此前對大數據做過很多功課,很感興趣。
看到葉風沒講完就離場了,這時哪忍得住再做聽眾,直接反客為主,上台給大家講起了自己的想法。
「各位~!~」
馬芸笑眯眯地講道:
「我喜歡葉董剛才提的「人工智慧」這種說法,但是在國外,「人工智慧」這幾個詞的翻譯是artificialintelligence,我覺得欠妥。這樣翻譯成「人工智慧」會造成誤解,在理解上過於突出「人」。「大數據」這幾個字也有問題,很多人一聽這個「大」,就以為大數據就是數據量很大,其實大數據的「大」是大計算的「大」,大計算加數據,才能稱之為大數據。」
馬芸開口就是早想好的金句。
果然真吸引了大家的注意,眾人的目光紛至而來!
。