第773章 馬芸:我還有話說!

第773章 馬芸:我還有話說!

葉風講的雖然淺顯易懂,但確實精彩萬分。

「數據處理,必須經過這幾個步驟,完成之後才會有智慧。」

此時台前的葉風,像極了傳教老師。

下面的眾人,像極了專心聽弟子。

「第一個步驟是數據收集。這裡有兩個方式,第一個方式是拿,專業點的說法叫抓取或者爬取,例如萬象搜索就是這麼做的,它把網上的所有的信息都下載到它的數據中心,然後你一搜才能搜出來。比如你去搜索的時候,結果會是一個列表,這個列表為什麼會在搜索引擎的公司裡面呢,就是因為他把這個數據啊都拿下來了,但是你一點鏈接,點出來這個網站就不在搜索引擎它們公司了。」

「比如說網易有個新聞,你拿萬象搜出來,你不點的時候,那一頁在萬象數據中心,一點出來的網頁就是在網易的數據中心了。另外一個方式就是推送,有很多終端可以幫我們收集數據,比如說華風智能手機上面的健康管理應用,可以將你每天跑步的數據、心跳的數據、睡眠的數據都上傳到數據中心裏面。」

「第二個步驟是數據傳輸。一般會通過隊列方式進行,因為數據量實在是太大了,數據必須經過處理才會有用,可是系統處理不過來,只好排好隊,慢慢的處理。」

「第三個步驟是數據存儲。現在數據就是金錢,掌握了數據就相當於掌握了錢。要不然別人怎麼知道你想買什麼呢?就是因為它有你歷史的交易的數據,這個信息可不能給別人,十分寶貴,所以需要存儲下來。」

「第四個步驟是數據分析。剛才說的存儲數據是原始數據,原始數據多是雜亂無章的,有很多垃圾數據在裡面,因而需要清洗和過濾,得到一些高質量的數據。對於高質量的數據,就可以進行分析,從而對數據進行分類,或者發現數據之間的相互關係,得到知識。」

「比如90年代盛傳的沃爾瑪超市啤酒和尿布的故事。」

葉風剛剛舉了一個例子,還沒說完,大家就會心笑起來。

在坐的各位,都是精英,基本上都聽過這個故事。

尤其是紅旗大賣場的總裁曹世茹,她知道在美國有一個有趣的現象:尿布和啤酒赫然擺在一起出售。但是這個奇怪的舉措卻使尿布和啤酒的銷量雙雙增加了。這不是一個笑話,而是發生在美國沃爾瑪連鎖店超市的真實案例,並一直為她津津樂道,常常用來教育下面的員工。

沃爾瑪擁有世界上最大的數據倉庫系統,為了能夠準確了解顧客在其門店的購買習慣,沃爾瑪對其顧客的購物行為進行購物籃分析,想知道顧客經常一起購買的商品有哪些。沃爾瑪數據倉庫里集中了其各門店的詳細原始交易數據。在這些原始交易數據的基礎上,沃爾瑪利用數據挖掘方法對這些數據進行分析和挖掘。

一個意外的發現是:「跟尿布一起購買最多的商品竟是啤酒!經過大量實際調查和分析,揭示了一個隱藏在「尿布與啤酒「背後的美國人的一種行為模式:在美國,一些年輕的父親下班后經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。產生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班後為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。

葉風笑道:「即然大家都知道,我就不多說了,這就是通過對購買數據進行分析,發現男人一般買尿布的時候,會同時購買啤酒,這樣就發現了啤酒和尿布之間的相互關係,獲得知識,然後應用到實踐中,將啤酒和尿布的櫃檯弄的很近,就獲得了智慧,讓啤酒和尿布銷量雙雙大增。」

「第五個步驟就是對於數據檢索和挖掘。檢索就是搜索,分析后的數據放入搜索引擎,從而人們想尋找信息的時候,一搜就有了。另外就是挖掘,僅僅搜索出來已經不能滿足人們的要求了,還需要從信息中挖掘出相互的關係。比如財經搜索,當搜索某個公司股票的時候,該公司的高管是不是也應該被挖掘出來呢?如果僅僅搜索出這個公司的股票發現漲的特別好,於是你就去買了,其實其高管發了一個聲明,對股票十分不利,第二天就跌了,這不坑害廣大股民么?所以通過各種演算法挖掘數據中的關係,形成知識庫,十分重要。」

聽葉風說得很有邏輯性,眾人都點頭連連。

這時,又聽葉風講到重點,說起雲計算、大數據、人工智慧的密切關係。

「當數據量很小的時候,很少的幾台機器就能解決。慢慢的當數據量越來越大,最牛的伺服器都解決不了問題的時候,就想怎麼辦呢?要聚合多台機器的力量,大家齊心協力一起把這個事搞定,眾人拾柴火焰高。」

「所以說大數據平台,什麼叫做大數據,說白了就是一台機器干不完,大家一起干。隨著數據量越來越大,很多不大的公司都需要處理相當多的數據,這些小公司沒有這麼多機器可怎麼辦呢?」

「說到這裡,大家想起雲計算了吧。當想要干這些活的時候,需要好多好多的機器一塊做,真的是想什麼時候要,想要多少就要多少。在以後,一個小公司需要大數據平台的時候,不需要採購一千台機器,只要到晴風雲平台上一點,這一千台機器都出來了,並且上面已經部署好了的大數據平台,只要把數據放進去算就可以了。」

「雲計算需要大數據,大數據需要雲計算,兩個人就這樣結合了。」

「雖說有了大數據,人的慾望總是這個不能夠滿足。雖說在大數據平台裡面有搜索引擎這個東西,想要什麼東西我一搜就出來了。但是也存在這樣的情況,我想要的東西不會搜,表達不出來,搜索出來的又不是我想要的。例如音樂軟體裡面推薦一首歌,這首歌我沒聽過,當然不知道名字,也沒法搜,但是軟體推薦給我,我的確喜歡,這就是搜索做不到的事情。當人們使用這種應用的時候,會發現機器知道我想要什麼,而不是說當我想要的時候,去機器裡面搜索。這個機器真像我的朋友一樣懂我,這就有點人工智慧的意思了。」

「人們很早就在想這個事情了。最早的時候,人們想象,如果要是有一堵牆,牆後面是個機器,我給它說話,它就給我回應,我如果感覺不出它那邊是人還是機器,那它就真的是一個人工智慧的東西了。」

葉風繼續講了一些讓機器學會推理、教給機器知識等高深的人工智慧見解,最後總結道:

「人工智慧可以做的事情非常多,例如可以鑒別垃圾郵件,鑒別黃色暴力文字和圖片等。這也是經歷了三個階段的。第一個階段依賴於關鍵詞黑白名單和過濾技術,包含哪些詞就是黃色或者暴力的文字。隨著這個網路語言越來越多,詞也不斷的變化,不斷的更新這個詞庫就有點顧不過來。第二個階段時,基於一些新的演算法,一些基於概率的演算法。第三個階段就是基於大數據和人工智慧,進行更加精準的用戶畫像和文本理解和圖像理解。」

「由於人工智慧演算法多是依賴於大量的數據的,這些數據往往需要面向某個特定的領域,例如電商,郵箱等等進行長期的積累,如果沒有數據,就算有人工智慧演算法也白搭。而雲計算廠商往往是積累了大量數據的,於是就需求在雲計算裡面裝一個人工智慧軟體即服務,就這樣,雲計算、大數據、人工智慧三兄弟湊齊了。」

「所以將來,只要在一個雲計算平台上面,雲、大數據、人工智慧都能找得到。對一個大數據公司,積累了大量的數據,也會使用一些人工智慧的演算法提供一些服務。對於一個人工智慧公司,也不可能沒有大數據平台支撐。所以雲計算,大數據,人工智慧就這樣整合起來,完成了相遇,相識,相知,過上了沒羞沒臊的美好生活。。

「哈哈哈哈!!!」

聽葉風說得基情四射,眾人哄然大笑。

說到這裡,不知不覺,已經快一個小時了。

就算葉風講得再精彩。

他也感覺到眾人的精神有些疲憊。

特別是的那幾名省里來的高官,本身年紀就大,又聽著自己一點兒也不懂的專業知識。

早就心不在焉了,只是跟隨眾人大笑而大笑。

葉風見狀,「啪啪」拍了拍手掌。

遊艇上面的美女服務員魚貫而入。

「美酒、咖啡、水果、餐點……」

紛紛獻上台前。

葉風笑道:「大家都有點累了吧,這次請大家來,最主要的目的是吃好玩好、放鬆心情。累壞了可真不值得呢。大家不要客氣,休息一會兒再說。」

「葉董客氣了!!」

「葉董有心了!!」

「葉董太體貼了!!」

底下陣陣笑聲傳來,不管是不是晴風集團的,都對葉風交首稱讚。

「大氣!」

「大格局!」

「大氣魄!」

眾人紛紛吃著點心,喝著紅酒,各自交談起來。

張若蘭聽著這些讚譽,含笑上台,挽著葉風手臂到到甲板看海去了。

過了一陣兒。

葉風和張若蘭出去了還沒見回來。

這時。

遊艇豪華大會客廳里傳來一陣嘈雜。

「下面,有請阿里巴巴董事局主席,馬芸先生給大家帶來演講——智能社區和數據時代!」

「呼拉呼拉!!」

一片掌聲。

馬芸帶著笑容打開話筒,感謝台下眾的的掌聲,還重重地看了葉風離去的地方,隨後展開了演講的內容。

他是師範大學畢業的,也曾當過老師。

早練就一副金口。

先前看葉風在台上講得風生水起,心裡早按奈不住了。

正好他此前對大數據做過很多功課,很感興趣。

看到葉風沒講完就離場了,這時哪忍得住再做聽眾,直接反客為主,上台給大家講起了自己的想法。

「各位~!~」

馬芸笑眯眯地講道:

「我喜歡葉董剛才提的「人工智慧」這種說法,但是在國外,「人工智慧」這幾個詞的翻譯是artificialintelligence,我覺得欠妥。這樣翻譯成「人工智慧」會造成誤解,在理解上過於突出「人」。「大數據」這幾個字也有問題,很多人一聽這個「大」,就以為大數據就是數據量很大,其實大數據的「大」是大計算的「大」,大計算加數據,才能稱之為大數據。」

馬芸開口就是早想好的金句。

果然真吸引了大家的注意,眾人的目光紛至而來!

上一章書籍頁下一章

我成了富一代

···
加入書架
上一章
首頁 都市青春 我成了富一代
上一章下一章

第773章 馬芸:我還有話說!

%