第499章 AI進度
陳騰將AI部門負責AIGC部門的負責人給喊了過來。
所謂AIGC,是ArtificialIntelligenceGeneratedContent的首字母拼音。
翻譯過來,就是「人工智慧生成內容」。
顧名思義,AIGC這類AI的作用,就是生成一些內容。
2022年以後大火的GPT,就是最廣為人知的AIGC。
除此之外,還有AI作畫、AI生成視頻,都在AIGC的範疇之中。
在AIGC大火的時候,許多人認為一個全新的時代將要到來。
畫畫、寫作、作曲……這類創作性的工作,由AI就能夠完成。
然而理想很豐滿,現實很骨感。
陳騰在這些AI工具大火的時候,也玩過幾次。
只不過再嘗試幾次之後,就會發現這些AI工具存在著重大的缺陷。
文字類AI生成的內容牛頭不對馬嘴。
上一秒說過的話,下一秒就會忘記,記憶短得像是七秒鐘記憶的魚一樣。
在算力達到一定程度之前,AI對於上下文內容的記憶能力永遠都小得可憐。
不過用來寫些沒什麼意義的檢討、總結、日報周報,還是相當不錯的。
以及在寫代碼的時候,生成一些簡單的代碼。
圖片類AI生成的內容同樣存在一些問題。
比如說早期一直被詬病的手部細節,比如說只能生成動漫類型的圖片。
一旦生成寫實類的圖片,就會顯得非常失真。
用來做輔助工作還行。
要是想要靠AI獨立地完成一些任務,還有很長的路要走。
2022年的AI水平尚且如此,2015年的AI水平就更加不用說了。
不過現在能邁出第一步,陳騰還是非常感興趣的。
「老闆,您找我?」
眼前的男人四十歲不到,叫做魏龍,是國內人工智慧領域的一位專家。
他從騰達做手機語音助手的時候,就來到了騰達。
在語音助手這一塊,做了相當多的工作。
技術水平是有口皆碑的好。
「對,我聽朱岩哲說你們推出了一個AIGC的測試版本?」
「是的,目前我們的對話大模型暫命名為DH,版本號為0.1。」
「DH?」
「對話的首拼。」
「原來如此。」陳騰笑了笑,「那這個DH0.1現在大概處於什麼樣的水準?」
「對話的智力水平……大概只有幼兒園小朋友的水平吧。」
陳騰微微點頭。
這個水平,的確不高。
也難怪版本號是0.1,而不是1.0。
「你覺得如果我們這個DH0.1如果需要提升,目前最欠缺的是什麼?」
「數據。」魏龍毫不猶豫地回答道,「絕對是優質的數據,我們這個模型的水準還是不錯的,就是數據實在是太少了。」
「數據嗎……」
陳騰倒是沒懷疑魏龍說的模型水準。
因為這個DH模型的基礎,其實是【LSM人工智慧語言學習大模型】。
就是陳騰上次五連抽,在系統上抽到的那個。
系統出品,怎麼都不會太差勁的。
在抽到這個大模型之後,魏龍手下的技術團隊又基於這個模型做了一定程度上的改進。
所以模型水準陳騰是非常信任的。
不過模型的學習能力強是一回事,數據又是一回事。
如果將模型比作一個人,優秀的模型就是天賦很高的天才。
可就算是頂級的天才,沒有高質量的學習資料,能學到的東西也有限。
現在騰達的這個DH模型,缺乏的就是學習資料。
「我們現在的數據源有哪些?」
「就是各大平台上網友們交流的一些數據,比如短視頻平台的評論區,直播平台的彈幕。不過這些數據的質量,實在是太低了。」
陳騰微微點頭。
魏龍說的很有道理。
短視頻平台的評論區,有相當多的一部分評論都是沒什麼意義的回復。
這個沒意義,指的是對AI訓練沒意義。
比如顏值博主的評論區什麼「好美」「好漂亮」的誇讚。
對於AI訓練來說,意義不大。
經過篩選處理過後,能用的數據少得可憐。
陳騰又想到了GPT。
實際上第一代的GPT是在2018年推出的。
但是第一代的GPT在市場上,並沒有攪動什麼風雲。
因為智能水平太低了,根本沒有人樂意與這樣的AI對話。
直到四年之後,足足餵了四年的數據,這才有了許多人願意對話聊天的GPT。
可見AI的學習與發展,是一條十分漫長的路。
「如果按照現在的學習速度,你覺得我們的AI需要多長的時間,才能通過圖靈測試?」
所謂圖靈測試,就是讓一個人去問AI問題。
看看這個人,能否發現正在與自己聊天對話的是AI。
能發現是AI,則未通過圖靈測試。
未能發現是AI,則通過圖靈測試。
這個測試方法在學術界具備一定的爭議。
有人覺得這是一個很好的測試手段,有人則覺得這種測試手段沒什麼必要。
但是不管怎麼說,圖靈測試都可以作為一個AI智能程度的一個指標。
能通過圖靈測試的人工智慧不一定特別有用,但至少具備一定的智能程度。
「如果按照現在的學習速度,通過圖靈測試的話大概需要兩年吧。如果數據的量充足且優質,也許兩三個月甚至更短的時間就能通過圖靈測試了。」
魏龍有些無奈地說道。
優化模型、輸入數據。
他們搞人工智慧的,無非就是在做這兩件事情。
「我倒是有一個想法,可以試一試,我們可以在互聯網上,將DH0.1偽裝成普通的用戶,讓真人用戶和DH0.1對話試試。」
「可是DH0.1現在的水準,恐怕和正常人聊上幾句,就會讓人覺得聊天內容牛頭不對馬嘴了。」
「那有什麼關係?」陳騰反問,「你現在上網去和人討論問題,牛頭不對馬嘴的情況難道遇到的少嗎?」
魏龍:「……」
還真別說,他確實在互聯網上見證過生物多樣性。
「那我們就偽裝成真人,去和用戶聊天?」
「嗯,你去找蔣華,讓他配合你們弄些人機賬號出來吧。」
「好的。」
「什麼時候你們覺得這個對話模型有資格被稱之為DH1.0了,我們就向用戶正式開放我們這個對話模型。」
「如果能和大量真人進行對話,我覺得一年以內,甚至半年的時間我們就能達到1.0版本。智力水平,應該有七八歲小孩子這麼高。」
「那還不錯。」
陳騰對七八歲小孩子的智力水平還是認可的。
至少能對話了。
如果在這個基礎上再進步,那就真的可以商業化了。