第499章 AI進度_遊戲公司？這分明是科技巨頭-愛下電子書

第499章 AI進度

陳騰將AI部門負責AIGC部門的負責人給喊了過來。

所謂AIGC，是ArtificialIntelligenceGeneratedContent的首字母拼音。

翻譯過來，就是「人工智慧生成內容」。

顧名思義，AIGC這類AI的作用，就是生成一些內容。

2022年以後大火的GPT，就是最廣為人知的AIGC。

除此之外，還有AI作畫、AI生成視頻，都在AIGC的範疇之中。

在AIGC大火的時候，許多人認為一個全新的時代將要到來。

畫畫、寫作、作曲……這類創作性的工作，由AI就能夠完成。

然而理想很豐滿，現實很骨感。

陳騰在這些AI工具大火的時候，也玩過幾次。

只不過再嘗試幾次之後，就會發現這些AI工具存在著重大的缺陷。

文字類AI生成的內容牛頭不對馬嘴。

上一秒說過的話，下一秒就會忘記，記憶短得像是七秒鐘記憶的魚一樣。

在算力達到一定程度之前，AI對於上下文內容的記憶能力永遠都小得可憐。

不過用來寫些沒什麼意義的檢討、總結、日報周報，還是相當不錯的。

以及在寫代碼的時候，生成一些簡單的代碼。

圖片類AI生成的內容同樣存在一些問題。

比如說早期一直被詬病的手部細節，比如說只能生成動漫類型的圖片。

一旦生成寫實類的圖片，就會顯得非常失真。

用來做輔助工作還行。

要是想要靠AI獨立地完成一些任務，還有很長的路要走。

2022年的AI水平尚且如此，2015年的AI水平就更加不用說了。

不過現在能邁出第一步，陳騰還是非常感興趣的。

「老闆，您找我？」

眼前的男人四十歲不到，叫做魏龍，是國內人工智慧領域的一位專家。

他從騰達做手機語音助手的時候，就來到了騰達。

在語音助手這一塊，做了相當多的工作。

技術水平是有口皆碑的好。

「對，我聽朱岩哲說你們推出了一個AIGC的測試版本？」

「是的，目前我們的對話大模型暫命名為DH，版本號為0.1。」

「DH？」

「對話的首拼。」

「原來如此。」陳騰笑了笑，「那這個DH0.1現在大概處於什麼樣的水準？」

「對話的智力水平……大概只有幼兒園小朋友的水平吧。」

陳騰微微點頭。

這個水平，的確不高。

也難怪版本號是0.1，而不是1.0。

「你覺得如果我們這個DH0.1如果需要提升，目前最欠缺的是什麼？」

「數據。」魏龍毫不猶豫地回答道，「絕對是優質的數據，我們這個模型的水準還是不錯的，就是數據實在是太少了。」

「數據嗎……」

陳騰倒是沒懷疑魏龍說的模型水準。

因為這個DH模型的基礎，其實是【LSM人工智慧語言學習大模型】。

就是陳騰上次五連抽，在系統上抽到的那個。

系統出品，怎麼都不會太差勁的。

在抽到這個大模型之後，魏龍手下的技術團隊又基於這個模型做了一定程度上的改進。

所以模型水準陳騰是非常信任的。

不過模型的學習能力強是一回事，數據又是一回事。

如果將模型比作一個人，優秀的模型就是天賦很高的天才。

可就算是頂級的天才，沒有高質量的學習資料，能學到的東西也有限。

現在騰達的這個DH模型，缺乏的就是學習資料。

「我們現在的數據源有哪些？」

「就是各大平台上網友們交流的一些數據，比如短視頻平台的評論區，直播平台的彈幕。不過這些數據的質量，實在是太低了。」

陳騰微微點頭。

魏龍說的很有道理。

短視頻平台的評論區，有相當多的一部分評論都是沒什麼意義的回復。

這個沒意義，指的是對AI訓練沒意義。

比如顏值博主的評論區什麼「好美」「好漂亮」的誇讚。

對於AI訓練來說，意義不大。

經過篩選處理過後，能用的數據少得可憐。

陳騰又想到了GPT。

實際上第一代的GPT是在2018年推出的。

但是第一代的GPT在市場上，並沒有攪動什麼風雲。

因為智能水平太低了，根本沒有人樂意與這樣的AI對話。

直到四年之後，足足餵了四年的數據，這才有了許多人願意對話聊天的GPT。

可見AI的學習與發展，是一條十分漫長的路。

「如果按照現在的學習速度，你覺得我們的AI需要多長的時間，才能通過圖靈測試？」

所謂圖靈測試，就是讓一個人去問AI問題。

看看這個人，能否發現正在與自己聊天對話的是AI。

能發現是AI，則未通過圖靈測試。

未能發現是AI，則通過圖靈測試。

這個測試方法在學術界具備一定的爭議。

有人覺得這是一個很好的測試手段，有人則覺得這種測試手段沒什麼必要。

但是不管怎麼說，圖靈測試都可以作為一個AI智能程度的一個指標。

能通過圖靈測試的人工智慧不一定特別有用，但至少具備一定的智能程度。

「如果按照現在的學習速度，通過圖靈測試的話大概需要兩年吧。如果數據的量充足且優質，也許兩三個月甚至更短的時間就能通過圖靈測試了。」

魏龍有些無奈地說道。

優化模型、輸入數據。

他們搞人工智慧的，無非就是在做這兩件事情。

「我倒是有一個想法，可以試一試，我們可以在互聯網上，將DH0.1偽裝成普通的用戶，讓真人用戶和DH0.1對話試試。」

「可是DH0.1現在的水準，恐怕和正常人聊上幾句，就會讓人覺得聊天內容牛頭不對馬嘴了。」

「那有什麼關係？」陳騰反問，「你現在上網去和人討論問題，牛頭不對馬嘴的情況難道遇到的少嗎？」

魏龍：「……」

還真別說，他確實在互聯網上見證過生物多樣性。

「那我們就偽裝成真人，去和用戶聊天？」

「嗯，你去找蔣華，讓他配合你們弄些人機賬號出來吧。」

「好的。」

「什麼時候你們覺得這個對話模型有資格被稱之為DH1.0了，我們就向用戶正式開放我們這個對話模型。」

「如果能和大量真人進行對話，我覺得一年以內，甚至半年的時間我們就能達到1.0版本。智力水平，應該有七八歲小孩子這麼高。」

「那還不錯。」

陳騰對七八歲小孩子的智力水平還是認可的。

至少能對話了。

如果在這個基礎上再進步，那就真的可以商業化了。