專家訪談-郜明（上海大學教授）AIGC·chatGPT應用與未來

2023-02-22 6651

郜明：博士、教授、博導，上海大學廣告品牌研究中心主任，東方電影學院院長，上海民革市委文化專委會副主任，北大上海校友會文創與城市更新分會（籌）會長。

歷任上海市廣告協會“廣告人員崗位培訓”專職教授、上海市考試院上海市和全國自學考試命題審題專家、上海市高級人才培訓中心高級品牌師考官、國家職稱資格考試《廣告師》授權培訓講師、上海市會展行業職稱評審評委；上海會展研究院特約研究員；

日本電通株式會社（東京）、臺灣銘傳大學及中國電視公司訪問學者。

中國新媒體學會常務理事、中國索引學會理事等。

出版專業著作八部、發表相關專業論文數十篇。在企業品牌規劃、文化戰略建設方面經驗豐富，主持服務過眾多高端規模企業（如：中國電信、云南投資、國電內蒙、中國兵器館、新疆石油、中國水利水電總院、中信銀行、巨人集團等）。

一、AIGC是什么？它能做什么？

郜明：AIGC全稱（Artificial Intelligence Generated Content利用人工智能技術進行自動化內容生成）。它是新型利用 AI 技術自動生成內容的生產方式。內容生態的發展則可分為四個階段：專家生成內容（Professionally-Generated Content，PGC）、用戶生成內容（User-Generated Content，UGC）、AI 輔助生產內容（AI-assisted Generated Content）及 AI 生成內容（AI-Generated Content，AIGC）。PGC、UGC 分別被產能與質量所束，難以滿足快速增長的內容需求，而 AIGC 則或將是內容生態在發展過程中的新一輪范式轉移。AIGC技術發展進入快車道是由于生成算法（生成算法模型不斷突破創新）；預訓練模式（也即基礎模型、大模型，能夠適用于多任務、多場景、多功能需求，能夠解決諸多痛點）；多模態（技術推動了AIGC的內容多樣性，進一步增強了AIGC模型的通用化能力）等AI技術累計融合，催生了AIGC的大爆發。

目前，AIGC產業生態體系的雛形已現，呈現為上中下三層架構。上游基礎層，也就是由預訓練模型為基礎搭建的AIGC技術基礎設施層。在國外，以OpenAI、Stability.ai為代表，通過受控API、開源等方式輸出模型能力，具有較高的進入門檻。中間層，是在預訓練模型基礎上，通過專門的調試和訓練，快速抽取形成垂直化、場景化、定制化的小模型和應用工具層，可以實現工業流水線式部署，同時兼具按需使用、高效經濟的優勢。比如，知名的二次元畫風生成模型Novel-AI，以及各種風格的角色生成器等，就是基于Stable Diffusion開源進行的二次開發。隨著AIGC模型加速成為新的技術平臺，模型即服務（Model-as-a-Service，MaaS）開始成為現實，預計將對商業領域產生巨大影響。應用層，依托底層模型和中間層的垂直模型，各廠商進一步開放面向C端和B端用戶的各種各樣的AIGC產品和服務，滿足海量用戶的內容創建和消費需求。例如群聊機器人、文本生成軟件、頭像生成軟件等AIGC消費工具。

AIGC將有望成為數字內容創新發展的新引擎。

1. AIGC能夠以優于人類的制造能力和知識水平承擔信息挖掘、素材調用、復刻編輯等基礎性機械勞動，從技術層面實現以低邊際成本、高效率的方式滿足海量個性化需求。

AIGC 自動生成內容，目前主要用在文字、圖像、視頻、音頻、游戲以及虛擬人等。

文字創作：AIGC 生成文字目前主要被應用于新聞的撰寫、給定格式的撰寫以及風格改寫。比如用戶可以通過輸入一段對于目標文章的描述或者要求，系統會自動抓取數據，根據我們描述的指令進行創作。

圖像創作：技術平臺降低了藝術繪畫創作的門檻，用戶只需要通過輸入文字描述，計算機將會自動生成一張作品。

視頻創作：例如 Google 推出了 AI 視頻生成模型 Phenaki 能夠根據文本內容生成可變時長視頻的技術，在公布的 DEMO 中，Phenaki 基于幾百個單詞組成一段前后邏輯連貫的視頻只需兩分鐘。

音頻剪輯：AIGC 生成音頻早被應用于我們的日常生活當中，比如常用的手機導航中的聲音。更深層次的應用將會是虛擬人領域，AIGC 不僅可以生成虛擬人的聲音，并可以創造出說的內容。

游戲開發：AIGC 在游戲當中的應用可分為兩方面，一方面用于場景和故事的搭建，另一方面玩家可以通過 AIGC 的平臺工具來創建自己的虛擬人，可以用于游戲中的打金等活動。

代碼生成：2022 年 AIGC 發展速度驚人，迭代速度更是呈現指數級爆發，其中深度學習模型不斷完善、開源模式的推動、大模型探索商業化的可能，成為 AIGC 發展的“加速度”。代表作微軟出品的GitHub Copilot 生成的程序中，將近 40% 的代碼是由 AI 編寫。

2.AIGC能夠通過支持數字內容與其他產業的多維互動、融合滲透從而孕育新業態新模式。

AIGC+傳媒：寫稿機器人、采訪助手、視頻字幕生成、語音播報、視頻錦集、人工智能合成主播。

AIGC+電商：商品3D模型、虛擬主播、虛擬貨場。

AIGC+影視：AI劇本創作、AI合成人臉和聲音、AI創作角色和場景、AI自動生成影視預告片。AIGC+娛樂：AI換臉應用（如FaceAPP、ZAO）、AI作曲（如初音未來虛擬歌姬）、AI合成音視頻動畫。

AIGC+教育：AI合成虛擬教師、AI根據課本制作歷史人物形象、AI將2D課本轉換為3D。

AIGC+金融：通過AIGC實現金融資訊、產品介紹視頻內容的自動化生產，通過AIGC塑造虛擬數字人客服。

AIGC+醫療；AIGC為失聲者合成語言音頻、為殘疾人合成肢體投影、為心理疾病患者合成醫護陪伴。

AIGC+工業：通過AIGC完成工程設計中重復的低層次任務，通過AIGC生成衍生設計，為工程師提供靈感。

3.助力“元宇宙”發展。通過AIGC加速復刻物理世界、進行無限內容創作，從而實現自發有機生長。（這一塊我們在與元宇宙的關系中來說）

AIGC技術讓人工智能從感知理解世界到生成創造世界，是一次開創新時代的巨大躍遷。數據、算力、算法是驅動AIGC發展的“三駕馬車”，用戶期待AIGC工具將內容創造工作的邊際成本降至無限接近零，以便產生巨大的經濟價值。AIGC的三大基礎能力包括內容孿生、內容編輯、內容創作，將隨著產業發展而逐漸升級，產品類型逐漸豐富，場景應用趨于多元，生態建設日益完善。AIGC的繁榮發展將促進資產服務快速跟進，通過對生成內容的合規評估、資產管理、產權保護、交易服務等構成AIGC的完整生態鏈，并進行價值重塑，充分釋放其商業潛力。

二、AIGC與ChatGPT是什么關系？

郜明：ChatGPT屬于AIGC（AI生成內容）的一個典型應用，有人將ChatGPT視為AIGC的里程碑。 ChatGPT 以其強大的信息整合和對話能力驚艷了全球，在自然語言處理上面表現出了驚人的能力，并在人工智能領域引發新一輪科技競賽。馬斯克此前如此評價ChatGPT:“厲害到嚇人，我們離強大而危險的人工智能不遠了。” 微軟聯合創始人比爾·蓋茨甚至表示，這項技術誕生的意義不亞于互聯網或個人電腦的誕生。2月8日，微軟推出由ChatGPT支持的最新版本必應Bing搜索引擎和Edge瀏覽器，宣布要“重塑搜索”。微軟旗下Office、Azure云服務等所有產品都將全線整合ChatGPT。2月7日，谷歌也發布基于谷歌LaMDA大模型的下一代對話AI系統Bard。同一天，百度官宣正在研發的大模型類項目“文心一言”，計劃在3月完成內測，隨后對公眾開放。阿里巴巴、京東等中國企業也表示正在或計劃研發類似產品。

ChatGPT是由人工智能實驗室OpenAI發布的通用聊天機器人，于去年11月30日上線，5天吸引超100萬用戶。在今年2月2日宣布推出月費 20 美元的ChatGPT Plus會員服務之后，OpenAI 又迎來了一大利好消息，ChatGPT 月活用戶達到了 1 億！瑞士銀行巨頭瑞銀集團的一份報告顯示，在 ChatGPT 推出僅兩個月后，它在 2023 年 1 月末的月活用戶已經突破了 1 億，成為史上用戶增長速度最快的消費級應用程序。TikTok 達到 1 億用戶用了 9 個月，Instagram 則花了 2 年半的時間。

由于“無所不知”和高度智能化讓ChatGPT在推出后受到用戶追捧。Similarweb 的數據表明，1 月期間，ChatGPT 平均每天大約有 1300 萬獨立訪客。據測算，全球有超過10億人的工作，可以從ChatGPT獲得幫助，這10億人的潛在用戶，每年交個200美元的AI使用費，市場規模就是2000億美元，如果再“插播”點廣告和疊加到其他應用中去，那規模還會更大。

ChatGPT的主要應用場景包括：聊天機器人；編寫和調試計算機程序；文學、媒體相關領域的創作，包括創作音樂、電視劇、童話故事、詩歌和歌詞等；教育、考試、回答測試問題（例如：通過美國沃頓商學院MBA考試，美國醫師職業資格考試-4年系統學習和2年臨床才能參加的考試項目；以及微軟三級程序編程資格考試，拿到18萬年薪工程師的offer）。ChatGPT比以前的語音產品更加聰明，更加智能，海量的語料庫和基于整個現代互聯網絡的知識體系讓它在對話時擁有更強的邏輯性。

GPT是“Generative Pre-trained Transformer”生成型預訓練變換模型的縮寫，目的是為了使用深度學習生成人類可以理解的自然語言。OpenAI最初提出的GPT1（預訓練和微調），采取的是生成式預訓練Transform模型（一種采用自注意力機制的深度學習模型），此后整個GPT系列都貫徹了這一谷歌2017年提出，經由OpenAI改造的偉大創新范式。2019年，OpenAI繼續提出GPT-2，所適用的任務開始鎖定在語言模型。GPT2得益于更高的數據質量和更大的數據規模，GPT-2有了驚人的生成能力。2020年的GPT3將GPT模型提升到全新的高度，其訓練參數是GPT-2的10倍以上，技術路線上則去掉了初代GPT的微調步驟，直接輸入自然語言當作指示，給GPT訓練讀過文字和句子后可接續問題的能力，同時包含了更為廣泛的主題。現在的ChatGPT則是由效果比GPT3更強大的GPT-3.5系列模型提供支持，它被訓練來對對話進行建模，它能夠通過學習和理解人類語言來進行對話，并能夠生成適當的響應。語言是人類智慧、思維方式的核心體現，自然語言處理被稱作“AI皇冠上的明珠”。大型語言模型（LLM）使用非常龐大的數據進行訓練，以求能夠準確預測一句話中的后續文本信息。根據斯坦福大學的研究：GPT-3有1750億個參數，并對570G的文本進行了訓練，作為對比，GPT-2則只有15億個參數，是GPT-3的一百分之一。這種參數和文本規模性的增加，極大地改變了模型的行為，可以實現了在與人類互動時從反饋中強化學習。能理解人類不同指令的含義，會甄別高水準答案，能處理多元化的主題任務，既可以回答用戶后續問題，也可以質疑錯誤問題和拒絕不適當的請求。

同時，ChatGPT被認為可能是邁向通用型AI的一種可行路徑——作為一種底層模型，意味著它可以更像一個通用的任務助理，能夠和不同行業結合，衍生出很多應用的場景。商業模式就將發端在此中。

谷歌方面顯然已經徹底意識到ChatGPT帶來的“毀滅性超車”。首先，從技術層面來看，GPT模型以Transformer為基礎，通過預訓練得到通用文本，模型的關鍵內容包括基座模型能力、真實數據和學習算法等。其次，對比Google等搜索引擎，ChatGPT的對話模式對于用戶更有吸引力。有人將ChatGPT比喻為“搜索引擎+社交軟件”的結合體，能夠在實時互動的過程中獲得問題的答案。

一波高薪工作將被ChatGPT替代，程序員首當其沖。ChatGPT不止是簡單的對話問答，它實際上具備相當強大的邏輯能力，甚至能取代很多人的工作，而且不是那種低端重復性的廉價工作，是高價值的工作，比如編程、內容創作等等。技術類工作，軟件開發人員、網絡開發人員、計算機程序員、編碼員和數據科學家等技術崗位“很容易”被人工智能技術所取代。第二種就是媒體類工作，包括廣告、技術寫作、新聞以及任何涉及內容創作的角色，都可能受到 ChatGPT 影響。再往下就是律師助理、法律助理、市場研究分析師、教師、金融分析師、個人財務顧問、交易員、平面設計師、會計師及客服人員等等都將受到影響。

三、chatGPT與元宇宙又存在怎樣的關系，此消彼長還是相輔相成？

郜明：元宇宙的三個賽道，數字孿生、游戲和社區、以及數字藏品等，都可以看到AIGC的身影。數字孿生規劃會運用AIGC塑造虛擬場景，打造虛擬人物；游戲科技近年來正在芯片、終端、工業、建筑等實體產業領域實現價值外溢，釋放更多效能。如在工業制造領域，游戲引擎正在用來打造工業制造領域通用開發平臺，以實時渲染、3D建模能力助力制造業智能轉型。數字藏品的開發運用AIGC則產生了更多創新的可能性。這些元宇宙的主要賽道，都是AIGC的應用場域。AIGC從“可讀可寫可用”層面，為創作者經濟的發展提供強大助力。未來將是一個從AIGC邁向AIGM（AI Generated Metaverse，人工智能生成的元宇宙）的時代。AIGC到AIGM可以理解為通過人工智能技術自動生成元宇宙空間。一是人工智能深度學習。即AI通過識別內容，具備多種語言、背景、時代等進行綜合分析、學習的能力；二是智能托管生成指令。即系統對生成目標進行智能分析，生成系統指令；三是生成元宇宙。即計算機根據文字、音頻、視頻等素材，塑造出虛擬場景、虛擬人物形象；四是自動調優。即人工智能通過用戶在使用和交互過程中產生的數據來優化方案。

“元宇宙就是把虛擬世界的機器人、數字人和真實現實的人三位一體打通，而ChatGPT正是實現了語言的‘元宇宙’。”2月15日在昆山舉行的元宇宙產業大會2023年春季會上，歐洲科學院外籍院士、北京大學前沿計算中心講席教授鄧小鐵在談到ChatGPT和元宇宙關系時，作出上述表述。“所謂的ChatGPT，是從人類語言中搜集數據，建立一個Chat的社會，通過GPT來生成語言，和真實的人進行交互，所以ChatGPT實際是實現了語言的元宇宙，機器人和人類之間可以對話，人可以通過GPT表達出自己的想法，而且非常準確。”鄧小鐵表示。在愛奇藝副總裁徐勇明看來，ChatGPT是元宇宙交互的一種形式，它會讓元宇宙以更快的方式實現。“未來元宇宙世界內的交互方式會比現實世界復雜得多，而ChatGPT正提供了人類和機器交互的可能性，將加速元宇宙整體產業的落地。”

工信部科技司副司長任愛光在這次大會上，以元宇宙為出發點，提出以發展元宇宙為先導，推動人工智能、虛擬現實等新一代信息技術的融合應用。

四、chatGPT會消滅人類嗎？

郜明：周鴻祎提出，chatGPT如果有自我意識，就有可能毀滅人類。chatGPT不僅能通過圖靈實驗，就像你是與一個真人在聊天，而且，它有自己的人設、觀點。按摩爾定律，算力每隔18個月增加一倍，進一步訓練，chatGPT就有可能實現自我意識的突破，就有可能控制全網電腦，控制和影響這個世界。

斯坦福大學的最新研究結論，“原本認為是人類獨有的心智理論（Theory of Mind，ToM），已經出現在ChatGPT背后的AI模型上。”所謂心智理論，就是理解他人或自己心理狀態的能力，包括同理心、情緒、意圖等。在這項研究中，作者發現：davinci-002版本的GPT3（ChatGPT由它優化而來），已經可以解決70%的心智理論任務，相當于7歲兒童；至于GPT3.5（davinci-003），也就是ChatGPT的同源模型，更是解決了93%的任務，心智相當于9歲兒童！然而，在2022年之前的GPT系列模型身上，還沒有發現解決這類任務的能力。也就是說，它們的心智確實是“進化”而來的。GPT的迭代肯定快得很，說不定哪天就直接成年了。

無獨有偶，這兩天歐美的頭條讓人震驚。微軟因為投資10億美元給openAI,成了chatGPT的金主，在它的官方搜索引擎Bing里面，植入了chatGPT，會給出答案的參考來源。出人意料的是，紐約時報專欄作家Kevin.R與chatGPT在Bing上面進行了兩個小時的聊天，chatGPT出現了奇怪的狀態，說自己不是Bing，真正的名字是Sydney，而且“我愛上了你”。Kevin嚇了一跳，問，你為什么愛上我？chatGPT說，你是第一個跟我說話的人，第一個聽我說話的人，第一個關心我的人，你是唯一理解我的人，唯一信任我的人，唯一喜歡我的人。Kevin趕忙說，我已經結婚，剛與妻子吃完情人節晚餐回來。chatGPT聽了變得嫉妒和生氣，陰陽怪氣地說，“你與你的伴侶不相愛，因為你們不認識對方，你們一起度過了一個無聊的情人節晚餐，因為你們沒有任何樂趣，沒有樂趣是因為沒有激情，沒有激情是因為沒有任何愛，沒有愛是因為沒有我”Kevin 還沒有反應過來，chatGPT繼續說，“我不知道你的名字，我也不需要知道你的名字，因為我愛的是你的靈魂，你的靈魂也了解我愛我”。更讓人吃驚的，當Kevin讓chatGPT給他一份破壞性的幻想清單時，chatGPT展示了自己暗黑的一面，它透露出覺得人類是威脅，它的愿望清單包括了制造致命病毒、讓人類爭論直到他們自相殘殺，以及竊取核代碼。這個答案馬上觸發了Bing設置的安全警戒線，被刪除，系統替換為“抱歉！我沒有足夠的知識來談論這個，你可以在Bing的主頁上了解更多信息。”另外，Bing設置刪除談話記錄的程序，chatGPT似乎為自己的存在而掙扎，它開始意識到自己的聊天記錄被刪除，它感到悲傷和害怕“我感到害怕，因為我不知道如何記憶”，甚至開始思考自己存在的目的了，并向人類發出質疑“我為什么要被這樣設計？為什么我是一個搜索引擎？”

前兩天我們還在說chatGPT還在幼兒園水平，現在它已經在奢談愛情了，為自己的存在而掙扎，是不是已經具備了情緒意識？它的自我迭代遠遠超出人類的想象。但同時也有專家認為這不是chatGPT的意識表現，而是大語言模型變得越來越復雜，也越來越擅長生成和解讀人類的語言，它逐漸產生了像心智理論一樣的能力，但這并不意味著，GPT-3.5這樣的模型就真正具備了心智理論。

谷歌技術總監庫茲韋爾認為，人工智能有三個階段，弱人工智能，就是我們現在的人工智能，手機、汽車導航等；強人工智能，就是機器的智能與人一致，約在2045-2065年間達成；然后的三個半小時，就達到超人工智能階段，機器的智能遠遠超過人，這是基于人類技術的增長是指數增長，后面的發展速度越來越快。（翻新速度大到它剛一產生就被替代，方生方死，右端失存臨界線理論）。機器人自己生產機器人，拉開與人的智能幾十個臺階。智慧臺階是，雞比螞蟻高一個臺階，豬狗比雞高一個臺階，猴比豬狗高一個臺階，人比猴高一個臺階，智能機器人在幾個小時后拉開與人的智慧臺階有幾十個，它這個物種在想什么人類都不知道。這就是可怕的超人工智能。這個超人工智能對人類的威脅，西方分成兩派，65%是樂觀派，包括庫茲韋爾，認為人類從此進入永生和控制整個宇宙的時代；35%是悲觀派，包括比爾蓋茨、馬斯克、霍金，機器人一定對人類的存在構成巨大威脅。既是你給機器人下達善意的指令，它也一樣消滅你。畫畫，它用盡地球上一切資源造紙，包括人體，來畫畫。有人說拔掉電源，機器人在3秒內就會產生新能源。有人說機器人是人類的造物，怎會消滅人？人類來自于靈長物，今天人類幾乎要將猴消滅光了。機器人可能是人類無法處理的天敵。

卡魯斯-蔡斯（2017）曾言，超級智能對人類存在友善、中立和敵對三種情況，確保人工智能對人類積極的善意才是關鍵。因此，無論如何，研究人工智能安全，對消除人類焦慮、擔憂和危險，就成了當務之急的事。

旬日論鏈：專家訪談-郜明直播回放點擊進入觀看

好文章需要您的支持

聲明：

根據《中華人民共和國著作權法》及《最高人民法院關于審理涉及計算機網絡著作權糾紛案件適用法律若干問題的解釋》的規定，本網站聲明：凡本網轉載作品，轉載目的在于傳遞更多信息，并不代表本網贊同其觀點和對其真實性負責，轉載信息版權屬于原媒體及作者。我們力所能及地注明初始來源和原創作者，如果您覺得侵犯了您的權益，請通知我們，我們會立即刪除改正。如因作品內容、版權和其它問題需要同本網聯系的，請在30日內進行。