ChatGPTPlus停售風波:算力不足是偽命題,數據才是關鍵
分類: 最新資訊
說說詞典
編輯 : 大寶123
發布 : 04-07
閱讀 :142
界面新聞記者 | 李京亞昨日中午,一則ChatGPT Plus停售的消息在國內科技圈引發震動。據量子位等媒體報道,OpenAI暫停了Plus的銷售,ChatGPT已不支持Plus付費,之后何時開放也未可知。幾位用戶告訴界面新聞,昨天確實發生了ChatGPT Plus的停售,這些用戶包括國內售賣ChatGPT賬號的中間商和賣虛擬信用卡的中間商。今日早間,多位用戶告訴界面新聞,ChatGPT會員可以正常升級到ChatGPT Plus,升級后功能一切正常。算力告急?ChatGPT Plus的推出是為了用戶可在ChatGPT高峰時段優先使用,獲得更迅速的服務響應,因此,付費的ChatGPT Plus相對于免費的ChatGPT而言,擁有更大的模型容量、更先進的訓練和更好的預處理,在使用上能夠更加快速高效地處理輸入并完成輸出。 OpenAI是在今年2月1日發布了ChatGPT Plus訂閱計劃,ChatGPT Plus每月收費20美元(約合135元人民幣)。ChatGPT Plus的強大功能是基于GPT-4模型而生,而此前風靡全網的ChatGPT使用的是GPT-3.5模型,更強大的模型就意味著更大規模的算力。目前,大模型算力成本主要有初始訓練成本和后續運營成本兩部分。東吳證券對GPT模型所需的算力作了測算:在GPT-3模型初始訓練階段,根據OpenAI官網數據,每個token(token是服務端生成的一串字符串, 以作客戶端進行請求的一個令牌)的訓練成本通常約為 6N FLOPS(FLOPS 指每秒浮點運算次數,可理解為計算速度,可以用來衡量硬件的性能), 那么OpenAI對ChatGPT的初始訓練成本需要843顆英偉達A100芯片。當進入運營階段,由于這個階段所需算力量與使用者數量緊密相關,東吳證券作出假設,如果GPT-3每日有5000萬活躍用戶,每個用戶提10個問題,每個問題回答400字,則這個階段需要16255顆英偉達A100芯片。 根據ChatGPT Plus的收費金額,東吳證券推論,GPT-4的參數量是GPT-3的10倍以上,因此預計GPT-4的算力需求是GPT-3的10倍以上。 此等算力規模需求,自然會引發算力告急的猜想。隨著用戶需求量超過預期,OpenAI很可能采取一些方式來減少對ChatGPT的訪問。比如從3月31日開始,ChatGPT開始集中在亞洲地區大規模封號,據各方消息匯總,這次封號受到影響的賬戶多達百萬。OpenAI想借ChatGPT Plus作為打開豐富商業模式的開端。但在現實階段體驗中,無論是ChatGPT還是ChatGPT Plus,都存在顯著的相應延遲和回答錯誤率提升等問題。3月下旬開始,OpenAI對于Plus付費用戶的訪問連續下降閾值,其應用模型GPT-4訪問限制由第一天的150msg/4hr到100msg/4hr到50msg/3hr直到最近的25msg/3hr,相當于不到一個月連續下降了4次訪問閾值,這都被視為算力不足的體現。不過,也出現了專業聲音認為,算力并非大模型發展和功能體驗的真正瓶頸。氪信科技創始人兼CEO朱明杰告訴界面新聞,他并沒有把算力問題太當成瓶頸,做大模型,最先解決的是最終結果的問題。氪信科技是將搜索引擎級別的大規模機器學習技術用于金融領域的最早一批人工智能公司,朱明杰告訴記者,“用第一性原理來說,本質上OpenAI解決的問題是如何把這么大體量的數據壓縮到模型里面去,變成知識的問題,這才是它的終極目標。中間算力到底用A100還是A800,用的是GPU架構還是CPU架構,反而都是可解的事情。”事實上,此番撲朔迷離的ChatGPT Plus停售事件,是近日“唱衰ChatGPT大合唱”的最新樂章。剛剛,加拿大和德國加入了意大利的“反感ChatGPT”陣營。當地時間4月4日,加拿大隱私專員辦公室(OPC)宣布開始調查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未經同意收集、使用和披露個人信息”的投訴。據路透社消息,德國聯邦數據保護專員Ulrich Kelber在4月3日發表的評論中告訴德國《商報》,德國可能會追隨意大利的腳步,因數據安全考量而“封殺”ChatGPT。3月底,意大利個人數據保護局宣布,即日起暫時禁止ChatGPT的使用,同時對OpenAI展開調查,限制其處理意大利的用戶信息。該機構認為,3月20日ChatGPT平臺出現了用戶對話數據和付款服務支付信息丟失情況。此外,平臺沒有就收集處理用戶信息予以告知,缺乏大量收集和存儲個人信息的法律依據。兩天后,OpenAI首席執行官Sam Altman回應稱這是一個 “重大問題”,“我們對此感覺很糟糕。”他表示,將會遵從意大利政府的要求,并已停止在意大利提供ChatGPT——盡管其認為自身遵守所有的隱私法。而在意大利對ChatGPT做出封禁決定前兩天,馬斯克率一眾科技圈大佬呼吁暫停高階AI系統訓練,其所發表的一封公開信引發了軒然大波。信中指出,“只有在我們確信強大的人工智能系統的效果將是積極的,風險是可控的,才應該開發。”數據才是關鍵縱觀近期圍繞ChatGPT的爭議事件會發現,表面看,算力是影響OpenAI發展的瓶頸,但事實上,數據才是OpenAI能否繼續發展的助力和關隘。“算力的擴容目前不會是提供服務的瓶頸,不難克服。”北京師范大學法學院博士生導師、中國互聯網協會研究中心副主任吳沈括對界面新聞表示。“ChatGPT們當然需要新的監管規則,但現行的法規依然有效,在這個意義上,從數據切入是目前最扎實有效的監管方式。”吳沈括表示,無論是意大利、德國還是加拿大,他們本次監管切入點都是數據流轉。“不過,意大利等國針對ChatGPT的監管舉措到目前為止,都不能得出技術本身是違法的結論。”吳沈括強調。吳沈括進一步分析了歐美在ChatGPT監管中的不同站位,他指出,歐洲有嚴格的數據法規,從數據流轉角度切入得心應手,能夠反映歐洲關于數字主權、技術主權的核心立場,特別是針對美國企業,“這里有一個數字經濟、數字發展的主導權問題。”他判斷歐洲各國效法跟進的可能性較大,而美國方面,由于處于技術先發的優勢地位,對ChatGPT們的監管思路會更為寬松。“美國和其他國家的監管思路必然出現明顯差異,因為這種技術存在本身,能放大其已有的數據優勢、算力優勢和算法優勢。”吳沈括直言。他預計此后,ChatGPT們運算處理過程中的規則透明度、可解釋性,會成為監管關系的重點。“這里面的要害是數據收集匯聚,是否具有合法性,是否取得了當事人同意,是否屬于違法爬取數據;第二是加工處理角度,是否有超過、超越權利人授權;第三,關于數據處理運算結果的輸出,是否符合倫理的要求,法律規則和安全的要求,是否會帶來危害社會和公眾利益的結果。”吳沈括從三個層次概括了ChatGPT們要度過目前數據屏障的關鍵。在移除數據屏障的過程中,OpenAI可能還面臨著一樁難題。OpenAI已經面臨與自己的金主微軟之間尷尬的客戶競爭,很多企業級客戶開始在OpenAI和Azure OpenAI中進行權衡。有觀點指出,OpenAI已經向Azure保留了一些模型,迫使很多公司直接和OpenAI合作,比如3月1日開始,OpenAI對外銷售其語音識別模型Whisper的訪問權限,目前該模型仍不可用于Azure OpenAI服務。亞洲地區大規模封號事件開始后,OpenAI的系統出現了部分問題,而微軟的Azure云上所提供的OpenAI相關服務仍然保持穩定,客戶還可在運行與OpenAI相同的模型時獲得Microsoft Azure的安全功能。安全性,已成為微軟從OpenAI手上搶奪客戶的一大優勢。接下來,OpenAI需要在紛繁復雜的線頭中厘清制約發展的真正瓶頸在哪兒。OpenAI的聯合創始人John Schulman給別人提出的建議也適用于其自身:選擇去解決什么問題的能力比你本身擁有的技能更重要。