久久久免费电影_国产亚洲精品久久久久久牛牛_久久久av亚洲男天堂_国产精品6699

您的位置:首頁 >科技 >

“喂”給人工智能的真實數(shù)據(jù)終將耗盡 合成數(shù)據(jù)能否讓AI模型精確可靠?

2025-01-27 13:03:44    來源:科技日報
人工智能(AI)初創(chuàng)公司xAI創(chuàng)始人埃隆·馬斯克近日表示:“在AI訓練中,我們現(xiàn)在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數(shù)據(jù)將在2到8年內(nèi)消耗殆盡。鑒于真實數(shù)據(jù)日益稀缺,為滿足AI的“胃口”,科技行業(yè)正轉向使用合成數(shù)據(jù)。

澳大利亞“對話”網(wǎng)站在本月稍早時間報道中指出,合成數(shù)據(jù)具有諸多優(yōu)勢,但過度依賴合成數(shù)據(jù)也可能削弱AI的精確性和可靠性。

圖片來源:物理學家組織網(wǎng)

合成數(shù)據(jù)應運而生

以往,科技公司主要依賴真實數(shù)據(jù)來構建、訓練和改進AI模型。真實數(shù)據(jù)是指由人類創(chuàng)建的文本、視頻和圖像。它們通過調(diào)查、實驗、觀察或挖掘網(wǎng)站和社交媒體等途徑被收集而來。

真實數(shù)據(jù)因蘊含真實事件以及其場景和背景而極具價值,但其并非盡善盡美。它可能摻雜拼寫錯誤、不一致或無關的內(nèi)容,甚至潛藏嚴重偏見,導致生成式AI模型在某些情況下創(chuàng)建的圖像僅展示男性或白人形象。

但真實數(shù)據(jù)日益匱乏,因為人類生成數(shù)據(jù)的速度趕不上AI不斷增長的需求。

美國開放人工智能研究中心聯(lián)合創(chuàng)始人伊利亞·蘇茨克維爾在去年12月舉行的機器學習會議上聲稱,AI行業(yè)已觸及他所稱的“數(shù)據(jù)峰值”,AI的訓練數(shù)據(jù)如同化石燃料一樣面臨著耗盡的危機。此外,有研究預測,到2026年,ChatGPT等大型語言模型的訓練將耗盡互聯(lián)網(wǎng)上所有可用文本數(shù)據(jù),屆時將沒有新的真實數(shù)據(jù)可供使用。

為給AI提供充足的“養(yǎng)分”,一種由算法生成的、模仿真實世界情況的數(shù)據(jù)——合成數(shù)據(jù)應運而生。合成數(shù)據(jù)是在數(shù)字世界中創(chuàng)造的,而非從現(xiàn)實世界收集或測量而來。它可以作為真實世界數(shù)據(jù)的替代品,來訓練、測試、驗證AI模型。

從理論上來說,合成數(shù)據(jù)為訓練AI模型提供了一種經(jīng)濟高效且快捷的解決方案。它有效解決了AI訓練使用真實數(shù)據(jù)時飽受詬病的隱私問題和道德問題,尤其是涉及個人健康數(shù)據(jù)等敏感信息時。更重要的是,與真實數(shù)據(jù)不同,合成數(shù)據(jù)在理論上可以無限供應。

研究機構高德納公司估計,2024年AI及分析項目使用的數(shù)據(jù)中,約60%是合成數(shù)據(jù)。到2030年,AI模型使用的絕大部分數(shù)據(jù)將是由AI生成的合成數(shù)據(jù)。

科技公司來者不拒

事實上,微軟、元宇宙平臺公司,以及Anthropic等眾多科技頭部企業(yè)和初創(chuàng)企業(yè),已經(jīng)開始廣泛使用合成數(shù)據(jù)來訓練其AI模型。

例如,微軟在1月8日開源的AI模型“Phi-4”,便是合成數(shù)據(jù)攜手真實數(shù)據(jù)訓練的;谷歌的“Gemma”模型也采用了類似方法。Anthropic公司也利用部分合成數(shù)據(jù),開發(fā)出其性能最優(yōu)異的AI系統(tǒng)之一“Claude 3.5 Sonnet”。蘋果自研AI系統(tǒng)Apple Intelligence,在預訓練階段,也大量使用了合成數(shù)據(jù)。

隨著科技公司對合成數(shù)據(jù)的需求與日俱增,生產(chǎn)合成數(shù)據(jù)的工具也接踵而至。

英偉達公司發(fā)布的3D仿真數(shù)據(jù)生成引擎Omniverse Replicator,能夠生成合成數(shù)據(jù),用于自動駕駛汽車和機器人訓練。去年6月,英偉達開源了Nemotron-4340b系列模型,開發(fā)者可使用該模型生成合成數(shù)據(jù),用于訓練大型語言模型,以應用于醫(yī)療保健、金融、制造、零售等行業(yè)。在醫(yī)療、金融等專業(yè)領域,該模型能夠根據(jù)特定需求生成高質(zhì)量的合成數(shù)據(jù),幫助構建更為精準的行業(yè)專屬模型。微軟推出的開源合成數(shù)據(jù)工具Synthetic Data Showcase則旨在通過生成合成數(shù)據(jù)和用戶界面,實現(xiàn)隱私保護的數(shù)據(jù)共享和分析。亞馬遜云科技推出的Amazon SageMaker Ground Truth也能為用戶生成數(shù)十萬張自動標記的合成圖像。

此外,去年12月,元宇宙平臺公司推出開源大模型Llama 3.3,更是大幅降低了生成合成數(shù)據(jù)的成本。

過度依賴風險難測

盡管合成數(shù)據(jù)暫時解決了AI訓練的燃眉之急,但它也并非盡善盡美。

一個關鍵問題在于:當AI模型過于依賴合成數(shù)據(jù)時,它們可能會“崩潰”。它們會產(chǎn)生更多“幻覺”,編造看似合理可信但實際上并不存在的信息。而且,AI模型的質(zhì)量和性能也會飛速下降,甚至無法使用。例如,某個AI模型生成的數(shù)據(jù)出現(xiàn)了一些拼寫錯誤,利用這些充滿了錯誤的數(shù)據(jù)訓練其他模型,這些AI模型必定會“以訛傳訛”,導致更大的錯誤。

此外,合成數(shù)據(jù)也存在過于簡單化的風險。它可能缺乏真實數(shù)據(jù)集蘊含的細節(jié)和多樣性,這可能導致在其上訓練的AI模型的輸出也過于簡單,缺乏實用性。

為解決這些問題,國際標準化組織需要著手創(chuàng)建強大的系統(tǒng),來跟蹤和驗證AI訓練數(shù)據(jù)。此外,AI系統(tǒng)可以配備元數(shù)據(jù)追蹤功能,讓用戶或系統(tǒng)能對合成數(shù)據(jù)進行溯源。人類也需要在AI模型的整個訓練過程中對合成數(shù)據(jù)進行監(jiān)督,以確保其高質(zhì)量且符合道德標準。

AI的未來在很大程度上取決于數(shù)據(jù)的質(zhì)量,合成數(shù)據(jù)將在克服數(shù)據(jù)短缺方面發(fā)揮越來越重要的作用。對合成數(shù)據(jù)的使用,人們必須保持謹慎態(tài)度,盡量減少錯誤,確保其作為真實數(shù)據(jù)的可靠補充,從而保障AI系統(tǒng)的準確性和可信度。

關鍵詞:

相關閱讀

久久久免费电影_国产亚洲精品久久久久久牛牛_久久久av亚洲男天堂_国产精品6699
日本www在线播放| 国产嫩草在线观看| www.五月天色| 玖玖爱视频在线| 韩国日本美国免费毛片| 日本女优爱爱视频| 免费看黄色一级大片| 亚洲成人av免费看| 亚洲免费av一区| 久久精品国产露脸对白| 在线观看av免费观看| 1314成人网| 免费的一级黄色片| 欧美亚洲日本一区二区三区| 69堂免费视频| 欧美两根一起进3p做受视频| 尤蜜粉嫩av国产一区二区三区| www午夜视频| 中文字幕超清在线免费观看| 日本道在线视频| 日本中文字幕在线视频观看| 亚洲 高清 成人 动漫| 欧美牲交a欧美牲交aⅴ免费真| 高清一区二区视频| 青青草原播放器| 日韩精品在线中文字幕| 亚洲色成人一区二区三区小说| 天天爱天天操天天干| 九九久久久久久| www.xxx麻豆| 88av.com| 在线观看视频黄色| 东北少妇不带套对白| 激情婷婷综合网| 中文字幕第66页| 婷婷五月综合缴情在线视频| 91香蕉视频污版| 久久视频免费在线| 国产淫片免费看| 亚洲18在线看污www麻豆| 51xx午夜影福利| 午夜精品久久久内射近拍高清 | 免费黄色日本网站| 精品无码国产一区二区三区av| 国产av麻豆mag剧集| 韩国中文字幕av| 国产911在线观看| www.玖玖玖| av不卡在线免费观看| 一女被多男玩喷潮视频| 在线观看免费av网址| 大陆av在线播放| 在线观看亚洲色图| 日韩极品视频在线观看| 成人亚洲精品777777大片| 日韩中文字幕亚洲精品欧美| 97公开免费视频| 精品视频在线观看一区二区| 中文字幕国内自拍| 黄网站欧美内射| 手机在线视频你懂的| 精品久久久噜噜噜噜久久图片| 天天想你在线观看完整版电影免费| 国产成人精品视频ⅴa片软件竹菊| 欧美美女黄色网| 一级黄色片国产| 欧洲熟妇精品视频| 黄色国产一级视频| 国产日本欧美在线| 蜜臀av免费观看| 2022亚洲天堂| 国产91沈先生在线播放| 国产精品久久久久久9999| 国产男女激情视频| 久久久久久人妻一区二区三区| 91网址在线观看精品| 香蕉视频网站入口| 久久久999免费视频| 2022中文字幕| 2025韩国大尺度电影| 国产又粗又长又大的视频| 人人妻人人添人人爽欧美一区| 青青草免费在线视频观看| 国产欧美激情视频| 久热精品在线播放| 妓院一钑片免看黄大片| 国产二区视频在线播放| 国产精品成人久久电影| 小泽玛利亚av在线| 最新视频 - x88av| 青娱乐精品在线| 国产高清av片| 8x8x成人免费视频| 亚洲a级黄色片| 日韩在线一区视频| 亚洲欧美国产中文| 狠狠躁狠狠躁视频专区| 冲田杏梨av在线| 黄色一级二级三级| 男女视频一区二区三区| 日韩免费高清在线| 91av俱乐部| 国产主播中文字幕| 在线免费视频一区| 五月天婷婷亚洲| www.污网站| 中文字幕av导航| 亚洲免费视频播放| 青青视频免费在线观看| 奇米777四色影视在线看| 第九区2中文字幕| 91网站在线观看免费| 成人av在线不卡| 久久视频这里有精品| 国产一区二区在线视频播放| 日韩欧美视频网站| 国产精品无码专区av在线播放| 激情婷婷综合网| 日本免费色视频| 最新av在线免费观看| www婷婷av久久久影片| 成人免费播放器| 能在线观看的av| 亚洲不卡视频在线| 亚洲一区二区偷拍| 欧美一级中文字幕| 欧美亚洲日本一区二区三区| 国产成人无码一二三区视频| 国产91色在线观看| 日本高清免费观看| 最新av网址在线观看| 国产3p露脸普通话对白| 日日摸天天爽天天爽视频| 污污网站在线观看视频| 99久re热视频精品98| 成人免费性视频| 激情综合网俺也去| 国产成年人在线观看| 老太脱裤子让老头玩xxxxx| 密臀av一区二区三区| 99999精品| 久久久久久久午夜| 中文字幕永久有效| 999久久欧美人妻一区二区| 色综合av综合无码综合网站| 国产成人在线综合| 国产主播自拍av| 亚洲娇小娇小娇小| 精品国产一区二区三区无码| 国产精品亚洲二区在线观看| 国产乱码一区二区三区四区| www插插插无码免费视频网站| 情侣黄网站免费看| 精品一区二区成人免费视频| 欧美v在线观看| 老司机av福利| 少妇高清精品毛片在线视频| 亚洲最新免费视频| 日韩精品一区二区三区不卡| 国产一区一区三区| 日韩av一二三四| 免费看黄色a级片| 十八禁视频网站在线观看| 黄色网zhan| 亚洲成色www.777999| 日韩精品一区二区免费| 亚洲一区日韩精品| 黄色免费视频大全| 国产a级片免费看| 欧美黑人又粗又大又爽免费| 久久av高潮av| 激情五月俺来也| 自慰无码一区二区三区| 一区二区三区一级片| 91在线视频观看免费| 国产精品成人久久电影| 青青草原播放器| 国产免费视频传媒| 成人性免费视频| 97超碰免费观看| 三级视频中文字幕| 欧美日韩在线中文| 欧美一区二区三区综合| 九九九九九国产| 丁香婷婷激情网| 奇米精品一区二区三区| 超碰10000| 91丝袜超薄交口足| 一区二区xxx| 精品人妻一区二区三区四区在线 | 男人天堂a在线| 手机在线国产视频| 热久久精品免费视频| 欧美老熟妇喷水| 久久综合久久网| 777久久精品一区二区三区无码 | 日韩精品综合在线| 可以免费看的黄色网址| 亚洲天堂网站在线| 国产精品视频中文字幕|