日本a√视频在线,久久青青亚洲国产,亚洲一区欧美二区,免费g片在线观看网站

<style id="k3y6c"><u id="k3y6c"></u></style>

<mark id="k3y6c"></mark>

<mark id="k3y6c"></mark>

<bdo id="b5lmf"></bdo>

<sub id="b5lmf"><dl id="b5lmf"><b id="b5lmf"></b></dl></sub>

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 谷歌 DeepMind 發(fā)布 WebLI-100B：千億級數(shù)據(jù)集解鎖 AI 視覺語言模型的文化多樣性

谷歌 DeepMind 發(fā)布 WebLI-100B：千億級數(shù)據(jù)集解鎖 AI 視覺語言模型的文化多樣性

作者：時間：2025-02-14 來源：IT之家

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

2 月 14 日消息，科技媒體 marktechpost 昨日（2 月 13 日）發(fā)布博文，報道稱谷歌 DeepMind 團隊發(fā)布了 WebLI-100B 千億級數(shù)據(jù)集，并通過增強文化多樣性和多語言性，以及減少子組之間的性能差異來提高包容性。

目前挑戰(zhàn)

注：機器通過學習大型數(shù)據(jù)集來連接圖像和文本，數(shù)據(jù)越多，模型識別模式和提高準確性的能力就越強。視覺語言模型 (VLMs) 依賴這些數(shù)據(jù)集執(zhí)行圖像字幕和視覺問答等任務。

視覺語言模型目前依賴于 Conceptual Captions 和 LAION 等大型數(shù)據(jù)集，包含數(shù)百萬到數(shù)十億的圖像-文本對。這些數(shù)據(jù)集支持零樣本分類和圖像字幕生成，但其發(fā)展已放緩至約 100 億對。

這種限制降低了進一步提高模型精度、包容性和多語言理解的前景，現(xiàn)有方法基于網(wǎng)絡爬取的數(shù)據(jù)，存在樣本質(zhì)量低、語言偏差和多元文化代表性不足等問題。

WebLI-100B 千億級數(shù)據(jù)集

Google DeepMind 的研究人員為了緩解視覺語言模型在文化多樣性和多語言性方面的局限性，提出了 WebLI-100B 數(shù)據(jù)集，該數(shù)據(jù)集包含 1000 億個圖像-文本對，比之前的數(shù)據(jù)集大十倍。

該數(shù)據(jù)集捕獲了罕見的文化概念，并提高了模型在低資源語言和多樣化表示等較少探索領域的性能。與先前的數(shù)據(jù)集不同，WebLI-100B 不是依賴嚴格的過濾（通常會刪除重要的文化細節(jié)），而是專注于擴展數(shù)據(jù)。

該框架涉及在 WebLI-100B 數(shù)據(jù)集的不同子集（1B、10B 和 100B）上預訓練模型，以分析數(shù)據(jù)縮放的影響。

在完整數(shù)據(jù)集上訓練的模型在文化和多語言任務中的表現(xiàn)優(yōu)于在較小數(shù)據(jù)集上訓練的模型，即使使用相同的計算資源。該數(shù)據(jù)集沒有進行激進的過濾，而是保留了語言和文化元素的廣泛代表性，使其更具包容性。

研究結(jié)果表明，將數(shù)據(jù)集大小從 10B 增加到 100B 對以西方為中心的基準測試的影響很小，但在文化多樣性任務和低資源語言檢索方面帶來了改進。

關鍵詞： AI 智能計算 大語言模型

評論

相關推薦

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

南芯科技強勢入局\"多相電源\"市場，提供更高效的\"AI+通用電源\"方案

電源與新能源南芯科技多相電源 AI+通用電源 | 2025-09-02

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

海聯(lián)達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

谷歌正拉攏小型云服務提供商托管 TPU，目標直指英偉達

智能計算谷歌 TPU 芯片 AI | 2025-09-04

尼吉康的事業(yè)介紹

視頻 nichicon 尼吉康汽車電子 IoT AI | 2025-07-25

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

滿足AI需求的關鍵本地生態(tài)系統(tǒng)：臺積電

智能計算 AI 本地生態(tài)系統(tǒng) 臺積電 | 2025-09-14

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

聯(lián)發(fā)科天璣9500參數(shù)：4.21GHz CPU、100 TOPS AI

手機與無線通信聯(lián)發(fā)科天璣9500 CPU AI | 2025-09-09

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產(chǎn)力

winni945 | 2018-09-12

什么時候應該使用RAG、TAG和RAFT AI？

智能計算 RAG TAG RAFT AI | 2025-09-14

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

AI 采用率在大型公司中下降

智能計算 AI 智能計算 | 2025-09-09

Gartner：到2025年末，AI PC將占全球PC市場份額的31%

智能計算 Gartner AI PC | 2025-09-09

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

最新全球生成式AI消費應用榜單Top 100

生成式 AI | 2025-09-02

基于Ai-WB2-12F與Rd-04的雷達檢測系統(tǒng)

設計方案雷達 Ai-WB2-12F Rd-04 | 2025-08-12

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

基于VisitionX制造智能眼鏡

設計方案 AI 智能眼鏡 VisitionX | 2025-08-12

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

釋說芯語16：硬科技：構(gòu)建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

美國或?qū)⒃倭I GAIN法案，要求本國AI芯片制造商向海外供貨前先滿足國內(nèi)需求

AI 芯片英偉達 | 2025-09-11

據(jù)報道，中國明年將使人工智能芯片產(chǎn)量翻三番，華為的晶圓廠將減少對英偉達的依賴

智能計算人工智能 AI 國產(chǎn)替代 | 2025-08-29

焦點

推薦視頻

技術專區(qū)

關閉