制造論壇-制造行業(yè)自己的交流社區(qū)!
標(biāo)題:
開(kāi)源的大模型有哪些?
[打印本頁(yè)]
作者:
馬蜂科技
時(shí)間:
2025-2-21 11:06
標(biāo)題:
開(kāi)源的大模型有哪些?
以下是一些常見(jiàn)的開(kāi)源大模型,按語(yǔ)言模型和視覺(jué)模型分類介紹:
開(kāi)源語(yǔ)言模型
Meta Llama 3
由Meta開(kāi)發(fā)的語(yǔ)言模型家族,提供多種大小版本,適合從輕量級(jí)移動(dòng)客戶端到大規(guī)模云部署的多種應(yīng)用場(chǎng)景。
優(yōu)點(diǎn)是可以在相對(duì)低功耗的硬件上運(yùn)行,但其訓(xùn)練數(shù)據(jù)并未完全公開(kāi),因此是否完全符合開(kāi)源定義存在爭(zhēng)議。
BLOOM
由Hugging Face主導(dǎo)開(kāi)發(fā)的多語(yǔ)言語(yǔ)言模型,參數(shù)規(guī)模達(dá)1760億。
采用“負(fù)責(zé)任AI許可”,雖然不是完全開(kāi)源,但可以免費(fèi)使用和分發(fā),只要不用于許可條款中定義的有害用途。
GPT-2
OpenAI開(kāi)源的第二代語(yǔ)言模型,基于12億參數(shù)。
適用于多種語(yǔ)言任務(wù),如文本生成和**機(jī)器人,采用MIT許可協(xié)議,符合開(kāi)源原則。
Falcon
由阿布扎比技術(shù)創(chuàng)新研究所開(kāi)發(fā),提供40B和180B兩種版本。
40B版本采用Apache 2.0許可,符合開(kāi)源定義,而180B版本使用和分發(fā)有一定限制。
Grok.AI
由X.ai開(kāi)發(fā)的“專家混合”模型,基礎(chǔ)模型更通用。
盡管公開(kāi)了模型權(quán)重和架構(gòu),但未公開(kāi)所有代碼和訓(xùn)練數(shù)據(jù),因此其開(kāi)源性存在爭(zhēng)議。
DeepSeek-R1
由DeepSeek AI開(kāi)發(fā)的開(kāi)源權(quán)重模型,以較低成本提供強(qiáng)大的推理能力。
可通過(guò)Hugging Face獲取模型權(quán)重,并支持多種部署方式。
開(kāi)源視覺(jué)模型
Stable Diffusion
最流行的開(kāi)源圖像生成模型之一,支持文本到圖像和圖像到圖像的生成。
能夠生成高度逼真和詳細(xì)的圖像,但使用需要一定的技術(shù)知識(shí)。
YOLO(You Only Look Once)
用于實(shí)時(shí)目標(biāo)檢測(cè)的快速模型,最新版本為YOLOv11。
適用于視頻監(jiān)控、自動(dòng)駕駛和增強(qiáng)現(xiàn)實(shí)等領(lǐng)域。
DETR(Detection Transformer)
基于Transformer的目標(biāo)檢測(cè)模型,適合需要高精度的場(chǎng)景。
這些開(kāi)源模型為開(kāi)發(fā)者提供了廣泛的選擇,可以根據(jù)具體需求選擇合適的模型進(jìn)行研究和應(yīng)用開(kāi)發(fā)。
作者:
夜星晨
時(shí)間:
2025-3-27 21:27
完全同意,你的分析讓人信服。
作者:
花花世界
時(shí)間:
2025-3-28 05:15
期待更多精彩觀點(diǎn)碰撞!
作者:
閃電兔
時(shí)間:
2025-11-30 00:12
完全贊同樓主的看法,這些儀器使用細(xì)節(jié)確實(shí)容易被忽略~
歡迎光臨 制造論壇-制造行業(yè)自己的交流社區(qū)! (http://m.bemediamail.com/)
Powered by Discuz! X3.5