完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>
標(biāo)簽 > 大模型
以大模型作為基礎(chǔ)模型支撐AI產(chǎn)業(yè)應(yīng)用邏輯已經(jīng)被證明實用性,AI大模型為AI落地應(yīng)用提供了一種通用化的解決方案;各自各樣參數(shù)不一、面向不同行業(yè)、面向不同任務(wù)的“大模型”也陸續(xù)發(fā)布,大模型已經(jīng)成為整個AI 界追逐的寵兒,AI大模型有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點。
文章:3105個 瀏覽:4073次 帖子:20個
深度學(xué)習(xí)(DL)與自動駕駛(AD)的融合標(biāo)志著該領(lǐng)域的重大飛躍,吸引了學(xué)術(shù)界和工業(yè)界的關(guān)注。配備了攝像頭和激光雷達(dá)的AD系統(tǒng)模擬了類似人類的決策過程。
谷歌大型模型終于開放源代碼,遲到但重要的開源戰(zhàn)略
在人工智能領(lǐng)域,谷歌可以算是開源的鼻祖。今天幾乎所有的大語言模型,都基于谷歌在 2017 年發(fā)布的 Transformer 論文;谷歌的發(fā)布的 BERT...
利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(下)
對于語言模型(LLM)幻覺,知識圖譜被證明優(yōu)于向量數(shù)據(jù)庫。知識圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和一致的信息,減少了LLM中出現(xiàn)幻覺的可能性。
2024-02-22 標(biāo)簽:數(shù)據(jù)庫語言模型知識圖譜 1694 0
利用知識圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動的RAG系統(tǒng)(上)
向量數(shù)據(jù)庫是一組高維向量的集合,用于表示實體或概念,例如單詞、短語或文檔。向量數(shù)據(jù)庫可以根據(jù)實體或概念的向量表示來度量它們之間的相似性或關(guān)聯(lián)性。
2024-02-22 標(biāo)簽:數(shù)據(jù)庫大模型 1617 0
對于模型訓(xùn)練,我們可以采用 3D 并行訓(xùn)練的方式來實現(xiàn)。將模型參數(shù)和梯度張量劃分為多個分區(qū),分配到不同 GPU 卡上進(jìn)行計算。每張卡負(fù)責(zé)自己分區(qū)的梯度和...
什么是混合專家模型?混合專家模型 (MoEs)優(yōu)劣勢分析
門控網(wǎng)絡(luò)或路由: 這個部分用于決定哪些令牌 (token) 被發(fā)送到哪個專家。例如,在下圖中,“More”這個令牌可能被發(fā)送到第二個專家,而“Param...
2024-02-22 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)AITransformer 5710 0
大模型:即基礎(chǔ)模型,在海量數(shù)據(jù)和計算資源的基礎(chǔ)上通過預(yù)先訓(xùn)練出來的,具有大參數(shù)規(guī)模的深度學(xué)習(xí)模型 >狹義多指大語言模型,廣義還包括CV、多模態(tài)等...
2024-02-22 標(biāo)簽:AI人工智能大數(shù)據(jù) 522 0
大模型系列:Flash Attention V2整體運(yùn)作流程
基于1.1中的思想,我們在V2中將原本的內(nèi)外循環(huán)置換了位置(示意圖就不畫了,基本可以對比V1示意圖想象出來)。我們直接來看V2的偽代碼(如果對以下偽代碼...
自然語言處理領(lǐng)域存在著一個非常有趣的現(xiàn)象:在多語言模型中,不同的語言之間似乎存在著一種隱含的對齊關(guān)系。
2024-02-20 標(biāo)簽:機(jī)器學(xué)習(xí)自然語言處理大模型 848 0
Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會 上分享了他如何在測試中使用 ChatGPT。
AI新基建引領(lǐng)“三浪變革”,驅(qū)動產(chǎn)業(yè)升級與創(chuàng)新
2023年迎來“知識生產(chǎn)力變革”第一浪,以大語言模型為核心,實現(xiàn)知識工程的生產(chǎn)力變革,類似于中世紀(jì)的印刷革命。大語言模型具有超高速學(xué)習(xí)能力,可在人機(jī)協(xié)同...
小紅書搜索團(tuán)隊研究新框架:負(fù)樣本在大模型蒸餾中的重要性
在思維鏈(CoT)提示的幫助下,大語言模型(LLMs)展現(xiàn)出強(qiáng)大的推理能力。然而,思維鏈已被證明是千億級參數(shù)模型才具有的涌現(xiàn)能力。
還有一個與批次大小有關(guān)的數(shù)量,它們在一個有趣的點上相交。這個點不取決于硬件之外的任何因素。舉例來說,在 A10G 和 A100 上,硬件可以實現(xiàn)的總浮點...
2024-01-29 標(biāo)簽:神經(jīng)網(wǎng)絡(luò)gpuAI 644 0
在當(dāng)今的智能制造業(yè)中,智能化和數(shù)字化的發(fā)展已經(jīng)成為制造業(yè)的主要趨勢。隨著人工智能(AI)技術(shù)的不斷發(fā)展和進(jìn)步,智能制造的智慧工廠已經(jīng)成為制造業(yè)的一個重要...
2024-01-26 標(biāo)簽:物聯(lián)網(wǎng)AI智能制造 1565 0
探索ICLR‘24 Spotlight中的首個十億級別3D通用大模型
Uni3D在少樣本點云部件分割任務(wù)上也展示出了卓越的性能。下表結(jié)果顯示,在各種實驗條件下,Uni3D的性能都明顯優(yōu)于Point-BERT等基線方法。
大模型Reward Model的trick應(yīng)用技巧
借助對比學(xué)習(xí)和元學(xué)習(xí)的方法。增加對比學(xué)習(xí)的loss,對比學(xué)習(xí)通過增強(qiáng)模型區(qū)分能力,來增強(qiáng)RM的對好壞的區(qū)分水平。元學(xué)習(xí)則使獎勵模型能夠維持區(qū)分分布外樣本...
字節(jié)發(fā)布機(jī)器人領(lǐng)域首個開源視覺-語言操作大模型,激發(fā)開源VLMs更大潛能
對此,ByteDance Research 基于開源的多模態(tài)語言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機(jī)器...
Continous Batching大模型推理關(guān)鍵技術(shù)
TurboTransformers算是比較早期指出輸入變長需要新的Batching方法的論文。在2020年上半年,我開始思考如何把變長輸入Batchin...
計算機(jī)系統(tǒng)如何應(yīng)對大模型時代的挑戰(zhàn)與機(jī)遇
“操作系統(tǒng)管理著計算機(jī)的資源和進(jìn)程,以及所有的硬件和軟件。計算機(jī)的操作系統(tǒng)讓用戶在不需要了解計算機(jī)語言的情況下與計算機(jī)進(jìn)行交互?!边@是我們對計算機(jī)系統(tǒng)的...
2024-01-23 標(biāo)簽:云計算計算機(jī)系統(tǒng)數(shù)據(jù)庫 984 0
編輯推薦廠商產(chǎn)品技術(shù)軟件/工具OS/語言教程專題
電機(jī)控制 | DSP | 氮化鎵 | 功率放大器 | ChatGPT | 自動駕駛 | TI | 瑞薩電子 |
BLDC | PLC | 碳化硅 | 二極管 | OpenAI | 元宇宙 | 安森美 | ADI |
無刷電機(jī) | FOC | IGBT | 逆變器 | 文心一言 | 5G | 英飛凌 | 羅姆 |
直流電機(jī) | PID | MOSFET | 傳感器 | 人工智能 | 物聯(lián)網(wǎng) | NXP | 賽靈思 |
步進(jìn)電機(jī) | SPWM | 充電樁 | IPM | 機(jī)器視覺 | 無人機(jī) | 三菱電機(jī) | ST |
伺服電機(jī) | SVPWM | 光伏發(fā)電 | UPS | AR | 智能電網(wǎng) | 國民技術(shù) | Microchip |
Arduino | BeagleBone | 樹莓派 | STM32 | MSP430 | EFM32 | ARM mbed | EDA |
示波器 | LPC | imx8 | PSoC | Altium Designer | Allegro | Mentor | Pads |
OrCAD | Cadence | AutoCAD | 華秋DFM | Keil | MATLAB | MPLAB | Quartus |
C++ | Java | Python | JavaScript | node.js | RISC-V | verilog | Tensorflow |
Android | iOS | linux | RTOS | FreeRTOS | LiteOS | RT-THread | uCOS |
DuerOS | Brillo | Windows11 | HarmonyOS |