• <li id="y80kg"></li>
    <strike id="y80kg"></strike>
    <ul id="y80kg"></ul>
  • <strike id="y80kg"><s id="y80kg"></s></strike>
    <strike id="y80kg"><s id="y80kg"></s></strike>
    百戰(zhàn)歸來(lái),清大EMBA再啟程

    DeepSeek核心技術(shù)原理和本地部署微調(diào)實(shí)操課程

    周紅偉

    周紅偉 現(xiàn)任云宇宙科技CEO

    常駐地:重慶
    邀請(qǐng)老師:13439064501 陳助理
    主講課程:1、《人工智能算法方法論和知識(shí)體系》 2、《人工智能和大數(shù)據(jù)驅(qū)動(dòng)智能決策》 3、《人工智能和大數(shù)據(jù)核心應(yīng)用和商業(yè)化落地》 4、《人工智能方法論在金融行業(yè)的應(yīng)用》 5、《人工智能方法論在通信行業(yè)的應(yīng)用》 6、《互聯(lián)網(wǎng)金融(消費(fèi)金融)企業(yè)的AI大數(shù)據(jù)應(yīng)用》 7、《互聯(lián)網(wǎng)大數(shù)據(jù)在智慧城市方面的應(yīng)用》 8、《大數(shù)據(jù)時(shí)代的人工智能思維》 9、《互聯(lián)網(wǎng)金融的大數(shù)據(jù)風(fēng)控》 10、《金融大數(shù)據(jù)反欺詐實(shí)踐》 11、《企業(yè)數(shù)據(jù)治理落地實(shí)踐》 12、《元宇宙認(rèn)知

    課程背景

    隨著人工智能技術(shù)的快速發(fā)展,智能助手(如DeepSeek-V3)在多模態(tài)理解、個(gè)性化交互、知識(shí)推理等領(lǐng)域的應(yīng)用日益廣泛。DeepSeek-V3作為深度求索公司推出的第三代智能助手,憑借其先進(jìn)的核心技術(shù)(如大規(guī)模預(yù)訓(xùn)練、多模態(tài)理解、上下文感知等),在智能客服、內(nèi)容創(chuàng)作、教育、醫(yī)療等領(lǐng)域展現(xiàn)了強(qiáng)大的潛力。

    然而,要將DeepSeek-V3的能力充分發(fā)揮并應(yīng)用于實(shí)際業(yè)務(wù)場(chǎng)景,不僅需要深入理解其核心技術(shù)原理,還需要掌握本地部署和微調(diào)的方法,以滿足特定領(lǐng)域或企業(yè)的定制化需求。為此,本課程旨在幫助學(xué)員系統(tǒng)學(xué)習(xí)DeepSeek-V3的核心技術(shù)原理,并通過(guò)實(shí)操掌握本地部署和微調(diào)的技能,從而提升在實(shí)際項(xiàng)目中的應(yīng)用能力。

    課程收益

    1. 深刻理解DeepSeek-V3的核心技術(shù)原理

    · 掌握DeepSeek-V3的架構(gòu)設(shè)計(jì)、多模態(tài)理解、上下文感知、知識(shí)圖譜等核心技術(shù)。

    · 掌握大規(guī)模預(yù)訓(xùn)練模型(如Transformer)的工作原理及其在DeepSeek-V3中的應(yīng)用。

    2. 掌握DeepSeek-V3的本地部署方法

    · 學(xué)習(xí)如何搭建適合DeepSeek-V3運(yùn)行的本地環(huán)境(包括硬件配置、依賴(lài)庫(kù)安裝等)。

    · 掌握DeepSeek-V3的本地部署流程,包括模型加載、服務(wù)啟動(dòng)和接口調(diào)用。

    · 掌握如何優(yōu)化部署性能,以支持高并發(fā)和低延遲的應(yīng)用場(chǎng)景。

    3. 學(xué)會(huì)DeepSeek-V3的微調(diào)與定制化

    · 掌握如何利用領(lǐng)域數(shù)據(jù)對(duì)DeepSeek-V3進(jìn)行微調(diào),以提升其在特定任務(wù)中的表現(xiàn)。

    · 學(xué)習(xí)微調(diào)過(guò)程中的關(guān)鍵技術(shù),包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、參數(shù)調(diào)優(yōu)等。

    4. 提升實(shí)際項(xiàng)目中的應(yīng)用能力

    · 通過(guò)實(shí)戰(zhàn)案例,學(xué)習(xí)如何將DeepSeek-V3應(yīng)用于智能客服、內(nèi)容生成、知識(shí)問(wèn)答等場(chǎng)景。

    課程時(shí)間 2天

    課程大綱

    第一天課程:DeepSeek-V3/R1核心技術(shù)架構(gòu)和訓(xùn)練過(guò)程

    上午課程

    第一部分 DeepSeek-V3的架構(gòu)創(chuàng)新:訓(xùn)練GPU和成本均低,但效果卓越

    1.1 V3風(fēng)靡海內(nèi)外的關(guān)鍵因素:訓(xùn)練成本極低、引領(lǐng)前沿創(chuàng)新

    1.1.1 V3訓(xùn)練成本:所用的GPU訓(xùn)練資源僅為L(zhǎng)lama 3.1 405B的差不多1/14

    1.1.2 在國(guó)內(nèi)也能引領(lǐng)世界級(jí)前沿

    1.2 模型架構(gòu):MLA、負(fù)載均衡的MoE、Multi-Token預(yù)測(cè)

    1.2.1 多頭潛在注意力

    1.2.2. 無(wú)輔助損失的負(fù)載平衡 DeepSeekMoE

    1.2.3 多token預(yù)測(cè):Multi-Token Prediction顯著加快模型的解碼速度

    第二部分 DeepSeek-V3基礎(chǔ)設(shè)施層面的創(chuàng)新:FP8 訓(xùn)練等

    2.1 訓(xùn)練框架(含GPU的內(nèi)部結(jié)構(gòu)示意圖)

    2.1.1 雙管道DualPipe與計(jì)算-通信重疊

    2.1.2 跨節(jié)點(diǎn)全對(duì)全通信的高效實(shí)現(xiàn):通過(guò)PXT連接CUDA和底層GPU硬件

    2.1.3. 極致內(nèi)存節(jié)省與最小開(kāi)銷(xiāo)

    2.2 FP8訓(xùn)練:雖算的快 但精度不夠,故需提高精度

    2.2.1 混合精度框架

    2.2.2. 通過(guò)量化和乘法提高精度

    2.2.2 低精度存儲(chǔ)和通信:降低內(nèi)存和通信開(kāi)銷(xiāo)

    2.3 推理與部署

    2.3.1 預(yù)填充

    2.3.2 解碼

    2.4 硬件設(shè)計(jì)建議

    下午課程

    第三部分 DeepSeek-V3的預(yù)訓(xùn)練與后訓(xùn)練

    3.1 預(yù)訓(xùn)練

    3.1.1 數(shù)據(jù)構(gòu)建:提高數(shù)學(xué)、編程、多語(yǔ)言樣本,最終14.8T語(yǔ)料

    3.1.2 超參數(shù)

    3.1.3 長(zhǎng)上下文擴(kuò)展

    3.1.4 評(píng)估與討論

    3.2 訓(xùn)練后處理:透露了大半后來(lái)引爆全球的R1正式版訓(xùn)練流程

    3.2.1 監(jiān)督微調(diào)

    3.2.2 強(qiáng)化學(xué)習(xí):涉及獎(jiǎng)勵(lì)模型和GRPO

    3.2.3 評(píng)估與討論:關(guān)于DeepSeek-R1提煉與多token預(yù)測(cè)

    第四部分 DeepSeek R1:如何通過(guò)純RL訓(xùn)練大模型的推理能力

    4.1 提出背景與相關(guān)工作

    4.1.1 R1-Zero的提出背景:無(wú)需人類(lèi)數(shù)據(jù),從零實(shí)現(xiàn)自我迭代

    4.1.2 R1的提出背景:解決Zero可讀性差等問(wèn)題

    4.2 DeepSeek-R1-Zero:規(guī)則驅(qū)動(dòng)的大規(guī)模RL訓(xùn)練,無(wú)冷啟動(dòng)、無(wú)SFT

    4.2.1 RL算法GRPO:不需要critic

    4.2.2 規(guī)則獎(jiǎng)勵(lì)建模(準(zhǔn)確率獎(jiǎng)勵(lì) + 格式獎(jiǎng)勵(lì)):不用訓(xùn)練專(zhuān)門(mén)的獎(jiǎng)勵(lì)模型RM

    4.2.3 訓(xùn)練模板:通過(guò)prompt讓Zero啟動(dòng)深度思考的推理模式

    4.2.4 Zero的性能、自我進(jìn)化過(guò)程和頓悟時(shí)刻

    4.3 DeepSeek-R1:先冷啟動(dòng)數(shù)據(jù)SFT 再RL,之后再SFT 再RL

    4.3.1 階段一 冷啟動(dòng)(主要關(guān)注推理):通過(guò)R1-Zero生成數(shù)千條長(zhǎng)CoT數(shù)據(jù)

    4.3.2 階段二 面向推理的GRPO RL:類(lèi)似Zero的規(guī)則獎(jiǎng)勵(lì),但增加語(yǔ)言一致性獎(jiǎng)勵(lì)

    4.3.3 階段三 V3上的的兩輪SFT(結(jié)合rejection sampling):涉及80w通用層面的推理和非推理數(shù)據(jù)

    4.3.4 階段四 所有場(chǎng)景的RL:提高有用性和無(wú)害性,且混合規(guī)則獎(jiǎng)勵(lì)和偏好獎(jiǎng)勵(lì)

    4.4 蒸餾:賦予小模型推理能力

    4.5 一些經(jīng)驗(yàn)總結(jié):成功和失敗的經(jīng)驗(yàn)分析總結(jié)

    第二天課程:DeepSeek本地部署和微調(diào)案例實(shí)操

    上午課程

    第五部分 本地部署準(zhǔn)備工作:各個(gè)版本、推理框架、硬件資源

    5.1 DeepSeek-R1的多個(gè)版本:加上2個(gè)原裝671B的,總計(jì)8個(gè)參數(shù)版本

    5.2 主流的大模型推理框架:分為PC端和Android端

    5.3 不同參數(shù)的模型所要求的硬件

    5.4 蒸餾版和滿血版的兩類(lèi)部署

    第六部分 通過(guò)Ollama、vLLM本地部署DeepSeek-R1蒸餾版:支持聯(lián)網(wǎng)搜索及知識(shí)庫(kù)問(wèn)答

    6.1 基于Ollama和各類(lèi)插件構(gòu)建智能對(duì)話:終端、open-webui(支持聯(lián)網(wǎng))、Chatbox

    6.1.1 Ollama下的終端命令行交互

    6.1.2 Ollama下的open-webui交互:基于docker安裝,且支持聯(lián)網(wǎng)搜索

    6.1.3 基于Ollama + ChatBox部署deepseek-r1:7b

    6.2 基于Ollama和Page Assist/AnythingLLM構(gòu)建本地知識(shí)庫(kù)問(wèn)答系統(tǒng)

    6.2.1 基于Ollama + Page Assist搭建本地知識(shí)庫(kù)問(wèn)答系統(tǒng):且支持聯(lián)網(wǎng)搜索

    6.2.2 基于Ollama + AnythingLLM搭建本地知識(shí)庫(kù)問(wèn)答

    6.3 通過(guò)vLLM推理deepseek-r1

    6.3.1 基于vLLM的命令行交互——R1-Distill-Llama-8B

    6.3.2 基于vllm + open WebUi 部署r1 7b

    6.4 本地手機(jī)端部署DeepSeek-R1蒸餾Llama/Qwen后的版本

    下午課程

    第七部分 無(wú)蒸餾前提下本地部署R1 or R1-Zero 671B滿血版

    7.1 折中路徑:無(wú)蒸餾但量化部署Deepseek-R1 671B滿血版

    7.1.1 本地CPU上運(yùn)行 Deepseek-R1 的完整的硬件 + 軟件設(shè)置

    7.1.2 GPU上跑無(wú)蒸餾但量化的Deepseek-R1 671B滿血版

    7.2 企業(yè)級(jí)部署:無(wú)蒸餾不量化部署Deepseek-R1 671B滿血版

    專(zhuān)利和文獻(xiàn):

    深度學(xué)習(xí)國(guó)際發(fā)明專(zhuān)利

    1) 基于深度學(xué)習(xí)的圖像檢索方法及裝置,專(zhuān)利公開(kāi)公告號(hào):CN107368614A。專(zhuān)利類(lèi)型:發(fā)明公布。發(fā)明人:周紅偉;李凱;任偉;李慶;郭奇杰;周楊;劉川郁

    2) Simulation model and droplet ejection performance of a thermal-bubble microejector,Hongwei Zhou,A.M.Gué,Sensors and Actuators B: Chemical Volume 145,Issue 1,4 March 2010,Pages 311-319

    3)Simulation Bubble Nucleation and Bubble Growth of a Thermal Bubble Microejector,Hongwei Zhou,A.M.Gué,Excerpt from the Proceedings of the COMSOL Conference 2009 Mila

    客服微信

    返回
    頂部
    2021精品国产综合久久| 香蕉久久夜色精品国产小说| 中文字幕日韩wm二在线看| 国产愉拍精品手机| 高清精品一区二区三区一区| 91精品国产91久久久久久蜜臀| 午夜天堂精品久久久久| 久久免费精品一区二区| 亚洲综合精品香蕉久久网| 北条麻妃久久99精品| 国产精品成人99久久久久| 日韩在线不卡视频| 日韩免费一区二区三区在线 | 精品国产av一二三四区| 国产精品1024| 亚洲乱码一区二区三区国产精品| 亚洲精品网站在线观看你懂的| 日产精品久久久久久久| 久久99精品久久久久子伦小说 | 国内精品在线播放| 精品久久久久久无码人妻中文字幕 | 国产精品无码v在线观看| www.午夜精品| 亚洲日韩精品无码专区网站| 污污网站国产精品白丝袜| 伊人精品久久久久7777| 丰满人妻熟妇乱又伦精品软件| 视频一区二区精品的福利| www.99精品视频在线播放| 国产成人久久久精品二区三区| 国产高清在线精品一区二区| 精品无码久久久久久久久久| 精品无码国产污污污免费网站国产 | 午夜精品久久久久久毛片| 久久久久亚洲精品影视| 四虎成人精品无码| 91精品久久国产青草| 国产精品久久精品| 亚洲av永久中文无码精品综合| 国产伦精品一区二区三区不卡| 国产视频精品免费|