AI詞典|30條AI術(shù)語,全網(wǎng)最易懂版!
人工智能技術(shù)正在改變各行各業(yè),但很多技術(shù)概念卻讓人云里霧里。本文通過“定義+案例”的方式解讀AI領(lǐng)域的30條常見術(shù)語,覆蓋基礎(chǔ)理念、訓(xùn)練技術(shù)、應(yīng)用交互等內(nèi)容,幫助從業(yè)者及技術(shù)愛好者快速掌握技術(shù)脈絡(luò)。
基礎(chǔ)理念
1.人工智能
(AI-Artificial Intelligence)
定義:通過計(jì)算機(jī)系統(tǒng)模擬人類智能行為的技術(shù),涵蓋學(xué)習(xí)、推理、感知、決策等能力。目標(biāo)是讓機(jī)器能完成需要人類智慧的任務(wù)。
例如:智能音箱能夠理解“播放周杰倫的歌曲”的指令并執(zhí)行,這背后結(jié)合了語音識別(感知)和意圖理解(推理)這兩種人工智能技術(shù)。
2.機(jī)器學(xué)習(xí)
(ML-Machine Learning)
定義:通過算法讓計(jì)算機(jī)從數(shù)據(jù)中自動(dòng)學(xué)習(xí)規(guī)律,并用于預(yù)測或決策的技術(shù)。核心是讓機(jī)器具備“從經(jīng)驗(yàn)中改進(jìn)”的能力,而非依賴固定編程規(guī)則。
舉例:在線購物平臺利用機(jī)器學(xué)習(xí)算法根據(jù)瀏覽歷史推薦商品,調(diào)整推薦以符合用戶偏好。
3.深度學(xué)習(xí)
(DL-Deep Learning)
定義:基于多層神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法,能自動(dòng)提取數(shù)據(jù)的多層次特征。擅長處理圖像、語音等復(fù)雜非結(jié)構(gòu)化數(shù)據(jù)。
舉例:手機(jī)相冊自動(dòng)識別人臉并分類:通過多層神經(jīng)網(wǎng)絡(luò)先識別邊緣→五官→整體面部特征,最終確定人物身份。
4.神經(jīng)網(wǎng)絡(luò)
(Neural Network)
定義:模仿生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的計(jì)算模型,由大量互連的“神經(jīng)元”分層組成,通過調(diào)整連接權(quán)重實(shí)現(xiàn)信息處理。
示例:在手寫數(shù)字識別任務(wù)中,輸入層負(fù)責(zé)接收像素?cái)?shù)據(jù),隱藏層進(jìn)行筆畫特征的提取,而輸出層則確定數(shù)字屬于0到9中的哪一個(gè)。
5.自然語言處理
(NLP-Natural Language Processing)
定義:讓計(jì)算機(jī)理解、生成人類語言的技術(shù),涵蓋語義分析、機(jī)器翻譯等領(lǐng)域。
舉例:在智能客服解答“如何重置密碼”的問題時(shí),首先需要將語音轉(zhuǎn)換為文字,然后理解詢問的含義,最終形成回答的文本。
6.計(jì)算機(jī)視覺
(CV-Computer Vision)
定義:使計(jì)算機(jī)能夠“看懂”圖像和視頻的技術(shù),包括物體檢測、圖像分類、人臉識別等應(yīng)用。
舉例:在超市自助結(jié)賬機(jī)中,攝像頭通過識別商品條碼,匹配數(shù)據(jù)庫中的信息,顯示價(jià)格;汽車零部件廠商的CV系統(tǒng)檢測產(chǎn)品缺陷。
7.大語言模型
(LLM-Large Language Model)
定義:基于海量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,能理解、生成人類語言,完成問答、寫作等任務(wù)。
舉例:在回答問題的過程中,DeepSeek會(huì)深入解析文本的含義,并利用其在訓(xùn)練過程中習(xí)得的語言規(guī)則,來構(gòu)建一個(gè)邏輯連貫的答復(fù)。
8.Transformer架構(gòu)
(Transformer Architecture)
定義:基于注意力機(jī)制構(gòu)建的深度學(xué)習(xí)模型架構(gòu),擅長處理序列數(shù)據(jù)(如文本),通過并行計(jì)算大幅提升訓(xùn)練效率。
舉例:在將英文句子翻譯成中文時(shí),谷歌翻譯模型會(huì)同時(shí)考慮“bank”在不同語境下的意義(如銀行/河岸),從而挑選出恰當(dāng)?shù)姆g。
9.生成式AI
(GenAI-Generative AI)
定義:能夠創(chuàng)造新內(nèi)容(文本、圖像、視頻等)的人工智能系統(tǒng),通過理解數(shù)據(jù)模式生成符合人類需求的原創(chuàng)性輸出。
舉例:用AI生成營銷文案時(shí),輸入產(chǎn)品關(guān)鍵詞即可生成廣告語、社交媒體推文。
10.多模態(tài)
(Multimodal)
定義:同時(shí)處理和理解多種類型數(shù)據(jù)(文本、圖像、語音等)的技術(shù),實(shí)現(xiàn)跨媒介的信息融合與推理。
舉例:智能客服在分析了用戶所發(fā)文字“這件衣服質(zhì)量如何”以及產(chǎn)品圖片后,綜合提供了材質(zhì)說明和洗滌建議。
11.知識圖譜
(KG-Knowledge Graph)
定義:以圖結(jié)構(gòu)組織知識的數(shù)據(jù)庫,用節(jié)點(diǎn)表示實(shí)體,邊表示關(guān)系,支持語義搜索和智能推理。
示例:在電子商務(wù)平臺上,用戶在購買手機(jī)時(shí)常常也會(huì)看到推薦耳機(jī),這是因?yàn)橹R圖譜中存在“手機(jī)-配件-耳機(jī)”的連接關(guān)系。
12.向量化/嵌入技術(shù)
(Embedding)
定義:將文字、圖像等數(shù)據(jù)轉(zhuǎn)換為數(shù)值向量的技術(shù),使計(jì)算機(jī)能夠通過數(shù)學(xué)運(yùn)算處理語義信息。
舉例:“國王”-“男性”+“女性”=“女王”的向量運(yùn)算,反映詞語間的語義關(guān)系。
13.智能體
(Agent)
定義:能感知環(huán)境、自主決策并執(zhí)行動(dòng)作的AI程序,常應(yīng)用于機(jī)器人、游戲AI等場景。
舉例:自動(dòng)駕駛汽車:通過攝像頭(感知)識別行人→計(jì)算路徑(決策)→控制方向盤(執(zhí)行)完成避讓。
14.通用人工智能
(AGI-Artificial General Intelligence)
定義:具備與人類相當(dāng)?shù)娜I(lǐng)域認(rèn)知能力的人工智能,能靈活應(yīng)對各種未知任務(wù),目前尚未實(shí)現(xiàn)。
舉例:在科幻影片里的機(jī)器人,不僅能夠識別病癥,還能編寫詩歌,具備多種才能。
訓(xùn)練技術(shù)
15.監(jiān)督學(xué)習(xí)
(SL-Supervised Learning)
定義:使用帶標(biāo)簽數(shù)據(jù)訓(xùn)練的機(jī)器學(xué)習(xí)方法,模型通過對比預(yù)測結(jié)果與標(biāo)準(zhǔn)答案調(diào)整參數(shù)。
舉例:在訓(xùn)練模型識別垃圾郵件時(shí),提供大量已標(biāo)記的“正常郵件”與“垃圾郵件”樣本,以便模型學(xué)習(xí)區(qū)分它們的特征。
類比:就像學(xué)生使用帶有答案的習(xí)題集,每解答一題后便與正確答案(標(biāo)簽)進(jìn)行對照,通過分析錯(cuò)誤(損失計(jì)算)來防止重復(fù)犯錯(cuò)。
16.預(yù)訓(xùn)練
(Pre-Training)
定義:在大規(guī)模通用數(shù)據(jù)集上進(jìn)行的初步訓(xùn)練,使模型獲得基礎(chǔ)特征提取能力,為后續(xù)任務(wù)提供初始參數(shù)。
舉例:BERT模型通過完形填空任務(wù)預(yù)訓(xùn)練,學(xué)習(xí)詞語上下文關(guān)系,之后可用于問答、分類等下游任務(wù)。
類比:如同學(xué)生廣泛閱讀百科全書(進(jìn)行預(yù)訓(xùn)練),構(gòu)建起知識體系,隨后專注于特定領(lǐng)域(進(jìn)行微調(diào))。
17.微調(diào)
(FT-Fine-Tuning)
定義:在預(yù)訓(xùn)練模型基礎(chǔ)上,用特定領(lǐng)域數(shù)據(jù)繼續(xù)訓(xùn)練以適配新任務(wù)的過程,通常只調(diào)整部分網(wǎng)絡(luò)層參數(shù)。
舉例:法律文本分類:在通用語言模型基礎(chǔ)上,用法律文書數(shù)據(jù)集微調(diào)預(yù)訓(xùn)練模型,提升專業(yè)術(shù)語理解能力。
類比:像定制西裝時(shí)基于標(biāo)準(zhǔn)版型(預(yù)訓(xùn)練模型),根據(jù)個(gè)人身材數(shù)據(jù)(領(lǐng)域數(shù)據(jù))調(diào)整袖長、腰圍等細(xì)節(jié)(參數(shù)微調(diào))。
18.數(shù)據(jù)增強(qiáng)
(DA-Data Augmentation)
定義:通過變換原始數(shù)據(jù)生成新樣本的技術(shù),增加數(shù)據(jù)多樣性,提升模型泛化能力。
舉例:圖像分類任務(wù)中,對貓的圖片進(jìn)行旋轉(zhuǎn)、裁剪、調(diào)整亮度等操作,生成更多訓(xùn)練樣本。
類比:像用濾鏡編輯照片,同一張風(fēng)景照通過不同濾鏡(增強(qiáng)手段)生成晨霧、晚霞、陰天等版本。
19.知識蒸餾
(KD-Knowledge Distillation)
定義:將大型模型(教師模型)的知識遷移到小型模型(學(xué)生模型)的技術(shù),通過軟化輸出概率傳遞暗知識。
舉例:將BERT的知識蒸餾到TinyBERT,教師模型不僅傳遞預(yù)測結(jié)果(蘋果是水果),還傳遞“蘋果與梨相似度70%”的軟標(biāo)簽。
類比:像導(dǎo)師帶學(xué)生,教授(大模型)不僅傳授標(biāo)準(zhǔn)答案(硬標(biāo)簽),還講解解題思路(類間關(guān)系),幫助學(xué)生(小模型)舉一反三。
20.模型壓縮
(MC-Model Compression)
定義:通過剪枝(移除冗余參數(shù))、量化(降低數(shù)值精度)、知識蒸餾(小模型模仿大模型)等技術(shù),減小模型體積和計(jì)算量,使其更適合在移動(dòng)端或邊緣設(shè)備部署。
舉例:將手機(jī)語音助手模型從500MB壓縮到50MB,在保持90%準(zhǔn)確率的同時(shí),耗電量降低60%。
類比:像整理行李,通過丟棄不必要的服飾(剪枝)、利用壓縮袋縮小體積(量化)、挑選必需品(蒸餾),使行李(模型)輕巧又實(shí)用。
21.檢索增強(qiáng)生成
(RAG-Retrieval-Augmented Generation)
定義:結(jié)合實(shí)時(shí)檢索外部知識庫與生成模型的技術(shù),解決大模型事實(shí)性錯(cuò)誤與信息滯后問題,提升生成內(nèi)容的準(zhǔn)確性。
舉例:智能客服回答“最新退換貨政策”時(shí),先檢索公司知識庫獲取最新條款,再生成回答文本。
類比:律師辦案時(shí),先查閱最新法典(知識檢索),再結(jié)合案情(用戶問題)撰寫法律文書(生成回答)。
應(yīng)用交互
22.多輪對話
(MTD-Multi-Turn Dialogue)
定義:通過對話狀態(tài)追蹤(DST)技術(shù)維護(hù)上下文,支持超過3輪以上的連貫交互,實(shí)現(xiàn)類人對話體驗(yàn)。
示例:用戶:杭州有哪些好玩的地方? →系統(tǒng):可以去西湖、靈隱寺看看。 → 用戶再問:哪個(gè)地方更適合帶小孩去呢? → 系統(tǒng):西湖有游船和博物館,非常適合親子游。
比較:就像和老朋友聊天,每次對話都流暢地延續(xù)上一次的話題,就像“你之前提到的那家餐廳”→“沒錯(cuò),就是那家美味的本幫小館”的順暢對話。
23.意圖識別
(IR-Intent Recognition)
定義:將自然語言轉(zhuǎn)化為預(yù)定義意圖標(biāo)簽(如“查詢天氣”“訂餐”)的技術(shù),是對話系統(tǒng)的核心模塊。
舉例:用戶說“太熱了”,系統(tǒng)識別為“調(diào)節(jié)溫度”意圖,觸發(fā)空調(diào)降溫指令。
類比:像餐廳服務(wù)員,聽到“來點(diǎn)解渴的”立刻理解需要推薦飲品(意圖),而非字面要求“找水解渴”。
24.語義理解
(SU-Semantic Understanding)
定義:通過分析用戶輸入(如文字或語音)判斷其真實(shí)需求的技術(shù),是對話系統(tǒng)的核心能力。
舉例:對智能音箱說“明天會(huì)下雨嗎”系統(tǒng)識別出“查詢天氣”意圖并調(diào)用天氣API。
類比:像餐廳服務(wù)員通過顧客的“來份牛排”快速理解對方需要點(diǎn)餐。
25.提示詞工程
(PE-Prompt Engineering)
定義:通過結(jié)構(gòu)化指令設(shè)計(jì)、上下文示例、角色模擬等方法,精確引導(dǎo) 大模型輸出的系統(tǒng)性技術(shù),類似“與機(jī)器溝通的語言藝術(shù)”。
舉例:想讓AI寫招聘啟事,用“用互聯(lián)網(wǎng)行業(yè)術(shù)語撰寫Java工程師招聘,要求3年經(jīng)驗(yàn),薪資面議”比“寫個(gè)招聘”更有效。
類比:像使用智能咖啡機(jī)時(shí),選擇“中杯/熱/雙份濃縮”比只說“來杯咖啡”更能得到想要的口味。
26.多模態(tài)交互
(MMI-Multimodal Interaction)
定義:支持同時(shí)使用語音、手勢、圖像等多種方式進(jìn)行人機(jī)交互的技術(shù),提升交互自然度。
舉例:智能廚房中,用戶說“調(diào)大火力”同時(shí)用手指順時(shí)針劃圈,系統(tǒng)綜合理解后調(diào)整灶臺火焰。
類比:像與朋友對話,邊說“這本書很有趣”邊用手指書中插圖(多模態(tài)),比單純語言描述更易理解。
其它
27.模型參數(shù)量
(MP-Model Parameters)
定義:模型中可調(diào)整的權(quán)重總數(shù),通常與模型復(fù)雜度正相關(guān)。
舉例:GPT-4有1.76萬億參數(shù),手機(jī)端小模型可能只有1億參數(shù)。
類比:圖書館藏書量,書籍越多(參數(shù)多)能解答的問題越廣泛,但查找信息也更耗時(shí)耗能。
28.準(zhǔn)確率/召回率/F1分?jǐn)?shù)
(Accuracy/Recall/F1 - Score)
定義:準(zhǔn)確率指的是正確預(yù)測占全部預(yù)測的比例(查得準(zhǔn));召回率指的是正確識別出的正例占全部正例的比例(查得全);F1分?jǐn)?shù)指兩者平衡的綜合指標(biāo)。
舉例:癌癥篩查系統(tǒng):準(zhǔn)確率98%:100次診斷98次正確;召回率95%:20名患者中檢出19人;F1=96.4%:綜合評估指標(biāo)。
類比:漁夫捕魚,準(zhǔn)確率=撈到的魚中目標(biāo)魚種占比;召回率=所有目標(biāo)魚種被捕獲的比例;F1=評價(jià)綜合捕撈效率。
29.工具調(diào)用
(TC-Tool Calling)
定義:AI系統(tǒng)通過API接口調(diào)用外部工具或服務(wù)的能力,擴(kuò)展模型功能邊界,實(shí)現(xiàn)復(fù)雜任務(wù)處理。
舉例:智能助手收到“訂明早8點(diǎn)鬧鐘”指令后,調(diào)用手機(jī)系統(tǒng)API設(shè)置鬧鐘,而非僅生成文本回復(fù)。
類比:像全能秘書,接到“安排會(huì)議”要求后,實(shí)際操作日歷軟件(工具調(diào)用),而非只是口頭應(yīng)答“好的”。
30.思維鏈
(CoT-Chain of Thought)
定義:要求人工智能在解決復(fù)雜問題時(shí),顯式展示推理過程中的每個(gè)邏輯步驟,如同人類逐步演算草稿,以提升可驗(yàn)證性與可解釋性。
舉例:面對問題“商品原價(jià)580元,打8折后滿400減50,最終多少錢?”
分步輸出:“首先計(jì)算打折后的價(jià)格:580乘以0.8等于464元;其次,確認(rèn)是否滿足滿減條件:464大于400,因此可以減免50元。最終答案:464元減去50元等于414元。”
類比:像按照指南一步步組裝家具——“拆開包裝-安裝桌腿-固定面板-旋緊螺絲”(分步推理),相較于直接查看成品圖(直接出結(jié)果),更為穩(wěn)妥可靠。