什麼是人工智慧 (AI)?

人工智慧 (AI) 是電腦科學的一個多學科領域,著重於設計能夠模擬人類認知功能的系統,使機器能夠執行需要人類智慧的任務。AI 包含 機器學習,它使用演算法和統計模型來學習:

  • 資料
  • 自然語言處理
  • 電腦視覺
  • 機器人
  • 專家系統

AI 尋求開發能感知、推理、學習、規劃和獨立或與人類協作行動的智慧型代理,以改變不同產業和塑造科技的未來。

 

人工智慧說明

人工智慧 (AI) 是一個快速發展的領域,包含技術、演算法和應用程式,用來創造能夠模仿人類認知能力的智慧型代理,例如學習、推理、規劃、感知和理解自然語言等能力。雖然最近才成為主流,但 AI 應用已無處不在。我們會在虛擬助理、聊天機器人、影像分類、臉部識別、物件識別、語音識別、機器翻譯和機械人感知等領域遇到它們。

作為一個研究領域,人工智能包含了 機器學習、自然語言處理、電腦視覺、機器人學和專家系統等領域。

機器學習

人工智慧的核心是機器學習,這是一個利用演算法和統計模型的子集,讓系統能夠從資料輸入中學習並適應,而無需明確的程式設計。有監督、無監督和 強化學習 等技術可讓機器根據資料識別模式、進行預測和最佳化決策。

  • 監督學習:這包括在標記資料集上訓練演算法,也就是將每個輸入資料點與輸出標記配對起來。監督學習演算法的設計是為了學習從輸入到輸出的映射,非常適用於垃圾郵件偵測或影像識別等應用。
  • 無監督學習:與監督學習相反,無監督學習演算法不給予任何標籤,而是依賴資料的內在結構來得出洞察力。它用於聚類、關聯和降維任務。
  • 半監督和強化學習:這些形式同時利用標記和非標記資料,可以提高學習效率和準確性。

自然語言處理 (NLP)

自然語言處理 (NLP) 讓人工智慧系統具備理解、解釋、產生及與人類語言互動的能力。NLP 技術有助於情感分析、語言翻譯和聊天機開發等任務。

電腦視覺

電腦視覺著重於讓機器能夠感知、辨識和解釋周遭環境的視覺資訊。這門學科涉及物件識別、臉部識別和場景理解,對於自動車和監控系統等應用而言至關重要。

機器人

機器人學將人工智慧與機械、電機及控制工程結合,以設計、製造及編程能夠自主或半自主執行複雜任務的機器人。機器人的範圍從工業機械手到仿人助理,利用 AI 進行導航、操作以及與人類及其環境互動。

專家系統

專家系統是人工智慧的一個分支,涉及到以規則為基礎的系統開發,以模擬特定領域中人類的專業知識。專家系統是用來提供建議、診斷或決策支援,其基礎是一套預先定義的規則和知識庫。

 

AI 發展簡史

  • 1950-1960 年代:早期人工智慧研究與達特茅斯會議
  • 1970-1980 年代:專家系統與第一個人工智慧冬天
  • 1990 年代至 2000 年代:機器學習進展與第二個 AI 寒冬
  • 2010 年代至今:深度學習革命、大數據和運算能力的提升

人工智慧的歷史可以追溯到 20 世紀中葉,其歷史豐富而複雜。這個領域誕生於控制論、邏輯理論和認知科學的融合。1956 年,達特茅斯會議標誌著人工智能作為一個研究領域的正式誕生。在 John McCarthy、Marvin Minsky、Nathaniel Rochester 和 Claude Shannon 的帶領下,這次事件為數十年的研究和發展奠定了基礎。

20 世紀 60 年代和 70 年代早期出現了最佳化和重大進展。研究人員開發的程式可以解決代數問題、證明邏輯定理,甚至可以用英文進行基本的會話。然而,隨著人們意識到許多人工智能問題比最初想像的更複雜,人們的熱情也逐漸減退。

20 世紀 70 年代末和 80 年代目睹了專家系統的興起 - 專門設計來模擬特定領域中人類專家決策能力的人工智能程式。這些系統應用於醫療診斷和地質勘探等領域。儘管取得了一些成功,但可擴展性和適應性方面的限制導致資金和興趣減少,這段時期被稱為 「AI 寒冬」。

20 世紀 90 年代和 21 世紀初,我們轉向採用更多資料驅動的方法。機器學習技術可讓電腦透過經驗改善任務的表現,因此獲得廣泛的關注。雖然進度仍然相對緩慢,導致第二個 AI 冬天的來臨。

目前的人工智能文藝復興始於 2010 年代,由三大關鍵因素驅動:大數據的可用性、運算能力的大幅提升,以及深度學習演算法的突破。這種匯流使電腦視覺、自然語言處理和機器人等領域取得了顯著的進展。AI 系統目前在各種任務上的表現都優於人類,從影像識別到複雜的策略遊戲,例如圍棋。

今天,AI 已經不只是學術研究的課題,而是產業與社會的轉型力量。當我們站在更多重大突破的關鍵時刻,了解人工智慧發展的歷史背景,對於瞭解其潛力與風險都至關重要。

 

AI 種類

人工智慧大致可分為兩大類型:狹義 AI 和一般 AI。瞭解這些類別,就能更深入瞭解人工智慧技術的現況及其未來發展潛力。

狹義 AI(弱 AI)

狹義人工智慧 (Narrow AI) 也稱為弱人工智慧 (Weak AI),是指針對特定任務或狹小範圍的任務所設計與訓練的人工智慧系統。這些系統在其定義的參數內表現優異,但缺乏將其智慧轉移到特定重點以外的其他領域或任務的能力。

在我們的日常生活中,狹義人工智能的例子無所不在。Siri 或 Alexa 等虛擬助理可解釋語音指令,並執行特定任務,例如設定提醒事項或播放音樂。影像識別系統可以高準確度辨識照片中的物件或人臉。Netflix 或 Amazon 等平台上的推薦演算法會根據使用者的喜好和行為來建議內容或產品。

狹義 AI 系統雖然非常有用,其表現也往往令人印象深刻,但卻只限於其程式化的功能。他們不具備真正的理解力或意識,如果不重新編程或重新訓練,就無法適應全新的環境。

一般 AI(強 AI)

通用人工智能(General AI),也稱為強大人工智能(Strong AI)或人工通用智能(Artificial General Intelligence,AGI),是一種假想的人工智能類型,將具備類似人類的認知能力。這樣的系統能夠理解、學習和應用各種領域的知識,就像人類的大腦一樣。

一般 AI 的主要特徵包括

  • 在各種情況下推理、規劃和解決問題的能力
  • 在沒有特定程式的情況下學習和適應新環境
  • 理解和產生自然語言
  • 提出原創想法並展現創意
  • 自我意識和意識(雖然這有爭議)

值得注意的是,通用 AI 目前仍屬於純理論層面。儘管人工智慧技術有顯著的進步,我們仍遠未創造出一個在所有領域都能真正模擬人類智慧的系統。AGI 的發展帶來了許多技術上的挑戰,也提出了深刻的哲學與倫理問題。

狹義人工智慧與一般人工智慧之間的區別在 風險管理上至關重要。狹義人工智慧系統帶來了需要管理的即時且具體的風險,而通用人工智慧的潛在發展則引進了一系列長期、存在性的考量,這些考量更具推測性,但潛在影響力更大。

隨著 AI 技術不斷地進步,狹義 AI 與一般 AI 的界線可能會變得越來越模糊。有些研究人員提出「人工狹義智慧 (Artificial Narrow Intelligence+)」或「人工一般智慧 (Artificial General Intelligence-)」的概念,來描述那些展現出超越傳統狹義人工智慧的能力,但尚未達到完全一般人工智慧的系統。

 

AI 技術的相互依存性

機器學習、深度學習和自然語言處理已經越來越緊密地結合在一起,每個子領域都能與其他領域相輔相成,創造出更複雜的人工智能系統。

例如,卷積神經網路 (CNN) 和循環神經網路 (RNN) 等深度學習技術已應用於電腦視覺和 NLP 任務,在影像分類和機器翻譯方面取得最先進的效能。同樣地,轉換器架構大幅提升了機器翻譯、資訊擷取、情感分析和問題回答等任務的效能,為自然語言處理帶來了革命性的改變。概率方法(如 Bayesian 網路和期望最大化演算法)與機器學習方法的結合,為處理不確定性和做出資料驅動的決策提供了強大的工具。

強化學習、電腦視覺和控制演算法的融合,讓機器人可以學習複雜的行為、在動態環境中導航,以及與物件互動。專家系統透過整合知識表示、推理引擎和機器學習,展示了人工智能技術的相互依存性。

透過結合這些元件,專家系統可以推理、學習並適應新資訊,使其成為各領域決策的重要工具。

 

革新產業

人工智能在各個領域都取得了長足的進展,改變了各行各業,也改變了我們的生活、工作和互動方式。

醫療保健

AI 在醫療保健領域取得了顯著的進展,能夠及早偵測疾病、提供個人化的治療方案,並改善病患的療效。深度學習演算法,尤其是卷積神經網路 (CNN),在加強醫療影像分析診斷癌症和阿茲海默症等疾病方面發揮了重要作用。

自然語言處理技術有助於從電子健康記錄和科學文獻中擷取重要資訊,簡化醫學研究和決策過程。此外,人工智能驅動的藥物發現平台加速了新藥的開發,縮短了將救命藥物推向市場的時間和成本。

財務

金融業已利用 AI 來最佳化交易策略、偵測詐欺、管理風險及改善客戶服務。我們大多數人都體驗過 AI 驅動的聊天機器人和虛擬助理提供的簡化支援或個人化財務建議。

機器學習演算法,例如支援向量機與決策樹,可讓自動化交易系統分析大量資料,並精準快速地執行交易。AI 驅動的詐欺偵測系統利用異常偵測和模式識別技術,識別可疑活動,加強安全性並減少損失。

運輸

透過開發自動駕駛汽車、交通管理系統和路線最佳化演算法,人工智能已經改變了運輸業。機器學習技術、電腦視覺和感測器融合讓自動駕駛汽車能夠感知和導航複雜的環境,有望減少意外事故並改善交通流量。

AI 驅動的交通管理系統可分析即時交通資料,預測壅塞模式,最佳化交通號誌時間,縮短通勤時間。由人工智能驅動的路線最佳化演算法,可協助物流公司和送貨服務將油耗降至最低並提高效率。

教育

AI 有可能透過個人化學習、智慧型輔導系統及自動分級,為教育帶來革命性的改變。機器學習演算法可分析學生的學習模式、偏好和進度,量身打造教育內容,以最佳化學習成果。智慧型輔導系統提供個人化的回饋、指導和支援,在學生和教師之間架起一座橋樑。人工智能驅動的評分系統可以評估論文和其他複雜的作業,為教育工作者節省時間,並為學生提供及時、一致的回饋。

製造業

人工智能在製造流程現代化、提高生產力和減少浪費方面發揮了重要作用。機器學習演算法可實現預測性維護,在潛在的設備故障發生前即加以識別,減少停機時間。以深度學習為動力的電腦視覺系統有助於自動化品質控制,確保製造產品的準確性和一致性。AI 驅動的供應鏈最佳化平台可分析需求預測、庫存水位和生產排程,簡化作業並降低成本。

娛樂與媒體

AI 透過實現內容個人化、推薦系統和創意應用,重塑了娛樂和媒體的格局。機器學習演算法可分析使用者偏好、行為和人口統計資料,以整理個人化內容和建議,提升使用者參與度和滿意度。生成式 AI 技術,例如生成式敵意網路 (GAN) 和變形器架構,賦權創造新奇的藝術、音樂和故事體驗,擴大了人類創造力的邊界。

 

人工智能研究的挑戰與機遇

儘管人工智慧已取得重大進展,但仍存在數項嚴重性挑戰。主要的挑戰之一是開發能展現一般智慧(即在廣泛的任務和領域中學習和推理的能力)的人工智慧系統。目前的 AI 系統通常專門用於特定任務,而轉移學習技術仍處於起步階段。此外,開發能解釋其推理和決策的人工智慧系統,這是許多應用程式的重要需求,但這仍是一個尚未解決的問題。

AI 系統的道德部署

另一項挑戰是確保 人工智慧系統的道德與安全部署。資料隱私、演算法偏見以及人工智慧對就業的影響等議題已引起研究人員、決策者和公眾的關注。這些疑慮突顯出將倫理與安全考量納入人工智慧研發的重要性。

人工智能驅動的雲端安全威脅

AI 為雲端安全帶來多項嚴重性挑戰,其中一些最迫切的問題來自於對抗性攻擊、資料隱私疑慮、模型複雜性、基於 AI 的網路威脅,以及資源消耗攻擊。

逆向攻擊

AI 系統,尤其是深度學習模型,很容易受到 敵意範例的影響,這些 範例是為了欺騙模型產生錯誤輸出而精心設計的輸入。在雲端環境中,攻擊者可利用這些漏洞危害 AI 服務,導致不正確的預測、未授權的存取或資料竄改。

資料隱私與保密

資料隱私 和機密性是另一項挑戰,因為人工智能模型通常需要大量資料進行訓練,其中可能包括敏感的使用者資訊。在雲端儲存和處理這些資料會引起隱私權方面的疑慮,因為未經授權的存取或 資料 外洩可能會導致 敏感資訊外露。此外,人工智慧模型可能會透過模型反轉或成員推論攻擊,不慎洩漏機密資料。

模型複雜性與可解釋性

人工智能模型的複雜性,尤其是深度學習和集合方法,對雲端安全構成挑戰,因為其缺乏可解釋性導致難以評估安全屬性和找出弱點。反過來,這會妨礙偵測和緩解對 AI 服務的潛在攻擊。

以 AI 為基礎的網路威脅

攻擊者可利用 AI 技術開發更複雜的網路威脅,例如智慧型惡意軟體和 自動化漏洞利用。在雲端環境中,這些人工智能增強的攻擊可能較難偵測和防禦,對傳統的安全措施造成重大挑戰。

資源消耗攻擊

人工智能模型,尤其是深度學習,需要大量的計算資源來進行訓練和推理。攻擊者可利用這一點,針對雲端 AI 服務發動資源消耗攻擊,例如拒絕服務 (DoS) 或分散式拒絕服務 (DDoS),造成效能降低或服務中斷。

為了因應這些挑戰,雲端安全策略必須採用整體性的方法,包含強大的 AI 模型設計、安全的資料管理實務,以及 先進的威脅偵測 與減緩技術。這包括開發安全的人工智能框架、 保護隱私的資料處理方法,以及不斷地監控和評估雲端中的人工智能服務。

 

使用 AI 捍衛雲端

AI 可以透過改善有助於維護雲端服務的機密性、完整性和可用性的能力,同時應對雲端安全環境不斷演進的挑戰,從而大幅提升雲端安全。

透過利用機器學習演算法分析雲端產生的資料,人工智能可以改善威脅偵測,並找出可能顯示安全威脅的模式和異常現象。AI 驅動的安全性工具能夠偵測不尋常的使用者行為、網路流量或系統事件,並將其標示出來以作進一步調查。即時識別惡意軟體、資料外洩或未授權存取等威脅,可大幅降低這些攻擊可能造成的損害。

除了威脅偵測之外,AI 還能簡化和自動化事件回應,將人為干預的需求降至最低。運用人工智能演算法的雲端安全系統可自動採取糾正行動,例如隔離受影響的系統、封鎖惡意 IP 位址,或撤銷已入侵的憑證。事件回應自動化不僅能縮短回應時間,還能降低人為錯誤的風險, 強化雲端安全勢態

人工智能也可以透過採用隱私保護資料處理技術,例如差異隱私、同態加密和安全的多方計算,來強化資料的隱私性和機密性。這些方法允許人工智能模型從 加密 或匿名資料中學習,確保敏感資訊受到保護,同時仍能受益於人工智能驅動的洞察力。

AI 可透過不斷地監控和適應演變中的威脅環境,為系統彈性化做出貢獻。AI 驅動的安全解決方案可以從過去的事件中學習,並調整其行為,在需要時更新偵測模型。這種適應性可讓雲端安全系統主動防禦新興威脅,並根據威脅行為者不斷變化的策略進行調整。

人工智慧安全勢態管理 (AI-SPM)

威脅的複雜性與日俱增、AI 技術的進步,以及 IT 環境的變化,催生了 AI-SPM的出現。隨著人工智能不斷地演進與成熟,其在管理與改善安全勢態方面的作用可能會更加顯著。

AI-SPM - 或人工智慧安全勢態管理 - 是指應用人工智慧技術來管理和改善組織 IT 基礎架構的安全勢態。AI-SPM 的方法包括使用 AI 演算法來即時分析、監控和應對潛在的安全威脅、弱點和風險。

AI-SPM 的主要組成部分

異常偵測:人工智能演算法可分析大量資料,例如日誌或網路流量,以偵測可能顯示安全性威脅的異常模式和行為。

弱點管理AI 可協助組織識別 IT 基礎架構中的弱點,並排定優先順序,使組織能夠採取主動措施來修補風險。

事件回應自動化AI 可以簡化事件回應程序,在偵測到安全威脅時自動採取糾正措施,縮短回應時間,並降低人為錯誤的風險。

風險評估:AI 可協助 組織評估及可量化的網路安全風險,使組織能針對其安全策略及資源分配做出以資料為導向的決策。

不斷地監控與適應:AI 驅動的安全解決方案可從事件中學習,並調整其行為,以防範新興的威脅和惡意行為者不斷改變的策略。

 

人工智能的未來

隨著人工智能不斷地進步,我們可以預期會看到更複雜的應用程式和系統,充分發揮機器學習、深度學習、自然語言處理、電腦視覺和機械人的潛力。研究人員正努力開發能像人類一樣學習和推理的人工智慧系統,從而發展出更具一般性和適應性的智慧。整合人工智慧技術,並開發能夠解決道德與安全問題的系統,將在確保人工智慧在各領域進行負責任、有益的部署上扮演關鍵的角色。

深入探討 AI 在網路安全方面的預測:人工智慧 (AI) 在網路安全方面的預測為何。

 

人工智慧常見問題

AI 是一個更廣泛的領域,涵蓋電腦系統的開發,能夠執行通常需要人類智慧的任務,例如理解自然語言、識別模式和做出決策。機器學習是人工智慧的一個子領域,特別著重於創造能從資料中學習的演算法,讓電腦在沒有明確程式設計的情況下,也能改善執行任務的效能。
人工智能中的幻覺指的是機器學習模型產生的輸出並非基於輸入數據或實際資訊。當一個模型 (例如 LLM) 產生了聽起來合理但不正確或不合理的回應時,就會出現這種現象。
在人工智能和 LLM 的背景下,Confabulation 指的是機器學習模型產生錯誤或無意義的輸出。這通常發生在模型遇到它在訓練過程中沒有遇到過的輸入資料時,導致產生不準確或不可信的回應。解決人工智慧系統中的混淆問題,以確保其可靠性和可信度,以及維護模型和其處理資料的安全性,尤其重要。
推論是經過訓練的機器學習模型(例如 LLM)根據輸入資料產生預測或輸出的過程。在推論過程中,模型會運用學習到的模式和表徵,針對給定的輸入做出決定或產生回應。
NLP 是人工智慧的一個領域,著重於人類與電腦之間使用自然語言的互動。NLP 技術包括語音辨識、語音合成、機器翻譯、資訊擷取、資訊檢索和問題回答。
電腦視覺是人工智能的一個子領域,處理從影像和視訊中自動擷取資訊的問題。電腦視覺的技術包括影像分類、臉部識別、物件識別和機器人感知。
機器人學是人工智能的一個分支,著重於開發能夠感知物理世界並與之互動的智慧型代理。機器人感知是機器人學的一個子領域,處理從環境中獲取和處理感官資料。
專家系統是一種人工智能程式,旨在模仿特定領域中人類專家的決策能力。這些系統使用知識表示與推理技術來提供建議、決策或解決複雜的問題。
AI 倫理與安全關注 AI 系統的倫理與社會影響,包括資料隱私、演算法偏見以及 AI 對就業的影響等相關問題。

監督學習是一種機器學習方法,使用標記資料來訓練模型,並提供輸入輸出對作為範例。該模型透過最小化其預測與實際標籤之間的差異,來學習將輸入映射到正確的輸出。在人工智能和 LLM 的背景下,監督學習通常用於分類、迴歸和序列預測等任務。

資料挖掘中使用的監督學習演算法範例包括判斷樹 (decision tree)、支援向量機 (support vector machines) 和神經網路 (neural network),這些演算法可應用於廣泛的應用,例如客戶流失預測或信用風險評估。

確保訓練資料的品質與完整性,以及管理敏感資訊的存取,對維護有監督學習模型的安全性與可信度至關重要。

無監督學習是一種機器學習方法,模型從沒有明確標記的資料中學習,發現資料本身的模式和結構。常見的無監督學習技術包括聚類(根據相似性對資料點進行分組)和降維(將高維資料轉換為低維表示)。.

在人工智能和 LLM 的背景下,無監督學習可以用來發現資料中隱藏的模式或關係,提供有價值的洞察力並改善模型效能。

無監督學習技術(如聚類和關聯規則挖掘)在探索性資料分析和識別資料中有意義的組合或關係方面發揮了重要作用。例如,用於聚類的 k-means 演算法和用於關聯規則挖掘的 Apriori 演算法,可以在資料集中發現先前未知的模式或關聯。

半監督學習是一種機器學習範例,在訓練過程中結合使用標記和非標記資料。有監督學習只依賴標記資料,而無監督學習只使用無標記資料,半監督學習則利用這兩種方法的優點來改善模型效能。

半監督學習背後的主要動機是,標記資料通常稀少且取得成本昂貴,而大量非標記資料則較容易取得。透過加入未標示的資料,半監督學習演算法可以擷取更多的洞察力和模式,完善模型的判斷邊界,進而在未見過的資料上達到更好的泛化效果。

半監督學習中常用的技術包括自我訓練、共同訓練和基於圖表的方法,這些方法可以讓模型從標記和非標記資料中反覆學習。

強化學習是一種機器學習範例,其中代理可透過與環境互動來學習決策,並接受獎勵或懲罰形式的回饋。代理的目標是透過探索不同的行動,建立一個政策,決定在各種情況下採取的最佳行動,從而在一段時間內將累積獎勵最大化。

強化學習可應用於自然語言處理任務,在此任務中,代理程式必須學習根據使用者的輸入產生最佳化的回應或做出選擇。

深度學習是機器學習的一個子領域,主要研究具有多層次的人工神經網路,可從大量資料中自動抽取複雜的模式和特徵。這些網路通常被稱為深度神經網路,可以學習分層表示,使其能夠處理廣泛的任務,例如圖像識別、自然語言處理和語音識別。

在人工智慧與雲端運算 領域,深度學習可利用雲端可用的資料與運算資源,協助建立更精準、更有效率的模型。

一般智慧(通常稱為人工一般智慧 (AGI))是指人工智慧系統能夠理解、學習並以類似人類的熟練程度在廣泛的領域中執行任務的能力。狹義的人工智慧系統擅長於特定的任務,而 AGI 則不同,它可以適應新的情況、進行抽象推理,並將知識從一個領域轉移到另一個領域。實現 AGI 仍是人工智能研究的長期目標,因為目前的系統主要著重於專門的任務,缺乏人類所展現的廣泛認知能力。
群體智慧是人工智能的一個子領域,研究分散式自組織系統的集體行為,例如粒子群最佳化和蟻群最佳化。這些技術用於人工智能中的搜尋與最佳化任務。
形式邏輯是用於人工智慧知識表示與推理的數學架構。它包括命題邏輯、謂語邏輯、邏輯推理、模糊邏輯和非單調邏輯。
概率方法是處理人工智慧不確定性的技術。貝葉斯網路、條件概率表、期望最大化演算法和決策網路都是人工智能中使用的概率方法範例。
決策理論是用來建模和分析決策過程的數學框架。機制設計是博弈論的一個子領域,著重於設計系統,以在代理人之間的策略互動中達到預期的結果。

貝葉斯網路 (Bayesian Networks),又稱為信念網路或貝葉斯網路,是一種概率圖形模型,使用有向無環圖 (DAG) 來表示一組變數及其條件依賴關係。圖表中的每個節點對應隨機變數,而邊代表它們之間的概率依賴關係。

透過對聯合概率分布進行編碼,貝葉斯網路有助於在不確定情況下進行高效推理和推斷。它們被廣泛應用於各種領域,包括人工智慧、機器學習、醫療診斷、風險分析和自然語言處理。這些網路依循 Bayes 定理,根據可觀測的證據更新概率,以支援異常偵測、分類和決策等任務。

Transformer 架構是專為 NLP 任務 (例如翻譯和文字摘要) 設計的進階深度學習模型。它使用自我注意機制來平行處理輸入序列,而不是像傳統的循環神經網路 (RNN) 或長短期記憶 (LSTM) 網路一樣依序處理。此架構包括一個編碼器和一個解碼器,每個編碼器和解碼器都由多個相同的層組成,具有多頭注意和前饋子層。

Transformers 已在各種 NLP 基準中達到最先進的效能,成為 BERT、GPT 和 T5 等模型的基礎。

循環神經網路 (Recurrent neural networks, RNN) 是一類專門用來處理序列資料的神經網路,例如時間序列或自然語言。與前饋式網路不同,RNN 包含回饋連接,使其能夠維持內部狀態或記憶先前的輸入。此結構可讓 RNN 捕捉時間上的依賴性,並學習序列中的模式。

然而,RNN 可能會因為漸層消失或爆炸等問題而難以處理長期依賴關係。為了解決這個問題,長短期記憶體 (LSTM) 和閘控循環單元 (GRU) 等變體已被開發出來,在語言建模、語音辨識和機器翻譯等任務中提供更佳的效能。

卷積神經網路 (CNN) 是一種深度學習架構,專門用於處理網格狀資料,例如影像。CNN 由執行卷積運算、匯集和啟動函數的層組成,使網路能夠學習輸入資料的分層表示。透過使用局部連線性和共用權重,CNN 可以有效偵測影像中的模式和特徵,使其在影像分類、物件偵測和語意分割等任務中非常有效。

生成式敵意網路 (GAN) 是一種深度學習模型,由兩個神經網路 (生成器和判別器) 組成,在競爭環境下同時進行訓練。產生器會建立合成資料樣本,而辨別器會評估真實與產生樣本的真實性。產生器的目的是產生可以欺騙辨別器的真實樣本,而辨別器則致力於準確區分真實與虛假資料。

透過這種敵對過程,GANs 可以產生高品質、真實的資料,使其在圖像合成、資料增強和風格轉換等應用中具有價值。

知識表達是人工智慧的一個基本方面,它處理的是以能夠進行推理和決策的方式來編碼、組織和處理知識。知識表示技術包括形式邏輯、語義網路、框架、本體和概率圖形模型。這些方法允許人工智能系統表達、儲存和擷取資訊,以及根據現有資料推斷新知識。知識表示對於專家系統、自然語言理解和規劃應用來說至關重要。
在人工智能的背景下,推理是指系統推斷新知識或從現有知識推導出邏輯結果的能力。AI 推理技術包括演繹推理、歸納推理和歸納推理。這些方法用於各種 AI 應用,例如知識型系統、自然語言理解和自動定理證明。
在人工智慧中,規劃涉及開發演算法和技術,讓人工智慧代理能夠在複雜、動態和不確定的環境中建立並執行計劃。經典規劃、分層任務網路 (HTN) 規劃和概率規劃是 AI 規劃系統中常用的幾種方法。AI 規劃的應用包括機器人、物流和自動駕駛車輛。
在人工智慧中,感知指的是開發演算法和系統,讓機器能夠處理和詮釋感官資訊,例如影像、音訊和觸覺資料。電腦視覺、語音辨識和感測器融合都是人工智能感知技術的範例,用來分析資料並使其有意義。AI 感知對於機器人、自動車和人機互動等應用至關重要。
馬可夫決策過程 (Markov decision processes, MDP) 是一種數學模型,用於在代理與環境互動的情況下,根據概率做出決策。MDP 的特徵為一組狀態、行動、轉換概率和獎勵。代理在考慮狀態轉換的概率性的同時,選擇動作以最大化隨時間累積的報酬。MDPs 廣泛應用於強化學習、機器人學和控制系統,以建立不確定性下的決策問題模型。
馬可夫決策過程 (Markov decision processes, MDP) 和隱藏馬可夫模型 (hidden Markov models, HMM) 都是用概率狀態轉換來建模系統的數學框架。MDP 著重於決策並納入獎勵,而 HMM 則主要處理具有隱藏狀態的系統所產生序列的分析。在 HMM 中,觀測到的資料是隱藏狀態的概率函數,目標是在觀測到資料的情況下,推斷最可能的隱藏狀態順序。HMM 廣泛應用於語音辨識、生物資訊學和金融等任務,例如模式識別和序列預測。
圖靈測試 (Turing Test) 由 Alan Turing 於 1950 年提出,是一種判斷機器是否展現類似人類智慧的評估方法。在這項測試中,一位人類法官與一台機器和另一位人類進行自然語言對話,但不知道誰是誰。如果法官無法可靠區分機器與人類的反應,則認為機器已通過測試,展現出與人類認知相當的智慧水準。在人工智能和 LLM 的背景下,圖靈測試是衡量人工智能系統理解和產生類似人類語言能力的基準。

k-means 演算法是一種無監督的機器學習技術,用來根據資料點的相似性進行聚類。給定一組資料點和預先定義的叢集數 (k),該演算法的目的是將資料分割成 k 個不同的群組,使叢集內的方差最小化。此過程會先隨機選取 k 個初始中心點,接著反覆將資料點指定給最接近的中心點,並根據指定點的平均值重新計算中心點。當中心點的位置穩定或符合預先定義的停止標準時,演算法就會收斂。

K-means 因其簡單、高效和易於實作,被廣泛用於探索性資料分析、異常偵測和影像分割。

Apriori 演算法是一種用於關聯規則挖掘的無監督機器學習方法,主要用於市場籃子分析。該演算法的目標是識別頻繁項目集並推導出關聯規則,以指示大型交易資料庫中項目之間的關係。

Apriori 的運作原理是向下封閉原則,也就是如果一個項目集是常見的,那麼它的所有子集也一定是常見的。演算法以廣度第一的方式進行,反覆產生候選項集,並根據最小支援臨界值剪除不常見的項目。一旦識別出頻繁項目集,就會使用最小置信度約束推導出關聯規則。

Apriori 演算法廣泛應用於零售、行銷和推薦系統,協助企業發掘有價值的洞察力,並制定有效的策略。

五種常見的機器學習演算法包括

  • 線性回歸:根據輸入特徵和輸出值之間的關係來預測不斷地數值的簡單演算法。
  • Logistic 回歸:用於預測二元結果的分類演算法,例如客戶是否會購買。
  • 判斷樹:一種圖形模型,可根據特徵值遞迴地將資料分割成子集,以執行分類或迴歸任務。
  • 支援向量機 (SVM):一種分類演算法,可找出分隔不同類別資料點的最佳化邊界 (或超平面),使它們之間的邊界最大化。
  • 神經網路:靈感來自於人腦的多功能演算法,能夠學習複雜的模式和表徵,適用於廣泛的任務。
Next What Is the Role of AI and ML in Modern SIEM Solutions?