機器學習

AI 人工智能 跟你有關?

AI (Artificial Intelligence) 人工智慧就是讓系統或電腦設備有模擬人類思考模式, 並持續通過進化與學習, 最終逹致像人類一樣思考, 執行策略的科技. 說到AI, 不得不提量子電腦(Quantum computer), 它是通過以量子存取形式來處理數據的一種邏輯進行通用計算的裝置。量子電腦一般被視為速度快數億倍強的電腦, 通過量子演算法, 能達到未有的高速.

至於近月興起的CHATGPT, 是由OpenAI開發的大型語言模型AI聊天機器人. 是一個語言生成模型, 能透過學習大量的數據, 回應非結構化的資訊, 信息也更貼近人類的自然語言文本, 並且通過接受大量的數據訓練, 可以應付各種類型的問題和處理多種任務。

深度強化學習(1) 什麼是深度強化學習?

 

強化學習

一般來說機器學習模式可以分為三類:

  • 有監督學習:Supervised Learning
  • 無監督學習:Unsupervised Learning
  • 強化學習:Reinforcement Learning

 

強化學習與其佢兩種機器學習模式差距好大, 解決嘅問題都有好大不同。 由於強化學習涉及概念比較多, 而且訓練比較難, 所以喺一般嘅機器學習書籍中, 都唔會涉及強化學習, 而是由專門嘅書籍介紹。 

有監督學習和無監督嘅學習嘅輸出一般都係肯定性嘅答案, 比如: 模型會畀出數據歸屬於哪一個類型, 抑或畀出一個數值型嘅預測結果。 而強化學習嘅目標係訓練一個 agent, 呢個agent 會根據環境反饋, 輸出一系列決策, 而唔係只輸出一個結果。  相比其他兩種模型, 強化學習模型更加類似人類大腦, 可以根據環境, 不斷嘅做出決策。