文 | AI國際站 唐恩
編 | 艾娃
本文由AI國際站 原創出品,未經許可,任何渠道、平臺請勿轉載,違者必究。
預測機器為人工智能業務提供了直觀且急需的介紹,新事物與有效的事物之間存在區別。您只需要看一下在拉斯維加斯舉行的年度消費電子展(CES),就可以發現我們創造的技術中有多少沒有被削減,而是因為找不到有效的商業模式而被扔進了創新的垃圾箱。
哪里人工智能將焉附?機器學習的最新進展無疑給人工智能帶來了很多興奮和恐懼。超越人類冠軍的游戲機器人。一種可在短短幾秒鐘內撰寫文章的生成文本的AI。可以提前幾年檢測出癌癥的醫學成像算法。這些技術進步中有多少實際上已成為主流?其中有多少是不必要的炒作?人工智能將如何影響工作?機器學習如何改變公司的商業模式?
Ajay Agrawal,Joshua Gans和Avi Goldfarb教授在其《預測機器:人工智能的簡單經濟學》一書中回答了這些問題以及許多其他問題,并非常真實地描繪了機器學習如何適應當今的經濟。
Prediction machines提供了有關機器學習以及AI算法提供的預測的功能和限制的非常易于訪問的高級概述。這本書是商業領袖和高管必讀的書。對于想了解創新成果以及他們如何創造技術融入更大經濟的工程師和科學家來說,這也是一項非常有價值的研究。
這本書包含了大量詳細而有用的信息,以及有關機器學習如何改變我們做事方式的示例。
預測機的力量
關于人工智能,機器學習和其他相關術語的含義和差異存在許多誤解。關于AI在人類層面的思維和理解方面的進步以及奇異點是否可以達到的問題,也有許多科學討論。但是Prediction Machines的作者將AI的當前狀態分解為一個非常簡單的概念,盡管沒有令人興奮的概念:預測。他們寫道:“人工智能的新浪潮實際上并沒有為我們帶來情報,而是情報的關鍵組成部分-預測。”
機器學習算法的預測能力仍然是本書的核心概念,并有助于我們了解其在各個層次上的影響。
預測機器:人工智能的簡單經濟學
什么是預測?Prediction Machine的作者再次簡化:“預測是填充缺失信息的過程。預測會獲取您擁有的信息(通常稱為“數據”),并使用它來生成您沒有的信息。”
即使在最高級的水平上,大多數機器學習算法都是可以預測結果的數學模型:圖像屬于哪一類?將來股票的價值是多少?貸款申請人違約的可能性是多少?某個電子郵件的可能答案是什么?
隨著這些預測變得更加細化和精確,它們可以為以前不可能或極其困難的應用提供支持,例如創建從未存在的人的真實照片或開發用于危險疾病的藥物。
您會在媒體上聽到很多東西,那就是機器學習及其流行的子集深度學習已經存在了數十年。但是,為什么今天機器學習的預測能力變得如此重要呢?大多數專家會告訴您數據的可用性,更強大,更便宜的計算資源在過去幾年中推動了深度學習的發展。
預測機器的作者將這兩個前提推得更遠。“當某物的價格下跌時,我們會更多地使用它。他們寫道:“這很簡單,而且現在正在AI中發生。”正如他們在書中進一步解釋的那樣,這是計算和技術歷史上一直存在的趨勢。計算機降低了算術的價格。互聯網減少了分發,通信和搜索的成本。機器學習降低了預測的成本,而以前這需要大量的人類認知工作和專業知識。
Prediction Machines的作者寫道:“將某物減少到純成本的方式可以避免大肆宣傳,盡管這無助于使最新最好的技術看起來令人興奮。”因此,就當今的AI而言,作者寫道:“計算機仍然無法思考,因此思想不會變得便宜。”但是預測變得非常便宜,這本身就是一個大問題。
機器學習將如何改變業務
廉價的預測將通過兩種主要方式改變組織的工作方式。“低級別的預測機器可以減輕人們的預測任務,從而節省成本,”預測機器的作者寫道。這意味著放射線醫生會在人工神經網絡的幫助下檢查更多的X射線片,幫助臺操作員使用自然語言處理算法來響應更多的客戶查詢,并且借助機器學習算法預測庫存時間和庫存量,庫存管理系統可以更有效地工作。 。
作者寫道:“但是在某個時候,預測機器可能變得如此準確和可靠,以至于改變了組織的工作方式。”這是一個示例:Amazon當前使用機器學習算法來提出銷售建議。例如,當搜索Prediction Machines時,這家電子商務巨頭的平臺使用聚類機器學習算法來顯示我可能會感興趣的其他書籍的列表。
亞馬遜使用機器學習來提出建議。
希望(對于亞馬遜),這些建議可以說服我購買一本書而不是兩本書。需要明確的是,亞馬遜的建議非常不錯。實際上,我經常在亞馬遜上搜索舊書以發現新的相關書名。
但是在某些時候,預測將變得如此精確,以至于將導致公司業務模式的重大轉變。目前,亞馬遜使用先購物后發貨的模式。您在amazon上購買商品,公司會盡力將購買的商品盡快送到您的家中。
先買后買是另一種商業模式:亞馬遜使用機器學習來預測您的需求,然后將其運送到您的家中。如果需要這些物品,則購買它們,如果不需要,則由公司承擔退還費用。僅當預測準確性超過某個閾值以使其對亞馬遜有利時,該模型才有效。
機器學習和數據的價值
在學術界,大多數AI研究都專注于創建可以對已建立的數據集(例如ImageNet,CLEVR或SQUAD)執行任務的算法。但是在實際應用中,獲得正確的數據以訓練和維護機器學習算法時,還有許多其他細微差別。
Prediction Machines的作者做了出色的工作,為機器學習算法處理數據的經濟學帶來了神秘化。預測機器依賴于數據。更多更好的數據可以帶來更好的預測。從經濟角度來講,數據是預測的關鍵補充。隨著預測變得越來越便宜,它變得越來越有價值。
但是他們還強調,收集質量數據既昂貴又費時,并且經營一家AI公司需要在獲取更多數據的利益和獲取數據的成本之間進行權衡。統計學家和機器學習從業者都知道,數據的規模收益遞減。當您在更多數據上訓練機器學習算法時,準確性提高的速度會變慢。第三個數據點提供的信息比百分之一百多,后者又比百分之一有用。
作者提醒我們,但是當您使用機器學習來開展業務時,情況會有所不同,因為從經濟角度來看,重要的是從預測中獲得的價值。因此,如果更多的數據可以改善您的機器學習算法,從而使您在競爭者中脫穎而出(想一想從購物然后運輸到運輸然后購物的轉變),那么可能值得投資。
這就是為什么我們看到Facebook和google等技術巨頭進行軍備競賽,以收集可以增強其AI算法的數據。商業領導者還必須了解,本身擁有大量數據并不一定會讓您處于開發強大的機器學習算法的正確位置。數據分為三類:訓練,輸入和反饋。您需要全部三個來為您的業務開發和維護高效的機器學習模型。
例如,擁有大量歷史銷售記錄可能會為預測銷售數字的機器學習模型構成一個很好的培訓數據集。但是,要不斷提高模型的性能,還需要獲取新數據(輸入)并將新的預測與實際客戶行為(反饋)進行比較的方法。除了技術創新外,這還需要一種業務策略。
數據和預測機器是補充。因此,除非有足夠的數據來采購或開發AI,否則其價值有限。”作者寫道。“如果這些數據與其他人在一起,則需要一種策略來獲取它。如果數據駐留在獨家或壟斷提供商的手中,那么您可能會面臨使該提供商占用您AI的全部價值的風險。如果數據歸競爭對手所有,則可能沒有任何策略值得從競爭對手那里獲取。如果數據歸消費者所有,則可以交換數據以換取更好的產品或更高質量的服務。”
預測與判斷之間的區別
Prediction Machines中討論的另一個關鍵主題是,在預測和判斷之間劃清界限,在AI和人類之間分工。預測不是決定。做出決定需要先對預測做出判斷,然后采取行動。我認為這是至關重要的一點。對于每個業務領導者來說,重要的是要了解機器學習算法的潛力,同時也要認識到它們的缺點以及需要依靠人工智慧和決策的地方。
隨著機器預測逐漸取代人類做出的預測,人類預測的價值將下降。但是關鍵是,盡管預測是任何決策的關鍵組成部分,但它并不是唯一的組成部分。決策的其他要素(判斷,數據和行動)目前仍牢牢地存在于人類領域。它們是對預測的補充,這意味著隨著預測變得便宜,它們的價值也會增加。
判斷是一項復雜的任務,通常需要常識和對世界的了解,這是機器學習算法當前奮斗的兩個領域。在許多情況下,人類必須判斷和決定跨越短期和長期的多個目標。他們必須評估動態情況并評估權衡。但是,在不太復雜的環境中,可以通過獎勵功能工程或硬編碼規則的實施來自動進行判斷和決策。這些是AI分支(例如強化學習)可以完全自動化任務的領域。
了解機器學習業務模型
如果Prediction Machines強調了一件事情,那就是運營AI業務的根本差異和挑戰。許多公司和業務領導者都具有經典軟件開發和業務的背景。他們需要適應管理機器學習模型的開發和維護的規則,并管理隨之而來的獨特風險。那些適應人工智能業務的人必將獲得豐厚的回報。






