采用人工智能面臨的挑戰

?機器人資訊 ????|???? ?2020-05-16

  人們需要了解采用人工智能的挑戰,例如數據、人員和業務。

 

  人工智能正在進入更多的行業,越來越多的公司已經體驗到了實施人工智能的好處。盡管人工智能正在發展并越來越受歡迎,但許多企業仍然無法采用這種新技術改進業務。這是為什么?

 

  企業可能擔心人工智能實施的原因有很多。在2019年,O'Reilly公司出版了一本電子書,總結了對企業采用人工智能的調查結果,并列出了阻礙進一步實施人工智能的一些最常見因素。

 

  23%的受訪者表示,他們沒有進一步采用人工智能的主要原因是他們的公司文化不認可對人工智能的需求。其他原因包括缺乏數據和缺乏技術人員,以及難以確定適當的商業案例等。


  企業在實施人工智能時面臨哪些挑戰?

 

  正如人們所見,一些常見問題主要包括與人員、數據或業務一致性相關的問題。雖然每家公司都不同,并且也會以不同的方式體驗人工智能的采用過程,但也應該注意一些障礙。在本文中,將介紹人工智能實現中最常見的一些挑戰,并嘗試建議如何做好應對這些挑戰的準備。

 

  與數據相關的問題可能是大多數企業所面臨的問題。眾所周知,企業構建的系統只能與它給出的數據一樣好。由于數據是人工智能解決方案的關鍵要素,因此在此過程中可能會出現許多問題。

 

  1.數據質量和數量

 

  如上所述,人工智能系統的質量在很大程度上依賴于輸入的數據。人工智能系統需要大量的訓練數據集,以類似于人類的方式從可用信息中學習,但為了識別模式,它需要更多的數據。

 

  在任務上做得更好,執行任務的經驗越多,這是有道理的。不同的是,人工智能能夠以人類想像不到的速度分析數據,因此其學習速度很快。企業給它的數據越好,它將提供更好的結果。

 

  那么企業怎么解決數據問題?首先,需要知道已有的數據,并將其與模型所需的數據進行比較。為此,企業需要知道其將要使用的模型,否則,將無法指定所需的數據。

 

  列出企業擁有的數據的類型和類別問題:數據是結構化的還是非結構化的?是否收集有關客戶人口統計數據,購買歷史記錄,現場互動等數據?當企業知道其已經擁有的東西時,會看到所缺少的東西。

 

  缺少的部分可能是人工智能系統可以輕松訪問的一些公開信息,或者企業可能必須從第三方購買數據。某些類型的數據可能仍然難以獲得,例如臨床數據可以更準確地預測治療結果。不幸的是,在這一點上,企業必須做好準備,不是所有類型的數據都容易獲得。

 

  在這種情況下,綜合數據得以拯救。綜合數據是基于實際數據或從頭開始人工創建的。當沒有足夠的數據可用于訓練模型時,可以使用它。獲取數據的另一種方法是使用開放數據作為數據集的補充,或使用谷歌數據集搜索獲取數據來訓練模型。企業還可以使用RPA機器人來抓取公開可用的數據,例如維基百科網站上發布的信息。

 

  當企業知道自己擁有哪些數據以及需要哪些數據時,將能夠驗證擴展數據集的哪種方式最適合自己。

 

  2.數據標簽

 

  幾年前,大多數數據都是結構化的或文本的格式。如今,隨著物聯網(IoT)的發展,大部分數據都是由圖像和視頻組成的。這沒有什么不對,但問題是許多利用機器學習或深度學習的系統都是以監督的方式進行訓練,所以他們需要對數據進行標記。

 

  事實上,人們每天產生大量數據的事實,已經達到了沒有足夠人員來標記正在創建的所有數據的程度。有些數據庫提供標記數據,包括ImageNet,這是一個擁有1400多萬張圖像的數據庫。所有這些都是由ImageNet人工注釋的。盡管在某些情況下其他地方可以獲得更合適的數據,但許多計算機視覺專家仍然只使用ImageNet,因為他們的圖像數據已被標記。

 

  企業可以采用一些數據標注方法。可以在企業內部或外包工作,也可以使用合成標簽或數據編程。所有這些方法各有利弊。


  3.可解釋性

 

  對于許多“黑盒”模型,企業最終得出一個結論,例如預測但沒有解釋。如果人工智能系統提供的結論與企業已經知道的結果重疊并認為是正確的,那么就不會質疑它。但是如果不認同會發生什么?需要知道如何做出決定。在許多情況下,其決定本身是不夠的。醫生不能完全依賴系統提供的關于患者健康的建議。

 

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。