在利用機器學習來改進其商業模式方面,Facebook和Twitter已經讓世界上大多數其他公司遠遠落后。雖然他們的做法并不總是能引起最終用戶的最佳反應,但從這些公司那里可以學到很多關于在擴展和應用數據分析方面應該做什么以及不該做什么的東西。

首先獲取您需要的數據

雖然 Facebook 似乎將機器學習用于所有內容 – 但它用于內容檢測和內容完整性、情緒分析、語音識別和欺詐性帳戶檢測,以及面部識別、語言翻譯和內容搜索功能等操作功能。Facebook 算法管理所有這些,同時將一些計算卸載到邊緣設備,以減少延遲。

這使得擁有較舊移動設備(超過全球市場的一半)的用戶能夠更輕松地訪問該平臺。對于計算能力有限的傳統系統來說,這是一個極好的策略,這些系統隨后可以使用云來處理大量數據?;谠频南到y還可以通過引入可訪問的元數據來改進,這些元數據將自定義、更正和上下文化真實世界的數據。

首先考慮真正需要哪些數據,以及哪些數據集最重要。然后從小開始。很多時候,團隊在急于做的時候會分心,做大做。但這種心態實際上可以混淆為真正的目標:做對了。專注于工作中的適度工作,然后增加應用程序開發以應用于更多數據集或更快地適應不斷變化的參數。通過專注于早期成功和向上擴展,可以完全避免由于數據過快而導致的早期故障。即使真的發生了失敗,小成功的勢頭將推動項目向前發展。

自動化培訓

機器學習需要不斷的修改和培訓才能保持新鮮。Twitter 和 Facebook 都使用 Apache 氣流自動培訓,使平臺不斷更新,有時每小時循環一次。再培訓的數量和速度將在很大程度上依賴于計算成本和資源的可用性。但是,理想的算法性能將依賴于數據集的定期訓練。

最大的挑戰之一可能是選擇人工智能模型的學習類型。雖然深度學習方法是處理大型數據集的首選,但經典三訓練可能會創建一個強大的基線,以優于深度學習,至少對于神經語言編程是這樣。雖然三訓不能完全自動化,但它可能通過采用不同的單元和民主共同學習產生更高質量的結果。

選擇正確的平臺

Twitter 和 Facebook 目前面臨的挑戰之一是試圖標準化他們最初構建框架、管道和平臺的非結構化方法

尋找一個可擴展的平臺,并考慮公司的長期需求,以便成功選擇正確的人工智能工具。

不要忘記最終用戶

搜索”機器學習”和”Facebook”不可避免地會引發數百篇博文和文章,內容涉及一些用戶對網站內置的人工智能功能的負面感受。隱私的喪失、數據挖掘和有針對性的廣告是公司受到的一些不那么令人擔憂的指控。然而,許多相同的用戶欣賞其他AI工具,使他們能夠連接到朋友和家人在其他國家誰不說他們的語言和工具,使平臺沒有色情和仇恨言論(如果有點不完美)。

不是技術本身,而是缺乏透明度,以及Facebook如何在其平臺上實施機器學習,使用戶感到沮喪,并使一些人反對。不要犯同樣的錯誤。信任和透明度應該是所有重大決策的關鍵詞。最終用戶會欣賞它,他們會留下一個精心設計的網站,感覺他們從互動中獲得了一些東西,而不是感覺個人被它侵犯。

Comments are closed.