數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間有什么區(qū)別？

2022-04-17 09:55:36 來源: 網(wǎng)絡(luò)

機(jī)器學(xué)習(xí)，有時也稱為計算智能，近年來已經(jīng)突破了一些技術(shù)障礙，并在機(jī)器人、機(jī)器翻譯、社交網(wǎng)絡(luò)、電子商務(wù)，甚至醫(yī)藥和醫(yī)療保健等領(lǐng)域取得了重大進(jìn)展。機(jī)器學(xué)習(xí)是人工智能的一個領(lǐng)域，其目標(biāo)是開發(fā)學(xué)習(xí)計算技術(shù)以及構(gòu)建能夠自動獲取知識的系統(tǒng)。

學(xué)習(xí)系統(tǒng)是一種計算機(jī)程序，它通過成功解決過去的問題積累的經(jīng)驗做出決策。盡管應(yīng)用時間不長，但是有許多不同的學(xué)習(xí)算法，該領(lǐng)域是計算領(lǐng)域最熱門的領(lǐng)域之一，并且定期發(fā)布一些新的技術(shù)和算法。

機(jī)器學(xué)習(xí)vs人工智能

許多人認(rèn)為機(jī)器學(xué)習(xí)和人工智能的含義是一樣的，但這并不十分準(zhǔn)確。人工智能有幾種定義，這其中包含機(jī)器學(xué)習(xí)的廣泛概念。一個被廣泛接受的定義是，人工智能由依賴人類行為來解決問題的計算機(jī)制組成。換句話說，技術(shù)使計算機(jī)就像人類一樣“思考”來執(zhí)行任務(wù)。

人類能夠分析數(shù)據(jù)，發(fā)現(xiàn)其中的模式或趨勢，從中進(jìn)行更明智的分析，然后使用結(jié)論做出決策。在某種意義上，人工智能也遵循同樣的原則。通常，人們完成任務(wù)越多，就越熟練。這是具有學(xué)習(xí)能力的結(jié)果。經(jīng)常重復(fù)或執(zhí)行相關(guān)程序?qū)θ藗儊碚f是一種培訓(xùn)。在人工智能系統(tǒng)中也會發(fā)生類似的事情：公開獲取或記錄在專用平臺上的數(shù)據(jù)用作人工智能算法的培訓(xùn)。

那么培訓(xùn)是如何完成的?為此目的有幾種算法。這一切都取決于應(yīng)用程序以及它們背后的組織或人員。在這里，最重要的是知道在這一點上機(jī)器學(xué)習(xí)是有意義的。

什么是機(jī)器學(xué)習(xí)?

機(jī)器學(xué)習(xí)也是一個有多種定義的概念，但在其核心，機(jī)器學(xué)習(xí)是一個可以根據(jù)自身經(jīng)驗自主修改其行為的系統(tǒng)，其人為干擾很小。這種行為修改基本上包括建立邏輯規(guī)則，目的是提高任務(wù)的性能，或者根據(jù)應(yīng)用程序做出最適合場景的決策。這些規(guī)則是根據(jù)分析數(shù)據(jù)中的模式識別生成的。

例如，如果一個人在搜索引擎中鍵入“勇敢”這個詞，該服務(wù)需要分析一系列參數(shù)來決定是否顯示類似于激怒或勇敢的結(jié)果，這可能有兩種含義。在眾多可用參數(shù)中有用戶搜索歷史：例如，如果在尋找“勇敢”之前幾分鐘，則最有可能出現(xiàn)第二種意義。這是一個非常簡單的例子，但它說明了機(jī)器學(xué)習(xí)的一些重要方面。

重要的是，系統(tǒng)必須根據(jù)大量數(shù)據(jù)進(jìn)行分析，這是搜索者必須放棄的一個標(biāo)準(zhǔn)，因為他們接收了數(shù)百萬次訪問，因此這是一個培訓(xùn)標(biāo)準(zhǔn)。

另一個方面是持續(xù)的數(shù)據(jù)輸入，有利于識別新標(biāo)準(zhǔn)。假設(shè)“勇敢”這個詞成為與文化運動相關(guān)的俚語，通過機(jī)器學(xué)習(xí)，搜索引擎將能夠識別指向該術(shù)語的新含義的模式，并且在一段時間之后，將能夠在搜索結(jié)果中考慮它。

機(jī)器學(xué)習(xí)有幾種方法。眾所周知的一種方法稱之為“深度學(xué)習(xí)”，其中大量數(shù)據(jù)來自多層人工神經(jīng)網(wǎng)絡(luò)，這些算法受到解決復(fù)雜問題的大腦神經(jīng)元結(jié)構(gòu)的啟發(fā)，例如圖像中的物體識別。

機(jī)器學(xué)習(xí)的例子

機(jī)器學(xué)習(xí)的使用正在演變成各種各樣的應(yīng)用，人們當(dāng)今擁有的許多技術(shù)資源都基于人工智能和機(jī)器學(xué)習(xí)。

自治數(shù)據(jù)庫 - 借助機(jī)器學(xué)習(xí)，自治數(shù)據(jù)庫處理以前由管理人員(DBA)執(zhí)行的若干任務(wù)，允許這些專業(yè)人員處理其他活動，從而降低因為人為錯誤導(dǎo)致的應(yīng)用程序不可用的風(fēng)險。

打擊支付系統(tǒng)中的欺詐行為 - 每秒都會產(chǎn)生各種信用卡欺詐和其他支付方式的嘗試。機(jī)器學(xué)習(xí)允許反欺詐系統(tǒng)在成功之前識別其中的大部分。

文本翻譯——翻譯必須考慮場景、區(qū)域表達(dá)式和其他參數(shù)。由于采用機(jī)器學(xué)習(xí)，自動翻譯越來越精確。

內(nèi)容推薦——視頻和音頻流平臺使用機(jī)器學(xué)習(xí)來分析用戶查看或拒絕的內(nèi)容的歷史記錄，以便為他們提供符合其意愿的建議。

營銷和銷售——根據(jù)以前的購買推薦產(chǎn)品和服務(wù)的網(wǎng)站使用機(jī)器學(xué)習(xí)來分析購買歷史，并推廣客戶可能感興趣的其他項目。這種捕獲數(shù)據(jù)、分析數(shù)據(jù)并使用它來定制購物體驗的能力或?qū)嵤I銷活動是零售業(yè)的未來。

運輸——分析數(shù)據(jù)以識別模式和趨勢對于運輸行業(yè)至關(guān)重要，這取決于開發(fā)更有效的路線，并預(yù)測潛在問題以提高可靠性和盈利能力。機(jī)器學(xué)習(xí)數(shù)據(jù)建模和分析方面是運輸廠商、公共交通和業(yè)內(nèi)其他組織的重要工具。

石油和天然氣 - 機(jī)器學(xué)習(xí)有助于發(fā)現(xiàn)新的能源，分析土壤中的礦物質(zhì)，預(yù)測煉油廠傳感器的故障，加速石油的分配，使其更加高效和經(jīng)濟(jì)。在這個行業(yè)中，機(jī)器學(xué)習(xí)應(yīng)用程序的數(shù)量是巨大的，并且持續(xù)增長。

醫(yī)療保健 - 由于可穿戴設(shè)備和傳感器的出現(xiàn)，使醫(yī)療保健專業(yè)人員能夠?qū)崟r訪問患者數(shù)據(jù)，因此機(jī)器學(xué)習(xí)是醫(yī)療保健領(lǐng)域不斷發(fā)展的趨勢。該技術(shù)還可以幫助醫(yī)學(xué)專家分析數(shù)據(jù)，以識別趨勢或警報，從而改善診斷和治療。

機(jī)器學(xué)習(xí)中使用的方法

兩種最廣泛采用的機(jī)器學(xué)習(xí)方法是監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)，但它們并不是唯一的方法。

通過標(biāo)記示例訓(xùn)練監(jiān)督學(xué)習(xí)算法，作為已知所需輸出的輸入。例如，設(shè)備可能具有標(biāo)記為“F”(失敗)或“E”(執(zhí)行)的數(shù)據(jù)點。學(xué)習(xí)算法接收一組輸入以及相應(yīng)的正確輸出，并通過將實際輸出與正確輸出進(jìn)行比較來學(xué)習(xí)以發(fā)現(xiàn)錯誤。然后它修改結(jié)算模型。通過分類、回歸和梯度增強等方法，監(jiān)督學(xué)習(xí)使用標(biāo)準(zhǔn)來預(yù)測附加的非標(biāo)記數(shù)據(jù)中的標(biāo)簽值。監(jiān)督學(xué)習(xí)通常用于歷史數(shù)據(jù)預(yù)測可能的未來事件的應(yīng)用中。例如，它可以預(yù)測信用卡交易何時可能是欺詐性的，或者哪些投保人傾向于要求其政策。

非監(jiān)督學(xué)習(xí)用于針對沒有歷史標(biāo)簽的數(shù)據(jù)。“正確答案”未向系統(tǒng)報告。算法必須找出所顯示的內(nèi)容。目標(biāo)是探索數(shù)據(jù)并在其中找到一些結(jié)構(gòu)。無監(jiān)督學(xué)習(xí)適用于交易數(shù)據(jù)。例如，它可以識別具有相似屬性的客戶群，然后可以在營銷活動中對其進(jìn)行類似處理;或者它可以找到分隔不同客戶群的關(guān)鍵屬性。常用的技術(shù)包括自組織映射、鄰近映射、k-均值分組和分解為奇異值。這些算法還用于分割文本主題、推薦項目和識別數(shù)據(jù)中的差異點。

半監(jiān)督學(xué)習(xí)用于與監(jiān)督學(xué)習(xí)相同的應(yīng)用程序，但處理有標(biāo)簽和無標(biāo)簽的數(shù)據(jù)進(jìn)行培訓(xùn)——通常是用大量無標(biāo)簽數(shù)據(jù)標(biāo)記的少量數(shù)據(jù)(因為沒有標(biāo)簽的數(shù)據(jù)更便宜，并且需要花費更少的精力來獲取)。這類學(xué)習(xí)可用于分類、回歸和預(yù)測等方法。當(dāng)與標(biāo)簽相關(guān)的成本太高而無法實現(xiàn)完全標(biāo)記的培訓(xùn)過程時，半監(jiān)督學(xué)習(xí)非常有用。其典型例子包括在網(wǎng)絡(luò)攝像頭上識別人臉。

強化學(xué)習(xí)通常用于機(jī)器人、游戲和導(dǎo)航。有了它，算法通過嘗試和錯誤發(fā)現(xiàn)，哪些行為會帶來更大的回報。這種類型的學(xué)習(xí)有三個主要組成部分：代理(學(xué)習(xí)者或決策者)、環(huán)境(代理與之交互的所有內(nèi)容)和行動(代理可以做什么)。目標(biāo)是讓代理選擇在給定時間段內(nèi)最大化預(yù)期回報的行動。如果代理遵循一個好的政策，可以更快地實現(xiàn)目標(biāo)。因此，強化學(xué)習(xí)的重點是找出最佳策略。

數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間有什么區(qū)別?

雖然所有這些方法都有相同的目標(biāo)，提取可用于決策的見解、模式和關(guān)系，但它們具有不同的方法和功能。

數(shù)據(jù)挖掘可以被視為從數(shù)據(jù)中提取洞察力的許多不同方法的超集。它可能涉及傳統(tǒng)的統(tǒng)計方法和機(jī)器學(xué)習(xí)。數(shù)據(jù)挖掘應(yīng)用來自多個區(qū)域的方法來識別數(shù)據(jù)中先前未知的模式。這可能包括統(tǒng)計算法、機(jī)器學(xué)習(xí)、文本分析、時間序列分析和其他分析領(lǐng)域。數(shù)據(jù)挖掘還包括數(shù)據(jù)存儲和操作的研究和實踐。

通過機(jī)器學(xué)習(xí)，目的是了解數(shù)據(jù)的結(jié)構(gòu)。因此，統(tǒng)計模型背后有一個理論是經(jīng)過數(shù)學(xué)證明的，但這要求數(shù)據(jù)也滿足某些假設(shè)。機(jī)器學(xué)習(xí)是從使用計算機(jī)檢查數(shù)據(jù)結(jié)構(gòu)的能力發(fā)展而來的，即使人們不知道這種結(jié)構(gòu)是什么樣子的。機(jī)器學(xué)習(xí)模型的測試是新數(shù)據(jù)中的驗證錯誤，而不是證明空假設(shè)的理論測試。由于機(jī)器學(xué)習(xí)通常使用迭代的方法從數(shù)據(jù)中學(xué)習(xí)，因此可以輕松地自動學(xué)習(xí)。這些步驟通過數(shù)據(jù)執(zhí)行，直到找到一個可靠的標(biāo)準(zhǔn)。

深度學(xué)習(xí)結(jié)合了計算能力的進(jìn)步和特殊類型的神經(jīng)網(wǎng)絡(luò)，以學(xué)習(xí)大量數(shù)據(jù)中的復(fù)雜模式。深度學(xué)習(xí)技術(shù)是當(dāng)今最先進(jìn)的技術(shù)，用于識別圖片中的對象和語音中的單詞。研究人員正在嘗試將模式識別方面的成功應(yīng)用于更復(fù)雜的任務(wù)，例如機(jī)器翻譯、醫(yī)療診斷以及許多其他社會和企業(yè)問題。

盡管人工智能和機(jī)器學(xué)習(xí)的概念早已出現(xiàn)，但它們開始成為主流應(yīng)用的一部分。但是，現(xiàn)在仍處于起步階段。如果人工智能和機(jī)器學(xué)習(xí)有用并且令人印象深刻，當(dāng)?shù)玫礁玫挠?xùn)練和改進(jìn)時，其實施將會更加有效。

關(guān)鍵詞：數(shù)據(jù)挖掘機(jī)器學(xué)習(xí) 深度學(xué)習(xí)

手机看片福利永久国产日韩-手机看片369-手机精品在线-手机国产乱子伦精品视频-国产精品嫩草影院在线观看免费-国产精品嫩草影院在线播放

數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間有什么區(qū)別？

您可能也感興趣:

今日熱點

湖北發(fā)布第四批專精特新“小巨人”企業(yè)名單總數(shù)將達(dá)2357家

中國衛(wèi)星導(dǎo)航年將會于5月25日舉行提升北斗創(chuàng)新成果轉(zhuǎn)化能力

內(nèi)蒙古大幅度提高科學(xué)技術(shù)獎勵獎金標(biāo)準(zhǔn) 重獎高層次科技人才

更多

更多

排行

最近更新

今日要聞

手机看片福利永久国产日韩-手机看片369-手机精品在线-手机国产乱子伦精品视频-国产精品嫩草影院在线观看免费-国产精品嫩草影院在线播放

數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)之間有什么區(qū)別？

您可能也感興趣:

今日熱點

湖北發(fā)布第四批專精特新“小巨人”企業(yè)名單 總數(shù)將達(dá)2357家

中國衛(wèi)星導(dǎo)航年將會于5月25日舉行 提升北斗創(chuàng)新成果轉(zhuǎn)化能力

內(nèi)蒙古大幅度提高科學(xué)技術(shù)獎勵獎金標(biāo)準(zhǔn) 重獎高層次科技人才

為您推薦

長期護(hù)理保險正在多地加速鋪開 更好滿足老年人養(yǎng)老需求

貸款370萬元買保險？消費者需當(dāng)心有人盯上你的保單

銀保監(jiān)會要求保險機(jī)構(gòu)提升農(nóng)業(yè)保險保障水平 發(fā)展特色農(nóng)產(chǎn)品保險

湖北省棉花“保險+期貨”項目落地三縣市 5萬棉農(nóng)將成為受益者

更多

更多

排行

最近更新

今日要聞

湖北發(fā)布第四批專精特新“小巨人”企業(yè)名單總數(shù)將達(dá)2357家

中國衛(wèi)星導(dǎo)航年將會于5月25日舉行提升北斗創(chuàng)新成果轉(zhuǎn)化能力

長期護(hù)理保險正在多地加速鋪開更好滿足老年人養(yǎng)老需求

銀保監(jiān)會要求保險機(jī)構(gòu)提升農(nóng)業(yè)保險保障水平發(fā)展特色農(nóng)產(chǎn)品保險