你擔心的金融安全 無監督機器學習技術可以搞定
“無科技,不金融”。隨著移動互聯網時代的到來,科技金融模式不斷創新,但是欺詐手法也在不斷翻新,呈現出專業化、產業化、隱蔽化等特點。日前,世界科技開發者盛會DeveloperWeek 2019評選VR、人工智能、金融科技等領域優勝者,AI公司DataVisor維擇科技憑借無監督機器學習技術獲得最具投資價值的科技金融企業獎。
無監督機器學習技術是什么,為何會被認為最具投資價值?它能在科技金融活動中起到什么作用?能解決哪些金融交易中的問題?
科技金融反欺詐創新利器
與傳統金融不同,互聯網金融業務大多發生在線上,往往幾秒鐘就完成審核、申請、放款等,面臨的欺詐風險也是前所未有的。據統計,我國網絡犯罪導致的損失占GDP0.63%,一年損失金額高達4000多億人民幣。國際上的情況也不樂觀,多份市場研究報告指出,僅2016年一年,全球信用卡、借記卡、預付卡和私有品牌支付卡損失就高達163.1億美元;每年保險欺詐(不包括健康險)損失總額預計超過400億美元。
“隨著技術不斷演進,針對金融業的攻擊、欺詐手段已不同以往。團伙作案、分工明確、掌握各種先進技術工具、不斷變化攻擊手段,全新挑戰使得金融企業越來越難以招架。”DataVisor中國區總經理吳中說,金融反欺詐期待創新已成業內共識。
“無監督機器學習是近年才發展起來的反欺詐手法。目前國內反欺詐金融服務主要是應用黑白名單、有監督學習和無監督機器學習的方法來實現。”愛信諾征信有限公司總經理金端峰在接受科技日報記者專訪時說。
黑白名單被認為是最原始的反欺詐方式,類似于“篩選器”。如銀行征信系統就可理解成一個黑白名單,信用卡多次逾期還款就可能被列入信貸“黑名單”;在淘寶上購買了退貨險后屢屢退貨,就可能上騙保“黑名單”。黑白名單是所有反欺詐方法中最簡單的,但也是更新最慢、成本最高的。
能將異常用戶一網打盡
有監督學習需要大量有標簽數據來訓練模型,以此來預測還未被標注的數據。以垃圾郵件為例,假如把5000封已由人工確認過的垃圾郵件輸入到模型,模型通過對標題的識別、郵件內容句子的分割、關鍵詞的識別等各種分析方法,找到其中的內在關系。如標題中有“福利”二字的,有90%的可能性是垃圾郵件;一次性發送超過200封的,有60%的可能性是垃圾郵件;回復率低于10%的,有70%的可能性是垃圾郵件……于是,當模型處理一封新郵件時,通過檢測以上各子項,并對每一子項乘以百分比后相加,就能得出垃圾郵件的可能性。但有監督學習的弊端是,每個模型都需要大量訓練數據以及較長的訓練時間。
“可能你的模型還沒有訓練好,欺詐分子已經完成欺詐活動并尋找下個目標了。”吳中說。
無監督機器學習主要方式有聚類和圖形分析。金端峰說,無監督無需任何訓練數據和標簽,通過聚類等機器學習算法模型發現用戶的共性行為,以及用戶和用戶的關系來檢測欺詐。“通過無監督機器學習分析用戶的共性行為,可以發現偽裝過的異常用戶,將其一網打盡。”
何為聚類方式?例如一群用戶注冊事件,可通過聚類發現幾個小群符合某些共性:注冊時間集中,都使用了某種操作系統,某一個瀏覽器版本等。該用戶群中的任何一個單獨拿出來分析,看上去都極為正常,如果符合某種超乎尋常的一致性就十分可疑了。比如一群人在凌晨2—3點采用同一款瀏覽器注冊了同一產品,其IP的前20位相同,GPS定位小于1公里,注冊后都修改了昵稱和性別等。
現在的金融欺詐都是團伙作戰,面對“化整為零,批量復制”的欺詐手法,金端峰說,無監督算法應用于反欺詐檢測還有一個優勢,那就是能提前預警。“現在的欺詐分子都有潛伏期,以免太容易被發現。由于他們在潛伏期的行為依然符合某種規律,具有某些一致性,同樣還是會被無監督算法捕捉到。在攻擊發生前就檢測出欺詐分子,這一點傳統方法是難以做到的,防患于未然這也是無監督機器學習之所以在反欺詐檢測中大放光彩的重要原因之一。”
防患于未然及時預警
在科技金融活動中,無監督機器學習能有效防止欺詐行為的發生并及時對用戶發出預警,阻止開戶欺詐、欺詐交易、賬號盜取,發現洗錢攻擊等,保障正常的金融活動。
金端峰舉例說,猛犸反欺詐公司基于非監督式的異常檢測,將數據分解為正常趨勢、隨機擾動和異常情況三部分,并在此基礎上做到設備、網絡和用戶三個層面上的“千人千面”;并根據用戶間的相互關聯構造網絡圖,欺詐者往往團體作案,行為表現在網絡圖中呈現高度一致性和聚集性,與正常用戶明顯不同,因此利用聚類和圖形分析辨別欺詐行為。“螞蟻金服、京東金融等一些高科技互聯網公司也通過無監督機器學習等技術手段,在金融科技方面取得了良好成績。”
除了有效防止欺詐行為的發生,無監督機器學習在科技金融領域還能有多種作用。比如通過用戶畫像和大數據模型精準找到用戶,實現精準營銷;根據個人投資者提供的風險承受水平、收益目標以及風格偏好等要求,運用一系列智能算法及投資組合優化等理論模型,為用戶提供最終的投資參考,并依據市場動態對資產配置調整提供建議;投資研究需要收集大量資料,進行數據分析,報告撰寫等,通過機器自主抓取相關信息,可以輔助決策,甚至自動生成投研報告;利用大數據人工智能技術,可使用海量的多維度數據,塑造出高度精細化的風險控制模型;通過學習、積累金融法規,并結合金融機構的實際情況提供合規建議;機器還可以從海量的交易數據中學習知識和規則,發現異常行為,對洗錢行為進行警示等。
應用廣泛可進行投資預測
無監督機器學習技術的應用正在不斷深入和擴展。愛信諾是上市企業航天信息股份有限公司的全資子公司,在大數據采集、分析和應用方面具有突出能力,建成了以稅務和企業經營數據為核心的企業信用數據庫。
金端峰說,其實,許多大公司都有大型數據庫,儲存用戶數據信息,通過無監督機器學習分析用戶的整體數據,就能發現用戶金融消費習慣的變化、投資偏好等,自動發現市場分類并針對不同群體用戶推出不同的金融產品。“這樣,有針對性的開發新市場,減少了盲目投入。”
此外,根據客戶國籍、職業、薪酬、經驗、行業、信用記錄等信息,利用無監督機器學習技術來確定客戶的信用風險評分,甚至是在向客戶提供任何服務之前就進行此類評定,加快放貸過程,還能避免耗時而必要的“盡調”過程。
“隨著機器學習的使用,股票預測變得相當簡單。”金端峰說,機器學習算法會利用上市企業的資產負債表、損益表等歷史數據,進行分析,并找出關系到公司未來發展的有意義的跡象,進行投資預測。(記者 李禾)
關鍵詞:
您可能也感興趣:
為您推薦
8家險企股權被掛牌轉讓,為何險企股權不再被追捧?
深圳最低工資標準調整為2360元/月 失業保險金為2124元/月
遼寧實施失業保險省級統籌 對缺口核定等作出詳細規定
排行
最近更新
- 江蘇發布重大項目清單 增資擴產項目明顯增多
- 山東抓投資抓項目 新興領域投資規模持續擴大
- Gucci在2月將投放 10 個“SuperGucci”NFT
- 美國銀行:美國CBDC將保持美元作為世界儲備貨幣的地位
- 美股三大指數尾盤集體轉漲
- 光伏發電概念股有哪些?光伏發電概念龍頭股一覽
- The new iPad屏幕對比評測
- 電源接通延時器
- 汽車電子穩定系統(ESP)詳解
- 聯想B520一體機拆解
- 焦炭相關股票有哪些?焦炭概念股票龍頭一覽
- 增強信號 3G無線上網卡改裝拆解全攻略
- 盤點全球五大智能手機生產商 華為聯想入圍
- 三星新平板 Galaxy Note 10.1全拆解
- 智能監控防盜報警系統
- 格力電器未來三年股東回報規劃:每年累計分紅不低于當年凈利潤50%
- 消息稱京東科技計劃2022年在港IPO,募資10億至20億美元
- 恒大集團:呼吁境外債權人不采取任何激進的法律行動
- 海航董事長劉璐因個人原因辭職,在海航已近28年
- 青青稞酒預計2021年營收增長30%-40%,四季度凈虧損超1500萬
- 2022年在港上市募資10億美元?京東科技:不予置評
- 財政部修訂出臺《財政行政處罰聽證實施辦法》
- 賣房子需要交什么稅?賣房子必須攜帶哪些證件?
- 醫保卡的使用范圍有哪些?補牙可以使用醫保報銷嗎?
- 小產權房能過戶嗎?購買小產權房有什么風險?
- 奕東電子的實際控制人是誰?奕東電子股票上市了嗎?
- 百合股份是一家什么公司?百合股份的股票何時上市?
- 浙江:爭取實施數字人民幣試點
- 支付寶被盜刷后該怎么辦?理賠流程有哪些?
- 春節假期港股休市時間是如何安排的?何時恢復交易?