手机看片福利永久国产日韩-手机看片369-手机精品在线-手机国产乱子伦精品视频-国产精品嫩草影院在线观看免费-国产精品嫩草影院在线播放

<button id="sa88o"><input id="sa88o"></input></button>

<code id="sa88o"></code>

<rt id="sa88o"></rt><rt id="sa88o"></rt>

<strike id="sa88o"></strike>

<bdo id="sa88o"></bdo>

首頁新聞 > 科技 > 正文

合理規制，讓“爬蟲”向善向上

2021-03-21 19:23:10 來源: 光明日報

近年來，隨著移動互聯、人工智能、大數據、云計算等新技術的迅速發展與普及應用，人們的工作、交往和生活方式都發生了深刻變化，數據成為驅動社會發展的新型生產要素、各行各業增強競爭力的重要源泉。但在大數據收集過程中，也存在著各種違法犯罪問題。網絡爬蟲(Web Crawler)作為一種能快速精準地獲取數據信息的基礎性網絡技術，近年來得到了越來越多的青睞和應用。如何對其進行規制，驅動其向好向善，成為當前重要的法治議題。

“小爬蟲”的“大角色”

網絡爬蟲，又稱為“網頁蜘蛛”“網絡機器人”，是一種按照一定的規則，自動抓取網絡信息的程序或者腳本。它能在特定程序的驅動下，模仿人工點擊從網站、手機應用、小程序或搜索引擎中檢索、提取、存儲數據。我們可以形象地將它們理解為一種爬行在網絡上的蜘蛛，它們根據程序的指令，通常沿著URL(網址)這根蛛絲，在互聯網這張大網上爬來爬去，尋找和帶回所需要的數據資源。我們熟知的百度、搜狗、谷歌等搜索引擎，其技術核心元素之一就是“網絡爬蟲”。例如百度蜘蛛，它通過互聯網入口爬取網頁，實時存儲并更新索引，然后為用戶提供檢索服務。

自從1993年第一個網絡爬蟲程序——“互聯網漫游者”被開發出來，網絡爬蟲這種便捷高效的搜索技術便得到了業界關注。特別是隨著數據資源的爆炸式增長，網絡爬蟲的應用場景也變得越發廣泛與多元，長期活躍于市場調查、產品研發、金融分析、輿情監控、風險預測等領域。近年來，一些運用爬蟲技術為客戶提供數據服務的互聯網企業，也獲得了快速發展。對個人而言，我們可以利用爬蟲軟件等計算機編程語言，讓網絡爬蟲為自己服務。例如想買到理想的房子，就可爬取房產中介的公開信息，分析房源數據與趨勢以輔助決策。

網絡的本質與價值在于連接，核心是實現數據的流動與分享。網絡爬蟲作為數據抓取的技術工具，通過爬行增強了網絡節點間的聯絡，提升了網絡的整體價值，是構建互聯網開放與共享理念的重要技術基石。但網絡爬蟲所行之處，并非總是鮮花和掌聲，特別是涉及隱私領地和網絡安全之時。因此，為了規范爬蟲，維護網絡秩序，1994年誕生了“robots.txt協議”，該協議雖然只是一個“君子協議”，但它逐漸被視為網絡空間爬蟲技術應用公認的行業準則，也成為判定爬取行為是否獲得網站許可的主要依據。在2014年百度公司訴奇虎360違反robots協議案中，法院在判決時就認為，被告沒有遵守原告網站的robots協議，其行為明顯不當，應當承擔相應的不利后果。

科技異化：“好爬蟲”和“壞爬蟲”

科技本身是一種中立性工具，向善向惡、合法與非法，關鍵在于使用者的選擇。原本通過robots協議，一方獲得了數據與信息，一方增加了流量與關注，皆大歡喜。但robots協議能防“君子”卻難防“小人”，有些爬蟲程序不遵守規則，隨心所欲地爬取別人不愿意分享的數據信息，并大量擠占服務器資源，變成了“網絡害蟲”。例如近年來一些大數據風控公司利用爬蟲技術，在網絡上非法收集用戶個人信息并轉賣給第三方，借以謀取經濟利益。

網絡爬蟲設計的初衷是通過計算機技術，自動為網站編纂索引，更新信息，為用戶提供高效的檢索服務。具有訪問、下載和解析(對數據進行分析與篩選)三種基本功能。目前，爬蟲作惡主要是對前兩種功能的異化，體現為三類作惡方式。

一是惡意抓取非授權數據。訪問數據是“網絡爬蟲”的行為起點，也是其價值本源，一些企業或個人為了經濟利益或其他特殊目的，想方設法讓網絡爬蟲突破道德規則與技術障礙(網站“反爬蟲”措施)，爬取未經授權或超過授權范圍的數據。例如2018年2月至4月間，馬某通過編寫“爬蟲”程序，竊取手機應用及網站的用戶信息約20萬條，然后通過微信出售給他人，非法獲利共計2.4萬元，這種行為就構成了侵犯公民個人信息罪。

二是惡意侵犯知識產權。一些網絡爬蟲在數據爬取過程中，未經版權方的許可，就下載、復制或傳播文字、圖片和視頻等內容，并以此獲利。通常形式是，爬蟲對具有版權歸屬的文學或影視作品等設置加框鏈接，吸引用戶點擊，然后通過售賣廣告等形式牟利。例如段某建立的“窩窩電影”網站，利用爬蟲技術對多家視頻網站的500余部影視作品設置了加框鏈接，吸引用戶點擊播放，并賺取廣告費100余萬元，這種行為就觸犯了著作權法。

三是惡意擾亂系統運行。網絡爬蟲訪問系統時，跟人工點擊原理一樣，因此當巨量爬蟲同時訪問某一網站時，就會占用大量的帶寬資源，造成服務器不堪重負甚至崩潰。業內專家表示，2019年有近40%的網絡流量來自爬蟲，其中20%來自惡意爬蟲，而且比例還將不斷上升。出行行業即是重災區。以中國鐵路“12306網站”為例，自2011年上線運營以來，春運期間多次出現因爬蟲(主要是搶票軟件)攻擊而無法訪問的情況。據統計，2018年春運期間，網站最高峰時1天內頁面瀏覽量達813.4億次，其中近90%是“爬蟲”所為。

合理規制，讓“爬蟲”向善向上

據統計，截至2020年12月，我國網民規模達9.89億。增強網絡空間治理，保障個人信息和數據安全，已成為重大的時代命題。

目前我國對網絡爬蟲的規制還沒有專門的法律法規，主要依靠民法典、反不正當競爭法、著作權法、網絡安全法以及刑法中的相關法律條款。但從法律規制效果來看，情況不容樂觀。一方面是由于互聯網技術的快速發展，以及網絡所具有的開放性、虛擬性和流動性等特征，讓對違法犯罪行為的監管和證據提取較為困難，特別是隨著數據抓取從網頁拓展至手機應用程序、小程序等移動端平臺，抓取手段就更加復雜與隱蔽;另一方面是網絡世界和數字服務發展迅猛，法律法規還具有較大的滯后性，司法實踐對網絡爬蟲技術濫用引發的法律問題缺乏足夠的司法經驗，而相關的司法解釋亦未能予以足夠關注，難以形成有效規制。例如2017年今日頭條與新浪微博之間因“微頭條”業務同步“微博”發言內容的糾紛案例，其實質是數據權屬難以確定的問題。但由于缺乏明確的司法解釋指引，引發了實踐中的普遍爭議。

2019年5月，國家互聯網信息辦公室公布了《數據安全管理辦法(征求意見稿)》，該辦法專門針對利用網絡開展數據收集、存儲、傳輸、處理、使用等活動進行了規制，有望對網絡爬蟲等技術行為進行有效治理。該辦法強調，國家堅持保障數據安全與發展并重，鼓勵研發數據安全保護技術，積極推進數據資源開發利用，保障數據依法有序自由流動。這也提醒我們，網絡爬蟲等本質上是順應數字經濟發展需求而生，既要從法律層面高度重視，也要把握好法律規制的邊界，力求達到數據利用與合理規制之間的良性平衡，以便讓網絡技術更好地服務經濟社會與人民生活，助推數字中國建設。

(作者：韓軼聶晶，分別系中央民族大學法學院院長、教授，中央民族大學法學院犯罪防控研究中心研究員)

關鍵詞：網絡爬蟲科技異化人工智能

您可能也感興趣:

今日熱點

黑龍江科技招商大會大慶專場舉行推動科技成果落地轉化

上海：去年科技信貸授信規模1583億元，科技保險助力科研穩發展

蘭州新區科創能力大幅提升新培育科技型企業160家

更多

更多

排行

最近更新

今日要聞

關于本站管理團隊版權申明網站地圖聯系合作招聘信息

Copyright © 2005-2018 創投網 - www.extremexp.net All rights reserved
聯系我們:33 92 950@qq.com
豫ICP備2020035879號-12

主站蜘蛛池模板：工囗番漫画全彩无遮挡| 亚洲一级毛片免费观看| 欧美理伦| 爱情岛亚洲论坛在线观看| 玖玖色资源站| 四虎影视在线影院4hutv| 国产馆在线观看免费的 | 国产精品日本一区二区在线播放 | 中日韩精品视频在线观看| 国产999| 欧美性bbbbbxxxxxxx| 男人j桶进女人j的视频| 成年女人免费播放影院| 免费中文字幕不卡视频| 欧美人与zoxxxx另类| 免费一级毛片在线播放不收费| 欧美一级特黄aa大片在线观看免费| 日韩黄色影片| 男女性色大片免费网站| 里番牝教师～淫辱yy608| 色吊丝av中文字幕| 波多野结衣bd| 小泽玛利亚番号| 亚洲欧洲综合在线| 北条麻妃在线一区二区| 和僧侣的交行之夜樱花| 小小影视日本动漫观看免费| 女人被男人躁到呻吟的| 别急慢慢来在线观看| 亚洲福利电影在线观看| 粗大的内捧猛烈进出小视频| 中文字幕免费在线| 国产成人精品999在线观看| jux434被公每天侵犯的我| 久久精品欧美日韩精品| 国产精品宾馆在线| 夫妇交换性2国语在线观看 | 十七岁在线观看资源网| 免费特级黄毛片| gay肌肉猛男gay激情狂兵| 久久私人影院|

<button id="8auem"><input id="8auem"></input></button>

<code id="8auem"><acronym id="8auem"></acronym></code>

<rt id="8auem"><acronym id="8auem"></acronym></rt>

<tfoot id="8auem"><tr id="8auem"></tr></tfoot>

<rt id="8auem"><acronym id="8auem"></acronym></rt>

<abbr id="8auem"></abbr>