商業(yè)價(jià)值

提高品牌影響力,以優(yōu)質(zhì)產(chǎn)品服務(wù)市場(chǎng)
人民日?qǐng)?bào)評(píng)互聯(lián)網(wǎng)爬蟲:技術(shù)是把雙刃劍 要揚(yáng)善抑惡
作者:網(wǎng)絡(luò)轉(zhuǎn)載   創(chuàng)建時(shí)間:2024-05-24   閱讀量:4486

睡前聊一會(huì)兒,夢(mèng)中有世界,大家好。利用搶票軟件購(gòu)買火車票,去比價(jià)平臺(tái)看各家報(bào)價(jià),購(gòu)物前先看看網(wǎng)友留言,置身互聯(lián)網(wǎng)時(shí)代,這些或許再普通不過的生活場(chǎng)景,實(shí)際上背后都有一個(gè)繞不開的技術(shù),叫做“爬蟲”。受黨報(bào)評(píng)論君邀請(qǐng),今天我們來聊一聊這個(gè)話題。

  

爬蟲,是一種“自動(dòng)化瀏覽網(wǎng)絡(luò)”的程序,在互聯(lián)網(wǎng)上變出萬千隱形分身,造訪各個(gè)網(wǎng)站,辛勤地做著信息的謄寫者和搬運(yùn)工,就像一只蟲子在一幢樓里不知疲倦地爬來爬去。最早應(yīng)用這類技術(shù)的是搜索引擎,為的是給用戶提供更快更精準(zhǔn)的搜索結(jié)果。然而近年來,隨著技術(shù)發(fā)展,爬蟲不僅游弋到互聯(lián)網(wǎng)金融、電商、社交等等更加枝蔓的樹藤上,也在不斷進(jìn)化自身的能力。獲取網(wǎng)站數(shù)據(jù)、監(jiān)控同類商品價(jià)格、甚至模仿人類行為點(diǎn)贊留言、輸入驗(yàn)證碼,身手越來越敏捷的爬蟲在互聯(lián)網(wǎng)上可謂無孔不入。


  

客觀來說,在幫助人們從海量信息中快速獲取有效信息方面,爬蟲技術(shù)功不可沒,但也給互聯(lián)網(wǎng)籠罩上真假難辨的迷霧。程序員界有一句話,整個(gè)互聯(lián)網(wǎng)50%以上的流量其實(shí)來自于“爬蟲”。也就是說,互聯(lián)網(wǎng)上的大量點(diǎn)擊、瀏覽行為來源于爬蟲,而非人類。有人說互聯(lián)網(wǎng)世界里,“你永遠(yuǎn)不知道屏幕后面坐的是一個(gè)人還是一條狗”,如今可能還要加上一條,“你永遠(yuǎn)不知道互聯(lián)網(wǎng)上的那只腳印是人還是蟲留下的”。

  

爬蟲也分善惡,惡意的爬蟲往往讓被爬的網(wǎng)站渾身不自在,自從爬蟲誕生的那一刻起,反爬的戰(zhàn)爭(zhēng)就無可避免。比如爬蟲最愛光顧的出行領(lǐng)域,據(jù)了解,89.2%的流量沖著12306訂票網(wǎng)站而去,不僅給網(wǎng)站服務(wù)器造成巨大壓力,也擾亂了正常的訂票秩序。“請(qǐng)?jiān)谕蹒蟮ず桶装俸沃羞x出所有的白百何”“請(qǐng)點(diǎn)擊下圖中所有的郭敬明”,近年來12306訂票網(wǎng)站的圖形驗(yàn)證碼備受吐槽,它的設(shè)計(jì)初衷恰恰是為了防止惡意爬蟲刷票。再比如一些聚合電商、比價(jià)平臺(tái)自動(dòng)把各大電商的商品扒下來,這可不是出于好心幫助賣貨,而是為了分奪流量這杯羹,正因如此,一些電商不斷升級(jí)應(yīng)用防火墻,把爬蟲擋在門外。

  

如果說爬蟲與反爬蟲是圍繞利益的爭(zhēng)奪戰(zhàn),那么對(duì)我們普通人來說,最應(yīng)該關(guān)心的是,面對(duì)惡意爬蟲,如何保護(hù)個(gè)人隱私不被竊取。幾年前,就曾有互聯(lián)網(wǎng)公司因?yàn)檫`規(guī)使用爬蟲技術(shù)而對(duì)簿公堂,未經(jīng)允許、擅自抓取、違規(guī)復(fù)制,極有可能導(dǎo)致用戶信息泄露。今天,網(wǎng)絡(luò)場(chǎng)景應(yīng)用早已成為日常生活的一部分,我們的身份信息、消費(fèi)賬單、人脈關(guān)系通過爬蟲技術(shù)都不難被獲取,一篇報(bào)道就曾經(jīng)解密數(shù)據(jù)公司,是如何利用爬蟲獲取用戶在社交軟件上的行為軌跡,進(jìn)而繪制出完整的用戶畫像,進(jìn)行隱私販賣。凡此種種,違背了互聯(lián)網(wǎng)的宗旨,更觸犯法律的底線。


  

實(shí)際上,爬蟲技術(shù)誕生之初,就有過“君子協(xié)定”,約定了禁爬的區(qū)域、隱私的保障,但當(dāng)爬蟲與利益勾連得越來越緊密時(shí),這些協(xié)定能否維持下去?當(dāng)前堵截互聯(lián)網(wǎng)上密密麻麻、行蹤詭譎的惡意爬蟲,如果只是依靠“魔高一尺、道高一丈”的技術(shù)競(jìng)速,又何時(shí)是個(gè)盡頭?由此來看,破除爬蟲使用上的亂象、讓技術(shù)造福用戶,一方面需要重申互聯(lián)網(wǎng)規(guī)則,將多維交織的行業(yè)規(guī)則化為身體力行的從業(yè)守則,減少市場(chǎng)主體惡意使用爬蟲技術(shù)的情況;另一方面也需要治理跟上發(fā)展的腳步,用制度和法規(guī)劃出技術(shù)應(yīng)用的合理軌道,避免技術(shù)發(fā)展中方向走偏、價(jià)值走失。

  

這正是:技術(shù)從來雙刃劍,揚(yáng)善抑惡最考驗(yàn)。


鼎聯(lián)網(wǎng)絡(luò)

人民日?qǐng)?bào)評(píng)互聯(lián)網(wǎng)爬蟲:技術(shù)是把雙刃劍 要揚(yáng)善抑惡
作者:網(wǎng)絡(luò)轉(zhuǎn)載   創(chuàng)建時(shí)間:2024-05-24   閱讀量:4486

睡前聊一會(huì)兒,夢(mèng)中有世界,大家好。利用搶票軟件購(gòu)買火車票,去比價(jià)平臺(tái)看各家報(bào)價(jià),購(gòu)物前先看看網(wǎng)友留言,置身互聯(lián)網(wǎng)時(shí)代,這些或許再普通不過的生活場(chǎng)景,實(shí)際上背后都有一個(gè)繞不開的技術(shù),叫做“爬蟲”。受黨報(bào)評(píng)論君邀請(qǐng),今天我們來聊一聊這個(gè)話題。

  

爬蟲,是一種“自動(dòng)化瀏覽網(wǎng)絡(luò)”的程序,在互聯(lián)網(wǎng)上變出萬千隱形分身,造訪各個(gè)網(wǎng)站,辛勤地做著信息的謄寫者和搬運(yùn)工,就像一只蟲子在一幢樓里不知疲倦地爬來爬去。最早應(yīng)用這類技術(shù)的是搜索引擎,為的是給用戶提供更快更精準(zhǔn)的搜索結(jié)果。然而近年來,隨著技術(shù)發(fā)展,爬蟲不僅游弋到互聯(lián)網(wǎng)金融、電商、社交等等更加枝蔓的樹藤上,也在不斷進(jìn)化自身的能力。獲取網(wǎng)站數(shù)據(jù)、監(jiān)控同類商品價(jià)格、甚至模仿人類行為點(diǎn)贊留言、輸入驗(yàn)證碼,身手越來越敏捷的爬蟲在互聯(lián)網(wǎng)上可謂無孔不入。


  

客觀來說,在幫助人們從海量信息中快速獲取有效信息方面,爬蟲技術(shù)功不可沒,但也給互聯(lián)網(wǎng)籠罩上真假難辨的迷霧。程序員界有一句話,整個(gè)互聯(lián)網(wǎng)50%以上的流量其實(shí)來自于“爬蟲”。也就是說,互聯(lián)網(wǎng)上的大量點(diǎn)擊、瀏覽行為來源于爬蟲,而非人類。有人說互聯(lián)網(wǎng)世界里,“你永遠(yuǎn)不知道屏幕后面坐的是一個(gè)人還是一條狗”,如今可能還要加上一條,“你永遠(yuǎn)不知道互聯(lián)網(wǎng)上的那只腳印是人還是蟲留下的”。

  

爬蟲也分善惡,惡意的爬蟲往往讓被爬的網(wǎng)站渾身不自在,自從爬蟲誕生的那一刻起,反爬的戰(zhàn)爭(zhēng)就無可避免。比如爬蟲最愛光顧的出行領(lǐng)域,據(jù)了解,89.2%的流量沖著12306訂票網(wǎng)站而去,不僅給網(wǎng)站服務(wù)器造成巨大壓力,也擾亂了正常的訂票秩序?!罢?qǐng)?jiān)谕蹒蟮ず桶装俸沃羞x出所有的白百何”“請(qǐng)點(diǎn)擊下圖中所有的郭敬明”,近年來12306訂票網(wǎng)站的圖形驗(yàn)證碼備受吐槽,它的設(shè)計(jì)初衷恰恰是為了防止惡意爬蟲刷票。再比如一些聚合電商、比價(jià)平臺(tái)自動(dòng)把各大電商的商品扒下來,這可不是出于好心幫助賣貨,而是為了分奪流量這杯羹,正因如此,一些電商不斷升級(jí)應(yīng)用防火墻,把爬蟲擋在門外。

  

如果說爬蟲與反爬蟲是圍繞利益的爭(zhēng)奪戰(zhàn),那么對(duì)我們普通人來說,最應(yīng)該關(guān)心的是,面對(duì)惡意爬蟲,如何保護(hù)個(gè)人隱私不被竊取。幾年前,就曾有互聯(lián)網(wǎng)公司因?yàn)檫`規(guī)使用爬蟲技術(shù)而對(duì)簿公堂,未經(jīng)允許、擅自抓取、違規(guī)復(fù)制,極有可能導(dǎo)致用戶信息泄露。今天,網(wǎng)絡(luò)場(chǎng)景應(yīng)用早已成為日常生活的一部分,我們的身份信息、消費(fèi)賬單、人脈關(guān)系通過爬蟲技術(shù)都不難被獲取,一篇報(bào)道就曾經(jīng)解密數(shù)據(jù)公司,是如何利用爬蟲獲取用戶在社交軟件上的行為軌跡,進(jìn)而繪制出完整的用戶畫像,進(jìn)行隱私販賣。凡此種種,違背了互聯(lián)網(wǎng)的宗旨,更觸犯法律的底線。


  

實(shí)際上,爬蟲技術(shù)誕生之初,就有過“君子協(xié)定”,約定了禁爬的區(qū)域、隱私的保障,但當(dāng)爬蟲與利益勾連得越來越緊密時(shí),這些協(xié)定能否維持下去?當(dāng)前堵截互聯(lián)網(wǎng)上密密麻麻、行蹤詭譎的惡意爬蟲,如果只是依靠“魔高一尺、道高一丈”的技術(shù)競(jìng)速,又何時(shí)是個(gè)盡頭?由此來看,破除爬蟲使用上的亂象、讓技術(shù)造福用戶,一方面需要重申互聯(lián)網(wǎng)規(guī)則,將多維交織的行業(yè)規(guī)則化為身體力行的從業(yè)守則,減少市場(chǎng)主體惡意使用爬蟲技術(shù)的情況;另一方面也需要治理跟上發(fā)展的腳步,用制度和法規(guī)劃出技術(shù)應(yīng)用的合理軌道,避免技術(shù)發(fā)展中方向走偏、價(jià)值走失。

  

這正是:技術(shù)從來雙刃劍,揚(yáng)善抑惡最考驗(yàn)。


鼎聯(lián)網(wǎng)絡(luò)

首頁
小程序
微信平臺(tái)
聯(lián)系我們