螞蟻金服舉報魔蝎科技?傳言背后折射的巨頭與爬蟲糾葛金融

                  觀察君 2019-10-02 11:18
                  分享到:
                  導讀

                  先是魔蝎科技、新顏科技相關人員被警方帶走,之后聚信立、公信寶、同盾科技等紛紛被查或被卷入。

                  自9月初開始,一場由爬蟲而引起的第三方數據風控公司漩渦不斷擴散。先是魔蝎科技、新顏科技相關人員被警方帶走,之后聚信立、公信寶、同盾科技等紛紛被查或被卷入。

                  9月26日,有行業人士向零壹財經表示,此次魔蝎科技被查,可能系被螞蟻金服舉報。零壹財經向螞蟻金服官方求證此事,螞蟻金服未予回應。

                  此事目前無法核實真假,但是在這條行業傳言背后,折射出掌握著數據的巨頭,與爬蟲公司之間隱現的矛盾與博弈。多位業內人士向零壹財經確認,互聯網巨頭涉及金融的隱私數據被爬、并被轉賣的現象是真實存在的。

                  這是近幾年互聯網金融飛速發展中出現的新問題。此前,互聯網巨頭數據被爬的現象一直存在,但是由于被爬數據大多為公開數據,危害不大,巨頭們一般不予追究。

                  但是,金融相關數據往往涉及個人財產和個人隱私,其數據保護的重要性逐漸上升,情況可能正在發生變化。

                  風控被抄襲

                  與前幾年傳統征信所持的觀點不同,京東、淘寶等互聯網巨頭的數據對于金融貸款的風險控制其實是非常有用的。

                  傳統征信人士的觀點認為,京東、淘寶等電商交易數據,不是借錢還錢的信用數據,對于金融風險控制作用不大。

                  但是事實證明并非如此,起碼在消費金融領域,京東淘寶的數據價值很大。一般來說,消費金融貸前風險控制分兩個部分:反欺詐和信用評估。通俗地解釋,就是有人來借錢,第一步要確定這個人身份的真假,是不是欺詐,第二步是評估是否要借給這個人,第三步是借的話,借多少錢合適。一位頭部消費金融公司風控總監告訴零壹財經,在這三步當中,京東淘寶等電商數據都很有參考價值。

                  在第一步中,在京東淘寶買過東西的,東西都是要送到消費者手中的,所以京東淘寶的個人信息一般都是實名認證,并且經過實踐驗證沒有問題的。這個真實性是超過通訊錄的。在第二第三步中,在京東淘寶等電商網站上買過東西的消費者,金融機構可以通過消費記錄判斷消費者的消費水平。因此,一般做線上貸款的機構,很多都參考京東淘寶的數據,如果用戶授權爬取淘寶數據,爬蟲也有機會經由網頁端的淘寶進入到支付寶。

                  消費金融行業內,有很多貸款產品的設計是參照互聯網巨頭的。一位風控人士告訴零壹財經,業內不少公司都會參考螞蟻金服和微眾銀行的風險控制,比如友信金服旗下有一款產品“隨信貸”,其申請條件是,滿足以下三個條件的其中之一:芝麻分700分以上+1萬以上的借唄;芝麻分700分以上+3萬以上的微粒貸;征信體現有借款金額大于10萬的銀行貸款。

                  “在市場大多數機構缺乏風險定價能力的時候,參照風險定價做得較好的機構,這是業內比較通行的方法。”一位資深的消費金融風控人士告訴零壹財經,并且透露,一般來說“714”產品幾乎都會使用芝麻分。這一說法也得到多位消費金融業內人士的確認。

                  大數據風控行業頭部公司魔蝎科技有可能涉及相關業務。據媒體公開報道,9月6日,魔蝎科技遭到警方調查。魔蝎科技的一款核心產品為向放貸機構提供運營商報告,合作機構范圍較廣,牽涉業內大量金融機構。另據行業媒體一本財經2017年11月份的一篇報道,魔蝎科技也提供“同業爬蟲”的產品,即專門爬取現金貸數據的產品,只需要提供其他現金貸平臺的用戶名和密碼,就可以爬取用戶的所有信息。

                  巨頭對爬蟲的容忍

                  不過,零壹財經接觸的大多數大數據風控行業人士認為,螞蟻金服舉報魔蝎科技的可能性不大。

                  原因之一是目前的大數據風控公司的體量都不大。“魔蝎科技的體量,相對于螞蟻金服來說太小。這么一小塊業務,對螞蟻金服的影響也沒那么大。”一位風控資深人士向零壹財經表示,其他多位也持類似觀點。

                  此外,淘寶京東等巨頭對爬蟲有一定程度的容忍度,因為爬蟲有些時候對這些巨頭的業務有幫助。

                  一位運營商內部技術人士亦曾服務于互聯網巨頭,他向零壹財經透露,爬蟲有時可以幫助互聯網巨頭和運營商提高一些考核指標,因此他們一般都睜一眼閉一只眼。

                  他解釋,每逢雙十一,淘寶京東公布的指標中有一項是“GMV”,指的是網站的成交金額,主要包括付款金額和未付款的。通俗來說,我們平時網購時會進行下單,產生的訂單中往往會包括付款訂單和未付款的訂單,而GMV統計的指標就是其二者之和。爬蟲,其實就是模擬人的上網行為,爬蟲在京東淘寶上爬取數據時,可以提高GMV的量,這會使得數據更加好看。“只要這些爬蟲不影響網站的‘負載均衡’,一般都不會管。”他解釋,通俗地說,就是別把網站擠癱了就行。

                  零壹財經通過百度搜索,搜到淘寶、京東、螞蟻金服反爬蟲的新聞確實不多。只有在2008年,淘寶網站屏蔽百度搜索爬蟲,禁止百度搜索引擎抓取淘寶網站的網頁內容事件引發廣泛關注。 

                  博弈的過程

                  不過,上述業內人士對目前的猜測并不確信,因為情況在發生變化。

                  對爬蟲睜一只眼閉一只眼的時代正在過去。據36氪2018年8月的一篇報道《反爬蟲戰爭進行了十八年,但一切才剛剛開始》,爬蟲和反爬蟲的戰爭一直存在,大數據時代來臨之后,爬蟲的出現使得數據失真,這樣會極大地增加數據分析難度,而這會影響商業利益。

                  爬蟲帶來的數據失真問題可能不小。有一個說法是,互聯網上50%的流量都是爬蟲創造的。

                  該報道舉了一個例子:最典型的例子是機票的動態定價,網站會結合當下瀏覽量判定機票的搶手程度并且調整價格。這時如果有大量爬蟲在瀏覽網站,算法就會給出和實際情況并不符合的定價,也損傷了消費者購買到廉價產品的權益。

                  對巨頭來說,數據被爬的煩惱也是有的。一位互聯網巨頭內部風控人士向零壹財經坦言,對巨頭來說,數據被爬的煩惱肯定是有的。他透露,行業內都知道的是,魔蝎的淘寶爬蟲非常厲害,而且僅僅針對淘寶的反爬,在行業內是前列的。

                  對于螞蟻金服舉報魔蝎科技的傳言,他認為如果這是事實的話,他對此事的理解是“一個博弈的過程”,這個過程讓魔蝎在做淘寶爬蟲方面做到了極致,這也是螞蟻金服做反爬不能容忍的結果,自己的反爬做到極致,可是自己的數據卻在給別人做嫁衣。

                  螞蟻金服 魔蝎科技 爬蟲
                  分享到:

                  1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
                  2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
                  3.作者投稿可能會經TMT觀察網編輯修改或補充。