中国宝武改革开放再出发:从全球“追赶者”到全球“首发者”
  • 发布日期:2020-01-11 15:31 作者:一分快三平台 浏览量:155
  •   在北京798艺术,区对面的一栋办公!楼里,马蜂窝旅游&#;网总部的运营一切如常,丝毫看&#;不出其受到此前“点评数据造。假”事件的影响。

      10月下旬,自媒体公众号“小声比比”以《估值;175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》为题发表文章,披露马蜂窝网站上2100;万用户点评数。据中,有1800万是通、过机器人从其他竞争对手网站里“搬运”而来的、。在后续文。章中,该公众号;还指出,马蜂窝网。站的游记里,也夹杂了不少营销水军和软广。

      作为一家正在迅速成长的旅游平台,马蜂窝“被捅”,按理说会激起强烈!反,响。但事件发生后!,除马蜂窝发表一则声明外,包括投资人、被爬取数据网站在内的。各方均保持了“沉默”。

      在马蜂窝事件之前,还有大众点评网站未经授权搬运小红书APP近百万篇用户笔记;甚至就在两三。年前,马蜂窝用户的游记也被其他网站,抄、袭,为此马蜂窝官方微博还出面帮助维、权。

      “!为了获得好看的数据和足够的资金,数据互爬和造假在行业内是公开的秘密。”;采访中,业内&#;人&#;士的、一句话道出了各方沉默的内在原因。

      在大量“需求”之下,“刷流量”和“刷单”已形成了;产业链。由于现有法律对互联网数据所有权和使用权的规范还不完善,因此虽然上述行为给用户获取真实信息带来困扰,但目前还缺乏有、效的解,决方法。

      。爬虫无处不在

      创立于2006年的马蜂窝是一个分享型的在线旅游社区,用户可以在网站上写游记和攻略、,是、典型的将“用户原创内容(UGC)”作为核心竞争力的互联网企业。在国内,与之类似的还有&#;合并前的大众点评网、豆瓣网等公&#;司。对这些企业来说&#;,优质的原创内,容既是它们获得资本青睐的重要原因,也是决定存亡的生命,线。

      “越是依靠内容的产品,越容易、出现网络爬虫。”,在某互联。网企业担任数据工程师的陈立(化名)告诉。所谓网络爬虫,是一种按照一定规则,自动抓取互联网信息的&#;程序或者脚本。此次。马蜂窝;被指“搬运”数据,也是通过爬虫技术爬取而来。

      “对初&#;创公司来说,如何实现&#;‘冷启动’是让人头疼的事情。”陈立曾在一家餐饮点评网站就职,刚上线时,;由于没有!用&#;户,网站里就;没有原创内容;缺乏内容,又无法吸引用户。面对“死!循环”,从别处爬取内容填充网站成了最便捷的选择。

      数据搬运早不是新鲜事。天涯社区是中国最早的一批内容平台,其早期创始人李胜兵!曾公开表示,早在那时,阻止爬虫和、机器灌水就是程。序员的日常工作之一。

      即使是已拥有一定用户量的企业,,也难免在数据上“动手&#;脚”。有业内人士告诉,大部分互联网企业早、期。都难以实现盈利,因此除了营收,增长数据;就成了衡量企、业未来潜力的重要因素,这将在很大程度、上决定企业能否获得投资人!的青睐。

      ;1

      、2

      共;2页

      刷&#;出产业链

      作为一名普通的用户,北京白领李嘉觉得手机。里的某个点评APP“越来。越看不懂了”。。为了美发,李嘉;最近对公司、和家附近的美发店进行了搜索,让她没料到的是,在APP上,这些店几乎都是清一色的好评,“点评动辄写上两三百字,还要配上五六张照片”。在为数极少的中评和差评中,用户多是抱怨;店里的实际服务和点评中的描述有较大差距。

      根据经验,李嘉认&#;为,大多数好评都可能;是由商家刷单而来。“看来看去,反而更难选择了。”

      正面的评价和数,据能够影响消费者,的选;择,无论是平台还是商家,对刷单、刷量都有极大需求。不少线下营销公司根据这种需求,已经把刷单发展成!一条产业,链。

      在淘宝网上以“马&#;蜂窝、旅游”为关键词进行搜索,能、够发现多家代写游记、客栈或餐厅推广的店铺。以火锅店店主的身份进行咨!询,一家店铺提供了3种服务。:直接从别处抓取非原创评论、店铺工作人员原创评论、店铺创作游记并在其中嵌入火锅,店信息。相对于点评一条3~5元的价格,游记推广的价,格则高达300~500元。店主承。诺,游记会在目的地网页“占据显眼位置”,并提供长期维护。

      除马蜂窝以外,。也有推广公司提供途牛、穷游等平台的推广服务。在微博平台、视频网站平台,刷单、刷量也同样&#;存在。报价方面,以视!频点击量为例,根据、达到的效果不同,1万次点击量的“售价”从2元到8,0元不等。

      陈立告诉,对商家的刷量、&#;刷单行为,平&#;台都心知肚明,但刷单既给商。家带来了客流,又为平台免费提供了内容数据,还让营销公司获利,“皆大欢喜,利益链条由此完整”。

      与商家一样,。平台自身也需要“刷量”。此前,在“知乎”社区中,有用户指出,蜻蜓FM后台有自启代码,不仅可以在用户手机;的后台启动无窗透。明界面,伪造日、活跃用户数,还能自主触发广告商的广告,并回传给!第三方数据公司,从而完成“用户,自;主点击。广告”的操作。

      沉默背后是法规。的缺位

      有爬虫就有;反爬虫。

      “普通用户最常见的就是验证码技术。”携程技术中心曾专门举行了主题为、“爬虫VS反爬虫,一场没有硝烟的战争”&#;的技术培训活动,并在活动中表示:我们所处的。互联网,是一个爬虫的世界。

      陈立介绍,由于受、高利&#;润的驱使,爬取方总是能不断升级技术突破反爬虫,因、此这场战争中胜者几乎总是爬虫。不少从业人员都用“道&#;高一尺,魔高一丈”形容双方的;交锋。

      在一分快三平台程序员互相比拼技术的背后,是法律条款的缺失。网络爬虫作为一种技术本是合法中立的,但其获取、的网络信息的所有权以及获取信息后的使。用、范围,在目前的法律条款中,还没有明确的规定。

      这或许也是、此次马蜂窝“被;捅”后,相关企业集体沉默的原因之一。在透明且缺乏版权意识,与法律规范的网络世界中,爬虫是谁都可以钻的漏洞。有业内人士甚至表态:几乎没有任何互联网企业的数据和内容是完全“清白”的。

      除了爬虫,造成不公平!竞争以及给消费&#;者带来困扰的刷&#;单与刷量行为,目前也缺乏有效的约束方法。即使是平台公&#;司有意维权,也面临着&#;举证!难和成本高的障碍。今年8月,国内首起因视频网站刷量而引发的不正当竞争案宣判,爱奇艺虽胜诉,但50万元的赔偿能起到的震慑作用微乎其微。

      ,“抄袭的人得到好处,守规矩的人变得弱势,这是不公平的。”李胜兵表示,未来,要依靠互联网的“自滤”功能和法律法规的不;断完善,才有望破解“数据造假”的难题。(工人日&#;报—中工网罗筱!晓)

      、1

      。2

      ,共2页