使用网页抓取数据赢利的3个思绪
文章目次[*]通过主动步伐在Airbnb上花最少的钱住最好的旅店
[*]抓取特定商品代价数据,在最低价时买进
[*]抓取公示数据,将其可视化
站长之家注:在大数据期间,怎样有用获取数据已成为驱动业务决议的关键技能。分析市场趋势,监督竞争对手等都必要举行数据收罗。而网页抓取则是数据收罗的重要方法之一。
在本文中,Christopher Zita将和各人展示 3 种使用网络抓取赢利的方法,全程只需几个小时就能学会,所用代码不到 50 行。
通过主动步伐在Airbnb上花最少的钱住最好的旅店
主动步伐可用于实行特定的操纵,你可以将其出售给没有技能本领的人以获取收益。
为了展示怎样创建和出售主动步伐,Christopher Zita创建了一个Airbnb主动抓取步伐。该步伐答应用户输进位置,它将抓取Airbnb在该位置提供的全部房屋数据,包罗代价、品级、答应进驻的客人数目等。全部的这些都是通过抓取Airbnb上的数据来完成的。
为了演示步伐的现实运行,Christopher Zita在步伐中输进了罗马,然后在几秒钟内得到了 272 个Airbnb的相干数据:
http://upload.chinaz.com/2020/0601/6372662539940411318460367.jpg
如今,检察全部房屋数据变得非常简朴,过滤起来也轻易得多。以Christopher Zita家为例,他们家有四口人,假如要往罗马,会在Airbnb上探求代价公道且至少有 2 张床的旅店。而在得到这个表格中的数据后,excel可以非常轻松地举行过滤。从这 272 个效果中,找到了 7 个满意要求的旅店。
http://upload.chinaz.com/2020/0601/6372662540918612969882384.jpeg
在这 7 家旅店中,Christopher Zita选择了梵蒂冈圣彼得丹尼尔旅店。由于通过数据对比,可以看出,这家旅店评级很高,而且是 7 家旅店中最自制的,每晚收费仅 61 美元。选择所需链接之后,只需复制这个链接到欣赏器中然后预订即可。
http://upload.chinaz.com/2020/0601/6372662542203088699605765.jpg
外出旅游度假时,探求旅店是一项困难的使命。为此,有人乐意通过付费来简化这一过程。有了这个主动步伐,你只必要 5 分钟就能以低廉的代价预订到让你满足的房间。
抓取特定商品代价数据,在最低价时买进
网页抓取最常见的用途之一就是从网站上得到代价。通过创建步伐抓取特定产物的代价数据,当代价降落到肯定水平时,它会在产物售罄之前主动购买该产物。
http://upload.chinaz.com/2020/0601/6372662544314191511722150.jpg
接下来,Christopher Zita将向各人展示一个可以为各人节流许多钱同时还能赢利的方法:
每个电商网站都会有限量特价商品,它们会表现商品的原始代价和打折后的代价,但一样平常不会表现在原价的底子上打了多少扣头。比方,一只腕表最初的代价为 350 美元,而促销代价为 300 美元,您会以为 50 美元的扣头是一笔不小的数量,但现实上只有14.2%的扣头。而假如一件T恤最初的代价为 50 美元,而贩卖代价为 40 美元,你会以为没自制多少,但现实上它的扣头率比腕表高出20%。因此,您可以通过购买扣头率最高的产物来省钱/赢利。
下面以百货市肆Hudson's'Bay为例,来举行数据抓取实行,通过获取全部商品的原始代价和扣头代价,来找出扣头率最高的商品。
http://upload.chinaz.com/2020/0601/6372662546322161518423025.jpg
抓取网站数据后,我们得到了 900 多种商品的数据,此中只有Perry Ellis纯色衬衫这 1 种商品的扣头率在50%以上。
http://upload.chinaz.com/2020/0601/6372662547326927526929595.jpg
由于是限时优惠,这件衬衫的代价很快将涨回 90 美元左右。因此,假如如今以 40 美元的代价购买它,并在限时优惠竣事后以 60 美元的代价卖出,仍旧可以赚 20 美元。
这是一种方法,假如你找到符合的利基市场,就有大概赚许多钱。
抓取公示数据,将其可视化
网络上有数百万个可供全部人免费利用的数据集,这些数据通常很轻易网络。固然,另有一些数据不轻易得到,且必要耗费大量的时间将其可视化,贩卖数据就是如许演变而来。像天眼查、企查查这类的公司就是通过专注获取企业工商变动信息并将可视化,然后通过“购买会员可查”的情势贩卖给用户。
雷同模式的另有这家体育数据网站BigDataBall,通过出售球员各项角逐数据以及其他统计信息,该网站一个赛季向用户收取 30 美元。他们定这个价并不是由于他们网站有这个数据,而是他们抓取数据后,将这些数据整理分类,然后以易于阅读且清楚的布局展示这些数据。
http://upload.chinaz.com/2020/0601/6372662548889549957869787.jpg
如今,Christopher Zita要做的是免费获取和BigDataBall雷同的数据,然后将其放进布局化数据会合。BigDataBall并不是唯一拥有这些数据的网站,Basketball-Reference.com拥有雷同的数据,然而该网站没有将数据布局化,用户难以过滤并下载所需的数据集。Christopher Zita使用网页抓取工具,抓取了Basketball-Reference.com网页中的全部球员数据。
http://upload.chinaz.com/2020/0601/6372662550372478823166758.jpg
全部NBA球员日记的布局化数据集
现在为止,他已经得到了本赛季凌驾 16000 个球员日记。通过网络抓取,在几分钟之内Christopher Zita得到了这些数据并节流了 30 美元。
固然,Christopher Zita也可以像BigDataBall一样使用网页抓取工具查找难以手动获取的数据,让盘算机完成工作,然后将数据可视化并出售给对这些数据感爱好的人。
总结
现现在,网页抓取已经成为一种非常独特且新奇的赢利方式。假如在得当的环境下应用它,你可以很轻易赚到钱。
注:原文编译自medium,原文标题《How To Make Money, Using Web Scraping》
天天一篇超实用创业案例,扫码关注【站长视界】↓↓↓
http://upload.chinaz.com/2020/0601/2020060116330945038.jpg
http://www.fyguaji.com
页:
[1]