新闻中心
大数据分析是什么?
先把数据分析,机器学习,人工智能等这些概念搞清楚,就知道大数据分析是什么了,以及从哪开始学起了。
数据分析,机器学习,深度学习,人工智能的关系我画了这张图
我来解释下这张图。
一切技术的出现都是为了解决现实问题,而现实问题分为简单问题和复杂问题。简单问题,需要简单分析,我们使用数据分析。复杂问题,需要复杂分析,我们使用机器学习。
1、什么是简单问题?
比如公司领导想知道每周的销售情况,这种就是简单问题。简单问题可以用数据分析来处理,通过分析数据来分析出有用的信息。
最简单的,你用 excel 分析一家淘宝店铺的销售数据,每周公司会让你出一份周报一份发现了最近几个月销量下降,然后根据分析产生销量下降的原因是什么,找到原因后制定对应的策略来提高销量。
我们来看一个真实的案例。全球最大的旅行房屋租赁社区 Airbnb 曾在 2011 年纠结于新用户增长的缓慢,有一天,他们的数据分析团队发现房源照片的精美程度,跟房源的预定人数成很大的正相关。
于是,他们提出一种假设,即「附有专业摄影照片的房源要更抢手,因此房主肯定会愿意申请 Airbnb 提供的此项服务」。
他们迅速上线了一个提供专业摄影照片服务的版本,然后跟原版本做 A/B Test,发现同一个房源,使用专业摄影服务的比不使用的多了 2-3 倍的订单量。
2011 年后期,Airbnb 雇用了 20 名专业摄影师,以帮助平台上的房主拍摄房屋照片,几乎在同一时间段,Airbnb 的订单量曲线有了一个陡峭的增长。
2、什么是复杂问题?
比如我们天天使用的淘宝,它会根据你的历史购物习惯(数据),来给推荐你可能感兴趣的商品。淘宝是如何做到的呢?对于这种复杂问题,淘宝背后使用的就是机器学习。
我再举个例子,今日头条是如何靠机器学习逆袭成为新闻客户端老大的。
2010 年前后,门户时代崛起的网易、搜狐、腾讯三巨头向移动端转型,几乎垄断了当时的新闻客户端市场。而仅仅 2 年后,今日头条,使用「机器学习」这把屠龙刀向用户个人性化推荐用户感兴趣的新闻,一举打破巨头垄断,成为新闻客户端老大。虽然,后来腾讯和网易为了对抗头条,推出了类似的产品的天天快报和网易号,但因起步晚和算法不成熟,都失败了。
下面图片是我在知乎一个问题下回答的传播分析报告
在这份报告中,像点赞数、评论数、收藏数、总阅读量这样的分析就是简单分析。像「你可能感兴趣的人」这样的分析,就是复杂分析,需要通过机器学习算法来找到,类似于豆瓣上给你推荐感兴趣的电影、淘宝上给你推荐感兴趣的商品。
3、什么是深度学习?
机器学习分很多方法(算法),不同的方法解决不同的问题。深度学习是机器学习中的一个分支方法。
深度学习在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量的人力做相关的研究和开发。我说个例子,你肯定听说过。那就是 2016 年谷歌旗下 DeepMind 公司开发的阿尔法围棋(AlphaGo)战胜人类顶尖围棋选手。阿尔法围棋的主要工作原理就是「深度学习」。
4、什么是人工智能?
人工智能,它的范围很广,广义上的人工智能泛指通过计算机(机器)实现人的头脑思维,使机器像人一样去决策。
机器学习是实现人工智能的一种技术。所以我把人工智,机器学习,深度学习放到不同的圆圈里,他们三者是包含的关系:
现在,你已经清楚了数据分析、机器学习、深度学习这些概念的关系了。当我们从解决现实问题的角度来看,很多概念会清楚。处理不同的问题,使用不同的方法。
5、数据分析与人工智能的关系?