新闻中心

强推!《商务数据可视化》值得熬夜品读!(数据可视化在电子商务中的应用)

2023-11-22
浏览次数:
返回列表

今日推荐:《商务数据可视化(全彩微课版)》 作者:廖莎;胡辉;孙学成。搜索书名开始观看吧~

-----精选段落-----

项目一商务数据可视化入门

对商务数据进行可视化处理时,一般可以按照以下步骤进行。

(1)明确数据可视化的需求,寻找数据背后的故事

在开始创建一个商务数据可视化项目时,需要明确数据可视化的需求是什么。首先回答这样一个问题:这个可视化项目会给用户提供哪些帮助?这个问题可以帮助用户避免在数据可视化时把一些不相干的数据放在一起比较。

在确定了可视化项目的目标之后,经过整理、分组与理解信息,寻找其中可视化的可能性。同时,通过观察与比较来总结信息之间的关系,建立基本的数据关系结构,思考如何利用含义清晰的视觉元素将这些数据包装成更加有趣的故事。

(2)为数据选择正确的可视化类型

在确定需求之后,就可以为数据选择一个正确的可视化类型。数据可视化的效率很高,但前提是准确运用,因为不同类型的数据有其最适合的图表类型,如果使用错误的图表类型去展现,很容易造成误解。

(3)确定最关键的信息指标,给予场景联系

高效的数据可视化不仅取决于信息的可视化类型,还取决于一种平衡,既要保证总体信息的通俗易懂,又要在某些关键点上有所突出,提供深刻甚至独家的信息解读。此外,还需要提供合适的场景来进行上下文的联系,从而合理地架构数据。

(4)为内容而设计,优化展现形式

故事再好、数据再有吸引力,如果设计得很糟糕,用户也不会被其吸引。优秀的设计同样很关键,这样可以高效地对信息进行转换,利用精美的视觉效果来吸引用户进行阅读。在进行数据可视化设计时,需要为内容而设计,并优化展现形式,如图1-16所示。

任务二数据的采集、清洗与抽样

任务概述

要进行数据分析,离不开有效数据的支持。首先通过数据采集获得原始数据,然后对原始数据进行整合与处理,再根据实际需要将数据集合,才能挖掘原始数据中潜在的重要商业信息,从而掌握真正的核心数据。因此,在进行数据分析之前,首先需要进行数据的采集、清洗和随机抽样等工作,本任务将分别对其进行详细介绍。

任务重点与实施

一、数据的采集

数据采集主要针对定性数据和定量数据。定性数据主要采用问卷调研和用户访谈的方式来获取,而定量数据分为内部数据和外部数据两部分。

其中,内部数据可以通过网站日志、业务数据库来获取;外部数据则主要采用网络爬虫抓取的方式来获得,通过编写脚本语言,按照一定的规则来获取网络上的相关信息。当然,外部数据的采集也可以借助第三方统计平台来实现,从某种意义上来说,通过第三方统计平台可以降低中小企业数据采集的门槛。图1-17所示为数据采集方法。

1.问卷调研

一般在进行用户画像调研时,都会用到问卷调研工具。在进行问卷调研时,首先需要考虑样本的容量,其次是内容的设计,并按照“调研目标→设计问卷→投放问卷→问卷收集汇总→调研结果分析”的步骤展开调研。

2.用户访谈

在访谈之前,首先要确定访谈目标,然后设计访谈提纲,选择访谈对象,并对访谈及相应情况进行记录,最后针对访谈结果进行分析。在具体分析访谈结果时,可以采用关键词提炼法,针对每个用户对每个问题的回答进行关键词的提炼,并按照关键词的频次进行排序,对共性词进行汇总。

3.网站日志

通过网站日志对用户数据及相应行为进行分析,其优点是保证用户的使用行为可以查询,如用户访问数、页面浏览数、停留时长等点击流数据均可通过网站日志获得,同时针对用户的一些误操作还可以通过日志文件进行恢复。在实际运用中,由于从打印日志到处理日志,再到输出统计结果,整个过程很容易出错,所以经常出现业务运行和统计分析两个数据流相分离的情况。

4.业务数据库

互联网产品后端都有业务数据库,其中存储了销售量、订单量、购买用户数等指标数据。一般通过业务数据库获得的数据都是实时的、准确的,可以直接用于衡量网站的绩效和目标。

5.第三方统计平台

对于电商企业来说,一般可以将其用户行为分成四类。

(1)纯粹的浏览行为。

(2)收藏、下载等轻度交互行为。

(3)注册、登录等重度交互行为。

(4)添加购物车、填写地址、下单等与交易相关的行为。

对于第三方统计平台,又可分为无埋点、有埋点和“有埋点+无埋点”三种情况,如表1-1所示。

二、数据的清洗

通过数据分析获得的结果,不仅依赖于算法,同时还依赖于数据的质量。正所谓“磨刀不误砍柴工”,好数据胜过复杂的模型,所以在进行数据分析之前对采集到的数据进行清洗尤为重要。

数据清洗是指发现并纠正数据文件中可识别错误的最后一道程序,是对数据的完整性、一致性和准确性进行重新审查和校验的过程。一般不符合要求的数据主要有缺失数据、重复数据、错误数据三类,也就是所谓的“脏数据”。而数据清洗的任务就是按照一定的规则将这些“脏数据”洗掉,目的在于删除重复的数据信息,纠正数据中存在的错误,提供数据的一致性。

下面围绕数据清洗这个目的,从缺失数据、重复数据和错误数据三个方面出发,通过运用一些简单的统计学检验和Excel表格工具发现“脏数据”,并对其进行清洗。

1.缺失数据的清洗

在数据采集过程中,缺失值常表示为空值或错误标识符(#DIV/0!)。为了保证数据的完整性,用户可以运用一些统计学方法查找缺失数据并对其进行处理。在查找缺失数据时,利用【Ctrl+G】组合键打开Excel的定位功能,选择其中的错误单元格或空值单元格,就可以进一步查找数据表中的错误值和空白值。

对缺失值的处理一般有以下四种方法。

举报/反馈

搜索