你家产品在用户心里算哪壶?——用语义分析透镜瞧一瞧
2018/3/23 9:21:28


文/吴启维
网购达人们买东西前都会选择逛逛评价区,好评率、是否带图、评论有无水军……都会直接影响购买意愿。本文数据侠吴启维,就通过爬取某产品的用户评论,结合语义分析的情感划分,定位用户对于产品不同属性的针对性反馈,以此来提炼有共性和有价值的信息。一起来看看用户评价里有哪些值得深挖的奥秘吧!
本文转自数据冰山(ID:shujubingshan)
2017年,某厨房家电品牌客户需要针对其某一款养生壶产品做用户评论分析,同时利用其他18款同类竞品作参照体系,以挖掘用户有价值的反馈。而笔者有幸作为数据分析师参与到该项目中,从中学习语义分析与商业分析的应用场景。
准备工作
此次项目目标是帮助客户企业内部人员基于用户评论数据量化有价值的信息。那么,要在哪些维度上量化呢?我们大致可以根据用户关注度以及竞品的差异化组合定义以下四种维度:
用户关注度低,与竞品差异化小
用户关注度高,与竞品差异化小
用户关注度低,与竞品差异化大
用户关注度高,与竞品差异化大
接下来,我们开始定义数据。
数据来源:天猫商城
数据类型:非结构化数据(用户评论)
时间范围:2017年
产品数目:19款(从下图综合排名较高的产品里挑选)

分门别类
针对 19款产品在天猫商城2017年的用户评论数据量,我们进行了切词,词频统计,得到的词云如下:

基于上图,我们要怎么根据这些词云去挖掘重要的反馈呢?再分解一下问题,就是我们要怎么去量化和挖掘对客户有价值的信息呢?先不急,有一个很重要的环节就是要把这些零散的字词根据不同属性进行分类。例如,燕窝、花茶等归类为食物食材;方便、好用等归类为使用感受,以此类推。

划分区域
我们一面数据定义了两个无量纲指数,一个是体现目标产品与其它竞品分别在所对应评论中词频率的相对差异,另一个是体现目标产品本身的词频率。中间涉及了一些数学计算,就不在此处详细解析了。最终,把目标产品的词所对应的分类,映射到二维的坐标图上。我们以「食物食材」为例,如下图:

说明:
1、Y轴(词频率):在评论中,针对某词,出现频率越高,Y轴的值越大,反之亦然
2、X轴(差异化):在X轴上正负之别是如果目标产品针对某词的出现频率高于其它18款竞品针对某词的频率,那么该词在X轴的值为正数,反之亦然
那么,我们就可以在横纵坐标轴上大致划分文章开头所定义的四个维度了。

用户关注度低,与竞品差异化小【稳扎稳打】:这一块区域就是不能犯低级错误,才能谈得上进阶另外三个区域。
用户关注度高,与竞品差异化小【时刻警惕】:这一块区域意味着要紧跟行业的风向和标准,确保不要掉队。
用户关注度低,与竞品差异化大【扬长避短】:这一块区域可以挖掘哪些是值得保留的服务及功能。
用户关注度高,与竞品差异化大【招牌特点】:这一块区域决定了能否跟其他竞品一绝高下,建立自身品牌独有优势。
提炼信息价值,萃取价值精华
至此,我们已经定义好了数据,也对词云进行了分类,并且对这些分类完成了在二维横纵轴上的映射。接下来,我们可以摩拳擦掌的看看如何针对这些分类进行信息提炼了。我们以上图最右上角的「产品功效」和「活动」分别打个样,采用NLP(自然语言处理)对以上的分类所对应的原始评论进行评论情感分析,并以此进行进一步的挖掘。
在产品功效中,用户讨论最多的是「味道」。这个关键词所对应评论中,正面情感的评论比例较高,占比达到88%。


挖掘出大部分正面评价的用户是通过目标养生壶所制作出的食品味道感到满意,以下为部分原始评论截图。

看起来用目标养生壶烹饪银耳汤,干贝海鲜粥,银耳羹,炖子排这些食材的使用感受不错,如果还有更多相同共性发现的话,可以考虑在养生壶和礼品的结合中着

下一页
返回列表
返回首页
©2018 深度学习世界--关注深度学习应用,提供深度学习资料下载和技术交流 电脑版
Powered by iwms