首页 / 一种定量表征卷烟产品消费者体验的方法

一种定量表征卷烟产品消费者体验的方法实质审查 发明

技术领域

[0001] 本发明属于烟草领域,具体涉及一种基于互联网消费者评价数据定量表征卷烟产品消费者体验的方法。

相关背景技术

[0002] 消费体验是消费者获得产品后,在使用产品或者享受服务时体验到的感觉和情感,而消费者在亲身使用产品过程中的各种体验好与坏,是产品价值与消费者价值的核心所在。烟草工业企业非常关注消费者对自有卷烟产品消费体验的好坏以及程度,通过收集和跟踪自有产品的消费者评价信息,了解消费者对自有产品的体验感受,从而识别自有产品的优势和弱势,归纳总结并提出有效改进建议,指导产品提质维护工作的开展。传统的做法通常是采用调研问卷或拦截访问的方式,收集消费者对卷烟产品体验感受的描述信息,然后再依赖调研分析人员依靠大脑中的主观印象给出大体判断,缺少定量的表征指标;时间长、成本高、效率低下,分析结果缺乏科学依据,更难以实现动态数据收集和持续跟踪监控。同时,由于没有一种定量表征卷烟产品消费体验的方法,消费者对卷烟产品的体验感受无法直接传递到产品研发人员,导致产品设计目标和评价依据均模糊不清,产品研发和提质改造工作无法做到有的放矢,与消费者的体验感受脱节,无法满足市场消费者对卷烟产品良好体验的要求。
[0003] 近年来,随着电子商务、社交网站、博客、微博以及自媒体的蓬勃发展,广大消费者有了更广阔的发表自己意见的空间,人们参与讨论和发布自己观点、态度和情感信息的热情与日俱增,因此带有主观色彩的言论和评论的互联网信息日益丰富。这些海量的、带有情感色彩的、非结构化的文本包含了大量的信息,企业可以从中获得用户对产品或服务的意见,而消费者在消费前也可以得到更多的建议。因此,对消费者的意见、观点、评价等倾向性信息的分析有着重要的实用价值,利用文本分析技术挖掘消费者潜意识的体验感受信息(口味、口感、包装等),掌握消费者对卷烟产品的体验感受及评价建议,找出自有产品的优势及劣势,从而探求改进方法,有效指导产品研发及产品升级改造,对烟草工业企业有重要意义。
[0004] 为此提出本发明。

具体实施方式

[0032] 为了使本发明的目的、技术方案更加清晰,结合以下实施例进行详细说明,实施例旨在说明本发明的内容,而不是对本发明保护范围的进一步限定。实施的过程、条件、试剂、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。各实施例中未注明具体条件的实验方法,通常按照常规条件或按照制造厂商所建议的条件。除非另有说明,本说明书中使用的全部专业术语和科学用语的含义均与本发明所属技术领域的技术人员一般理解的含义相同。但如有冲突,以包含定义的本说明书为准。
[0033] 如图1所示,本发明的一种定量表征卷烟产品消费者体验的方法,包括如下步骤:
[0034] (1)利用网络爬虫工具自动抓取互联网上的消费者评论数据,构建消费者评论数据样本集X={xi},i=1 2 3…n;
[0035] (2)构建卷烟消费体验专用情感词典并给予分值;构建程度副词词典并进行权重赋值;构建否定词词典并进行权重赋值;
[0036] (3)计算消费者评论数据xi所对应的消费体验情感极性为“积极”或“消极”;
[0037] (4)定义卷烟产品消费体验评价指数y,综合计算全部消费者对于产品体验的评价状况,定量表征卷烟产品的消费体验。
[0038] 其中,步骤(1)利用网络爬虫技术自动抓取消费者评论数据,包括如下步骤:
[0039] (11)设定网络爬取的网址(URL)集合,建立URL队列;
[0040] (12)从URL队列中依次读取URL地址,爬取对应网页的元素数据,并缓存到页面数据库中;
[0041] (13)筛选消费者评价数据,构建评论数据样本集X。
[0042] 其中,步骤(2)构建卷烟消费体验专用情感词典并给予分值;构建程度副词词典并进行权重赋值;构建否定词词典并进行权重赋值;包括如下步骤:
[0043] (21)构建卷烟消费体验专用情感词典并给予分值:将卷烟消费体验细分为包装、口味、口感、烟气、余味、香味、价格、品质共八个维度,收集烟民交流用语、卷烟评价专业术语、互联网卷烟消费者评价的语料词汇,按照积极和消极两个情感极性,分别筛选出常用情感词汇,构建卷烟消费体验专用情感词典并给予分值;如下表1所示:
[0044] 表1卷烟消费体验专用情感词典
[0045]
[0046]
[0047] (22)构建程度副词词典并进行权重赋值:收集程度副词,按照极量、高量、中高量、中量和低量进行权重赋值;如下表2所示:
[0048] 表2程度副词及权重设定
[0049]
[0050] (23)构建否定词词典并进行权重赋值:针对中文语句中含有多重否定的句法,当否定词在词组中出现的次数是奇数时,表示否定意思;当否定词在词组中出现的次数是偶数时,表示肯定意思;收集否定词构成否定词词典,并设定否定词权重为‑1,如下表3所示:
[0051] 表3否定词及权重设定
[0052]
[0053] 其中,计算消费者评论数据xi所对应的消费体验情感极性为“积极”或“消极”,包括如下步骤:
[0054] (31)对消费者评论数据xi进行分词;
[0055] (32)遍历xi中的每个词语,如果词语属于卷烟消费体验专用情感词典,则判断该词前是否有程度副词;如果有,则用程度副词权重与词语分值相乘;如果程度副词前还包含否定词,则用否定词权重、程度副词权重与词语分值相乘;得到分值sij;
[0056] (33)遍历进行至整个xi没有情感词为止,将每次遍历过程的得分进行加和,得到xi的综合分值si;
[0057] (34)当si>0时,表明消费者对卷烟产品的消费体验是“积极”的,将xi标注为x积极;当si<0时,表明消费者对卷烟产品的消费体验是“消极”的,将xi标注为x消极。
[0058] 其中,步骤(4)卷烟产品消费体验评价指数y,计算公式为:其中,count(x积极)为x积极的个数,count(x消极)为x消极的个数。
[0059] 其中,y表示卷烟产品消费体验的最终得分,取值在[‑1,1]之间;当y>0时,表明大多数消费者对卷烟产品的消费体验是积极的;当y<0时,表明大多数消费者对卷烟产品的消费体验是消极的;y的绝对值大小表明消费者对卷烟产品消费体验积极或消极的强烈程度。
[0060] 实施例:本实施例为定量表征卷烟产品“玉溪(软)”的消费体验方法,主要步骤如图1所示;具体步骤如下:
[0061] 步骤(1),从烟悦网上采集关于卷烟产品“玉溪(软)”的网友评价数据,设定网络爬取的网址(URL)集合,建立URL队列(见表4);从URL队列中依次读取URL地址,爬取对应网页的元素数据并缓存到页面数据库中(见表5);筛选消费者评价数据,构建评论数据样本集X(见表6)。
[0062] 表4URL队列
[0063]序号 URL
1 https://www.yanyue.cn/product/comment/productid/148/p/1
2 https://www.yanyue.cn/product/comment/productid/148/p/2
3 https://www.yanyue.cn/product/comment/productid/148/p/3
4 https://www.yanyue.cn/product/comment/productid/148/p/4
5 https://www.yanyue.cn/product/comment/productid/148/p/5
6 https://www.yanyue.cn/product/comment/productid/148/p/6
7 https://www.yanyue.cn/product/comment/productid/148/p/7
8 https://www.yanyue.cn/product/comment/productid/148/p/8
…… ……
163 https://www.yanyue.cn/product/comment/productid/148/p/163
[0064] 表5页面数据库缓存
[0065]
[0066] 表6数据样本集X
[0067]
[0068] 步骤(2),按照表1‑表3,构建卷烟消费体验专用情感词典并给予分值;构建程度副词词典并进行权重赋值;构建否定词词典并进行权重赋值;从第一条消费者评论数据起计算消费者所对应的消费体验情感极性为“积极”或“消极”:
[0069] i.对消费者评论数据x1进行分词:{‘口感’,‘非常’,‘柔顺’,‘香气’,‘纯正’,‘包装’,‘不’,‘粗糙’}。
[0070] ii.遍历x1的每个词语:‘柔顺’属于卷烟消费体验专用情感词典(分值+1),该词前有程度副词‘非常’(权重2),没有否定词,则s11=1*2=2;‘纯正’属于卷烟消费体验专用情感词典(分值+1),该词前没有程度副词,没有否定词,则s12=1;‘粗糙’属于卷烟消费体验专用情感词典(分值‑1),该词前有否定词‘不’,则s13=‑1*‑1=1;x1对应的综合分值s1=s11+s12+s13=4>0,标注为x积极;
[0071] iii.按照相同方法,计算并标注全部评论的消费体验情感极性;
[0072] 步骤(3),计算对全部1619条评论数据的消费体验评价指数,为:表明卷烟产品“玉溪(软)”的消费体验良好。
[0073] 从数据采集抓取到分析计算完毕,全过程用时2分30秒。效率高、成本低。可以自动完成。
[0074] 以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页 第1页 第2页 第3页