(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211159691.0
(22)申请日 2022.09.22
(71)申请人 南方电网大 数据服务有限公司
地址 510800 广东省广州市花都区新 华街
红珠路5-1
(72)发明人 赵永国 杨荣霞 曹熙 张仙梅
曾祥清 黎名航
(74)专利代理 机构 北京中睿智恒知识产权代理
事务所(普通 合伙) 16025
专利代理师 侯文峰
(51)Int.Cl.
G06F 30/20(2020.01)
(54)发明名称
一种基于LDA+K-M eans的产品设计方法及系
统
(57)摘要
本发明公开了一种基于LDA+K ‑Means的产品
设计方法及系统, 包括基于LDA主题模型和K ‑
Means聚类算法, 通过采集消费者的口碑数据, 结
合现有产品归纳的产品属性知识库, 生成消费者
关注的产品属性以及产品属性的偏好权重; 再利
用针对产品属性的细粒度情感分析方法获取消
费者关于产品属性的偏好强度; 基于产品属性和
偏好权重, 根据SoC模型, 通过CPLEX进行优化求
解, 生成基于消费者喜好的产品设计方案; 本发
明利用LDA+K ‑Means获取消费者偏好并应用于优
化产品概念设计的方法, 以外部数据驱动企业内
部管理决策, 突破传统产品设计和营销的壁垒,
为企业制定产品设计和营销方案策略提供启示。
权利要求书2页 说明书6页 附图1页
CN 115544742 A
2022.12.30
CN 115544742 A
1.一种基于LDA+K ‑Means的产品设计方法, 其特 征在于, 包括以下步骤:
基于LDA主题模型和K ‑Means聚类算法, 通过采集消费者的口碑数据, 生成所述消费者
关注的产品属性以及所述产品属性的偏好权 重;
基于所述产品属性和所述偏好权重, 根据SoC模型, 通过CPLEX进行优化求解, 生成基于
消费者喜好的产品设计方案 。
2.根据权利要求1所述 一种基于LDA+K ‑Means的产品设计方法, 其特 征在于:
在采集消费者的口碑数据的过程中, 采用Airflow大数据分布式任务调度框架, 通过基
于多平台的分布式数据采集方法, 获取所述口碑数据, 其中, 所述多平台用于表示不同的社
交媒体平台和电商平台。
3.根据权利要求2所述 一种基于LDA+K ‑Means的产品设计方法, 其特 征在于:
在通过分布式数据采集方法获取口碑数据的过程中, 将Airflow的Worker工作器节点
分布于多 台服务器, 使用Airflow的Scheduler实现任务调度分配功能, 再将针对所述多平
台的采集任务脚本 部署在各个W orker节点上, 对所述口碑数据进行分布式数据采集。
4.根据权利要求3所述 一种基于LDA+K ‑Means的产品设计方法, 其特 征在于:
在获取口碑数据的过程后, 对所述口碑数据进行预处理, 根据 所述LDA主题模型和所述
K‑Means聚类算法, 通过预 处理后的所述口碑数据, 生 成所述消费者关注的产品属性以及所
述产品属性的偏好权 重, 其中, 所述口碑数据的预处 理方法包括以下步骤:
处理特殊符号;
自定义停用词;
发现新词并进行中文分词;
聚合文档, 用于通过获取同一用户身份的所述消费者在不同平台的意见与看法, 进行
聚合后生成语料库;
基于key‑value进行词匹配, 用于对所述语料库的词, 通过key ‑value的匹配规则进行
处理, 生成所述语料库的词的唯一 ID;
过滤和降维, 用于通过过滤所述语料库的短文本, 剔除低频次和无意义的高频词, 降低
生成转换矩阵时的维度, 其中, 所述短文本用于表示低于文本 长度阈值的文本;
构建转换矩阵, 用于根据词袋模型, 计算每一个文档中每个词的词频, 转化为文档与词
的矩阵。
5.根据权利要求 4所述一种基于LDA+K ‑Means的产品设计方法, 其特 征在于:
在生成产品属性和偏好权重的过程中, 基于所述LDA主题模型和所述K ‑Means聚类算
法, 根据预处 理后的所述口碑数据, 提取与所述产品属性相关的消费者偏好主题;
根据所述消费者偏好主题, 生成所述消费者所关注的所述产品属性的集合和所述偏好
权重。
6.根据权利要求5所述 一种基于LDA+K ‑Means的产品设计方法, 其特 征在于:
在提取消费者偏好主题的过程中, 通过所述LDA主题模型将所述矩阵, 聚类为若干个主
题, 并获取初始聚类中心;
获取主题概率分布作为所述K ‑Means聚类的输入, 通过距离度量方法来进行聚类, 得到
所述消费者的细分 市场, 并生成所述偏好权 重。
7.根据权利要求6所述 一种基于LDA+K ‑Means的产品设计方法, 其特 征在于:权 利 要 求 书 1/2 页
2
CN 115544742 A
2在生成产品设计方案的过程中, 通过对所述消费者进行细分市场和情感分析, 获取所
述消费者对于所述产品属性的成分 效用, 输入到所述SoC模 型, 通过CPLEX进 行优化求解, 生
成所述产品设计方案 。
8.一种基于LDA+K ‑Means的产品设计系统, 其特 征在于, 包括:
产品属性划 分模块, 用于基于LDA主题模型和K ‑Means聚类算法, 通过采集消费者的口
碑数据, 生成所述消费者关注的产品属性以及所述产品属性的偏好权 重;
产品设计模块, 用于基于所述产品属性和所述偏好权重, 根据SoC模型, 通过CPLEX进行
优化求解, 生成基于消费者喜好的产品设计方案 。权 利 要 求 书 2/2 页
3
CN 115544742 A
3
专利 一种基于LDA+K-Means的产品设计方法及系统
安全报告 >
其他 >
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:54:46上传分享