![]()
隨著移動互聯(lián)網(wǎng)的發(fā)展,電商平臺進(jìn)入了一個快速發(fā)展期,截至目前各電商平臺已積累了海量的用戶行為數(shù)據(jù)。從是否能直接反映用戶喜好這一維度,對用戶行為數(shù)據(jù)可以分為兩類,一類是顯式反饋數(shù)據(jù),一類是隱式反饋數(shù)據(jù)。目前針對隱式反饋的研究較少,但是隱式反饋數(shù)據(jù)在電商平臺上的占比最大,通過對隱式反饋用戶行為數(shù)據(jù)的挖掘可以為電商實現(xiàn)更進(jìn)一步的精準(zhǔn)營銷提供可能,同時對隱式反饋數(shù)據(jù)分析挖掘也是對顯式反饋數(shù)據(jù)很好地補充,所以對于電商平臺來說針對隱式反饋用戶行為的分析挖掘十分重要。因此本文提出了基于數(shù)據(jù)可視化、特征工程和機(jī)器學(xué)習(xí)模型等一系列方法對電商隱式反饋數(shù)據(jù)進(jìn)行處理,以便實現(xiàn)對用戶的購買行為進(jìn)行預(yù)測以及更好的為用戶推送商品。本文首先梳理了有關(guān)隱式反饋、用戶行為、特征工程及購買預(yù)測的相關(guān)研究文獻(xiàn)??偨Y(jié)了眾多文獻(xiàn)的研究內(nèi)容,分析這些文獻(xiàn)在研究中存在的不足。然后進(jìn)一步提出了本文研究框架和研究方法。本文以電商大規(guī)模隱式反饋數(shù)據(jù)為研究基礎(chǔ),將購買預(yù)測問題轉(zhuǎn)化為機(jī)器學(xué)習(xí)二分類問題。首先對原始數(shù)據(jù)進(jìn)行清洗整理,去掉刷單用戶和爬蟲用戶等,并通過數(shù)據(jù)可視化的方式觀察購買轉(zhuǎn)化率在時間上的分布等規(guī)律。然后基于觀察到的規(guī)律構(gòu)建四大特征指標(biāo),其中針對隱式反饋數(shù)據(jù)中沒法明顯表示用戶喜好的這一缺陷設(shè)計了用戶平均加權(quán)選擇傾向特征來解決這一問題,并取得了不錯的效果,所有特征按照特征群劃分為6個特征群,總計988個特征。隨后使用隨機(jī)森林算法展示特征重要性這一特點,對特征進(jìn)行篩選并留下784維特征。最后使用Logit回歸、CNN卷積神經(jīng)網(wǎng)絡(luò)和Inception網(wǎng)絡(luò)對處理好的數(shù)據(jù)進(jìn)行購買預(yù)測,其中CNN和Inception的訓(xùn)練是將784維的特征轉(zhuǎn)化成28*28的灰度圖進(jìn)行訓(xùn)練。因為樣本數(shù)據(jù)不均衡,所以實驗中使用F1指標(biāo)來評價預(yù)測效果。最終Logit回歸的F1值為11.25、CNN的F1值為11.41、Inception的F1值為12.42。實驗表明,基于Inception網(wǎng)絡(luò)的兩個主要設(shè)計思想:多尺度卷積抽取多維度特征和隱含層也可輸出結(jié)果,本文設(shè)計的Inception網(wǎng)絡(luò)在天池用戶行為數(shù)據(jù)集上取得了不錯的預(yù)測效果。本文以電商用戶行為的隱式反饋數(shù)據(jù)為中心,通過觀察用戶行為、進(jìn)行特征工程和設(shè)計模型,完成了對用戶購買行為的預(yù)測。本文構(gòu)造的用戶平均加權(quán)傾向特征和Inception模型,可以提高最終預(yù)測的效果。為電商平臺向用戶更好的推送商品,提供了一定的參考價值。
基本信息
| 題目 | 基于隱式反饋數(shù)據(jù)的用戶行為分析及購買預(yù)測 |
| 文獻(xiàn)類型 | 碩士論文 |
| 作者 | 卞天宇 |
| 作者單位 | 南京郵電大學(xué) |
| 導(dǎo)師 | 張昌兵 |
| 文獻(xiàn)來源 | 南京郵電大學(xué) |
| 發(fā)表年份 | 2020 |
| 學(xué)科分類 | 信息科技,經(jīng)濟(jì)與管理科學(xué) |
| 專業(yè)分類 | 計算機(jī)軟件及計算機(jī)應(yīng)用,企業(yè)經(jīng)濟(jì),貿(mào)易經(jīng)濟(jì) |
| 分類號 | F713.36;F274 |
| 關(guān)鍵詞 | 隱式反饋,購買預(yù)測,特征工程 |
| 總頁數(shù): | 64 |
| 文件大小: | 2063K |
論文目錄
| 摘要 |
| abstract |
| 第一章 緒論 |
| 1.1 研究背景與意義 |
| 1.1.1 研究背景 |
| 1.1.2 研究意義 |
| 1.2 主要研究內(nèi)容與技術(shù)路線圖 |
| 1.2.1 主要研究內(nèi)容 |
| 1.2.2 研究技術(shù)路線圖 |
| 1.3 主要研究方法 |
| 1.4 創(chuàng)新與不足 |
| 第二章 文獻(xiàn)綜述 |
| 2.1 對隱式反饋的研究 |
| 2.2 對用戶行為的研究 |
| 2.3 對特征工程與選擇的研究 |
| 2.4 對購買預(yù)測的研究 |
| 2.5 對現(xiàn)有研究的評述 |
| 第三章 數(shù)據(jù)預(yù)處理及分析 |
| 3.1 數(shù)據(jù)集介紹 |
| 3.2 數(shù)據(jù)清洗 |
| 3.3 數(shù)據(jù)探索 |
| 3.3.1 四種行為頻次統(tǒng)計 |
| 3.3.2 四種行為分組頻次統(tǒng)計 |
| 3.3.3 四種行為按天在時間上的分布 |
| 3.3.4 三種行為的購買轉(zhuǎn)化率 |
| 3.4 訓(xùn)練集和測試集劃分 |
| 3.5 特征設(shè)計 |
| 3.6 特征處理 |
| 3.7 特征選擇 |
| 3.7.1 隨機(jī)森林特征選擇概述 |
| 3.7.2 特征重要性排名 |
| 第四章 模型構(gòu)建及預(yù)測實驗 |
| 4.1 實驗評測指標(biāo) |
| 4.2 Logit回歸 |
| 4.2.1 原理 |
| 4.2.2 Logit訓(xùn)練 |
| 4.3 CNN卷積神經(jīng)網(wǎng)絡(luò) |
| 4.3.1 卷積神經(jīng)網(wǎng)絡(luò)的基本概念 |
| 4.3.2 設(shè)計卷積網(wǎng)絡(luò) |
| 4.3.3 數(shù)據(jù)轉(zhuǎn)換 |
| 4.3.4 卷積網(wǎng)絡(luò)訓(xùn)練 |
| 4.4 Inception網(wǎng)絡(luò) |
| 4.4.1 Inception原理 |
| 4.4.2 Inception網(wǎng)絡(luò)設(shè)計 |
| 4.4.3 Inception網(wǎng)絡(luò)訓(xùn)練 |
| 4.5 實驗對比 |
| 第五章 總結(jié)與展望 |
| 5.1 總結(jié) |
| 5.2 展望 |
| 參考文獻(xiàn) |
| 附錄1 程序清單 |
| 附錄2 攻讀碩士學(xué)位期間撰寫的論文 |
| 附錄3 攻讀碩士學(xué)位期間獲得的獎項 |
| 致謝 |
參考文獻(xiàn)
| [1] 基于隱式反饋數(shù)據(jù)的個性化游戲推薦[J]. 電子學(xué)報 2018(11) |
| [2] 基于機(jī)床反饋數(shù)據(jù)和工藝知識的進(jìn)給速度優(yōu)化[J]. 機(jī)械制造 2017(09) |
| [3] 畢業(yè)實習(xí)數(shù)據(jù)反饋與高校教學(xué)改革互動機(jī)制建設(shè)[J]. 教育學(xué)術(shù)月刊 2012(11) |
| [4] 趣味心理測試圖連連看[J]. 讀寫算(科技知識動漫) 2015(Z2) |
| [5] 一種基于內(nèi)容的新聞推薦系統(tǒng)實例[J]. 電腦知識與技術(shù) 2015(25) |
| [6] 大數(shù)據(jù)解讀“雙11”[J]. 齊魯周刊 2017(46) |
| [7] 客戶反饋挖掘技術(shù)研究[J]. 科技廣場 2012(07) |
| [8] 基于“慧學(xué)云”平臺預(yù)習(xí)反饋數(shù)據(jù)進(jìn)行動態(tài)分層與確立分層教學(xué)目標(biāo)的研究[J]. 中國現(xiàn)代教育裝備 2016(24) |
相似文獻(xiàn)
| [1]基于隱式反饋數(shù)據(jù)的個性化游戲推薦[D]. 陳聰.杭州電子科技大學(xué)2018 |
| [2]基于機(jī)器學(xué)習(xí)的用戶反饋數(shù)據(jù)中心設(shè)計與實現(xiàn)[D]. 苗林茂.北京交通大學(xué)2017 |
| [3]基于HADOOP的電商實時用戶行為分析系統(tǒng)[D]. 趙東昕.上海交通大學(xué)2016 |
| [4]基于Spark的用戶行為分析系統(tǒng)研究及實現(xiàn)[D]. 肖順.長江大學(xué)2019 |
| [5]基于Spark的用戶行為分析系統(tǒng)的設(shè)計與實現(xiàn)[D]. 殷樂.戰(zhàn)略支援部隊信息工程大學(xué)2018 |
| [6]基于網(wǎng)約車的用戶行為分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 王菲.首都經(jīng)濟(jì)貿(mào)易大學(xué)2018 |
| [7]基于移動用戶行為分析的城市功能區(qū)識別研究[D]. 張令浩.重慶郵電大學(xué)2018 |
| [8]基于Web應(yīng)用的日志異常檢測與用戶行為分析研究[D]. 馮秋燕.華南理工大學(xué)2019 |
| [9]動態(tài)異構(gòu)數(shù)據(jù)分布式處理與特征提取[D]. 陳戈.上海交通大學(xué)2016 |
| [10]基于微博的用戶行為分析及智能推薦[D]. 黃萬云.景德鎮(zhèn)陶瓷大學(xué)2018 |
