以消費表現為基礎之 顧客群集分析 第 10 組 報告人 資管 4A H24934023 林俊豪 資管 4A H24931499 顏志憲 資管 4B H24949280 蘇建安.

Slides:



Advertisements
Similar presentations
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Advertisements

布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
1 Advanced Chemical Engineering Thermodynamics Appendix BK The Generalized van der Waals Partition Function.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
全球化環境下的組織管理 本章內容 全球化的趨勢 國際化的階段 國際企業母公司對分支機構的管理取向 國際企業組織的結構設計 Chapter 6
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
貨幣創造與控制 CHAPTER 27 學習本章後,您將能: C H A P T E R C H E C K L I S T 解釋銀行如何藉由放款而創造貨幣 1 解釋中央銀行如何影響貨幣數量 2.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
CH22 可靠性加速測試方法 目的 基本假設 加速試驗模式 Inverse Power Model
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
第一章 演算法:效率、分析與量級 1.1演算法 1.2發展有效率演算法的重要性 1.3演算法的分析 1.4量級(Order)
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
Integrated single vendor single buyer model with stochastic demand and variable lead time 指導教授:林燦煌 博士 指導教授:林燦煌 博士 研 究 生:黃笙源 研 究 生:黃笙源 M. Ben-Daya, M. Hariga.
具備人臉追蹤與辨識功能的一個 智慧型數位監視系統 系統架構 在巡邏模式中 ,攝影機會左右來回巡視,並 利用動態膚色偵測得知是否有移動膚色物體, 若有移動的膚色物體則進入到追蹤模式,反之 則繼續巡視。
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
五力模式 -葛維鈞-. 2 五力分析 產業內 競爭者 產業內 競爭者 替代者 購買者 供應者 潛 在 進入者 潛 在 進入者.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
Chapter 20 塑模動態觀點:狀態圖 Statechart Diagram. 學習目標  說明狀態圖的目的  定義狀態圖的基本記號  展示狀態圖的建構  定義活動、內部事件及遞延事件的狀態 圖記號.
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
Fugacity Coefficient and Fugacity
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
宏觀經濟學之均衡點. 定義  非自願性失業 當工人預備以現有的名義工資水平去接受工作,但 未能找到工作時,這種稱為非自願性失業。  通貨膨脹 所有名義價格持續上升。
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
Analyzing Case Study Evidence
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
逆向選擇和市場失調. 定義  資料不對稱 在交易其中,其中一方較對方有多些資料。  逆向選擇 出現在這個情況下,就是當買賣雙方隨意在 市場上交易,與比較主動交易者作交易為佳 。
產出外界效果的權利. 外界效果  是社會成本和私人成本發生分歧的原因。 外界效果可以是成本,也可以是收益。
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
Chapter 10 m-way 搜尋樹與B-Tree
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.
Chapter 7 Sampling Distribution
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data : k 組資料,樣本數為 n 1,…, n k. x ij --- 第 i 組的第 j 個觀察值 N =
ask the customer by asking the data. 2 背景介紹 7-11 是美國最大連鎖便利商店 –2500 家直營店, 3300 家加盟店 當冰箱問世之後,便利商店可販售的物品增加 每間分店店經理會逐一詢問顧客最需要哪些可冷 凍、冷藏的物品,以充分服務顧客 此種方法不切實際.
CH08 確認市場區隔與目標市場 中興大學行銷學系 黃文仙
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
連續隨機變數 連續變數:時間、分數、重量、……
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
啤酒遊戲- 供應鍊模擬 Dr. CK Farn 2006 Spring. 中央大學。范錚強 2 模擬設定 過度簡化的供應鍊 銷售桶裝啤酒 角色 工廠(倉庫) 配銷商 大盤商 零售商.
Presentation transcript:

以消費表現為基礎之 顧客群集分析 第 10 組 報告人 資管 4A H 林俊豪 資管 4A H 顏志憲 資管 4B H 蘇建安

資料來源 資料來源是由一零售商之銷售部門所提供 customer 資料表 紀錄顧客基本資料 product 資料表 紀錄商品基本資料 sales_fact 資料表 紀錄顧客交易資料

顧客分群時,必需事先掌握 : 「要對哪些顧客進行分群?」 「依據顧客的什麼特性進行分群?」 並建立研究所需的顧客歷史交易資料表

顧客歷史交易資料表屬性 Customer 屬性:購買商品之顧客 ( 如 customer_id) 。 Product 屬性:顧客所購買的商品項目 ( 如 product_id) 。 Money Spent 屬性:顧客購買該項商品所花費 之金額 ( 如 store_sales) Transaction Time 屬性:發生交易之時間點 ( 如 time_id) 。

根據顧客歷史交易資料表轉換成轉換成顧客累 積交易資料表,並計算出兩兩商品組合的親近 度

找尋較佳客戶分群數 K 以此研究為例,設定測試 K 值的最小搜尋邊界 (30) 與最大搜尋邊界 (80) ,與搜尋間隔 (10) ,分 別針對每個 K 值測試分群結果品質,挑出平均 值最大的測試 K 值 (60) 。

顧客分群 此研究提供兩種不同的初始質心給定方式 1. 隨機產生初始質心 2. 基因演算法產生初始質心

顧客群價值分析 顧客分群後利用 RFM 價值分析模式衡量每個顧 客群對零售商利潤的貢獻程度 R(Recency ) F(Frequency ) M(Monetary Amount )

研究目的驗證 此研究目的在於讓顧客分群結果中的每個顧客 群內之顧客都有較為相似的消費行為及模式, 如此一來,才能正確地衡量顧客對於零售商的 重要程度,使得零售商在導入顧客關係管理之 過程中,更能持續有效地掌握顧客所反應出的 消費表現,以達成客製化之目標。

研究目的驗證 ( 二 ) 根據研究目的,我們可將驗證準則定義為: 「每個顧客群內之顧客是否都有較為相似的消 費行為及模式?」。

實驗設計 從 customer 資料表中挑出 11 個人口統計之特殊 屬性 將屬性質做適當的轉換 如 : 年齡、婚姻、年收入、性別、教育 …

由於這些特徵屬性的單位尺度並不相同,所以 利用標準常態偏差 (Z-score) 轉換成統一尺度

利用 SPSS10.01 內建的 K-means 分群演算法的 功能,完成以「人口統計」特徵屬性當作區隔 變數的顧客分群方法 假設分群數為 30

完成後分別計算出商品支持度、標準差及前 5 項商品的平均支持度 有兩種比較的方法 : 1. 每個顧客群內最大的 5 項商品之支持度的平 均值 2. 每個顧客群內所有商品之支持度的標準差

歸納分群結果可以發現下列兩種特性 : 每個顧客群內之最大的前五名的商品支持度較大:表 示每個顧客群內之顧客都會比較集中購買某些特定的 商品,也就是說每個顧客群內之顧客比較明顯具有相 同的消費行為及模式。 每個顧客群內的所有商品支持度的標準差較大:表示 每個顧客群內之各種商品之吸引顧客購買的能力,彼 此之間的差異比較大,即表示當我們以每個顧客群內 之支持度較大的商品,用來代表所有顧客的消費行為 及模式之合理性也就相對比較高。

所以有鑑於此,此研究所提出的以顧客對零售 商所提供商品與服務之「消費表現」 \ 當作區隔 變數之顧客分群方法,確實能達成本研究之研 究目的。

討論顧客分群中的變化趨勢 在顧客分群過程中,必需經過若干次的學習循 環,直到滿足學習循環之終止條件為止,也就 是代表 K 個顧客群之質心位置的顧客已經固定 而不更改。

在此實驗中,經過每次學習循環之後,所有顧 客與其顧客群內之質心顧客的相似度之總和有 出現逐漸增加的趨勢變化 在 30 個顧客群中,其代表顧客群質心的顧客 有所更動的數目有出現逐漸減少的趨勢變化 因此會出現「消費表現較為相似的顧客會逐漸 地凝聚在同一顧客群內」之趨勢性的變化

討論顧客群之初始質心顧客的產生 由於不同的顧客群之初始質心顧客的產生方式, 會影響最後顧客分群結果之品質好壞,,所以 此研究提供兩種方式 隨機產生初始質心顧客 以基因演算法產生初始質心顧客

若以基因演算法產生初始質心顧客之方式時, 則我們必需自行設定兩個參數: 演化族群內之染色體數目 ( I ) (10) 疊代演化的次數 ( E ) (5) 當疊代演化次數越多,所得到的 ρ (K ) 之平均 值也會隨之增大 (35 後收斂 )

由上面的做法可以得到結論 : 不論族群內之染色體數目多寡,隨著疊代演化 次數增加,所得到的分群結果品質 ρ (K ) 也有 逐漸提升的趨勢,而其提升幅度是呈現逐漸趨 於緩和的現象。

衡量顧客群之價值分析的結果 以 RFM 模型為基礎,進行顧客群價值分析衡 量每個顧客群對於零售商利潤之貢獻程度,方 能讓零售商依照不同顧客群對於零售商的重要 程度,提供客製化的商品與服務。

可將所有的顧客群分成四種類型 : 最佳型顧客群 : 零售商之核心顧客群予以保留 頻率型顧客群 : 提升顧客的購買金額 消費型顧客群 : 增加顧客的造訪頻率 不確定型顧客群 : 考慮放棄 針對各種不同類型的顧客群使用不同的行銷策 略,以增加公司的競爭優勢,提高企業獲利