第五章 購物籃分析 Market Basket Analysis. 雖然購物分析的主要資料來源是零售業,但 是它仍然可以應用在其他的行業中 : ● 如果消費者使用信用卡消費,我們將可以推知他 們下一項會購買的商品。 ●電話使用者最常選用的附加功能,可以幫助我 們決定配套方案 。 ●消費者的常用銀行服務,可以幫助我們找出他.

Slides:



Advertisements
Similar presentations
桃園縣政府貼心規劃【 1999 縣民諮詢服務熱 線】,提供桃園縣民更優質、便捷的服務。 有不清楚的縣政問題,歡迎您隨時拿起電話 撥打 1999 ,我們將協助您提供諮詢服務,讓 您享受便捷的生活。 1999 將是您的好幫手, 天天在您左右!
Advertisements

布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
:Word Morphing ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10508:word morphing 解題者:楊家豪 解題日期: 2006 年 5 月 21 日 題意: 第一行給你兩個正整數, 第一個代表下面會出現幾個字串,
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
CHAPTER 9 Market Basket Analysis and Association Rules 購物籃分析與關聯規則
Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點 行為 清楚掌握主題 - 當「事件」出現時才開 始記錄 記錄程序 等待目標事件的發生 開始記錄 事件結束,停止記錄.
Advanced Chemical Engineering Thermodynamics
3Com Switch 4500 切VLAN教學.
期末專題 - 吊人頭遊戲 第 35 組 組員 : 電機系 49841XXXX XXX 電機系 49841OOOO OOO.
What is static?. Static? 靜態 ? class Test { static int staticX; int instanceX; public Test(int var1, int var2) { this.staticX = var1; this.instanceX =
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
1 真理大學運輸管理學系 實務實習說明 目錄  實務實習類別  實務實習條例  校外實習單位  實務實習成績計算方式  校外實習甄選 / 自洽申請流程  附錄:相關表格.
: OPENING DOORS ? 題組: Problem Set Archive with Online Judge 題號: 10606: OPENING DOORS 解題者:侯沛彣 解題日期: 2006 年 6 月 11 日 題意: - 某間學校有 N 個學生,每個學生都有自己的衣物櫃.
貨幣創造與控制 CHAPTER 27 學習本章後,您將能: C H A P T E R C H E C K L I S T 解釋銀行如何藉由放款而創造貨幣 1 解釋中央銀行如何影響貨幣數量 2.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
真理大學航空運輸管理學系 實務實習說明. 實務實習部份 實務實習 校內實習 校外實習 實習時數必須在 300 小時 ( 含 ) 以上才承認 校內實習時數及實習成績。 二個寒假 各一個月 暑假兩個月.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
1 單元三 查詢結果的引用分析 Web of Science 利用指引 查看出版及被引用情況 在查詢結果的清單中,可以瀏覽近 20 年來查詢主題出版和被引用的情況。
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
JAVA 程式設計與資料結構 第十章 GUI Introdution III. File Chooser  File Chooser 是一個選擇檔案的圖形介面, 無論我們是要存檔還是要開啟檔案,使 用這個物件都會讓我們覺得容易且舒適。
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
1 第十四章 職業道德 職業道德是一個人在行業工作內表現的道德 情操. 2 職業道德貴在實踐 3 學習目標  了解職業道德的意義  了解職業道得的重要性  遵守職業道德規範.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
: Fast and Easy Data Compressor ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10043: Fast and Easy Data Compressor 解題者:葉貫中 解題日期: 2007 年 3.
真理大學航空服務管理學系 實務實習說明. 實務實習部份 實務實習 校內實習 校外實習 實習時數必須在 300 小時 ( 含 ) 以上才承認 校內實習時數及實習成績。 二個寒假 各一個月 暑假兩個月.
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
Fugacity Coefficient and Fugacity
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
經濟問題 CHAPTER 3 C H A P T E R C H E C K L I S T 學習本章後,您將能: 利用生產可能邊界來描述經濟問題 計算機會成本 定義效率與描述資源的效率使用 解釋生產可能邊界擴張的原因 解釋人們如何受惠於專業化與交易.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
Management Abstracts Retrieval System; MARS 檢索操作.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
Analyzing Case Study Evidence
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
: Expect the Expected ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11427: Expect the Expected 解題者:李重儀 解題日期: 2008 年 9 月 21 日 題意:玩一種遊戲 (a game.
逆向選擇和市場失調. 定義  資料不對稱 在交易其中,其中一方較對方有多些資料。  逆向選擇 出現在這個情況下,就是當買賣雙方隨意在 市場上交易,與比較主動交易者作交易為佳 。
產出外界效果的權利. 外界效果  是社會成本和私人成本發生分歧的原因。 外界效果可以是成本,也可以是收益。
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
JAVA 程式設計與資料結構 第十六章 Hash Tables. Introduction Hash Tables 結構為一個 Array ,稱之為 Bucket array 。 如果想要新增一個物件,要根據這個物件的特性 將其加入 Hash Table 內。 Bucket Array 用 A 來代替,其.
概念性產品企劃書 呂學儒 李政翰.
Chapter 7 Sampling Distribution
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
15 消費者物價指數與生活成本 CHAPTER. 15 消費者物價指數與生活成本 CHAPTER.
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
中央大學。范錚強 1 eB 中的金流問題 國立中央大學. 資訊管理系 范錚強 Tel: (03) mailto: Updated
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
財務管理概論 劉亞秋‧薛立言 合著 (東華書局, 2007)
幼兒行為觀察與記錄 第八章 事件取樣法.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
啤酒遊戲- 供應鍊模擬 Dr. CK Farn 2006 Spring. 中央大學。范錚強 2 模擬設定 過度簡化的供應鍊 銷售桶裝啤酒 角色 工廠(倉庫) 配銷商 大盤商 零售商.
Presentation transcript:

第五章 購物籃分析 Market Basket Analysis

雖然購物分析的主要資料來源是零售業,但 是它仍然可以應用在其他的行業中 : ● 如果消費者使用信用卡消費,我們將可以推知他 們下一項會購買的商品。 ●電話使用者最常選用的附加功能,可以幫助我 們決定配套方案 。 ●消費者的常用銀行服務,可以幫助我們找出他 們會要的其他服務。 ●異常的保險配套方式可能是詐欺的跡象,提醒 我們進行深入調查。 ●依據患者的病歷,我們可以判定他們使用特定 治療方式發生併發症的可能機會。

購物籃分析的三大特點 有用的 - 包含高品質的有效情報 有用的 - 包含高品質的有效情報 ●在禮拜四,消費者通常同時購買尿布和啤 ●在禮拜四,消費者通常同時購買尿布和啤 酒。 酒。 明顯的 - 該行老手已經知道的事 明顯的 - 該行老手已經知道的事 ●消費者簽定維修協定後,通常會買大型家 ●消費者簽定維修協定後,通常會買大型家 電用品。 電用品。 無法理解的 - 看起來沒有合理解釋的 無法理解的 - 看起來沒有合理解釋的 ●當一個大型的五金行開幕後,最常賣出的 ●當一個大型的五金行開幕後,最常賣出的 商品之一是馬桶蓋。 商品之一是馬桶蓋。

虛擬標籤 (Virtual Items) 虛擬標籤可以幫助描述一筆交易, 但它們並不是真的分類項 虛擬標籤可以幫助描述一筆交易, 但它們並不是真的分類項 可以幫助比較差異 可以幫助比較差異 Example: Example: 健怡可樂 低糖百事可樂 > 可口可樂 百事可樂 >

Confidence 、 Support 交易紀錄 客戶 商品 1 柳橙汁、蘇打飲料 2 牛奶、柳橙汁、玻璃清潔劑 3 柳橙汁、清潔劑 4 柳橙汁、清潔劑、蘇打飲料 規律 條件 結果 有蘇打飲料, 必有柳橙汁 – 100% 有柳橙汁, 必有蘇打飲料 – 50% Confidence — 在 A 事件發生的狀況下,同 時發生 A 、 B 事件的機率 = 條件機率 = P(B ∣ A) Support— 在所有事件發生的狀況下, 同時發生 A 、 B 事件的機率 =P(B∩A)

使用購物籃分析的基本流程 選擇正確的組合 選擇正確的組合 * 組成的 item 是取決於各行業所需 * 組成的 item 是取決於各行業所需 * 分類法 – 商品分類 * 分類法 – 商品分類 * 去除雜質 * 去除雜質

使用購物籃分析的基本流程 計算超過門檻的商品 計算超過門檻的商品 * Support - P(A∩B) * Support - P(A∩B) * Confidence - P(BlA) * Confidence - P(BlA) 定義 threshold 大小 定義 threshold 大小 分析機率取得規則 分析機率取得規則  規則 ( 如果 條件句,則 結論句 )  規則 ( 如果 條件句,則 結論句 )

表 8.5 商品及其組合的機率:

表 8.6 規則的信心水準

信心水準最的就是最好的規則, 所以我們似乎應該選「如果 B 和 C 則 A 」。但是這裡有點問題,這個規則 事實上比隨便說 A 會出現在交易中還 糟。 A 在 45% 的交易中出現,但是該 規則只有 33% 的信心水準,規則比隨 便猜猜還糟。

這種情況就要利用一技巧 - 「增益」 ( Improvement ) 。增益能告訴我們,一 條規則在預測結果時能比隨機發生的機 會好多少。公式如下:

當增益效果大於 1 時,那麼最後的 結果會在預期結困的基礎上比單純 亂數好 ; 但是當數值小於 1 時,效果 就很差了。表 8.7 顯示了三種規則的 增益效果和最高增益的增益效果。

表 8.7 規則的增益效果

當增益效果小於 1 時,否定陳述句會 引出一條比較好的規則。例如 : 如果 B 和 C ,則 A => 有 0.33 的信心 水準 ; ~ 如果 B 和 C ,則 ~ A => 會有 0.67 的信 心水準。 P(~A l B∩C) = 0.67 P(~A l B∩C) = 0.67 I(~A l B∩C) = 0.67/0.55 I(~A l B∩C) = 0.67/0.55 = 1.22 = 1.22

連續時間序列分析 購物籃分析主要發生同一時間的事件, 在特定時間點發生的事 購物籃分析主要發生同一時間的事件, 在特定時間點發生的事 時間序列資料 (Time series data) 時間序列資料 (Time series data) 通常建立在顧客的基本資料上, 通常建立在顧客的基本資料上, 才能找出同一個人的不同交易紀錄 才能找出同一個人的不同交易紀錄

跨時綜覽 (Time Windows) 一般將一個月發生的交易全都簡化 紀錄為單筆紀錄。 一般將一個月發生的交易全都簡化 紀錄為單筆紀錄。 可以幫助我們了解行為模式。 可以幫助我們了解行為模式。 Example: Example: 滿 意: ( 存款、提款 ) 滿 意: ( 存款、提款 ) 不滿意: ( 存款、提款、查詢餘額、 不滿意: ( 存款、提款、查詢餘額、 結算、取消帳戶 ) 結算、取消帳戶 )