第 9 章 基本的資料探勘、線上分析處理、資訊呈現.

Slides:



Advertisements
Similar presentations
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Advertisements

本章結構 前言 符號介紹與立透法則 指數機率分配 基本無限來源模式 基本有限來源模式 等候系統的經濟分析-最佳化 進階等候模式 16-1.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
建立使用案例敘述 --Use Case Narrative
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
第九章 運銷通路 授課老師 簡立賢. 授課大綱 運銷通路之涵意及其基本結構  何謂運銷通路  運銷通路的基本結構 影響農產品運銷通路選擇之因素  產品因素  市場因素  廠商因素  法規因素 運銷效率之判斷  通路中階段數目與運銷效率  通路競爭與運銷效率.
第二章 太陽能電池的基本原理 及其結構 2-1 太陽能電池的基本原理 2-2 太陽能電池的基本結構 2-3 太陽能電池的製作.
Advanced Chemical Engineering Thermodynamics
如何將數字變成可用之資訊 現代化資料處理與應用概念. 如何將數字變成可用之資訊 人最容易接受的訊息是圖像化資訊。 在一堆數字中,要進行比較分析,一般會使用表格形 式計算與分析。 所以一般我們會將數字依關聯性, 轉換成表格計算與分析。 此表格一般稱試算表或稱表格。 再將結果轉換為圖表,進行比較與分析。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
全球化環境下的組織管理 本章內容 全球化的趨勢 國際化的階段 國際企業母公司對分支機構的管理取向 國際企業組織的結構設計 Chapter 6
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
1.1 電腦的特性 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。
第 4 章 迴歸的同步推論與其他主題.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
Structural Equation Modeling Chapter 7 觀察變數路徑分析=路徑分析 觀察變數路徑分析.
Chapter I: 資料探勘 - 初探. 目標 定義 DM 並瞭解如何用來解決問題 瞭解電腦是最佳學習概念的工具 瞭解 DM 可被用來當成可能問題解決策略 之時機 瞭解專家系統與資料探勘使用不同的方 法來完成相似的目標 瞭解如何從事前定義的類別資料所形成 概念定義來建立監督式學習的模型.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
物流通關專業教室 (052) 國貿實務專業教室 (054) 企業資源整合專業教室 (055) 整合各專業教室資訊進行 即時動態及異常管理 (051) 貿易運籌研訓中心 專業實習、 、 師生研究討論 、、 、、 海關模擬系統、貨況追蹤、貨物 進出倉管理、海空運通關承攬、 通關自動化作業等相關模組 全球運籌決策中心.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
最新計算機概論 第 5 章 系統程式. 5-1 系統程式的類型 作業系統 (OS) : 介於電腦硬體與 應用軟體之間的 程式,除了提供 執行應用軟體的 環境,還負責分 配系統資源。
8-1 Chapter 8 技術與流程 組織的技術 製造業的核心技術 服務業的核心技術 非核心技術與組織管理 工作流程的相依性.
文件製作 陳彥良. Phase 1 Identifying problems Identifying opportunities Identifying objectives.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology MATLAB 操作與 系統動態模擬 SIMULINK 李達生.
網路廣告 Web Advertising. 2 商業廣告 不被認知認知 熟悉 / 信任 沒有交易過 零星交易 固定交易.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告 指導老師:陳正宗終身特聘教授.
「方案設計」課程第八章 方案設計 — 建立方案資訊管理系統 張 紉張 紉. 「方案設計」課程第八章 方案服務資料紀錄的重要性 社會服務方案的社會法律及財務責任 – 服務人口群的服務需求 – 法定責任的報告 法院審理裁決 立法委員的質詢 社會大眾的了解 – 倡導需求 – 方案改善及成效說明( p:170~171.
法律系 系所科助之血淚辛酸史 劉蕙綺. 系上推行困難處 ( 學期初 ) 傳統習慣:法律系以教科書為主 很多老師沒有電子檔案 專、兼任老師使用平台的意願 因老師多為資深老師,因此在使用電腦部 份可能比較需要幫助 通常學生知道訊息的來源是藉由 BBS 或者 是系上的系板,使用意願會降低.
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2008.
方案設計 —評估考核 張 紉.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
Chapter 10 m-way 搜尋樹與B-Tree
網路介紹及其運用 講師陳炯勳. 5-2 IP 協定 ( 一 ) IP 協定運作 (1) – 網路成員:主機 (Host) 與路由器 (Router) – 路由表 – 電報傳輸運作.
概念性產品企劃書 呂學儒 李政翰.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
專題成果報告 胺基酸功能預測開發環境 指導教授:歐昱言 邱彥豪 邱顯鈞.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
指導教授 : 林啟芳 教授 組員 : 邱秉良 林育賢. 何謂 GPS  GPS 即全球定位系統,是一個中距離圓 型軌道衛星導航系統。它可以為地球表面 絕大部分地區( 98% )提供準確的定位、 測速和高精度的時間標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
電機工程系 選課輔導說明會. 選課輔導說明會宗旨 電機系自 95 年開始,同步進行『工程教育 認證』以及『系科本位課程』兩大與學生 課程相關的認證計畫。 電機系自 95 年開始,同步進行『工程教育 認證』以及『系科本位課程』兩大與學生 課程相關的認證計畫。 本系每年至少一次的系教育諮詢委員會, 廣邀產業界、學界、家長、畢業生、在校.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
第12章 團體溝通情境中的領導者.
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
第四章 認知程序與產品定位. 資訊處理的模型年齡 第一節 資訊接收 激發 – 當消費者暴露在一項新期的資訊下,而引發消 費者的內在心理處理程序。 注意 – 消費者必須對資訊注意才能夠接收和處理這項 資訊,在處理資訊時的注意包括兩個觀點:強 度和選擇性注意。
啤酒遊戲- 供應鍊模擬 Dr. CK Farn 2006 Spring. 中央大學。范錚強 2 模擬設定 過度簡化的供應鍊 銷售桶裝啤酒 角色 工廠(倉庫) 配銷商 大盤商 零售商.
行銷學原理‧曾光華、饒怡雲 著‧前程文化 出版
Presentation transcript:

第 9 章 基本的資料探勘、線上分析處理、資訊呈現

資料探勘(續) 企業常將顧客分類,進行資料探勘,以便行銷策略可更有效的針對特定群體。典型的例子是以RFM區分顧客,意即最近購買時間、頻率、金額等,這些資料庫取自顧客,可進行量化分析。 2017/4/17 顧客關係管理

資料探勘 倉儲資料儲存室是企業的資源,須完成三個基本功能: 從倉儲資料儲存室中取得資料 資料轉換成資訊 資訊呈現給CRM系統的使用者 2017/4/17 顧客關係管理

資料探勘(續) 資料探勘是從倉儲中取得資料,有些資料探勘軟體也可作資料轉換與呈現,OLAP(線上分析處理)系統是針對資料倉儲使用者設計的軟體 資料探勘並非只是從資料倉儲直接取得資料,而是從之前未知的資料中取得資訊。 資料探勘(data mining)可界定為蒐集資料市集之過程,可使使用者了解以前未知的資料型態、關係、趨勢等。將其運用於CRM,則是從顧客資料中,更了解顧客及其行為。 2017/4/17 顧客關係管理

決策支援 資料倉儲系統並非只是交易處理系統,而是要用於決策制定。 將電腦運用於決策支援系統(DSS)的理念可追溯至Gorry與Morton兩位麻省理工學院教授於1971年發表於史隆管理評論(Sloan Management Review)的文章,該理念可相對於管理資訊系統(MIS- Management Information System),但MIS偏向企業整體資訊之發掘,但運用的結果是,管理者不一定知道所需的資訊,而資訊專業人員也不一定懂管理。 Gorry與Morton將MIS觀念與決策支援系統(DSS- Decision Support System)觀念結合,以便針對問題加以解決。 2017/4/17 顧客關係管理

圖表9.1 供決策支援之資料探勘 2017/4/17 顧客關係管理

假設驗證與知識發現 資料探勘之使用過程稱為假設驗證(hypothesis verification),使用者可用CRM系統支持或拒絕其假設。 資料探勘也有助於知識發現(knowledge discovery),使用者透過CRM系統之使用,可確認資料中存在之特性,透過資料之發掘予以陳述。 假設驗證以使用者導向(user-driven)進行,知識發現則以系統導向(system-driven)之方式進行。 2017/4/17 顧客關係管理

資料探勘功能 分類 分群 許多公司常依顧客行為將顧客分類,以提供較佳之服務 賣方喜歡依顧客相似特性,將顧客分群,企業可依此資料,對特定分群推出行銷方案。 資料探勘軟體可結合人口統計變數、地理、活動、心理、行為變數等資料進行分群,計算程序(algorithm)可將資料結合軟體,以得到更豐富的資訊。 2017/4/17 顧客關係管理

資料探勘功能(續) 連結 連結是用於產品之間,賣方可了解連結是否存在,及其強度,且基於相關產品而進行決策。 例如:早餐之製造商可藉優惠券資料獲知哪些產品被購買,零售商可將常被一起購買之產品放在一起展示,確認連結之過程稱為發現連結(associations discovery)。 2017/4/17 顧客關係管理

資料探勘功能(續) 型態或序列 哈拉博奕公司如何應用此功能 賣方也會對顧客購買行為之型態或序列有興趣,有些行為會以某序列方式發生,資料探勘型態稱為發現序列型態(sequential pattern discovery),包含時間為變數,序列的強度可用量化方式加以衡量。 另一個發現型態或序列的方法是相似時間序列發現(similar time sequence discovery) ,不僅發現序列型態,也確認相似型態的行為。顧客依序列購物,及相似時間序列發現可用於確認其他分群也有類似的序列,資料探勘軟體系統可完成這些功能。 哈拉博奕公司如何應用此功能 2017/4/17 顧客關係管理

知識發現方法 決策樹 決策樹(decision tree)是基於屬性而進行推導的過程,可用一系列的架構進行推論,通常只有一個起點,但有多個終點 決策樹的基礎稱為根部,分枝的盡頭則稱為樹葉,通常根部在圖表的上方或左方,邏輯過程是由上而下或由左至右。 2017/4/17 顧客關係管理

圖表9.2 決策樹 2017/4/17 顧客關係管理

圖表9.2 決策樹(續) 2017/4/17 顧客關係管理

知識發現方法(續) 算術推導 算術推導(genetic algorithm)則基於最適化之觀念加以推導,圖表9.3表示廣告策略之推導,該策略目標是使銷售極大,太少廣告將喪失潛在的收入,太多也對企業不利。 2017/4/17 顧客關係管理

圖表9.3 算術推導之例 2017/4/17 顧客關係管理

知識發現方法(續) 記憶體為基礎之推導 記憶體為基礎之推導(memory based reasoning)是指基於已往記憶,預測未來可能發生之事項,運用在行銷上,則是以已往產品之購買預測其品牌忠誠度。 資料探勘的應用中,資料紀錄可得知顧客行為,大量購買的顧客可分類為忠誠的顧客,也可用於預測未來可能的序列行為。 RFM(最近購買時間、頻率、金額等)是記憶體為基礎之推導的例子,可預測其未來行為。 2017/4/17 顧客關係管理

知識發現方法(續) 神經網絡分析 神經網絡分析(neural networks)是基於人體腦部之基礎,配合電腦輸入、處理、輸出等架構,所形成的分析架構 圖表9.4A是分析中的元件要素,包含輸入、處理、輸出等,為單一方向推導 圖表9.4B則結合更多來源,形成網絡分析。 圖表9.5則以表列方式呈現四種基本的資料探勘所能達成之功能。 2017/4/17 顧客關係管理

圖表9.4 神經網路分析 2017/4/17 顧客關係管理

圖表9.5 知識發現方法可完成之基本功能 2017/4/17 顧客關係管理

線上分析處理(OLAP)之基本概念 OLAP是基於資料倉儲使用者之需求,使其達成互動效果,並進行多維度分析及獲得迅速回應。使用者可基於網路(Web)畫面進行互動利用,且可獲得包含圖形之結果。 OLAP可用於移動平均及時間序列等之運算,OLAP也支援向下查詢、向上查詢、橫向查詢、穿越查詢 OLAP也可將資料加以轉軸,從不同角度看資料,將於圖表9.6討論。 2017/4/17 顧客關係管理

圖表9.6 產品多元分類 2017/4/17 顧客關係管理

圖表9.6 產品多元分類(續) 2017/4/17 顧客關係管理

圖表9.6 產品多元分類(續) 2017/4/17 顧客關係管理

基本的線上分析處理架構 OLAP的資料可取自關係性或多維度的資料庫,前者稱為ROLAP(關係性線上分析處理- Relational Online Analytical Processing),後者稱為MOLAP(多維度線上分析處理- Multidimensional Online Analytical Processing),架構列於圖表9.7 ROLAP從關係性資料庫管理系統中取得資料,MOLAP則從多維度資料庫系統中取得資料。 2017/4/17 顧客關係管理

圖表9.7 ROLAP 與 MOLAP 架構 2017/4/17 顧客關係管理

關係性線上分析處理(ROLAP) 各資料庫以關係性表格組成,採資料庫常用標準軟體,經證明可不受限於資料規模,但若受資料規模限制,則影響其分析能力。 2017/4/17 顧客關係管理

圖表9.8 ROLAP 報告之例子 2017/4/17 顧客關係管理

多維度線上分析處理(MOLAP) 多維度資料庫正在成長,IBM與微軟已發展多維度資料庫管理系統(MDBMSs) MDBMSs適用於OLAP以完成多維度分析,但資料庫規模受限。因此須將MDDB下載至顧客工作站,MDBMSs只需管理一部分的資料庫即可。CRM系統的設計者須決定用ROLAP或MOLAP ROLAP適用於資料庫很大,而分析為中等 MOLAP適用於資料庫較小,而分析較複雜 須結合ROLAP與MOLAP的強勢,則須用HOLAP。 2017/4/17 顧客關係管理

圖表9.9 MOLAP 報告之例子 2017/4/17 顧客關係管理

OLAP軟體 OLAP軟體系統有兩個例子,一個是微軟SQL 2000伺服器,另一個是IBM DB2。 微軟的產品可提供多維度構面,且將量化數據加以彙總,資料可用彈性及迅速報告之方式提供。細節及彙總資料可用關係性或多維度OLAP資料庫加以儲存,或以複雜結合方式,稱為HOLAP (Hybrid Online Analytical Processing)。在HOLAP,細節資料儲存在關係性資料庫,而彙總資料儲存在多維度資料庫。 IBM DB2則可提供假設導向之資料探勘,且迅速回應,以假設推導之邏輯加以分析。 2017/4/17 顧客關係管理

資訊呈現 資訊使用者 初學者(novice)是指沒有受過特別的電腦訓練,需要訊息,但不須分析,主管是其中一例,他只需彙總的資訊。 分析人員(analyst)是指精通分析之使用,且應用統計工具,將資訊加以轉換,以供主管使用,主管的幕僚是其中一例。有權力者(power user),他們將資訊分析,且加入其他總體資訊,通常是資訊專業人員 2017/4/17 顧客關係管理

資訊呈現(續) 資訊傳送軟體 報告撰寫 資料庫查詢語言 決策支援系統 線上分析處理 2017/4/17 顧客關係管理

圖表9.10 資訊傳送過程 2017/4/17 顧客關係管理