Download presentation
Presentation is loading. Please wait.
1
Design and Implementation of Applying Data Mining Techniques to CSE Student ’ s Habits 指導教授: 張玉盈 專題組員: 李立文 (8934013)
2
何謂 Data Mining ? Data Mining 的定義: 在一大群的資料當中,找尋出有價值的 資訊、或是隱藏著的規則及模式。 Association Rule 當一大群資料中,某些屬性出現的同時, 會引發另外一些屬性跟著出現這樣的情 形,即是 Association Rule 。 如:買麵包的顧客通常也會買牛奶。
3
Association Rule 定義: - I = {i 1, i 2, i 3, ….., i n }, I 為所有 Item 的集合 - D 為資料庫中所有 Transaction 的集合 - 任何在 D 中的 Transaction 均為 I 的 subset - Support 若關聯 A=>B 這樣的 Itemset 在資料庫中出現 的比率為 s% ,則稱 A=>B 的 support 為 s - Confidence 若關聯 A=>B 以 confidence c 成立,即表示 在 D 裡面所有包含 A 的 Transactions 中,有 c% 亦包含了 B
4
Apriori 演算法 TIDItems 1001 3 4 2002 3 5 3001 2 3 5 4002 5 D Itemsets 12 23 33 41 53 s 12 23 33 53 s 1 2? 1 3? 1 5? 2 3? 2 5? 3 5? Itemsets 1 32 2 32 2 53 3 52 Itemsets 1 21 1 32 1 51 2 32 2 53 3 52 Scan D C1C1 L1L1 C2C2 C2C2 L2L2 S = 50%
5
Apriori 演算法 (cont.) Itemsets 2 3 5? Itemsets 2 3 52 Scan D C3C3 C3C3 L3L3 Itemsets 2 3 52
6
專題目的 收集資工系學生的生活習慣、上課習慣、 以及興趣等資料,並實作 Data Mining 中 尋找 Association Rule 的 Apriori 演算法來 對這些資料進行分析,以期能夠了解在 資工系學生的生活習慣,以及上課習慣 之中,所表現出來的各種特性以及關聯。
7
主程式使用語言及演算法 主程式使用語言: Java Mining 演算法: Apriori 演算法 程式平台: JVM 程式架構: Client / Server Client 端程式形式: Applet Server 端程式形式:應用程式 (.JAR)
8
問卷問題分配 個人資料 - 基本資料:年齡、性別等等 - 個人興趣 運動類:如足球、籃球等等 電腦類:如寫程式、電腦組裝等等 其他:如攝影 學生資料 - 年級:一 ~ 四年級 - 生活習慣:如是否常熬夜 、 是否常看網頁等等 - 讀書習慣:如是否常缺席 、 上課是否常打瞌睡等等 - 其他:如參加過的社團種類等等
9
程式架構 Local Database Remote Database Server Apriori Algorithm ServerSocket Message Handler Client Client Agent Information Panel Confidence Panel Result Panels Text Statistics Accept User Input ResultCommand Login Req. Command Result Msg. Req. of compute Get Users Data Get Data Data
10
程式流程 登入 輸入資料庫 帳號 & 密碼 Server Client 主畫面 載入資料庫內容 Apriori 計算 顯示結果 分析 Confidence 啟動程式 結束 ServerSocket.Accept(); Message Handler Error or Logout Connect Login Request Command
11
資料收集 收集對象:資工系大學部學生 資料收集方式:問卷調查 問卷形式: JSP 網頁連結資料庫 後端資料庫: MySQL 預計資料筆數: 120 筆以上 實際資料筆數: 67 筆 欄位數目: 110 個欄位
12
程式畫面 – Login
13
程式畫面 – Load Database
14
程式畫面 – Data Filter
15
程式畫面 – Text & Statistics Result
16
程式畫面 – Confidence & User Manager
17
程式畫面 - Server
18
部分結果結論 整體分析 在資工系的學生之中,幾乎全部的學生都是男性,並且常使用 BBS 且常瀏覽網頁,並且常聽音樂。 ( 比率: 79.10%) 一些有趣的關聯 興趣與修課 - 對硬體有興趣的學生通常喜歡上實習課 (81.48%) - 不喜歡上實習課的學生通常喜歡參加運動性社團 (80.95%) - 喜歡寫程式的學生通常也喜歡玩 Game(81.25%) 上課與成績 - 不用功且討厭報告的人通常會打瞌睡 (94.12%) - 不用功且討厭報告的人通常也沒什麼自信心 (94.12%) 食衣住行 - 常吃宵夜且對住宿環境沒什麼意見的學生通常不怎麼注重 自己桌上的整潔 (94.44%)
19
程式開發中遇到的幾個問題 Applet 與資料庫之間的連線問題 IE 瀏覽器對 Applet 的支援問題 資料庫中文資料及欄位名稱輸入的問題
20
未來可能的擴充 能夠連接多種不同的 Databases 更多種類的 Mining 方法 能夠利用關聯資料庫產生可做為程式的 輸入的 Data
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.