Mining for Interactive Identification of Users’ Information Needs Rey-Long Liu and Wan-Jung Lin 劉瑞瓏ヽ林宛蓉 Dept. of Information Management Chung Hua University.

Slides:



Advertisements
Similar presentations
第 十 三 章 行銷通路 與 實體運配.
Advertisements

E-HR
2011 環保實作說明會 東海校園溫室氣體盤查計畫 計畫執行單位:東海大學總務處 東海大學環境科學與工程學系 計畫主持人: 鄧宗禹教授
搭客析 - TAXI 1. 指導教師 高玉芬 老師 B 陳韋臣 ( 組長 ) B 李鉢卿 B 李佳和 B 黃柏融 2 專題參與人員.
企業資源規劃導論 第一章 企業資源規劃簡介.
 Prentice Hall Chapter 71 科技與工作流程設計.  Prentice Hall Chapter 72 學習目標 了解科技如何影響生產力 討論電腦輔設計 認識彈性製造系統 定義組織再造的三項要素 資訊科技如何支援決策.
Chapter 0 Computer Science (CS) 計算機概論 教學目標 瞭解現代電腦系統之發展歷程 瞭解電腦之元件、功能及組織架構 瞭解電腦如何表示資料及其處理方式 學習運用電腦來解決問題 認知成為一位電子資訊人才所需之基本條 件 認知進階電子資訊之相關領域.
1 資訊管理學生為何要學習商管知識? 中央大學、資訊管理系 范錚強. 2 資訊管理學門  “The Study of the effective design, delivery and usage of information systems in organizations.” Keen (1980)
1 st Year2 nd Year3 rd Year4 th Year FallSpringFallSpringFallSpringFallSpring 資料庫實務 (Database Practices) 資料庫系統 (Database System) 人工智慧 (Artificial Intelligence)
盧希鵬 葉乃菁 鄒仁淳 著 1. 3 資訊與資訊系統 1.1 資訊的層次 1.2 資訊系統 問題討論 範例個案 本 章 綱 要本 章 綱 要 本 章 綱 要本 章 綱 要.
台灣經濟新報 簡介 Taiwan Economic Journal 郭欣怡 TEL : (02) #120 :
第八章:行銷資訊系統資料來源及運用 課程名稱 行銷資訊系統 進度 第八章 授課老師 總時數 3小時 線 行銷資訊系統 – E世代的行銷管理.
物流通關專業教室 (052) 國貿實務專業教室 (054) 企業資源整合專業教室 (055) 整合各專業教室資訊進行 即時動態及異常管理 (051) 貿易運籌研訓中心 專業實習、 、 師生研究討論 、、 、、 海關模擬系統、貨況追蹤、貨物 進出倉管理、海空運通關承攬、 通關自動化作業等相關模組 全球運籌決策中心.
 Prentice Hall Chapter 61 績效評估控制系統.  Prentice Hall Chapter 62 學習目標 描述控制程序的步驟 指出行為控制的方法 描述 EOQ 模式的目標 比較資料與資訊.
台灣客家知識治理之研究 -- 以 行政院客委會為例 發表人: 彭安麗 南華大學公共行政與政策研究所助理教授 發表人: 彭安麗 南華大學公共行政與政策研究所助理教授
政府資訊資源查詢 國立政治大學 圖書館參考組. 大綱  前言  政府資訊的定義  本校政府資訊館藏特色及處理方式  政府資源網站介紹  社資政府資訊館藏介紹  政府資訊資料庫介紹  問題與討論.
文件製作 陳彥良. Phase 1 Identifying problems Identifying opportunities Identifying objectives.
ERP 導入策略 朝陽科技大學 嚴國慶. 企業經常面臨的問題 銷售、生產、品管、採購相互抱怨 物料量計算時間太久,採購週期延長 訂購單、採購單、缺料單日期不同 庫存數據不知正確與否,無法信賴.
張緯良 世新大學資訊管理學系 副教授 中華民國資訊管理學會 理 事 中華企業資源規劃學會 監 事
前程文化 物流管理:原理、方法與實例 顏憶茹、張淳智 12-1 緒論 物流中心的意義 物流中心的機能與重要性 物流中心的類型 物流中心的系統規劃 現階段物流中心的主要發展趨勢及課題 結論 物流中心.
 Prentice Hall Chapter 81 組織設計.  Prentice Hall Chapter 82 學習目標 了解組織結構的六項特徵 比較機械式與有機式的組織設計 解釋造成結構差異的四項權變性變數 解釋環境的不確定性如何影響組織結構.
第十章 ERP 企業資源規劃 ERP 企業資源規劃. 第十章 ERP 企業資源規劃 2 本章前言 二十年前,因為個人電腦的普及,許多分散式資訊系統及 使用者自建系統的觀念紛紛被提出。各個部門與分公司自 建自己的資訊系統。雖然減少了系統發展的等待時間,但 也增加了系統的複雜度。 當.
資訊管理學生為何要學習商管知識? 中央大學、資訊管理系 范錚強. 資訊管理學門  “The Study of the effective design, delivery and usage of information systems in organizations.” Keen (1980)
人力資源管理 1 教 師:林昌榮 人力資源管理 2 äD: Demand äS: Supply äB: Balance 4Product Demand 4Labor Productivity 4Internal Labor Market 4External Labor Market 4Demand.
Oracle General Ledger Rel.11i Presenter :電算中心 羅元佳
1 CHAOYANG UNIVERSITY OF TECHNOLOGY 朝 陽 科 技 大 學 研 究 發 展 處 專案計畫審查辦法說明會 報告人:洪處長弘祈.
鄭瑞興的個人簡介 中山資工所 鄭瑞興.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
ERP 世新大學 ERP 實驗室 1 企業資源規劃 企業 e 化之營運管理 Oracle General Ledger 會計總帳 2003/09.
教材名稱:網際網路安全之技術及其應用 (編號: 41 ) 計畫主持人:胡毓忠 副教授 聯絡電話: 教材網址: 執行單位: 政治大學資訊科學系.
二、整體財務資訊及分析  財務報表資訊  財務資訊分析  財務資訊聯絡人. 財務規模 項目 93 年度 94 年度 95 年度 96 年度 收 入 支 出 本期餘絀 備註: 1.
企業資源規劃 企業 e 化之營運管理 Oracle-AP 模組介紹. 銷售預測 FCST 顧客訂單 orders 物料需求規劃 MRP 產能需求規劃 CRP 生產排程 schedule 採購訂單 PO 收料作業 receive 在製品管理 WIP 發料作業 issue 出貨作業 shipping 應付帳款.
如何進入IT就業市場.
ERP 世新大學 ERP 實驗室 1 企業資源規劃 企業 e 化之營運管理 Oracle General Ledger 會計總帳.
1 總務處營繕組 業務簡報 ( 藝文生態館 ) ( 學生宿舍 ) Construction & Maintenance Section 97 年 7 月 8 日.
人力資源管理 1 教 師:林昌榮 人力資源管理 2 何謂工作分析  界定職位之工作內容及工作方式  決定擔任此職位的人所具備的能 力及條件  為人力資源管理活動的磐石.
1 第七章 風險管理 風險的要素 – 不確定 – 有損失的可能性. 2 風險的種類 事業風險 (business risk) 與財務風險 (financial risk) 可分散化風險 – 個別風險 – 非系統風險 – 純風險 不可分散化風險 – 市場風險 – 系統風險 – 投機 ( 或價格 ) 風險.
國立中央大學. 資訊管理系 范錚強 Inception 公司治理模擬.
1 Blackboard 數位學習管理平台 教育訓練 BEENET Sam. 2 Source: Dunn & Bradstreet MDR, Higher Education Findings. e-Learning 市場的 No.1 ~ Blackboard * Of institutions.
政府資訊搜尋利用指導 國立政治大學 社會科學資料中心. 大綱  前言  政府資訊的定義  本校政府資訊館藏特色及處理方式  政府資源網站介紹  社資政府資訊館藏介紹  問題與討論.
寬頻通訊系統基礎教育計畫 分項計畫二 寬頻網路通訊 主要參與人員 黎碧煌 教 授 鍾順平 副教授
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
MANAGEMENT INFORMATION SYSTEMS 管理資訊系統. 企業的五大資源 人力 (Personnel) 人力 (Personnel) 資料 (Material) 資料 (Material) 機器設備 (Machines) 機器設備 (Machines) 金錢 (Money) 金錢.
創造力與創新之後 一 、 累積創意 二 、 專利 三 、 創新創業. 課程週數建議 一、 一、 累積創新 ( 一 ) 創新資料庫規劃、前端後端關係、創新資料性質分類 、儲存與運用、資料維護 “ 累積創新 ” 課程 : 計一週 、 二 、 專利 ( 七 ) 專利權 ( 一 ) 專利目的、專利要件、專利種類、專利效力、專利法概述.
數位家庭教學推動聯盟中心 數位家庭軟體工程 第一年教材編列進度報告 國立台灣海洋大學資訊工程學系 梁德容.
智勝文化事業有限公司製作 行銷管理 ( 再版 ) 林建煌 著 第六章 組織市場與其購買行為. 智勝文化事業有限公司製作 行銷管理 ( 再版 ) 林建煌 著 組織購買者的類型  製造廠商  中間商  服務性組織  政府組織  非營利機構.
統計學 ( 二 ) 朝陽科技大學工業工程與管理系副教授洪弘祈 Statistics II2 企業與統計之關係 n 品質管制 n 預測統計與市場調查 n 績效與人事管理 n 例行報告之方案評估與決策參考 n 製程改善 n 研發能力之提昇 n 產品可靠度 n 生產管制.
1 會計與產業整合之理論與架構初探 許恩得 En-te Hsu 東海大學會計學系副教授兼系主任. 2 簡報流程 壹、導論 貳、會計知識發展模式 參、會計學系經營模式 肆、結論.
概念性產品企劃書 呂學儒 李政翰.
報告人:陳錦生 校長 日 期: 99 年 10 月 21 日. 自我評鑑報告內容簡介 校務評鑑五大項目 自我評鑑過程 簡述自我評鑑過程 學校現況 校地、教職員生數、圖書冊數、院系所學位學程.
技術與流程 本章內容 組織的技術 製造業的核心技術 服務業的核心技術 非核心技術與組織管理 工作流程的相依性 Chapter 8
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
McGraw-Hill© The McGraw-Hill Companies, Inc., 2004 第 12 單元 資訊系統開發 McGraw-Hill Education.
ERP 世新大學 ERP 實驗室 1 企業資源規劃 企業 e 化之營運管理 Oracle General Ledger 會計總帳.
1 高等管理資訊系統. 2 授課教師 : 王耀德 研究室 : 主顧 686 電話 : (04) # 課輔時間 Wednesday 09:00~13:00 介紹.
1 知識管理期中簡報 - 運用人力資源管理達成知識的移轉 報告者:白大倫 學號: 日期: 2006/11/13.
電機工程系 選課輔導說明會. 選課輔導說明會宗旨 電機系自 95 年開始,同步進行『工程教育 認證』以及『系科本位課程』兩大與學生 課程相關的認證計畫。 電機系自 95 年開始,同步進行『工程教育 認證』以及『系科本位課程』兩大與學生 課程相關的認證計畫。 本系每年至少一次的系教育諮詢委員會, 廣邀產業界、學界、家長、畢業生、在校.
導論 人力資源管理 教 師:林昌榮 人力資源管理.
1 化學品管理系統介紹 工研院資訊中心 何玲菁 內容  目的  作業流程  權責  系統登入  功能說明  系統展示  Q & A.
 Prentice Hall Chapter 21 管理組織及人員 Who, What, and Why?
中壢家商網路現況與經驗分享 報告人:葉建麟 日 期: 時間歷 程備 註 43 年奉准試辦一年招考新生三班 44 年正式成立考核通過 47 年成立高級部 49 年改為完全家事職業學校 57 年奉令改制為省立中壢高級家事職業學校 59 年 奉令改制為省立中壢高級家事商業職業 學校 初級部結束.
ERP 財會模組 Financial Module.
創業計畫 沈培輝老師(科管所). 創業計畫 事業目標 (**) 市場分析 (*) 產品發展與製造 (***) 市場行銷 (***) 組織與管理 (***) 股權 (*) 財務計劃 (***) 風險管理與應變策略 (*) 計劃時程與里程碑 (***)
Introduction of ERP Castles Within Enterprises Sales Inventory Billing Payment Delivery.
Interactive Identification of Information Needs and Its Application to Medical Informatics Rey-Long Liu 劉瑞瓏 Dept. of Information Management Chung Hua University.
行銷學原理‧曾光華、饒怡雲 著‧前程文化 出版
Presentation transcript:

Mining for Interactive Identification of Users’ Information Needs Rey-Long Liu and Wan-Jung Lin 劉瑞瓏ヽ林宛蓉 Dept. of Information Management Chung Hua University

2 Outline  Introduction Information Need Identification (INI): What & Why Interactive INI  INEED: Incremental Mining for Interactive INI The profile miner The information need identifier  Experiment  Conclusion

3 Introduction  Information Need Identification (INI) for  Information portals  Online service guidance  Internet search engines  People finding  Interactive INI, which needs to consider  Precision (P)  Precision Effectiveness (PE)  Recall (R)  Recall Effectiveness (RE) CRCR C n2 2 C n2 1 C n1 2 C n1 1 Cn2Cn2 Cn1Cn1 CnCn C1212C1212 C1211C1211 C 12 2 C 12 1 C11C11 C12C12 C1C1 C 11 2 C 11 1 C 12 2 C 12 1 C12C12 C11C11 C1212C1212 C1211C1211 C1C1 C1212C1212 C1211C1211 C1212C1212 C1211C1211 C n2 2 C1212C1212 C12C12 ‧‧ ‧

4 Introduction (Cont.)  Main Challenges Each information space has its own content and structure. Each information space is intrinsically dynamic. Users are often unable (or unwilling) to precisely express their information needs (INs). Their queries are often quite short. Users prefer simpler and fewer interactions.

5 INEED (3) Information Information Storage Interface Information Provider (4) Information Required Profile Miner IN Identifier INEED Category Profile (0)Content & Taxonomy (2)Request (1)Interaction

6 The Profile Miner Incremental profile mining Given: The document d to be added to category c. Effect: Updating the profiles of c and related categories. Procedure: (1) While c is not the root of the text hierarchy, do (1.1) For each distinct word w in d, do (1.1.1) If w is not a profile term for c, add to the profile of c (strength s w,c is unknown); (1.2) For each pair in the profile of c, do (1.2.1) s w,c = P(w|c)  (B c /  i P(w|c i )); (1.2.2) For each sibling b of c, update s w,b in the profile of b; (1.3) c  father of c.

7 The Profile Miner (Cont.) f Updating the profiles of related categories once a document is added New document added to f The s-values of the profile terms are updated ‧‧‧ The s-values of the profile terms are updated

8 The Profile Miner (Cont.) 經理人員 決策制定、協調整合 業務處 市場規劃、商品推展 管理處 內務行政、績效管理 研發處 整合評估、流程制定 行銷部 行銷文宣、廣告宣傳 客戶部 訂單管理、銷售分析 品保部 品質維護、產品測試 製造部 產品生產、設計製造 行政部 營運管理 資訊部 系統規劃、研發維護 人事課 員工聘用、人才培育 會計課 帳目管理、預算編排 出納課 款項收付 電腦整合課 生產資訊、資訊運用 資訊管理課 系統管理、辦公室自動化 An example:

9 管理處 內務、行政、管理 研發處 研發、生產、流程 品保部 品質、管理、測試 資訊部 資訊、系統、建置 電腦整合課 生產、整合、運用 … … … 生產管理之相關資訊 ? The Profile Miner (Cont.) 經理人員 業務處 市場、規劃、銷售 行銷部 行銷、廣告、宣傳 客戶部 訂單、管理、分析 具有代表性 P(w|c) 高 區別能力 P(w|c) * B c /  i P(w|c i ) 強 S=P(w|c) * (B c /  i P(w|c i ) 管理處 內務、行政、管理 研發處 研發、生產、流程 品保部 品質、管理、測試 資訊部 資訊、系統、建置 電腦整合課 生產、整合、運用 … … … 生產管理系統建 置與維護 生產品質維護 context

10 The IN Identifier

11 The IN Identifier (Cont.) (1) For each category c, HitScore c  0; (2) For each pair (w, c), where w is a word in the query Q and c is a category, (2.1) If s w,c > 1 and Support(w, c)  minSupport, (2.1.1) ns  (s w,c – 1) / (number of siblings of c); (2.1.2) HitScore c  HitScore c + ns  TF(w, Q); (3) S  The set of all categories; (4) While the target category has not been identified and interaction is still allowed, do (4.1) Let p 1 and p 2 be two pedigrees (in S) with the highest average HitScore; (4.2) Let t 1 and t 2 be the categories with the highest HitScore in p 1 and p 2 ; (4.3) Display t 1 and t 2 (and their basic information) for the user to select; (4.4) If either t 1 or t 2 is exactly the target, return the space under the target; (4.5) Else if neither t 1 nor t 2 is of interest, S  S – {the categories under t 1 and t 2 }; (4.6) Else if both t 1 and t 2 are of interest, g  ClimbUp(common ancestor of t 1 and t 2 ), and return the space under g; (4.7) Else (4.7.1) Let t be the category that is of interest; (4.7.2) If t is a leaf, g  ClimbUp(father of t), and return the space under g; (4.7.3) Else S  {the categories under t}; (5) Return S;

12 The IN Identifier (Cont.)  Finding two candidate categories for interaction (1) (2) (3) (4) (5) p1p1 p2p2 t1t1 t2t2

13 The IN Identifier (Cont.) Function ClimbUp(f), where f is a category to start climbing (1) If f is the root, return f; (2) While the target category has not been identified and interaction is still allowed, (2.1) f sibling  A sibling of f; (2.2) f uncle  A sibling of the father of f; (2.3) Display f sibling and f uncle (and their basic information) for the user to select; (2.4) If either f sibling or f uncle is exactly the target, return the target; (2.5) Else if neither f sibling nor f uncle is of interest, return f; (2.6) Else if both f sibling and f uncle are of interest, (2.6.1) f  grandfather of f; (2.6.2) If f is the root, return f; (2.7) Else if f sibling is of interest, return father of f; (2.8) Else return {f, f uncle }; (3) Return f;

14 The IN Identifier (Cont.)  Generalization by climbing the hierarchy Possible results of generalizationFinding two categories for generalization f sibling f uncle f

15 Experiment  Experimental Data Source: Yahoo! ( Coverage: Computers & Internet, Society and Culture, and Science Size: 214 categories; depth: 8 Training data: 2216 documents Test data: 168 queries extracted from another set of site summaries

16 Experiment (Cont.)  Each system could conduct at most 5 interactions for each query SystemDescriptionNote INEEDAs described with two settings for minSupport: and INEED INEED BruteForce As in most search engines, the whole information space is considered (no INI is conducted). RandomCN The system employs top-down navigation. At each level, two categories are randomly selected for the user to confirm. Repeat 10 times IdealCN The system employs top-down navigation. At each level, the target is always in the candidates identified by the system. NB The output category is determined by the conditional probabilities of the query terms occurring the categories, with two feature set sizes: 5000 and NB-5000 NB-8000

17 Experiment (Cont.)  Precision BruteForce was poor Interaction is good for precision INEED improved 14%~20% w.r.t NB  Recall INEED was good in both precision and recall BruteForce and CN achieved 100% recall INEED achieved 100% recall using only 2 interactions

18 Experiment (Cont.)  Precision-effectiveness BruteForce was excluded INEED improved more (19%~32%) w.r.t. NB  interactions by INEED were more effective  Recall-effectiveness INEED performed best INEED improved 2%~20% w.r.t. NB

19 Experiment (Cont.)  Precision vs.Recall BruteForec and CN always achieved 100% recall INEED performed best (its curve lied on the upper right corner)  When no interaction is allowed INEED improved 38% recall w.r.t. NB Precision of INEED improved 62% in the first interaction (NB only improved 29%)

20 Experiment (Cont.) Test query: Virtual world featuring 3-D ray-traced graphics. Wander around, meet other netizens, and try to solve some puzzles. Features animation and sound clips, Correct target identified by INEED: Computers and Internet → Multimedia → Virtual Reality → Exhibits Erroneous category identified by NB: Computers and Internet → Software → Operating Systems → Windows → Windows 95 An example:

21 Conclusion  Interactive Information Need Identification (interactive INI) as an essential component for  Information portals  Online service guidance  Information retrieval  People finding  Requirements of interactive INI, fulfilled by INEED  Exactly identify the information space that may satisfy the user’s information needs  Effectively interact with the user  Intelligently reduce the user’s load in query formation and result cognition

22 Thanks