Podpora adaptívneho WEB-u prostriedkami strojového učenia Kristína Machová
Znižovanie kognitívnej záťaže používateľa Internetu Systém AWS Odporúčanie internetových stránok na základe modelu používateľa (generovanie konceptu) Poskytovanie informácií o aktuálnych skupinách návštevníkov (zhlukovanie)
Vstupy Trénovacia množina je formovaná na základe log protokolu www servera a následne spracovaná Z trénovacej množiny sa získava koncept používateľa klasifikačnými metódami strojového učenia (HGS, HSG) Taktiež sa z nej generujú skupiny používateľov konceptuálnou zhlukovacou technikou (CLUSTER/2) Knowledge Management focuses on “doing the right thing” instead of “doing things right”. In our thinking, knowledge management is a framework within which the organization views all its processes as knowledge processes. In this view, all business processes involve creation, dissemination, renewal, and application of knowledge toward organizational success and survival.
Trénovacia množina Por.č. A(url) T(userID) 1 /som.php USER3eafc6cd8c98a 2 /maxnet.php USER3eafc6cd8c98a 3 /ns_top.php USER3eafc6cd8c98a 4 /cobweb.php USER3eafc71274ad9 5 /id3.php USER3eafc71274ad9 6 /c45.ph USER3eafc71274ad9 7 /pid1.php USER3eafc7413857e 8 /psd1.php USER3eafc7413857e 9 /plc.php USER3eafc7413857e
Transformovaná trénovacia množina P.č. Kľúčové slová T(userID) 1 UI,NS,zhlukovanie,SOM,konkur_učenie USER3eafc6cd8c98a4 2 UI,NS,konkur_učenie,MAXNET USER3eafc6cd8c98a 3 UI,NS,dopredné,topológia USER3eafc6cd8c98a 4 UI,SU,zhlukovanie,COBWEB USER3eafc71274ad9 5 UI,SU,rozhodovanie,roz_stromy,ID3 USER3eafc71274ad9 6 UI,SU.rozhodovanie,roz_stromy,C4.5 USER3eafc71274ad9 7 Riadenie,regulátory,spojité,PID USER3eafc7413857e 8 Riadenie,regulátory,diskrétne,PSD USER3eafc7413857e 9 Riadenie,automaty,PLC USER3eafc7413857e
Tvorba modelu používateľa Model používateľa je reprezentovaný množinou kľúčových slov, ktorá vyjadruje záujmy používateľa Použité klasifikačné algoritmy HGS a HSG najvšeobecnejší najšpecifickejší HGS HSG
HGS a HSG Čiastočné pokrytie a premenný počet atribútov Najvšeobecnejší koncept je úplná množina kľúčových slov (disjunkt.) Najšpecifickejší koncept je jedno kľúčové slovo Operátorom špecifikácie (zovšeobecnenia) je vypustenie (pridanie) kľúčového slova z (do) popisu konceptu
Protirečivé príklady Systém AWS používa dva rôzne prístupy k riešeniu tohto problému Implicitné riešenie modifikovanou heuristickou funkciou – „upravené heuristikou“ Vymazanie z množiny negatívnych príkladov – „s vypustením“
Odporúčanie stránok Klasifikačný problém. Hľadajú sa stránky, ktoré by mohli byť klasifikované k danému používateľovi. Stupeň pokrytia vyjadruje mieru zhody kľúčových slov stránky a kľúčových slov modelu používateľa. Ak je stupeň pokrytia väčší ako zvolená prahová hodnota, stránka je odporučená danému používateľovi.
Testovanie časovej náročnosti
Generované modely I. Používateľ Model (HGS „upravené heuristikou“) USER3eafc6cd8c98a konkur_učenie,MAXNET,NS,SOM,topológia USER3eafc71274ad9 CN2,COBWEB,HCT,IWP,prahové_pojmy USER3eafc7413857e PLC,programovanie USER3eafc77ec0dbc CLUSTER/2,SOM,zhlukovanie USER3eafc79999251 NEX,rozhod_zoznamy USER3eafc7bca8371 fuzzy_regulátor USER3eafc7dd6b312 moduly,programovanie,simatic,SLC USER3eafc807499a2 C4.5,CN2,fuzzy_regulátor,NEX,PLC, roz_zoznamy,simatic
Generované modely II. Používateľ Model (HGS „s vypustením“) USER3eafc6cd8c98a konkur_učenie,MAXNET,NS,SOM,topológia USER3eafc71274ad9 C4.5,CN2,COBWEB,HCT,ID3,IWP,prahové_pojmy, roz_stromy,rozhodovanie,SU USER3eafc7413857e diskrétne,PID,PLC,programovanie,PSD,regulátory, SLC,spojité USER3eafc77ec0dbc CLUSTER/2,ID3,SOM,zhlukovanie USER3eafc79999251 ID3,NEX,rozhod_zoznamy USER3eafc7bca8371 fuzzy_regulátor,diskrétne,PID,PSC,regulátory,spojité USER3eafc7dd6b312 moduly,programovanie,simatic,SLC,automaty USER3eafc807499a2 C4.5,CN2,diskrétne,fuzzy_regulátor,ID3,NEX,PID, PLC,PSD,regulátory,riadenie,roz_stromy, roz_zoznamy,rozhodovanie,simatic,spojité
Generované modely III. Používateľ Model (HSG „s vypustením“) USER3eafc6cd8c98a UI,zhlukovanie,konkur_učenie,MAXNET,NS,SOM, topológia USER3eafc71274ad9 (CN2),COBWEB,HCT,ID3,IWP,prahové_pojmy, roz_stromy,rozhodovanie,SU,UI USER3eafc7413857e riadenie,regulátory,spojité,PID,PLC,(programovanie) USER3eafc77ec0dbc UI,SU,CLUSTER/2,SOM,zhlukovanie USER3eafc79999251 UI,SU,rozhodovanie,roz_stromy,ID3,NEX, rozhod_zoznamy USER3eafc7bca8371 riadenie,fuzzy,regulátory,fuzzy_regulátor USER3eafc7dd6b312 riadenie,automat,moduly,programovanie,(simatic),SLC USER3eafc807499a2 UI,SU,rozhodovanie,roz_stromy,ID3,C4.5,(CN2, fuzzy_regulátor),NEX,(PLC,roz_zoznamy),simatic
Generované modely IV. Používateľ Model (HSG „upravené heuristikou“) USER3eafc6cd8c98a UI,zhlukovanie,konkur_učenie,MAXNET,NS,SOM, topológia USER3eafc71274ad9 (CN2),COBWEB,HCT,ID3,IWP,prahové_pojmy, roz_stromy,rozhodovanie,SU,UI USER3eafc7413857e riadenie,regulátory,spojité,PID,PLC,(programovanie) USER3eafc77ec0dbc UI,SU,CLUSTER/2,SOM,zhlukovanie USER3eafc79999251 UI,SU,rozhodovanie,roz_stromy,ID3,NEX, rozhod_zoznamy USER3eafc7bca8371 riadenie,fuzzy,regulátory,fuzzy_regulátor USER3eafc7dd6b312 riadenie,automat,moduly,programovanie,(simatic),SLC USER3eafc807499a2 UI,SU,rozhodovanie,roz_stromy,ID3,C4.5,(CN2, fuzzy_regulátor),NEX,(PLC,roz_zoznamy),simatic
Porovnanie činnosti Technika Riešenie protirečiv. Klasif. prah Odporuč. z navštív. Odporuč. z nenavštív. HGS heuristika 0.33 0.6374 0.3750 HGS vypustenie 0.33 0.9688 0.5469 HGS heuristika 0.50 0.4732 0.2031 HGS vypustenie 0.50 0.7813 0.4531 HSG heuristika 0.50 0.8681 0.8906 HSG vypustenie 0.50 0.9688 0.9063 HSG heuristika 0.60 0.7847 0.6719 HSG vypustenie 0.60 0.9375 0.8125
Tvorba používateľských skupín Pre počet zhlukov 2 boli vygenerované: Zhluk 1: automaty, fuzzy, fuzzy_regulátor, moduly, PID, PLC, programovanie, regulátory, riadenie, SLC, spojité (primárny záujem o riadenie, 3 používatelia) Zhluk 2: C4.5, CLUSTER/2, COBWEB, HCT, ID3, IWP, konkur_učenie, MAXNET, NEX, NS, prahové pojmy, topológia, roz_stromy, rozhod_zoznamy, rozhodovanie, simatic, SOM, SU, UI, zhlukovanie (záujem o strojové učenie, 5 používateľov)
Zhlukovanie používateľov II. Pre počet zhlukov 4 boli vygenerované: Zhluk 1: C4.5, CLUSTER/2, COBWEB, HCT, ID3, IWP, NEX, prahové pojmy, roz_stromy, rozhod_zoznamy, rozhodovanie, simatic, SOM, SU, UI (strojové učenie, 4 používatelia) Zhluk 2: automaty, moduly, programovanie, riadenie, SLC (skôr riadenie, 1 používateľ) Zhluk 3: fuzzy, fuzzy_regulátor, PID, PLC, regulátory, riadenie, spojité (riadenie, 3) Zhluk 4: konkur_učenie, MAXNET, NS, SOM, topológia, UI, zhlukovanie (skôr strojové učenie, 1)
Diskusia použiteľnosť AWS pre rozsiahlejšie informačné priestory preskúmanie vhodnosti iných nástrojov strojového učenia zakomponovanie systému pre automatické získavanie kľúčových slov aplikácia nad zložitejšie štruktúrovaným webom
Ďakujem za pozornosť