Sisteme de recomandare Neagu Bianca IA 08.11.2010 SAC
Sisteme de recomandare Recomanda articole de care utilizatorul este probabil interesat Au aparut din cauza cresterii cantitatii de informatie Analizeaza profilul utilizatorului Din punctul de vedere al caracteristicilor articolului (abordare orientata pe continut) Din punctul de vedere al retelei sociale (filtrare colaborativa) Incearca sa estimeze ratingul pe care utilizatorul l-ar da unui articol nou 01.12.2018 SAC
Tipuri de sisteme de recomandare Bazate pe continut Analizeaza informatia textuala Sunt necesare mai multe date despre produs Filtrate colaborativa (CF) Se cauta utilizatori cu preferinte similare Se recomanda produsele noi preferate de acestia Nu necesita cunostinte despre produs Filtrate hibrida Combina cele 2 tehnici (algoritmul content-boosted CF, Personality Diagnosis) 08.11.2010 SAC 3
Obtinerea datelor Explicit – i se cere utilizatorului sa: Implicit Dea o nota unui produs Faca o lista cu articole care ii plac/displac Sa puna in ordinea preferintei o lista de produs Implicit Sunt observate articolele pe care utilizatorul le vizualizeaza intr-un magazin online Mentinerea evidentei produselor cumparate online 01.12.2018 SAC
Reprezentarea datelor – CF (1) Rij Airplane Matrix Room with a View ... Hidalgo Joe 9 7 2 Carol 8 ? Kumar 3 6 01.12.2018 SAC 5
Reprezentarea datelor – CF (2) 01.12.2018 SAC 6
Echivalenta structurala Indexul Jacard: SE(x,y) = J(N(x),N(y)) = |N(x) ∩ N(y)| / |N(x) U N(y)| Pentru exemplul anterior: |N(YouTube) ∩ N(Video)| / |N(YouTube) U N(Video)| = |{A, B, C, F} ∩ {A, B, C, D, E, F}| / |{A, B, C, F} U {A, B, C, D, E, F}| = |{A, B, C, F}| / |{A, B, C, D, E, F}| = 4 / 6 = 2/3 01.12.2018 SAC 7
CF : Provocari (1) Datele rare Scalabilitatea Tehnica de reducere: SVD Metode hibride Adaugarea de date: media, regresia liniara Scalabilitatea Reducere: SVD Pearson CF: calculeaza doar asemanarea dintre perechile de produse evaluate de aceeasi utlizatori Clustere 01.12.2018
CF: Provocari (2) Sinonimia Gray Sheep SVD (solutie partiala pentru polisemie) matrice mare de asocieri termen-document Realizeaza o aranjare astfel incat sa evidentieze tiparele importante de asociere intre date si sa e ignore pe cele mai putin importante Gray Sheep Metoda hibrida: medie ponderata intre predictia bazata pe filtrare bazata pe continut si cea bazata pe CF 01.12.2018
Bibliografie Collaborative Filtering: A Tutorial, William W. Cohen, Center for Automated Learning and Discovery Carnegie Mellon University A Survey of Collaborative Filtering Techniques, Xiaoyuan Su and Taghi M. Khoshgoftaar, Department of Computer Science and Engineering, Florida Atlantic University http://webwhompers.com/collaborative-filtering.html http://en.wikipedia.org/wiki/Recommender_system 01.12.2018 SAC 10