Sisteme de recomandare 2

Slides:



Advertisements
Similar presentations
Adobe photoshop.  De multe ori ne facem fotografii si unele nu le facem publice pentru ca ori am avut un cos in acel moment sau un alt aspect negativ.
Advertisements

 Ce e bravenet.COM ?  De ce bravenet.COM ?  Avantaje si dezavantaje in folosirea bravenet.COm Grupa 6: Lucian-Eduard Barticel Eduard Giurgiu Iany Ionut.
Aplicatie pentru intarirea capacitatii manageriale Coriolis Consulting pentru INCD-PM Alexandru Darabont.
Cum sa-i tii pe pagina ta Bobby Voicu. Mai intai de toate… … e bine sa ai: Un plan de dezvoltare al site-ului Un plan de promovare Un plan de management.
PROGRAMUL CADRU 7 Cum să folosim facilitatea CORDIS: “Search for partners”
Display Advertising ARBOsocial Departament SEM in structura ARBOinteractive Dezvoltarea si management ul campaniilor CPC prin: Principalul sistem de.
Batalia sexelor O lume dominata de barbati vs o lume dominata de femei.
Present Perfect Continuous prezentare. schema Afirmativ: S + have/has + been + V-ing… Negativ: S + have/has + not + been + V-ing… Interogativ: have/has.
Training utilizare portal UBB Profesori Trainer: Anna-Maria Grecu Cluj-Napoca, iunie 2011.
Present Perfect Simple prezentare. Schema de formare: Afirmativ: S + have/has + V(III)/ V(-ed)… Negativ: S + have/has + not + V(III)/ V(-ed)… Interogativ:
Februarie 2018 ASE Bucuresti
ACTIVITATEA 1 -,, PROFESOR IT LA PAPI’’
Subinterogări multiple
Subinterogari.
Funcţii Excel definite de utilizator (FDU) în VBA
Instrumente CASE Curs nr. 7.
Căutarea şi regăsirea informaţiei.
Dispozitive de stocare
Arhitectura serviciilor web
Mihai Dumitru, Decembrie ‘09
Ionuț Dobre SSA Value co-creation from the consumer perspective Steve Baron Gary Warnaby Ionuț Dobre SSA
Căutarea şi regăsirea informaţiei.
Conducător ştiinţific: Conf. Dr. ing. Ştefan Stăncescu
Paxos Made Simple Autor: Puşcaş Radu George
Gestionarea datelor stiintifice
CURSUL 4 ECONOMETRIE TESTUL HI PATRAT.
Retele de calculatoare
SCIENCEDIRECT TRAINING
Reflexia luminii.
METODA BACKTRACKING Examenul de bacalaureat 2012
Cursul 3 Cautare peste siruri problema cautarea naiva
Algoritmi de combatere a congestiei
Generarea modelelor fractale
CONVERSII INTRE SISTEME DE NUMERATIE
Macromedia Flash 8 Ciobanu Razvan | Cls a IX-a A
WebSite Social Tema 2 WebSite Social.
Problema rucsacului lacom
Tipuri structurate Tipul tablou
SUBNETAREA.
Conferința Națională de Risk Management
Search Engine Optimization
Web Form BuilDer Coffee Cup.
Future Simple prezentare.
Algoritm de crawling optimizat pe similaritate în documente HTML
Formatarea paragrafului
Funcții C/C++ continuare
prof. mrd. Negrilescu Nicolae Colegiul National Vlaicu Voda
Apache WEB Server.
INTERNET SERVICII INTERNET.
PRELUCRARI SPECIFICE TABLOURILOR BIDIMENSIONALE
Eclipsele de soare si de luna
Forms (Formulare).
A great way to create a channel of communication
Cursul 9. SEO (Promovarea site-urilor web)
Functia de documentare
Raspunsul la frecventa
Folosirea de către companii a Twitter, Facebook şi LinkedIn
Configurarea, deployment-ul automat si testarea serviciilor
Sisteme de recomandare
Cum să particularizați Microsoft SharePoint Site web online
Planificarea proceselor
Software open source in industria software
Crearea unei aplicatii Windows Forms simple
Student:Dvornic Mihaela Grupa:342 C5
Sisteme de recomandare cu filtrare colaborativa
Review blog culianu.wordpress.com
Implementarea listelor simplu inlantuite
Harti de imagini, Cadre, Stiluri
Despre lamaie.net De ce sunt lamaile acre? Realizatori: Cristina Cazan
Tabele WEB.
Presentation transcript:

Sisteme de recomandare 2 Razvan Stoenescu, Alexandru Marinescu, Ioana Mihaela Mihalache, Marin Ilinca, Marius Airinei,

   

   

k-Nearest Neighbor Marius Airinei   Pattern recognition  simplitate in implementare  utilizat cu succes in sistemele de recomandare

Etapele algoritmul kNN   determinarea parametrului K calcularea dinstantelor intre item-ul cautat si celelalte elemente sortarea distantelor si alegerea primelor K elemente  adunarea valorilor din elementele selectate  atribuirea itemului valoarea medie a sumei elementelor selectate

Utilizare kNN  

Optimizari metode pentru gasirea distantelor intre elemente introducerea de parametri care evidentiaza cantitatea de informatie adusa de un element metode de a selecta parametrul K

Algoritmi utilizati in motoarele de cautare   1. PageRank 2. SimRank 3. HITS 4. Linkuri catre alti algoritmi

Algoritmul PageRank 1. Se stabileste setul de pagini 2. Se acorda PR egal tuturor paginilor 3. Se calculeaza PR dupa una din formulele:   unde d este un indice ce se presupune a avea valoarea 0.85, N este numarul de pagini din set, iar L(X) reprezinta numarul de linkuri externe ale paginii X.

Algoritm PageRank (2) Exemplu versiune simplificata:   Fie 4 pagini A, B, C si D. Initializam valorile:  PR(A) = PR(B) = PR(C) = PR(D) = 0.25    --adica 1/n   (1/4) Fie ca paginile B, C si D sa aiba link catre A. Atunci: PR(A) = PR(B) + PR(C) + PR(D) = 0.75. Fie ca pagina B sa aiba link catre C, iar D catre toate celelalte 3. Atunci am avea: PR(A) = PR(B)/2 + PR(C)/1 + PR(D)/3 =                0.125 + 0.25 + 0.083 = 0.458

Algoritmul SimRank SimRank este un algoritm folosit pentru a desemna documente/obiecte asemanatoare. Spre exemplu, atunci cand se incearca o cautare pentru un document asemanator. Acest algoritm poate conduce spre posibilitatea de a clusteriza obiectele. Un exemplu este Yahoo! Search, unde avem in bara din stanga rezultatele cautarii organizate pe categorii.

Algoritmul SimRank (2) Notatii: I(a) - numar linkuri catre pagina a   Notatii: I(a) - numar linkuri catre pagina a           O(b) - numar linkuri dinspre pagina b (external links) s(a, b) - valoarea ce denota similaritatea dintre paginile a si b Apar probleme cand I(a) = 0, deoarece s(a, X) va fi 0, oricare X. Rezolvare:

HITS (Hubs and authorities) HITS este un algoritm de analiza a linkurilor care evalueaza paginile Web prin doua valori:    authority value (estimeaza valoarea continutului efectiv al paginii) hub value (pentru a estima „greutatea” linkurilor catre alte pagini)

HITS (2) - Algoritmul Fiecare nod va avea authority value si hub value egale cu 1. Ruleaza regula de update pt authority value Ruleaza regula de update pt hub value Normalizeaza valorile impartind fiecare hub value prin suma tuturor patratelor tuturor valorilor hub Normalizeaza analog si valorile authority Repeta de la etapa a II-a daca este necesar   G := set of pages for each page p in G do   p.auth = 1 // authority value   p.hub = 1 // hub value function HubsAndAuthorities(G)   for pas from 1 to k do     for each page p in G do       for each page q in p.inLink do         p.auth += q.hub     for each page p in G do       for each page r in p.outLink do         p.hub += r.auth

Linkuri utile: 1. http://en.wikipedia.org/wiki/PageRank 2. http://en.wikipedia.org/wiki/SimRank 3. http://en.wikipedia.org/wiki/HITS_algorithm 4. http://en.wikipedia.org/wiki/Hilltop_algorithm 5. http://en.wikipedia.org/wiki/TrustRank 6. http://en.wikipedia.org/wiki/Topic-Sensitive_PageRank 7. http://en.wikipedia.org/wiki/EigenTrust

Filtrare colaborativa vs. Comportament real-time     Filtrarea colaborativa (Collaborative filtering) este procesul de filtrare de informatii folosind tehnici care implica o colaborare între mai multi factori :      - agenti     - puncte de vedere     - surse de date, etc.

Filtrare colaborativa (1)     Sistemele ce folosesc filtrarea colaborativa, de regula, au doua etape :     1. Cauta utilizatori a caror evaluari seamana cu evaluarea utilizatorului curent.     2. Utilizeaza ratingul de la utilizatorii identificati la punctul 1 pentru a calcula o predictie pentru utilizatorul activ.

Filtrare colaborativa (2)     O alternative la aceasta metoda a fost propusa si promovata de Amazon : filtrarea bazata pe obiect.     1. Inregistreaza aseamanarile dintre fiecare doua obiecte.     2. Foloseste relatiile dintre obiecte si preferintele utilizatorului current pentru a face predictiile.    

Baytone - real-time behavior     Sistemul de recomandare real-time acorda o pondere mult mai mica istoricului unui utilizator, paginilor vizitate si produselor cumparate in trecut de acesta.     Actiunile urmarite includ :      - pagini de start,      - interogari,      - miscarea mouse-ului,      - timpul petrecut pe o pagina,      - comportamentul comunitatii

Influenţa în sistemele de recomandare   măsură a efectului unui utilizator în ceea ce priveşte recomandările tool puternic pentru înţelegerea funcţionării unui sistem de recomandare modalităţi de măsurare propuse bazate pe algoritmi mai multe tipuri de metrici

Metrica influenţei bazată pe conexiunile dintre utilizatori  se urmăreşte comportamentul vecinilor  se selectează primii k vecini care au dat rating itemului m

Observarea influenţei unui utilizator(1) se exclude din reţeaua socială utilizatorul respectiv se calculează modificările care au loc in predicţie datorită excluderii utilizatorului se calculează NPD ui(Number of Prediction Differences) NPD ui spune de câte ori se va schimba predicţia datorită eliminării

Observarea influenţei unui utilizator (2) NPD ui reprezintă nivelul infleunţei unui utilizator costisitoare din punct de vedere al timpului soluţie alternativă : NUPD ui NUPD ui: numărul de utilizatori unici a căror predicţie se schimbă cu cel puţin pragul atins în momentul eliminării

Concluzii influenţa poate varia de la un utilizator la altul chiar dacă au dat acelaşi număr de ratinguri numărul de opinii - componentă importantă a influenţei metrica propusă - NUPD - independentă de algoritmi

Va multumim pentru atentie! întrebari ?