Ajánló rendszerek
Az ajánló rendszereknek már több mint egy évtizedes kutatási története van, de csak napjainkban kezdenek beépülni a hétköznapokba. Milyen területeken találkozhatunk velük napjainkban? Milyen alkalmazások képzelhetÅ‘k el segÃtségükkel a jövÅ‘ben? Egyetemi dolgozat.
A kutatókat és az internetes vállalkozásokat régóta foglalkoztatja az a kérdés, hogy hogyan lehet minél hatékonyabban eligazodni nagy méretű adathalmazokban. Ezen probléma feloldására az évtizedek során nagyon sok különbözÅ‘ megközelÃtésű javaslat született.
Az elsÅ‘ kézenfekvÅ‘ módszer a szabad szavas keresés volt, ám ennek jól használható megoldására is egészen a 90-es évek végéig kellett várni. A web linkstruktúráját kihasználva a Google PageRank technológiája lehetÅ‘vé tette a népszerűbb tartalmak kiemelését a többi közül, ami minÅ‘ségi ugrást eredményezett a keresésben. Azonban Ãgy is csak egy kereshetÅ‘ ranglistát kaptunk, ami egyáltalán nem veszi figyelembe személyes érdeklÅ‘désünket, és felveti azt a problémát is, hogy mi történik akkor, ha nem ismerjük a megfelelÅ‘ kulcsszavakat.
A keresÅ‘kkel párhuzamosan egy másik technológia is folyamatosan fejlÅ‘dött a 90-es évektÅ‘l, mely nem mindig igényli a felhasználó aktÃv részvételét a szűrési folyamatban. Az ajánló rendszerek a felhasználóról létrehozott profil alapján nyújtanak számára valószÃnűleg lényeges információt. Ezen rendszerek jelenlegi leghatékonyabb megvalósÃtása a közösségi szűrés (collaborative filtering), mely sok felhasználó profilja alapján von le következtetést az adott felhasználóra vonatkozólag.
A keresÅ‘k és a közösségi szűrés nem egymás ellenfelei, hanem hasznos kiegészÃtÅ‘i. Az utóbbi olyan tartalmakra hÃvhatja fel a figyelmünket, melyekre egyébként nem jutna eszünkbe keresÅ‘ kifejezést megfogalmazni. A dolgozatban a közösségi szűrés történetét, technikai hátterét és jövÅ‘beni lehetÅ‘ségeit tekintem át.
2. Első lépések
A közösségi szűrés területén az elsÅ‘ jelentÅ‘s publikáció Upendra Shardanand és Pattie Maes nevéhez fűzÅ‘dik, akik az MIT Media Lab munkatársai voltak. 1995-ös Ãrásukban egy Ringo névre keresztelt zenei ajánló rendszer készÃtése során megszerzett tapasztalataikat foglalják össze. A kÃsérleti projekt a kezdeti hibák után egyre jobb zenei ajánlatokat nyújtott, ami remekül mutatja a módszer erejét, hogy az ajánlatok annál pontosabbakká válnak, minél több felhasználó használja a rendszert. Itt tehát nem szembesülünk az informatika területén gyakori skálázhatósági problémával.
Bár ez volt a módszer első sikeres bemutatkozása, de hasonló ajánló rendszerek már korábban is léteztek. A University of Minnesota GroupLens csoportja már 1992 óta foglalkozik a közösségi ajánlás kutatásával, de MovieLens névre keresztelt filmes ajánló rendszerük nem ért el akkora sikert, mint a Ringo.
A technológia sokáig csak tudományos körökben terjedt, amikoris az Amazon.com online könyváruház alkalmazni kezdte webes felületén. Az áruház minden egyes termékének lapján megjelent azon termékek listája, melyeket sokan vásároltak meg az aktuális termékkel együtt. Az új funkció hamarosan rendkÃvül népszerű lett, Ãgy a cég további ajánló szolgáltatások kifejlesztésébe fogott. Ma már teljesen személyre szabott ajánlatokat is kaphatunk a termékekhez kapcsolt ajánlatok mellett.
Elsőként tehát az internetes áruházak vették hasznát az új technológiának, de napjainkban már más környezetben is sikerrel alkalmazzák. Mielőtt azonban ezekre részletesen kitérnénk, vizsgáljuk meg a módszer technikai hátterét.
3. Technikai háttér
A keresÅ‘k egyik nagy hátránya, hogy szövegen alapulnak, Ãgy nehezen alkalmazhatók nem szövegalapú tartalmak esetén. A közösségi szűrés ezzel szemben objektumok közti kapcsolatok rendszerébÅ‘l vonja le a következtetést, Ãgy könnyedén alkalmazható zenék vagy videók esetén is.
Vegyünk egy egyszerűsÃtett modellt: egy páros gráf bal oldalon levÅ‘ csomópontjai felhasználókat, a jobb oldalon lévÅ‘k valamilyen terméket (pl. könyv, zene, film) jelölnek. Egy felhasználó és termék között akkor fut él, ha a felhasználó szereti az adott terméket. EbbÅ‘l a hálózatból levonhatjuk azt a következtetést, hogy ha A, B és C felhasználó ugyanazt az 5 terméket kedveli, és van egy 6. termék, amit A és B kedvel, de C nem ismeri, akkor azt a terméket ajánlhatjuk C-nek, hiszen valószÃnűleg kedvelni fogja. Az elv lényege hétköznapi módon valahogy Ãgy fogalmazható meg: Akik a múltban gyakran egyetértettek, azok valószÃnűleg a jövÅ‘ben is egyet fognak érteni.
Természetesen a valós megoldásokban használt gráfok az elÅ‘bbinél sokkal bonyolultabbak. Az egyes éleknek különbözÅ‘ (akár negatÃv) súlya lehet, ezzel sokkal finomabb különbségek is jól modellezhetÅ‘k. A módszer egy matematikai hasonlóság-függvényt definiál az objektumok között, amely lehetÅ‘séget ad felhasználó-felhasználó és termék-termék közötti hasonlóság meghatározására is, mint ezt az Amazon oldalán is tapasztalhatjuk.
Komoly kihÃvást jelent az ajánlások alapjául szolgáló gráf felépÃtése. Mint már korábban láttuk, az ajánlások annál pontosabbak, minél több felhasználót és terméket tartalmaz a rendszer, és az is fontos, hogy az élek száma sokszorosa legyen az objektumok számának. A Ringo és MovieLens projektekben úgy hozták létre a kezdeti adatbázist, hogy különbözÅ‘ levelezÅ‘listákon embereket kértek meg az adott zenészek illetve filmek értékelésére. Ez a módszer meglehetÅ‘sen kis adatmennyiséget biztosÃtott, hiszen a felhasználók aktÃv részvételét igényelte, véleményüket explicit módon adták meg. Ennél sokkal több adat beszerzésére is lehetÅ‘ség van, amennyiben az adatokat implicit módon, a felhasználó viselkedését figyelve gyűjtjük össze. Az Amazon ennek megfelelÅ‘en a vásárlási adatokra épÃtette elsÅ‘ rendszerét, más cégek a még több adat reményében a felhasználók oldalletöltési szokásait is figyelni kezdték. Ha egy felhasználó többször megtekinti egy termék adatlapját, akkor valószÃnűleg tetszik neki a termék, Ãgy ezt a tudást is felhasználhatjuk az ajánlatok számÃtásánál.
Bár az adatok implicit gyűjtése sokkal nagyobb adathalmazt eredményez, azonban ezen adatok kevésbé megbÃzhatóak. A böngészést végezhette a felhasználó egyik családtagja, vagy az is lehet, hogy csak ajándékot keresett egy teljesen más érdeklÅ‘désű ismerÅ‘se számára. Ezért hasznos lehet, hogyha az ajánló rendszer lehetÅ‘séget biztosÃt az implicit adatok explicit felülbÃrálására, Ãgy a két megközelÃtés remekül kiegészÃti egymást.
Pages: 1 2