Z našich údajov vyplýva, že keď ľudia hľadajú určitý produkt, väčšina z nich pri vyhľadávaní použije približne 1,5 slova. Tieto krátke dopyty, bohužiaľ, sťažujú zobrazovanie relevantných výsledkov fulltextového vyhľadávania. Pomôcť by mohlo používanie filtrov, ale tých je zvyčajne tak veľa, že bývajú, naopak, mätúce. Jedným zo spôsobov ako zefektívniť vyhľadávanie, je metóda learning to rank, ktorá vytvára optimálne poradie výsledkov vyhľadávania. Ani táto metóda strojového učenia však nie je všemocná, a preto sme prišli s Query Understanding, ktorá learning to rank výborne doplní.
Fulltextové vyhľadávanie je výborným nástrojom pri používaní dlhších dopytov, povedzme, štyri alebo viac slov, alebo skutočne špecifických fráz, ako je napríklad produktový kód. V týchto prípadoch fulltextové vyhľadávanie skutočne dokáže nájsť to, čo hľadáme a umiestniť to na prvú pozíciu, alebo zobrazí stránku bez výsledkov. Oba prípady sú lepšie než keby vyhľadávanie ponúklo celý zoznam nerelevantných produktov, čo sa často stáva pri použití kratších dopytov bez špecifických fráz.
Ako v skutočnosti funguje vyhľadávanie
Takto v skutočnosti vyhľadáva väčšina ľudí. Podľa našich zozbieraných údajov ľudia v priemere používajú 1,43 slova na dopyt (so štandardnou odchýlkou +/- 0,58, vypočítaná na základe údajov od našich 150+ najaktívnejších klientov) a aj keď máme mnohých klientov, u ktorých sa vyskytujú dopyty iba s produktovými kódmi (to závisí od domény), medián dopytov iba s použitím produktového kódu je iba 2,9 %.
Ľudia často používajú krátke, nešpecifické dopyty, ktoré sa stávajú základným kameňom úrazu pre fulltextové vyhľadávanie. Nevýhody takéhoto vyhľadávania sú rovnaké ako jeho výhody – dokáže nájsť akúkoľvek zhodu s dopytom, a to doslova kdekoľvek. Popritom však bežne nájde aj množstvo nesúvisiacich výsledkov, v ktorých je ťažké sa zorientovať.
Ako by sa k tomu mali e‑shopy postaviť?
Na to existuje technológia learning to rank. Táto metóda je založená na strojovom učení, výsledkom priraďuje číselné hodnoty, ktoré predstavujú ich relevantnosť a následne ich zoradí podľa kombinácie ľudského správania a fulltextových metrík, vďaka čomu vo výsledku ponúkne optimálne poradie výsledkov vyhľadávania. V Luigi’s Boxe túto metódu už používame v produktoch vyhľadávania.
Postupne sme však zistili, že aj keď je learning to rank skvelá technológia, nepredstavuje komplexné riešenie na všetky problémy spojené s vyhľadávaním. Nedokáže totiž zozbierať dostatok údajov pre dopyty, ktoré sa vyskytujú menej často, napríklad len raz za mesiac. Existuje však veľa domén, ktoré majú veľké množstvá práve takýchto, menej častých dopytov a potrebujú na ne správne riešenie.
Riešením by bolo viesť používateľov k tomu, aby viac používali filtre, aby sa počet výsledkov vyhľadávania zúžil na základe určitých parametrov, ktoré ich zaujímajú. Ak sa však zameriame na filtre, znova sa otvárajú nespočetné možnosti. Jeden z našich klientov má napríklad viac ako 2 000 rôznych parametrov (podľa produktovej kategórie) a takmer 19 000 rôznych hodnôt pre tieto parametre. Je v podstate nemožné vytvoriť intuitívne a jednoduché rozhranie pre všetky z nich.
Query Understanding
My sa snažíme tento problém riešiť tak, že identifikujeme zámer používateľa pri vyhľadávaní a premeníme čo najviac fráz z dopytu na kľúčové filtre. Napríklad, ak používateľ zadá „otvorené slúchadlá“, automaticky rozoznáme filter Otvorený akustický systém, ktorý je inak bežne dostupný cez štandardné fazetové rozhranie a informujeme používateľa, že tento filter môže neskôr vypnúť, ak by si to rozmyslel. Takto dokážeme spracovať všetky z tisícok dostupných parametrov, rozpoznať a ak systém rozozná túto potrebu, následne zapnúť aj také filtre, ktoré inak pre používateľov nie sú dostupné.
Ako v skutočnosti funguje vyhľadávanie
Takto v skutočnosti vyhľadáva väčšina ľudí. Podľa našich zozbieraných údajov ľudia v priemere používajú 1,43 slova na dopyt (so štandardnou odchýlkou +/- 0,58, vypočítaná na základe údajov od našich 150+ najaktívnejších klientov) a aj keď máme mnohých klientov, u ktorých sa vyskytujú dopyty iba s produktovými kódmi (to závisí od domény), medián dopytov iba s použitím produktového kódu je iba 2,9 %.
Ľudia často používajú krátke, nešpecifické dopyty, ktoré sa stávajú základným kameňom úrazu pre fulltextové vyhľadávanie. Nevýhody takéhoto vyhľadávania sú rovnaké ako jeho výhody – dokáže nájsť akúkoľvek zhodu s dopytom, a to doslova kdekoľvek. Popritom však bežne nájde aj množstvo nesúvisiacich výsledkov, v ktorých je ťažké sa zorientovať.
Špeciálny, no v skutočnosti dosť častý prípad je, keď ľudia hľadajú kategóriu. V tom prípade ich presmerujeme na stránku kategórie, teda na (často) stránku, ktorú e‑shop manuálne upravil a pridal na ňu súvisiaci obsah, ako sú bannery, propagácie, atď. Tak sa klientovi zobrazia relevantné výsledky a vaše aktuálne ponuky!
Naša nová funkcia, Query Understanding, momentálne dokáže rozoznať kategórie, značky a produktové parametre, čo pomáha zákazníkom získať relevantnejšie výsledky pre krátke dopyty. Je k dispozícii pre všetkých našich zákazníkov, potrebujeme len štruktúrované informácie o vašich produktoch. Prečo to neskúsiť?
Barbora v Luigi's Boxe ako odborníčka na produktový marketing čaruje so slovami. Písaniu sa začala venovať už počas štúdia na vysokej škole ako dobrovoľníčka pre rôzne občianske združenia. Okrem toho, že je súčasťou tímu Luigi's Boxu, spoluorganizuje konferenciu TEDxBratislava, kde má na starosti marketing a PR.
Viac príspevkov od tohto autora