Zlatá množina je množina dopytov a dokumentov, ktoré už odborníci na témy označili ako relevantné. Používa sa na porovnávanie výkonu vyhľadávania reprezentujúceho obsah, ktorý sa bude pravidelne vyhľadávať.
Zlatá množina sa používa ako prahová hodnota na hodnotenie výkonu vyhľadávacích nástrojov, systémov na vyhľadávanie informácií a iných typov systémov na odporúčanie obsahu.
Zlatá množina je obzvlášť cenná v situáciách, kde je kvalita výsledkov vyhľadávania dôležitá, ako napríklad v zdravotníctve alebo právnom výskume, kde presné informácie môžu mať významné dôsledky.
Zlatý súbor je starostlivo zostavený tak, aby reprezentoval typy dopytov a dokumentov, ktoré sa zvyčajne vyskytujú v konkrétnej doméne. To zaisťuje, že hodnota je relevantná a užitočná na hodnotenie výkonnosti vyhľadávacích nástrojov alebo iných systémov na vyhľadávanie informácií.
Použitie zlatej množiny je štandardizovaný spôsob merania výkonu vyhľadávacích nástrojov alebo iných systémov odporúčaní obsahu, čo umožňuje priame porovnanie medzi rôznymi systémami. Môže sa tiež použiť na identifikáciu oblastí na zlepšenie, ako aj na sledovanie pokroku systému v priebehu času.
Okrem toho, že je to užitočný nástroj na vyhodnocovanie výkonu vyhľadávania, zlatú sadu možno použiť aj na trénovanie modelov strojového učenia, ako sú modely používané pri spracovaní prirodzeného jazyka a získavaní informácií.
Poskytnutím sady označených údajov možno zlatú sadu použiť na trénovanie algoritmov na presnú klasifikáciu dokumentov a dopytov, čím sa zlepší celkový výkon systému.