Jak prowadzony jest ranking trafności

Aby dokonać takiego sortowania według trafności, bierze się pod uwagę wiele czynników. Podstawowe mechanizmy rankingu trafności można zidentyfikować, mimo że dostawcy komercyjni zwykle nie ujawniają, w jaki sposób dokładnie uwzględnia się te czynniki. Jednym z kluczowych elementów są metadane bibliograficzne: dane formalne, takie jak tytuły, podtytuły, nazwiska autorów, identyfikatory i słowa kluczowe, są analizowane i klasyfikowane dla każdego zapytania. System wyszukiwania ocenia częstotliwość występowania wyszukiwanego hasła w metadanych oraz pozycję wyszukiwanego hasła w publikacji. Jeśli wyszukiwane hasło brzmi na przykład „zmiany klimatyczne”, dokument zawierający wyszukiwane hasło w tytule będzie miał wyższą pozycję w rankingu w porównaniu z dokumentem, w którym termin ten pojawia się jedynie w streszczeniu.

Jednak o rankingu nie decyduje tylko wygląd i pozycja słowa w tytule, streszczeniu czy pełnym tekście. Uwzględniona zostanie również częstotliwość występowania terminu w metadanych lub w pełnym tekście. Im częściej wyszukiwane hasło pojawia się w metadanych, abstrakcie i pełnym tekście, tym więcej punktów trafności zostanie przypisanych dokumentowi przez algorytm. Jeśli pełny tekst artykułu zostanie udostępniony w otwartym dostępie, można przeszukiwać szerszy zakres słów, co poprawia ranking trafności. Punkty są sumowane, a dokumenty odpowiednio uszeregowane.

W zależności od technologii wyszukiwarki, wiele innych czynników, takich jak rok publikacji – niedawno opublikowane artykuły i książki są uważane za bardziej istotne i dlatego zajmują wyższą pozycję w rankingu – cytaty i poglądy w stosunku do całkowitej liczby znalezionych dokumentów oraz współczynnik wpływu czasopisma mogą również mieć wpływ na ranking.