Binarna waga słów
Binarna waga słów — najprostszy schemat (metoda) określania relatywności dokumentu względem termu (zadanej frazy, słowa)[1][2].
Określa współczynnik wij=1 lub wij=0[1][2][3],
- wij oznacza słowo i w dokumencie j z kolekcji dokumentów;
Mówiąc ogólnie metoda ta daje jedynie informacje czy dane słowo w występuje w dokumencie i czy też nie i nadaje współczynnikowi wij odpowiednią wartość[1][2][3][4]:
Wagi są przypisywane do terminów w pliku indeksu. Metoda ta jest wykorzystywana przez najprostsze wyszukiwarki, które stwierdzają jedynie występowanie słowa w zaindeksowanym dokumencie. Im bardziej wyrafinowana wyszukiwarka, tym bardziej złożony schemat ważenia[5].
Przypisy
- 1 2 3 R.N. Rathi, A. Mustafi, The importance of Term Weighting in semantic understanding of text: A review of techniques, „Multimedia Tools and Applications”, 82 (7), 2023, s. 9761–9783, DOI: 10.1007/s11042-022-12538-3, ISSN 1380-7501, PMID: 35437420, PMCID: PMC9007265 [dostęp 2024-09-10] (ang.).
- 1 2 3 Text Clustering using bursty information
- 1 2 Introduction to Information Retrieval
- ↑ Term Weighting and the Vector Space Model Information Retrieval Computer Science Tripos Part II
- ↑ How a Search Engine Works [online], www.infotoday.com [dostęp 2024-07-25].