TFIDF
Z Wikipedii
TFIDF (ang. TF – term frequency, IDF – inverse document frequency) - ważenie częstością termów - odwrotna częstość w dokumentach - jedna z metod obliczania wagi słów w oparciu o liczbę ich wystąpień, należąca do grupy algorytmów obliczających statystyczne wagi termów. Każdy dokument reprezentowany jest przez wektor, składający się z wag słów występujących w tym dokumencie. TFIDF informuje o częstości wystąpienia termów uwzględniając jednocześnie odpowiednie wyważenie znaczenia lokalnego termu i jego znaczenia w kontekście pełnej kolekcji dokumentów.
Algorytm stosowany jako metoda oceny relatywności dokumentu w wyszukiwarkach internetowych, kolejnym zastosowaniem jest ocena podobieństwa dokumentów w systemach grupowania wyników oraz systemach typu antyplagiat.
Wartość TF-IDF oblicza się ze wzoru:

- gdzie:
[edytuj] Zobacz też
[edytuj] Linki zewnętrzne
| Gazeta oznaczyła psie odchody na Polu Mokotowskim |
|
Bezpłatny dwudnik "Echo Miasta" (Media4Mat) przeprowadził w sobotę na warszawskim Polu Mokotowskim akcję "Zobacz, co robi Twój pies".
|
| Antyradio znowu zmienia poranny program |
|
Od dziś poranne pasmo w sieci Antyradio (Eurozet) prowadzi Mariusz Smolarek. To trzecia zmiana w tym programie od pół roku.
|
| "Telewizja Puls przyspiesza o godzinÄ™" |
|
W sobotę ruszyła kampania pod hasłem "Telewizja Puls przyspiesza o godzinę".
|
| Sondaż: TVN inteligentne, TV Trwam aroganckie |
|
TVN to najinteligentniejsze i najbardziej odpowiedzialne spoÅ‚ecznie medium, a Radio Maryja – najbardziej aroganckie – wynika z badaÅ„ firmy BAV Consulting.
|
| "Wprost": kolejni dziennikarze odchodzÄ… |
|
Pięciu dziennikarzy działów Polska wydarzenia i Polska społeczeństwo w tygodniku "Wprost" (AWR "Wprost") złożyło w piątek wypowiedzenia. To kolejne osoby z zespołu zajmującego się tematyką krajową, które rozstają się z tygodnikiem.
|
