Stop listy
Z Wikipedii
Stop-Lista (ang. Stop-Words) - lista odrzucanych słów.
Eliminacja słów o małym znaczeniu (spójniki: i, oraz, lub) oraz słów popularnych (mp3, sex) czyli wszystkich należących do grupy słów nie wpływających na identyfikację dokumentu. Stosowane w wyszukiwarkach w celu zredukowania wielkości zbiorów.
Listy takie można utworzyć dla określonej dziedziny lub dla określonego języka. Istnieją stop–listy dla języka angielskiego, zawierające ok. 450 słów.
Usuwanie wyrazów nieznaczących z tekstu może się odbywać w następujący sposób:
- słownikowy - z tekstu usuwane są wyrazy wymienione w specjalnym słowniku.
- statystyczny - z tekstu usuwane są wyrazy, których częstość występowania znajduje się w założonym przedziale.
- hybrydowy - połączenie powyższych technik.
| 4000 GB w zsypie |
|
Serwer, z którego nielegalnie można było pobrać 4000 gigabajtów nielegalnych gier, filmów, muzyki i programów zabezpieczyli policjanci z KWP. Administratorowi i właścicielowi serwera grozi do pięciu lat więzienia.
|
| Społecznościowy antywirus? |
|
Czy możliwe jest wykorzystanie potencjału społeczności internetowych, lub użytkowników sieci do ochrony komputera przed zagrożeniami płynącymi z sieci? Producent oprogramowania antywirusowego, Panda Security, właśnie takie rozwiązania planuje wprowadzić w swoich najnowszych produktach.
|
| Mozilla aktualizuje Thunderbird'a |
|
W ostatnią środę Mozilla udostępniła na swoich serwerach najnowszą wersję programu pocztowego Thunderbird 2.0.0.16, wzbogaconą o dziewięć zasadniczych poprawek.
|
| Internetowy tablet z Firefoksem |
|
Michael Arrington planuje stworzyć stylowy tablet, który służyć ma wyłącznie do surfowania w internecie.
|
| Wielofunkcyjna stacja dokujÄ…ca |
|
Stacje dokujące i huby USB to urządzenia przygotowane z myślą o osobach, którym ciągle brakuje gniazd przyłączeniowych.
|