W internecie jest wiele cennych i potrzebnych informacji. Ale stron www
jest tak wiele, że często trudno jest dotrzeć do właściwych i wiarygodnych stron.
Trudno jest ustalić ile jest w sieci witryn, portali i stron – łatwiej określić liczbę
domen i serwerów. Według badań NEC Research Institute w 1999 roku istniało
800 milionów stron www. W 2002 roku wyszukiwarka Google przechowywała
w swoich bazach danych ponad 2 miliardy odnośników, a w 2005 było ich już 8
miliardów. Najlepiej jeżeli znamy dokładny adres strony z poszukiwanymi
wiadomościami, ale niestety tak jest rzadko. Wtedy należy posłużyć się
dostępnymi narzędziami służącymi do wyszukiwania informacji.
Wyszukiwanie internetowe
Wyszukiwarka internetowa (ang. search engine) to program lub strona
internetowa, której zadaniem jest ułatwienie użytkownikom internetu znalezienie informacji w sieci.
Określenie wyszukiwarka stosujemy do:
• stron internetowych serwisów wyszukujących - czyli implementacji
oprogramowania wyszukującego działającego z interfejsem WWW
ogólnodostępnym dla internautów
• oprogramowania przeznaczonego do indeksowania i wyszukiwania
informacji w sieciach komputerowych: internecie, intranecie.
Wyszukiwarki tworzą automatycznie swoje bazy danych o witrynach.
Można podzielić je na te oparte na analizie treści strony (tekstowe) oraz oparte na analizie topologii sieci.
Wyszukiwarki tekstowe przeszukują internet analizując zawartość stron.
Kiedy użytkownik poda zapytanie, wyszukiwarka odpowie mu łączami do stron,
które uzna, w zależności od użytego algorytmu, za najbardziej odpowiednie.
Algorytmy te polegają na informacjach podanych w kodach stron, np. na
podanych tytułach, nagłówkach i słowach kluczowych. Są zatem bardzo podatne
na nadużycia, przez co użytkownik zamiast użytecznych informacji dostaje linki
na strony nie mające nic wspólnego z jego zapytaniem.
Katalogi stron internetowych
Jest to jeden z rodzajów organizacji adresów i kategoryzacji stron
internetowych. Są to często moderowane ręcznie, grupowane tematycznie,
zbiory adresów internetowych.
Autorzy stron lub inne osoby zgłaszają swoje strony do katalogów, zazwyczaj
z krótkim opisem, po czym, zwykle po przejrzeniu, strona zostaje wpisana na
listę pod danym hasłem.
Katalog stron jest strukturą drzewiastą: witryny przypisane są, ze względu na
swoją zawartość do poszczególnych kategorii, które dzielą się na kategorie
podrzędne.
Obecnie najbardziej znane to:
• polska część Open Directory Project
• Katalog Onet.pl http://katalog.onet.pl
• Wirtualna Polska http://katalog.wp.pl
• Katalog WOW http://www.wow.pl
• Hoga http://www.hoga.pl
Formułowanie pytań wyszukiwarek
Różne wyszukiwarki dysponują różnymi rodzajami zapytań, jednak pewne
zasady są wspólne dla wszystkich narzędzi wyszukujących. Ich znajomość
przyspieszy wyszukiwanie właściwych treści. Przedstawione zapytania
niejednokrotnie można ze sobą łączyć co daje jeszcze lepsze efekty.
Konieczność występowania wyrazu lub nie
Możliwość dają nam dwa znaki + i – koniecznie ze spacją przed
znakiem. Pierwszy wymusza wyświetlenie stron, które muszą zawierać wyraz
poprzedzony +. Drugi zaś wyklucza strony zawierające dane słowo. Czasem
przydaje się, gdy słowo ma kilka znaczeń. Np. gdy szukamy informacji
o protokołach sieciowych możemy podać zapytanie: protokół –dyplomacja.
A zapytanie Wojna Światowa +I zapewni nam informacje o I Wojnie.
Wyszukiwanie frazy
Wpisanie do wyszukiwarki dwóch słów np. program nauczania spowoduje
wyświetlenie stron zawierających słowo program i witryn zawierających wyraz
nauczania oraz tych, które zawierają oba słowa. Gdy oba wyrazy umieścić
w cudzysłowie, otrzymamy listę zawierającą adresy stron, które w swoim tekście
posiadają dwa słowa obok siebie i to w pożądanej kolejności.