Prawa autorskie

2019/11/11

Pozyskiwanie informacji w internecie (2). Wyszukiwanie w TRYBIE PROSTYM, na przykładzie Google (Google hacking)


TRYB PROSTY - różne możliwości
  • Direct Answer, przykładowe pytania – 11 km na mile, 12 dolarów na euro, czas Lima, pogoda Kraków, zachód słońca Szczecin, ale także np. „information behavior”
  • Fraza (cudzysłów)
  • Google Search Graph
  • Operatory boolowskie (AND, OR, NOT)
  • Operatory (komendy) i znaki specjalne
  • Ustawienia języka i regionu i ich znaczący wpływ na wyniki wyszukiwania (na dole głównej strony Google po prawej – Ustawienia – Ustawienia wyszukiwania)


Boolean search / Boolean strings - fraza (cudzysłów) i operatory boolowskie (AND, OR, NOT)
  • Stosowanie cudzysłowu (frazy) = zawężanie wyników wyszukiwania. Jest spora różnica między rezultatami zapytań kompetencje cyfrowe i "kompetencje cyfrowe".  
  • Stosowanie operatora sumy (alternatywa, OR) = rozszerzanie wyników wyszukiwania
  • Stosowanie operatorów iloczynu (koniunkcja, AND) oraz różnicy (–, NOT) = zawężanie wyników wyszukiwania.
  • W Google AND nie piszemy – jest domyślne; zamiast NOT używamy minusa – (spacja przed, bez spacji po). A jak to jest w innych wyszukiwarkach globalnych? Warto sprawdzić w Bing, DuckDuckGo i Yahoo.
  • Operatory piszemy kapitalikami. Przed i po operatorach AND i OR są spacje.
  • Google wykonuje działania „po kolei”, ważna jest kolejność słów w wyrażeniu wyszukiwawczym.
  • W Google OR jest nadrzędne wobec domyślnego AND. Słowa lub frazy występujące bezpośrednio przed i po OR są automatycznie traktowane jako argumenty tego operatora. W różnych wyszukiwarkach może występować odmienne pierwszeństwo operatorów (kolejność wykonywania działań), zob. m.in. Operator Precedence w Bing.
  • Operatory boolowskie występują w wielu różnych systemach informacyjno-wyszukiwawczych – nie tylko w Google i innych wyszukiwarkach internetowych, ale także w bazach danych, kolekcjach cyfrowych itd.


Operatory (komendy) i znaki specjalne / x-ray search 

Google
Co robi?
Przykłady
 after
Ogranicza wyniki wyszukiwania do stron www/zasobów, które zostały zindeksowane po określonej dacie.
 „zarządzanie informacją” after:2018
 „zarządzanie informacją” after:2019-01-01
 allintitle, intitle
 allintitle nie da się łączyć z innymi operatorami
Ogranicza wyniki wyszukiwania do stron www/zasobów, które zawierają w tytule podane słowa lub frazy.
 intitle:”zarządzanie informacją”
 allinurl, inurl
 allinurl nie da się łączyć z innymi operatorami
Ogranicza wyniki wyszukiwania do stron www/zasobów, które zawierają w adresie URL podane słowa lub frazy.
 inurl:”zarządzanie informacją”
 before
Ogranicza wyniki wyszukiwania do stron www/zasobów, które zostały zindeksowane przed określoną datą.
 „zarządzanie informacją” before:2018
 „zarządzanie informacją” before:2019-01-01
 cache
Wyświetla zapisaną (zindeksowaną) przez Google ostatnią kopię danej strony – kopia z pamięci podręcznej Google.
To samo oferuje mała strzałka z prawej strony nazwy wyszukanego zasobu na liście wyników wyszukiwania.
 cache:www.uj.edu.pl
 filetype
Ogranicza wyniki wyszukiwania do plików w określonym formacie.
Za pomocą filetype można wyszukiwać następujące typy plików: csv, doc, docx, odt, kml, kmz, pdf, pps, ppt, pptx, rar, rtf, xls, xlsx i inne.
 filetype:pdf
 intext
Szuka słowa lub wyrażenia w treści dokumentu/strony.
 intext:”obiekty, procesy i zjawiska informacyjne”
 related
Wyświetla zasoby podobne/powiązane tematycznie ze wskazanym adresem URL.
To samo – w niektórych przypadkach – oferuje mała strzałka z prawej strony nazwy wyszukanego zasobu na liście wyników wyszukiwania.
 related:https://www.spi.org.pl/
 site
Ogranicza wyniki wyszukiwania do zasobów, które znajdują się w danej domenie internetowej. 
 "kompetencje informacyjne" site:wzks.uj.edu.pl
 „zarządzanie informacją” -site:.uj.edu.pl



 „……”
Szuka frazy dokładnie w podanym brzmieniu.
 „kompetencje informacyjne”
 *
Zastępuje dowolny wyraz.
 „najdroższy * w Polsce”
 ..
Określenie przedziału liczbowego.
 tablet 400..600 PLN
 @
Szuka w mediach społecznościowych.
 Cisek @SlideShare
 Cisek @LinkedIn
 #
Przeszukuje hashtagi.
 #ecil2018


Budowa wyrażenia wyszukiwawczego w Google:
  • Google nie bierze pod uwagę małych/wielkich liter,
  • Google uwzględnia maksymalnie 10 wyrazów w wyrażeniu wyszukiwawczym,
  • po komendzie jest dwukropek, potem – bez spacji – słowo lub fraza (w cudzysłowie),
  • w wyrażeniu wyszukiwawczym można łączyć różne komendy i operatory (oprócz allintitle i allinurl).


Brak komentarzy:

Prześlij komentarz