Zaawansowane wyszukiwanie i język zapytań. Język wyszukiwarki
Język zapytań jest sztucznie stworzonym językiem programowania używanym do tworzenia zapytań w bazach danych i systemach informatycznych.
Ogólnie rzecz biorąc, takimi metodami zapytania może byćklasyfikować, w zależności od tego, czy służą do bazy danych, czy do wyszukiwania informacji. Różnica polega na tym, że wnioski o takich usług są zobowiązani do zapewnienia faktycznych odpowiedzi na te pytania, a wyszukiwarka próbuje znaleźć dokumenty zawierające informacje dotyczące użytkownika jest zainteresowany w tej dziedzinie.
Bazy danych
Języki zapytań dla baz danych zawierają następujące przykłady:
- QL - obiektowe, odnosi się do relacyjnych baz danych; następca Datalogu.
- Kontekstowy (CQL) to formalny język reprezentacji zapytań dla systemów wyszukiwania informacji (takich jak indeksy stron internetowych lub katalogi bibliograficzne).
- CQLF (CODYASYL) - dla baz danych CODASYL-TYPE.
- Język zapytań zorientowanych na koncepcje (COQL) -jest używany w odpowiednich modelach (com). Opiera się na zasadach konstruowania modeli danych i wykorzystuje takie operacje jak projekcja i de-projekcja analizy wielowymiarowej, operacje analityczne i wnioski.
- DMX - używany do modeli wyszukiwania danych.
- Datalog to język zapytań do dedukcyjnych baz danych.
- Gellish English to język, który możeUżywany do zapytań w angielskich bazach Gellish i umożliwia prowadzenie dialogów (zapytań i odpowiedzi), a także służy do modelowania informacji wiedzy.
- HTSQL - tłumaczy żądania HTTP na SQL.
- ISBL - używany do PRTV (jeden z pierwszych systemów zarządzania relacyjnymi bazami danych).
- LDAP to protokół dla żądań i usług katalogowych, które działają przez TCP / IP.
- MDX jest wymagany w przypadku baz danych OLAP.
Wyszukiwarki
Język zapytań z koleima na celu wyszukiwanie danych w wyszukiwarkach. Różni się tym, że często żądania zawierają zwykły tekst lub hipertekst z dodatkową składnią (na przykład "i" / "lub"). Różni się znacznie od standardowych języków podobnych, które są regulowane przez ścisłe reguły składni komend lub zawierają parametry pozycyjne.
W jaki sposób są klasyfikowane zapytania?
Istnieją trzy szerokie kategorie, któreobejmują większość zapytań: informacje, nawigację i transakcje. Chociaż ta klasyfikacja nie została ustalona teoretycznie, została empirycznie potwierdzona obecnością rzeczywistych zapytań w wyszukiwarkach.
Żądania informacji to takie, któreobejmują szerokie tematy (na przykład konkretne miasto lub model ciężarówki), dla których można uzyskać tysiące istotnych wyników.
Nawigacja - to zapytania, które wyszukują jedną witrynę lub stronę internetową na określony temat (na przykład YouTube).
Transakcyjne - odzwierciedlają intencję użytkownika, aby wykonać określone działanie, na przykład dokonać zakupu samochodu lub zarezerwować bilet.
Wyszukiwarki często obsługują czwartątyp zapytania, który jest używany znacznie rzadziej. To tak zwane żądania połączeń, które zawierają rejestr połączeń internetowych indeksowanych grafiką (ilość linków do adresu URL zdefiniowany lub ile stron są indeksowane z danej dziedziny).
W jaki sposób odbywa się pobieranie informacji?
Większość zasobów wyszukiwania nie ujawnia ichdzienniki wyszukiwania, więc informacje, które użytkownicy wyszukują w Internecie, są bardzo trudne do znalezienia. Niemniej jednak pierwsze badania naukowe pojawiły się w 1998 roku. Później w 2001 r. Przeprowadzono badanie uzupełniające, w którym analizowano zapytania, które były wyświetlane jako bardzo istotne. Stało się również jasne, w jaki sposób wyszukiwarka używa języka zapytań.
Interesujące cechy związane z wyszukiwaniem w Internecie stały się znane:
Średnia długość zapytania wyszukiwania wynosiła 2,4 słowa.
- Około połowa użytkowników wysłała jedno żądanie, a nieco mniej niż jedna trzecia użytkowników tworzyła co najmniej trzy unikalne zapytania jeden po drugim.
- Prawie połowa użytkowników oglądała tylko pierwszą lub dwie strony wyników.
- Mniej niż 5% użytkowników korzysta z zaawansowanych funkcji wyszukiwania (na przykład do wyboru określonych kategorii lub wyszukiwania w wyszukiwaniu).
Funkcje niestandardowych działań
Badanie wykazało również, że 19% zapytańzawierał określenie geograficzne (na przykład nazwy, kody pocztowe, obiekty geograficzne itp.). Warto również zauważyć, że oprócz krótkich zapytań (czyli z kilkoma warunkami), często występowały przewidywalne schematy, według których użytkownicy zmienili wyszukiwane słowa.
Stwierdzono również, że 33% wniosków odjeden użytkownik powtarza się, a w 87% przypadków użytkownik kliknie ten sam wynik. Sugeruje to, że wielu użytkowników używa powtarzających się żądań do przeglądania lub ponownego wyszukiwania informacji.
Dystrybucje zapytań częstotliwościowych
Ponadto potwierdzili to specjaliścirozkłady częstotliwości zapytań odpowiadają prawu mocy. Oznacza to, że niewielka część słów kluczowych jest obserwowana na największej liście żądań (na przykład ponad 100 milionów) i są one najczęściej używane. Reszta fraz w tych samych tematach jest używana rzadziej i bardziej indywidualnie. Zjawisko to nazywa się zasadę Pareto (lub „80-20 regułę”), a to jest możliwe, aby korzystać z takich wyszukiwarek technik optymalizacji jak indeksowanie lub partycjonowania bazy danych, buforowanie i obciążenia wstępnego, a także okazją do doskonalenia języka zapytań w wyszukiwarkach.
W ostatnich latach okazało się, że średnia długośćliczba zapytań stale rośnie. Tak więc średnie zapytanie w języku angielskim stało się dłuższe. W związku z tym, Google wprowadził aktualizację o nazwie „Hummingbird” (sierpień 2013), który jest w stanie obsłużyć długie frazy wyszukiwania z żadnym protokołem „mówione” język zapytań (takich jak „Gdzie jest najbliższa kawiarnia?”).
W przypadku dłuższych zapytań stosowane jest ich przetwarzanie - są one podzielone na wyrażenia sformułowane w standardowym języku, a odpowiedzi na poszczególne części są wyświetlane oddzielnie.
Zapytania strukturalne
Wyszukiwarki, które wspierają logikęoperacje i składnia, użyj bardziej rozbudowanych języków zapytań. Użytkownik, który przeszukuje dokumenty obejmujące kilka tematów lub twarzy, może opisać każde z nich przez logiczną charakterystykę słowa. Zasadniczo język zapytań logicznych jest zbiorem określonych fraz i znaków interpunkcyjnych.
Co to jest wyszukiwanie zaawansowane?
Język zapytań "Yandex" i "Google" jest w stanieAby przeprowadzić bardziej zawężone wyszukiwanie pod pewnymi warunkami. Wyszukiwanie zaawansowane umożliwia wyszukiwanie części nazwy strony lub prefiksu nagłówka, a także niektórych kategorii i list nazw. Może również ograniczyć wyszukiwanie stron zawierających określone słowa w tytule lub należących do określonych grup tematycznych. W przypadku prawidłowego stosowania, język zapytań może obsługiwać parametry rząd wielkości bardziej złożonego niż powierzchnia emisji większości wyszukiwarek, w tym zdefiniowanych przez użytkownika słów do końca zmiennej i tej samej pisowni. Po wyświetleniu wyników wyszukiwania zaawansowanego zostanie wyświetlony link do odpowiednich sekcji strony.
Możliwe jest również wyszukiwanie wszystkich stron,zawierające pewną frazę, a przy standardowym zapytaniu, wyszukiwarki nie mogą zatrzymać się na żadnej stronie dyskusji. W wielu przypadkach język zapytania może prowadzić do dowolnej strony znajdującej się w tagach noindex.
W niektórych przypadkach dobrze sformułowane zapytanie pozwala znaleźć informacje zawierające wiele znaków specjalnych i liter innych alfabetów (np. Chińskie znaki).
W jaki sposób są czytane znaki w języku zapytań?
Duże i małe litery, a także niektóreznaki diakrytyczne (umlauty i akcenty) nie są uwzględniane w wyszukiwaniach. Na przykład wyszukiwanie słowa kluczowego Citroen nie pozwala znaleźć stron zawierających słowo "Citroen". Ale niektóre ligatury odpowiadają poszczególnym literom. Na przykład wyszukiwanie słowa "aeroskop" z łatwością znajdzie strony zawierające "Ereskebing" (AE = Æ).
Wiele znaków niealfanumerycznych jest ciąglesą ignorowane. Na przykład niemożliwe jest znalezienie informacji na temat zapytania zawierającego ciąg | L | (litera między dwoma pionowymi kreskami), pomimo faktu, że ten symbol jest używany w niektórych szablonach konwersji. Tylko dane z LT będą w wynikach. Niektóre symbole i zwroty są traktowane w różny sposób: zapytanie „pożyczki (finanse)” wyświetla artykuł ze słowami „kredyt” i „finanse”, ignorując wsporniki, nawet jeśli nie jest to artykuł z dokładną nazwą „kredyt (finanse).”
Istnieje wiele funkcji, które mogą być używane z językiem zapytań.
Składnia
Język zapytań "Yandex" i "Google" możeużyj jakiejś interpunkcji, aby zawęzić wyszukiwanie. Na przykład nawiasy klamrowe to {{search}}. Zawarte w nich wyrażenie zostanie przeszukiwane w całości, bez zmian.
Fraza w podwójnych cudzysłowach pozwala ci zdefiniowaćobiekt wyszukiwania. Na przykład, cytowane słowo zostanie uznane za używane w przenośni lub jako fikcyjna postać, bez cytatów - jako informacja o bardziej dokumentalnym charakterze.
Ponadto wszystkie główne wyszukiwarki obsługują znak "-" dla logicznego "nie", a także i / lub. Wyjątkiem są terminy, których nie można oddzielić przy użyciu prefiksu łącznika lub myślnika.
Niedokładne dopasowanie szukanej frazy jest odnotowywanesymbol ~. Na przykład, jeśli nie pamiętasz dokładnego określenia terminu lub tytułu, możesz go określić w ciągu wyszukiwania z określonym znakiem, a będziesz mógł uzyskać wyniki z największym podobieństwem.
Niestandardowe parametry wyszukiwania
Istnieją również parametry wyszukiwania, takie jak intitle,i kategorię inc. Są to filtry wyświetlane przez dwukropek w postaci "filtru: ciąg zapytania". Ciąg zapytania może zawierać szukany termin lub frazę, część lub pełną nazwę strony.
Funkcja "intitle: zapytanie "nadaje priorytet wynikom wyszukiwania według nazwy, ale pokazuje również zwykłe wyniki dotyczące treści tytułu. Kilka z tych filtrów może być używanych jednocześnie. Jak skorzystać z tej możliwości?
Żądanie formularza "intitle: nazwa lotniska "wyświetli w tytule wszystkie artykuły z nazwą lotniska. Jeśli sformułujemy ją jako "intitle parkingowe: nazwa lotniska", to w tytule otrzymacie artykuły z nazwą lotniska i wzmianką o parkowaniu w tekście.
Wyszukaj według filtru "incategory: Kategoria "działa na zasadzie pierwszego wydania artykułów należących do określonej grupy lub listy stron. Na przykład zapytanie wyszukiwania, takie jak "Temples incategory: History", da wyniki na temat historii świątyń. Ta funkcja może być również używana jako rozszerzona przez ustawienie różnych parametrów.