Ściągawka dotycząca anonimowych systemów wyszukiwania. Wyszukiwarki bez cenzury i ograniczeń

W świecie prywatnych poszukiwań jest dwóch dużych i znanych liderów: Yauba i Ixquick. Zacznijmy nasz przegląd od przyjrzenia się bliżej tym dwóm uznanym liderom, a następnie szybko porównajmy ich z istniejącymi konkurentami na tym konkretnym rynku.




Ta wyszukiwarka została założona przez Hindusa Ahmeda Hossaina i stworzona wspólnie przez Indyjski Instytut Technologii, Uniwersytet w Delphi (Indie) i słynny MIT (Massachusetts Institute of Technology). Aktywny udział w projekcie wzięły także wydziały IT Uniwersytetu Harvarda i Uniwersytetu Kalifornijskiego w Berkeley. To poważny projekt naukowy i próba stworzenia zasadniczo nowego rodzaju poszukiwań, przy czym na pierwszym planie stoi fakt, że w procesie wyszukiwania nie powinny być wykorzystywane żadne prywatne dane ani fakty osobowe obywateli. Wszystkie wyniki wyszukiwania nie są w żaden sposób analizowane ani gromadzone; projekt zasadniczo stara się stworzyć w miarę możliwości całkowicie czyste i bezpieczne wyszukiwanie. Serwis nie zapisuje Twojego adresu IP, nie przechowuje na Twoim komputerze żadnych plików cookies, a wszelkie informacje, które wpisałeś w formularzach wyszukiwania, są usuwane niezwłocznie po ich przetworzeniu. W tej chwili wyszukiwarka z pewnością znajduje się na liście 100 000 najczęściej odwiedzanych witryn w światowym Internecie. Ważne jest, aby ta wyszukiwarka posiadała własną wyszukiwarkę, która również z powodzeniem indeksuje strony rosyjskojęzyczne i przetwarza zapytania użytkowników w języku rosyjskim. W wynikach wyszukiwania, w odpowiedzi na żądania użytkowników, Yauba oferuje przejście do znalezionych witryn za pomocą dwóch rodzajów linków, z których jeden jest niebieski (jest to zwykły link bezpośredni), a drugi jest zielony, co umożliwia użytkownikowi wyszukiwania przeglądanie tej witryny za pośrednictwem anonimowego serwera proxy.




Ixquick nazywa siebie pierwszą wyszukiwarką na świecie, która nie rejestruje adresów IP odwiedzających. Ten projekt wyszukiwania twierdzi również, że przechowuje minimum informacji dotyczących wyszukiwania, które w żadnym wypadku nie będą udostępniane osobom trzecim, ale są potrzebne wyłącznie do ich własnych potrzeb technicznych, rozwoju i optymalizacji wyszukiwania. W 2008 roku wyszukiwarka ta otrzymała Europejski Znak Prywatności i stała się pierwszą wyszukiwarką oficjalnie rekomendowaną przez Unię Europejską do użytku jej obywatelom. Wyszukiwarka posiada wygodny, nowoczesny interfejs (istnieje m.in. możliwość zwinięcia wyników wyszukiwania w spoiler). W wynikach wyszukiwania użytkownik ma możliwość przejścia do znalezionych linków za pośrednictwem proxy anonimizującego samego projektu i istnieje możliwość podążania za linkami bezpośrednimi, zupełnie jak w Google. Naszym zdaniem wyszukiwarka pokazuje bardzo dobre wyniki wyszukiwania. Informacje na samej stronie deweloperów o charakterze wyszukiwarki są nieco sprzeczne, dlatego w jednym miejscu mówimy o własnej wyszukiwarce, w innym wręcz przeciwnie, jest napisane, że jest to właściwie metawyszukiwarka, czyli tzw. tworzenie zbiorczego wyniku wyszukiwania z wyników wyszukiwania takich światowych liderów wyszukiwań jak Bing, Yahoo, Ask/Theoma, a także zawarcie odrębnej umowy z Wikipedią. Podobnie jak tradycyjne wyszukiwarki, Ixquick umożliwia także przeszukiwanie zdjęć, baz danych telefonów, kolekcji wideo itp.




StartPage to kolejna anonimowa wyszukiwarka będąca technologicznie klonem Ixquick. StartPage, podobnie jak jego kolega, nie przechowuje żadnych prywatnych danych korzystających z niego użytkowników. Zespół programistów StartPage po prostu próbuje ulepszyć istniejący Ixquick.




I chociaż nazwa tej wyszukiwarki wygląda jak imię jakiejś bajkowej, niepoważnej postaci z kreskówek, to pod względem wyszukiwania jest to prawdziwa wyszukiwarka, która wykorzystuje farmę klastrów składającą się z 400 serwerów do obsługi wszystkich przychodzących żądań i indeksowania Internetu. DuckDuckGo nazywa tak ukochane przez tradycyjne wyszukiwarki gromadzenie danych osobowych „wyciekiem wyszukiwania” i samo w sobie, jako przykład, zachowuje całkowitą neutralność w stosunku do użytkownika. W przeciwieństwie do wyżej wymienionych wyszukiwarek, tutaj wszystko można dostosować. Zatem w sekcji Ustawienia wyników i Ustawienia prywatności możesz samodzielnie określić, co może, a czego nie może używać i zapisywać wyszukiwarka - domyślnie wszystkie wartości są resetowane. W sekcji Ustawienia proxy możesz skonfigurować przekierowanie do bezpośredniego linku w znalezionym poście lub włączyć tryb proxy – tak jak robią to wyszukiwarki z powyższej recenzji. Również w tej sekcji możesz włączyć wymuszone korzystanie z bezpiecznego protokołu https, dzięki czemu Twoja komunikacja z serwerem wyszukiwania będzie również bezpiecznie szyfrowana, co uniemożliwi osobom trzecim „podsłuchiwanie” Twoich zainteresowań.




Ponieważ wszystkie cztery omówione powyżej wyszukiwarki są dość podobne i tego samego typu, podsumowując, możemy podać kolejny przykład zupełnie innego podejścia do anonimowości - polega to na działaniu z tradycyjną wyszukiwarką Google poprzez specjalny filtr bezpieczeństwa. Podobne skuteczne podejście demonstruje dość znany serwis hidemyass.com. Działa jako swego rodzaju serwer proxy z interfejsem internetowym specjalnie dla wyszukiwarki Google, generując standardowe wyniki, ale jednocześnie pozbawiając Cię wszelkich przyjemności związanych z „nadzorem”, próbami określenia Twojego położenia geograficznego, gustów i nawyków oraz inne wady tradycyjnego wyszukiwania za pomocą Google. Wierzymy, że to podejście jest odpowiednie dla większości użytkowników, ponieważ... nie zmusza Cię do porzucenia znanego już i wiodącego na świecie giganta wyszukiwarek, jednocześnie eliminując wszystkie jego niepożądane funkcje. Oczywiście nie można sobie komplikować życia i nie korzystać z tak wyspecjalizowanych usług, ale skorzystać z jakiegoś publicznego anonimizatora, np. the-cloak.com, który mniej lub bardziej skutecznie radzi sobie z rolą obrońcy przed obsesyjną ciekawością poszukiwań silniki, ale tutaj należy od razu pamiętać o pewnych subtelnościach. Na przykład w niektórych przypadkach będziesz musiał samodzielnie wyłączyć wykonywanie JavaScriptu w swojej przeglądarce, ponieważ... w ten sposób niektóre wyszukiwarki będą w stanie „dotrzeć do Ciebie”, nawet jeśli uzyskasz do niego dostęp za pośrednictwem anonimizera. Drugie alternatywne podejście polega na użyciu wyszukiwarek z metawyszukiwarką, z których wiele jest mniej inwazyjnych i ciekawych, działających jako rodzaj pośredniego interfejsu dla tradycyjnych wyszukiwarek. Jako taki „dobry przykład” można przytoczyć nasz rosyjski projekt nigma.ru.

W 2017 roku, kiedy Internet zawiera miliony terabajtów informacji, a każdy ruch użytkownika w Internecie jest rejestrowany, nie obejdzie się bez anonimowych wyszukiwarek. Przecież dla nas wszystkich bardzo ważne jest, aby jak najszybciej i jak najbezpieczniej dotrzeć do niezbędnych danych. Ale czy nasi drodzy czytelnicy wiedzą dokładnie, w jaki sposób wyszukiwarki przekładają wprowadzane znaki na kod? Czy zdajesz sobie sprawę, że wszystkie zgłoszenia od razu trafiają do działów marketingu korporacji?

Zasada działania konwencjonalnych wyszukiwarek w 2017 roku: anonimowość na poziomie zerowym

Google

Przejdźmy do wyszukiwarki Google i zobaczmy, jak wyświetla link do witryny, na przykład whoer.net:


Wyszukiwarka Yandex

A tak robi to Yandex:

Jak widać, nie jest to zbyt oczywiste. Tak naprawdę zostało to zrobione celowo, a wpisanie tekstu to nic innego jak skrypt, który przetworzy „kliknięcie” w link i zapamięta akcję użytkownika.
Dzisiaj na naszej stronie porozmawiamy o anonimowych wyszukiwarkach, które nie „zanieczyszczają” wyszukiwania niepotrzebnymi skryptami i nie przechowują danych o Twoich wyszukiwanych hasłach.

Najpopularniejszą anonimową wyszukiwarką w 2017 roku jest DuckDuck, która jest domyślną wyszukiwarką w anonimowej przeglądarce Tor.

DuckDuck jest również dostępny do wyboru w przeglądarkach Firefox i Opera. Prywatna wyszukiwarka słynie z tego, że nie używa skryptów w linkach i nie wyświetla w wynikach wyszukiwania witryn reklamowych i wirusowych. DuckDuckGo pozwala użytkownikowi określić znaki specjalne i symbole w zapytaniu. I jak już powiedzieliśmy, wyszukiwarka nie monitoruje działań użytkownika.

Wyświetlanie wyników zapytań w anonimowej wyszukiwarce DuckDuck

Jak widać nie ma tu ukrytych skryptów behawioralnych, a jedynie bezpośredni link!

Korzyści z DuckDuckGo

Kolejnym pozytywnym aspektem systemu DuckDuckGo jest jego pełna obsługa protokołu https. Na razie to ustawienie jest wyłączane na pierwszą prośbę użytkownika, ale można je łatwo aktywować poprzez wygodne menu główne wyszukiwarki. Po wykonaniu tej czynności wszystkie wyszukiwania zostaną poddane dodatkowemu szyfrowaniu.

IxQuick uznana została za najbardziej poufną wyszukiwarkę 2017 roku.

Serwery tej wyszukiwarki są „wyposażone” w potężny system metawyszukiwarki. Oznacza to, że: po żądaniu wyszukiwania, IxQuick wyświetla jednocześnie wyniki z kilkunastu wyszukiwarek, łącząc je w swoim oknie wyszukiwania i przypisując każdemu linkowi unikalną ocenę, która służy do rankingu.
Powyższy zrzut ekranu pokazuje, że główne zapytania pochodzą z Google, więc nie musisz się martwić o trafność wyników.

Ustawienia prywatności w anonimowej wyszukiwarce IxQuick

Pomimo całej mocy produkcyjnej, nie prowadzi się żadnego „nadzoru” użytkowników, co więcej, adresy IP użytkowników nie są nawet rejestrowane. Jednakże każdy użytkownik może zezwolić na zapisywanie ustawień wyszukiwania na serwerze anonimowej wyszukiwarki w formie plików cookie, które będą automatycznie usuwane co trzy miesiące lub aktualizowane przy każdej wizycie na stronie głównej IxQuick.

Plusy i minusy IxQuick

Ogromną zaletą IxQuick jest metawyszukiwanie związane z anonimowością zapytań, które robot wyszukiwania „przeczesuje” wykorzystując skomplikowaną sieć przekierowywania danych z oryginalnej wyszukiwarki do użytkownika.
Wśród wad anonimowego wyszukiwania IxQuick możemy jedynie zauważyć fakt, że w interfejsie nie ma języka rosyjskiego.


Już na podstawie zrzutu ekranu uważny czytelnik może stwierdzić, że StartPage jest klonem anonimowej wyszukiwarki IxQuick. Zgadza się: historia tego projektu ma swój początek wcześniej niż IxQuick, ale pomimo tego, że serwis nie analizował i nie zapisywał wyników wyszukiwania użytkownika, to jednak przegrał z konkurencją i wkrótce został wykupiony przez potężniejszego rywala.
Jednak ta witryna nadal działa, dlatego możemy zalecić użycie kombinacji: w IxQuick skonfiguruj Bing jako głównego dostawcę zapytań, a w StartPage ustaw wyszukiwarkę Google jako domyślną. W ten sposób uzyskasz podwójne anonimowe wyszukiwanie, łatwo porównując wyniki swoich danych wyszukiwania.

Witam, drodzy czytelnicy bloga. , to nieliczni użytkownicy mieli dość własnych zakładek. Jednak, jak pamiętacie, działo się to w postępie geometrycznym i bardzo szybko nawigacja w całej jej różnorodności stała się trudniejsza.

Następnie pojawiły się katalogi (Yahoo, Dmoz i inne), w których ich autorzy dodawali i sortowali różne strony w kategorie. To od razu ułatwiło życie ówczesnym, niezbyt licznym użytkownikom globalnej sieci. Wiele z tych katalogów żyje do dziś.

Jednak po pewnym czasie rozmiar ich baz danych stał się tak duży, że programiści najpierw pomyśleli o stworzeniu w nich wyszukiwarki, a następnie o stworzeniu zautomatyzowanego systemu indeksowania wszystkich treści internetowych, aby były one dostępne dla każdego.

Główne wyszukiwarki rosyjskojęzycznego segmentu Internetu

Jak rozumiesz, pomysł ten został wdrożony z oszałamiającym sukcesem, ale wszystko skończyło się dobrze tylko dla kilku wybranych firm, którym udało się nie zniknąć w Internecie. Prawie wszystkie wyszukiwarki, które pojawiły się w pierwszej fali, teraz albo zniknęły, popadły w ruinę, albo zostały kupione przez konkurentów odnoszących większe sukcesy.

Wyszukiwarka to mechanizm bardzo złożony i, co ważne, bardzo zasobochłonny (nie chodzi tu tylko o zasoby materialne, ale także ludzkie). Za pozornie prostym, czyli jego ascetycznym odpowiednikiem od Google, stoją tysiące pracowników, setki tysięcy serwerów i wiele miliardów inwestycji, które są niezbędne, aby ten kolos mógł nadal działać i zachować konkurencyjność.

Wejście teraz na ten rynek i zaczynanie od zera to raczej utopia niż realny projekt biznesowy. Przykładowo jedna z najbogatszych korporacji świata, Microsoft, od kilkudziesięciu lat próbuje zdobyć przyczółek na rynku wyszukiwarek i dopiero teraz ich wyszukiwarka Bing powoli zaczyna spełniać ich oczekiwania. A wcześniej była cała seria niepowodzeń i niepowodzeń.

Co możemy powiedzieć o wejściu na ten rynek bez specjalnych wpływów finansowych. Na przykład nasza krajowa wyszukiwarka Nigma ma w swoim arsenale wiele przydatnych i innowacyjnych rzeczy, ale ich ruch jest tysiące razy mniejszy niż liderów rynku rosyjskiego. Przyjrzyj się na przykład codziennej publiczności Yandex:

W związku z tym możemy założyć, że lista głównych (najlepszych i najszczęśliwszych) wyszukiwarek Runeta i całego Internetu została już utworzona, a cała intryga polega tylko na tym, kto ostatecznie kogo pożre lub jak będzie ich procentowy udział zostać rozdzielone, jeśli wszystkie przeżyją i utrzymają się na powierzchni.

Rosyjski rynek wyszukiwarek jest bardzo wyraźnie widoczna i tutaj prawdopodobnie możemy wyróżnić dwóch lub trzech głównych graczy i kilku pomniejszych. Ogólnie rzecz biorąc, w RuNet powstała dość wyjątkowa sytuacja, która, jak rozumiem, powtórzyła się tylko w dwóch innych krajach na świecie.

Mówię o tym, że wyszukiwarka Google, która przybyła do Rosji w 2004 roku, nadal nie była w stanie objąć przywództwa. Właściwie w tym okresie próbowali kupić Yandex, ale coś tam nie wyszło i teraz „nasza Rosja”, wraz z Czechami i Chinami, to miejsca, w których wszechmocny Google, jeśli nie zostanie pokonany, to w w każdym razie napotkał poważny opór.

W rzeczywistości, aby zobaczyć aktualny stan rzeczy wśród najlepsze wyszukiwarki w RuNet Każdy może. Wystarczy wkleić ten adres URL w pasek adresu przeglądarki:

Http://www.liveinternet.ru/stat/ru/searches.html?period=miesiąc;total=tak

Faktem jest, że większość z nich korzysta.

Po wejściu na podany adres URL naszym oczom ukazuje się obraz, który nie jest zbyt atrakcyjny i reprezentacyjny, ale dobrze oddaje istotę sprawy. Zwróć uwagę na pięć najlepszych wyszukiwarek, z których korzystają witryny w języku rosyjskim:

Tak, oczywiście nie wszystkie zasoby z treściami w języku rosyjskim znajdują się w tej strefie. Istnieją również SU i RF, a ogólne obszary, takie jak COM czy NET, są pełne projektów internetowych skupionych na Runecie, ale mimo to próba jest dość reprezentatywna.

Zależność tę można przedstawić w bardziej barwny sposób, tak jak ktoś zrobił to np. w Internecie w ramach swojej prezentacji:

Nie zmienia to istoty. Jest kilku liderów i kilku bardzo, bardzo daleko w tyle za wyszukiwarkami. Swoją drogą, o wielu z nich już pisałem. Czasami zanurzenie się w historię sukcesu lub odwrotnie, zagłębienie się w przyczyny niepowodzeń niegdyś obiecujących wyszukiwarek może być całkiem interesujące.

Tak więc, w kolejności ważności dla Rosji i Runetu jako całości, wymienię je i podam krótką charakterystykę:

    Wyszukiwanie w Google stało się już powszechnie znanym słowem wielu ludzi na świecie – możesz o tym przeczytać w linku. W tej wyszukiwarce spodobała mi się opcja „tłumaczenia wyników”, gdy otrzymywałeś odpowiedzi z całego świata, ale w swoim ojczystym języku, ale teraz niestety nie jest ona dostępna (przynajmniej na google.ru).

    Ostatnio zastanawia mnie także jakość ich wyników (strona wyników wyszukiwania). Osobiście zawsze najpierw korzystam z lustrzanej wyszukiwarki RuNet (tam jest, cóż, jestem do tego przyzwyczajony) i dopiero jeśli nie znajduję tam zrozumiałej odpowiedzi, zwracam się do Google.

    Zwykle ich wypuszczenie mnie cieszyło, ale ostatnio tylko mnie to zdziwiło – czasami wychodzą takie bzdury. Możliwe, że ich walka o zwiększenie przychodów z reklam kontekstowych i ciągłe przesuwanie wyników wyszukiwania w celu zdyskredytowania promocji SEO może przynieść odwrotny skutek. W każdym razie ta wyszukiwarka ma konkurenta w RuNet i jakiego rodzaju.

    Myślę, że jest mało prawdopodobne, aby ktokolwiek specjalnie odwiedził Go.mail.ru, aby szukać w RuNet. Dlatego ruch do projektów rozrywkowych z tej wyszukiwarki może wynosić znacznie więcej niż dziesięć procent. Właściciele takich projektów powinni zwrócić uwagę na ten system.

Jednak oprócz wyraźnych liderów rynku wyszukiwarek rosyjskojęzycznego segmentu Internetu jest jeszcze kilku graczy, których udział jest dość niski, ale mimo to sam fakt ich istnienia powoduje, że trzeba powiedzieć kilka słów o nich.

Wyszukiwarki Runet z drugiego rzutu


Wyszukiwarki internetowe

W zasadzie w skali całego Internetu poważny gracz jest tylko jeden – Google. To niekwestionowany lider, choć wciąż ma pewną konkurencję.

Po pierwsze, nadal jest tak samo Bing, która na przykład ma bardzo dobrą pozycję na rynku amerykańskim, zwłaszcza biorąc pod uwagę, że jej silnik jest używany także we wszystkich usługach Yahoo (prawie jedna trzecia całego rynku wyszukiwania w USA).

Otóż ​​po drugie, w związku z ogromnym udziałem użytkowników z Chin w ogólnej liczbie użytkowników Internetu, ich główna wyszukiwarka tzw. Baidu wcina się w rozkład miejsc na świecie Olimpu. Urodził się w 2000 roku i obecnie jego udział stanowi około 80% całej krajowej widowni w Chinach.

Trudno powiedzieć coś bardziej zrozumiałego o Baidu, ale w Internecie krążą opinie, że miejsca na jego Top zajmują nie tylko strony najbardziej istotne dla zapytania, ale także ci, którzy za to zapłacili (bezpośrednio do wyszukiwarki) , a nie do biura SEO). Oczywiście dotyczy to przede wszystkim ofert komercyjnych.

Generalnie patrząc na statystyki staje się jasne, dlaczego Google łatwo godzi się na pogorszenie wyników wyszukiwania w zamian za zwiększenie zysków z reklamy kontekstowej. Tak naprawdę nie boją się odpływu użytkowników, bo w większości przypadków nie mają dokąd pójść. Sytuacja jest nieco smutna, ale zobaczymy, co będzie dalej.

Nawiasem mówiąc, aby jeszcze bardziej utrudnić życie optymalizatorom i być może zachować spokój użytkowników tej wyszukiwarki, Google ostatnio używa szyfrowania podczas przesyłania zapytań z przeglądarek użytkowników do paska wyszukiwania. Wkrótce w statystykach liczników odwiedzin nie będzie już można zobaczyć, z jakimi zapytaniami przyszli do Ciebie użytkownicy Google.

Oczywiście oprócz wyszukiwarek wymienionych w tej publikacji istnieją tysiące innych - regionalnych, specjalistycznych, egzotycznych itp. Próba wymienienia i opisania ich wszystkich w jednym artykule byłaby niemożliwa i prawdopodobnie nie konieczna. Powiedzmy lepiej kilka słów o jak łatwo jest stworzyć wyszukiwarkę oraz jak łatwo i niedrogo można je aktualizować.

Zdecydowana większość systemów działa na podobnych zasadach (przeczytaj o tym i tamtym) i ma ten sam cel – dać użytkownikom odpowiedź na ich pytanie. Co więcej, odpowiedź ta musi być relewantna (odpowiadająca pytaniu), wyczerpująca i, co nie jest nieistotne, relewantna (pierwszej świeżości).

Rozwiązanie tego problemu nie jest takie proste, zwłaszcza że wyszukiwarka będzie musiała na bieżąco analizować zawartość miliardów stron internetowych, odsiewać te niepotrzebne, a z pozostałych tworzyć listę (kwestię), na której najwięcej jako pierwsze pojawią się odpowiednie odpowiedzi na pytanie użytkownika.

To niezwykle złożone zadanie rozwiązuje się poprzez wstępne zebranie informacji z tych stron za pomocą różnych roboty indeksujące. Zbierają linki z już odwiedzonych stron i ładują z nich informacje do bazy wyszukiwarki. Istnieją boty indeksujące tekst (zwykły i szybki bot, który żyje z aktualności i często aktualizowanych zasobów, dzięki czemu w wynikach zawsze prezentowane są najnowsze dane).

Oprócz tego istnieją roboty indeksujące obrazy (w celu ich późniejszego wyprowadzenia), favicony, witryny lustrzane (w celu ich późniejszego porównania i ewentualnego sklejenia), boty sprawdzające funkcjonalność stron internetowych, których użytkownicy lub poprzez narzędzia dla webmasterów (tutaj mogę przeczytać o i).

Sam proces indeksowania i późniejszy proces aktualizacji indeksowych baz danych są dość czasochłonne. Chociaż Google robi to znacznie szybciej niż jego konkurenci, przynajmniej Yandex, któremu zajmuje to tydzień lub dwa (przeczytaj o).

Zazwyczaj wyszukiwarka dzieli treść tekstową strony internetowej na pojedyncze słowa, które sprowadzają się do podstawowych zasad, dzięki czemu może następnie udzielić poprawnych odpowiedzi na pytania zadawane w różnych formach morfologicznych. Wszystkie dodatkowe rzeczy w postaci znaczników HTML, spacji itp. rzeczy są usuwane, a pozostałe słowa są sortowane alfabetycznie, a ich pozycja w tym dokumencie jest wskazana obok nich.

Coś takiego nazywa się indeksem odwrotnym i umożliwia przeszukiwanie nie według stron internetowych, ale według ustrukturyzowanych danych znajdujących się na serwerach wyszukiwarek.

Liczba takich serwerów dla Yandexa (który wyszukuje głównie strony rosyjskojęzyczne, trochę ukraińskiego i tureckiego) liczy się w dziesiątkach, a nawet setkach tysięcy, a dla Google (który wyszukuje w setkach języków) – w milionach .

Wiele serwerów posiada kopie, które służą zarówno zwiększeniu bezpieczeństwa dokumentów, jak i pomagają zwiększyć szybkość przetwarzania żądań (poprzez rozłożenie obciążenia). Oszacuj koszty utrzymania całej tej gospodarki.

Żądanie użytkownika zostanie wysłane przez moduł równoważenia obciążenia do segmentu serwera, który jest aktualnie najmniej obciążony. Następnie przeprowadzana jest analiza regionu, z którego użytkownik wyszukiwarki wysłał swoje zapytanie, i jest ona analizowana pod kątem morfologicznym. Jeśli ostatnio w pasku wyszukiwania wpisano podobne zapytanie, to użytkownikowi podawane są dane z pamięci podręcznej, aby ponownie nie obciążać serwerów.

Jeżeli żądanie nie zostało jeszcze zbuforowane, to zostaje przeniesione do obszaru, w którym znajduje się baza danych indeksowych wyszukiwarki. W odpowiedzi otrzymasz listę wszystkich stron internetowych, które choć w pewnym stopniu są powiązane z zapytaniem. Pod uwagę brane są nie tylko bezpośrednie wystąpienia, ale także inne formy morfologiczne, a także itp. rzeczy.

Ich trzeba mieć ranking i na tym etapie w grę wchodzi algorytm (sztuczna inteligencja). Tak naprawdę żądanie użytkownika jest mnożone przez wszystkie możliwe opcje jego interpretacji, a odpowiedzi na wiele żądań są wyszukiwane jednocześnie (poprzez wykorzystanie operatorów języka zapytań, z których część jest dostępna dla zwykłych użytkowników).

Z reguły w wynikach wyszukiwania znajduje się jedna strona z każdego serwisu (czasami więcej). są obecnie bardzo złożone i uwzględniają wiele czynników. Dodatkowo, aby je poprawić, stosuje się ręczne ocenianie witryn referencyjnych, co pozwala na dostosowanie działania algorytmu jako całości.

Generalnie widać, że sprawa jest ciemna. Można o tym długo rozmawiać, ale już wiadomo, że satysfakcję użytkownika z systemu wyszukiwania osiąga się, och, jakie to trudne. I zawsze znajdą się tacy, którym coś się nie spodoba, jak ty i ja, drodzy czytelnicy.

Powodzenia! Do zobaczenia wkrótce na stronach bloga

Możesz obejrzeć więcej filmów, przechodząc do
");">

Możesz być zainteresowany

Yandex People - jak wyszukiwać osoby w sieciach społecznościowych Apometr to bezpłatna usługa służąca do śledzenia zmian w wynikach wyszukiwania i aktualizacji wyszukiwarek. DuckDuckGo – wyszukiwarka, która Cię nie śledzi
Jak sprawdzić prędkość Internetu - test połączenia online na komputerze i telefonie, SpeedTest, Yandex i inne mierniki
Obrazy Yandex i Google, a także wyszukiwanie według pliku obrazu w Tineye (tinai) i Google

Od dwóch dekad, pracując w mediach, obserwuję to samo zjawisko. Mianowicie: część dziennikarzy zupełnie nie ma nastroju na opanowywanie nowych technologii i, jak się wydaje, nadal tęskni za maszynami do pisania.

Inni, wręcz przeciwnie, opanowują nowe technologie z kosmiczną szybkością, wyprzedzając najbardziej znanych maniaków technologii. Ten tekst należy do drugiej kategorii.

Wszyscy jesteśmy przyzwyczajeni do korzystania z najpopularniejszej wyszukiwarki na świecie – Google – w celu znalezienia potrzebnych informacji. W witrynach Google, dostępnych w około 200 językach, codziennie rejestrowane są miliardy zapytań – to nie przypadek, że strona główna Google.com uznawana jest za najpopularniejszy zasób w Internecie. Yandex i Bing są również często używane.

Trzeba jednak przyznać: wyszukiwarka Google jest przeznaczona dla masowego konsumenta, dla którego w 99% przypadków pierwsze trzy strony wyników wyszukiwania są więcej niż wystarczające. Ale dziennikarze to właśnie ci ludzie, którzy czasami potrzebują znaleźć coś niezbyt powszechnego, zagłębić się w problem. Jednak nawet najbardziej zaawansowana wyszukiwarka nie jest w stanie przeszukać blogów, artykułów naukowych, zdjęć cyfrowych i przepisów. Z tego powodu istnieje wiele mało znanych wyszukiwarek, które specjalizują się w jakimś „wąskim” wyszukiwaniu lub potrafią wyszukiwać tam, gdzie tradycyjne wyszukiwarki zwykle nie szukają. W końcu uniwersalne wyszukiwarki po prostu „nie widzą” na przykład nieistniejących już stron internetowych lub starych wersji stron, treści w sieciach społecznościowych, stron celowo zamkniętych dla „pająków internetowych” itp.

Więc co możemy zrobić?

1. Odpowiedz na pytanie

Możesz wyszukiwać coś, używając słów kluczowych lub wyrażeń, albo możesz zadać pytanie w naturalnym, ludzkim języku. Oto pytania, na które znajdują się odpowiedzi Answers.com– wyszukiwarka, która pozwala znaleźć odpowiedzi na ogromną liczbę pytań. Wynikiem wyszukiwania nie jest zestaw linków, ale artykuły z Wikipedii, Uniwersytetu Oksfordzkiego i innych wiarygodnych zasobów. Wystarczy zapytać po angielsku.

2. Znajdź coś, czego już nie ma

Dziś prawie każdy zaawansowany użytkownik Internetu wie, jak korzystać z pamięci podręcznej Google lub Yandex, gdy chce wyświetlić (i/lub przedstawić jako dowód) niedawno usuniętą lub zmienioną stronę w jej oryginalnej formie. Cóż, albo zobaczyć ją taką, jaka była w pewnym momencie. Jest jednak pewien problem: taka pamięć podręczna jest dostępna dla wyników wyszukiwania tylko przez stosunkowo krótki czas. Jest to zrozumiałe: zadaniem robota wyszukiwania jest zapewnienie najbardziej aktualnej wersji zasobu internetowego.

Czasami jednak trzeba zobaczyć witrynę tak, jak wyglądała, powiedzmy, kilka lat temu. W tym celu stworzono specjalne narzędzia wyszukiwania – takie jak na przykład serwis internetowy Maszyna powrotna. Jego pracę wspiera organizacja non-profit Internet Archive, która od 1997 roku gromadzi kopie stron internetowych i treści multimedialnych zamieszczanych w Internecie. Wszystkie te kopie, przechowywane na wielu serwerach, są dostępne bezpłatnie dla każdego. Wayback Machine pozwala znaleźć nie tylko starą wersję aktualnie istniejącej witryny, ale także te strony internetowe, które od dawna nie istnieją - mówimy o witrynach zamkniętych. Do tej pory Internet Archive zgromadziło już ponad 366 miliardów stron, więc jest bardzo prawdopodobne, że znajdziesz to, czego potrzebujesz.

3. Szukam zdjęcia

Dziś zdecydowana większość użytkowników, którzy potrzebują znaleźć zdjęcie lub inny plik graficzny, korzysta w tym celu z Google Grafiki. Jednak największa wyszukiwarka na świecie jest „dostosowana” do wyszukiwania tekstowego, a wyszukiwanie obrazowe w niej jest tylko jedną z dodatkowych usług.

Jeśli więc nie możesz znaleźć tego, czego potrzebujesz, korzystając z Grafiki Google, warto skorzystać z czegoś specjalistycznego. Na przykład serwis Wyszukiwarka zdjęć. Według twórców ich pomysł zindeksował już ponad trzy i pół miliarda obrazów cyfrowych.

Do zalet Picsearch należy zarówno wielojęzyczny interfejs użytkownika, jak i pełna wielojęzyczna wyszukiwarka, a także szereg bardzo praktycznych filtrów, na przykład możliwość wyszukiwania tylko obrazów czarno-białych lub kolorowych, zdjęć z przewagą określonego kolor, wyszukaj „tapetę” dla tła pulpitu, a także twarzy lub animowanych obrazów.

Wyszukiwarka może być także godną alternatywą dla Grafiki Google Wszystkie zdjęcia. Z jednej strony jest znacznie mniejszy – zawiera „tylko” około 25 milionów zdjęć przechowywanych w internetowych serwisach fotograficznych, m.in. Flickr, Fotolia i Wikimedia Commons. Jednak, jak twierdzą eksperci, efekty jej pracy są naprawdę imponujące. Większość znalezionych zdjęć można jednak wykorzystać bezpłatnie, pod warunkiem wskazania nazwiska fotografa lub właściciela praw autorskich.

Na uwagę zasługuje usługa wyszukiwania po treści obrazkowej. Picollator.ru. Gdy wpiszesz zapytanie w większości wyszukiwarek oferujących wyszukiwanie plików obrazów, otrzymasz wyniki na podstawie tekstu wyświetlanego na stronie, a także nazw plików. Picollator działa zasadniczo inaczej, identyfikując to, co jest pokazane na zdjęciach. Oczywiste jest, że w tym przypadku zapytanie nie powinno być formułowane jako słowo lub fraza, ale jako obraz.

Oznacza to, że aby przeprowadzić wyszukiwanie, należy wgrać zdjęcie na serwer lub podać link do strony, na której zostało już przesłane. Wyniki wyszukiwania będą zawierać miniatury obrazów podobnych do przesłanego zdjęcia. To prawda, że ​​​​ta usługa działa tylko ze zdjęciami ludzi i dobrej jakości.

Niestety, zbyt wielu dziennikarzy – szczególnie tych z wydziału dziennikarstwa – nie jest przyjaznych liczbom. Wiele osób nawet nie widzi różnicy między procentami a punktami procentowymi, dlatego artykuły z zakresu ekonomii czasami zamieniają się w bełkot. Z pomocą może im przyjść jedna z najsłynniejszych „alternatywnych” wyszukiwarek - WolframAlfa .

W istocie jest to „encyklopedyczna” wyszukiwarka, której zadaniem jest udzielanie odpowiedzi na naprawdę złożone pytania z takich dziedzin, jak matematyka, fizyka, medycyna, statystyka, historia, językoznawstwo i inne dziedziny nauki. Zasadniczo WolframAlpha jest bardziej kolosalną bazą danych, której część została przekształcona w algorytmy obliczeniowe. To dzięki nim użytkownik wyszukiwarki może uzyskać szczegółowe informacje o tym, ile gramów białka i kalorii zawiera filiżanka kakao, jaka jest średnia długość życia w Stanach Zjednoczonych, Francji i Australii w przyszłym roku czy jak rozwiązać równanie algebraiczne.

Aby jednak w pełni korzystać z WolframAlpha, musisz biegle posługiwać się językiem angielskim. Niestety system nie obsługuje innych języków.

5. Znowu nauka

Świat nauki zawsze był nieco zamknięty dla niewtajemniczonych. Nie jest ona oczywiście odgrodzona od ogółu społeczeństwa stalowym murem, jednak aby zapoznać się z publikacjami naukowymi, zagłębić się w konkretne bazy danych i zapoznać się z wynikami eksperymentów, internauci zazwyczaj muszą się zarejestrować i uzyskać specjalny dostęp. Oznacza to, że zwykłe wyszukiwarki nie indeksują tych informacji - dla nich prawie wszystkie artykuły naukowe należą do kategorii tzw. „Deep Web”.

Jeśli więc naprawdę potrzebujesz zagłębiać się w informacje naukowe, które dla większości niewtajemniczonych są niezrozumiałe, skorzystaj ze specjalistycznej wyszukiwarki. Choćby wyszukiwarka Kompletna planeta, z dostępem do ponad 70 000 naukowych baz danych i wysoce ukierunkowanych wyszukiwarek.

6. Szukam mężczyzny!

Zwykła wyszukiwarka może służyć jedynie do wyszukiwania informacji o celebrycie. Jeśli potrzebujesz informacji, które wcale nie dotyczą osoby publicznej, szanse na znalezienie jakichkolwiek danych gwałtownie spadają. A wtedy trzeba skorzystać ze specjalistycznej wyszukiwarki.

Najbardziej znanym z tych systemów jest wyszukiwarka. Pipl. Przeszukuje dane osób w różnych rejestrach publicznych, internetowych bazach danych, usługach i sieciach społecznościowych. Dużą zaletą usługi Pipl jest to, że działa ona również z cyrylicą, więc jest dość skuteczna w przypadku nazwisk w języku rosyjskim.

Alternatywa - serwis rosyjski SpravkaRU.NET. Potrafi znaleźć adres i numer telefonu domowego mieszkańca nie tylko w Rosji, ale także na Ukrainie, Białorusi, Kazachstanie, Łotwie i Mołdawii. W istocie jest to duża elektroniczna książka telefoniczna głównych miast w krajach byłego Związku Radzieckiego, choć jest daleka od ukończenia. Jednak w przeciwieństwie do wielu podobnych usług, SpravkaRU.NET zawiera całkowicie aktualne bazy danych. Jeśli więc masz przynajmniej pewne informacje o krewnych lub przybliżonym miejscu zamieszkania interesującego Cię obiektu, to z pewnością pomoże Ci to go znaleźć. Należy pamiętać, że usługa często nie działa.

Najprostszym sposobem na znalezienie kogoś jest skorzystanie z wyszukiwarki „Yandex.Ludzie”. Zostało to zweryfikowane: nie uzyskasz zbyt wielu informacji, ale prawie na pewno znajdziesz tę osobę.

7. Przeszukiwanie bloga

W ciągu ostatniego półtorej dekady blogi stały się nie tylko zjawiskiem społecznym i kulturowym, ale po prostu bezdennym źródłem szerokiej gamy informacji. Nie zawsze wiarygodne i poprawnie przedstawione, ale często nadal bardzo interesujące. Specjalistyczne wyszukiwanie blogów rosyjskojęzycznych - obsługa „Yandex.Blogi”. Żadnych specjalnych bajerów i gwizdków, tylko działające poszukiwania.

8. Zachowaj swoje poszukiwania w tajemnicy

Jednym z wybitnych osiągnięć 2010 roku jest anonimowa wyszukiwarka. KaczkaKaczkaGo. Jest to wyszukiwarka typu open source, założona we wrześniu 2008 roku. W swojej umowie z użytkownikiem DDG kładzie nacisk na poufność danych dostarczonych przez użytkownika, niezapisywanie i przechowywanie informacji o użytkowniku oraz brak nadzoru użytkowników.

Technologicznie DuckDuckGo różni się od uniwersalnych wyszukiwarek tym, że nie wykorzystuje „bańki filtrującej”, czyli nie bierze pod uwagę wcześniejszych zapytań użytkownika, aby określić, które informacje są dla niego najbardziej interesujące. DuckDuckGo domyślnie korzysta z protokołu HTTPS pomiędzy klientem a serwerem, wykorzystując algorytm szyfrowania RC4 ze 128-bitowym kluczem. Ponadto DDG Search Engine nie wykorzystuje plików cookies, nie przechowuje danych o adresach IP użytkowników, nie prosi o zalogowanie i domyślnie szyfruje przesyłane dane.

Anonimowa wyszukiwarka jest pomysłem programisty Gabriela Weinberga. Stworzył DDG w 2008 roku, od początku decydując, że nie będzie przechowywać danych użytkowników, ponieważ zawiera zbyt dużo danych osobowych. „Jeśli zapytasz ludzi, jak ważna jest prywatność w ich wyszukiwaniach, powiedzą, że jest ona bardzo ważna, ale prawie nikt nie stara się, aby ich wyszukiwania były anonimowe” – napisał Weinberg na swoim blogu. – Google przechowuje nie tylko zapytania wyszukiwane przez użytkowników, ale także adresy IP, z których uzyskali dostęp. Mitem jest, że Google musi przechowywać wszystkie te informacje. Prawie wszystkie zarabiane przez nich pieniądze zależą od tego, co użytkownik wpisze w pasku wyszukiwania”.

Początkowo DuckDuckGo było mało znane: na początku czerwca 2013 r. przetwarzało zaledwie 1,7 miliona żądań dziennie. Ale wtedy doszło do skandalu: informacja o programie PRISM została upubliczniona w Stanach Zjednoczonych – przy jego pomocy amerykańska NSA uzyskała dostęp do serwerów firm, w tym właścicieli największych wyszukiwarek świata – Google, Microsoft i Yahoo. Niedługo potem liczba codziennych wyszukiwań w DuckDuckGo przekroczyła 3 miliony dziennie i nadal szybko rosła.

Jest to przeszukiwalna baza danych najpopularniejszych bibliotek DLL. Pliki są posortowane alfabetycznie i dostępna jest funkcja wyszukiwania. Plik, którego szukasz, możesz znaleźć nawet wtedy, gdy znasz tylko przybliżoną nazwę biblioteki.

13. Znajdowanie informacji medycznych

Strona internetowa Medpoisk.ru– uniwersalna wyszukiwarka przeznaczona do wyszukiwania wyłącznie w serwisach medycznych. Korzysta z wyszukiwarki Google. To praktyczne narzędzie nie tylko dla lekarzy, ale także dla każdego, kto potrzebuje odpowiedzi na każde pytanie z zakresu medycyny. Jak leczyć tę lub inną chorobę, jakie są przeciwwskazania do tego lub innego leku, z którym lekarzem się skonsultować. W wyszukiwarce dostępna jest także giełda pracy dla pracowników medycznych.

14. Przestrzeń jest dla nas wszystkim

Usługa wyszukiwania astronomicznego Astronet.ru specjalizuje się w wyszukiwaniu informacji na stronach o tematyce związanej z astronomią i eksploracją kosmosu. W sumie baza danych wyszukiwarki zawiera około pięciuset witryn o tematyce astronomicznej - witryny obserwatoriów, strony amatorskie, biblioteki literatury naukowej i tym podobne.

Oprócz funkcji wyszukiwania, na stronie znajduje się wiele innych przydatnych usług, w tym na przykład angielsko-rosyjsko-angielski słownik astronomiczny, podręcznik biograficzny zawierający szczegółowe informacje o wszystkich naukowcach, którzy przyczynili się do rozwoju astronomii oraz słownik terminów astronomicznych. Dostępna jest także przydatna mapa gwiazd, która generuje pozycje konstelacji na podstawie szerokości i długości geograficznej punktu obserwacji, a także pory dnia.

Oczywiście to tylko niewielka część alternatywnych usług wyszukiwania. Co więcej, z biegiem czasu niektóre z nich przestają działać, ale pojawiają się nowe. Najtęższe umysły tworzą coraz bardziej zaawansowane algorytmy selekcji wyników wyszukiwania w Internecie. Jeśli jednak nauczysz się umiejętnie operować składnią wyszukiwanego hasła, to Google, Yandex, Yahoo! i inne wyszukiwarki „ogólnego przeznaczenia” mogą generować wyniki równie dobre, jak wyszukiwarki alternatywne.

Użytkownicy są coraz bardziej zainteresowani. Opowiemy Ci o trzech wyszukiwarkach, które nie mają żadnych ograniczeń, a które nie zbierają Twoich danych osobowych, a wręcz przeciwnie, chronią Twoją prywatność.

Strona startowa: Najbardziej dyskretna wyszukiwarka na świecie

Startpage.com nazywa siebie „najbardziej dyskretną wyszukiwarką na świecie”. Od 2016 roku serwis został połączony z serwisem Ixquick. Jako dowód bezpieczeństwa wyszukiwania, Startpage.com reklamuje się jako jedyna wyszukiwarka posiadająca certyfikat prywatności UE.

Startpage.com obiecuje nie przechowywać adresów IP użytkowników i według serwisu nie wykorzystuje plików cookie do śledzenia. Dodatkowo strona Startpage.com jest dostępna z sieci Tor. Serwery wyszukiwarki zlokalizowane są w Holandii. Witryna posiada przydatną funkcję: wyniki wyszukiwania można przeglądać za pomocą opcji „Proxy”, która szyfruje połączenie z odpowiednią stroną internetową za pomocą serwera proxy. Jest to zatem prawdziwa wyszukiwarka bez ograniczeń: możesz bezpiecznie przeglądać to, co blokuje Twój dostawca. Wyszukiwarki proxy są główną cechą Startpage, co czyni ją wyszukiwarką pozbawioną cenzury. Jeśli chcesz wyszukiwać bez blokowania, ta usługa jest dla Ciebie.

DuckDuckGo to najpowszechniej używana bezpieczna alternatywa dla Google z ponad dziesięcioma milionami wyszukiwań dziennie. Mimo że serwery wyszukiwarki znajdują się w USA, DuckDuckGo.com nadal oferuje kilka interesujących funkcji.

Podczas przeszukiwania DuckDuckGo.com Twój adres IP nie będzie przechowywany. System nie wykorzystuje również plików cookies do śledzenia. DuckDuckGo wykorzystuje szyfrowanie HTTPS. Możesz także wpisać zapytanie do wyszukiwarki za pośrednictwem sieci Tor. Możesz także użyć różnych motywów, aby dostosować wygląd swojej strony wyszukiwania.

Nie można tutaj otwierać stron internetowych za pośrednictwem serwera proxy. Biorąc jednak pod uwagę fakt, że system ten znajduje się poza jurysdykcją Federacji Rosyjskiej, nie podlega on np. „prawu do bycia zapomnianym” w takim znaczeniu, w jakim jest rozumiane w naszym kraju. Wyniki wyszukiwania mogą nie być doskonałe, ale nadal są całkiem przydatne. Ta usługa jest bardziej odpowiednia dla tych, którzy cenią przede wszystkim anonimowość i wyszukiwanie bez śledzenia. Lub dla tych, którzy chcą znaleźć informacje wykluczone z wyników wyszukiwania w Federacji Rosyjskiej. Powinniśmy Cię jednak ostrzec: w Rosji DuckDuckGo zostało partnerem Yandex, więc możesz spodziewać się wszystkiego.

notEvil: przeszukiwanie nieistniejącego Internetu Wyszukiwarka notEvil umożliwia przeszukiwanie Internetu za pomocą anonimowej sieci Tor. Aby to zrobić, nie musisz instalować żadnego dodatkowego oprogramowania (choć będzie ono potrzebne do otwierania wyników wyszukiwania).

Wyszukiwarka ta umożliwia przeszukiwanie tzw. darknetu – tej części Internetu, która zazwyczaj jest niedostępna dla przeciętnego użytkownika. Dzięki blokowaniu stopniowo przenoszą się do niego przydatne usługi, na przykład umożliwiające pobieranie treści.

Anonimowe wyszukiwarki jako bezpieczna alternatywa dla Google

Wszystkie trzy wyszukiwarki nie rejestrują Twojego adresu IP ani nie wykorzystują plików cookie do śledzenia. Szyfrowanie przy użyciu protokołu HTTPS jest zapewniane przez wszystkich wymienionych dostawców. Wyszukiwarka DuckDuckGo uzyskała w teście najlepsze wyniki wyszukiwania, a przy wyborze alternatywnej wyszukiwarki z systemem Startpage.com otrzymasz gwarancję bezpieczeństwa. Certyfikat ochrony danych UE potwierdza, że ​​wyszukiwarka dotrzymuje obietnicy anonimowości wyszukiwania. NotEvil z kolei przydaje się do przeszukiwania darknetu.