Jak działa wyszukiwarka? Przegląd programów do wyszukiwania dokumentów i danych.

Profesjonalne wyszukiwanie w Internecie wymaga specjalistycznego oprogramowania, a także wyspecjalizowanych wyszukiwarek i usług wyszukiwania.

PROGRAMY

http://dr-watson.wix.com/home – program przeznaczony jest do badania tablic informacji tekstowych w celu identyfikacji bytów i powiązań między nimi. Efektem pracy jest raport dotyczący badanego obiektu.

http://www.fmsasg.com/ - jeden z najlepszych na świecie programów do wizualizacji połączeń i relacji Sentinel Vizualizer. Firma całkowicie zrusyfikowała swoje produkty i uruchomiła infolinię w języku rosyjskim.

http://www.newprosoft.com/ – „Web Content Extractor” to najpotężniejsze i najłatwiejsze w użyciu oprogramowanie do wydobywania danych ze stron internetowych. Posiada również skutecznego pająka Visual Web.

WitrynaSputnik – pakiet oprogramowania nie mający analogii na świecie, umożliwiający wyszukiwanie i przetwarzanie jego wyników w widzialnym i niewidzialnym Internecie, przy użyciu wszystkich niezbędnych użytkownikowi wyszukiwarek.

WebSite-Watcher – umożliwia monitorowanie stron internetowych, w tym chronionych hasłem, forów monitorujących, kanałów RSS, grup dyskusyjnych, plików lokalnych. Posiada wydajny system filtrów. Monitoring odbywa się automatycznie i jest dostarczany w przyjaznej dla użytkownika formie. Program z zaawansowanymi funkcjami kosztuje 50 euro. Stale aktualizowana.

http://www.scribd.com/ to najpopularniejsza platforma na świecie i coraz częściej wykorzystywana w Rosji do zamieszczania różnego rodzaju dokumentów, książek itp. za darmo dostęp z bardzo wygodną wyszukiwarką tytułów, tematów itp.

http://www.alasti.com/ to najpotężniejsze i najskuteczniejsze narzędzie do jakościowej analizy informacji dostępne dla użytkowników indywidualnych, małych i średnich przedsiębiorstw. Program jest wielofunkcyjny i dlatego przydatny. Łączy w sobie możliwość tworzenia jednolitego środowiska informacyjnego do pracy z różnymi plikami tekstowymi, tabelarycznymi, audio i wideo jako jedną całość, a także narzędzia do analizy jakościowej i wizualizacji.

Ashampoo ClipFinder HD – coraz większa część przepływu informacji pochodzi z wideo. W związku z tym funkcjonariusze wywiadu konkurencyjnego potrzebują narzędzi, które pozwolą im pracować z tym formatem. Jednym z takich produktów jest prezentowane przez nas bezpłatne narzędzie. Umożliwia wyszukiwanie filmów wideo w oparciu o określone kryteria w witrynach do przechowywania plików wideo, takich jak YouTube. Program jest łatwy w obsłudze, wyświetla wszystkie wyniki wyszukiwania na jednej stronie ze szczegółowymi informacjami, tytułami, czasem trwania, czasem przesłania filmu do magazynu itp. Istnieje rosyjski interfejs.

http://www.advego.ru/plagiatus/ – program został stworzony przez optymalizatory SEO, ale całkiem nadaje się jako narzędzie inteligencji internetowej. Plagiat pokazuje stopień niepowtarzalności tekstu, źródła tekstu i procent dopasowania tekstu. Program sprawdza także unikalność podanego adresu URL. Program jest bezpłatny.

http://neiron.ru/toolbar/ – zawiera dodatek umożliwiający łączenie wyszukiwania Google i Yandex, a także pozwala na analizę konkurencji opartą na ocenie efektywności serwisów i reklam kontekstowych. Zaimplementowany jako wtyczka do FF i GC.

http://web-data-extractor.net/ to uniwersalne rozwiązanie umożliwiające pozyskanie dowolnych danych dostępnych w Internecie. Konfiguracja wycinania danych z dowolnej strony odbywa się za pomocą kilku kliknięć myszką. Wystarczy, że wybierzesz obszar danych, który chcesz zapisać, a Datacol automatycznie wybierze formułę wycięcia tego bloku.

CaptureSaver to profesjonalne narzędzie do badania Internetu. Po prostu niezbędny działający program, który pozwala przechwytywać, przechowywać i eksportować dowolne informacje internetowe, w tym nie tylko strony internetowe, blogi, ale także wiadomości RSS, e-mail, obrazy i wiele więcej. Ma najszerszą funkcjonalność, intuicyjny interfejs i śmieszną cenę.

http://www.orbiscope.net/en/software.html – system monitorowania sieci w ponad przystępnych cenach.

http://www.kbcrawl.co.uk/ – oprogramowanie do pracy m.in. w „Niewidzialnym Internecie”.

http://www.copernic.com/en/products/agent/index.html – program umożliwia wyszukiwanie za pomocą ponad 90 wyszukiwarek, z wykorzystaniem ponad 10 parametrów. Umożliwia łączenie wyników, eliminowanie duplikatów, blokowanie uszkodzonych linków i wyświetlanie najbardziej trafnych wyników. Występuje w wersjach bezpłatnej, osobistej i profesjonalnej. Używany przez ponad 20 milionów użytkowników.

Maltego to całkowicie nowe oprogramowanie, które pozwala ustalić powiązania podmiotów, wydarzeń i obiektów w prawdziwym życiu i w Internecie.

USŁUGI

nowość https://hunter.io/ – skuteczna usługa wykrywania i sprawdzania poczty elektronicznej.

https://www.whatruns.com/ to łatwy w użyciu, ale skuteczny skaner, który pozwala wykryć, co działa, a co nie, na stronie internetowej i jakie są luki w zabezpieczeniach. Zaimplementowano również jako wtyczkę dla Chrom.

https://www.crayon.co/ to amerykańska platforma budżetowa służąca do wywiadu rynkowego i konkurencyjnego w Internecie.

http://www.cs.cornell.edu/~bwong/octant/ – identyfikator hosta.

https://iplogger.ru/ – prosta i wygodna usługa służąca do ustalania cudzego adresu IP.

http://linkurio.us/ to nowy, zaawansowany produkt dla pracowników ds. bezpieczeństwa gospodarczego i śledczych zajmujących się korupcją. Przetwarza i wizualizuje ogromne ilości nieustrukturyzowanych informacji pochodzących ze źródeł finansowych.

http://www.intelsuite.com/en – anglojęzyczna platforma internetowa służąca do wywiadu i monitorowania konkurencji.

http://yewno.com/about/ to pierwszy system operacyjny umożliwiający tłumaczenie informacji na wiedzę i wizualizację nieustrukturyzowanych informacji. Obecnie obsługuje język angielski, francuski, niemiecki, hiszpański i portugalski.

https://start.avalancheonline.ru/landing/?next=%2F – usługi prognostyczne i analityczne Andrieja Masalowicza.

https://www.outwit.com/products/hub/ – kompletny zestaw samodzielnych programów do profesjonalnej pracy w web 1.

https://github.com/search?q=user%3Acmlh+maltego – rozszerzenia dla Maltego.

http://www.whoishostingthis.com/ – wyszukiwarka hostingu, adresów IP itp.

http://appfollow.ru/ – analiza aplikacji na podstawie recenzji, optymalizacji ASO, pozycji w czołówkach i wynikach wyszukiwania dla App Store, Google Play i Windows Phone Store.

http://spiraldb.com/ to usługa zaimplementowana jako wtyczka do Chroma, która pozwala uzyskać wiele cennych informacji o dowolnym zasobie elektronicznym.

https://millie.northernlight.com/dashboard.php?id=93 - bezpłatna usługa gromadząca i porządkująca kluczowe informacje na temat branż i firm. Istnieje możliwość wykorzystania paneli informacyjnych na podstawie analizy tekstu.

http://byratino.info/ – zbieranie danych faktycznych z publicznie dostępnych źródeł w Internecie.

http://www.datafox.co/ – Platforma CI gromadzi i analizuje informacje o firmach interesujących klientów. Jest demo.

https://unwiredlabs.com/home - specjalistyczna aplikacja z API do wyszukiwania poprzez geolokalizację dowolnego urządzenia podłączonego do Internetu.

http://visualping.io/ – usługa monitorowania serwisów, a przede wszystkim dostępnych na nich zdjęć i obrazów. Nawet jeśli zdjęcie pojawi się tylko na sekundę, znajdzie się w e-mailu subskrybenta. Posiada wtyczkę do przeglądarki Google Chrome.

http://spyonweb.com/ to narzędzie badawcze, które pozwala na dogłębną analizę dowolnego zasobu Internetu.

http://bigvisor.ru/ – usługa umożliwia śledzenie kampanii reklamowych określonych segmentów towarów i usług lub konkretnych organizacji.

http://www.itsec.pro/2013/09/microsoft-word.html – instrukcje Artema Ageeva dotyczące korzystania z programów Windows na potrzeby wywiadu konkurencyjnego.

http://granoproject.org/ to narzędzie typu open source dla badaczy śledzących sieci powiązań między osobami i organizacjami w polityce, ekonomii, przestępczości itp. Pozwala łączyć, analizować i wizualizować informacje uzyskane z różnych źródeł, a także pokazywać istotne powiązania.

http://imgops.com/ – usługa wydobywania metadanych z plików graficznych i pracy z nimi.

http://sergeybelove.ru/tools/one-button-scan/ – mały skaner online do sprawdzania luk w zabezpieczeniach stron internetowych i innych zasobów.

http://isce-library.net/epi.aspx – usługa wyszukiwania źródeł pierwotnych na podstawie fragmentu tekstu w języku angielskim

https://www.rivaliq.com/ to skuteczne narzędzie do prowadzenia wywiadu konkurencyjnego na zachodnich, przede wszystkim europejskich i amerykańskich rynkach towarów i usług.

http://watchthatpage.com/ to usługa pozwalająca na automatyczne zbieranie nowych informacji z monitorowanych zasobów Internetu. Usługa jest bezpłatna.

http://falcon.io/ to rodzaj raportu dla sieci. Nie zastępuje Rapportive, ale zapewnia dodatkowe narzędzia. Natomiast Rapportive udostępnia ogólny profil osoby, jakby sklejony z danych z portali społecznościowych i wzmianek w sieci.http://watchthatpage.com/ - usługa pozwalająca na automatyczne zbieranie nowych informacji z monitorowanych zasobów na Internet. Usługa jest bezpłatna.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – dodatek do przeglądarki Firefox. Monitoruje aktualizacje stron internetowych. Przydatne w przypadku witryn internetowych, które nie mają kanałów informacyjnych (Atom lub RSS).

http://agregator.pro/ – agregator portali informacyjnych i medialnych. Używane przez marketerów, analityków itp. analizować przepływ wiadomości na określone tematy.

http://price.apisshops.com/ – zautomatyzowany serwis internetowy służący do monitorowania cen dla wybranych grup produktów, konkretnych sklepów internetowych i innych parametrów.

http://www.la0.ru/ to wygodna i odpowiednia usługa służąca do analizy linków i linków zwrotnych do zasobu internetowego.

www.recordedfuture.com to potężne narzędzie do analizy i wizualizacji danych, realizowane jako usługa internetowa zbudowana w oparciu o chmurę obliczeniową.

http://advse.ru/ to serwis pod hasłem „Dowiedz się wszystkiego o swoich konkurentach”. Umożliwia wyszukiwanie witryn konkurencji zgodnie z wyszukiwanymi hasłami oraz analizowanie kampanii reklamowych konkurencji w Google i Yandex.

http://spyonweb.com/ – usługa umożliwia identyfikację witryn o tej samej charakterystyce, w tym korzystających z tych samych identyfikatorów usługi statystycznej Google Analytics, adresów IP itp.

http://www.connotate.com/solutions – linia produktów do wywiadu konkurencyjnego, zarządzania przepływem informacji i przekształcania informacji w zasoby informacyjne. Obejmuje zarówno złożone platformy, jak i proste, tanie usługi, które pozwalają na skuteczny monitoring wraz z kompresją informacji i uzyskiwanie jedynie niezbędnych wyników.

http://www.clearci.com/ - platforma wywiadu konkurencyjnego dla firm różnej wielkości, od start-upów i małych firm po firmy z listy Fortune 500. Rozwiązane jako saas.

http://startingpage.com/ to dodatek Google, który umożliwia wyszukiwanie w Google bez zapisywania adresu IP. W pełni obsługuje wszystkie możliwości wyszukiwania Google, w tym w języku rosyjskim.

http://newspapermap.com/ to wyjątkowa usługa, która jest bardzo przydatna dla oficera wywiadu konkurencyjnego. Łączy geolokalizację z internetową wyszukiwarką multimediów. Te. wybierasz interesujący Cię region, a nawet miasto, czy język, widzisz miejsce na mapie oraz listę internetowych wersji gazet i czasopism, klikasz odpowiedni przycisk i czytasz. Obsługuje język rosyjski, bardzo przyjazny interfejs użytkownika.

http://infostream.com.ua/ to bardzo wygodny system monitorowania wiadomości „Infostream”, wyróżniający się pierwszorzędnym wyborem i dość dostępny dla każdego portfela, od jednego z klasyków wyszukiwania internetowego, D.V. Lande.

http://www.instapaper.com/ to bardzo proste i skuteczne narzędzie do zapisywania niezbędnych stron internetowych. Można używać na komputerach, iPhone'ach, iPadach itp.

http://screen-scraper.com/ – umożliwia automatyczne wydobywanie wszystkich informacji ze stron internetowych, pobieranie zdecydowanej większości formatów plików i automatyczne wprowadzanie danych do różnych formularzy. Zapisuje pobrane pliki i strony w bazach danych oraz realizuje wiele innych niezwykle przydatnych funkcji. Działa na wszystkich głównych platformach, ma w pełni funkcjonalne darmowe i bardzo wydajne wersje profesjonalne.

http://www.mozenda.com/ - ma kilka planów taryfowych i jest dostępny nawet dla małych firm, serwis internetowy służący do wielofunkcyjnego monitorowania sieci i dostarczania niezbędnych użytkownikowi informacji z wybranych witryn.

http://www.recipdonor.com/ - usługa pozwala na automatyczne monitorowanie wszystkiego, co dzieje się na stronach konkurencji.

http://www.spyfu.com/ – i to w przypadku, gdy Twoi konkurenci są zagraniczni.

www.webground.su to usługa monitorowania Runetu stworzona przez profesjonalistów zajmujących się wyszukiwaniem internetowym, która obejmuje wszystkich głównych dostawców informacji, aktualności itp. i umożliwia indywidualne ustawienia monitorowania zgodnie z potrzebami użytkownika.

WYSZUKIWARKI

https://www.idmarch.org/ to najlepsza pod względem jakości wyszukiwarka światowego archiwum dokumentów PDF. Obecnie zindeksowano ponad 18 milionów dokumentów PDF, od książek po tajne raporty.

http://www.marketvisual.com/ to unikalna wyszukiwarka, która umożliwia wyszukiwanie właścicieli i najwyższej kadry kierowniczej według pełnego imienia i nazwiska, nazwy firmy, stanowiska lub ich kombinacji. Wyniki wyszukiwania zawierają nie tylko poszukiwane obiekty, ale także ich powiązania. Zaprojektowany głównie dla krajów anglojęzycznych.

http://worldc.am/ to wyszukiwarka ogólnodostępnych zdjęć powiązanych z geolokalizacją.

https://app.echosec.net/ to publiczna wyszukiwarka, która sama siebie określa jako najbardziej zaawansowane narzędzie analityczne dla specjalistów zajmujących się egzekwowaniem prawa oraz specjalistami ds. bezpieczeństwa i wywiadu. Umożliwia wyszukiwanie zdjęć zamieszczonych na różnych portalach, platformach społecznościowych i portalach społecznościowych w odniesieniu do określonych współrzędnych geolokalizacyjnych. Obecnie podłączonych jest siedem źródeł danych. Do końca roku będzie ich już ponad 450. Dziękujemy Dementy za podpowiedź.

http://www.quandl.com/ to wyszukiwarka siedmiu milionów baz danych finansowych, ekonomicznych i społecznych.

http://bitzakaz.ru/ – wyszukiwarka przetargów i zamówień rządowych z dodatkowymi płatnymi funkcjami

Wyszukiwarka witryn internetowych - umożliwia znalezienie witryn, które Google nie jest dobrze indeksowane. Jedynym ograniczeniem jest to, że przeszukuje tylko 30 witryn internetowych dla każdego słowa kluczowego. Program jest łatwy w użyciu.

http://www.dtsearch.com/ to potężna wyszukiwarka, która pozwala przetwarzać terabajty tekstu. Działa na komputerach stacjonarnych, w Internecie i intranecie. Obsługuje zarówno dane statyczne, jak i dynamiczne. Umożliwia wyszukiwanie we wszystkich programach pakietu MS Office. Wyszukiwanie odbywa się za pomocą fraz, słów, tagów, indeksów i wielu innych. Jedyna dostępna federacyjna wyszukiwarka. Ma zarówno wersję płatną, jak i bezpłatną.

http://www.strategator.com/ – wyszukuje, filtruje i agreguje informacje o firmie z dziesiątek tysięcy źródeł internetowych. Wyszukiwania w USA, Wielkiej Brytanii, głównych krajach EWG. Jest bardzo przydatny, przyjazny dla użytkownika i oferuje opcje bezpłatne i płatne (14 USD miesięcznie).

http://www.shodanhq.com/ to niezwykła wyszukiwarka. Zaraz po swoim pojawieniu się otrzymał przydomek „Google dla hakerów”. Nie wyszukuje stron, ale określa adresy IP, typy routerów, komputerów, serwerów i stacji roboczych znajdujących się pod określonym adresem, śledzi łańcuchy serwerów DNS i pozwala na wdrożenie wielu innych ciekawych funkcji dla inteligencji konkurencyjnej.

http://search.usa.gov/ to wyszukiwarka stron internetowych i otwartych baz danych wszystkich agencji rządowych USA. W bazach danych znajduje się wiele praktycznych, przydatnych informacji, m.in. do wykorzystania w naszym kraju.

http://visual.ly/ – dziś wizualizacja jest coraz częściej wykorzystywana do prezentacji danych. To pierwsza wyszukiwarka infograficzna w sieci. Portal wraz z wyszukiwarką posiada rozbudowane narzędzia do wizualizacji danych, które nie wymagają umiejętności programowania.

http://go.mail.ru/realtime – wyszukuj dyskusje na tematy, wydarzenia, obiekty, tematy w czasie rzeczywistym lub dostosowywalnym. Wcześniej bardzo krytykowane wyszukiwanie w Mail.ru działa bardzo skutecznie i zapewnia interesujące, trafne wyniki.

Zanran właśnie został uruchomiony, ale już działa świetnie, pierwsza i jedyna wyszukiwarka danych, która wydobywa dane z plików PDF, tabel EXCEL, danych na stronach HTML.

http://www.ciradar.com/Competitive-Analytics.aspx to jeden z najlepszych na świecie systemów wyszukiwania informacji na potrzeby wywiadu konkurencyjnego w głębokiej sieci Web. Pobiera prawie wszystkie typy plików we wszystkich formatach na interesujący Cię temat. Wdrożony jako usługa internetowa. Ceny są więcej niż rozsądne.

http://public.ru/ – Skuteczne wyszukiwanie i profesjonalna analiza informacji, archiwum medialne od 1990 roku. Internetowa biblioteka mediów oferuje szeroki zakres usług informacyjnych: od dostępu do elektronicznych archiwów rosyjskojęzycznych publikacji medialnych i gotowych tematycznych przeglądów prasy po indywidualny monitoring i ekskluzywne badania analityczne na podstawie materiałów prasowych.

Cluuz to młoda wyszukiwarka oferująca szerokie możliwości analizy konkurencji, zwłaszcza w anglojęzycznym Internecie. Pozwala nie tylko znajdować, ale także wizualizować i nawiązywać połączenia pomiędzy osobami, firmami, domenami, e-mailami, adresami itp.

www.wolframalpha.com – wyszukiwarka jutra. W odpowiedzi na żądanie wyszukiwania udostępnia informacje statystyczne i faktyczne dostępne na temat obiektu żądania, w tym informacje wizualizowane.

www.ist-budget.ru – uniwersalne wyszukiwanie w bazach danych o zamówieniach rządowych, przetargach, aukcjach itp.

Na pierwszy rzut oka może się wydawać, że tylko Yandex może być lepszy od Google, a nawet to nie jest faktem. Firmy te inwestują ogromne pieniądze w innowacje i rozwój. Czy naprawdę ktoś ma szansę nie tylko rywalizować z liderami, ale i zwyciężyć? Odpowiedź Lifehackera: „Tak!” Istnieje kilka wyszukiwarek, które odniosły sukces. Przyjrzyjmy się naszym bohaterom.

Co to jest

Jest to dość znana wyszukiwarka typu open source. Serwery znajdują się w USA. Oprócz własnego robota wyszukiwarka wykorzystuje wyniki z innych źródeł: Yahoo! Szukaj BOSS, Wikipedia, Wolfram|Alfa.

Lepiej

DuckDuckGo pozycjonuje się jako wyszukiwarka zapewniająca maksymalną prywatność i poufność. System nie zbiera żadnych danych o użytkowniku, nie przechowuje logów (nie ma historii wyszukiwania), a stosowanie plików cookies jest maksymalnie ograniczone.

DuckDuckGo nie gromadzi ani nie udostępnia danych osobowych użytkowników. To jest nasza polityka prywatności.
Gabriel Weinberg, założyciel DuckDuckGo

Dlaczego tego potrzebujesz

Wszystkie liczące się wyszukiwarki internetowe starają się personalizować wyniki wyszukiwania na podstawie danych o osobie przed monitorem. Zjawisko to nazywa się „bańką filtrującą”: użytkownik widzi tylko te wyniki, które są zgodne z jego preferencjami lub które system za takie uznaje.

DuckDuckGo tworzy obiektywny obraz niezależny od Twoich wcześniejszych zachowań w Internecie i eliminuje reklamy tematyczne z Google i Yandex na podstawie Twoich zapytań. Dzięki DuckDuckGo wyszukiwanie informacji w językach obcych jest łatwe: Google i Yandex domyślnie preferują strony rosyjskojęzyczne, nawet jeśli zapytanie zostanie wprowadzone w innym języku.

Co to jest

„” to rosyjski system metawyszukiwarek opracowany przez absolwentów Moskiewskiego Uniwersytetu Państwowego Wiktora Ławrenkę i Władimira Czernyszowa. Przeszukuje indeksy Google, Bing, Yandex i innych, a także posiada własny algorytm wyszukiwania.

Lepiej

Przeszukiwanie indeksów wszystkich głównych wyszukiwarek pozwala na wygenerowanie trafnych wyników. Dodatkowo Nigma dzieli wyniki na kilka grup tematycznych (klastrów) i zaprasza użytkownika do zawężenia pola wyszukiwania, odrzucając niepotrzebne lub podkreślając te priorytetowe. Dzięki modułom Matematyka i Chemia możesz rozwiązywać problemy matematyczne i pytać o wyniki reakcji chemicznych bezpośrednio w pasku wyszukiwania.

Dlaczego tego potrzebujesz

Eliminuje konieczność wyszukiwania tego samego zapytania w różnych wyszukiwarkach. System klastrowy ułatwia manipulowanie wynikami wyszukiwania. Przykładowo Nigma zbiera wyniki ze sklepów internetowych w osobny klaster. Jeżeli nie masz zamiaru nic kupować to po prostu wyklucz tę grupę. Wybierając klaster „Witryny anglojęzyczne”, otrzymasz wyniki wyłącznie w języku angielskim. Moduły matematyczne i chemiczne pomogą uczniom w wieku szkolnym.

Niestety projekt nie jest aktualnie rozwijany, gdyż deweloperzy przenieśli swoją działalność na rynek wietnamski. Niemniej jednak „Nigma” nie tylko nie jest jeszcze przestarzała, ale pod pewnymi względami nadal daje Google przewagę. Miejmy nadzieję, że rozwój zostanie wznowiony.

Co to jest

not Evil to system przeszukujący anonimową sieć Tor. Aby z niego skorzystać, należy udać się do tej sieci, na przykład uruchamiając wyspecjalizowaną przeglądarkę o tej samej nazwie. not Evil nie jest jedyną wyszukiwarką tego typu. Istnieje LOOK (domyślna wyszukiwarka w przeglądarce Tor, dostępna z poziomu zwykłego Internetu) lub TORCH (jedna z najstarszych wyszukiwarek w sieci Tor) i inne. Zdecydowaliśmy się na Not Evil ze względu na wyraźne nawiązanie do samego Google (wystarczy spojrzeć na stronę startową).

Lepiej

Wyszukuje tam, gdzie Google, Yandex i inne wyszukiwarki są zazwyczaj zamknięte.

Dlaczego tego potrzebujesz

Sieć Tor zawiera wiele zasobów, których nie można znaleźć w przestrzegającym prawa Internecie. A w miarę zacieśniania się kontroli rządu nad treścią Internetu ich liczba będzie rosła. Tor jest rodzajem sieci w sieci: z własnymi sieciami społecznościowymi, narzędziami do śledzenia torrentów, mediami, platformami handlowymi, blogami, bibliotekami i tak dalej.

YaCy

Co to jest

YaCy to zdecentralizowana wyszukiwarka działająca na zasadzie sieci P2P. Każdy komputer, na którym zainstalowany jest główny moduł oprogramowania, samodzielnie skanuje Internet, czyli działa analogicznie do robota wyszukującego. Uzyskane wyniki gromadzone są we wspólnej bazie danych, z której korzystają wszyscy uczestnicy YaCy.

Lepiej

Trudno powiedzieć, czy to lepiej, czy gorzej, ponieważ YaCy to zupełnie inne podejście do organizacji poszukiwań. Brak jednego serwera i firmy będącej właścicielem sprawia, że wyniki są całkowicie niezależne od niczyich preferencji. Autonomia każdego węzła eliminuje cenzurę. YaCy potrafi przeszukiwać głęboką sieć i nieindeksowane sieci publiczne.

Dlaczego tego potrzebujesz

Jeśli jesteś zwolennikiem oprogramowania typu open source i wolnego Internetu, na które nie mają wpływu agencje rządowe i duże korporacje, to YaCy jest twoim wyborem. Można go również wykorzystać do zorganizowania wyszukiwania w obrębie sieci korporacyjnej lub innej sieci autonomicznej. I choć YaCy nie jest zbyt przydatny w życiu codziennym, to jest godną alternatywą dla Google'a pod względem procesu wyszukiwania.

Pipl

Co to jest

Pipl to system przeznaczony do wyszukiwania informacji o konkretnej osobie.

Lepiej

Autorzy Pipl twierdzą, że ich wyspecjalizowane algorytmy wyszukują wydajniej niż „zwykłe” wyszukiwarki. W szczególności priorytetowymi źródłami informacji są profile na portalach społecznościowych, komentarze, listy członków i różne bazy danych, w których publikowane są informacje o osobach, np. orzeczenia sądowe. Wiodącą pozycję Pipl w tym obszarze potwierdzają oceny Lifehacker.com, TechCrunch i inne publikacje.

Dlaczego tego potrzebujesz

Jeśli potrzebujesz znaleźć informacje o osobie mieszkającej w USA, Pipl będzie znacznie skuteczniejszy niż Google. Bazy danych rosyjskich sądów są najwyraźniej niedostępne dla wyszukiwarki. Dlatego nie radzi sobie tak dobrze z obywatelami Rosji.

Co to jest

Kolejna wyspecjalizowana wyszukiwarka. Wyszukuje różne dźwięki (dom, przyroda, samochody, ludzie itp.) w otwartych źródłach. Usługa nie obsługuje zapytań w języku rosyjskim, ale istnieje imponująca lista tagów w języku rosyjskim, które można wyszukiwać.

Lepiej

Dane wyjściowe zawierają tylko dźwięki i nic więcej. W ustawieniach wyszukiwania możesz ustawić żądany format i jakość dźwięku. Wszystkie znalezione dźwięki są dostępne do pobrania. Istnieje wyszukiwanie dźwięków według wzoru.

Dlaczego tego potrzebujesz

Jeśli potrzebujesz szybko odnaleźć odgłos wystrzału z muszkietu, uderzenia dzięcioła ssącego lub krzyk Homera Simpsona, to ta usługa jest dla Ciebie. I wybrałem to tylko z dostępnych zapytań w języku rosyjskim. W języku angielskim spektrum jest jeszcze szersze. Ale poważnie, wyspecjalizowana usługa wymaga wyspecjalizowanej publiczności. Ale co, jeśli przyda się również Tobie?

Życie alternatywnych wyszukiwarek jest często ulotne. Lifehacker zapytał byłego dyrektora generalnego ukraińskiego oddziału Yandex, Siergieja Petrenko, o długoterminowe perspektywy takich projektów.

Jeśli chodzi o los alternatywnych wyszukiwarek, sprawa jest prosta: mają to być projekty bardzo niszowe, z małą publicznością, a więc bez wyraźnych perspektyw komercyjnych lub odwrotnie, z całkowitą jasnością ich braku.

Jeśli spojrzysz na przykłady w artykule, zobaczysz, że takie wyszukiwarki albo specjalizują się w wąskiej, ale popularnej niszy, która być może nie urosła jeszcze na tyle, aby być zauważalna na radarach Google czy Yandex, albo testują oryginalna hipoteza w rankingu, która nie ma jeszcze zastosowania w zwykłym wyszukiwaniu.

Na przykład, jeśli wyszukiwanie w Toru nagle okaże się poszukiwane, to znaczy wyniki z niego będą potrzebne co najmniej procentowi odbiorców Google, wtedy oczywiście zwykłe wyszukiwarki zaczną rozwiązywać problem, jak to zrobić znajdź je i pokaż użytkownikowi. Jeśli zachowanie odbiorców wykaże, że dla znacznej części użytkowników w znacznej liczbie zapytań wyniki podane bez uwzględnienia czynników zależnych od użytkownika wydają się bardziej trafne, to Yandex lub Google zaczną generować takie wyniki.

„Być lepszym” w kontekście tego artykułu nie oznacza „być lepszym we wszystkim”. Tak, pod wieloma względami nasi bohaterowie są dalecy od Google i Yandex (nawet daleko od Binga). Ale każda z tych usług daje użytkownikowi coś, czego nie mogą zaoferować giganci branży wyszukiwania.

Witam, drodzy czytelnicy bloga. , to nieliczni użytkownicy mieli dość własnych zakładek. Jednak, jak pamiętacie, działo się to w postępie geometrycznym i bardzo szybko nawigacja w całej jej różnorodności stała się trudniejsza.

Następnie pojawiły się katalogi (Yahoo, Dmoz i inne), w których ich autorzy dodawali i sortowali różne strony w kategorie. To od razu ułatwiło życie ówczesnym, niezbyt licznym użytkownikom globalnej sieci. Wiele z tych katalogów żyje do dziś.

Jednak po pewnym czasie rozmiar ich baz danych stał się tak duży, że programiści najpierw pomyśleli o stworzeniu w nich wyszukiwarki, a następnie o stworzeniu zautomatyzowanego systemu indeksowania wszystkich treści internetowych, aby były one dostępne dla każdego.

Główne wyszukiwarki rosyjskojęzycznego segmentu Internetu

Jak rozumiesz, pomysł ten został wdrożony z oszałamiającym sukcesem, ale wszystko skończyło się dobrze tylko dla kilku wybranych firm, którym udało się nie zniknąć w Internecie. Prawie wszystkie wyszukiwarki, które pojawiły się w pierwszej fali, teraz albo zniknęły, popadły w ruinę, albo zostały kupione przez konkurentów odnoszących większe sukcesy.

Wyszukiwarka to mechanizm bardzo złożony i, co ważne, bardzo zasobochłonny (nie chodzi tu tylko o zasoby materialne, ale także ludzkie). Za pozornie prostym, czyli jego ascetycznym odpowiednikiem od Google, stoją tysiące pracowników, setki tysięcy serwerów i wiele miliardów inwestycji, które są niezbędne, aby ten kolos mógł nadal działać i zachować konkurencyjność.

Wejście teraz na ten rynek i zaczynanie od zera to raczej utopia niż realny projekt biznesowy. Przykładowo jedna z najbogatszych korporacji świata, Microsoft, od kilkudziesięciu lat próbuje zdobyć przyczółek na rynku wyszukiwarek i dopiero teraz ich wyszukiwarka Bing powoli zaczyna spełniać ich oczekiwania. A wcześniej była cała seria niepowodzeń i niepowodzeń.

Co możemy powiedzieć o wejściu na ten rynek bez specjalnych wpływów finansowych. Na przykład nasza krajowa wyszukiwarka Nigma ma w swoim arsenale wiele przydatnych i innowacyjnych rzeczy, ale ich ruch jest tysiące razy mniejszy niż liderów rynku rosyjskiego. Przyjrzyj się na przykład codziennej publiczności Yandex:

W związku z tym możemy założyć, że lista głównych (najlepszych i najszczęśliwszych) wyszukiwarek Runeta i całego Internetu została już utworzona, a cała intryga polega tylko na tym, kto ostatecznie kogo pożre lub jak będzie ich procentowy udział zostać rozdzielone, jeśli wszystkie przeżyją i utrzymają się na powierzchni.

Rosyjski rynek wyszukiwarek jest bardzo wyraźnie widoczna i tutaj prawdopodobnie możemy wyróżnić dwóch lub trzech głównych graczy i kilku pomniejszych. Ogólnie rzecz biorąc, w RuNet powstała dość wyjątkowa sytuacja, która, jak rozumiem, powtórzyła się tylko w dwóch innych krajach na świecie.

Mówię o tym, że wyszukiwarka Google, która przybyła do Rosji w 2004 roku, nadal nie była w stanie objąć przywództwa. Właściwie w tym okresie próbowali kupić Yandex, ale coś tam nie wyszło i teraz „nasza Rosja”, wraz z Czechami i Chinami, to miejsca, w których wszechmocny Google, jeśli nie zostanie pokonany, to w w każdym razie napotkał poważny opór.

W rzeczywistości, aby zobaczyć aktualny stan rzeczy wśród najlepsze wyszukiwarki w RuNet Każdy może. Wystarczy wkleić ten adres URL w pasek adresu przeglądarki:

Http://www.liveinternet.ru/stat/ru/searches.html?period=miesiąc;total=tak

Faktem jest, że większość z nich korzysta.

Po wejściu na podany adres URL naszym oczom ukazuje się obraz, który nie jest zbyt atrakcyjny i reprezentacyjny, ale dobrze oddaje istotę sprawy. Zwróć uwagę na pięć najlepszych wyszukiwarek, z których korzystają witryny w języku rosyjskim:

Tak, oczywiście nie wszystkie zasoby z treściami w języku rosyjskim znajdują się w tej strefie. Istnieją również SU i RF, a ogólne obszary, takie jak COM czy NET, są pełne projektów internetowych skupionych na Runecie, ale mimo to próba jest dość reprezentatywna.

Zależność tę można przedstawić w bardziej barwny sposób, tak jak ktoś zrobił to np. w Internecie w ramach swojej prezentacji:

Nie zmienia to istoty. Jest kilku liderów i kilku bardzo, bardzo daleko w tyle za wyszukiwarkami. Swoją drogą, o wielu z nich już pisałem. Czasami zanurzenie się w historię sukcesu lub odwrotnie, zagłębienie się w przyczyny niepowodzeń niegdyś obiecujących wyszukiwarek może być całkiem interesujące.

Tak więc, w kolejności ważności dla Rosji i Runetu jako całości, wymienię je i podam krótką charakterystykę:

Wyszukiwanie w Google stało się już powszechnie znanym słowem wielu ludzi na świecie – możesz o tym przeczytać w linku. W tej wyszukiwarce spodobała mi się opcja „tłumaczenia wyników”, gdy otrzymywałeś odpowiedzi z całego świata, ale w swoim ojczystym języku, ale teraz niestety nie jest ona dostępna (przynajmniej na google.ru).

Ostatnio zastanawia mnie także jakość ich wyników (strona wyników wyszukiwania). Osobiście zawsze najpierw korzystam z lustrzanej wyszukiwarki RuNet (tam jest, cóż, jestem do tego przyzwyczajony) i dopiero jeśli nie znajdę tam zrozumiałej odpowiedzi, zwracam się do Google.

Zwykle ich wypuszczenie mnie cieszyło, ale ostatnio tylko mnie to zdziwiło – czasami wychodzą takie bzdury. Możliwe, że ich walka o zwiększenie przychodów z reklam kontekstowych i ciągłe przesuwanie wyników wyszukiwania w celu zdyskredytowania promocji SEO może przynieść odwrotny skutek. W każdym razie ta wyszukiwarka ma konkurenta w RuNet i jakiego rodzaju.

Myślę, że jest mało prawdopodobne, aby ktokolwiek specjalnie odwiedził Go.mail.ru, aby szukać w RuNet. Dlatego ruch do projektów rozrywkowych z tej wyszukiwarki może wynosić znacznie więcej niż dziesięć procent. Właściciele takich projektów powinni zwrócić uwagę na ten system.

Jednak oprócz wyraźnych liderów rynku wyszukiwarek rosyjskojęzycznego segmentu Internetu jest jeszcze kilku graczy, których udział jest dość niski, ale mimo to sam fakt ich istnienia powoduje, że trzeba powiedzieć kilka słów o nich.

Wyszukiwarki Runet z drugiego rzutu

Wyszukiwarki internetowe

W zasadzie w skali całego Internetu poważny gracz jest tylko jeden – Google. To niekwestionowany lider, choć wciąż ma pewną konkurencję.

Po pierwsze, nadal jest tak samo Bing, która na przykład ma bardzo dobrą pozycję na rynku amerykańskim, zwłaszcza biorąc pod uwagę, że jej silnik jest używany także we wszystkich usługach Yahoo (prawie jedna trzecia całego rynku wyszukiwania w USA).

Otóż po drugie, w związku z ogromnym udziałem użytkowników z Chin w ogólnej liczbie użytkowników Internetu, ich główna wyszukiwarka tzw. Baidu wcina się w rozkład miejsc na świecie Olimpu. Urodził się w 2000 roku i obecnie jego udział stanowi około 80% całej krajowej widowni w Chinach.

Trudno powiedzieć coś bardziej zrozumiałego o Baidu, ale w Internecie krążą opinie, że miejsca na jego Top zajmują nie tylko strony najbardziej istotne dla zapytania, ale także ci, którzy za to zapłacili (bezpośrednio do wyszukiwarki) , a nie do biura SEO). Oczywiście dotyczy to przede wszystkim ofert komercyjnych.

Generalnie patrząc na statystyki staje się jasne, dlaczego Google łatwo godzi się na pogorszenie wyników wyszukiwania w zamian za zwiększenie zysków z reklamy kontekstowej. Tak naprawdę nie boją się odpływu użytkowników, bo w większości przypadków nie mają dokąd pójść. Sytuacja jest nieco smutna, ale zobaczymy, co będzie dalej.

Nawiasem mówiąc, aby jeszcze bardziej utrudnić życie optymalizatorom i być może zachować spokój użytkowników tej wyszukiwarki, Google użył ostatnio szyfrowania podczas przesyłania zapytań z przeglądarek użytkowników do paska wyszukiwania. Wkrótce w statystykach liczników odwiedzin nie będzie już można zobaczyć, z jakimi zapytaniami przyszli do Ciebie użytkownicy Google.

Oczywiście oprócz wyszukiwarek wymienionych w tej publikacji istnieją tysiące innych - regionalnych, specjalistycznych, egzotycznych itp. Próba wymienienia i opisania ich wszystkich w jednym artykule byłaby niemożliwa i prawdopodobnie nie konieczna. Powiedzmy lepiej kilka słów o jak łatwo jest stworzyć wyszukiwarkę oraz jak łatwo i niedrogo można je aktualizować.

Zdecydowana większość systemów działa na podobnych zasadach (przeczytaj o tym i tamtym) i ma ten sam cel – dać użytkownikom odpowiedź na ich pytanie. Co więcej, odpowiedź ta musi być relewantna (odpowiadająca pytaniu), wyczerpująca i, co nie jest nieistotne, relewantna (pierwszej świeżości).

Rozwiązanie tego problemu nie jest takie proste, zwłaszcza biorąc pod uwagę, że wyszukiwarka będzie musiała na bieżąco analizować zawartość miliardów stron internetowych, odsiewać te niepotrzebne, a z pozostałych tworzyć listę (kwestię), na której najwięcej jako pierwsze pojawią się odpowiednie odpowiedzi na pytanie użytkownika.

To niezwykle złożone zadanie rozwiązuje się poprzez wstępne zebranie informacji z tych stron za pomocą różnych roboty indeksujące. Zbierają linki z już odwiedzonych stron i ładują z nich informacje do bazy wyszukiwarki. Istnieją boty indeksujące tekst (zwykły i szybki bot, który żyje z aktualności i często aktualizowanych zasobów, dzięki czemu w wynikach zawsze prezentowane są najnowsze dane).

Oprócz tego istnieją roboty indeksujące obrazy (w celu ich późniejszego wyprowadzenia), favicony, witryny lustrzane (w celu ich późniejszego porównania i ewentualnego sklejenia), boty sprawdzające funkcjonalność stron internetowych, których użytkownicy lub poprzez narzędzia dla webmasterów (tutaj mogę przeczytać o i).

Sam proces indeksowania i późniejszy proces aktualizacji indeksowych baz danych są dość czasochłonne. Chociaż Google robi to znacznie szybciej niż jego konkurenci, przynajmniej Yandex, któremu zajmuje to tydzień lub dwa (przeczytaj o).

Zazwyczaj wyszukiwarka dzieli treść tekstową strony internetowej na pojedyncze słowa, które sprowadzają się do podstawowych zasad, dzięki czemu może następnie udzielić poprawnych odpowiedzi na pytania zadawane w różnych formach morfologicznych. Wszystkie dodatkowe rzeczy w postaci znaczników HTML, spacji itp. rzeczy są usuwane, a pozostałe słowa są sortowane alfabetycznie, a ich pozycja w tym dokumencie jest wskazana obok nich.

Coś takiego nazywa się indeksem odwrotnym i umożliwia przeszukiwanie nie według stron internetowych, ale według ustrukturyzowanych danych znajdujących się na serwerach wyszukiwarek.

Liczba takich serwerów dla Yandexa (który wyszukuje głównie strony rosyjskojęzyczne, trochę ukraińskiego i tureckiego) liczy się w dziesiątkach, a nawet setkach tysięcy, a dla Google (który wyszukuje w setkach języków) – w milionach .

Wiele serwerów posiada kopie, które służą zarówno zwiększeniu bezpieczeństwa dokumentów, jak i pomagają zwiększyć szybkość przetwarzania żądań (poprzez rozłożenie obciążenia). Oszacuj koszty utrzymania całej tej gospodarki.

Żądanie użytkownika zostanie wysłane przez moduł równoważenia obciążenia do segmentu serwera, który jest obecnie najmniej obciążony. Następnie przeprowadzana jest analiza regionu, z którego użytkownik wyszukiwarki wysłał swoje zapytanie, i jest ona analizowana pod kątem morfologicznym. Jeśli ostatnio w pasku wyszukiwania wpisano podobne zapytanie, to użytkownikowi podawane są dane z pamięci podręcznej, aby ponownie nie obciążać serwerów.

Jeżeli żądanie nie zostało jeszcze zbuforowane, to zostaje przeniesione do obszaru, w którym znajduje się baza danych indeksowych wyszukiwarki. W odpowiedzi otrzymasz listę wszystkich stron internetowych, które choć w pewnym stopniu są powiązane z zapytaniem. Pod uwagę brane są nie tylko bezpośrednie wystąpienia, ale także inne formy morfologiczne, a także itp. rzeczy.

Ich trzeba mieć ranking i na tym etapie w grę wchodzi algorytm (sztuczna inteligencja). Tak naprawdę żądanie użytkownika jest mnożone przez wszystkie możliwe opcje jego interpretacji, a odpowiedzi na wiele żądań są wyszukiwane jednocześnie (poprzez wykorzystanie operatorów języka zapytań, z których część jest dostępna dla zwykłych użytkowników).

Z reguły w wynikach wyszukiwania znajduje się jedna strona z każdego serwisu (czasami więcej). są obecnie bardzo złożone i uwzględniają wiele czynników. Dodatkowo, aby je poprawić, stosuje się ręczne ocenianie witryn referencyjnych, co pozwala na dostosowanie działania algorytmu jako całości.

Generalnie widać, że sprawa jest ciemna. Można o tym rozmawiać długo, ale już wiadomo, że satysfakcję użytkownika z systemu wyszukiwania osiąga się, och, jakie to trudne. I zawsze znajdą się tacy, którym coś się nie spodoba, jak ty i ja, drodzy czytelnicy.

Powodzenia! Do zobaczenia wkrótce na stronach bloga

Możesz obejrzeć więcej filmów, przechodząc do

");">

Możesz być zainteresowany

Yandex People - jak wyszukiwać osoby w sieciach społecznościowych Apometr to bezpłatna usługa służąca do śledzenia zmian w wynikach wyszukiwania i aktualizacji wyszukiwarek. DuckDuckGo – wyszukiwarka, która Cię nie śledzi
Jak sprawdzić prędkość Internetu - test połączenia online na komputerze i telefonie, SpeedTest, Yandex i inne mierniki
Obrazy Yandex i Google, a także wyszukiwanie według pliku obrazu w Tineye (tinai) i Google

Twierdzenie, że w dobie technologii informatycznych i niekończącego się wzrostu ilości danych, którymi dysponuje zarówno jednostka, jak i społeczeństwo, pojawia się wiele problemów z przetwarzaniem informacji i ich wyszukiwaniem, jest już bluźnierstwem. Kto nie porusza tego tematu? Aby nie obciążać Państwa subiektywnymi i po części obiektywnymi ocenami wyciągniętymi z różnych źródeł informacji na temat problemu, przejdę od razu do jego rozwiązania. Dzisiaj porozmawiamy o wyszukiwaniu. Czyli o programach i poważnych systemach informatycznych, które wyszukują potrzebne nam dokumenty i dane.

Uaktualnij „wyszukiwanie bezpośrednie”

Nie tak dawno temu, gdy drzewa były duże, a informacji nawet w sieci lokalnej przedsiębiorstwa nie było zbyt wiele, wszelkie wyszukiwanie odbywało się po prostu poprzez przeszukiwanie kilku dostępnych plików i sprawdzanie po kolei ich nazw i zawartości. Takie wyszukiwanie nazywa się bezpośrednim, a programy (narzędzia) korzystające z technologii bezpośredniego wyszukiwania są tradycyjnie obecne we wszystkich systemach operacyjnych i pakietach narzędzi. Jednak nawet moc współczesnych komputerów nie wystarczy do szybkiego i odpowiedniego przeszukiwania gigantycznych wolumenów danych podczas wyszukiwania bezpośredniego. Przeszukanie kilkuset dokumentów na dysku, a przeszukanie ogromnej biblioteki i kilkudziesięciu skrzynek pocztowych to dwie różne rzeczy. Dlatego programy direct search dzisiaj wyraźnie schodzą na dalszy plan – jeśli chodzi o narzędzia uniwersalne.

Oczywiście ten rodzaj wyszukiwania nie był od dawna poszukiwany w sektorze korporacyjnym. Objętości nie są takie same. Dlatego od wielu lat, a ostatnio wyraźnie, technologie umożliwiające szybkie i dokładne wyszukiwanie dokumentów w różnych formatach i z różnych źródeł są więcej niż istotne. Nie tak dawno temu „ojciec” Microsoftu Bill Gates, najwyraźniej zazdrosny o fenomenalny sukces wyszukiwarki internetowej Google, na jednej z konferencji prasowych ogłosił chęć branży oprogramowania (i nie tylko) włączenia się w każdy możliwy sposób, rozwijać i pogłębiać tworzenie wyszukiwarek i technologii. Jest jednak zbyt wcześnie, aby stworzyć jakikolwiek fenomenalnie działający program firmy Microsoft lub konkurencyjny serwer w Internecie (MSN wciąż nie dociera do Google). Dlatego przejdźmy do istniejących rozwiązań. Indeks, zapytanie, trafność

Nowoczesne technologie opierają się na dwóch podstawowych procesach. Po pierwsze, indeksuje dostępne informacje i przetwarza żądanie, a następnie generuje wyniki. Jeśli chodzi o pierwszy, dowolny program (czy to wyszukiwarka komputerowa, system informacji korporacyjnej czy wyszukiwarka internetowa) tworzy własny obszar wyszukiwania. Oznacza to, że przetwarza dokumenty i generuje indeks tych dokumentów (zorganizowaną strukturę zawierającą informacje o przetwarzanych danych). W przyszłości to właśnie utworzony indeks służy do pracy – szybkie uzyskanie listy niezbędnych dokumentów zgodnie z żądaniem. To, co następuje, choć wcale nie jest proste pod względem technologicznym, jest całkiem zrozumiałe dla przeciętnego użytkownika. Program przetwarza żądanie (używając frazy kluczowej) i wyświetla listę dokumentów zawierających tę frazę kluczową. Ponieważ informacje zawarte są w ustrukturyzowanym indeksie, przetwarzanie zapytań jest znacznie szybsze (dziesiątki i setki razy!) niż w przypadku wyszukiwania bezpośredniego (wybór dokumentów odbywa się nie poprzez wyliczenie plików, ale poprzez analizę informacji tekstowych w indeks).

Program wyświetla znalezione dokumenty na liście wynikowej według trafności - zgodności dokumentu z tekstem zapytania. W różnych technologiach istnieją oczywiście różne metody wyszukiwania i określania trafności dokumentu (liczba „wystąpień” słowa i częstotliwość jego występowania w dokumencie, stosunek tych parametrów do całkowitej liczby słów w dokumencie, odległość między wyrazami zapytania w wyszukiwanych plikach itp.). Na podstawie tych parametrów określana jest „waga” dokumentu i w zależności od niej konkretny plik pojawia się na liście wyników na określonej pozycji. W przypadku wyszukiwania w Internecie sytuacja jest jeszcze bardziej skomplikowana. Rzeczywiście w tym przypadku należy wziąć pod uwagę wiele innych czynników (przykładem jest Page Rank Google). Ale to temat na osobny artykuł, więc nie będziemy się rozwodzić nad Internetem.Recenzja wyszukiwarek

W tym materiale zbadano możliwości kilku popularnych programów wyszukiwania, które mogą pochwalić się zarówno przyzwoitymi prędkościami, jak i dobrą funkcjonalnością. Ale popisywanie się w broszurach to jedno, a bycie pod okiem eksperta to zupełnie co innego. I nie było już ekspertów, ani biura pełnego ludzi, którzy lubili majstrować przy oprogramowaniu pod kątem jego użyteczności. Na komputerze doświadczalnym zainstalowano zestaw programów (Athlon 2,2 MHz, z pamięcią RAM 1 GB, dyskiem twardym IDE 160 GB Seagate 7200 obr./min i systemem Windows XP): dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, Pulpit ISYS. Na potrzeby testów skompilowano tekstową bazę danych dokumentów w formatach doc, txt i html o łącznym rozmiarze ani większym, ani mniejszym, ale 20 gigabajtów. Grupa towarzyszy pod przewodnictwem Twojego pokornego sługi testowała, porównywała i dzieliła się swoimi subiektywnymi wrażeniami z każdego oprogramowania. Przeczytaj podsumowanie ustaleń poniżej. dtSearch Pulpit

Program, który według twórców twierdzi, że jest najszybszą, najwygodniejszą i najlepszą wyszukiwarką. Jak w ogóle wszyscy inni z tej recenzji. Interfejs dtSearch jest dość prosty, jednak niektóre okna lub zakładki są nieco przeładowane elementami, co sprawia, że korzystanie z niego wydaje się trudne. Ale w rzeczywistości nie ma szczególnych trudności. Jedynym naprawdę nieprzyjemnym punktem jest brak obsługi języka rosyjskiego w oprogramowaniu (pomimo tego, że program może wyszukiwać dokumenty w kilku językach, jego interfejs jest wyłącznie w języku angielskim).

Jednak dtSearch jest jednym z niewielu programów, które potrafią indeksować strony internetowe na określoną przez użytkownika „głębokość” (aczkolwiek biorąc pod uwagę „dodatkowy zakup” zestawu dodatków dtSearch Spider). Jest to dodatek do obsługi plików dyskowych w różnych formatach tekstowych i wiadomości e-mail ze skrzynki pocztowej programu Outlook. Jednocześnie program nie może współpracować z bazami danych, które są tak łakomym kąskiem dla wyszukiwarek ze względu na dużą ilość zawartych w nich informacji i ich szeroką dystrybucję w firmach, a co za tym idzie w sieciach korporacyjnych. Szybkość indeksowania dokumentów dtSearch okazała się na właściwym poziomie. Patrząc w przyszłość powiem, że program ten poradził sobie z zaindeksowaniem danej ilości informacji na poziomie innego konkurenta – iSYS – i podzielił się z nim drugim miejscem na liście najszybszych systemów. dtSearch zaindeksował testowo 20 gigabajtów informacji w 6 godzin i 13 minut, tworząc indeks o wielkości 7,9 GB na potrzeby kolejnych poszukiwań.

Jeśli chodzi o możliwości wyszukiwania, tutaj są na odpowiednim poziomie. Po pierwsze, dtSearch przeprowadza wyszukiwanie morfologiczne (wyszukiwanie słowa we wszystkich jego formach morfologicznych). Korzystając z tej okazji, uwalniasz się od, powiedzmy, myśli typu „w jakim przypadku w potrzebnym mi dokumencie użyto określonego słowa?” Stosowanie wyszukiwania morfologicznego jest prawie zawsze uzasadnione, dlatego powinno być obecne w każdej profesjonalnej wyszukiwarce.

Wyszukiwanie po dźwięku to funkcja niestandardowa nawet w przypadku profesjonalnych wyszukiwarek. Jego istotą jest to, że program będzie wyszukiwał słowa brzmiące tak samo jak słowo, które wpisałeś. A najlepsze jest to, że ta funkcja działa również w języku rosyjskim! Na przykład, jeśli w wyszukiwanym zapytaniu wpiszesz słowo „ucho”, w rezultacie zobaczysz nie tylko słowa „ucho”, ale także „ucho”.

Wyszukiwanie z korekcją błędów jest bardzo ważną funkcją. Służy do wyszukiwania słów zawierających błędy składniowe - mogą to być zarówno literówki, jak i błędy w dokumentach uzyskanych np. za pomocą systemów rozpoznawania znaków. Prosty przykład - szukasz słowa klawiatura. W jakimś dokumencie pojawia się słowo „klawiatura”, oczywiste jest, że w rzeczywistości jest to słowo „klawiatura”, osoba po prostu pomyliła się podczas pisania. Zatem wyszukiwanie polegające na korekcji błędów wykryje i uwzględni w wynikach dokument zawierający słowo „klawiatura”. W dtSearch istnieje również ustawienie, które pozwala określić stopień możliwych błędnych znaków.

Szukaj używając synonimów. Ta funkcja wykorzystuje listę synonimów różnych słów. Czyli np. wpisując słowo „szybki” program znajdzie także słowa „szybki” i inne będące synonimami słowa „szybki”, jeśli oczywiście występują na liście synonimów . Gotowa lista synonimów nie jest dostarczana z programem dtSearch, istnieje jednak możliwość korzystania z list w Internecie (w związku z tym wymagane jest połączenie, co nie zawsze jest wygodne) lub można utworzyć własną listę synonimów .

Oprócz wymienionych możliwości dtSearch może wyszukiwać za pomocą fraz składających się ze słów połączonych operacjami logicznymi. Każdemu słowu w zapytaniu można przypisać własną „wagę”, czyli znaczenie. Przydatną opcją jest skorzystanie ze słownika składającego się ze słów nieistotnych, aby nie brać ich pod uwagę przy wyszukiwaniu, ale ten słownik też jest pusty i trzeba będzie go samemu wypełnić.

Następnie przyjrzyjmy się możliwościom programu podczas pracy w sieci. W rzeczywistości dtSearch nie oferuje żadnych konkretnych możliwości pracy z siecią. Jednak korzystanie z niego online jest całkiem możliwe. Alternatywnie możesz utworzyć jakiś indeks i umieścić go w publicznym (współdzielonym) folderze. Sam program można zainstalować na komputerze każdego użytkownika, można go także umieścić w folderze ogólnodostępnym, a skróty można tworzyć w specjalny sposób dla każdego użytkownika z osobna, wykorzystując parametry wiersza poleceń, których przeznaczenie opisano w pliku pomocy dołączonym do programu. Możliwa jest także automatyczna instalacja programu w sieci za pomocą pliku MSI. Uwzględni to ustawienia każdego podłączonego użytkownika.

Ogólnie jest to dobry program z kategorii profesjonalnych wyszukiwarek. Może kwalifikować się do dobrej oceny, ale zdobycie zaufania i szacunku użytkowników może nie być łatwe dla dtSearch z pewnych powodów (nie wszystko jest płynne z interfejsem, rosyjscy użytkownicy są pozbawieni, nie ma jasnych funkcji do pracy z siecią) . Jeśli chodzi o bezpośrednie wyszukiwanie dokumentów, program nie miał problemów z tekstem rosyjskim. Ponieważ nie było żadnego z zadeklarowaną morfologią, ani z wyszukiwaniem rozmytym. System całkiem trafnie odnalazł potrzebne dokumenty zarówno poprzez proste jednowyrazowe zapytanie, jak i poprzez użycie kilku akapitów lub dokumentu jako frazy kluczowej.

Oficjalna strona:
Rozmiar dystrybucji: 23 Mb Bloodhound Prof Deluxe

Na podstawie nazwy można się domyślić, że w tym programie dostępna jest obsługa języka rosyjskiego. To już jest miłe. Jeśli chodzi o interfejs, ogólnie jest on nieco nietypowy, ale z wyglądu jest bardzo atrakcyjny. Kolejną rzeczą jest wygoda. Kryterium bardzo kontrowersyjne, ale prawdopodobnie rozwiązanie wielookienkowe nie jest najskuteczniejszą opcją (w jednym oknie wprowadza się żądanie, w drugim wyświetla się wynik i tym podobne).

Snoop używa tych samych indeksów do szybkiego wyszukiwania, ale indeksowanie jest znacznie wolniejsze niż w przypadku innych programów. Jest to bardzo dziwne, zwłaszcza biorąc pod uwagę, że jego możliwości przetwarzania zapytań są bardzo słabe, a zatem struktura indeksu nie jest złożona. Najprawdopodobniej jest to spowodowane niezoptymalizowanymi algorytmami. Program ten okazał się wyraźnym outsiderem pod względem indeksowania i szybkości wyszukiwania: czas poświęcony na utworzenie indeksu jest sześciokrotnie dłuższy niż w przypadku dtSearch i iSYS. Zindeksowanie 20 gigabajtów tekstów dla bloodhounda zaowocowało 38 godzinami i 46 minutami pracy. Utworzony „obszar wyszukiwania” zajął na dysku twardym ten sam rozmiar, co oryginalne dane, z małym minusem - 19 gigabajtów.

Bloodhound można przedstawić jako alternatywę dla standardowego wyszukiwania w systemie Windows; jest mało prawdopodobne, że potrafi więcej. O tym, że podstawowym zadaniem Snoopera jest najprostsze wyszukiwanie plików, świadczy nie tylko niewielka liczba funkcji analizujących tekst zapytań i zaawansowane wyszukiwanie według atrybutów plików, ale nawet okno wyników, które zawiera bezpośrednie linki do znalezionych plików, a także do folderów zawierających te pliki. Okno wyników nie jest zbyt pouczające w tym sensie, że cały znaleziony plik można odczytać jedynie poprzez jego uruchomienie, to znaczy nie ma ono wbudowanej przeglądarki plików. Wyświetlany jest jednak fragment pliku, w którym znaleziono wyszukiwane słowo; ogólnie ten schemat wyświetlania bardzo przypomina wyszukiwarki internetowe.

Mówiąc o konkretnych możliwościach przetwarzania zapytań warto zauważyć, że nie ma czegoś takiego jak „wyszukiwany tekst”, maksymalnie można wyszukać frazę, choćby dlatego, że nie ma wieloliniowego pola wprowadzania tekstu. Można jednak przeanalizować wpisaną frazę, a Snoop oferuje nam tutaj standardowy zestaw wyszukiwania: operacje logiczne, wyszukiwanie maski i wyszukiwanie cytatów… niewiele. Program zawiera pewne podstawy wyszukiwania morfologicznego, jednak prawdopodobnie jest na tyle prymitywny, że najprawdopodobniej zakłóca poprawne działanie (w czasie testów zauważono wiele błędów związanych z nieprawidłowym użyciem morfologii).

Ale program pozwala określić atrybuty pliku podczas wyszukiwania (data dokumentu, nazwa pliku, nazwa folderu), a w tych zapytaniach można również użyć tego samego zestawu wyszukiwania. Możesz także wyszukiwać litery, określając parametry (Od, Temat... itp.).

Więc wymyśliliśmy samo wyszukiwanie, co jeszcze jest interesującego w programie, za który otrzymał tak wiele nagród, zgodnie z informacjami z oficjalnej strony internetowej? Trudno powiedzieć, co jest w nim takiego specjalnego, najprawdopodobniej interfejs Bloodhound jest atrakcyjny (dokładnie pod względem wyglądu, nie mówiąc już o użyteczności).

Operacje na indeksach są bardzo standardowe; fajną funkcją jest możliwość aktualizacji indeksów zgodnie z harmonogramem. Ponadto z indeksów można korzystać także online. Od teraz potrzebujemy więcej szczegółów.

Pomimo prymitywności zapytań program może służyć do wyszukiwania plików, więc jego użycie może być uzasadnione w sieciach. Choć to naciągane, bo w dużej sieci priorytetem jest szybkie wyszukiwanie danych za pomocą skomplikowanych zapytań ze względu na ogromną ilość informacji - a są wyraźnie problemy z szybkością wyszukiwania i programem. Muszę powiedzieć, że praca z siecią w Izhishika jest przemyślana tak, jak powinna. Specjalnie do tego celu zaprojektowano osobną aplikację - Bloodhound Server. Działa to tak samo, jak po prostu Snooper (mają jedną wyszukiwarkę), tylko dla dokumentów znajdujących się na serwerze centralnym lub w zasobach współdzielonych w sieci firmowej. Snooper Server tworzy nowe indeksy na udostępnionych zasobach lub korzysta z wcześniej utworzonych. Każdy użytkownik sieci firmowej może połączyć się z Serwerem Wyszukiwania i za jego pomocą uzyskać dostęp do dowolnego dokumentu (znajdującego się w bieżącym indeksie) za pomocą przeglądarki internetowej. Zgadzam się, ten schemat jest niezwykle wygodny: okazuje się, że pliki we własnej sieci można wyszukiwać w taki sam sposób, jak informacje w Internecie, na przykład za pośrednictwem Google.

Oceniając wszystkie zalety i wady tego programu, wniosek sam w sobie nasuwa się, że jego możliwości najprawdopodobniej nie są wystarczające dla sieci korporacyjnych (mimo dobrej organizacji pracy z siecią), ale dla komputera domowego lub nawet sieci domowej jest to w zasadzie może się pojawić. Choć ani szybkość pracy, ani możliwości wyszukiwania nie napawają optymizmem...

Oficjalna strona internetowa w języku rosyjskim:
Rozmiar dystrybucji: 6 MbGoogle Desktop Search + GDS Enterprise

Oczywiście nie mogliśmy przejść obojętnie obok tak znanego dewelopera. Nazwa Google już wiele mówi. Osoby, które od lat korzystają z najpotężniejszej wyszukiwarki internetowej, z pewnością bez wątpienia zdecydują się na zainstalowanie tej właśnie wyszukiwarki na swoim komputerze. Pomyśl tylko: Google na Twoim domowym komputerze! Nie poddając się jednak prowokacjom szeroko promowaną marką, spróbujmy na trzeźwo, a co najważniejsze obiektywnie rozważyć możliwości „desktopowej” wyszukiwarki Google.

Pierwszą rzeczą, która rzuca się w oczy, jest brak własnej powłoki dla programu. Google Desktop Search nadal mieści się odpowiednio w oknie przeglądarki, cały interfejs wersji desktopowej został odziedziczony z oprogramowania od jego starszego internetowego brata. To, czy to dobrze, czy źle, jest kwestią sporną: niektórym podoba się minimalizm w projekcie tej wyszukiwarki, podczas gdy inni chcą zobaczyć pełnoprawną aplikację wypełnioną wszelkiego rodzaju przyciskami i tak dalej.

Co rzuca się w oczy zaraz po projekcie? I fakt, że ten sam Google Desktop Search zaczyna indeksować wszystko na komputerze, bez żadnego żądania! A co najciekawsze, nie ma możliwości wybrania ścieżki indeksowania za pomocą Google Desktop Search. Będziesz musiał pobrać osobny program (TweakGDS), który pozwoli ci nieco rozszerzyć ustawienia Google Desktop, w tym określić miejsca niezbędne do indeksowania. Chociaż zanim to wszystko zrozumiesz, będzie już indeksował standardowy dysk twardy, więc to ustawienie będzie bardziej potrzebne podczas pracy z dużymi ilościami danych, co jest bardzo ważne w przypadku sieci korporacyjnych (wersje Enterprise) . Nie jest jednak faktem, że po pobraniu TweakGDS Twoje problemy zostaną rozwiązane. W końcu do działania wymaga Microsoft .NET Framework i Microsoft Scripting Runtime. Tak... instalację, jak i dostęp do ustawień, można było uprościć, choć twórcy pewnie rozumieją: po co pisać coś nowego, skoro jest gotowa wyszukiwarka, przenoszona na lokalny komputer i niech użytkownik „cieszy się”, a znane nazwisko zrobi z „tego” kolejne arcydzieło. No, ale zakończmy tę liryczną dygresję i przejdźmy do poszukiwań.

Jeśli chodzi o analizę zapytań i dostarczanie wyników, wszystko tutaj jest absolutnie identyczne z Google w Internecie: ten sam system wyświetlania wyników, ten sam standardowy zestaw operacji logicznych dla zapytań. Ogólnie rzecz biorąc, Google Desktop Search, podobnie jak poprzedni program, przeznaczony jest wyłącznie do wyszukiwania plików - oczywiście nie ma wewnętrznej przeglądarki tych plików. Liczba formatów plików obsługiwanych przez Google Desktop Search jest w zupełności wystarczająca, fajne jest też to, że przeszukuje odwiedzane strony internetowe, pobierając dane z pamięci podręcznej. Prędkości wyszukiwania i indeksowania są całkiem akceptowalne. To prawda, do użytku domowego. Google Desktop Search poradził sobie z imponującymi 20 gigabajtami tekstów w 8 godzin i 17 minut. Spędzanie kilku dni na przetwarzaniu informacji z sieci korporacyjnej dużego przedsiębiorstwa nie jest czymś, czego chciałby każdy administrator systemu. Plusy: wielkość utworzonego indeksu była na tym samym poziomie (4,5 GB) co inna testowana w tej recenzji wyszukiwarka – SearchInform.

Dużą zaletą (lub wadą – decydujesz) Google Desktop Search jest to, że obsługuje wtyczki, które mogą wiele zmienić na lepsze. Inną rzeczą jest to, że podłączanie wtyczek i ich konfiguracja tak bardzo komplikuje zadanie instalacji wyszukiwarki, że zaczynasz się zastanawiać, czy to wszystko jest konieczne, skoro możesz zainstalować normalny, pełnoprawny program, w którym wszystko będzie już obecne. W końcu, aby móc korzystać z każdej funkcji, będziesz musiał zainstalować nową wtyczkę. Nawet aby program w pełni współpracował z archiwami, potrzebny jest osobny gadżet. To fascynujące i uwodzicielskie, że wszystkie te dodatkowe moduły są bezpłatne. Jeśli jednak nie weźmiesz pod uwagę komputerowej wersji wyszukiwarki, wówczas kompetentna konfiguracja GDS Enterprise może nie być w Twojej mocy - w końcu nie bez powodu specjaliści z Google oferują swoje usługi w zakresie konfigurowania własnych oprogramowanie dla Twojej sieci za jedyne 10 000 USD.

Jeśli przejdziesz przez procedurę konfiguracji i instalacji (lub zapłacisz 10 000 dolarów zespołowi szybkiego reagowania Google), zrozumiesz, że złożoność instalacji jest z nawiązką kompensowana przez bardzo elastyczne ustawienia stosowane w sieciach korporacyjnych. Ważnym aspektem korzystania z Google Desktop w sieci firmowej jest zastosowanie polityk grupowych, które umożliwiają ustawienie ustawień dla każdego użytkownika.

Podsumowując, najrozsądniejszym zastosowaniem tego programu jest komputer domowy lub służbowy. Przecież na zwykłym komputerze wystarczy zainstalować program – resztę zrobi sam (nawet o nic nie zapyta).

Jednak Google Desktop Search Enterprise będzie akceptowalny w przypadkach, gdy istnieje pilna potrzeba elastycznej konfiguracji zasad sieciowych w celu korzystania z wyszukiwarki, podczas gdy możliwość przetwarzania zapytań będzie na drugim miejscu, a czas (lub pieniądze) ) wydane na konfigurację programu będą na pierwszym miejscu.

Oficjalna strona:
Rozmiar dystrybucji łącznie z TweakGDS: 1,2 MbCopernic Desktop Search

Kliknij na zdjęcie aby powiększyć

Interfejs programu budzi niezwykle pozytywne emocje – wszystko wykonane jest zgodnie z ogólnie przyjętymi standardami, nic zbędnego, jednym słowem przyjemny design. Dla początkującego zrozumienie interfejsu Copernic Desktop Search będzie bardzo łatwe. Choć nieco mylące jest to, że projektanci przejrzyście stworzyli interfejs programu, biorąc pod uwagę fakt, że program będzie działał w standardowej kompozycji Windows XP. W przypadku korzystania z klasycznego motywu program nie wygląda już tak ładnie. Ale to bardziej kwestia gustu.

Przy pierwszym uruchomieniu program wyświetli monit o utworzenie indeksów do wyszukiwania. Dość nietypowe wydawało się to, że po wybraniu folderów do indeksowania program nie proponował wciśnięcia żadnego przycisku typu „Rozpocznij indeksowanie”, a indeksowanie nie rozpoczynało się automatycznie, dopiero wtedy zauważono, że Copernic próbował rozpocząć indeksowanie podczas gdy komputer był bezczynny. Będziesz musiał zagłębić się nieco w opcje programu, aby wszystko poprawnie skonfigurować. Należy zauważyć, że możliwości ustawienia automatycznego tworzenia indeksu są dość szerokie: wbudowany harmonogram, możliwość indeksowania, gdy komputer jest bezczynny, w tle, z niskim priorytetem. Indeksowanie nie przebiegało zbyt szybko – 10 godzin 51 minut – to wolniej niż w innych wyszukiwarkach (poza Bloodhoundem, ale Copernic i tak jest o rząd wielkości szybszy od rozwoju iSleuthHound Technologies.

Teraz o strukturze indeksu. Generalnie nie ma w tym nic specjalnego. Można wybierać typy plików, zarówno w formie ogólnej, jak i szczegółowej. Oznacza to, że początkowo możesz wybrać, co chcesz zaindeksować - dokumenty, obrazy, filmy, muzykę. Na drugiej karcie okna opcji będziesz mógł wybrać określone typy plików według rozszerzenia. Dodatkowo możesz skonfigurować indeks tak, aby na przykład zdjęcia o rozmiarze mniejszym niż 16x16 nie były indeksowane lub pliki dźwiękowe o długości krótszej niż 10 sekund nie były indeksowane. Oprócz indeksowania plików z folderów, Copernic może pracować z e-mailami i kontaktami z książki adresowej programów Microsoft Outlook i Microsoft Outlook Express, a także umożliwia indeksowanie Ulubionych i Historii z przeglądarki Internet Explorer.

Jeśli chodzi o możliwości wyszukiwania, są one tutaj bardzo słabe. Podczas testów wykazano nawet, że program nie wyszukuje dokumentów w formatach txt i html w języku rosyjskim, umożliwiając ich wyszukiwanie jedynie według tytułów, a nie treści. Jedyną rzeczą, którą program zapewnia w celu poprawy wydajności wyszukiwania, jest użycie standardowego zestawu operacji logicznych i nawet wtedy tę funkcję odkryto eksperymentalnie, ponieważ nie została ona udokumentowana. Swoją drogą pomoc programu też nie jest w porządku - jest ona dostępna tylko przez Internet, co, jak widać, jest bardzo niewygodne, a informacji pomocy w Internecie nie ma zbyt wiele. Najwyraźniej twórcy zdecydowali, że prosty interfejs programu nie oznacza obecności normalnej pomocy. Kontynuując rozmowę na temat możliwości wyszukiwania, należy zauważyć, że pomimo słabej analizy zapytań, program udostępnia ciekawy system wyszukiwania - użytkownik może wybrać typ plików (zdjęcia, filmy, muzyka itp.), wpisać hasło wyszukiwania wyszukaj i wybierz atrybuty specyficzne dla wybranego typu pliku. Na przykład w przypadku plików dźwiękowych mogą to być wartości ze znaczników mp3 (wykonawca, album, data itp.), w przypadku obrazów można na przykład wybrać ich rozmiar (według rozdzielczości), ogólnie każdy typ ma swój własny własne ustawienia. Po wyszukaniu konkretnego typu pliku program wyświetli w oknie wyników bardzo pouczającą listę, a jeśli Twoje zapytanie zawiera pliki innych typów, możesz je otworzyć, klikając konkretny link.

Osobno warto wspomnieć o oknie wyświetlania wyników. Poniżej listy znalezionych plików wyświetlana jest zawartość tych plików (podobny schemat często stosowany jest w klientach pocztowych). To prawda, że \u200b\u200bprzeglądanie tekstu można wykonywać tylko w formacie natywnym i nie ma trybu wyświetlania zwykłego tekstu, co nie zawsze jest wygodne, ponieważ otwarcie dokumentu w tym przypadku zajmuje więcej czasu. Ponieważ jednak Copernic może wyszukiwać obrazy i muzykę, możliwe jest przeglądanie tych plików multimedialnych.

Opisano podstawowe zasady działania tego programu, teraz zobaczmy, co Copernic Desktop Search może nam zaoferować do pracy z siecią... W zasadzie możesz oglądać bardzo długo, ale prawie nic nie zobaczysz . Innymi słowy, ten program nie miał działać w sieci. Copernic Desktop Search jest wyłącznie wyszukiwarką domową.

Oczywiście jedynym (najbardziej logicznym) zastosowaniem tego programu jest komputer domowy. Tutaj w pełni poradzi sobie ze wszystkimi prostymi zapytaniami wyszukiwania użytkowników składającymi się z jednego lub dwóch słów, znajdzie niezbędne informacje, a także podział wyszukiwania według typu pliku i obsługę plików multimedialnych wraz z indeksowaniem w tle w trybie niskiego priorytetu, w połączeniu z przyjemnym interfejs, tylko daj programowi siłę, aby zyskał zaufanie wśród niedoświadczonych użytkowników.

Oficjalna strona
Rozmiar dystrybucji: 2,6 MbISYS Desktop

Kliknij na zdjęcie aby powiększyć

Bardzo potężny program. Pod względem poziomu wyposażenia we wszelkiego rodzaju funkcje plasuje się gdzieś blisko kolejnego na liście systemu wyszukiwania SearchInform. Co więcej, rozmiar pliku instalacyjnego przekracza 40Mb! Trudno powiedzieć, co dałoby się zmieścić w takich wymiarach, bo sam SearchInform, przy podobnej funkcjonalności, zajmuje 15Mb.

Proces instalacji tutaj również nie jest zbyt przyjemny, a raczej nawet proces instalacji. Jeszcze przed pobraniem programu zostaniesz poproszony o rejestrację, w przeciwnym razie nie ma takiej możliwości. Następnie interfejs. Wykonany jest bardzo ładnie, nic niepotrzebnego nie rzuca się w oczy, są to jednak wrażenia osoby, która jest już do tego nieco przyzwyczajona. Początkującemu nie będzie łatwo dowiedzieć się, gdzie i co się znajduje, gdzie kliknąć i gdzie w końcu szukać. Zdecydowanie zaleca się przeczytanie pomocy przed rozpoczęciem pracy - zaoszczędzisz wiele nerwów i czasu. Do wszystkiego dochodzi całkowity brak obsługi języka rosyjskiego w programie. Niedobrze. Poza tym okna tutaj nie są przeciążone sterowaniem, ale trzeba było za to zapłacić multimodułami i wykorzystaniem dodatkowych okien. Na przykład zapytania wyszukiwania wprowadza się poprzez uruchomienie jednego programu, a zarządzanie indeksem odbywa się za pomocą innego programu. Wyszukiwane hasła są również wprowadzane tutaj w oddzielnych wyskakujących oknach. Trudno powiedzieć, co jest lepsze – przeciążony interfejs czy wszechobecne multiokna, to raczej kwestia gustu.

Jeśli chodzi o tworzenie indeksów, program udostępnia funkcje upraszczające proces ustawiania opcji dla nowego indeksu. Funkcje te obejmują kilka gotowych szablonów do tworzenia indeksów dla folderu „Moje dokumenty”, „Poczta”, „Poczta i dokumenty”, „Określony folder”, „Folder z wyborem typów plików” itp. Takie szablony ułatwiają utworzenie indeksów na pierwszym etapie. Narzędzie do pracy z indeksami nie ma zbyt dobrego interfejsu, co odstrasza pewną złożonością (jest to, szczerze mówiąc, bardzo subiektywna ocena), jednak jeśli na to spojrzysz, zapewnia wiele przydatnych opcji i ogólnie , jego użycie nie sprawia większych trudności. ISYS Desktop może indeksować dane z różnych źródeł danych, a także zapewnia wiele elastycznych ustawień takiego indeksowania. Dodatkowe funkcje indeksowania obejmują: obsługę SQL, FTP, kontekstu TRIM, WORLDOX 2002, skryptów. Jeśli podczas tworzenia indeksu zaznaczyłeś opcję „Folder z wyborem typów plików”, masz możliwość ręcznego wybrania typów plików do indeksowania (według rozszerzenia). Trzeba powiedzieć, że istnieje po prostu ogromna liczba obsługiwanych typów plików, ale nie będziesz mógł dodać własnego typu (rozszerzenia) do istniejącej listy. Można również zauważyć obecność harmonogramu indeksowania. Utworzenie indeksu i przetworzenie 20 gigabajtów informacji zajęło ISYS Desktop 6 godzin i 13 minut, ostatecznie pokazując dobry czas i rozmiar utworzonego pliku - 7,9 GB.

Możliwości wyszukiwania tego programu są całkiem dobre. To, co jest używane w ISYS, ma znacznie większe możliwości niż konwencjonalna obsługa operacji logicznych. Wśród zaawansowanych możliwości wyszukiwania program oferuje wykorzystanie synonimów oraz filtr sortujący (według ścieżki, nazwy i daty utworzenia pliku). Zbiór operatorów logicznych jest nieco szerszy niż zestaw standardowy. Oprócz operacji logicznych program umożliwia pracę z wieloma innymi operatorami, które w zasadzie mogą zastąpić niektóre rodzaje wyszukiwania, na przykład wyszukiwanie z analizą można całkowicie zastąpić za pomocą operatorów specjalnych. Bardzo się zdziwiłem, że w programie nie ma wyszukiwania wykorzystującego morfologię. Jest to poważne pominięcie, ponieważ przy zastosowaniu analizy morfologicznej wydajność wyszukiwania ulega znacznej poprawie. Ponadto nie ma listy słów znaczących, ale istnieje obszerna lista słów nieistotnych. Ogłoszono także funkcje wyszukiwania, takie jak „wyszukiwanie przybliżone” i „analiza heurystyczna”.

ISYS zapewnia wybór kilku typów zapytań, a mianowicie typów wizualnych. Odbywa się to za pomocą różnych typów okien do wprowadzania zapytań, jednak tak naprawdę żadne okno nie pozwala na zastosowanie innych technologii niż wymienione powyżej.

Wyniki wyszukiwania są bardzo pouczające i są wyświetlane w postaci listy dokumentów posortowanych według trafności. Poniżej wyświetlany jest podgląd wybranego dokumentu. W przeciwieństwie do Copernic Desktop Search, podgląd tutaj jest dostępny tylko w postaci zwykłego tekstu, nie było możliwości wyświetlenia dokumentów w ich natywnym formacie, czy to Word, HTML czy PDF, choć w zasadzie nie jest to zbyt krytyczne. Program umożliwia dzielenie znalezionych dokumentów na grupy według określonych kryteriów (domyślnie są one dzielone według trafności). Możesz także przeglądać już znalezione dokumenty wybierając poszczególne foldery (jest to wygodne, gdy w rezultacie powstaje bardzo duża liczba dokumentów).

Korzystanie z programu w sieci firmowej jest również bardzo uzasadnione, ponieważ zapewnia dobre możliwości organizacji wyszukiwania sieciowego. System wyszukiwania opiera się na utworzeniu publicznego indeksu, który zawiera zaindeksowane dane z publicznie dostępnych zasobów internetowych.

Faktycznie program od ISYS jest godny uwagi, przynajmniej zapoznania się z nim. Ten program jest dojrzałym projektem z ogromną liczbą funkcji (nie zawsze i nie każdy oczywiście ich potrzebuje, ale jednak). Nie wiadomo, jakie są szanse na poprawę w zakresie przetwarzania zapytań w programie, ale na chwilę obecną można go polecić do niemal uniwersalnego zastosowania. A biorąc pod uwagę, że jest on wciąż zbyt ciężki dla systemów domowych, głównymi miejscami jego instalacji są sieci korporacyjne.

Oficjalna strona:
Rozmiar dystrybucji: 40 MbSearchInform

Kliknij na zdjęcie aby powiększyć

Chyba nie warto od razu zaczynać od opisu interfejsu SearchInform. Na początek powinniśmy opisać proces instalacji, a raczej jeden z jego szczegółów: bez połączenia z Internetem nie można zainstalować programu. Faktem jest, że przed pierwszym uruchomieniem program wymaga rejestracji użytkownika (bezpłatnej) i wysyła wszystkie wprowadzone dane na serwer. Najwyraźniej programiści musieli podjąć takie środki w walce z piractwem, ale nie miało to pozytywnego wpływu na łatwość instalacji.

Interfejs programu został zaprojektowany zgodnie ze wszystkimi ogólnie przyjętymi zasadami, jednak na pierwszy rzut oka jest nieco uciążliwy. Używając programu po raz pierwszy, wydaje się, że jest on zbyt skomplikowany, czasami nie jest łatwo zapamiętać, w którym menu lub na której zakładce znajduje się żądana opcja, jednak przy dłuższym użytkowaniu interfejs nie wydaje się już tak strasznie skomplikowany . Najważniejsze jest, aby najpierw przeczytać certyfikat.

Po zapoznaniu się z interfejsem możesz przystąpić do tworzenia indeksu. Sam proces jest bardzo prosty, a szybkość indeksowania, nawet na oko, jest znacznie wyższa niż w przypadku wszystkich innych wyszukiwarek uwzględnionych w recenzji. Wyraźne wyniki testów pokazują, że SearchInform jest dwukrotnie szybszy niż dtSearch i iSYS pod względem szybkości indeksowania! Program zaindeksował dostarczone dane w ilości 20 gigabajtów w rekordowym czasie 3 godzin 17 minut. A rozmiar utworzonego indeksu okazał się najmniejszy 4,4 GB - 100 megabajtów mniej niż Google Desktop Search.

Program oprócz zwykłych plików i folderów obsługuje także indeksowanie e-maili, łączenie i indeksowanie baz danych (!) oraz innych źródeł zewnętrznych (DMS, CRM), od razu podczas indeksowania można określić słownik do przeprowadzenia wyszukiwania morfologicznego oraz wszystkie atrybuty mogą być plikami indeksowanymi. Po utworzeniu indeksu, próbując przeprowadzić pierwsze testowe wyszukiwanie dokumentów, możesz poczuć się nieco zdezorientowany: „Są tu dwa rodzaje wyszukiwania, ale którego potrzebuję?” Jak wspomniano wcześniej, najważniejsze jest przeczytanie pomocy, wtedy wszystko stanie się jasne. Program potrafi właściwie realizować dwa rodzaje wyszukiwania – wyszukiwanie frazowe oraz wyszukiwanie dokumentów o treści podobnej do treści zapytania.

Opis wszystkich głównych funkcji analizy wyszukiwanego hasła został podany powyżej, dlatego teraz wymienimy jedynie możliwości wyszukiwania, jakie zapewnia ten program. Zacznijmy od wyszukiwania fraz: oczywiście wyszukiwanie morfologiczne, wyszukiwanie cytatów, operacje logiczne, wyszukiwanie z parsowaniem słów (wyszukiwanie na początku słowa, na końcu, w jego środkowej części lub całe dopasowanie), mieszane wyszukiwanie cytatów ( gdy wszystkie słowa z zapytania muszą być obecne w dokumencie, ale niekoniecznie we wpisanej kolejności), wyszukiwanie z korekcją błędów, stosowanie synonimów, „wyszukiwanie prawie cytowań” (szukanie wpisanej frazy jako cytatu, ale inne słowa mogą znajdować się pomiędzy wprowadzonymi słowami) itp. Niektóre z wymienionych opcji mają własne, specyficzne ustawienia. Dodatkowo możliwe jest skorzystanie ze słownika słów nieistotnych, a program ma już gotową listę tych słów, można też skorzystać ze słownika słów priorytetowych do wyszukiwania (oczywiście trzeba będzie go wypełnić się).

Tutaj w zasadzie pokrótce omówiliśmy wszystkie główne funkcje wyszukiwania fraz.

Przejdźmy dalej do rozważenia funkcji tego programu - wyszukiwania podobnych dokumentów. Twórcy twierdzą, że nie jest to bynajmniej proste wyszukiwanie tekstowe, to właśnie „wyszukiwanie podobnych” - dokładnie tak jest wszędzie opisywane, ale cóż, możesz to nazwać, jak chcesz - najważniejsze jest to . Szybkie wyszukiwanie w Internecie może szybko wykazać, że tzw. „wyszukiwanie podobnych” to nowe osiągnięcie w dziedzinie analizy tekstu. System ten umożliwia wyszukiwanie tekstów o podobnej treści semantycznej. Najprzyjemniejsze było to, że po przeprowadzeniu testowych zapytań okazało się, że teoria całkiem nieźle pokrywa się z praktyką! Program faktycznie wyszukuje dokumenty o podobnej treści i wyświetla je na liście, sortując je według procentu podobieństwa.

Następnie przyjrzyjmy się, co SearchInform (w szczególności jego wersja korporacyjna SearchInform Corporate) oferuje do pracy w sieci korporacyjnej. Istnieją dwa typy aplikacji: po stronie serwera i po stronie użytkownika. Część serwerowa samodzielnie przetwarza określone indeksy, a użytkownicy mogą je wykorzystywać do wyszukiwania, w zależności od przypisanych im praw dostępu. Użytkownicy mogą być konfigurowani automatycznie przy użyciu kont Windows (w profesjonalnym ujęciu SearchInform korzysta z uwierzytelniania NTFS Windows) lub ręcznie (użytkownicy będą musieli być dodani osobno). Każdemu użytkownikowi można zezwolić lub zabronić dostępu do określonych indeksów, a także można łączyć użytkowników w grupy. Ogólnie rzecz biorąc, ustawienia SearchInform do pracy w sieci wyprzedzają Google pod względem elastyczności i Ishhound Server pod względem wygody i prostoty.

Oficjalna strona:
Rozmiar dystrybucji: 14,7 Mb Porównanie szybkości indeksowania

System wyszukiwania	Czas indeksowania	Rozmiar indeksu
Bloodhound Prof Deluxe 4.5	38 godzin 46 minut	19 GB
Isys Desktop 7.0	6 godzin 13 minut	7,9 GB
DtSearch 7.0	6 godzin 3 minuty	8,6 GB
Google Desktop Search Enterprise	8 godzin 17 minut	4,5 GB
Wyszukiwanie w programie Copernic Desktop *	10 godzin 51 minut	7 GB
SzukajInform 1.5.02	3 godziny 17 minut	4,4 GB

* Większość dokumentów.html i .txt zawierających tekst w języku rosyjskim, mimo że były zaindeksowane, nie dało się znaleźć inaczej niż po ich nazwach.

Wszystkie programy są godne uwagi.

Na podstawie testów i dokładnego zbadania każdego programu przedstawionego w recenzji można wyciągnąć pewne wnioski. Zatem Google Desktop Search Copernic Desktop Search jest całkiem odpowiedni dla niedoświadczonego użytkownika jako domowy system wyszukiwania informacji. Dobrze radzą sobie z prostymi zapytaniami, nie obciążają użytkownika ustawieniami, a ponadto są całkowicie darmowe. Próba wejścia Google na rynek wyszukiwarek korporacyjnych nie jest jeszcze do końca uzasadniona: aby program działał prawidłowo, trzeba go wyposażyć w dodatkowe moduły, a jego konfiguracja nie jest łatwa. Dlatego oczywiste nazwy Desktop Search, Copernic i Google rezerwują za sobą niszę wyszukiwarek „desktopowych”.

Prawdziwe, wydajniejsze rozwiązania - dtSearch, iSYS i SearchInform również nie są niezawodne i oferują użytkownikom wersje „desktopowe”. Ale za rozsądną cenę, w przeciwieństwie do darmowego oprogramowania od Google i Copernic. Za moc, szybkość i funkcjonalność trzeba oczywiście zapłacić. Jednak twórcy dtSearch, iSYS i SearchInform skupiają się głównie na sektorze korporacyjnym. Sieć, funkcjonalność, indeksowanie i szybkość wyszukiwania to cechy, które odróżniają te produkty od ich „konkurencji”. Na podstawie wyników testu wyłoniono faworyta – SearchInform. Program zapewnia możliwość wyszukiwania podobnych dokumentów, ma najszybsze indeksowanie i prędkość wyszukiwania oraz ma dobry zestaw funkcji.

05/10/2016

FileSeek to przydatne narzędzie, które pozwala wielu użytkownikom łatwo znaleźć potrzebne pliki na dysku twardym. Wielofunkcyjny program potrafi wyszukiwać dane przy użyciu różnych filtrów. Przygotowanie procedury jest szybkie i nie wymaga szczególnej uwagi. Użytkownik może dostosować parametry wyszukiwania do swoich potrzeb. FileSeek jest bardzo szybki i skanuje setki plików. Wraz z wynikiem wyświetlany jest rozmiar pliku, numer linii, data ostatniej modyfikacji i nazwa dokumentu. Możesz także tworzyć, zarządzać i synchronizować wiele profili dla różnych projektów. Istnieje możliwość zmiany języka na inny...

30/03/2016

Copernic Desktop Search to wygodna aplikacja służąca do wyszukiwania różnorodnych informacji. Dzięki programowi użytkownicy na różnych poziomach znajdą wiadomości e-mail, załączone pliki i inne dokumenty. Prosty interfejs pomaga użytkownikowi znaleźć pliki w formatach takich jak doc, docx, pdf, xlsx i innych. Możesz znaleźć pliki muzyczne, grafiki, obrazy i filmy. Zaletami aplikacji są niewielki rozmiar aplikacji i minimalne obciążenie komputera. Program wykorzystuje zasoby procesora, miejsce na dysku i pamięć RAM. Copernic Desktop Search (CDS) zawiera różnorodne filtry.

21/10/2015

NeoSearch to jedna z najwygodniejszych aplikacji przeznaczonych do wyszukiwania potrzebnych użytkownikowi danych na komputerze. Program posiada wygodny, zrozumiały i stylowy interfejs użytkownika. Posiada szereg prostych funkcjonalności, z którymi poradzi sobie nawet początkujący użytkownik. Po zainstalowaniu programu rozpoczyna się indeksowanie plików. neoSearch sprawdza stan wszystkich plików znajdujących się w danym momencie na komputerze. Cały ten proces zajmuje minimalną ilość czasu. Specjalistyczna skala informuje Cię o postępie aplikacji. Następnie wyniki wyszukiwania wyświetlane są na ekranie jednocześnie w formie czterech dokumentów, których maks....

01/12/2014

Wise JetSearch to program umożliwiający bezpośrednie wyszukiwanie różnych plików lub folderów znajdujących się na różnych dyskach lokalnych komputera osobistego lub na wymiennych przenośnych nośnikach pamięci. Oprogramowanie to w korzystny sposób zastępuje standardowy model wyszukiwania plików wbudowany w system operacyjny. Może współpracować z dyskami NTFS i FAT; dane są przeszukiwane przy użyciu określonego przez użytkownika szablonu, nazwy lub innych indywidualnych parametrów. Algorytm pracy z programem Wise JetSearch jest dość prosty: wpisz słowa kluczowe, wybierz dysk, rozpocznij wyszukiwanie...

29/09/2014

FileSearchy - stworzony, aby uprościć wyszukiwanie plików na Twoim komputerze. W przeciwieństwie do innych programów wyszukiwania, ten program wyszukuje według nazwy w czasie rzeczywistym. Program umożliwia także przeszukiwanie zawartości plików typu doc i pdf, a jeśli ją znajdzie, podświetla znaleziony tekst. FileSearchy natychmiast wyszukuje potrzebne pliki według nazwy. Sam program obsługuje zakładki, co umożliwi wielokrotne wyszukiwanie w różnych zakładkach, które można wyrównać na końcu. Obsługuje wyszukiwanie według daty, rozmiaru pliku i wpisów rejestru. Możliwe jest wyszukiwanie wielu linii, a także wykluczanie linii, które nie powinny...

05/09/2014

SoftPerfect Network Search Engine (NSE) to program przydatny do szybkiego wyszukiwania udostępnionych plików w sieci lokalnej. Indeksuje i porządkuje pliki tak, aby przy właściwym żądaniu każdy użytkownik mający dostęp do danej sieci lokalnej znalazł żądany plik w ciągu kilku sekund. Administrator sieci ma wiele możliwości, ponieważ program posiada szeroki wybór przydatnych funkcji, które niewątpliwie przydadzą się podczas pracy. Na przykład funkcja selektywnego indeksowania plików i folderów. Instalacja i konfiguracja programu nie zajmie dużo czasu, gdyż nie jest skomplikowana, wystarczy skopiować kilka plików do folderu z...