Hvordan fungerer en søgemaskine? Gennemgang af programmer til søgning i dokumenter og data.

Professionel internetsøgning kræver specialiseret software samt specialiserede søgemaskiner og søgetjenester.

PROGRAMMER

http://dr-watson.wix.com/home – programmet er designet til at studere rækker af tekstinformation for at identificere enheder og forbindelser mellem dem. Resultatet af arbejdet er en rapport om det undersøgte objekt.

http://www.fmsasg.com/ - et af de bedste programmer i verden til at visualisere forbindelser og relationer Sentinel Vizualizer. Virksomheden har fuldstændig russificeret sine produkter og tilsluttet en hotline på russisk.

http://www.newprosoft.com/ – "Web Content Extractor" er den mest kraftfulde, brugervenlige software til at udtrække data fra websteder. Det har også en effektiv Visual Web-edderkop.

SiteSputnik en softwarepakke, der ikke har nogen analoger i verden, som giver dig mulighed for at søge og behandle resultaterne på det synlige og usynlige internet ved at bruge alle de søgemaskiner, der er nødvendige for brugeren.

WebSite-Watcher – giver dig mulighed for at overvåge websider, inklusive adgangskodebeskyttede, overvågningsfora, RSS-feeds, nyhedsgrupper, lokale filer. Har et kraftigt filtersystem. Overvågning udføres automatisk og leveres i en brugervenlig form. Et program med avancerede funktioner koster 50 euro. Konstant opdateret.

http://www.scribd.com/ er den mest populære platform i verden og bruges i stigende grad i Rusland til at sende forskellige slags dokumenter, bøger osv. gratis adgang med en meget praktisk søgemaskine til titler, emner mv.

http://www.atlasti.com/ er det mest kraftfulde og effektive værktøj til kvalitativ informationsanalyse tilgængelig for individuelle brugere, små og endda mellemstore virksomheder. Programmet er multifunktionelt og derfor nyttigt. Det kombinerer evnen til at skabe et samlet informationsmiljø til at arbejde med forskellige tekst-, tabel-, lyd- og videofiler som en enkelt helhed, samt værktøjer til kvalitativ analyse og visualisering.

Ashampoo ClipFinder HD – en stadig større del af informationsstrømmen kommer fra video. Konkurrencedygtige efterretningsofficerer har derfor brug for værktøjer, der giver dem mulighed for at arbejde med dette format. Et sådant produkt er det gratis hjælpeprogram, vi præsenterer. Det giver dig mulighed for at søge efter videoer baseret på specificerede kriterier på videofillagringswebsteder såsom YouTube. Programmet er nemt at bruge, viser alle søgeresultater på én side med detaljerede oplysninger, titler, varighed, tidspunkt, hvor videoen blev uploadet til lageret osv. Der er en russisk grænseflade.

http://www.advego.ru/plagiatus/ – programmet blev lavet af SEO optimizere, men er ganske velegnet som et internetintelligensværktøj. Plagiat viser graden af ​​entydighed af teksten, kilderne til teksten og procentdelen af ​​tekstmatch. Programmet kontrollerer også unikheden af ​​den angivne URL. Programmet er gratis.

http://neiron.ru/toolbar/ – inkluderer en tilføjelse til at kombinere Google og Yandex-søgning og giver også mulighed for konkurrenceanalyse baseret på vurdering af effektiviteten af ​​websteder og kontekstuel annoncering. Implementeret som et plugin til FF og GC.

http://web-data-extractor.net/ er en universel løsning til at indhente alle tilgængelige data på internettet. Opsætning af dataskæring fra enhver side udføres med få museklik. Du skal blot vælge det dataområde, du vil gemme, og Datacol vil automatisk vælge en formel til at skære denne blok ud.

CaptureSaver er et professionelt internetforskningsværktøj. Simpelthen et uundværligt arbejdsprogram, der giver dig mulighed for at fange, gemme og eksportere enhver internetinformation, herunder ikke kun websider, blogs, men også RSS-nyheder, e-mail, billeder og meget mere. Den har den bredeste funktionalitet, en intuitiv brugerflade og en latterlig pris.

http://www.orbiscope.net/en/software.html – webovervågningssystem til mere end overkommelige priser.

http://www.kbcrawl.co.uk/ – software til at arbejde, herunder på "Invisible Internet".

http://www.copernic.com/en/products/agent/index.html – programmet giver dig mulighed for at søge ved hjælp af mere end 90 søgemaskiner med mere end 10 parametre. Giver dig mulighed for at kombinere resultater, eliminere dubletter, blokere ødelagte links og vise de mest relevante resultater. Kommer i gratis, personlige og professionelle versioner. Brugt af mere end 20 millioner brugere.

Maltego er en fundamentalt ny software, der giver dig mulighed for at etablere forholdet mellem emner, begivenheder og objekter i det virkelige liv og på internettet.

TJENESTER

ny https://hunter.io/ – en effektiv service til at opdage og tjekke e-mail.

https://www.whatruns.com/ er en nem at bruge, men effektiv scanner til at finde ud af, hvad der virker og ikke virker på et websted, og hvad dets sikkerhedshuller er. Også implementeret som et plugin til Chrom.

https://www.crayon.co/ er en amerikansk budgetplatform for markeds- og konkurrenceintelligens på internettet.

http://www.cs.cornell.edu/~bwong/octant/ – værtsidentifikator.

https://iplogger.ru/ – en enkel og bekvem service til at bestemme en andens IP.

http://linkurio.us/ er et kraftfuldt nyt produkt til arbejdere med økonomisk sikkerhed og korruptionsefterforskere. Behandler og visualiserer enorme mængder ustruktureret information fra økonomiske kilder.

http://www.intelsuite.com/en – engelsksproget online platform til konkurrencedygtig intelligens og overvågning.

http://yewno.com/about/ er det første operativsystem til at omsætte information til viden og visualisere ustruktureret information. Understøtter i øjeblikket engelsk, fransk, tysk, spansk og portugisisk.

https://start.avalancheonline.ru/landing/?next=%2F – prognoser og analytiske tjenester af Andrey Masalovich.

https://www.outwit.com/products/hub/ – et komplet sæt stand-alone programmer til professionelt arbejde på web 1.

https://github.com/search?q=user%3Acmlh+maltego – udvidelser til Maltego.

http://www.whoishostingthis.com/ – søgemaskine til hosting, IP-adresser osv.

http://appfollow.ru/ – analyse af applikationer baseret på anmeldelser, ASO-optimering, placeringer i toppen og søgeresultater for App Store, Google Play og Windows Phone Store.

http://spiraldb.com/ er en tjeneste implementeret som et plugin til Chrom, som giver dig mulighed for at få en masse værdifuld information om enhver elektronisk ressource.

https://millie.northernlight.com/dashboard.php?id=93 - en gratis service, der indsamler og strukturerer nøgleoplysninger om brancher og virksomheder. Det er muligt at bruge informationspaneler baseret på tekstanalyse.

http://byratino.info/ – indsamling af faktuelle data fra offentligt tilgængelige kilder på internettet.

http://www.datafox.co/ – CI-platformen indsamler og analyserer oplysninger om virksomheder af interesse for kunder. Der er en demo.

https://unwiredlabs.com/home - en specialiseret applikation med en API til søgning ved geolocation af enhver enhed, der er forbundet til internettet.

http://visualping.io/ – en tjeneste til overvågning af websteder og først og fremmest de fotografier og billeder, der er tilgængelige på dem. Selvom billedet kun vises i et sekund, vil det være i abonnentens e-mail. Har et plugin til Google Chrome.

http://spyonweb.com/ er et forskningsværktøj, der giver mulighed for dybdegående analyse af enhver internetressource.

http://bigvisor.ru/ – tjenesten giver dig mulighed for at spore reklamekampagner for bestemte segmenter af varer og tjenester eller specifikke organisationer.

http://www.itsec.pro/2013/09/microsoft-word.html – instruktioner fra Artem Ageev om brug af Windows-programmer til konkurrencedygtige efterretningsbehov.

http://granoproject.org/ er et open source-værktøj til forskere, der sporer netværk af forbindelser mellem individer og organisationer inden for politik, økonomi, kriminalitet osv. Giver dig mulighed for at forbinde, analysere og visualisere information opnået fra forskellige kilder, samt vise væsentlige forbindelser.

http://imgops.com/ – en tjeneste til at udtrække metadata fra grafiske filer og arbejde med dem.

http://sergeybelove.ru/tools/one-button-scan/ – en lille online-scanner til at tjekke sikkerhedshuller på websteder og andre ressourcer.

http://isce-library.net/epi.aspx – tjeneste til at søge primære kilder ved hjælp af et fragment af tekst på engelsk

https://www.rivaliq.com/ er et effektivt værktøj til at udføre konkurrencemæssig efterretning på vestlige, primært europæiske og amerikanske markeder for varer og tjenester.

http://watchthatpage.com/ er en tjeneste, der giver dig mulighed for automatisk at indsamle nye oplysninger fra overvågede internetressourcer. Tjenesten er gratis.

http://falcon.io/ er en slags Rapportive for the Web. Det er ikke en erstatning for Rapportive, men giver yderligere værktøjer. I modsætning hertil giver Rapportive en generel profil af en person, som om den var limet sammen fra data fra sociale netværk og omtaler på nettet http://watchthatpage.com/ - en tjeneste, der giver dig mulighed for automatisk at indsamle ny information fra overvågede ressourcer på internettet. Tjenesten er gratis.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – tilføjelse til Firefox. Overvåger websideopdateringer. Nyttigt for websteder, der ikke har nyhedsfeeds (Atom eller RSS).

http://agregator.pro/ – aggregator af nyheds- og medieportaler. Anvendes af marketingfolk, analytikere mv. at analysere nyhedsstrømme om bestemte emner.

http://price.apishops.com/ – en automatiseret webservice til overvågning af priser for udvalgte produktgrupper, specifikke netbutikker og andre parametre.

http://www.la0.ru/ er en praktisk og relevant tjeneste til at analysere links og backlinks til en internetressource.

www.recordedfuture.com er et kraftfuldt værktøj til dataanalyse og visualisering, implementeret som en onlinetjeneste bygget på cloud computing.

http://advse.ru/ er en tjeneste med sloganet "Find ud af alt om dine konkurrenter." Giver dig mulighed for at få konkurrenters hjemmesider i overensstemmelse med søgeforespørgsler og analysere konkurrenters reklamekampagner i Google og Yandex.

http://spyonweb.com/ – tjenesten giver dig mulighed for at identificere websteder med de samme egenskaber, inklusive dem, der bruger de samme Google Analytics-statistik-tjenesteidentifikatorer, IP-adresser osv.

http://www.connotate.com/solutions – en serie af produkter til konkurrencedygtig intelligens, styring af informationsstrømme og konvertering af information til informationsaktiver. Det omfatter både komplekse platforme og enkle, billige tjenester, der giver mulighed for effektiv overvågning sammen med informationskomprimering og kun opnår de nødvendige resultater.

http://www.clearci.com/ - konkurrencedygtig efterretningsplatform for virksomheder i forskellige størrelser fra nystartede og små virksomheder til Fortune 500-virksomheder. Løst som saas.

http://startingpage.com/ er en Google-tilføjelse, der giver dig mulighed for at søge på Google uden at registrere din IP-adresse. Understøtter fuldt ud alle Google-søgefunktioner, inklusive på russisk.

http://newspapermap.com/ er en unik tjeneste, der er meget nyttig for en konkurrencedygtig efterretningsofficer. Forbinder geolocation med en online mediesøgemaskine. De der. du vælger den region, du er interesseret i, eller endda en by eller et sprog, se stedet på kortet og en liste over online-versioner af aviser og magasiner, klik på den relevante knap og læs. Understøtter russisk sprog, meget brugervenlig grænseflade.

http://infostream.com.ua/ er et meget bekvemt nyhedsovervågningssystem "Infostream", kendetegnet ved et førsteklasses udvalg og ret tilgængeligt for enhver tegnebog, fra en af ​​klassikerne inden for internetsøgning, D.V. Lande.

http://www.instapaper.com/ er et meget enkelt og effektivt værktøj til at gemme de nødvendige websider. Kan bruges på computere, iPhones, iPads mv.

http://screen-scraper.com/ – giver dig mulighed for automatisk at udtrække al information fra websider, downloade langt de fleste filformater og automatisk indtaste data i forskellige former. Den gemmer downloadede filer og sider i databaser og udfører mange andre ekstremt nyttige funktioner. Virker på alle større platforme, har fuldt funktionelle gratis og meget kraftfulde professionelle versioner.

http://www.mozenda.com/ - har flere takstplaner og er tilgængelig selv for små virksomheder, en webservice til multifunktionel webovervågning og levering af information nødvendig for brugeren fra udvalgte websteder.

http://www.recipdonor.com/ - tjenesten giver dig mulighed for automatisk at overvåge alt, hvad der sker på konkurrenternes hjemmesider.

http://www.spyfu.com/ – og det er hvis dine konkurrenter er udenlandske.

www.webground.su er en tjeneste til at overvåge Runet skabt af internetsøgeprofessionelle, som omfatter alle de store udbydere af information, nyheder osv., og som er i stand til individuelle overvågningsindstillinger, der passer til brugerens behov.

SØGEMASKINER

https://www.idmarch.org/ er den bedste søgemaskine til verdens arkiv af pdf-dokumenter med hensyn til kvalitet. I øjeblikket er mere end 18 millioner pdf-dokumenter blevet indekseret, lige fra bøger til hemmelige rapporter.

http://www.marketvisual.com/ er en unik søgemaskine, der giver dig mulighed for at søge efter ejere og topledelse efter fulde navn, firmanavn, stilling eller en kombination heraf. Søgeresultaterne indeholder ikke kun de objekter, du leder efter, men også deres forbindelser. Designet primært til engelsktalende lande.

http://worldc.am/ er en søgemaskine til frit tilgængelige fotografier knyttet til geolocation.

https://app.echosec.net/ er en offentlig søgemaskine, der beskriver sig selv som det mest avancerede analytiske værktøj for retshåndhævelses- og sikkerheds- og efterretningsfolk. Giver dig mulighed for at søge efter fotos, der er lagt ud på forskellige websteder, sociale platforme og sociale netværk i forhold til specifikke geolokationskoordinater. Der er i øjeblikket syv datakilder forbundet. Ved årets udgang vil deres antal være mere end 450. Tak til Dementy for tippet.

http://www.quandl.com/ er en søgemaskine til syv millioner finansielle, økonomiske og sociale databaser.

http://bitzakaz.ru/ – søgemaskine til udbud og offentlige ordrer med yderligere betalte funktioner

Website-Finder - gør det muligt at finde sider, som Google ikke indekserer godt. Den eneste begrænsning er, at den kun søger på 30 websteder for hvert søgeord. Programmet er nemt at bruge.

http://www.dtsearch.com/ er en kraftfuld søgemaskine, der giver dig mulighed for at behandle terabyte tekst. Fungerer på desktop, web og intranet. Understøtter både statiske og dynamiske data. Giver dig mulighed for at søge i alle MS Office-programmer. Søgningen udføres ved hjælp af sætninger, ord, tags, indekser og meget mere. Den eneste tilgængelige fødererede søgemaskine. Den har både betalte og gratis versioner.

http://www.strategator.com/ – søger, filtrerer og samler information om virksomheden fra titusindvis af webkilder. Søgninger i USA, Storbritannien, store EEC-lande. Det er yderst relevant, brugervenligt og har gratis og betalte muligheder ($14 pr. måned).

http://www.shodanhq.com/ er en usædvanlig søgemaskine. Umiddelbart efter sin optræden fik han kaldenavnet "Google for hackere." Den søger ikke efter sider, men bestemmer IP-adresser, typer af routere, computere, servere og arbejdsstationer placeret på en bestemt adresse, sporer kæder af DNS-servere og giver dig mulighed for at implementere mange andre interessante funktioner til konkurrencedygtig intelligens.

http://search.usa.gov/ er en søgemaskine til websteder og åbne databaser for alle amerikanske regeringsorganer. Databaserne indeholder en masse praktisk, nyttig information, også til brug i vores land.

http://visual.ly/ – i dag bruges visualisering i stigende grad til at præsentere data. Dette er den første infografiske søgemaskine på nettet. Sammen med søgemaskinen har portalen kraftfulde datavisualiseringsværktøjer, der ikke kræver programmeringsfærdigheder.

http://go.mail.ru/realtime – søg efter diskussioner om emner, begivenheder, objekter, emner i realtid eller tid, der kan tilpasses. Den tidligere stærkt kritiserede søgning i Mail.ru fungerer meget effektivt og giver interessante, relevante resultater.

Zanran er netop lanceret, men fungerer allerede godt, den første og eneste datasøgemaskine, der udtrækker data fra PDF-filer, EXCEL-tabeller, data på HTML-sider.

http://www.ciradar.com/Competitive-Analysis.aspx er et af verdens bedste informationssøgningssystemer til konkurrencedygtig intelligens på det dybe web. Henter næsten alle typer filer i alle formater om emnet af interesse. Implementeret som en webservice. Priserne er mere end rimelige.

http://public.ru/ – Effektiv søgning og professionel analyse af information, mediearkiv siden 1990. Onlinemediebiblioteket tilbyder en bred vifte af informationstjenester: fra adgang til elektroniske arkiver af russisksprogede mediepublikationer og færdige tematiske presseanmeldelser til individuel overvågning og eksklusiv analytisk forskning baseret på pressemateriale.

Cluuz er en ung søgemaskine med rige muligheder for konkurrencedygtig intelligens, især på det engelsksprogede internet. Giver dig mulighed for ikke kun at finde, men også at visualisere og etablere forbindelser mellem personer, virksomheder, domæner, e-mails, adresser mv.

www.wolframalpha.com – morgendagens søgemaskine. Som svar på en søgeanmodning giver den statistiske og faktuelle oplysninger, der er tilgængelige om anmodningsobjektet, herunder visualiseret information.

www.ist-budget.ru – universel søgning i databaser over offentlige indkøb, udbud, auktioner osv.

Ved første øjekast kan det se ud til, at kun Yandex kan være bedre end Google, og selv det er ikke et faktum. Disse virksomheder investerer enorme summer i innovation og udvikling. Er der virkelig nogen, der har en chance for ikke kun at konkurrere med lederne, men også for at vinde? Lifehackers svar: "Ja!" Der er flere søgemaskiner, der har haft succes. Lad os se på vores helte.

Hvad er dette

Dette er en ret velkendt open source søgemaskine. Servere er placeret i USA. Ud over sin egen robot bruger søgemaskinen resultater fra andre kilder: Yahoo! Søg BOSS, Wikipedia, Wolfram|Alpha.

Des bedre

DuckDuckGo positionerer sig som en søgemaskine, der giver maksimalt privatliv og fortrolighed. Systemet indsamler ingen data om brugeren, gemmer ikke logfiler (ingen søgehistorik), og brugen af ​​cookies er så begrænset som muligt.

DuckDuckGo indsamler eller deler ikke personlige oplysninger fra brugere. Dette er vores privatlivspolitik.
Gabriel Weinberg, grundlægger af DuckDuckGo

Hvorfor har du brug for dette

Alle større søgemaskiner forsøger at tilpasse søgeresultater baseret på data om personen foran skærmen. Dette fænomen kaldes "filterboblen": Brugeren ser kun de resultater, der er i overensstemmelse med hans præferencer, eller som systemet betragter som sådan.

DuckDuckGo skaber et objektivt billede, der ikke afhænger af din tidligere adfærd på internettet, og eliminerer tematisk annoncering fra Google og Yandex baseret på dine forespørgsler. Med DuckDuckGo er det nemt at søge efter information på fremmedsprog: Google og Yandex foretrækker som standard russisksprogede websteder, selvom forespørgslen er indtastet på et andet sprog.

Hvad er dette

"" er et russisk metasøgningssystem udviklet af kandidater fra Moskva State University Viktor Lavrenko og Vladimir Chernyshov. Den søger gennem indekserne for Google, Bing, Yandex og andre, og har også sin egen søgealgoritme.

Des bedre

Søgning gennem indekserne for alle større søgemaskiner giver dig mulighed for at generere relevante resultater. Derudover opdeler Nigma resultaterne i flere tematiske grupper (klynger) og inviterer brugeren til at indsnævre søgefeltet, kassere unødvendige eller fremhæve prioriterede. Takket være matematik- og kemimodulerne kan du løse matematiske problemer og anmode om resultaterne af kemiske reaktioner direkte i søgefeltet.

Hvorfor har du brug for dette

Eliminerer behovet for at søge efter den samme forespørgsel i forskellige søgemaskiner. Klyngesystemet gør det nemt at manipulere søgeresultater. For eksempel samler Nigma resultater fra onlinebutikker i en separat klynge. Hvis du ikke har til hensigt at købe noget, skal du blot udelukke denne gruppe. Ved at vælge "Engelsksprogede websteder"-klyngen vil du kun modtage resultater på engelsk. Matematik- og kemimodulerne vil hjælpe skolebørn.

Desværre er projektet ikke under udvikling i øjeblikket, da udviklerne har overført deres aktivitet til det vietnamesiske marked. Ikke desto mindre er "Nigma" ikke kun ikke forældet endnu, men på nogle ting giver det stadig Google et forspring. Lad os håbe udviklingen genoptages.

Hvad er dette

not Evil er et system, der søger på det anonyme Tor-netværk. For at bruge det skal du gå til dette netværk, for eksempel ved at starte en specialiseret browser af samme navn. not Evil er ikke den eneste søgemaskine af sin art. Der er LOOK (standardsøgningen i Tor-browseren, tilgængelig fra det almindelige internet) eller TORCH (en af ​​de ældste søgemaskiner på Tor-netværket) og andre. Vi slog os fast på ikke det onde på grund af den klare hentydning til Google selv (se bare startsiden).

Des bedre

Den søger, hvor Google, Yandex og andre søgemaskiner generelt er lukket.

Hvorfor har du brug for dette

Tor-netværket indeholder mange ressourcer, som ikke kan findes på det lovlydige internet. Og efterhånden som regeringens kontrol med indholdet af internettet strammer, vil deres antal vokse. Tor er en slags netværk inden for netværket: med sine egne sociale netværk, torrent-trackere, medier, handelsplatforme, blogs, biblioteker og så videre.

YaCy

Hvad er dette

YaCy er en decentral søgemaskine, der arbejder efter princippet om P2P-netværk. Hver computer, hvor hovedsoftwaremodulet er installeret, scanner internettet uafhængigt, det vil sige, at det er analogt med en søgerobot. De opnåede resultater er samlet i en fælles database, der bruges af alle YaCy-deltagere.

Des bedre

Det er svært at sige, om dette er bedre eller værre, da YaCy er en helt anden tilgang til at organisere søgning. Fraværet af en enkelt server og ejervirksomhed gør resultaterne fuldstændig uafhængige af nogens præferencer. Hver nodes autonomi eliminerer censur. YaCy er i stand til at søge på deep web og ikke-indekserede offentlige netværk.

Hvorfor har du brug for dette

Hvis du er tilhænger af open source-software og et gratis internet, ikke påvirket af offentlige myndigheder og store virksomheder, så er YaCy dit valg. Det kan også bruges til at organisere en søgning inden for et virksomheds- eller andet selvstændigt netværk. Og selvom YaCy ikke er særlig brugbar i hverdagen, er det et værdigt alternativ til Google i forhold til søgeprocessen.

Pipl

Hvad er dette

Pipl er et system designet til at søge efter information om en bestemt person.

Des bedre

Forfatterne af Pipl hævder, at deres specialiserede algoritmer søger mere effektivt end "almindelige" søgemaskiner. Prioriterede informationskilder omfatter især sociale netværksprofiler, kommentarer, medlemslister og forskellige databaser, der offentliggør oplysninger om personer, såsom domstolsafgørelser. Pipls lederskab på dette område bekræftes af vurderinger fra Lifehacker.com, TechCrunch og andre publikationer.

Hvorfor har du brug for dette

Hvis du har brug for at finde information om en person, der bor i USA, så vil Pipl være meget mere effektiv end Google. Russiske domstoles databaser er tilsyneladende utilgængelige for søgemaskinen. Derfor har han det ikke så godt med russiske statsborgere.

Hvad er dette

En anden specialiseret søgemaskine. Søger efter forskellige lyde (hus, natur, biler, mennesker osv.) i åbne kilder. Tjenesten understøtter ikke forespørgsler på russisk, men der er en imponerende liste over russisksprogede tags, som du kan søge efter.

Des bedre

Outputtet indeholder kun lyde og intet ekstra. I søgeindstillingerne kan du indstille det ønskede format og lydkvalitet. Alle fundne lyde er tilgængelige for download. Der søges efter lyde efter mønster.

Hvorfor har du brug for dette

Hvis du hurtigt har brug for at finde lyden af ​​et musketskud, slagene fra en diende spætte eller Homer Simpsons skrig, så er denne service noget for dig. Og jeg valgte kun dette fra de tilgængelige russisksprogede forespørgsler. På engelsk er spektret endnu bredere. Men seriøst, en specialiseret tjeneste kræver et specialiseret publikum. Men hvad nu, hvis det også er nyttigt for dig?

Alternative søgemaskiners liv er ofte flygtigt. Lifehacker spurgte den tidligere generaldirektør for den ukrainske afdeling af Yandex, Sergei Petrenko, om de langsigtede udsigter for sådanne projekter.

Hvad angår alternative søgemaskiners skæbne, er det enkelt: at være meget nicheprojekter med et lille publikum, derfor uden klare kommercielle udsigter eller omvendt med fuldstændig klarhed over deres fravær.

Hvis du ser på eksemplerne i artiklen, kan du se, at sådanne søgemaskiner enten specialiserer sig i en smal, men populær niche, som måske endnu ikke er vokset nok til at være mærkbar på Googles eller Yandex' radarer, eller også tester de. en original hypotese i ranking, som endnu ikke er anvendelig i almindelig søgning.

For eksempel, hvis en søgning på Tor pludselig viser sig at være efterspurgt, dvs. resultater derfra er nødvendige for mindst en procentdel af Googles publikum, så vil almindelige søgemaskiner selvfølgelig begynde at løse problemet med, hvordan man finde dem og vise dem til brugeren. Hvis publikums adfærd viser, at for en betydelig del af brugerne i et betydeligt antal forespørgsler virker resultater givet uden at tage hensyn til faktorer afhængigt af brugeren mere relevante, så vil Yandex eller Google begynde at producere sådanne resultater.

"Vær bedre" i denne artikels sammenhæng betyder ikke "vær bedre til alting." Ja, i mange aspekter er vores helte langt fra Google og Yandex (endda langt fra Bing). Men hver af disse tjenester giver brugeren noget, som søgeindustriens giganter ikke kan tilbyde.

Hej kære læsere af bloggen. , så havde dens få brugere nok af deres egne bogmærker. Men som du husker, skete det i geometrisk progression, og meget snart blev det sværere at navigere i al dens mangfoldighed.

Derefter dukkede mapper op (Yahoo, Dmoz og andre), hvor deres forfattere tilføjede og sorterede forskellige websteder i kategorier. Dette gjorde straks livet lettere for de daværende, endnu ikke ret mange brugere af det globale netværk. Mange af disse kataloger er stadig i live i dag.

Men efter nogen tid blev størrelsen af ​​deres databaser så store, at udviklerne først tænkte på at lave en søgning i dem og derefter på at lave et automatiseret system til indeksering af alt internetindhold for at gøre det tilgængeligt for alle.

De vigtigste søgemaskiner i det russisktalende segment af internettet

Som du forstår, blev denne idé implementeret med fantastisk succes, men alt viste sig dog kun godt for en håndfuld udvalgte virksomheder, der formåede ikke at forsvinde på internettet. Næsten alle søgemaskiner, der dukkede op i den første bølge, er nu enten forsvundet, forsvundet eller købt af mere succesrige konkurrenter.

En søgemaskine er en meget kompleks og vigtigst af alt meget ressourcekrævende mekanisme (dette betyder ikke kun materielle ressourcer, men også menneskelige). Bag den tilsyneladende simple , eller dens asketiske analog fra Google, er der tusindvis af ansatte, hundredtusindvis af servere og mange milliarder af investeringer, som er nødvendige for, at denne kolos kan fortsætte med at fungere og forblive konkurrencedygtig.

At gå ind på dette marked nu og starte fra bunden er mere en utopi end et rigtigt forretningsprojekt. Eksempelvis har en af ​​verdens rigeste virksomheder, Microsoft, i årtier forsøgt at få fodfæste på søgemarkedet, og først nu begynder deres søgemaskine Bing så småt at leve op til deres forventninger. Og før det var der en hel række af fiaskoer og tilbageslag.

Hvad kan vi sige om at komme ind på dette marked uden nogen særlig økonomisk påvirkning. For eksempel har vores indenlandske søgemaskine Nigma en masse nyttige og innovative ting i sit arsenal, men deres trafik er tusindvis af gange lavere end lederne på det russiske marked. Tag for eksempel et kig på det daglige Yandex-publikum:

I denne henseende kan vi antage, at listen over de vigtigste (bedste og heldigste) søgemaskiner i Runet og hele internettet allerede er blevet dannet, og hele intrigen ligger kun i, hvem der til sidst vil fortære hvem, eller hvordan deres procentvise andel vil fordeles, hvis de alle overlever og vil holde sig flydende.

Russisk søgemaskinemarked er meget tydeligt synlig, og her kan vi sandsynligvis skelne mellem to eller tre hovedspillere og et par mindre. Generelt har der udviklet sig en ret unik situation i RuNet, som, som jeg forstår det, kun har gentaget sig i to andre lande i verden.

Jeg taler om det faktum, at Google-søgemaskinen, der kom til Rusland i 2004, stadig ikke har været i stand til at tage ledelsen. Faktisk forsøgte de at købe Yandex omkring denne periode, men noget fungerede ikke derude, og nu er "vores Rusland", sammen med Tjekkiet og Kina, de steder, hvor den almægtige Google, hvis ikke besejret, så i i hvert fald mødte alvorlig modstand.

Faktisk at se tingenes aktuelle tilstand blandt de bedste søgemaskiner på RuNet Enhver kan. Det vil være nok at indsætte denne URL i adresselinjen i din browser:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Faktum er, at de fleste af dem bruger .

Efter at have indtastet den givne URL, vil du se et billede, der ikke er særlig attraktivt og præsentabelt, men det afspejler essensen af ​​sagen. Vær opmærksom på de fem bedste søgemaskiner, hvorfra websteder på russisk modtager trafik:

Ja, selvfølgelig er ikke alle ressourcer med russisksproget indhold placeret i denne zone. Der er også SU og RF, og generelle områder som COM eller NET er fulde af internetprojekter med fokus på Runet, men alligevel er stikprøven ret repræsentativ.

Denne afhængighed kan præsenteres på en mere farverig måde, som for eksempel nogen gjorde online til sin præsentation:

Dette ændrer ikke på essensen. Der er et par ledere og flere meget, meget langt bagefter søgemaskinerne. Jeg har i øvrigt allerede skrevet om mange af dem. Nogle gange kan det være ret interessant at kaste sig ud i succeshistorien eller omvendt at dykke ned i årsagerne til fejlene i engang lovende søgemaskiner.

Så i rækkefølge af betydning for Rusland og Runet som helhed, vil jeg liste dem og give dem korte karakteristika:

    At søge på Google er allerede blevet et kendt ord for mange mennesker på kloden – du kan læse om det i linket. I denne søgemaskine kunne jeg godt lide muligheden for "oversættelse af resultater", da du modtog svar fra hele verden, men på dit modersmål, men nu er den desværre ikke tilgængelig (i det mindste på google.ru).

    På det seneste har jeg også været forundret over kvaliteten af ​​deres output (Search Engine Result Page). Personligt bruger jeg altid først RuNet-spejlsøgemaskinen (der er en der, ja, den er jeg vant til), og kun hvis jeg ikke finder et forståeligt svar der, henvender jeg mig til Google.

    Normalt gjorde udgivelsen af ​​dem mig glad, men på det seneste har det kun undret mig – nogle gange kommer sådan noget sludder frem. Det er muligt, at deres kamp for at øge indtægterne fra kontekstuel annoncering og den konstante blanding af søgeresultater for at miskreditere SEO-promovering kan føre til det modsatte resultat. Under alle omstændigheder har denne søgemaskine en konkurrent på RuNet, og hvad er det for en.

    Jeg tror, ​​at det er usandsynligt, at nogen specifikt vil gå til Go.mail.ru for at søge i RuNet. Derfor kan trafikken til underholdningsprojekter fra denne søgemaskine være væsentligt mere end ti procent. Ejere af sådanne projekter bør være opmærksomme på dette system.

Ud over de klare ledere på søgemaskinemarkedet i det russisksprogede segment af internettet er der dog flere aktører, hvis andel er ret lav, men ikke desto mindre gør selve deres eksistens det nødvendigt at sige et par ord omkring dem.

Runet søgemaskiner fra andet led


Internet-dækkende søgemaskiner

I det store og hele er der på hele internettets skala kun én seriøs aktør - Google. Dette er den ubestridte leder, men den har stadig en vis konkurrence.

Først og fremmest er det stadig det samme Bing, som for eksempel har en rigtig god position på det amerikanske marked, især i betragtning af, at dens motor også bruges på alle Yahoo-tjenester (næsten en tredjedel af hele det amerikanske søgemarked).

For det andet, på grund af den enorme andel, som brugere fra Kina udgør af det samlede antal internetbrugere, kaldte deres hovedsøgemaskine Baidu kiler sig ind i fordelingen af ​​steder på verdens Olympus. Han blev født i 2000, og nu er hans andel omkring 80 % af hele det nationale publikum i Kina.

Det er svært at sige noget mere forståeligt om Baidu, men på internettet er der meninger om, at steder i dens top ikke kun er optaget af de websteder, der er mest relevante for anmodningen, men også af dem, der har betalt for det (direkte til søgemaskinen) , og ikke til SEO-kontoret). Det gælder naturligvis primært for kommercielle opslag.

Generelt, når man ser på statistikken, bliver det klart, hvorfor Google nemt accepterer at forværre sine søgeresultater i bytte for øget overskud fra kontekstuel annoncering. Faktisk er de ikke bange for brugerafgang, for i de fleste tilfælde har de ingen steder at tage hen. Denne situation er lidt trist, men vi må se, hvad der sker.

I øvrigt, for at gøre livet endnu mere vanskeligt for optimizere, og måske for at bevare roen for denne søgemaskines brugere, har Google for nylig brugt kryptering, når de har sendt forespørgsler fra brugernes browsere til søgefeltet. Snart vil det ikke længere være muligt at se i statistikken over besøgstællere, hvilke forespørgsler Google-brugere kom til dig for.

Ud over søgemaskinerne nævnt i denne publikation er der naturligvis tusindvis af andre - regionale, specialiserede, eksotiske osv. At forsøge at liste og beskrive dem alle i én artikel ville være umuligt, og sandsynligvis ikke nødvendigt. Lad os hellere sige et par ord om hvor nemt det er at oprette en søgemaskine og hvor nemt og billigt det er at holde det opdateret.

Langt de fleste systemer arbejder efter lignende principper (læs om dit og hint) og forfølger det samme mål – at give brugerne svar på deres spørgsmål. Desuden skal dette svar være relevant (svarende til spørgsmålet), omfattende og, hvilket ikke er uvæsentligt, relevant (af den første friskhed).

At løse dette problem er ikke så let, især i betragtning af, at søgemaskinen bliver nødt til at analysere indholdet af milliarder af internetsider i farten, luge de unødvendige ud og ud fra de resterende danne en liste (problem), hvor de fleste passende svar på brugerens spørgsmål vises først.

Denne ekstremt komplekse opgave løses ved foreløbig indsamling af information fra disse sider ved hjælp af forskellige indekseringsrobotter. De indsamler links fra allerede besøgte sider og indlæser oplysninger fra dem i søgemaskinens database. Der er bots, der indekserer tekst (en almindelig og hurtig bot, der lever af nyheder og hyppigt opdaterede ressourcer, så de seneste data altid præsenteres i resultaterne).

Derudover er der robotter, der indekserer billeder (til deres efterfølgende output til), faviconer, sidespejle (til deres efterfølgende sammenligning og eventuel limning), bots, der kontrollerer funktionaliteten af ​​internetsider, hvilke brugere eller gennem værktøjer til webmastere (her kan du kan læse om, og).

Selve indekseringsprocessen og den efterfølgende proces med at opdatere indeksdatabaser er ret tidskrævende. Selvom Google gør dette meget hurtigere end sine konkurrenter, i det mindste Yandex, som tager en uge eller to at gøre dette (læs om).

Typisk opdeler en søgemaskine tekstindholdet på en internetside i enkelte ord, som er reduceret til de grundlæggende principper, så den derefter kan give korrekte svar på stillede spørgsmål i forskellige morfologiske former. Alle de ekstra ting i form af HTML-tags, mellemrum osv. ting slettes, og de resterende ord er sorteret alfabetisk, og deres placering i dette dokument er angivet ved siden af ​​dem.

Denne slags ting kaldes et omvendt indeks og giver dig mulighed for at søge ikke efter websider, men efter strukturerede data placeret på søgemaskinens servere.

Antallet af sådanne servere til Yandex (som hovedsageligt kun søger efter russisksprogede websteder og lidt efter ukrainsk og tyrkisk) er i titusinder eller endda hundredtusindvis, og for Google (som søger på hundredvis af sprog) - i millioner .

Mange servere har kopier, som både tjener til at øge sikkerheden af ​​dokumenter og hjælpe med at øge hastigheden på anmodningsbehandlingen (ved at fordele belastningen). Estimer omkostningerne ved at opretholde hele denne økonomi.

Brugerens anmodning vil blive sendt af belastningsbalanceren til det serversegment, der i øjeblikket er mindst indlæst. Derefter foretages en analyse af den region, som søgemaskinebrugeren sendte sin anmodning fra, og den analyseres morfologisk. Hvis en lignende forespørgsel for nylig blev indtastet i søgefeltet, får brugeren data fra cachen for ikke at overbelaste serverne igen.

Hvis anmodningen endnu ikke er blevet cachelagret, overføres den til det område, hvor søgemaskinens indeksdatabase er placeret. Som svar vil du modtage en liste over alle internetsider, der i det mindste er relateret til anmodningen. Der tages ikke kun hensyn til direkte forekomster, men også andre morfologiske former, samt mv. ting.

Deres skal rangeres og på dette stadium kommer algoritmen (kunstig intelligens) i spil. Faktisk multipliceres brugerens anmodning gennem alle mulige muligheder for fortolkning, og svar på mange anmodninger søges samtidigt (ved brug af forespørgselssprog-operatorer, hvoraf nogle er tilgængelige for almindelige brugere).

Som regel indeholder søgeresultaterne én side fra hvert websted (nogle gange mere). er nu meget komplekse og tager højde for mange faktorer. Derudover, for at rette dem, og bruges, som manuelt evaluerer referencesteder, som giver dig mulighed for at justere driften af ​​algoritmen som helhed.

Generelt er det klart, at sagen er mørk. Vi kan tale om dette i lang tid, men det er allerede klart, at brugertilfredshed med et søgesystem opnås, åh, hvor er det svært. Og der vil altid være dem, der ikke kan lide noget, som dig og mig, kære læsere.

Held og lykke! Vi ses snart på bloggens sider

Du kan se flere videoer ved at gå til
");">

Du kan være interesseret

Yandex People - hvordan man søger efter folk på sociale netværk Apometr er en gratis tjeneste til sporing af ændringer i søgeresultater og opdateringer af søgemaskiner. DuckDuckGo - en søgemaskine, der ikke følger dig
Sådan tjekker du internethastighed - onlineforbindelsestest på computer og telefon, SpeedTest, Yandex og andre målere
Yandex og Google billeder, samt søgning efter billedfil i Tineye (tinai) og Google


At sige, at i vores tid med informationsteknologi og den endeløse vækst i mængden af ​​data, der er tilgængelig for både et individ og samfund, er der mange problemer med at behandle information og søge efter dem, er allerede blasfemi. Hvem rejser ikke dette emne? Og for ikke at belaste dig med subjektive og til dels objektive vurderinger hentet fra forskellige informationskilder vedrørende problemet, vil jeg gå direkte til dets løsning. I dag vil vi tale om søgning. Altså om programmer og seriøse informationssystemer, der søger efter de dokumenter og data, vi har brug for.

Opgrader "direkte søgning"

For ikke så længe siden, da træerne var store, og der ikke var meget information selv på virksomhedens lokale netværk, blev enhver søgning udført ved blot at søge gennem en håndfuld tilgængelige filer og sekventielt kontrollere deres navne og indhold. En sådan søgning kaldes direkte, og programmer (hjælpeprogrammer), der bruger direkte søgeteknologi, findes traditionelt i alle operativsystemer og værktøjspakker. Men selv kraften i moderne computere er ikke nok til en hurtig og tilstrækkelig søgning i gigantiske mængder af data under direkte søgning. At søge gennem et par hundrede dokumenter på en disk og søge i et enormt bibliotek og flere dusin postkasser er to forskellige ting. Derfor falder direkte søgeprogrammer i dag tydeligvis i baggrunden – når det kommer til universelle værktøjer.

Selvfølgelig har denne type søgning ikke været efterspurgt i lang tid i erhvervslivet. Mængderne er ikke de samme. Og derfor er teknologier, der er i stand til hurtigt og præcist at søge efter dokumenter i forskellige formater og fra forskellige kilder, mere end relevante i mange år nu, og for nylig helt klart. For ikke så længe siden annoncerede Microsofts "far" Bill Gates, der tilsyneladende var misundelig på internetsøgemaskinens fænomenale succes, på en af ​​pressekonferencerne softwareindustriens (og ikke kun) ønske om at bidrage på alle mulige måder, udvikle og uddybe skabelsen af ​​søgemaskiner og teknologier. Men det er for tidligt at skabe noget fænomenalt fungerende program fra Microsoft eller en konkurrencedygtig server på internettet (MSN når stadig ikke Google). Lad os derfor vende os til den eksisterende udvikling. Indeks, forespørgsel, relevans

Moderne teknologier er baseret på to grundlæggende processer. For det første er det at indeksere de tilgængelige oplysninger og behandle anmodningen med efterfølgende output af resultaterne. Hvad angår det første, opretter ethvert program (det være sig en desktop-søgemaskine, et virksomhedsinformationssystem eller en internetsøgemaskine) sit eget søgeområde. Det vil sige, at den behandler dokumenter og genererer et indeks over disse dokumenter (en organiseret struktur, der indeholder information om de behandlede data). I fremtiden er det det oprettede indeks, der bruges til arbejdet - hurtigt at få en liste over nødvendige dokumenter i henhold til anmodningen. Hvad der følger, selv om det på ingen måde er enkelt med hensyn til teknologi, er ganske forståeligt for den gennemsnitlige bruger. Programmet behandler anmodningen (ved hjælp af en søgeordssætning) og viser en liste over dokumenter, der indeholder denne søgeordssætning. Da informationen er indeholdt i et struktureret indeks, er forespørgselsbehandlingen meget hurtigere (tiere og hundredvis af gange!) end ved direkte søgning (udvælgelsen af ​​dokumenter udføres ikke ved at optælle filer, men ved at analysere tekstinformation i indeks).

Programmet viser de fundne dokumenter i den resulterende liste efter relevans - dokumentets overensstemmelse med forespørgselsteksten. I forskellige teknologier er der selvfølgelig forskellige metoder til at søge og bestemme relevansen af ​​et dokument (antallet af "forekomster" af et ord og dets omtalehyppighed i dokumentet, forholdet mellem disse parametre og det samlede antal ord i dokumentet, afstanden mellem ordene i forespørgselssætningen i de søgte filer og så videre). Baseret på disse parametre bestemmes "vægten" af dokumentet, og afhængigt af det vises en bestemt fil på listen over resultater på en bestemt position. I tilfælde af internetsøgning er situationen endnu mere kompliceret. I dette tilfælde skal der tages højde for mange andre faktorer (Googles Page Rank er et eksempel på dette). Men dette er et emne for en separat artikel, så vi vil ikke røre internettet. Gennemgang af søgemaskiner

Dette materiale undersøger mulighederne for flere populære søgeprogrammer, der kan prale af både anstændige hastigheder og god funktionalitet. Men at vise sig frem i brochurer er én ting, men at stå under en eksperts blik er noget helt andet. Og der var ikke flere eksperter, ikke mindre et kontor fyldt med mennesker, der kunne lide at pille ved softwaren for dens anvendelighed. Et sæt programmer blev installeret på den eksperimentelle computer (Athlon 2,2 MHz, med RAM 1 GB, 160 GB IDE-harddisk Seagate 7200 rpm og Windows XP): dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform , Copernic Desktop Search, ISYS Desktop. Til testene blev der udarbejdet en tekstdatabase med dokumenter i doc-, txt- og html-formater med en samlet størrelse på hverken mere eller mindre, men 20 gigabyte. En gruppe kammerater under ledelse af din ydmyge tjener testede, sammenlignede og delte deres subjektive indtryk af hver software. Læs et sammendrag af resultaterne nedenfor. dtSearch Desktop

Et program, der ifølge udviklerne hævder at være den hurtigste, mest bekvemme og bedste søgemaskine. Som generelt alle andre fra denne anmeldelse. dtSearch-grænsefladen er ret enkel, men nogle vinduer eller faner er noget overbelastet med elementer, hvilket gør det svært at bruge. Men i virkeligheden er der ingen særlige vanskeligheder. Det eneste virkelig ubehagelige punkt er softwarens manglende understøttelse af det russiske sprog (på trods af det faktum, at programmet kan søge efter dokumenter på flere sprog, er dets grænseflade udelukkende engelsk).

Men dtSearch er et af de få programmer, der kan indeksere websider til en brugerspecificeret "dybde" (omend under hensyntagen til "ekstra køb" af dtSearch Spider-tilføjelsessættet). Dette er udover at understøtte diskfiler i forskellige tekstformater og e-mails fra Outlook-postkassen. Samtidig kan programmet ikke arbejde sammen med databaser, som er en så velsmagende bid for søgemaskiner på grund af de store mængder information, der er indeholdt i dem og deres brede udbredelse i virksomheder og derfor i virksomhedsnetværk. Hastigheden af ​​at indeksere dtSearch-dokumenter viste sig at være på det rigtige niveau. Når jeg ser fremad, vil jeg sige, at dette program klarede indekseringen af ​​en given mængde information på niveau med en anden konkurrent - iSYS - og delte andenpladsen med den på listen over de hurtigste systemer. dtSearch indekserede en test 20 gigabyte information på 6 timer og 13 minutter, hvilket skabte et indeks på 7,9 GB til efterfølgende søgebehov.

Hvad angår søgefunktionerne, er de her på det rette niveau. For det første har dtSearch en morfologisk søgning (søgning efter et ord i alle dets morfologiske former). Ved at bruge denne mulighed frigør du dig selv fra for eksempel tanker som "i hvilket tilfælde blev et bestemt ord brugt i det dokument, jeg havde brug for?" Brugen af ​​morfologisk søgning er næsten altid berettiget, så den bør være til stede i enhver professionel søgemaskine.

Søg efter lyd er en ikke-standard funktion selv for professionelle søgemaskiner. Dens essens er, at programmet vil søge efter ord, der lyder det samme som det ord, du indtastede. Og det bedste er, denne funktion fungerer også for det russiske sprog! For eksempel, når du skriver ordet "øre" i en søgeforespørgsel, vil du ikke kun se ordene "øre", men også "øre" som et resultat.

Søgning med fejlretning er en meget vigtig funktion. Det bruges til at søge efter ord, der indeholder syntaktiske fejl - det kan f.eks. være enten tastefejl eller fejl i dokumenter, der er opnået ved hjælp af tegngenkendelsessystemer. Et simpelt eksempel - du leder efter ordet tastatur. Nogle dokumenter indeholder ordet "tastatur", det er indlysende, at dette faktisk er ordet "tastatur", personen har lige lavet en tastefejl, da han skrev. Så en fejlrettelsessøgning vil opdage og inkludere et dokument med ordet "tastatur" i resultatet. Der er også en indstilling i dtSearch, der giver dig mulighed for at bestemme graden af ​​mulige fejlagtige tegn.

Søg ved hjælp af synonymer. Denne funktion bruger en liste over synonymer til forskellige ord. Så for eksempel, ved at indtaste ordet "hurtig", vil programmet også finde ordene "højhastighed" og andre, der er synonymer for ordet "hurtigt", hvis de selvfølgelig er til stede på listen over synonymer . En færdig liste over synonymer medfølger ikke med dtSearch programmet, men det er muligt at bruge lister på internettet (derfor kræves en forbindelse, hvilket ikke altid er praktisk), eller du kan oprette din egen liste over synonymer .

Ud over de anførte muligheder kan dtSearch søge ved hjælp af sætninger bestående af ord forbundet med logiske operationer. Hvert ord i en forespørgsel kan tildeles sin egen "vægt", det vil sige betydning. En nyttig mulighed er at bruge en ordbog bestående af uvæsentlige ord for ikke at tage hensyn til dem, når du søger, men denne ordbog er også tom, og du skal selv udfylde den.

Lad os derefter se på programmets muligheder, når du arbejder på netværket. Faktisk tilbyder dtSearch ikke nogen specifikke muligheder for at arbejde med netværket. Det er dog sagtens muligt at bruge det online. Alternativt kan du oprette en form for indeks og lægge den i en offentlig (delt) mappe. Selve programmet kan installeres på hver brugers computer, eller det kan også placeres i en mappe, der er åben for offentlig adgang, og genveje kan oprettes på en særlig måde for hver bruger separat ved hjælp af kommandolinjeparametre, hvis formål er beskrevet i hjælpefilen, der følger med programmet. Det er også muligt automatisk at installere programmet på netværket ved hjælp af en MSI-fil. Dette vil tage højde for indstillingerne for hver tilsluttet bruger.

Generelt er det et godt program fra kategorien professionelle søgemaskiner. Det kan kvalificere sig til en god vurdering, men det er måske ikke nemt for dtSearch at få tillid og respekt fra brugerne på grund af visse faktorer (ikke alt er glat med grænsefladen, russiske brugere er frataget, der er ingen lyse funktioner til at arbejde med netværket) . Hvad angår direkte søgning efter dokumenter, havde programmet ingen problemer med russisk tekst. Da der ikke var nogen med den erklærede morfologi, eller med en uklar søgning. Systemet fandt ganske tilstrækkeligt de nødvendige dokumenter både ved en simpel forespørgsel på ét ord og ved at bruge et par afsnit eller et dokument som nøgleudtryk.

Officiel side:
Distributionsstørrelse: 23 Mb Bloodhound Prof Deluxe

Baseret på navnet kan du gætte, at der er understøttelse af det russiske sprog i dette program. Det her er allerede dejligt. Hvad angår grænsefladen, er den generelt noget usædvanlig, men i udseende er den meget attraktiv. En anden ting er bekvemmelighed. Et meget kontroversielt kriterium, men stadig, sandsynligvis, er en multi-vindusløsning ikke den mest succesfulde mulighed (anmodningen indtastes i et vindue, resultatet vises i et andet og lignende).

Snoop bruger de samme indekser til at udføre en hurtig søgning, men indeksering er meget langsommere end andre programmer. Dette er meget mærkeligt, især i betragtning af, at dets muligheder for at behandle søgeforespørgsler er meget svage, og derfor er indeksstrukturen ikke kompleks. Mest sandsynligt skyldes dette uoptimerede algoritmer. Dette program viste sig at være en klar outsider inden for indeksering og søgehastigheder: Tiden brugt på at oprette et indeks er seks gange længere end for dtSearch og iSYS. Indeksering af 20 gigabyte tekster til blodhunden resulterede i 38 timer og 46 minutters arbejde. Og det oprettede "søgeområde" optog samme størrelse på harddisken som de originale data med et lille minus - 19 gigabyte.

Bloodhound kan præsenteres som et alternativ til standardsøgningen i Windows; den er usandsynligt i stand til mere. Det faktum, at Snoopers primære opgave er den enkleste søgning efter filer, indikeres ikke kun af det lille antal funktioner til at analysere teksten i søgeforespørgsler og en avanceret søgning efter filattributter, men endda af et resultatvindue, der giver direkte links til fundet filer, samt til mapperne, der indeholder disse filer. Resultatvinduet er ikke særlig informativt i den forstand, at du kun kan læse hele den fundne fil ved at køre den, det vil sige, at den ikke har en indbygget filfremviser. Men et uddrag fra filen, hvor det søgte ord blev fundet, vises; generelt minder dette visningsskema meget om internetsøgemaskiner.

Når vi taler om specifikke muligheder for at behandle søgeforespørgsler, er det værd at bemærke, at der ikke er noget, der hedder "søgetekst"; det maksimale, der kan søges i, er en sætning, om ikke andet fordi der ikke er noget tekstinputfelt med flere linjer. Du kan dog analysere den indtastede sætning, og Snoop tilbyder os et standard søgesæt her: logiske operationer, maskesøgning og citatsøgning... ikke meget. Programmet indeholder nogle rudimenter af morfologisk søgning, men det er sandsynligvis så råt, at det højst sandsynligt forstyrrer korrekt drift (under tests blev der bemærket mange fejl med forkert brug af morfologi).

Men programmet giver dig mulighed for at angive filattributter, når du søger (dokumentdato, filnavn, mappenavn), og i disse forespørgsler kan du også bruge det samme søgesæt. Du kan også søge efter bogstaver ved at angive parametrene (Fra, Emne... osv.).

Så vi fandt ud af selve søgningen, hvad er ellers interessant ved programmet, som det modtog så mange priser for, ifølge oplysninger fra den officielle hjemmeside? Det er svært at sige, hvad der er så specielt ved det; højst sandsynligt er Bloodhound-grænsefladen attraktiv (præcis i udseende, for ikke at nævne brugervenligheden).

Operationer med indekser er meget standard; en god funktion er muligheden for at opdatere indekser på en tidsplan. Derudover kan indekser også bruges online. Fra nu af har vi brug for flere detaljer.

På trods af søgeforespørgslernes primitive karakter kan programmet bruges til at søge efter filer, så dets brug kan retfærdiggøres i netværk. Selvom dette er en strækning, da det i et stort netværk prioriteres hurtigt at søge efter data ved hjælp af komplekse søgeforespørgsler på grund af den enorme mængde information - og der er tydeligvis problemer med søgningens hastighed og programmet. Jeg må sige, at arbejdet med netværket på Izhishika er gennemtænkt, som det skal. En separat applikation er designet specifikt til dette - Bloodhound Server. Det fungerer på samme måde som blot Snooper (de har én søgemaskine), kun for dokumenter placeret på en central server eller på delte ressourcer på virksomhedens netværk. Snooper Server opretter nye indekser på delte ressourcer eller bruger tidligere oprettede. Enhver bruger af virksomhedens netværk kan oprette forbindelse til søgeserveren og bruge den til at få adgang til ethvert dokument (placeret i det aktuelle indeks) ved hjælp af en internetbrowser. Enig, denne ordning er yderst bekvem: det viser sig, at filer på dit eget netværk kan søges på samme måde som information på internettet gennem for eksempel Google.

Ved at vurdere alle fordele og ulemper ved dette program tyder konklusionen på sig selv, at dets egenskaber højst sandsynligt ikke er nok til virksomhedsnetværk (på trods af den gode tilrettelæggelse af at arbejde med netværket), men for en hjemmecomputer eller endda for et hjemmenetværk er det , i princippet, , kan det komme op. Selvom hverken arbejdshastigheden eller søgemulighederne inspirerer til optimisme...

Officiel hjemmeside på russisk:
Distributionsstørrelse: 6 MbGoogle Desktop Search + GDS Enterprise

Selvfølgelig kunne vi ikke ignorere sådan en berømt udvikler. Navnet Google siger allerede meget. Folk, der har brugt den mest kraftfulde internetsøgemaskine i årevis, vil helt sikkert, uden en eneste tvivl, beslutte at installere netop denne søgemaskine på deres computer. Tænk bare: Google på din hjemmecomputer! Men uden at give efter for provokationer med et bredt promoveret brand, lad os prøve nøgternt, og vigtigst af alt objektivt, at overveje mulighederne i "desktop"-søgemaskinen fra Google.

Det første, der fanger dit øje, er manglen på sin egen skal til programmet. Google Desktop Search er stadig placeret i browservinduet, henholdsvis hele grænsefladen af ​​desktopversionen blev arvet fra softwaren fra sin ældre internetbror. Hvorvidt dette er godt eller dårligt, er et spørgsmål: Nogle mennesker kan lide minimalismen i designet af denne søgemaskine, mens andre ønsker at se en fuldgyldig applikation fyldt med alle slags knapper og så videre.

Hvad fanger dit øje lige efter designet? Og det faktum, at den samme Google Desktop Search begynder at indeksere alt på computeren uden nogen efterspørgsel! Og det mest interessante er, at det er umuligt at vælge indekseringsstier ved hjælp af Google Desktop Search. Du bliver nødt til at downloade et separat program (TweakGDS), som giver dig mulighed for at udvide Google Desktop-indstillingerne noget, herunder angive de nødvendige steder til indeksering. Selvom du, når du finder ud af alt dette, allerede vil indeksere en standardharddisk, så denne indstilling er mere tilbøjelig til at være nødvendig, når du arbejder med store mængder data, hvilket er meget vigtigt, når det bruges i virksomhedsnetværk (Enterprise-versioner) . Det er dog ikke et faktum, at efter at have downloadet TweakGDS, vil dine problemer være løst. Det kræver trods alt Microsoft .NET Framework og Microsoft Scripting Runtime for at fungere. Ja... installationen, samt adgangen til indstillingerne, kunne have været gjort enklere, selvom udviklerne nok kan forstå: hvorfor skrive noget nyt, når der er en færdiglavet søgemaskine, portet det til den lokale computer og lad brugeren "nyd", og et berømt navn vil lave endnu et mesterværk ud af "dette". Kom nu, lad os afslutte denne lyriske digression og gå videre til søgningen.

Hvad angår analyse af søgeforespørgsler og levering af resultater, er alt her absolut identisk med Google på internettet: det samme system til at vise resultater, det samme standardsæt af logiske operationer for søgeforespørgsler. Generelt er Google Desktop Search, ligesom det tidligere program, udelukkende designet til at søge efter filer - det har selvfølgelig ikke en intern fremviser til disse filer. Antallet af filformater, der understøttes af Google Desktop Search, er ganske tilstrækkeligt, og det er også rart, at den søger på besøgte internetsider og tager data fra cachen. Søge- og indekseringshastigheder er ganske acceptable. Sandt nok til hjemmebrug. Google Desktop Search klarede imponerende 20 gigabyte tekster på 8 timer og 17 minutter. At bruge flere dage på at behandle oplysninger fra en stor virksomheds virksomhedsnetværk er ikke noget nogen systemadministrator ønsker at gøre. På plussiden: størrelsen af ​​det oprettede indeks var på samme niveau (4,5 GB) som en anden søgemaskine testet i denne anmeldelse - SearchInform.

Den store fordel (eller ulempe – du bestemmer selv) ved Google Desktop Search er, at den understøtter plugins, hvilket kan ændre meget til det bedre. En anden ting er, at tilslutning af plugins og opsætning af dem komplicerer opgaven med at installere en søgemaskine så meget, at du begynder at spekulere på, om alt dette er nødvendigt, når du kan installere et normalt, fuldgyldigt program, hvor alt allerede vil være til stede. Når alt kommer til alt, skal du installere et nyt plugin for at bruge hver funktion. Selv for at programmet skal fungere fuldt ud med arkiver, er en separat gadget nødvendig. Det er fascinerende og forførende, at alle disse ekstra moduler er gratis. Men hvis du ikke tager højde for desktopversionen af ​​søgemaskinen, så er kompetent konfiguration af GDS Enterprise muligvis ikke inden for din magt - trods alt er det ikke for ingenting, at specialister fra Google tilbyder deres tjenester til at oprette deres egne software til dit netværk for kun $10.000.

Hvis du går gennem opsætnings- og installationsproceduren (eller betaler 10.000 USD til et hurtigt svar-team fra Google), vil du forstå, at kompleksiteten af ​​installationen mere end kompenseres af de meget fleksible indstillinger, når de bruges i virksomhedsnetværk. Et vigtigt aspekt ved at bruge Google Desktop på et virksomhedsnetværk er brugen af ​​gruppepolitikker, som gør det muligt at indstille indstillinger for hver bruger.

For at opsummere, er den mest rimelige brug for dette program en hjemme- eller arbejdscomputer. Når alt kommer til alt, for en almindelig computer er det nok bare at installere programmet - det vil gøre resten selv (det vil ikke engang spørge dig om noget).

Google Desktop Search Enterprise vil dog være acceptabelt i tilfælde, hvor der er et presserende behov for fleksibel konfiguration af netværkspolitikken for at bruge søgemaskinen, mens evnen til at behandle søgeforespørgsler vil være på andenpladsen i betydning, og tiden (eller pengene) ) brugt på at oprette programmet vil være på førstepladsen.

Officiel side:
Distributionsstørrelse inklusive TweakGDS: 1,2 MbCopernic Desktop Search

Klik på billedet for at forstørre

Programgrænsefladen fremkalder ekstremt positive følelser - alt er udført i overensstemmelse med almindeligt accepterede standarder, intet overflødigt, med et ord, et behageligt design. For en nybegynder vil det være meget nemt at forstå Copernic Desktop Search-grænsefladen. Selvom det er noget forvirrende, at designerne klart har skabt programgrænsefladen under hensyntagen til, at programmet vil fungere i standard Windows XP-temaet. Når man bruger det klassiske tema, ser programmet ikke så pænt ud. Men det er mere en smagssag.

Ved den første lancering beder programmet dig om at oprette indekser til søgning. Det virkede noget usædvanligt, at efter at have valgt mapper til indeksering, tilbød programmet ikke at trykke på nogen knap, såsom "Start indeksering", og indeksering startede ikke automatisk, først da blev det bemærket, at Copernic forsøgte at starte indeksering, mens computeren var ledig. Du bliver nødt til at grave lidt dybere ned i programmets muligheder for at konfigurere alt korrekt. Det skal bemærkes, at der er ret brede muligheder for at opsætte automatisk indeksoprettelse: en indbygget skemalægger, mulighed for at indeksere, mens computeren er inaktiv, i baggrunden, med lav prioritet. Indekseringen var ikke for hurtig - 10 timer 51 minutter - dette er langsommere end i andre søgemaskiner (undtagen Bloodhound, men Copernic er stadig en størrelsesorden hurtigere end udviklingen af ​​iSleuthHound Technologies.

Nu om strukturen af ​​indekset. Generelt er der ikke noget særligt ved det. Det er muligt at vælge filtyper, både i generel og detaljeret form. Det vil sige, at du i første omgang kan vælge, hvad du vil indeksere - Dokumenter, Billeder, Videoer, Musik. På den anden fane i indstillingsvinduet vil du være i stand til at vælge specifikke filtyper efter udvidelse. Derudover kan du konfigurere indekset, så f.eks. billeder, der er mindre end 16x16 i størrelse, ikke indekseres, eller lydfiler, der er mindre end 10 sekunder lange, ikke indekseres. Udover at indeksere filer fra mapper, kan Copernic arbejde med e-mails og kontakter fra adressebogen i Microsoft Outlook og Microsoft Outlook Express, og det er muligt at indeksere favoritter og historik fra Internet Explorer.

Hvad angår søgemulighederne, er de meget svage her. Under test blev det endda afsløret, at programmet ikke søger efter dokumenter i txt- og html-formater på russisk, så du kun kan finde dem efter titler og ikke efter indhold. Det eneste, som programmet giver for at forbedre søgeeffektiviteten, er brugen af ​​et standardsæt af logiske operationer, og selv da blev denne funktion opdaget eksperimentelt, da den ikke var dokumenteret. Forresten er programmets hjælp heller ikke i orden - den er kun tilgængelig via internettet, hvilket du kan se, er meget ubelejligt, og der er ikke for meget hjælpeinformation på internettet. Tilsyneladende besluttede udviklerne, at programmets enkle grænseflade ikke indebærer tilstedeværelsen af ​​normal hjælp. For at fortsætte samtalen om søgefunktioner skal det bemærkes, at på trods af den svage analyse af forespørgsler giver programmet et interessant søgesystem - brugeren kan vælge typen af ​​filer (billeder, videoer, musik osv.), Indtast en søgning forespørg og vælg attributter, der er specifikke for den valgte filtype. For lydfiler kan disse for eksempel være værdier fra mp3-tags (kunstner, album, dato osv.), for billeder kan du for eksempel vælge deres størrelse (efter opløsning), generelt har hver type sin egne indstillinger. Efter at have søgt efter en bestemt filtype, vil programmet vise en meget informativ liste i resultatvinduet, og hvis din anmodning indeholder filer af andre typer, kan du åbne dem ved at klikke på et specifikt link.

Separat er det værd at nævne resultatvisningsvinduet. Under listen over fundne filer vises indholdet af disse filer (et lignende skema bruges ofte i e-mail-klienter). Sandt nok kan tekstvisning kun udføres i det oprindelige format, og der er ingen almindelig tekstvisningstilstand, hvilket ikke altid er praktisk, da åbning af et dokument i dette tilfælde tager mere tid. Men da Copernic kan søge efter billeder og musik, er det muligt at se disse multimediefiler.

De grundlæggende principper for driften af ​​dette program er beskrevet, lad os nu se, hvad Copernic Desktop Search kan tilbyde os til at arbejde med netværket... I princippet kan du se i meget lang tid, men du vil næppe kunne se noget . Med andre ord var dette program ikke beregnet til at være netværksbaseret. Copernic Desktop Search er udelukkende en hjemmesøgemaskine.

Det er klart, at den eneste (mest logiske) anvendelse af dette program er en hjemmecomputer. Her vil den fuldt ud klare alle simple brugersøgningsforespørgsler, der består af et eller to ord, vil finde den nødvendige information, og opdelingen af ​​søgning efter filtype og understøttelse af multimediefiler sammen med baggrundsindeksering i lavprioritet tilstand, kombineret med en behagelig interface, giver kun programmet styrke til at vinde tillid blandt uerfarne brugere.

Officiel side
Distributionsstørrelse: 2,6 MbISYS Desktop

Klik på billedet for at forstørre

Et meget kraftfuldt program. Med hensyn til udstyrsniveauet med alle mulige funktioner er det et sted tæt på det næste SearchInform søgesystem på listen. Desuden er størrelsen af ​​installationsfilen mere end 40 Mb! Det er svært at sige, hvad der kunne presses ind i sådanne dimensioner, for den samme SearchInform, med lignende funktionalitet, fylder 15 Mb.

Installationsprocessen her er heller ikke særlig behagelig, eller rettere ikke engang installationsprocessen. Allerede før du downloader programmet, vil du blive bedt om at registrere dig, ellers er der ingen måde. Dernæst grænsefladen. Det er lavet meget flot, intet unødvendigt fanger øjet, dog er det indtryk af en person, der allerede er lidt vant til det. Det vil ikke være let for en nybegynder at finde ud af, hvor og hvad der er placeret, hvor man skal klikke og hvor man endelig skal søge. Det kan varmt anbefales at læse hjælpen, inden du begynder at arbejde - du sparer en masse nerver og tid. Tilføjet til alt andet er den fuldstændige mangel på understøttelse af det russiske sprog i programmet. Ikke godt. Derudover er vinduerne her ikke overbelastede med styringer, men det skulle vi betale for med multi-moduler og brug af ekstra vinduer. For eksempel indtastes søgeforespørgsler ved at starte et program, og indeksstyring udføres ved hjælp af et andet program. Søgeforespørgsler indtastes også her i separate pop op-vinduer. Det er svært at sige, hvad der er bedre - en overbelastet grænseflade eller allestedsnærværende multi-vinduer; det er snarere et spørgsmål om smag.

Når det kommer til at oprette indekser, giver programmet funktioner til at forenkle processen med at indstille muligheder for et nyt indeks. Disse funktioner omfatter flere færdige skabeloner til oprettelse af indekser til mappen "Mine dokumenter", "Mail", "Mail og dokumenter", "Specific Folder", "Mappe med et udvalg af filtyper" osv. Sådanne skabeloner forenkler oprettelse af indekser på første etape. Værktøjet til at arbejde med indekser har ikke en særlig god grænseflade, hvilket er skræmmende med en vis kompleksitet (dette er en meget subjektiv vurdering, for at være ærlig), men hvis du ser på det, giver det mange nyttige muligheder og generelt , dets brug forårsager ikke meget vanskeligheder. ISYS Desktop kan indeksere data fra forskellige datakilder og giver også mange fleksible indstillinger til sådan indeksering. Yderligere indekseringsfunktioner omfatter: understøttelse af SQL, FTP, TRIM Context, WORLDOX 2002, scripts. Hvis du ved oprettelse af et indeks har valgt punktet "Mappe med valg af filtyper", har du mulighed for manuelt at vælge filtyper til indeksering (i forlængelse). Det skal siges, at der simpelthen er et stort antal understøttede filtyper, men du vil ikke kunne tilføje din egen type (udvidelse) til den eksisterende liste. Du kan også bemærke tilstedeværelsen af ​​en indekseringsplanlægger. Oprettelse af et indeks og behandling af 20 gigabyte information tog ISYS Desktop 6 timer og 13 minutter, hvilket i sidste ende viste en god tid og størrelsen på den oprettede fil - 7,9 GB.

Søgemulighederne i dette program er ganske gode. Det, der bruges i ISYS, er meget mere kraftfuldt end konventionel support til logiske operationer. Blandt de avancerede søgemuligheder tilbyder programmet brug af synonymer og et sorteringsfilter (efter sti, navn og dato for filoprettelse). Sættet af logiske operatorer er noget bredere end standardsættet. Ud over logiske operationer giver programmet dig mulighed for at arbejde med mange andre operatorer, som i princippet kan erstatte nogle typer søgning; for eksempel kan søgning med parsing erstattes fuldstændigt ved at bruge specielle operatorer. Jeg var meget overrasket over, at programmet ikke har en søgning ved hjælp af morfologi. Dette er en alvorlig udeladelse, da søgeeffektiviteten er væsentligt forbedret ved brug af morfologisk analyse. Derudover er der ingen liste over betydningsfulde ord, men der er en omfattende liste over ubetydelige ord. Søgefunktioner som "tilnærmet søgning" og "heuristisk analyse" annonceres også.

ISYS giver mulighed for at vælge mellem flere typer søgeforespørgsler, nemlig visuelle. Dette gøres ved hjælp af forskellige typer vinduer til indtastning af søgeforespørgsler, men faktisk er der ikke et enkelt vindue, der tillader brugen af ​​andre teknologier end dem, der er anført ovenfor.

Søgeresultaterne er meget informative og vises som en liste over dokumenter sorteret efter relevans. En forhåndsvisning af det valgte dokument vises nedenfor. I modsætning til Copernic Desktop Search er preview her kun tilgængelig i form af almindelig tekst; det var ikke muligt at vise dokumenter i deres oprindelige format, det være sig Word, Html eller PDF, selvom dette i princippet ikke er alt for kritisk. Programmet giver dig mulighed for at opdele fundne dokumenter i grupper efter bestemte kriterier (som standard er de opdelt efter relevans). Du kan også se allerede fundne dokumenter ved at vælge individuelle mapper (dette er praktisk, når resultatet producerer et meget stort antal dokumenter).

Det er også meget berettiget at bruge programmet på et virksomhedsnetværk, da det giver gode muligheder for at organisere netværkssøgning. Søgesystemet er baseret på oprettelsen af ​​et offentligt indeks, der indeholder indekserede data fra offentligt tilgængelige onlineressourcer.

Faktisk er programmet fra ISYS opmærksomhedsværdigt, i hvert fald at stifte bekendtskab med det. Dette program er et modent projekt med et stort antal funktioner (ikke altid og ikke alle har selvfølgelig brug for dem, men alligevel). Chancerne for, at programmet vil se nogle forbedringer i forhold til behandling af søgeforespørgsler er ukendte, men i øjeblikket kan det anbefales til næsten universel brug. Og i betragtning af, at det stadig er for tungt til hjemmesystemer, er de vigtigste steder for dets installation virksomhedsnetværk.

Officiel side:
Distributionsstørrelse: 40 MbSearchInform

Klik på billedet for at forstørre

Det er nok ikke værd at starte med det samme med en beskrivelse af SearchInform-grænsefladen. Vi bør først beskrive installationsprocessen, eller rettere en af ​​dens detaljer: du kan ikke installere programmet uden en internetforbindelse. Faktum er, at før den første lancering kræver programmet brugerregistrering (gratis) og sender alle indtastede data til serveren. Tilsyneladende var udviklerne nødt til at tage sådanne foranstaltninger i kampen mod piratkopiering, men dette havde ikke en positiv effekt på installationens lette.

Programgrænsefladen er designet i overensstemmelse med alle almindeligt accepterede regler, men ved første øjekast er det noget besværligt. Når du bruger programmet for første gang, ser det ud til, at det er for kompliceret, nogle gange er det ikke nemt at huske i hvilken menu eller på hvilken fane den ønskede mulighed er placeret, men med længere brug virker grænsefladen ikke længere så frygtelig kompliceret . Det vigtigste er at læse certifikatet først.

Efter at have forstået grænsefladen lidt, kan du begynde at oprette et indeks. Selve processen er meget enkel, og indekseringshastigheden, selv efter øje, er betydeligt højere end alle andre søgemaskiner i anmeldelsen. Tydelige testtal viser, at SearchInform er dobbelt så hurtig som dtSearch og iSYS med hensyn til indekseringshastighed! Programmet indekserede de leverede data i mængden af ​​20 gigabyte på en rekordtid på 3 timer og 17 minutter. Og størrelsen på det oprettede indeks viste sig at være den mindste 4,4 GB - 100 megabyte mindre end Google Desktop Search.

Programmet understøtter, udover almindelige filer og mapper, også indeksering af e-mails, tilslutning og indeksering af databaser (!) og andre eksterne kilder (DMS, CRM), umiddelbart under indeksering kan du angive en ordbog til at udføre en morfologisk søgning, og alle attributter kan være indekserede filer. Efter at have oprettet indekset, når du forsøger at udføre den første testsøgning efter dokumenter, kan du blive noget forvirret: "der er to typer søgning her, men hvilken har jeg brug for?" Som tidligere nævnt er det vigtigste at læse hjælpen, så bliver alt klart. Programmet kan faktisk udføre to typer søgninger - sætningssøgning og søgning efter dokumenter, der i indhold ligner forespørgselsteksten.

En beskrivelse af alle de vigtigste funktioner til at analysere en søgeforespørgsel blev givet ovenfor, så nu vil vi kun liste de søgefunktioner, som dette program tilbyder. Lad os starte med sætningssøgning: selvfølgelig, morfologisk søgning, citationssøgning, logiske operationer, søgning med ordparsing (søg i begyndelsen af ​​ordet, i slutningen, i den midterste del eller et komplet match), blandet citationssøgning ( når alle ord fra forespørgslen skal være til stede i dokumentet, men ikke nødvendigvis i den indtastede rækkefølge), søgning med fejlretning, brug af synonymer, "næsten citationssøgning" (søg på den indtastede sætning som citat, men andre ord kan evt. være til stede mellem de indtastede ord) osv. Nogle af de angivne muligheder har deres egne specifikke indstillinger. Derudover er det muligt at bruge en ordbog med uvæsentlige ord, og programmet har allerede en færdig liste over disse ord; du kan også bruge en ordbog med prioriterede ord til at søge (selvfølgelig skal du udfylde den dig selv).

Her har vi i princippet kort gennemgået alle hovedtræk ved sætningssøgning.

Lad os gå videre til at overveje funktionerne i dette program - søgning efter lignende dokumenter. Udviklerne hævder, at dette på ingen måde er en simpel tekstsøgning, det er netop en "søgning efter lignende" - det er præcis sådan, det er beskrevet overalt, men jamen, du kan kalde det, hvad du vil - hovedpointen er . En hurtig søgning på internettet kan hurtigt afsløre, at såkaldt "lignende søgning" er en nyudvikling inden for tekstanalyse. Dette system giver dig mulighed for at finde tekster, der ligner hinanden i semantisk indhold. Det mest behagelige var, at efter at have udført testsøgninger, viste det sig, at teorien falder ret godt sammen med praksis! Programmet søger faktisk efter dokumenter med lignende indhold og viser dem på en liste og sorterer dem efter procentdel af lighed.

Lad os derefter se på, hvad SearchInform (især dens virksomhedsversion SearchInform Corporate) tilbyder for at arbejde på et virksomhedsnetværk. Der er to typer applikationer: serverside og brugerside. Serverdelen behandler uafhængigt de specificerede indekser, og brugere kan bruge dem til søgning, afhængigt af de tildelte adgangsrettigheder. Brugere kan konfigureres automatisk ved hjælp af Windows-konti (i professionelle termer bruger SearchInform NTFS Windows-godkendelse) eller manuelt (brugere skal tilføjes separat). Hver bruger kan tillades eller nægtes adgang til bestemte indekser, og brugere kan også kombineres i grupper. Generelt er SearchInforms indstillinger for at arbejde på netværket foran Google med hensyn til fleksibilitet, og Ishhound Server med hensyn til bekvemmelighed og enkelthed.

Officiel side:
Distributionsstørrelse: 14,7 Mb Sammenligning af indekseringshastigheder

SøgesystemIndekseringstidIndeks størrelse
Bloodhound Prof Deluxe 4.538 timer 46 minutter19 GB
Isys Desktop 7.06 timer 13 minutter7,9 GB
DtSearch 7.06 timer 3 minutter8,6 GB
Google Desktop Search Enterprise8 timer 17 minutter4,5 GB
Copernic Desktop Search *10 timer 51 minutter7 GB
SearchInform 1.5.023 timer 17 minutter4,4 GB

* De fleste documents.html og .txt, der indeholdt russisk tekst, var, selvom de var indekseret, umulige at finde undtagen ved deres navne.

Alle programmer fortjener opmærksomhed.

Baseret på tests og en omhyggelig undersøgelse af hvert program præsenteret i gennemgangen, kan der drages visse konklusioner. Så Google Desktop Search Copernic Desktop Search er ganske velegnet til den uerfarne bruger som et hjemmeinformationssøgningssystem. De klarer enkle forespørgsler godt, overbelaster ikke brugeren med indstillinger og er desuden helt gratis. Googles forsøg på at komme ind på erhvervssøgemaskinemarkedet er endnu ikke særlig berettiget: For at det skal fungere ordentligt, skal programmet udstyres med yderligere moduler, og det er langt fra nemt at sætte op. Derfor reserverer de selvforklarende navne Desktop Search, Copernic og Google nichen med "desktop" søgemaskiner bag sig.

Sandt nok mere kraftfulde løsninger - dtSearch, iSYS og SearchInform er heller ikke idiotsikre og tilbyder brugerne deres "desktop"-versioner. Men til en fornuftig pris i modsætning til gratis software fra Google og Copernic. Du skal selvfølgelig betale for kraft, hastighed og funktionalitet. Men hovedfokus for udviklerne af dtSearch, iSYS og SearchInform er naturligvis på erhvervssektoren. Netværk, funktionalitet, indeksering og søgehastighed er det, der adskiller disse produkter fra deres "konkurrenter". Baseret på testresultaterne blev favoritten identificeret - SearchInform. Programmet giver mulighed for at søge efter lignende dokumenter, har de hurtigste indekserings- og søgehastigheder og har et godt sæt funktioner.

05/10/2016

FileSeek er et nyttigt værktøj, der giver mange brugere mulighed for nemt at finde de filer, de har brug for på deres harddisk. Det multifunktionelle program er i stand til at finde data ved hjælp af forskellige filtre. Opsætning af proceduren er hurtig og kræver ikke særlig opmærksomhed. Brugeren kan tilpasse søgeparametrene, så de passer til deres behov. FileSeek er meget hurtig og scanner hundredvis af filer. Sammen med resultatet vises filstørrelsen, linjenummeret, datoen for sidste ændring og dokumentnavnet. Du kan også oprette, administrere og synkronisere flere profiler til forskellige projekter. Det er muligt at skifte til et andet sprog...

30/03/2016

Copernic Desktop Search er et praktisk program til at søge efter forskellig information. Gennem programmet vil brugere på forskellige niveauer finde e-mail-beskeder, vedhæftede filer og andre dokumenter. En enkel grænseflade hjælper brugeren med at finde filer med formater som doc, docx, pdf, xlsx og andre. Du kan finde musikfiler, grafik, billeder og videoer. Fordelene ved applikationen omfatter applikationens lille størrelse og dens minimale belastning på computeren. Programmet bruger processorressourcer, diskplads og RAM. Copernic Desktop Search (CDS) indeholder en række forskellige filtre.

21/10/2015

NeoSearch er en af ​​de mest bekvemme applikationer designet til at søge efter de data, brugeren har brug for på en computer. Programmet har en praktisk, forståelig, stilfuld brugergrænseflade. Den har en række simple funktioner, som selv en nybegynder nemt kan håndtere. Efter installation af programmet starter filindeksering. neoSearch kontrollerer status for alle filer, der er på computeren på det tidspunkt. Hele denne proces tager minimal tid. En specialiseret skala informerer dig om forløbet af ansøgningen. Bagefter vises søgeresultaterne på skærmen samtidigt i form af fire dokumenter, som er max...

01/12/2014

Wise JetSearch er et program, der giver en direkte søgning efter forskellige filer eller mapper placeret på forskellige lokale drev på en personlig computer eller på flytbare bærbare lagermedier. Denne software erstatter med fordel den standard filsøgningsmodel, der er indbygget i operativsystemet. Det kan arbejde med NTFS- og FAT-drev; data søges ved hjælp af en brugerspecificeret skabelon, navn eller andre individuelle specifikke parametre. Algoritmen til at arbejde med Wise JetSearch-programmet er ret enkel: Indtast nøgleord, vælg et drev, start søgning...

29/09/2014

FileSearchy - oprettet for at forenkle søgningen efter filer på din computer. I modsætning til andre søgeprogrammer søger dette program på navn i realtid. Programmet giver dig også mulighed for at søge i indholdet af filer såsom doc og pdf, og hvis det finder det, så fremhæver det den fundne tekst. FileSearchy finder øjeblikkeligt de filer, du har brug for, ved navn. Selve programmet understøtter faner, som vil tillade flere søgninger i forskellige faner, som kan justeres til sidst. Understøtter søgning efter dato, filstørrelse og poster i registreringsdatabasen. Det er muligt at søge efter flere linjer samt udelukke linjer, der ikke burde være...

05/09/2014

SoftPerfect Network Search Engine (NSE) er et program, der er nyttigt til hurtigt at søge efter delte filer på et lokalt netværk. Det indekserer og arrangerer filer, så enhver bruger med adgang til et givet lokalt netværk med den korrekte anmodning vil finde den ønskede fil på få sekunder. Netværksadministratoren har mange muligheder, fordi programmet har et bredt udvalg af nyttige funktioner, som uden tvivl vil komme til nytte under arbejdet. For eksempel funktionen af ​​selektiv indeksering af filer og mapper. Installation og konfiguration af programmet vil ikke tage meget tid, da det ikke er kompliceret, vil det være nok at kopiere et par filer til mappen med...