Hvordan fungerer en søkemotor? Gjennomgang av programmer for søk i dokumenter og data.

Profesjonelt Internett-søk krever spesialisert programvare, samt spesialiserte søkemotorer og søketjenester.

PROGRAMMER

http://dr-watson.wix.com/home – programmet er utviklet for å studere rekker av tekstinformasjon for å identifisere enheter og forbindelser mellom dem. Resultatet av arbeidet er en rapport om objektet som studeres.

http://www.fmsasg.com/ - et av de beste programmene i verden for å visualisere forbindelser og relasjoner Sentinel Vizualizer. Selskapet har fullstendig russifisert produktene sine og koblet til en hotline på russisk.

http://www.newprosoft.com/ – “Web Content Extractor” er den kraftigste og mest brukervennlige programvaren for å trekke ut data fra nettsider. Den har også en effektiv Visual Web-edderkopp.

SiteSputnik en programvarepakke som ikke har noen analoger i verden, som lar deg søke og behandle resultatene på det synlige og usynlige Internett ved å bruke alle søkemotorene som er nødvendige for brukeren.

WebSite-Watcher – lar deg overvåke nettsider, inkludert passordbeskyttede, overvåkingsfora, RSS-feeds, nyhetsgrupper, lokale filer. Har et kraftig filtersystem. Overvåking utføres automatisk og leveres i en brukervennlig form. Et program med avanserte funksjoner koster 50 euro. Stadig oppdatert.

http://www.scribd.com/ er den mest populære plattformen i verden og brukes i økende grad i Russland for å legge ut ulike typer dokumenter, bøker osv. for gratis tilgang med en veldig praktisk søkemotor for titler, emner osv.

http://www.atlasti.com/ er det kraftigste og mest effektive verktøyet for kvalitativ informasjonsanalyse tilgjengelig for individuelle brukere, små og til og med mellomstore bedrifter. Programmet er multifunksjonelt og derfor nyttig. Den kombinerer muligheten til å skape et enhetlig informasjonsmiljø for arbeid med ulike tekst-, tabell-, lyd- og videofiler som en helhet, samt verktøy for kvalitativ analyse og visualisering.

Ashampoo ClipFinder HD – en stadig større del av informasjonsflyten kommer fra video. Følgelig trenger konkurrerende etterretningsoffiserer verktøy som lar dem jobbe med dette formatet. Et slikt produkt er gratisverktøyet vi presenterer. Den lar deg søke etter videoer basert på spesifiserte kriterier på videofillagringssider som YouTube. Programmet er enkelt å bruke, viser alle søkeresultater på én side med detaljert informasjon, titler, varighet, tidspunkt for når videoen ble lastet opp til lagringen, etc. Det er et russisk grensesnitt.

http://www.advego.ru/plagiatus/ – programmet ble laget av SEO-optimalisatorer, men er ganske egnet som et Internett-intelligensverktøy. Plagiat viser graden av unikhet til teksten, kildene til teksten og prosentandelen av tekstmatch. Programmet sjekker også unikheten til den angitte URL-en. Programmet er gratis.

http://neiron.ru/toolbar/ – inkluderer et tillegg for å kombinere Google og Yandex-søk, og tillater også konkurranseanalyse basert på vurdering av effektiviteten til nettsteder og kontekstuell annonsering. Implementert som en plugin for FF og GC.

http://web-data-extractor.net/ er en universell løsning for å skaffe data tilgjengelig på Internett. Oppsett av dataklipp fra hvilken som helst side gjøres med noen få museklikk. Du trenger bare å velge dataområdet du vil lagre, og Datacol vil automatisk velge en formel for å kutte ut denne blokken.

CaptureSaver er et profesjonelt Internett-forskningsverktøy. Rett og slett et uunnværlig arbeidsprogram som lar deg fange, lagre og eksportere all Internett-informasjon, inkludert ikke bare nettsider, blogger, men også RSS-nyheter, e-post, bilder og mye mer. Den har den bredeste funksjonaliteten, et intuitivt grensesnitt og en latterlig pris.

http://www.orbiscope.net/en/software.html – webovervåkingssystem til mer enn rimelige priser.

http://www.kbcrawl.co.uk/ – programvare for arbeid, inkludert på "Invisible Internet".

http://www.copernic.com/en/products/agent/index.html – programmet lar deg søke ved hjelp av mer enn 90 søkemotorer, med mer enn 10 parametere. Lar deg kombinere resultater, eliminere duplikater, blokkere ødelagte koblinger og vise de mest relevante resultatene. Kommer i gratis, personlige og profesjonelle versjoner. Brukt av mer enn 20 millioner brukere.

Maltego er en fundamentalt ny programvare som lar deg etablere forholdet mellom emner, hendelser og objekter i det virkelige liv og på Internett.

TJENESTER

nye https://hunter.io/ – en effektiv tjeneste for å oppdage og sjekke e-post.

https://www.whatruns.com/ er en enkel å bruke, men effektiv skanner for å finne ut hva som fungerer og ikke fungerer på et nettsted og hva sikkerhetshullene er. Også implementert som en plugin for Chrom.

https://www.crayon.co/ er en amerikansk budsjettplattform for markeds- og konkurranseetterretning på Internett.

http://www.cs.cornell.edu/~bwong/octant/ – vertsidentifikator.

https://iplogger.ru/ – en enkel og praktisk tjeneste for å bestemme andres IP.

http://linkurio.us/ er et kraftig nytt produkt for arbeidere med økonomisk sikkerhet og korrupsjonsetterforskere. Behandler og visualiserer enorme mengder ustrukturert informasjon fra økonomiske kilder.

http://www.intelsuite.com/en – engelskspråklig nettplattform for konkurransedyktig intelligens og overvåking.

http://yewno.com/about/ er det første operativsystemet for å oversette informasjon til kunnskap og visualisere ustrukturert informasjon. Støtter for øyeblikket engelsk, fransk, tysk, spansk og portugisisk.

https://start.avalancheonline.ru/landing/?next=%2F – prognose- og analysetjenester av Andrey Masalovich.

https://www.outwit.com/products/hub/ – et komplett sett med frittstående programmer for profesjonelt arbeid i web 1.

https://github.com/search?q=user%3Acmlh+maltego – utvidelser for Maltego.

http://www.whoishostingthis.com/ – søkemotor for hosting, IP-adresser osv.

http://appfollow.ru/ – analyse av applikasjoner basert på anmeldelser, ASO-optimalisering, plasseringer i topper og søkeresultater for App Store, Google Play og Windows Phone Store.

http://spiraldb.com/ er en tjeneste implementert som en plugin for Chrom, som lar deg få mye verdifull informasjon om enhver elektronisk ressurs.

https://millie.northernlight.com/dashboard.php?id=93 - en gratis tjeneste som samler inn og strukturerer nøkkelinformasjon om bransjer og bedrifter. Det er mulig å bruke informasjonspaneler basert på tekstanalyse.

http://byratino.info/ – innsamling av faktadata fra offentlig tilgjengelige kilder på Internett.

http://www.datafox.co/ – CI-plattformen samler inn og analyserer informasjon om selskaper av interesse for kunder. Det er en demo.

https://unwiredlabs.com/home - en spesialisert applikasjon med en API for søk etter geolokalisering av enhver enhet som er koblet til Internett.

http://visualping.io/ – en tjeneste for overvåking av nettsteder og først av alt fotografiene og bildene som er tilgjengelige på dem. Selv om bildet bare vises i et sekund, vil det være i abonnentens e-post. Har en plugin for Google Chrome.

http://spyonweb.com/ er et forskningsverktøy som gjør det mulig å analysere alle Internett-ressurser i dybden.

http://bigvisor.ru/ – tjenesten lar deg spore reklamekampanjer for visse segmenter av varer og tjenester, eller spesifikke organisasjoner.

http://www.itsec.pro/2013/09/microsoft-word.html – instruksjoner fra Artem Ageev om bruk av Windows-programmer for konkurrerende etterretningsbehov.

http://granoproject.org/ er et åpen kildekodeverktøy for forskere som sporer nettverk av forbindelser mellom enkeltpersoner og organisasjoner innen politikk, økonomi, kriminalitet, etc. Lar deg koble til, analysere og visualisere informasjon hentet fra ulike kilder, samt vise betydelige sammenhenger.

http://imgops.com/ – en tjeneste for å trekke ut metadata fra grafikkfiler og jobbe med dem.

http://sergeybelove.ru/tools/one-button-scan/ – en liten nettskanner for å sjekke sikkerhetshull på nettsider og andre ressurser.

http://isce-library.net/epi.aspx – tjeneste for søk i primærkilder ved å bruke et fragment av tekst på engelsk

https://www.rivaliq.com/ er et effektivt verktøy for å utføre konkurrerende etterretning i vestlige, primært europeiske og amerikanske markeder for varer og tjenester.

http://watchthatpage.com/ er en tjeneste som lar deg automatisk samle inn ny informasjon fra overvåkede Internett-ressurser. Tjenesten er gratis.

http://falcon.io/ er en slags Rapportive for Web. Det er ikke en erstatning for Rapportive, men gir tilleggsverktøy. Derimot gir Rapportive en generell profil av en person, som om den er limt sammen fra data fra sosiale nettverk og omtaler på nettet http://watchthatpage.com/ - en tjeneste som lar deg automatisk samle inn ny informasjon fra overvåkede ressurser på internettet. Tjenesten er gratis.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – tillegg for Firefox. Overvåker nettsideoppdateringer. Nyttig for nettsteder som ikke har nyhetsstrømmer (Atom eller RSS).

http://agregator.pro/ – samler av nyhets- og medieportaler. Brukes av markedsførere, analytikere, etc. å analysere nyhetsstrømmer om bestemte emner.

http://price.apishops.com/ – automatisert webtjeneste for overvåking av priser for utvalgte produktgrupper, spesifikke nettbutikker og andre parametere.

http://www.la0.ru/ er en praktisk og relevant tjeneste for å analysere lenker og tilbakekoblinger til en Internett-ressurs.

www.recordedfuture.com er et kraftig verktøy for dataanalyse og visualisering, implementert som en nettbasert tjeneste bygget på cloud computing.

http://advse.ru/ er en tjeneste med slagordet "Finn ut alt om konkurrentene dine." Lar deg skaffe konkurrenters nettsider i samsvar med søk og analysere konkurrenters annonsekampanjer i Google og Yandex.

http://spyonweb.com/ – tjenesten lar deg identifisere nettsteder med de samme egenskapene, inkludert de som bruker samme Google Analytics-statistikktjenesteidentifikatorer, IP-adresser osv.

http://www.connotate.com/solutions – en produktlinje for konkurransedyktig intelligens, styring av informasjonsflyt og konvertering av informasjon til informasjonsressurser. Det inkluderer både komplekse plattformer og enkle, billige tjenester som muliggjør effektiv overvåking sammen med informasjonskomprimering og kun oppnå de nødvendige resultatene.

http://www.clearci.com/ - konkurransedyktig etterretningsplattform for bedrifter av ulike størrelser fra oppstartsbedrifter og små bedrifter til Fortune 500-bedrifter. Løst som saas.

http://startingpage.com/ er et Google-tillegg som lar deg søke på Google uten å registrere IP-adressen din. Støtter alle Google-søkefunksjoner fullt ut, inkludert på russisk.

http://newspapermap.com/ er en unik tjeneste som er svært nyttig for en konkurrerende etterretningsoffiser. Kobler geolokalisering med en nettbasert mediesøkemotor. De. du velger regionen du er interessert i, eller til og med en by eller et språk, se stedet på kartet og en liste over nettversjoner av aviser og magasiner, klikk på den aktuelle knappen og les. Støtter russisk språk, veldig brukervennlig grensesnitt.

http://infostream.com.ua/ er et veldig praktisk nyhetsovervåkingssystem "Infostream", kjennetegnet ved et førsteklasses utvalg og ganske tilgjengelig for enhver lommebok, fra en av klassikerne innen internettsøk, D.V. Lande.

http://www.instapaper.com/ er et veldig enkelt og effektivt verktøy for å lagre de nødvendige nettsidene. Kan brukes på datamaskiner, iPhones, iPads, etc.

http://screen-scraper.com/ – lar deg automatisk trekke ut all informasjon fra nettsider, laste ned de aller fleste filformater og automatisk legge inn data i ulike former. Den lagrer nedlastede filer og sider i databaser og utfører mange andre ekstremt nyttige funksjoner. Fungerer på alle større plattformer, har fullt funksjonelle gratis og svært kraftige profesjonelle versjoner.

http://www.mozenda.com/ - har flere tariffplaner og er tilgjengelig selv for små bedrifter, en webtjeneste for multifunksjonell webovervåking og levering av nødvendig informasjon for brukeren fra utvalgte nettsteder.

http://www.recipdonor.com/ – tjenesten lar deg automatisk overvåke alt som skjer på konkurrentenes nettsider.

http://www.spyfu.com/ – og dette er hvis konkurrentene dine er utenlandske.

www.webground.su er en tjeneste for overvåking av Runet laget av Internett-søkefagfolk, som inkluderer alle de store leverandørene av informasjon, nyheter, etc., og er i stand til individuelle overvåkingsinnstillinger for å passe brukerens behov.

SØKEMOTORER

https://www.idmarch.org/ er den beste søkemotoren for verdensarkivet av pdf-dokumenter når det gjelder kvalitet. For tiden er mer enn 18 millioner pdf-dokumenter indeksert, alt fra bøker til hemmelige rapporter.

http://www.marketvisual.com/ er en unik søkemotor som lar deg søke etter eiere og toppledelse etter fullt navn, firmanavn, stilling eller en kombinasjon av disse. Søkeresultatene inneholder ikke bare objektene du leter etter, men også forbindelsene deres. Designet primært for engelsktalende land.

http://worldc.am/ er en søkemotor for fritt tilgjengelige fotografier knyttet til geolokalisering.

https://app.echosec.net/ er en offentlig søkemotor som beskriver seg selv som det mest avanserte analyseverktøyet for rettshåndhevelse og sikkerhets- og etterretningspersonell. Lar deg søke etter bilder lagt ut på ulike nettsteder, sosiale plattformer og sosiale nettverk i forhold til spesifikke geolokaliseringskoordinater. Det er for øyeblikket syv datakilder tilkoblet. Ved utgangen av året vil antallet være mer enn 450. Takk til Dementy for tipset.

http://www.quandl.com/ er en søkemotor for syv millioner finansielle, økonomiske og sosiale databaser.

http://bitzakaz.ru/ – søkemotor for anbud og offentlige bestillinger med ekstra betalte funksjoner

Website-Finder – gjør det mulig å finne nettsteder som Google ikke indekserer godt. Den eneste begrensningen er at den bare søker på 30 nettsteder for hvert søkeord. Programmet er enkelt å bruke.

http://www.dtsearch.com/ er en kraftig søkemotor som lar deg behandle terabyte med tekst. Fungerer på desktop, web og intranett. Støtter både statiske og dynamiske data. Lar deg søke i alle MS Office-programmer. Søket utføres ved hjelp av fraser, ord, tagger, indekser og mye mer. Den eneste forente søkemotoren som er tilgjengelig. Den har både betalte og gratisversjoner.

http://www.strategator.com/ – søker, filtrerer og samler informasjon om selskapet fra titusenvis av nettkilder. Søk i USA, Storbritannia, store EEC-land. Det er svært relevant, brukervennlig og har gratis og betalte alternativer ($14 per måned).

http://www.shodanhq.com/ er en uvanlig søkemotor. Umiddelbart etter at han dukket opp, fikk han kallenavnet «Google for hackere». Den søker ikke etter sider, men bestemmer IP-adresser, typer rutere, datamaskiner, servere og arbeidsstasjoner på en bestemt adresse, sporer kjeder av DNS-servere og lar deg implementere mange andre interessante funksjoner for konkurransedyktig intelligens.

http://search.usa.gov/ er en søkemotor for nettsteder og åpne databaser for alle amerikanske offentlige etater. Databasene inneholder mye praktisk, nyttig informasjon, blant annet til bruk i vårt land.

http://visual.ly/ – i dag brukes visualisering i økende grad for å presentere data. Dette er den første infografiske søkemotoren på nettet. Sammen med søkemotoren har portalen kraftige datavisualiseringsverktøy som ikke krever programmeringskunnskaper.

http://go.mail.ru/realtime – søk etter diskusjoner om emner, hendelser, objekter, emner i sanntid eller tid som kan tilpasses. Det tidligere sterkt kritiserte søket i Mail.ru fungerer svært effektivt og gir interessante, relevante resultater.

Zanran er nettopp lansert, men fungerer allerede utmerket, den første og eneste datasøkemotoren som trekker ut data fra PDF-filer, EXCEL-tabeller, data på HTML-sider.

http://www.ciradar.com/Competitive-Analysis.aspx er et av verdens beste systemer for informasjonsinnhenting for konkurransedyktig intelligens på deep web. Henter nesten alle typer filer i alle formater om emnet av interesse. Implementert som en webtjeneste. Prisene er mer enn rimelige.

http://public.ru/ – Effektivt søk og profesjonell analyse av informasjon, mediearkiv siden 1990. Nettmediebiblioteket tilbyr et bredt spekter av informasjonstjenester: fra tilgang til elektroniske arkiver av russiskspråklige mediepublikasjoner og ferdige tematiske presseanmeldelser til individuell overvåking og eksklusiv analytisk forskning basert på pressemateriale.

Cluuz er en ung søkemotor med store muligheter for konkurransedyktig intelligens, spesielt på det engelskspråklige Internett. Lar deg ikke bare finne, men også visualisere og etablere forbindelser mellom personer, selskaper, domener, e-poster, adresser osv.

www.wolframalpha.com – morgendagens søkemotor. Som svar på en søkeforespørsel gir den statistisk og faktainformasjon tilgjengelig om forespørselsobjektet, inkludert visualisert informasjon.

www.ist-budget.ru – universelt søk i databaser for offentlige anskaffelser, anbud, auksjoner, etc.

Ved første øyekast kan det virke som bare Yandex kan være bedre enn Google, og selv det er ikke et faktum. Disse selskapene investerer enorme summer i innovasjon og utvikling. Har noen virkelig en sjanse til ikke bare å konkurrere med lederne, men også til å vinne? Lifehackers svar: "Ja!" Det er flere søkemotorer som har lyktes. La oss se på heltene våre.

Hva er dette

Dette er en ganske kjent åpen kildekode-søkemotor. Servere er lokalisert i USA. I tillegg til sin egen robot, bruker søkemotoren resultater fra andre kilder: Yahoo! Søk BOSS, Wikipedia, Wolfram|Alpha.

Jo bedre

DuckDuckGo posisjonerer seg som en søkemotor som gir maksimalt personvern og konfidensialitet. Systemet samler ingen data om brukeren, lagrer ikke logger (ingen søkehistorikk), og bruken av informasjonskapsler er så begrenset som mulig.

DuckDuckGo samler ikke inn eller deler personlig informasjon fra brukere. Dette er vår personvernpolicy.
Gabriel Weinberg, grunnlegger av DuckDuckGo

Hvorfor trenger du dette

Alle store søkemotorer prøver å tilpasse søkeresultatene basert på data om personen foran skjermen. Dette fenomenet kalles "filterboblen": brukeren ser bare de resultatene som er i samsvar med hans preferanser eller som systemet anser som det.

DuckDuckGo skaper et objektivt bilde som ikke avhenger av din tidligere oppførsel på Internett, og eliminerer tematisk annonsering fra Google og Yandex basert på spørsmålene dine. Med DuckDuckGo er det enkelt å søke etter informasjon på fremmedspråk: Google og Yandex foretrekker som standard russiskspråklige nettsteder, selv om søket er skrevet inn på et annet språk.

Hva er dette

"" er et russisk metasøkesystem utviklet av kandidatene fra Moskva State University Viktor Lavrenko og Vladimir Chernyshov. Den søker gjennom indeksene til Google, Bing, Yandex og andre, og har også sin egen søkealgoritme.

Jo bedre

Ved å søke gjennom indeksene til alle store søkemotorer kan du generere relevante resultater. I tillegg deler Nigma resultatene inn i flere tematiske grupper (klynger) og inviterer brukeren til å begrense søkefeltet, forkaste unødvendige eller fremheve prioriterte. Takket være matematikk- og kjemimodulene kan du løse matematiske problemer og be om resultatene av kjemiske reaksjoner direkte i søkefeltet.

Hvorfor trenger du dette

Eliminerer behovet for å søke etter det samme søket i forskjellige søkemotorer. Klyngesystemet gjør det enkelt å manipulere søkeresultater. For eksempel samler Nigma resultater fra nettbutikker i en egen klynge. Hvis du ikke har tenkt å kjøpe noe, ekskluder du bare denne gruppen. Ved å velge "Engelskspråklige nettsteder"-klyngen, vil du kun motta resultater på engelsk. Matematikk- og kjemimodulene skal hjelpe skolebarn.

Dessverre er prosjektet ikke under utvikling, da utviklerne har overført sin aktivitet til det vietnamesiske markedet. Likevel er "Nigma" ikke bare ikke utdatert ennå, men på noen ting gir den fortsatt Google et forsprang. La oss håpe utviklingen kommer i gang igjen.

Hva er dette

not Evil er et system som søker i det anonyme Tor-nettverket. For å bruke det, må du gå til dette nettverket, for eksempel ved å starte en spesialisert nettleser med samme navn. not Evil er ikke den eneste søkemotoren i sitt slag. Det er LOOK (standardsøket i Tor-nettleseren, tilgjengelig fra det vanlige Internett) eller TORCH (en av de eldste søkemotorene på Tor-nettverket) og andre. Vi bestemte oss for ikke Evil på grunn av den klare hentydningen til selve Google (bare se på startsiden).

Jo bedre

Den søker der Google, Yandex og andre søkemotorer generelt er stengt.

Hvorfor trenger du dette

Tor-nettverket inneholder mange ressurser som ikke kan finnes på det lovlydige Internett. Og etter hvert som myndighetenes kontroll over innholdet på Internett skjerpes, vil antallet øke. Tor er et slags nettverk i nettverket: med sine egne sosiale nettverk, torrent-trackere, media, handelsplattformer, blogger, biblioteker og så videre.

YaCy

Hva er dette

YaCy er en desentralisert søkemotor som fungerer etter prinsippet om P2P-nettverk. Hver datamaskin som hovedprogramvaremodulen er installert på, skanner Internett uavhengig, det vil si at den er analog med en søkerobot. Resultatene som oppnås samles inn i en felles database som brukes av alle YaCy-deltakere.

Jo bedre

Det er vanskelig å si om dette er bedre eller verre, siden YaCy er en helt annen tilnærming til å organisere søk. Fraværet av en enkelt server og eierselskap gjør resultatene helt uavhengige av noens preferanser. Autonomien til hver node eliminerer sensur. YaCy er i stand til å søke på dypnettet og ikke-indekserte offentlige nettverk.

Hvorfor trenger du dette

Hvis du er tilhenger av åpen kildekode-programvare og gratis Internett, ikke påvirket av offentlige etater og store selskaper, så er YaCy ditt valg. Den kan også brukes til å organisere et søk innenfor et bedriftsnettverk eller et annet autonomt nettverk. Og selv om YaCy ikke er særlig nyttig i hverdagen, er det et verdig alternativ til Google med tanke på søkeprosessen.

Pipl

Hva er dette

Pipl er et system utviklet for å søke etter informasjon om en bestemt person.

Jo bedre

Forfatterne av Pipl hevder at deres spesialiserte algoritmer søker mer effektivt enn "vanlige" søkemotorer. Spesielt inkluderer prioriterte informasjonskilder profiler på sosiale nettverk, kommentarer, medlemslister og ulike databaser som publiserer informasjon om personer, for eksempel rettsavgjørelser. Pipls lederskap på dette området bekreftes av vurderinger fra Lifehacker.com, TechCrunch og andre publikasjoner.

Hvorfor trenger du dette

Hvis du trenger å finne informasjon om en person som bor i USA, vil Pipl være mye mer effektiv enn Google. Databasene til russiske domstoler er tilsynelatende utilgjengelige for søkemotoren. Derfor takler han ikke russiske statsborgere så godt.

Hva er dette

En annen spesialisert søkemotor. Søker etter ulike lyder (hus, natur, biler, mennesker osv.) i åpne kilder. Tjenesten støtter ikke spørringer på russisk, men det er en imponerende liste over russiskspråklige tagger du kan søke etter.

Jo bedre

Utgangen inneholder kun lyder og ingenting ekstra. I søkeinnstillingene kan du stille inn ønsket format og lydkvalitet. Alle lyder som er funnet er tilgjengelige for nedlasting. Det søkes etter lyder etter mønster.

Hvorfor trenger du dette

Hvis du raskt trenger å finne lyden av et muskettskudd, slagene til en diende hakkespett eller ropet til Homer Simpson, så er denne tjenesten for deg. Og jeg valgte dette bare fra de tilgjengelige russiskspråklige spørringene. På engelsk er spekteret enda bredere. Men seriøst, en spesialisert tjeneste krever et spesialisert publikum. Men hva om det kommer godt med for deg også?

Livet til alternative søkemotorer er ofte flyktig. Lifehacker spurte den tidligere generaldirektøren for den ukrainske avdelingen av Yandex, Sergei Petrenko, om de langsiktige utsiktene for slike prosjekter.

Når det gjelder skjebnen til alternative søkemotorer, er det enkelt: å være veldig nisjeprosjekter med et lite publikum, derfor uten klare kommersielle utsikter eller omvendt med fullstendig klarhet om deres fravær.

Hvis du ser på eksemplene i artikkelen, kan du se at slike søkemotorer enten spesialiserer seg på en smal, men populær nisje, som kanskje ennå ikke har vokst nok til å bli merkbar på radarene til Google eller Yandex, eller de tester en original hypotese i rangering, som ennå ikke er aktuelt i vanlig søk.

For eksempel, hvis et søk på Tor plutselig viser seg å være etterspurt, det vil si at resultater derfra trengs av minst en prosentandel av Googles publikum, så vil selvfølgelig vanlige søkemotorer begynne å løse problemet med hvordan finne dem og vise dem til brukeren. Hvis oppførselen til publikum viser at resultater gitt uten å ta hensyn til faktorer avhengig av brukeren for en betydelig andel brukere i et betydelig antall søk virker mer relevante, vil Yandex eller Google begynne å produsere slike resultater.

"Vær bedre" i sammenheng med denne artikkelen betyr ikke "vær bedre i alt." Ja, i mange aspekter er heltene våre langt fra Google og Yandex (selv langt fra Bing). Men hver av disse tjenestene gir brukeren noe som søkebransjens giganter ikke kan tilby.

Hei, kjære lesere av bloggsiden. , så hadde de få brukerne nok av sine egne bokmerker. Men, som du husker, skjedde det i geometrisk progresjon, og veldig snart ble det vanskeligere å navigere i alt dets mangfold.

Deretter dukket det opp kataloger (Yahoo, Dmoz og andre), der forfatterne deres la til og sorterte forskjellige nettsteder i kategorier. Dette gjorde umiddelbart livet lettere for de daværende, ennå ikke veldig mange brukerne av det globale nettverket. Mange av disse katalogene lever fortsatt i dag.

Men etter en tid ble størrelsen på databasene deres så store at utviklerne først tenkte på å lage et søk i dem, og deretter på å lage et automatisert system for å indeksere alt Internett-innhold for å gjøre det tilgjengelig for alle.

De viktigste søkemotorene til det russisktalende segmentet av Internett

Som du forstår, ble denne ideen implementert med forbløffende suksess, men alt viste seg imidlertid bra bare for en håndfull utvalgte selskaper som klarte ikke å forsvinne på Internett. Nesten alle søkemotorer som dukket opp i den første bølgen har nå enten forsvunnet, forsvunnet eller blitt kjøpt av mer suksessrike konkurrenter.

En søkemotor er en veldig kompleks og, viktigere, veldig ressurskrevende mekanisme (dette betyr ikke bare materielle ressurser, men også menneskelige). Bak den tilsynelatende enkle , eller dens asketiske analog fra Google, er det tusenvis av ansatte, hundretusenvis av servere og mange milliarder av investeringer som er nødvendige for at denne kolossen skal fortsette å fungere og forbli konkurransedyktig.

Å gå inn på dette markedet nå og starte fra bunnen av er mer en utopi enn et ekte forretningsprosjekt. For eksempel har et av verdens rikeste selskaper, Microsoft, forsøkt å få fotfeste i søkemarkedet i flere tiår, og først nå begynner søkemotoren deres Bing sakte å oppfylle forventningene deres. Og før det var det en hel rekke feil og tilbakeslag.

Hva kan vi si om å gå inn i dette markedet uten noen spesiell økonomisk påvirkning. For eksempel har vår innenlandske søkemotor Nigma mange nyttige og innovative ting i sitt arsenal, men trafikken deres er tusenvis av ganger lavere enn lederne på det russiske markedet. Ta for eksempel en titt på det daglige Yandex-publikummet:

I denne forbindelse kan vi anta at listen over de viktigste (beste og heldigste) søkemotorene til Runet og hele Internett allerede er dannet, og hele intrigen ligger bare i hvem som til slutt vil sluke hvem, eller hvordan deres prosentandel vil deles ut hvis de alle overlever og vil holde seg flytende.

Russisk søkemotormarked er veldig godt synlig, og her kan vi sannsynligvis skille mellom to eller tre hovedspillere og et par mindre spillere. Generelt har det utviklet seg en ganske unik situasjon i RuNet, som, slik jeg forstår det, bare har gjentatt seg i to andre land i verden.

Jeg snakker om det faktum at søkemotoren Google, etter å ha kommet til Russland i 2004, fortsatt ikke har vært i stand til å ta ledelsen. Faktisk prøvde de å kjøpe Yandex rundt denne perioden, men noe fungerte ikke der, og nå er «vårt Russland», sammen med Tsjekkia og Kina, de stedene hvor den allmektige Google, om ikke beseiret, så i møtte i alle fall alvorlig motstand.

Faktisk, for å se dagens tilstand blant de beste søkemotorene på RuNet Hvem som helst kan. Det vil være nok å lime inn denne nettadressen i adressefeltet til nettleseren din:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Faktum er at de fleste av dem bruker .

Etter å ha angitt den gitte URL-en, vil du se et bilde som ikke er veldig attraktivt og presentabelt, men det gjenspeiler godt essensen av saken. Vær oppmerksom på de fem beste søkemotorene som nettsteder på russisk mottar trafikk fra:

Ja, selvfølgelig, ikke alle ressurser med russiskspråklig innhold er plassert i denne sonen. Det finnes også SU og RF, og generelle områder som COM eller NET er fulle av internettprosjekter med fokus på Runet, men likevel er utvalget ganske representativt.

Denne avhengigheten kan presenteres på en mer fargerik måte, som for eksempel noen gjorde på nettet for presentasjonen hans:

Dette endrer ikke essensen. Det er et par ledere og flere veldig, veldig langt bak søkemotorer. Jeg har forresten allerede skrevet om mange av dem. Noen ganger kan det være ganske interessant å kaste seg inn i suksesshistorien, eller omvendt å fordype seg i årsakene til feilene til en gang lovende søkemotorer.

Så, i rekkefølge av betydning for Russland og Runet som helhet, vil jeg liste dem opp og gi dem korte egenskaper:

    Å søke på Google har allerede blitt et kjent ord for mange mennesker på planeten – du kan lese om det i lenken. I denne søkemotoren likte jeg alternativet "oversettelse av resultater" når du mottok svar fra hele verden, men på morsmålet ditt, men nå er det dessverre ikke tilgjengelig (i det minste på google.ru).

    I det siste har jeg også vært forundret over kvaliteten på resultatene deres (Search Engine Result Page). Personlig bruker jeg alltid RuNet-speilsøkemotoren (det er en der, vel, jeg er vant til den), og bare hvis jeg ikke finner et forståelig svar der, henvender jeg meg til Google.

    Vanligvis gjorde utgivelsen av dem meg glad, men i det siste har det bare forundret meg – noen ganger kommer sånt tull. Det er mulig at deres kamp for å øke inntektene fra kontekstuell annonsering og den konstante stokkingen av søkeresultater for å diskreditere SEO-promotering kan føre til det motsatte resultatet. I alle fall har denne søkemotoren en konkurrent på RuNet, og hva slags en på det.

    Jeg tror at det er usannsynlig at noen spesifikt vil gå til Go.mail.ru for å søke i RuNet. Derfor kan trafikken til underholdningsprosjekter fra denne søkemotoren være betydelig mer enn ti prosent. Eiere av slike prosjekter bør ta hensyn til dette systemet.

Men i tillegg til de klare lederne i søkemotormarkedet i det russiskspråklige segmentet av Internett, er det flere aktører hvis andel er ganske lav, men likevel gjør selve eksistensen det nødvendig å si noen få ord om dem.

Runet søkemotorer fra andre sjikt


Internett-dekkende søkemotorer

I det store og hele er det bare én seriøs aktør på hele Internetts skala - Google. Dette er den ubestridte lederen, men den har fortsatt en viss konkurranse.

For det første er det fortsatt det samme Bing, som for eksempel har en veldig god posisjon i det amerikanske markedet, spesielt med tanke på at motoren også brukes på alle Yahoo-tjenester (nesten en tredjedel av hele det amerikanske søkemarkedet).

Vel, for det andre, på grunn av den enorme andelen brukere fra Kina utgjør av det totale antallet Internett-brukere, kalte deres hovedsøkemotor Baidu kiler seg inn i fordelingen av steder på verdens Olympus. Han ble født i 2000 og nå er andelen hans omtrent 80 % av hele det nasjonale publikummet i Kina.

Det er vanskelig å si noe mer forståelig om Baidu, men på Internett er det meninger om at steder i toppen er okkupert ikke bare av nettstedene som er mest relevante for forespørselen, men også av de som har betalt for det (direkte til søkemotoren) , og ikke til SEO-kontoret). Dette gjelder selvsagt først og fremst kommersielle oppføringer.

Generelt sett, ser man på statistikken, blir det klart hvorfor Google lett går med på å forverre søkeresultatene sine i bytte mot økende fortjeneste fra kontekstuell annonsering. Faktisk er de ikke redde for brukerfrafall, fordi de i de fleste tilfeller ikke har noe sted å gå. Denne situasjonen er litt trist, men vi får se hva som skjer videre.

Forresten, for å gjøre livet enda vanskeligere for optimerere, og kanskje for å opprettholde sjelefred for brukere av denne søkemotoren, har Google nylig brukt kryptering ved overføring av søk fra brukernes nettlesere til søkefeltet. Snart vil det ikke lenger være mulig å se i statistikken til besøkstellere hvilke søk Google-brukere kom til deg for.

Selvfølgelig, i tillegg til søkemotorene nevnt i denne publikasjonen, er det tusenvis av andre - regionale, spesialiserte, eksotiske, etc. Å prøve å liste opp og beskrive dem alle i én artikkel ville være umulig, og sannsynligvis ikke nødvendig. La oss heller si noen ord om hvor enkelt det er å lage en søkemotor og hvor enkelt og billig det er å holde det oppdatert.

De aller fleste systemene jobber etter lignende prinsipper (les om dette og hint) og har samme mål – å gi brukerne svar på spørsmålet sitt. Dessuten må dette svaret være relevant (tilsvarende spørsmålet), omfattende og, som ikke er uviktig, relevant (av den første friskheten).

Å løse dette problemet er ikke så lett, spesielt med tanke på at søkemotoren må analysere innholdet på milliarder av Internett-sider i farten, luke ut de unødvendige, og fra de gjenværende danne en liste (problem), der de fleste passende svar på brukerens spørsmål vises først.

Denne ekstremt komplekse oppgaven løses ved foreløpig innsamling av informasjon fra disse sidene ved hjelp av ulike indekseringsroboter. De samler inn lenker fra allerede besøkte sider og laster informasjon fra dem inn i søkemotordatabasen. Det finnes roboter som indekserer tekst (en vanlig og rask bot som lever av nyheter og hyppig oppdaterte ressurser slik at de siste dataene alltid presenteres i resultatene).

I tillegg er det roboter som indekserer bilder (for deres påfølgende utgang til), favorittikoner, sidespeil (for deres påfølgende sammenligning og mulig liming), roboter som sjekker funksjonaliteten til Internett-sider, hvilke brukere eller gjennom verktøy for webansvarlige (her kan du kan lese om, og).

Selve indekseringsprosessen og den påfølgende prosessen med å oppdatere indeksdatabaser er ganske tidkrevende. Selv om Google gjør dette mye raskere enn sine konkurrenter, i det minste Yandex, som tar en uke eller to å gjøre dette (les om).

Vanligvis deler en søkemotor opp tekstinnholdet på en Internett-side i enkeltord, som er redusert til de grunnleggende prinsippene, slik at den deretter kan gi riktige svar på spørsmål som stilles i forskjellige morfologiske former. Alle de ekstra tingene i form av HTML-koder, mellomrom osv. ting slettes, og de resterende ordene sorteres alfabetisk og deres plassering i dette dokumentet er angitt ved siden av dem.

Denne typen ting kalles en omvendt indeks og lar deg søke ikke etter nettsider, men etter strukturerte data som ligger på søkemotorens servere.

Antallet slike servere for Yandex (som hovedsakelig søker etter russiskspråklige nettsteder og litt etter ukrainsk og tyrkisk) er i titalls eller til og med hundretusener, og for Google (som søker på hundrevis av språk) - i millioner. .

Mange servere har kopier, som tjener både til å øke sikkerheten til dokumenter og bidra til å øke hastigheten på forespørselsbehandlingen (ved å fordele belastningen). Estimer kostnadene ved å opprettholde hele denne økonomien.

Brukerens forespørsel vil bli sendt av lastbalanseren til serversegmentet som for øyeblikket er minst lastet. Deretter gjennomføres en analyse av regionen som søkemotorbrukeren sendte forespørselen sin fra, og den analyseres morfologisk. Hvis et lignende søk nylig ble lagt inn i søkefeltet, får brukeren data fra hurtigbufferen for ikke å overbelaste serverne igjen.

Hvis forespørselen ennå ikke er bufret, blir den overført til området der søkemotorens indeksdatabase er plassert. Som svar vil du motta en liste over alle Internett-sider som i det minste er noe relatert til forespørselen. Ikke bare direkte forekomster tas i betraktning, men også andre morfologiske former, så vel som osv. tingene.

Deres må rangeres og på dette stadiet kommer algoritmen (kunstig intelligens) inn. Faktisk multipliseres brukerens forespørsel gjennom alle mulige alternativer for tolkningen, og svar på mange forespørsler søkes samtidig (ved bruk av spørringsspråkoperatører, hvorav noen er tilgjengelige for vanlige brukere).

Som regel inneholder søkeresultatene én side fra hvert nettsted (noen ganger flere). er nå svært komplekse og tar hensyn til mange faktorer. I tillegg, for å korrigere dem, og brukes, som manuelt evaluerer referansenettsteder, som lar deg justere driften av algoritmen som helhet.

Generelt er det klart at saken er mørk. Vi kan snakke lenge om dette, men det er allerede klart at brukertilfredshet med et søkesystem oppnås, å, så vanskelig det er. Og det vil alltid være de som ikke liker noe, som deg og meg, kjære lesere.

Lykke til! Vi sees snart på sidene til bloggsiden

Du kan se flere videoer ved å gå til
");">

Du kan være interessert

Yandex People - hvordan søke etter folk på sosiale nettverk Apometr er en gratis tjeneste for sporing av endringer i søkeresultater og oppdateringer av søkemotorer. DuckDuckGo - en søkemotor som ikke følger deg
Hvordan sjekke Internett-hastighet - online tilkoblingstest på datamaskin og telefon, SpeedTest, Yandex og andre målere
Yandex og Google-bilder, samt søk etter bildefil i Tineye (tinai) og Google


Å si at i vår tid med informasjonsteknologi og den endeløse veksten av datavolumet som er tilgjengelig for både et individ og samfunnet, er det mange problemer med å behandle informasjon og søke etter den, er allerede blasfemi. Hvem tar ikke opp dette temaet? Og for ikke å belaste deg med subjektive og til dels objektive vurderinger hentet fra ulike informasjonskilder angående problemet, vil jeg gå direkte til løsningen. I dag skal vi snakke om søk. Det vil si om programmer og seriøse informasjonssystemer som søker etter dokumentene og dataene vi trenger.

Oppgrader "direkte søk"

For ikke så lenge siden, da trærne var store, og det ikke var mye informasjon selv på bedriftens lokale nettverk, ble ethvert søk utført ved ganske enkelt å søke gjennom en håndfull tilgjengelige filer og sekvensielt sjekke navn og innhold. Et slikt søk kalles direkte, og programmer (verktøy) som bruker direkte søketeknologi er tradisjonelt til stede i alle operativsystemer og verktøypakker. Men selv kraften til moderne datamaskiner er ikke nok for et raskt og tilstrekkelig søk i gigantiske mengder data under direkte søk. Å søke gjennom et par hundre dokumenter på en disk og søke i et enormt bibliotek og flere dusin postkasser er to forskjellige ting. Derfor faller direktesøk-programmer i dag helt klart i bakgrunnen - når det kommer til universelle verktøy.

Selvfølgelig har denne typen søk ikke vært etterspurt på lenge i bedriftssektoren. Volumene er ikke de samme. Og derfor, i mange år nå, og nylig helt klart, er teknologier som er i stand til raskt og nøyaktig å søke etter dokumenter i forskjellige formater og fra forskjellige kilder mer enn relevante. For ikke så lenge siden kunngjorde Microsofts "far" Bill Gates, tilsynelatende misunnelig på den fenomenale suksessen til Internett-søkemotoren Google, på en av pressekonferansene ønsket fra programvareindustrien (og ikke bare) om å bidra på alle mulige måter, utvikle og utdype etableringen av søkemotorer og teknologier. Men det er for tidlig å lage et fenomenalt fungerende program fra Microsoft eller en konkurrerende server på Internett (MSN når fortsatt ikke Google). La oss derfor gå til eksisterende utvikling. Indeks, spørring, relevans

Moderne teknologier er basert på to grunnleggende prosesser. For det første er det å indeksere den tilgjengelige informasjonen og behandle forespørselen med påfølgende utdata av resultatene. Når det gjelder det første, skaper ethvert program (det være seg en stasjonær søkemotor, et bedriftsinformasjonssystem eller en Internett-søkemotor) sitt eget søkeområde. Det vil si at den behandler dokumenter og genererer en indeks over disse dokumentene (en organisert struktur som inneholder informasjon om de behandlede dataene). I fremtiden er det den opprettede indeksen som brukes til arbeid - raskt å få en liste over nødvendige dokumenter i henhold til forespørselen. Det som følger, selv om det på ingen måte er enkelt når det gjelder teknologi, er ganske forståelig for den gjennomsnittlige brukeren. Programmet behandler forespørselen (ved hjelp av en nøkkelordsetning) og viser en liste over dokumenter som inneholder denne søkeordsetningen. Siden informasjonen er inneholdt i en strukturert indeks, er forespørselsbehandlingen mye raskere (titil og hundrevis av ganger!) enn ved direkte søk (utvelgelsen av dokumenter utføres ikke ved å telle opp filer, men ved å analysere tekstinformasjon i indeks).

Programmet viser de funnet dokumentene i den resulterende listen i henhold til relevans - dokumentets samsvar med søketeksten. I forskjellige teknologier er det selvfølgelig forskjellige metoder for å søke og bestemme relevansen til et dokument (antall "forekomster" av et ord og dets omtalefrekvens i dokumentet, forholdet mellom disse parameterne og det totale antallet ord i dokumentet, avstanden mellom ordene i søkefrasen i de søkte filene, og så videre). Basert på disse parametrene bestemmes "vekten" til dokumentet, og avhengig av den vises en bestemt fil i resultatlisten på en bestemt posisjon. Når det gjelder Internett-søk, er situasjonen enda mer komplisert. Faktisk, i dette tilfellet må mange andre faktorer tas i betraktning (Googles Page Rank er et eksempel på dette). Men dette er et emne for en egen artikkel, så vi vil ikke røre Internett. Gjennomgang av søkemotorer

Dette materialet undersøker mulighetene til flere populære søkeprogrammer som kan skryte av både anstendige hastigheter og god funksjonalitet. Men å vise seg frem i brosjyrer er én ting, men å stå under blikket til en ekspert er noe helt annet. Og det var ikke flere eksperter, ikke mindre et kontor fullt av folk som likte å tukle med programvaren for dens brukervennlighet. Et sett med programmer ble installert på den eksperimentelle datamaskinen (Athlon 2,2 MHz, med RAM 1 GB, 160 GB IDE-harddisk Seagate 7200 rpm og Windows XP): dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform , Copernic Desktop Search, ISYS skrivebord. For testene ble det satt sammen en tekstdatabase med dokumenter i doc-, txt- og html-formater med en total størrelse på verken mer eller mindre, men 20 gigabyte. En gruppe kamerater under ledelse av din ydmyke tjener testet, sammenlignet og delte sine subjektive inntrykk av hver programvare. Les et sammendrag av funnene nedenfor. dtSearch Desktop

Et program som ifølge utviklerne hevder å være den raskeste, mest praktiske og beste søkemotoren. Som generelt sett alle andre fra denne anmeldelsen. dtSearch-grensesnittet er ganske enkelt, men noen vinduer eller faner er noe overbelastet med elementer, noe som gjør det vanskelig å bruke. Men i virkeligheten er det ingen spesielle vanskeligheter. Det eneste virkelig ubehagelige punktet er programvarens mangel på støtte for det russiske språket (til tross for at programmet kan søke etter dokumenter på flere språk, er grensesnittet utelukkende engelsk).

Men dtSearch er et av få programmer som kan indeksere nettsider til en brukerspesifisert "dybde" (riktignok tatt i betraktning "ekstra kjøp" av dtSearch Spider-tilleggssettet). Dette kommer i tillegg til å støtte diskfiler med ulike tekstformater og e-post fra Outlook-postkassen. Samtidig kan ikke programmet fungere med databaser, som er en så velsmakende bit for søkemotorer på grunn av de store mengder informasjon som finnes i dem og deres brede distribusjon i selskaper, og derfor i bedriftsnettverk. Hastigheten på å indeksere dtSearch-dokumenter viste seg å være på riktig nivå. Når jeg ser fremover, vil jeg si at dette programmet taklet indekseringen av en gitt informasjonsmengde på nivå med en annen konkurrent - iSYS - og delte andreplassen med den i listen over de raskeste systemene. dtSearch indekserte en test 20 gigabyte med informasjon på 6 timer og 13 minutter, og skapte en indeks på 7,9 GB for påfølgende søkebehov.

Når det gjelder søkefunksjonene, her er de på riktig nivå. For det første har dtSearch et morfologisk søk ​​(søker etter et ord i alle dets morfologiske former). Ved å bruke denne muligheten frigjør du deg selv fra for eksempel tanker som "i hvilket tilfelle ble et bestemt ord brukt i dokumentet jeg trengte?" Bruk av morfologisk søk ​​er nesten alltid berettiget, så det bør være til stede i enhver profesjonell søkemotor.

Søk etter lyd er en ikke-standard funksjon selv for profesjonelle søkemotorer. Essensen er at programmet vil søke etter ord som høres ut på samme måte som ordet du skrev inn. Og det beste er at denne funksjonen også fungerer for det russiske språket! For eksempel, når du skriver inn ordet "øre" i et søk, vil du se ikke bare ordene "øre", men også "øre" som et resultat.

Søk med feilretting er en svært viktig funksjon. Den brukes til å søke etter ord som inneholder syntaktiske feil - disse kan enten være skrivefeil eller feil i dokumenter hentet ved hjelp av tegngjenkjenningssystemer, for eksempel. Et enkelt eksempel - du leter etter ordet tastatur. Noen dokumenter inneholder ordet "tastatur", det er åpenbart at dette faktisk er ordet "tastatur", personen skrev nettopp en skrivefeil. Så et feilrettingssøk vil oppdage og inkludere et dokument med ordet "tastatur" i resultatet. Det er også en innstilling i dtSearch som lar deg bestemme graden av mulige feilaktige tegn.

Søk med synonymer. Denne funksjonen bruker en liste over synonymer for forskjellige ord. Så, for eksempel, ved å skrive inn ordet "rask", vil programmet også finne ordene "høyhastighet" og andre som er synonymer for ordet "rask", hvis de selvfølgelig er til stede i listen over synonymer . En ferdig liste over synonymer følger ikke med dtSearch-programmet, men det er mulig å bruke lister på Internett (det er derfor nødvendig med en tilkobling, noe som ikke alltid er praktisk), eller du kan lage din egen liste over synonymer .

I tillegg til funksjonene som er oppført, kan dtSearch søke ved hjelp av fraser som består av ord forbundet med logiske operasjoner. Hvert ord i en spørring kan tildeles sin egen "vekt", det vil si betydning. Et nyttig alternativ er å bruke en ordbok som består av uviktige ord for ikke å ta hensyn til dem når du søker, men denne ordboken er også tom og du må fylle den ut selv.

La oss deretter se på programmets muligheter når du arbeider på nettverket. Faktisk tilbyr ikke dtSearch noen spesifikke muligheter for å jobbe med nettverket. Det er imidlertid fullt mulig å bruke det på nettet. Alternativt kan du lage en slags indeks og legge den i en offentlig (delt) mappe. Selve programmet kan installeres på hver brukers datamaskin, eller det kan også plasseres i en mappe som er åpen for offentlig tilgang, og snarveier kan opprettes på en spesiell måte for hver bruker separat, ved hjelp av kommandolinjeparametere, hvis formål er beskrevet i hjelpefilen som følger med programmet. Det er også mulig å installere programmet automatisk på nettverket ved hjelp av en MSI-fil. Dette vil ta hensyn til innstillingene for hver tilkoblet bruker.

Generelt er det et godt program fra kategorien profesjonelle søkemotorer. Det kan kvalifisere for en god vurdering, men å få tillit og respekt fra brukere er kanskje ikke lett for dtSearch på grunn av visse faktorer (ikke alt er glatt med grensesnittet, russiske brukere er fratatt, det er ingen lyse funksjoner for å jobbe med nettverket) . Når det gjelder direkte søk etter dokumenter, hadde programmet ingen problemer med russisk tekst. Siden det ikke var noen med den deklarerte morfologien, eller med et uklart søk. Systemet fant ganske tilstrekkelig de nødvendige dokumentene både ved en enkel ettordsspørring og ved å bruke et par avsnitt eller et dokument som nøkkeluttrykk.

Offisiell side:
Distribusjonsstørrelse: 23 Mb Bloodhound Prof Deluxe

Basert på navnet kan du gjette at det er støtte for det russiske språket i dette programmet. Dette er allerede fint. Når det gjelder grensesnittet, generelt er det noe uvanlig, men utseendemessig er det veldig attraktivt. En annen ting er bekvemmelighet. Et veldig kontroversielt kriterium, men likevel, sannsynligvis, er en flervindusløsning ikke det mest vellykkede alternativet (forespørselen legges inn i ett vindu, resultatet vises i et annet og lignende).

Snoop bruker de samme indeksene for å utføre et raskt søk, men indeksering er mye tregere enn andre programmer. Dette er veldig rart, spesielt med tanke på at evnene for behandling av søk er svært svake, og derfor er indeksstrukturen ikke kompleks. Mest sannsynlig er dette på grunn av uoptimaliserte algoritmer. Dette programmet viste seg å være en tydelig outsider når det gjelder indeksering og søkehastigheter: tiden brukt på å lage indeksen var seks ganger lengre enn samme dtSearch og iSYS. Indeksering av 20 gigabyte med tekster for blodhunden resulterte i 38 timer og 46 minutters arbeid. Og det opprettede "søkeområdet" tok opp samme størrelse på harddisken som de originale dataene med et lite minus - 19 gigabyte.

Bloodhound kan presenteres som et alternativ til standardsøket i Windows; det er usannsynlig at det er i stand til mer. Det faktum at Snoopers primære oppgave er det enkleste søket etter filer, indikeres ikke bare av det lille antallet funksjoner for å analysere teksten i søkespørsmål og et avansert søk etter filattributter, men til og med av et resultatvindu som gir direkte lenker til filer funnet, samt til mappene som inneholder disse filene. Resultatvinduet er lite informativt i den forstand at du kan lese hele filen som ble funnet bare ved å kjøre den, det vil si at den ikke har en innebygd filviser. Men et utdrag fra filen der det søkte ordet ble funnet vises; generelt minner dette visningsskjemaet veldig om Internett-søkemotorer.

Når vi snakker om spesifikke funksjoner for å behandle søkespørsmål, er det verdt å merke seg at det ikke er noe som heter "søketekst"; det maksimale som kan søkes er en setning, om ikke annet fordi det ikke er noe flerlinjers tekstinntastingsfelt. Du kan imidlertid analysere den angitte setningen, og Snoop tilbyr oss et standard søkesett her: logiske operasjoner, maskesøk og sitatsøk... ikke mye. Programmet inneholder noen rudimenter av morfologisk søk, men det er sannsynligvis så grovt at det mest sannsynlig forstyrrer korrekt drift (under tester ble det lagt merke til mange feil med feil bruk av morfologi).

Men programmet lar deg spesifisere filattributter når du søker (dokumentdato, filnavn, mappenavn), og i disse spørringene kan du også bruke det samme søkesettet. Du kan også søke etter bokstaver ved å spesifisere parametrene (Fra, Emne... osv.).

Så vi fant ut selve søket, hva annet er interessant med programmet, som det mottok så mange priser for, ifølge informasjon fra det offisielle nettstedet? Det er vanskelig å si hva som er så spesielt med det; mest sannsynlig er Bloodhound-grensesnittet attraktivt (nøyaktig i utseende, for ikke å nevne brukervennlighet).

Operasjoner med indekser er veldig standard; en fin funksjon er muligheten til å oppdatere indekser på en tidsplan. I tillegg kan indekser også brukes online. Fra nå av trenger vi flere detaljer.

Til tross for primitiviteten til søkespørringer, kan programmet brukes til å søke etter filer, slik at bruken kan rettferdiggjøres i nettverk. Selv om dette er en strekk, siden i et stort nettverk er prioritet å raskt søke etter data ved hjelp av komplekse søkespørringer på grunn av den enorme mengden informasjon - og det er helt klart problemer med hastigheten på søket og programmet. Jeg må si at arbeidet med nettverket på Izhishika er gjennomtenkt som det skal. En egen applikasjon er designet spesielt for dette - Bloodhound Server. Det fungerer på samme måte som bare Snooper (de har én søkemotor), bare for dokumenter som ligger på en sentral server eller på delte ressurser på bedriftsnettverket. Snooper Server oppretter nye indekser på delte ressurser eller bruker tidligere opprettede. Enhver bruker av bedriftsnettverket kan koble seg til søkeserveren og bruke den til å få tilgang til ethvert dokument (plassert i gjeldende indeks) ved hjelp av en nettleser. Enig, denne ordningen er ekstremt praktisk: det viser seg at filer på ditt eget nettverk kan søkes på samme måte som informasjon på Internett gjennom for eksempel Google.

Ved å vurdere alle fordelene og ulempene ved dette programmet, antyder konklusjonen seg selv at dets evner mest sannsynlig ikke er nok for bedriftsnettverk (til tross for den gode organiseringen av å jobbe med nettverket), men for en hjemmedatamaskin eller til og med for et hjemmenettverk er det , i prinsippet, , kan det komme opp. Selv om verken arbeidshastigheten eller søkemulighetene inspirerer til optimisme...

Offisiell nettside på russisk:
Distribusjonsstørrelse: 6 MbGoogle Desktop Search + GDS Enterprise

Selvfølgelig kunne vi ikke ignorere en så kjent utvikler. Navnet Google sier allerede mye. Folk som har brukt den kraftigste Internett-søkemotoren i årevis, vil helt sikkert, uten en eneste tvil, bestemme seg for å installere denne søkemotoren på datamaskinen. Bare tenk: Google på hjemmedatamaskinen! Men uten å gi etter for provokasjoner med et bredt markedsført merke, la oss prøve nøkternt, og viktigst objektivt, å vurdere mulighetene til "desktop"-søkemotoren fra Google.

Det første som fanger oppmerksomheten er mangelen på et eget skall for programmet. Google Desktop Search er fortsatt plassert i nettleservinduet, henholdsvis hele grensesnittet til skrivebordsversjonen ble arvet fra programvaren fra den eldre Internett-broren. Hvorvidt dette er bra eller dårlig er et problem: noen liker minimalismen i utformingen av denne søkemotoren, mens andre ønsker å se en fullverdig applikasjon fylt med alle slags knapper og så videre.

Hva fanger oppmerksomheten din rett etter designet? Og det faktum at det samme Google Desktop Search begynner å indeksere alt på datamaskinen, uten noen etterspørsel! Og det som er mest interessant er at det er umulig å velge indekseringsbaner ved hjelp av Google Desktop Search. Du må laste ned et eget program (TweakGDS), som lar deg utvide Google Desktop-innstillingene noe, inkludert å spesifisere stedene som er nødvendige for indeksering. Selv om når du finner ut av alt dette, vil den allerede indeksere en standard harddisk, så denne innstillingen er mer sannsynlig å være nødvendig når du arbeider med store datamengder, noe som er veldig viktig når det brukes i bedriftsnettverk (Enterprise-versjoner) . Det er imidlertid ikke et faktum at etter å ha lastet ned TweakGDS, vil problemene dine være løst. Tross alt krever det Microsoft .NET Framework og Microsoft Scripting Runtime for å fungere. Ja... installasjonen, samt tilgang til innstillingene, kunne vært gjort enklere, selv om utviklerne sikkert kan forstå: hvorfor skrive noe nytt når det er en ferdiglaget søkemotor, portet det til den lokale datamaskinen og la brukeren "nyter", og et kjent navn vil lage nok et mesterverk ut av "dette". Kom igjen, la oss avslutte denne lyriske digresjonen og gå videre til søket.

Når det gjelder å analysere søk og levere resultater, er alt her helt identisk med Google på Internett: det samme systemet for å vise resultater, det samme standardsettet med logiske operasjoner for søk. Generelt er Google Desktop Search, som det forrige programmet, utelukkende beregnet på å søke etter filer - det har selvfølgelig ikke en intern visningsprogram for disse filene. Antallet filformater som støttes av Google Desktop Search er ganske tilstrekkelig, og det er også fint at det søker på besøkte Internett-sider og henter data fra hurtigbufferen. Søke- og indekseringshastigheter er ganske akseptable. Riktignok til hjemmebruk. Google Desktop Search taklet imponerende 20 gigabyte med tekster på 8 timer og 17 minutter. Å bruke flere dager på å behandle informasjon fra bedriftsnettverket til en stor bedrift er ikke noe noen systemadministrator ønsker å gjøre. På plussiden: størrelsen på den opprettede indeksen var på samme nivå (4,5 GB) som en annen søkemotor testet i denne anmeldelsen - SearchInform.

Den store fordelen (eller ulempen – du bestemmer selv) med Google Desktop Search er at den støtter plugins, som kan endre mye til det bedre. En annen ting er at å koble til plugins og sette dem opp kompliserer oppgaven med å installere en søkemotor så mye at du begynner å lure på om alt dette er nødvendig når du kan installere et normalt, fullverdig program der alt allerede vil være til stede. Tross alt, for å bruke hver funksjon må du installere en ny plugin. Selv for at programmet skal fungere fullt ut med arkiver, trengs en egen gadget. Det er fascinerende og forførende at alle disse tilleggsmodulene er gratis. Men hvis du ikke tar hensyn til skrivebordsversjonen av søkemotoren, kan det hende at kompetent konfigurasjon av GDS Enterprise ikke er innenfor din makt - tross alt er det ikke for ingenting at spesialister fra Google tilbyr sine tjenester for å sette opp sine egne programvare for nettverket ditt for kun $10 000.

Hvis du går gjennom oppsetts- og installasjonsprosedyren (eller betaler $10 000 til et raskt svar-team fra Google), vil du forstå at kompleksiteten til installasjonen mer enn kompenseres av de svært fleksible innstillingene når den brukes i bedriftsnettverk. Et viktig aspekt ved bruk av Google Desktop på et bedriftsnettverk er bruken av gruppepolicyer, som gjør det mulig å angi innstillinger for hver bruker.

For å oppsummere, den mest fornuftige bruken av dette programmet er en hjemme- eller jobbdatamaskin. Tross alt, for en vanlig datamaskin, er det nok bare å installere programmet - det vil gjøre resten selv (det vil ikke engang spørre deg om noe).

Google Desktop Search Enterprise vil imidlertid være akseptabelt i tilfeller der det er et presserende behov for fleksibel konfigurasjon av nettverkspolicy for å bruke søkemotoren, mens muligheten til å behandle søkespørsmål vil være på andre plass i viktighet, og tiden (eller pengene) ) brukt på å sette opp programmet vil være på førsteplass.

Offisiell side:
Distribusjonsstørrelse inkludert TweakGDS: 1,2 MbCopernic Desktop Search

Klikk på bildet for å forstørre

Programgrensesnittet fremkaller ekstremt positive følelser - alt er gjort i samsvar med allment aksepterte standarder, ingenting overflødig, med et ord, en hyggelig design. For en nybegynner vil det være veldig enkelt å forstå Copernic Desktop Search-grensesnittet. Selv om det er noe forvirrende at designerne tydelig opprettet programgrensesnittet med tanke på det faktum at programmet vil fungere i standard Windows XP-tema. Når du bruker det klassiske temaet, ser ikke programmet så pent ut. Men dette er mer en smakssak.

Ved første oppstart ber programmet deg om å lage indekser for søk. Det virket noe uvanlig at etter å ha valgt mapper for indeksering, tilbød ikke programmet å trykke på noen knapp, for eksempel "Start indeksering", og indeksering startet ikke automatisk, først da ble det lagt merke til at Copernic prøvde å starte indeksering mens datamaskinen var ledig. Du må grave litt dypere inn i programmets alternativer for å konfigurere alt riktig. Det skal bemerkes at det er ganske brede muligheter for å sette opp automatisk indeksoppretting: en innebygd planlegger, muligheten til å indeksere mens datamaskinen er inaktiv, i bakgrunnen, med lav prioritet. Indekseringen var ikke for rask - 10 timer 51 minutter - dette er tregere enn i andre søkemotorer (bortsett fra Isle of Bloodhound, men Copernic er fortsatt en størrelsesorden raskere enn utviklingen av iSleuthHound Technologies.

Nå om strukturen til indeksen. Generelt er det ikke noe spesielt med det. Det er mulig å velge filtyper, både i generell og detaljert form. Det vil si at du i utgangspunktet kan velge hva du vil indeksere - Dokumenter, Bilder, Videoer, Musikk. På den andre fanen i alternativvinduet vil du kunne velge spesifikke filtyper etter utvidelse. I tillegg kan du konfigurere indeksen slik at for eksempel bilder som er mindre enn 16x16 i størrelse ikke indekseres eller lydfiler som er mindre enn 10 sekunder lange ikke indekseres. I tillegg til å indeksere filer fra mapper, kan Copernic jobbe med e-poster og kontakter fra adresseboken til Microsoft Outlook og Microsoft Outlook Express, og det er mulig å indeksere favoritter og historikk fra Internet Explorer.

Når det gjelder søkemulighetene, er de veldig svake her. Under tester ble det til og med avslørt at programmet ikke søker etter dokumenter i txt- og html-formater på russisk, slik at du bare kan finne dem etter titler og ikke etter innhold. Det eneste programmet gir for å forbedre søkeeffektiviteten er bruken av et standard sett med logiske operasjoner, og selv da ble denne funksjonen oppdaget eksperimentelt, siden den ikke ble dokumentert. Forresten, programmets hjelp er heller ikke i orden - den er bare tilgjengelig via Internett, som du ser er veldig upraktisk, og det er ikke for mye hjelpeinformasjon på Internett. Tilsynelatende bestemte utviklerne at det enkle grensesnittet til programmet ikke innebærer tilstedeværelsen av normal hjelp. For å fortsette samtalen om søkefunksjoner, bør det bemerkes at til tross for den svake analysen av spørringer, gir programmet et interessant søkesystem - brukeren kan velge filtype (bilder, videoer, musikk, etc.), angi et søk spørre og velg attributter som er spesifikke for valgt filtype. For eksempel, for lydfiler, kan disse være verdier fra mp3-tagger (artist, album, dato, etc.), for bilder kan du for eksempel velge størrelse (etter oppløsning), generelt har hver type sin egne innstillinger. Etter å ha søkt etter en bestemt filtype, vil programmet vise en svært informativ liste i resultatvinduet, og hvis forespørselen din inkluderer filer av andre typer, kan du åpne dem ved å klikke på en bestemt lenke.

Separat er det verdt å nevne resultatvisningsvinduet. Under listen over funnet filer vises innholdet i disse filene (et lignende opplegg brukes ofte i e-postklienter). Det er sant at tekstvisning bare kan gjøres i det opprinnelige formatet, og det er ingen ren tekstvisningsmodus, noe som ikke alltid er praktisk, siden det tar mer tid å åpne et dokument i dette tilfellet. Men gitt at Copernic kan søke etter bilder og musikk, er det mulig å se disse multimediefilene.

De grunnleggende prinsippene for driften av dette programmet er beskrevet, la oss nå se hva Copernic Desktop Search kan tilby oss for å jobbe med nettverket... I prinsippet kan du se veldig lenge, men du vil neppe kunne se noe . Dette programmet var med andre ord ikke ment å være nettverksbasert. Copernic Desktop Search er utelukkende en hjemmesøkemotor.

Åpenbart er den eneste (mest logiske) applikasjonen av dette programmet en hjemmedatamaskin. Her vil den fullt ut takle alle enkle brukersøk som består av ett eller to ord, vil finne nødvendig informasjon, og inndeling av søk etter filtype og støtte for multimediefiler sammen med bakgrunnsindeksering i lavprioritetsmodus, kombinert med en hyggelig grensesnitt, bare gi programmet styrke til å få tillit blant uerfarne brukere.

Offisiell side
Distribusjonsstørrelse: 2,6 MbISYS Desktop

Klikk på bildet for å forstørre

Et veldig kraftig program. Når det gjelder utstyrsnivået med alle slags funksjoner, er det et sted i nærheten av neste SearchInform søkesystem på listen. Dessuten er størrelsen på installasjonsfilen mer enn 40Mb! Det er vanskelig å si hva som kan presses inn i slike dimensjoner, fordi den samme SearchInform, med lignende funksjonalitet, tar opp 15 Mb.

Installasjonsprosessen her er heller ikke veldig hyggelig, eller rettere sagt ikke engang installasjonsprosessen. Selv før du laster ned programmet, vil du bli bedt om å registrere deg, ellers er det ingen måte. Deretter grensesnittet. Det er laget veldig pent, ingenting unødvendig fanger øyet, men dette er inntrykkene til en person som allerede er litt vant til det. Det vil ikke være lett for en nybegynner å finne ut hvor og hva som ligger, hvor du skal klikke og hvor du til slutt skal søke. Det anbefales på det sterkeste å lese hjelpen før du starter arbeidet - du vil spare mye nerver og tid. I tillegg til alt annet er den fullstendige mangelen på støtte for det russiske språket i programmet. Ikke bra. I tillegg er ikke vinduene her overbelastet med kontroller, men vi måtte betale for dette med multimoduler og bruk av ekstra vinduer. For eksempel legges søk inn ved å starte ett program, og indeksstyring utføres ved hjelp av et annet program. Søkespørsmål legges også inn her i separate popup-vinduer. Det er vanskelig å si hva som er bedre - et overbelastet grensesnitt eller allestedsnærværende multivinduer; snarere er det en smakssak.

Når det gjelder å lage indekser, gir programmet funksjoner for å forenkle prosessen med å sette alternativer for en ny indeks. Disse funksjonene inkluderer flere ferdige maler for å lage indekser for mappen «Mine dokumenter», «Mail», «Mail og dokumenter», «Spesifikk mappe», «Mappe med et utvalg filtyper» osv. Slike maler forenkler opprettelse av indekser på første trinn. Verktøyet for å jobbe med indekser har ikke et veldig godt grensesnitt, noe som er skremmende med en viss kompleksitet (dette er en veldig subjektiv vurdering, for å være ærlig), men hvis du ser på det, gir det mange nyttige alternativer og generelt , dens bruk forårsaker ikke store problemer. ISYS Desktop kan indeksere data fra ulike datakilder, og gir også mange fleksible innstillinger for slik indeksering. Ytterligere indekseringsfunksjoner inkluderer: støtte for SQL, FTP, TRIM Context, WORLDOX 2002, skript. Ved opprettelse av en indeks, hvis du valgte punktet "Mappe med utvalg av filtyper", har du mulighet til å velge filtyper for indeksering manuelt (i utvidelse). Det må sies at det ganske enkelt er et stort antall støttede filtyper, men du vil ikke kunne legge til din egen type (utvidelse) til den eksisterende listen. Du kan også merke tilstedeværelsen av en indekseringsplanlegger. Å lage en indeks og behandle 20 gigabyte med informasjon tok ISYS Desktop 6 timer og 13 minutter, og viste til slutt en god tid og størrelsen på den opprettede filen - 7,9 GB.

Søkemulighetene til dette programmet er ganske gode. Det som brukes i ISYS er mye kraftigere enn konvensjonell støtte for logiske operasjoner. Blant de avanserte søkemulighetene tilbyr programmet bruk av synonymer og et sorteringsfilter (etter bane, navn og dato for filoppretting). Settet med logiske operatorer er noe bredere enn standardsettet. I tillegg til logiske operasjoner lar programmet deg jobbe med mange andre operatører, som i prinsippet kan erstatte noen typer søk; for eksempel kan søk med parsing erstattes fullstendig ved å bruke spesielle operatører. Jeg ble veldig overrasket over at programmet ikke har et søk ved hjelp av morfologi. Dette er en alvorlig utelatelse, siden søkeeffektiviteten forbedres betraktelig ved bruk av morfologisk analyse. I tillegg er det ingen liste over betydningsfulle ord, men det er en omfattende liste over uvesentlige ord. Søkefunksjoner som «tilnærmet søk» og «heuristisk analyse» annonseres også.

ISYS gir et utvalg av flere typer søk, nemlig visuelle typer. Dette gjøres ved å bruke forskjellige typer vinduer for å legge inn søk, men faktisk tillater ikke et eneste vindu bruk av andre teknologier enn de som er oppført ovenfor.

Søkeresultatene er svært informative og vises som en liste over dokumenter sortert etter relevans. En forhåndsvisning av det valgte dokumentet vises nedenfor. I motsetning til Copernic Desktop Search, er forhåndsvisning her kun tilgjengelig i form av ren tekst; det var ikke mulig å vise dokumenter i deres opprinnelige format, det være seg Word, Html eller PDF, selv om dette i prinsippet ikke er for kritisk. Programmet lar deg dele opp funnet dokumenter i grupper i henhold til visse kriterier (som standard er de delt inn etter relevans). Du kan også se dokumenter som allerede er funnet ved å velge individuelle mapper (dette er praktisk når resultatet produserer et veldig stort antall dokumenter).

Å bruke programmet på et bedriftsnettverk er også svært berettiget, siden det gir gode muligheter for å organisere nettverkssøk. Søkesystemet er basert på opprettelsen av en offentlig indeks som inneholder indekserte data fra offentlig tilgjengelige nettressurser.

Faktisk er programmet fra ISYS verdig oppmerksomhet, i det minste å bli kjent med det. Dette programmet er et modent prosjekt med et stort antall funksjoner (ikke alltid og ikke alle trenger dem selvfølgelig, men likevel). Sjansene for at programmet vil se noen forbedringer når det gjelder behandling av søk er ukjent, men for øyeblikket kan det anbefales for nesten universell bruk. Og gitt at det fortsatt er for tungt for hjemmesystemer, er de viktigste stedene for installasjonen bedriftsnettverk.

Offisiell side:
Distribusjonsstørrelse: 40 MbSearchInform

Klikk på bildet for å forstørre

Det er sannsynligvis ikke verdt å starte med en gang med en beskrivelse av SearchInform-grensesnittet. Vi bør først beskrive installasjonsprosessen, eller snarere en av detaljene: du kan ikke installere programmet uten en Internett-tilkobling. Faktum er at før den første lanseringen krever programmet brukerregistrering (gratis) og sender alle innlagte data til serveren. Tilsynelatende måtte utviklerne ta slike tiltak i kampen mot piratkopiering, men dette hadde ikke en positiv effekt på installasjonsvennligheten.

Programgrensesnittet er designet i samsvar med alle generelt aksepterte regler, men ved første øyekast er det noe tungvint. Når du bruker programmet for første gang, ser det ut til at det er for komplisert, noen ganger er det ikke lett å huske i hvilken meny eller på hvilken fane det ønskede alternativet er plassert, men med lengre bruk virker grensesnittet ikke lenger så forferdelig komplekst . Det viktigste er å lese sertifikatet først.

Etter å ha forstått grensesnittet litt, kan du begynne å lage en indeks. Selve prosessen er veldig enkel og indekseringshastigheten, selv etter øye, er betydelig høyere enn alle andre søkemotorer i anmeldelsen. Tydelige testtall viser at SearchInform er dobbelt så rask som dtSearch og iSYS når det gjelder indekseringshastighet! Programmet indekserte de oppgitte dataene i mengden 20 gigabyte på en rekordtid på 3 timer og 17 minutter. Og størrelsen på den opprettede indeksen viste seg å være den minste 4,4 GB - 100 megabyte mindre enn Google Desktop Search.

Programmet støtter, i tillegg til vanlige filer og mapper, også indeksering av e-poster, kobling og indeksering av databaser (!) og andre eksterne kilder (DMS, CRM), umiddelbart under indeksering kan du spesifisere en ordbok for å utføre et morfologisk søk, og alle attributter kan være indekserte filer. Etter å ha opprettet indeksen, når du prøver å utføre det første testsøket etter dokumenter, kan du bli litt forvirret: "det er to typer søk her, men hvilken trenger jeg?" Som nevnt tidligere, det viktigste er å lese sertifikatet, så vil alt bli klart. Programmet kan faktisk utføre to typer søk - frasesøk og søk etter dokumenter som i innhold ligner søketeksten.

En beskrivelse av alle hovedfunksjonene for å analysere et søk ble gitt ovenfor, så nå vil vi bare vise søkemulighetene som tilbys av dette programmet. La oss starte med setningssøk: selvfølgelig, morfologisk søk, sitatsøk, logiske operasjoner, søk med ordanalyse (søk i begynnelsen av ordet, på slutten, i midtdelen eller et fullstendig samsvar), blandet siteringssøk ( når alle ord fra spørringen må være tilstede i dokumentet, men ikke nødvendigvis i den angitte rekkefølgen), søk med feilretting, bruk av synonymer, «nesten sitatsøk» (søk på den angitte setningen som sitering, men andre ord kan evt. være tilstede mellom de angitte ordene), etc. Noen av alternativene som er oppført har sine egne spesifikke innstillinger. I tillegg er det mulig å bruke en ordbok med uviktige ord, og programmet har allerede en ferdig liste over disse ordene; du kan også bruke en ordbok med prioriterte ord for å søke (selvfølgelig må du fylle den ut deg selv).

Her har vi i prinsippet kort gjennomgått alle hovedtrekkene ved setningssøk.

La oss gå videre til å vurdere funksjonene til dette programmet - søk etter lignende dokumenter. Utviklerne hevder at dette på ingen måte er et enkelt tekstsøk, det er nettopp et "søk etter lignende" - det er akkurat slik det beskrives overalt, men jammen, du kan kalle det hva du vil - hovedpoenget er . Et raskt søk på Internett kan raskt avsløre at såkalt «liknende søk» er en nyutvikling innen tekstanalyse. Dette systemet lar deg finne tekster som ligner på semantisk innhold. Det hyggeligste var at etter å ha gjennomført testsøk, viste det seg at teorien stemmer ganske bra med praksis! Programmet søker faktisk etter dokumenter med lignende innhold og viser dem i en liste, og sorterer dem etter prosentandel av likhet.

La oss deretter se på hva SearchInform (spesielt bedriftsversjonen SearchInform Corporate) tilbyr for å jobbe på et bedriftsnettverk. Det er to typer applikasjoner: serverside og brukerside. Serverdelen behandler uavhengig de angitte indeksene, og brukere kan bruke dem til søk, avhengig av tilgangsrettighetene som er tildelt dem. Brukere kan konfigureres automatisk ved hjelp av Windows-kontoer (i profesjonelle termer, SearchInform bruker NTFS Windows-autentisering) eller manuelt (brukere må legges til separat). Hver bruker kan tillates eller nektes tilgang til visse indekser, og brukere kan også kombineres i grupper. Generelt er SearchInforms innstillinger for arbeid på nettverket foran Google når det gjelder fleksibilitet, og Ishhound Server når det gjelder bekvemmelighet og enkelhet.

Offisiell side:
Distribusjonsstørrelse: 14,7 Mb Sammenligning av indekseringshastigheter

SøkesystemIndekseringstidIndeksstørrelse
Bloodhound Prof Deluxe 4.538 timer 46 minutter19 GB
Isys Desktop 7.06 timer 13 minutter7,9 GB
DtSearch 7.06 timer 3 minutter8,6 GB
Google Desktop Search Enterprise8 timer 17 minutter4,5 GB
Copernic Desktop Search *10 timer 51 minutter7 GB
SearchInform 1.5.023 timer 17 minutter4,4 GB

* De fleste documents.html og .txt som inneholder russisk tekst, var, selv om de var indeksert, umulig å finne unntatt ved navn.

Alle programmer er verdt oppmerksomhet.

Basert på tester og en nøye undersøkelse av hvert program presentert i gjennomgangen, kan visse konklusjoner trekkes. Så Google Desktop Search Copernic Desktop Search er ganske egnet for den uerfarne brukeren som et hjemmeinformasjonssøkesystem. De takler enkle spørsmål godt, overbelaster ikke brukeren med innstillinger og er dessuten helt gratis. Googles forsøk på å komme inn på bedriftens søkemotormarked er ennå ikke særlig berettiget: For at det skal fungere ordentlig, må programmet utstyres med tilleggsmoduler, og det er langt fra enkelt å sette opp. Derfor reserverer de selvforklarende navnene Desktop Search, Copernic og Google bak seg nisjen med "desktop" søkemotorer.

Riktignok kraftigere løsninger - dtSearch, iSYS og SearchInform er heller ikke idiotsikre og tilbyr brukerne deres "desktop"-versjoner. Men til en rimelig pris, i motsetning til gratis programvare fra Google og Copernic. Du må selvfølgelig betale for kraft, hastighet og funksjonalitet. Men hovedfokuset til utviklerne av dtSearch, iSYS og SearchInform er selvfølgelig på bedriftssektoren. Nettverk, funksjonalitet, indeksering og søkehastighet er det som skiller disse produktene fra deres "konkurrenter". Basert på testresultatene ble favoritten identifisert - SearchInform. Programmet gir muligheten til å søke etter lignende dokumenter, har den raskeste indekserings- og søkehastigheten, og har et godt sett med funksjoner.

05/10/2016

FileSeek er et nyttig verktøy som lar mange brukere enkelt finne filene de trenger på harddisken. Det multifunksjonelle programmet er i stand til å finne data ved hjelp av ulike filtre. Oppsett av prosedyren er rask og krever ikke spesiell oppmerksomhet. Brukeren kan tilpasse søkeparametrene for å passe deres behov. FileSeek er veldig rask og skanner hundrevis av filer. Sammen med resultatet vises filstørrelse, linjenummer, dato for siste endring og dokumentnavn. Du kan også opprette, administrere og synkronisere flere profiler for forskjellige prosjekter. Det er mulig å bytte til et annet språk...

30/03/2016

Copernic Desktop Search er et praktisk program for å søke etter mangfoldig informasjon. Gjennom programmet vil brukere på forskjellige nivåer finne e-postmeldinger, vedlagte filer og andre dokumenter. Et enkelt grensesnitt hjelper brukeren med å finne filer med formater som doc, docx, pdf, xlsx og andre. Du kan finne musikkfiler, grafikk, bilder og videoer. Fordelene med applikasjonen inkluderer den lille størrelsen på applikasjonen og dens minimale belastning på datamaskinen. Programmet bruker prosessorressurser, diskplass og RAM. Copernic Desktop Search (CDS) inneholder en rekke filtre.

21/10/2015

NeoSearch er en av de mest praktiske applikasjonene designet for å søke etter dataene brukeren trenger på en datamaskin. Programmet har et praktisk, forståelig, stilig brukergrensesnitt. Den har en rekke enkle funksjoner som selv en nybegynner enkelt kan håndtere. Etter installasjon av programmet starter filindeksering. neoSearch sjekker statusen til alle filene som er på datamaskinen i det øyeblikket. Hele denne prosessen tar minimal tid. En spesialisert skala informerer deg om fremdriften til søknaden. Etterpå vises søkeresultatene på skjermen samtidig i form av fire dokumenter, som er maks...

01/12/2014

Wise JetSearch er et program som gir et direkte søk etter ulike filer eller mapper som ligger innenfor ulike lokale stasjoner på en personlig datamaskin eller på flyttbare bærbare lagringsmedier. Denne programvaren erstatter med fordel standard filsøkemodell innebygd i operativsystemet. Den kan fungere med NTFS- og FAT-stasjoner; data søkes ved hjelp av en brukerspesifisert mal, navn eller andre individuelle spesifikke parametere. Algoritmen for å jobbe med Wise JetSearch-programmet er ganske enkel: skriv inn nøkkelord, velg en stasjon, start søk...

29/09/2014

FileSearchy - laget for å forenkle søket etter filer på datamaskinen din. I motsetning til andre søkeprogrammer, søker dette programmet etter navn i sanntid. Programmet lar deg også søke i innholdet i filer som doc og pdf, og hvis det finner det, så fremhever det funnet teksten. FileSearchy finner umiddelbart filene du trenger etter navn. Selve programmet støtter faner, som vil tillate flere søk i forskjellige faner, som kan justeres på slutten. Støtter søk etter dato, filstørrelse og registeroppføringer. Det er mulig å søke etter flere linjer samt ekskludere linjer som ikke skal være...

05/09/2014

SoftPerfect Network Search Engine (NSE) er et program som er nyttig for raskt å søke etter delte filer på et lokalt nettverk. Den indekserer og ordner filer slik at med riktig forespørsel vil enhver bruker med tilgang til et gitt lokalt nettverk finne ønsket fil i løpet av få sekunder. Nettverksadministratoren har mange muligheter, fordi programmet har et bredt utvalg av nyttige funksjoner som utvilsomt vil komme godt med under arbeidet. For eksempel funksjonen til selektiv indeksering av filer og mapper. Installering og konfigurering av programmet vil ikke ta mye tid, siden det ikke er komplisert, vil det være nok å kopiere noen få filer til mappen med...