Arbete av sökmotorer: allmänna principer för sökmotorer. Hur söksystem fungerar - snippets, omvänd sökalgoritm, sidindexering och funktioner i Yandex Work-princip för sökmotorn

God dag, kära läsare av min VD-blogg . Den här artikeln handlar om hur söksystem yandex som den använder teknik och algoritmer för ranking webbplatser, vilket gör att förbereda svaret på användarna. Många vet att det här flaggskeppet av den ryska sökningen ställer in tonen i Renhet, äger den största databasen i Eurasien, arbetar med innehållet på mer än en miljard sidor, känner till svaret på någon fråga. Enligt LiveInternet för augusti 2012 är andelen Yandex i Ryssland 60,5%. Den månatliga publiken i portalen är 48,9 miljoner människor. Men viktigast av allt, för oss, bloggare i hur sökmotorn tar emot våra önskemål, hur de bearbetas och vilket resultat erhålls vid utgången. Å ena sidan, att veta och förstå denna information är det lättare för oss att använda alla resurser i Yandex, å andra sidan - det är lättare att marknadsföra våra bloggar. Därför föreslår jag med mig att se den viktigaste tekniken för den bästa sökmotorns rinnande.

När Internet-användaren först vill söka information om sökmotorn kan det ha en fråga: "Hur är sökningen?" Men när han får det, förändras ofta denna fråga till en annan: "Varför så fort?" Och i själva verket, varför sökandet efter en fil på datorn tar 20 sekunder, och resultatet av frågan från hela nätverket av datorer runt om i världen visas efter en sekund? Det mest intressanta är att de två första frågorna (som en sökning och varför 1 sekund) kan vara i ett svar - sökmotorn har förberett i förväg till användarens begäran.

För att förstå principen om Yandexs funktion, som en annan sökmotor, kommer vi att dra en analogi med telefonkatalogen. För att hitta ett telefonnummer måste du veta abonnentens efternamn och alla sökningar tar i det här fallet högst en minut, eftersom alla katalogsidor är en fast alfabetisk pekare. Men föreställ dig om sökningen följdes av ett annat alternativ, där telefonnummer skulle beställas av siffrorna själva. Efter sådana sökningar som redan är försenade under en längre tid kommer siffrorna innan sökarna fortfarande vara mycket långa. 🙂

Så sökmotorn bestämmer all information från Internet i ett formulär som är praktiskt för det. Och viktigast av allt, alla dessa data läggs i förväg till sin katalog innan besökaren kommer med sina önskemål. Det är, när vi frågar Yandex en fråga, vet han redan vårt svar. Och ger oss det över en sekund. Men denna sekund innehåller ett antal viktiga processer som vi nu kommer att överväga i detalj.

Internetindexering

Yandex RU samlar all information på Internet, som kan nå. Med hjälp av specialutrustning ses hela innehållet, inklusive bilder på visuella parametrar. Engagerade i en sådan samling av sökmotorn, och processen att samla och förbereda data kallas indexering. Grunden för en sådan maskin innehåller ett datorsystem som är annorlunda i sökroboten. Det kringgår regelbundet indexerade webbplatser, kontrollerar dem för nytt innehåll och skannar också Internet på jakt efter fjärrsidor. Om det upptäcker att någon sådan sida inte längre existerar eller stängs från indexering, tar den bort det från sökningen.

Hur hittar sökroboten nya webbplatser? Först tack till länkar från andra webbplatser. För om en länk från en redan indexerad webbplats sätts på en ny webresurs, kommer roboten att gå till nästa gång du besöker den andra. För det andra, i webbansvarig av sökmotorn Yandex finns det en underbar service, folket kallade "Adduce" (från fraser på engelska -Addurl - lägg till adress). Det är möjligt att göra adressen till din nya webbplats, som efter ett tag kommer att besöka sökroboten. För det tredje, med hjälp av det speciella programmet "Yandex.Bar", ett besök på användare som använder det spåras. Följaktligen, om en person kom på en ny webresurs, visas en robot där snart.

Kommer alla sidor in i sökningen? Miljontals sidor är indexerade varje dag. Bland dem är sidor av olika kvalitet, där olika uppgifter kan innehålla - från unikt innehåll till fast sopor. Dessutom, som statistik säger, är sopor på Internet mycket mer. Varje dokument sökrobotanalyser med speciella algoritmer. Det bestämmer om han har någon användbar information om han kan svara på användarens begäran. Om inte, då tar sådana sidor inte "i astronauterna", om så är fallet ingår i sökningen.

Efter att roboten besökte sidan och bestämde sitt verktyg, visas den i sökmotorns lagring. Här är analysen av något dokument till själva grunderna, eftersom mästarna i Auto Center säger - till skruvarna. Sidan rensas av HTML-markup, ren text passerar en komplett inventering - platsen för varje ord beräknas. I en sådan demonterad form blir sidan till ett bord med siffror och bokstäver, vilket kallas ett index annorlunda. Nu, så att det inte händer med webbresursen, som innehåller den här sidan, är den senaste kopian alltid i sökningen. Även om webbplatsen inte längre existerar, lagras fortfarande av sina dokument på Internet.

Varje index tillsammans med data om typer av dokument, kodning, språk, tillsammans med kopior, är sökbas . Det är periodiskt uppdaterat, därför är det på speciella servrar, med vilka sökmotorns användarförfrågningar hanterar.

Hur ofta uppstår indexeringsprocessen? Först av allt beror det på typerna av platser. Den första typen av web resurs ändrar ofta innehållet på dess sidor. Det är, när en sökrobot kommer till dessa sidor varje gång, innehåller de ett annat innehåll varje gång. För dem kommer ingenting nästa gång inte hittas, så sådana webbplatser ingår inte i indexet. Den andra typen av webbplatser - datalager, på sidorna av vilka regelbundet läggs till länkar till dokument för nedladdning. Innehållet på den här webbplatsen ändras vanligtvis inte, så hans robot besöker extremt sällan. Andra platser beror på frekvensen av materialuppdateringen. Detta hänvisar till följande - desto snabbare Det nya innehållet visas på webbplatsen, desto oftare kommer sökroboten. Och prioriteringen ges främst de viktigaste webbresurserna (nyhetsplatsen är en storleksordning viktigare än någon blogg, till exempel).

Indexering gör att du kan utföra den första sökmotornsfunktionen - samla in information om nya sidor på Internet. Men Yandex har den andra funktionen - sök efter ett svar på användarens begäran i den sökta basen som redan är förberedd.

Yandex förbereder svaret

Bearbetningsprocessen för begäran och utfärdande av relevanta svar är engagerade datorsystem "metapoisk" . För sitt arbete samlar hon först till alla introduktionsinformation: från vilken region en begäran gjordes, till vilken klass den anser, finns det några fel i begäran, etc. Efter en sådan bearbetning kontrollerar metapoisk om det finns exakt samma förfrågningar med samma parametrar i databasen. Om svaret är positivt visar systemet användaren i förväg sparade resultat. Om det inte finns någon sådan fråga i databasen hänvisar metapoisken till sökbasen som innehåller indexdata.

Och här finns det fantastiska saker. Föreställ dig att det finns en super kraftfull dator som håller hela Internet bearbetad av sökrobotar. Användaren anger begäran och i minnesceller börjar sökandet efter alla dokument som är inblandade i frågan. Svaret finns och alla är nöjda. Men ta ett annat fall när det finns många önskemål som innehåller identiska ord i din kropp. Systemet måste gå igenom samma minnesceller varje gång, vilket kan öka tiden för databehandling ibland. Följaktligen ökar tiden, vilket kan leda till användarförlust - det kommer att bli ombedd att hjälpa till med en annan sökmotor.

Så att det inte finns några sådana förseningar, distribueras alla kopior i sajtindexet via olika datorer. Efter att ha skickat en förfrågan, ger Metapoisk kommandot till sådana servrar för att söka efter din bit med text. Därefter återvänder alla data från dessa maskiner till den centrala datorn, det kombinerar alla de erhållna resultaten och ger användaren de första tio av de bästa svaren. Med en sådan teknik dödas två hare omedelbart: söktiden reduceras flera gånger (svaret är per aktie på en sekund) och tack vare ökningen av plattformarna är information duplicerad (data är inte förlorade på grund av plötsliga uppdelningar) . Datorer med dubblettinformation utgör datacenteret - det här är ett rum med servrar.

När sökmotorns användare sätter sin begäran, i 20 fall av 100, erhålls tvetydiga mål i frågan. Till exempel, om han skriver i söksträngen, är ordet "Napoleon" ännu inte känt vad svaret är - receptet på kakan eller den stora kommissionsledamotens biografi. Eller frasen "Brothers Grimm" - sagor, filmer, musikband. Till en sådan möjlig fan av mål att begränsa specifika svar i Yandex finns det speciell teknik Spektrum. Det tar hänsyn till användarnas behov med hjälp av statistik för sökfrågor. Av alla de frågor som anges i Yandex besökare allokerar spektret olika föremål i dem (namn på personer, böcker, modeller, modeller, etc.) Dessa objekt distribueras i vissa kategorier. Hittills har sådana kategorier mer än 60 år. Med hjälp av dem har sökmotorn olika ord av ord i sin databas i användarförfrågningar. Intressant är dessa kategorier kontrollerade periodiskt (analysen sker ett par gånger i veckan), vilket gör det möjligt för Yandex att mer exakt ge svar på frågorna.

På grundval av teknik organiserade Yandex Spectrum dialogtips. De visas under söksträngen där användaren ringer sin tvetydiga förfrågan. Denna linje återspeglar de kategorier som objektobjektet kan relatera. Ytterligare sökresultat beror på användarvalet av en sådan kategori.

Från 15 till 30% av alla användare av Yandex-sökmotorn önskar endast lokal information (data i den region där de bor). Till exempel, om nya filmer i biograferna i din stad. Därför bör svaret på en sådan begäran vara annorlunda för varje region. I detta avseende använder Yandex sin teknik sök efter regioner . Till exempel kan sådana svar få invånare som letar efter en repertoar av filmer i deras oktober-biograf:

Men ett sådant resultat kommer att få invånare i Stavropols stad på samma begäran:

Användarregionen bestäms främst av sin IP-adress. Ibland är dessa data inte korrekta, eftersom ett antal leverantörer omedelbart kan arbeta i flera regioner och därför ändra IP-adresser till användare. I princip, om det händer med dig, kan du enkelt ändra din region i sökmotorns inställningar. Det anges i det övre högra hörnet på resultatsidan. Du kan ändra den.

Sökmotor Yandex RU - Response Resultat

När metapoisken förberedde svaret måste Yandex-sökmotorn ge den på sidan med resultaten. Det är en lista över referenser till hittade dokument med liten information om var och en. Uppgiften med tekniken för utfärdande av resultat är att mer informativt ge användaren de mest relevanta svaren. Mallen på en sådan länk ser ut så här:

Tänk på denna form av resultatet mer detaljerat. För Sökresultatrubrik Yandex använder ofta titelnamnet på sidan (det faktum att optimeringsmedel är ordinerade i titel tagg). Om det inte är, så visas ord från titeln på artikeln eller posten här. Om texten på rubriken är stor, sätter sökmotorn sitt fragment i det här fältet, vilket är mest relevant för den angivna frågan.

Det är mycket sällsynt, men det händer att titeln inte motsvarar innehållet i begäran. I det här fallet genererar Yandex sitt sökresultatrubrik med texten i artikeln eller posten. Han kommer definitivt att ha ett frågeord.

För snippeet Sökmotorn använder hela texten på sidan. Hon väljer alla fragment där svaret är närvarande för begäran, och väljer sedan det mest relevanta av dem och sätter in en länk till dokumentet till dokumentet. Tack vare detta tillvägagångssätt kan den kompetenta optimiseraren remake det efter det som har sett snippet, vilket förbättrar referensens attraktivitet.

För bättre prestationsuppfattning är användarens begäran, rubrikerna uppdragna som referenser i texten (markerar i blått med tonvikt). För attraktiviteten hos webbresursen och dess erkännande läggs Favon - en liten märkesplatsikon. Det verkar till vänster om texten i första raden före titeln. Alla ord som inkluderades i svarförfrågan är också markerade med fetstil för bekvämligheten med uppfattning.

Nyligen, i ett snippet, lägger Yandex-sökmotorn olika uppgifter som hjälper användaren ännu snabbare och mer exakt att hitta sitt svar. Om användaren till exempel skriver namnet på någon organisation i sin begäran, kommer Yandex att lägga till adress, kontakttelefoner och hänvisning till platsen i geografiska kartor. Om sökmotorn är bekant till webbplatsens struktur, där det finns ett dokument med svaret för användaren, kommer det definitivt att visa det. Dessutom kan Yandex omedelbart lägga till ett snippet av de mest besökta sidorna i en sådan webbresurs så att besökaren om så önskas kan omedelbart gå till det avsnitt du behöver, spara sin tid.

Det finns snippeter som innehåller ett värde av någon produkt för en webbutik, ett hotellbetyg eller en restaurang i form av stjärnor, annan intressant information med olika nummer om objekt i sökdokument. Uppgiften för sådan information är att ge en fullständig förteckning över uppgifter om de ämnen eller föremål som är intresserade av användaren.

I allmänhet, med olika exempel, kommer sidan med svaren att se ut så här:

Ranking och spår

Yandex-uppgiften innehåller inte bara sökandet efter alla möjliga svar, men också urval av det bästa (relevanta). När allt kommer omkring kommer inte användaren att bli rummaged i alla länkar som den kommer att tillhandahållas som ett resultat av Yandex-sökningen. Processen med att beställa sökresultat kallas rangordning . Det är det är ranking som bestämmer kvaliteten på de erbjudna svaren.

Det finns regler för vilka Yandex definierar relevanta sidor:

sänkning i positioner på sidan med resultat väntar på webbplatser som förvärrar sökkvaliteten. Vanligtvis är dessa sådana webbresurser vars ägare försöker lura sökmotorn. Till exempel är dessa platser med sidor som är meningslösa eller osynliga text. Självklart är han synlig och förstås av sökroboten, men inte en besökare som läser detta dokument. Eller platser, som när du byter till länken i utgivningszonen omedelbart översätter användaren till en annan webbplats.
de faller inte in i utfärdandet av resultat eller starkt minskning av ranking webbplatser som innehåller erotiskt innehåll. Detta beror på det faktum att sådana webbresurser ofta använder aggressiva kampanjmetoder.
webbplatser infekterade med virus är inte reducerade i utlämning och är inte uteslutna från sökresultaten - i det här fallet är användaren informerad om faran med en speciell ikon. Detta beror på det faktum att Yandex föreslår att sådana webbresurser kan innehålla viktiga dokument på begäran från sökmotorns besökare.

Till exempel kommer Yandex-webbplatser att rankas på begäran "Apple":

Förutom rankningsfaktorerna använder Yandex speciella prover med förfrågningar och svar på dem, vilka användare av sökmotorn anses vara mest lämpliga. Sådana prover ingen bil kan göra just nu - det här är en persons prerogativ. I Yandex kallas sådana experter assistent . Deras uppgift innehåller en fullständig analys av alla sökdokument och utvärdering av svar på de angivna förfrågningarna. De väljer de bästa svaren och utgör ett speciellt träningsprov. I det ser sökmotorn förhållandet mellan relevanta sidor och deras egenskaper. Att ha sådan information kan Yandex välja för varje begäran en optimal rankningsformel. Metoden för att konstruera en sådan formel kallas matrisNet. Plus detta system är att det är resistent mot omskolning, vilket gör det möjligt att ta hänsyn till ett stort antal rankingfaktorer, utan att öka antalet onödiga uppskattningar och mönster.

I slutet av mitt inlägg vill jag visa dig intressant statistik som samlats in av Yandex-sökmotorn i arbetet med ditt arbete.

1. Populariteten av personliga namn i Ryssland och ryska städer (Data tas från bloggare och sociala nätverk användare i mars 2012).

2. Statistik med olika typer av intressen.

Mitt inlägg om hur Yandex-sökmotorn är klar.

År 1863 skapade den stora författaren Jules Verne en annan Paris under det tjugonde århundradet. I det beskrivs han i detalj tunnelbanan, bil, elektrisk stol, dator och till och med internet. Utgivaren vägrade dock att skriva ut boken och hon låg i mer än 120 år tills hon hittades av Jules Verne farfar 1989. Publicerad var en bok 1994.

Sökmotor eller helt enkelt "sökmotor" är att söka efter online sidor i enlighet med användarens begäran. Den mest kända sökmotorn i världen är Google, den mest populära i Ryssland - Yandex, och en av de äldsta sökmotorerna är Yahoo. I sökmotorns arkitektur kan du allokera sökmotor - kärnan i systemet som representeras av en uppsättning mjukvarumoduler; Databas eller indexlagra information om all den välkända sökmotorn för internetresurser; och en uppsättning webbplatser som är inträde Användare (www.google.com, www.yandex.ru, ru.yahoo.com, etc.). Allt detta motsvarar den klassiska tre nivåer informationssystemarkitekturen: det finns ett användargränssnitt, företagslogik, som i det här fallet är representerat av genomförandet av sökalgoritmer och databas.

Specificitetssökning på nätet

Vid första anblicken är sökningen på Internet inte mycket annorlunda än den vanliga informationssökningen, till exempel, från behandling till databasen eller från filsökningsuppgiften. Så de ansåg utvecklarna av de första sökmotorerna på Internet, men över tiden insåg de att de misstog ...

Den första skillnaden i internetsökningen från det vanliga är att sökalgoritmen för samma databas förutsätter att dess struktur är känd i förväg av sökmotorn och författaren. På Internet, av uppenbara skäl, det är det inte. Internet sidor bildar inte strukturen i katalogen, men nätverket, som också påverkar sökalgoritmerna och det dataformat som publiceras på Internet-resurserna, styrs inte av någon.

Den andra skillnaden, som en av konsekvenserna av det första är att begäran inte presenteras i form av en uppsättning parametervärden (sökkriterier) och i form av text som skrivs av människan på ett naturligt språk för honom . Således, innan du börjar söka, behöver du fortfarande förstå vad författaren till begäran vill ha. Jag noterar, för att inte förstå någon annan person, utan en datormaskin.

Den tredje skillnaden är redan mindre uppenbar, men inte mindre grundläggande: I katalogen eller databasen är alla element lika. Det finns en tävling på Internet, och följaktligen divisionen på mer "pålitliga leverantörer av information" och källor nära statusen för "informationsmusor". Så klassresurser människor, och inkluderar även sökmotorer.

Och i slutsats bör det läggas till att sökområdet är miljarder sidor, flera kilobytes och mer vardera. Om ett tält av miljontals sidor läggs till dagligen och uppdateras så mycket. Allt detta är representerat av olika digitala format. Tyvärr tillåter inte ens moderna tekniker och resurser som är tillgängliga till marknadsledare på Internet inte att hantera all den här sorten "på flugan" och i sin helhet.

Vad är sökmotorn

Först och främst är det viktigt att inse en annan och förmodligen den mest signifikanta skillnaden mellan sökmotorns arbete på Internet och arbetet med något annat informationssystem som utövar i olika typer av kataloger och databaser. Sökmotorn söker inte information bland vad som finns på Internet vid mottagandet av begäran, och försöker skapa ett svar på grundval av din egen informationslagring - databas som heter indexet, där den lagrar en dokumentation till alla Känd för det och uppdaterar det periodiskt. Med andra ord fungerar sökmotorn inte med originalet, men med projektionsområdet med tillåtna sökvärden. Alla de senaste ändringarna på Internet kan återspeglas i sökresultaten först efter att de aktuella sidorna kommer att vara index - Tillagd till sökmotorns index. Så, sökmotorn i den första approximationen består av en sökmotor, databas eller index (index) och inloggningspunkter.

Nu kort om vad sökmotorn består av:

Spindel eller spindel (spindel). En applikation som är engagerad i nedladdning av webbplatser för Internetresurser. Ingenstans spindeln kommer inte att "krypa" - det begär bara innehållet på sidorna på samma sätt som den vanliga webbläsaren gör och skickar en förfrågan till HTTP-servern och får ett svar från det. Efter innehållet på den nedladdade sidan skickas den till indexer och sökrobot, som beskrivs nedan.

Indexer (indexer). Indexern genererar initial analys av innehållet på den nedladdade sidan, fördelar huvuddelarna (sidnamn, beskrivning, länkar, rubriker etc.) och avkallar allt detta med sektionerna av sökdatabasen - platser i sökmotorindexet. Denna process kallas indexering av internetresurserHärifrån och namnet på delsystemet självt. Baserat på resultaten av den ursprungliga analysen kan indexern också bestämma att sidan i allmänhet är "ovärderlig" att vara i indexet. Skälen till en sådan lösning kan vara annorlunda: Sidan har inget namn, är en exakt kopia av den andra som redan är tillgängliga i indexet på sidan eller innehåller referenser till resurser som förbjuds enligt lag.

Crawler. Detta "djur" är utformat för att "crawl" av länkar som finns på en spindelsida. Kryparen analyserar banorna som leder från den aktuella sidan till andra delar av webbplatsen, eller på sidan av externa Internetresurser och bestämmer det ytterligare proceduren för att kringgå spindeln av trådens tråd. Det var Krauller som hittar nya för sökmotorns sida och överför dem till spindel. Kryparens arbete är byggt på grundval av sökalgoritmer på kolumner i bredd och djup.

Sökmotor och resultatmotor). Den viktigaste delen av någon sökmotor. Algoritmerna i företagets delsystemutvecklare lagras i strikt sekretess, eftersom de är en kommersiell hemlighet. Det är den här delen av sökmotorn som är ansvarig för att sökmotorens svar på användarbegäran är tillräcklig. Här kan du välja två huvudkomponenter:
- Ranking delsystem. Ranging - Det här är sidor på webbplatser i enlighet med deras relevans för en specifik fråga. Belevans - Detta, i sin tur, graden av överensstämmelse med innehållet i sidans mening av frågan, och detta värde av sökmotorn bestämmer självständigt, baserat på det stora antalet parametrar. Ranking - Detta är den mest mystiska och kontroversiella delen av sökmotorns "konstgjorda intelligens". På sidan av sidan, utöver dess struktur och innehåll (innehåll), påverkar också: antalet och kvaliteten på länkar som leder till den här sidan från andra webbplatser; Åldern för själva platsens webbplats; Naturen av användarens beteende tittar genom sidan och många andra faktorer.
- Delsystem för utfärdande av resultat. Uppgiften för detta delsystem innehåller en tolkning av en användarfrågan, dess översättning till språket av strukturerade förfrågningar till indexet och bildandet av sökresultatssidorna. Förutom att analysera texten i frågan kan sökmotorn också ta hänsyn till:
  - Begära sammanhang, Formbar baserat på betydelsen av tidigare genomförda förfrågningar. Till exempel, om användaren ofta besöker webbplatser på bilteman, vill han förmodligen få information om dessa märken i ordet "VOLGA" eller "OKA", och inte om var ryssarna med samma namn börjar floder. Det kallas personlig sökningNär man utfärdar en och samma begäran om olika användare är det betydligt annorlunda.
  - Anpassade inställningarsom hon (sökmotor) kan "gissa" analysera användarnas valda länkar på sökresultatsidor. Detta är ett annat sätt att justera sammanhanget på begäran: användaren med sina handlingar som om han berättar för bilen, vad han ville hitta. Som regel försöker sökmotorer i sökresultaten lägga till sidor, relevant förfrågan, men relaterade till ganska olika livsområden. Antag att användaren är intresserad av filmer och väljer därför ofta länkar till sidor med meddelanden från Kinonovinki, även om dessa sidor inte är riktigt relevanta för den ursprungliga frågan. När du bildar ett svar på nästa begäran kan systemet föredra sidor med en beskrivning av filmer, i namnet är ord från frågans text.
  - OmrådeDet är mycket viktigt när man behandlar kommersiella förfrågningar relaterade till förvärv av varor och tjänster från lokala leverantörer. Om du är intresserad av försäljning och rabatter och är i Moskva, så är du sannolikt inte alls intressant, vilka aktier som hålls på detta ämne i St Petersburg, om du inte har angett detta uttryckligen i frågans text. Först och främst bör information om försäljning i Moskva visas i sökresultaten. Således delar moderna sökmotorer förfrågningar om geospendent och geonberoende. Mest sannolikt, om sökmotorn bestämmer att din förfrågan är geoberoende, lägger den automatiskt till ett tecken på en region som försöker bestämma informationen om din Internetleverantör.
  - Tid. Ibland måste sökmotorer analyseras när händelserna som beskrivs på sidan har inträffat. När allt kommer omkring är informationen ständigt föråldrad, och användaren behöver först och främst länkar till de senaste nyheterna, aktuella prognoser och meddelanden om händelser som ännu inte har slutfört eller borde komma i framtiden. Det är underförstått att sidens relevans beror på tid och jämför det med det ögonblick som förfrågan också kräver sökmotorn för komplexet av intelligens.
  Därefter letar sökmotorn efter det närmaste i mening nyckelförfrågan I indexet och formulärresultat, sortering av referenser i fallande ordning av deras relevans. Varje nyckelfråga i indexet motsvarar en separat sidor som är relevant för honom. Inte för varje kombination av bokstäver och siffror startar systemet en ny nyckelfråga och gör det på grundval av frekvensanalysen av vissa användarförfrågningar. Sökmotorn kan också blanda betygen från olika nyckelfrågor i sökresultaten, om den anser att det är nödvändigt för användaren.

Allmänna principer för sökmotorn

Det är nödvändigt att förstå att söktjänsterna på Internet är ett mycket mycket lönsamt företag. I detaljerna, på grund av vilka företag som Google och Yandex inte kan gå in, eftersom huvuddelen av deras vinster är deras inkomst från kontextuell reklam. Och när sökningen på Internet är extremt lönsamt, är konkurrensen bland sådana företag mycket allvarlig. Vad bestämmer konkurrenskraften på online-sökmarknaden? Svaret är kvaliteten på sökmotorn. Det är logiskt att ju högre det är, desto mer nya användare visas i systemet, och desto mer värdefullt på sidorna i den här frågan om den kontextuella annonseringen. Sökmotorutvecklare spenderar stora ansträngningar som syftar till att "rengöra" resultaten av deras sökresultat från olika typer av informationsskräp, kallad spam (spam). Mer detaljerat om hur detta är gjort, kommer att få veta i en separat artikel, och här kommer jag att ge de allmänna principerna om sökmotorns beteende, formulerad i form av slutsatser under det ovanstående.

Sökmotorn som representeras av sina spindlar och sökroboten skannar ständigt på internet för utseende av nya och uppdateringar av befintliga sidor, eftersom irrelevant information uppskattas nedan.

Sökmotorn uppdaterar regelbundet rankningen av resurser av deras relevans för nyckelfrågor, eftersom nya sidor ständigt visas i indexet. Denna process heter Update (Update) sökresultat.

På grund av stora mängder information som publiceras i den globala webben och de begränsade resurserna i sökmotorn, försöker sökmotorn alltid att ladda upp den mest (i sin åsikt) nödvändig. I hennes arsenal finns det alla typer av filter som skär ner mycket onödigt redan vid indexeringssteget eller kasta bort spam från indexet baserat på resultaten av sökresultaten.

Moderna sökmotorer under sökanalysen försöker inte bara ta hänsyn till texten till den mest begärda själva, utan också dess miljö: användarens sammanhang och preferenser, som tidigare sagt, såväl som begäranstid, region och mycket mer.

Inte bara de interna parametrarna (struktur, innehåll), men även externa parametrar, till exempel länkar till sidan från andra webbplatser och användarens beteende, påverkar relevansen av en specifik sida.

Arbetet med sökmotorer förbättras ständigt. Det ideala arbetet i sökmotorn (för en person) är endast möjligt om alla lösningar om indexering och rankning kommer att ta en provision bestående av ett stort antal specialister på alla områden och anvisningar för mänsklig verksamhet. Eftersom detta är orealistiskt, ersätter kommissionen expertsystem, heuristiska sökalgoritmer och andra delar av artificiell intelligens. Förmodligen kan arbetet med alla dessa delsystem också ge mer adekvata resultat om det var möjligt att bearbeta absolut alla data tillgängliga på Internet, men det är praktiskt taget omöjligt. Imperfekt artificiell intelligens och begränsade resurser - två huvudorsaker till det faktum att resultaten av sökresultaten inte alltid vänligen användar, men allt detta behandlas. För idag är enligt min mening att arbetet med de mest kända och stora sökmotorerna är ganska förenlig med sina användares behov och förväntningar.

Hej, kära läsare!

Sökmotorerna i världen internetutrymme är för närvarande ganska mycket. Var och en av dem har sina egna algoritmerindexerings- och rankningsplatser, men i allmänhet är principen om sökmotorer ganska lika.

Kunskap om hur sökmotorn arbetar med förhållanden med snabbt växande konkurrens är en stor fördel för att främja inte bara kommersiella, men även informationsplatser och bloggar. Dessa kunskaper hjälper till att bygga en effektiv platsoptimeringsstrategi och med mindre ansträngning att komma in i den främsta utfärdandet i kampanjgrupper.

Principer för sökmotorer

Betydelsen av optimeringens arbete är att "skapa" de framväxande sidorna för sökalgoritmer och därmed hjälpa dessa sidor att uppnå höga positioner på vissa förfrågningar. Men innan du börjar arbeta med optimering av webbplatsen eller bloggen är det nödvändigt att åtminstone ytligt förstå funktionerna hos sökmotorerna för att förstå hur de kan reagera på Action Optimizer.

Naturligtvis är detaljerade detaljer om sökresultatformationsformationen den information som sökmotorer inte avslöjas. Men för de korrekta ansträngningarna att hitta tillräcklig förståelse för de viktigaste principerna om vilka sökmotorer fungerar.

Informationssökningsmetoder

De två huvudmetoder som används idag av sökmotorer särskiljs av sökriktningen.

Direkt sökalgoritmDet som inbegriper kartläggning till var och en av de dokument som är lagrade i sökmotorns databas, är nyckelfrasen (användarförfrågan) en ganska tillförlitlig metod som låter dig hitta all nödvändig information. Nackdelen med denna metod är att när man söker i stora datarrayer är den tid som krävs för att hitta ett svar ganska stort.
Algoritm av omvända indexNär en nyckelfras jämförs med en lista över dokument där den är närvarande är det lämpligt när du interagerar med databaser som innehåller tiotals och hundratals miljoner sidor. Med detta tillvägagångssätt görs sökningen inte på alla dokument, men endast på speciella filer, inklusive listor med ord som finns på sidorna på webbplatser. Varje ord i en liknande lista åtföljs av en indikation på koordinaterna för positioner där det uppstår och andra parametrar. Det är den här metoden som gäller idag i arbetet med så kända sökmotorer som Yandex och Google.

Det bör noteras här att när du öppnar användaren till sökfältet i webbläsaren görs sökningen inte direkt på Internet, men i förmonterade, lagrade och aktuella databaser som innehåller den information som behandlas av sökmotorer (webbplatssidor) . Snabbformation av sökresultat kan bero på omvända index.

Textinnehållet på sidorna (direkta index) med sökmotorer sparas och används också när den automatiskt bildas från den lämpligaste begäran om textfragment.

Matematisk ranking modell

För att påskynda sökningen och förenkla processen att bilda utfärdandet, tillämpas den mest svarande användarbegäran, en viss matematisk modell. Uppgiften med denna matematiska modell är att hitta de önskade sidorna vid den omvända indexbasen, bedömning av deras överensstämmelse med frågan och distributionen i fallande ordning med relevans.

Att hitta den önskade frasen på sidan är inte tillräckligt. När du definierar sökmotorer beräknas beräkningen av dokumentets vikt om användarförfrågan. För varje förfrågan beräknas denna parameter baserat på följande data: användningsfrekvensen på den analys som analyseras och koefficienten som återspeglar hur sällan samma ord finns i andra dokument i sökmotorns databas. Produkten av dessa två värden och motsvarar dokumentets vikt.

Naturligtvis är algoritmen som presenteras mycket förenklad, eftersom det finns ett antal andra ytterligare koefficienter som används i beräkningarna till avyttring av sökmotorer, men det förändras inte från detta. Ju oftare ett separat ord från användarens begäran finns i vilket dokument som helst, ju högre vikten av den senare. Samtidigt erkänns sidinnehållet på sidan som spammning om vissa gränser överskrids, vilka är olika för varje förfrågan.

Grundläggande sökmotorfunktioner

Alla befintliga söksystem uppmanas att utföra flera viktiga funktioner: Sök efter information, indexering, en kvalitativ bedömning, korrekt rankning och bildning av sökresultat. Den prioriterade uppgiften för någon sökmotor är att ge användaren den information som han letar efter, som ett korrekt svar på en specifik begäran.

Eftersom de flesta av användarna inte har någon aning om hur sökmotorer arbetar på Internet och förmågan att utbilda användare av den "korrekta" sökningen är mycket begränsade (till exempel, sökips), är utvecklare tvungna att förbättra själva sökningen. Den senare innebär skapandet av algoritmer och principer för drift av sökmotorer som gör att du kan hitta den information som krävs, oavsett hur "korrekt" en sökfråga formuleras.

Läser in

Det spårar ändringar i redan indexerade dokument och sök efter nya sidor som kan representeras i resultaten av att utfärda användare att begära. Skanna resurser på internet sökmotorer utförs med hjälp av specialiserade program som heter spindlar eller sökrobotar.

Skanna internetresurser och datainsamling produceras automatiskt av sökrutor. Efter det första besöket på webbplatsen och sätt på det till sökdatabasen börjar robotarna regelbundet besöka den här sidan för att spåra och åtgärda de ändringar som hände i innehållet.

Eftersom antalet utvecklingsresurser på Internet är stort, och nya webbplatser visas dagligen, slutar den beskrivna processen inte i en minut. En sådan princip om drift av sökmotorer på Internet gör det möjligt för dem att alltid ha aktuell information om de webbplatser som finns tillgängliga på nätverket och deras innehåll.

Sökrobotens huvuduppgift är sökandet efter nya data och överföringen av sin sökmotor för vidare bearbetning.

Indexering

Sökmotorn kan bara hitta data på webbplatser som presenteras i sin databas - med andra ord indexerade. Vid det här steget måste sökmotorn bestämma om informationen som hittat information ska anges i databasen och, om du anger, i vilken av partitionerna. Denna process utförs också automatiskt.

Det antas att Google indexerar nästan all information som är tillgänglig i nätverket, Yandex till indexering av innehållet är lämpligt mer selektivt och inte så snabbt. Både sök Giants Runet arbetar till nytta av användaren, men de allmänna principerna för Google och Yandex-sökmotorns arbete är något annorlunda, eftersom de är baserade på det unika, vilket utgör varje system för mjukvarulösningar.

Allmänt för sökmotorsystem är att processen med att indexera alla nya resurser tar längre tid än indexeringen av det nya innehållet på de välkända systemsidorna. Informationen visas på platserna, förtroendet för sökmotorerna som högst faller i indexet är praktiskt taget omedelbart.

Ranging

Ranking är en bedömning av sökmotoralgoritmerna för betydelsen av indexerade data och bygga dem i enlighet med de faktorer som är karakteristiska för denna sökmotor. Den erhållna informationen behandlas för att bilda ett sökresultat över spektret av användarförfrågningar. Vilken typ av information kommer att presenteras i sökresultatet ovan, och hur lägre är fullständigt bestämd av hur den valda sökmotorn och dess algoritmer fungerar.

Webbplatser som finns i databasen av sökmotorn fördelas över ämnena och grupperna av förfrågningar. För varje frågegrupp bildas en preliminär utfärdande utsättning för ytterligare justering. Positioner för de flesta webbplatser ändras efter varje uppdatering av utfärdande - ranking uppdateringar, som Google inträffar dagligen, i sökandet efter Yandex - en gång några dagar.

Man som assistent i kampen för kvaliteten på utfärdandet

Verkligheten är att även de mest avancerade söksystemen, som Yandex och Google, behöver fortfarande hjälpa en person att bilda en utfärdande som uppfyller de antagna kvalitetsnormerna. Om sökalgoritmen inte är välutlösad, justeras resultaten manuellt - genom att bedöma innehållet på sidan på ett flertal kriterier.

Den många armén av specialutbildade människor från olika länder - moderatorer (bedömare) av sökmotorer - du måste utföra mycket arbete med att kontrollera att webbplatssidor överensstämmer med användarförfrågningar, filtrering utfärdande från spam och förbjudet innehåll (texter, bilder, video). Med bedömarens arbete kan du göra en utfärdande renare och bidra till den fortsatta utvecklingen av självlärande sökalgoritmer.

Slutsats

Med utvecklingen av Internet och den gradvisa förändringen av standarder och former av innehållsrepresentation förändras även sökriktningen, processerna för indexering och rankningsinformation som används av algoritmer förbättras, nya rankningsfaktorer visas. Allt detta gör det möjligt för sökmotorer att bilda högsta kvalitet och tillräckliga användarförfrågningar, men samtidigt komplicerar livslängden för webmasters och specialister som är engagerade i att främja webbplatser.

I kommentarerna, enligt artikeln, föreslår jag att prata om vilken av de viktigaste sökmotorerna i Runet - Yandex eller Google, enligt din mening, fungerar bättre, vilket ger användaren en bättre sökning och varför.

Är en av de viktigaste och viktigaste Internet-tjänsterna.

Med hjälp av sökmotorer hittar miljarderna av internetanvändare den nödvändiga informationen för sig själva.

Vad är en sökmotor?

Sökmotorn är ett programvara och hårdvarukomplex som använder speciella algoritmer för att behandla en stor mängd information om de mest olika platserna, om deras innehåll upp till varje sida.

Sökmotorn, från synvinkel av enkla besökare, är en sådan intelligent webbplats som innehåller mycket information och ger svar på alla användarförfrågningar.

Internetanvändare använder olika sökmotorer i olika länder. I det engelsktalande segmentet på Internet är den mest populära Googles sökmotor.

Sökmotorer i Runet

I Ryssland föredrar mer än hälften av användarna Yandex-söksystemet, och Google står för cirka 35% av förfrågningarna. De återstående användarna använder Rambler, Mail.ru, Nigma och andra tjänster.

I Ukraina använder cirka 60% av användarna Google, andelen Yandex står för lite mer än 25% av de bearbetade förfrågningarna.

Därför, när man främjar webbplatser i renhet, försöker specialister att marknadsföra webbplatsen, med fokus på sökmotorerna Yandex och Google.

Uppgifter för sökmotorer

För att maximera exakt för att svara på frågor från besökare måste sökmotorer utföra följande uppgifter:

Snabbt och effektivt samla information om olika sidor av olika webbplatser.
Processinformation om dessa sidor och bestämma vilken typ av förfrågan eller önskemål de motsvarar.
Form och utfärda sökresultat som svar på användarförfrågningar.

Komponenter i sökmotorer

Sökmotorer är ett komplext mjukvarupaket som består av följande huvudblock:

Datainsamling.
Indexering.
Beräkning.
Sträcker sig.

Denna separation är villkorad, eftersom arbetet med olika sökmotorer är något annorlunda än varandra.

1. Datainsamling

I detta skede finns en utmaning att hitta nya dokument, utarbeta en plan för sina besök och skanna.

Webmasters måste ges till sökmotorer om utseendet på nya material med hjälp av adressen till sidadressen i Adducerka eller för att driva meddelandet om de sociala nätverkssidorna.

Personligen använder jag det senare sättet och jag tror att det här är tillräckligt.

Kommentar. Lite distraherad och berätta om effektiviteten av placeringen av meddelanden om sociala nätverk om indexeringstakten på nya sidor på webbplatsen.

Jag använder för att styra och åtgärda den unika texten på texten på sidorna på webbplatsen. Ru.

Han kontrollerar kvalitativt unikhet, fixar det och gör det möjligt att placera en unik banner på sidorna på din webbplats.

Men ibland på den här tjänsten finns det en stor behandling. Jag hade flera fall när jag inte förväntade mig en unikhetskontroll, skickade en artikel på platsen och körde den på sociala nätverk.

Om verifieringen av unikhet försenades i ungefär en timme och mer var andelen unikhet alltid lika med 0%. Det innebär att för en ofullständig timme efter placering har sidan redan indexerats och listats i databasen med sökmotorer.

2. Indexering

Sökmotorer, samla in data på nya webbsidor, placera dem i databasen. I det här fallet bildas ett index, det vill säga nyckeln att snabbt komma åt data på den här sidan, om ett sådant behov uppstår.

3. Beräkning

Efter att ha kommit in i siddatabasen, passerar våra webbplatser scenen för att beräkna olika parametrar och indikatorer.

Hur många av dessa indikatorer och hur de beräknas säga exakt, förutom utvecklare av algoritmer av sökmotorer, kan ingen.

4. Ranking

Sedan är det på grundval av beräknade parametrar och indikatorer att bestämmas att bestämma resans relevans med dessa förfrågningar och rankas.

Det kommer att vara viktigt för den snabba och kvalitativa bildningen av sökresultatsidan på dessa förfrågningar.

Sökmotorer bildar svar på användarförfrågningar och formulärresultat för dem som en sökresultatsida.

Det bör noteras att algoritmer för behandling av data på sidor, bildandet av indikatorer och rankningsmetoder förbättras ständigt. Ändra prioriteringar för vilka ranking.
Sökmotorer försöker svara på användarförfrågningar så exakt som möjligt genom att försöka ta hänsyn till begäran, intressen för en viss användare, hans bostadsort, ålder, kön, vanor, lutningar.

Den mest populära webbtjänsten för modernitet är sökmotorn. Allt förklaras här, för de tid då representanter för de första internetanvändarna kunde observera nya saker i nätverket för länge sedan lämnade.

Informationen visas och ackumuleras så mycket att personen har blivit mycket svår att hitta exakt den som han skulle behövas. Föreställ dig, som om en sökning på Internet, om en vanlig användare skulle behöva leta efter information som inte förstår var. Det är inte så att vi inte förstår var, för att du inte kan hitta mycket information för en manuell sökning.

Sökmotor, vad är det?

Tja, om användaren redan är känd för att känna till webbplatser som det är möjligt att få den nödvändiga informationen, men vad ska man göra något? För att underlätta en persons liv att hitta den information som behövs på Internet och uppfunna sökmotorer eller helt enkelt sökmotorer. Sökmotorn utför en mycket viktig funktion, utan vilken internet inte vill ha det som vi brukade se - det här är en sökning efter information om nätverket.

Söksystem - Det här är en speciell webbnod eller en annan webbplats som ger användarna en hyperlänk till sidor, webbplatser som uppfyller den angivna sökfrågan.

För att vara lite mer exakt, sök sedan efter information på Internet, som utförs via programvara och hårdvara funktionell inställning och webbgränssnitt för att interagera med användare.

Att interagera en person med en sökmotor och ett webbgränssnitt skapades, det vill säga det synliga och begripliga skalet. Detta tillvägagångssätt för utvecklingsutvecklare underlättar sökandet efter många människor. Som regel är det på internet att en sökning utförs med hjälp av sökmotorer, men det finns också söksystem för FTP-servrar, individuella typer av varor i World Wide Web eller nyhetsinformation eller andra sökriktningar.

Sökningen kan utföras inte bara med textinnehåll av webbplatser, men också av andra typer av information som en person kan söka: bilder, videor, ljudfiler etc.

Hur är sökandet efter sökmotorn?

Sökningen är på internet, exakt samma som att titta på webbplatser är möjlig med webbläsarens webbläsare. Först efter att användaren frågade sin fråga i sökfältet är sökandet själv direkt.

Varje sökmotor innehåller en mjukvarudel där hela sökmotorn är baserad, den kallas sökmotorn - det här är ett mjukvarupaket och ger möjlighet att söka efter information. Efter att ha vände sig till sökmotorn, bildandet av en persons sökfråga och skriv in den i söksträngen genererar sökmotorn en sida med en lista med sökresultat, den mest relevanta, enligt sökmotorn finns ovan.

Sök Relevans - Leta efter den mest svarande tjänsten till användarens material och platsen för hyperlänken på dem på utgivningssidan med mer exakta resultat ovanför den andra. Fördelningen i sig kallas rangordningen av webbplatser.

Så hur förbereder sökmotorn för att utfärda dina material och hur hittar sökmotorns namn? Insamlingen av information i nätverket bidrar med unik för varje söksystem en robot eller en annan bot, som också har ett antal andra synonymer som en sökrobot eller spindel, och själva söksystemet kan delas in i tre steg:

Till det första steget i sökmotorns arbete kan du tillskriva skanningsplatser på det globala nätverket och samla egna kopior av webbsidor. Detta utgör ett stort antal ännu inte bearbetade och inte lämplig information för sökresultat.

Den andra etappen av sökmotorn reduceras för att föra in den tidigare erhållna, vid det första steget av information från platser. Denna sortering produceras, vilket för den minsta tiden kommer att gynna den högsta kvalitetsökningen, vilka användare faktiskt väntar på sökmotorn. Steget kallas indexering, det betyder att sidor redan är förberedda för utlämning, och den nuvarande basen anses vara ett index.

Bara det tredje etappen och orsakar sökresultat efter att ha mottagit en begäran från sin klient, baserat på nyckel eller om sökord som anges i begäran. Detta bidrar till valet av den mest relevanta begäran om information och efterföljande emission. Eftersom information, mycket, mycket många, utför sökmotorn rankning i linje med sina algoritmer.
Den bästa sökmotorn är den som kan ge det mest korrekt svarande materialet till användarens begäran. Men här kan de möta de resultat som påverkades av personer som är intresserade av att marknadsföra sin webbplats, är sådana webbplatser inte alltid, men visas ofta i sökresultaten, men inte under lång tid.

Även om världsledare i många regioner definieras, fortsätter sökmotorer att utveckla sin högkvalitativa sökning. Ju bättre sökningen de kommer att kunna tillhandahålla, desto fler människor kommer att använda den.

Hur använder du sökmotorn?

Vad är en sökmotor och hur det fungerar redan förståeligt, men hur man använder det rätt? De flesta webbplatser är alltid närvarande en söksträng, och bredvid det är den här knappen eller sökningen. En förfrågan är inmatad i söksträngen, varefter du måste trycka på sökknappen eller hur det händer oftare, tryck på ENTER-tangenten på tangentbordet och på några sekunder får du resultatet av frågan som en lista.

Men för att få rätt svar på sökförfrågan är det inte alltid möjligt att få första gången. För att söka efter önskade blev inte smärtsam, är det nödvändigt att korrekt komponera en sökfråga och följa rekommendationerna nedan.

Gör en sökfråga korrekt

Nästa kommer att indikera tips om hur du använder sökmotorn. Efter några knep och regler när du söker efter information i sökmotorn ger möjlighet att få det önskade resultatet mycket snabbare. Följ dessa rekommendationer:

Det behöriga skrivandet av ord säkerställer det maximala antalet matchningar med det önskade informationsobjektet (minst moderna sökmotorer har redan lärt sig att korrigera stavfel, men det är inte nödvändigt att försumma rådet).
Genom användningen av synonymer i frågan kan du nå ett bredare sökområde.
Ibland kan du ändra ordet i frågestället. Begär en förfrågan.
Främja arten på begäran, använd den exakta posten av fraser för att bestämma huvudkärnan i sökningen.
Experimentera med nyckelord. Användningen av nyckelord och fraser kan hjälpa till att identifiera huvudkärnan, och sökmotorn ger ett mer relevant resultat.

Så en sådan sökmotor är inget annat än möjligheten att hitta information om intresse och är vanligtvis helt fri att använda den, för att lära sig något, förstå något eller göra rätt slutsats för dig själv. Många representerar inte längre sina liv utan röstsökning, där texten inte behöver vinna, behöver du bara uttala din förfrågan, och mikrofoninmatningsenheten är här. Allt detta indikerar en konstant utveckling av sökteknik på Internet och behovet av dem.