Lucrul motoarelor de căutare: principiile generale ale motoarelor de căutare. Cum funcționează sistemele de căutare - fragmente, algoritm de căutare inversă, indexarea paginii și caracteristicile principiului de lucru Yandex al motorului de căutare

O zi bună, dragi cititori ai Blogului meu CEO . Acest articol este despre cum Sistemul de căutare Yandex Ceea ce utilizează tehnologii și algoritmi pentru site-urile de clasificare, ceea ce face să pregătească răspunsul la utilizatori. Mulți oameni știu că această emblematică a căutării rusești stabilește tonul din Runet, deține cea mai mare bază de date din Eurasia, operează cu conținutul de mai mult de un miliard de pagini, cunoaște răspunsul la orice întrebare. Potrivit LiveInternet pentru august 2012, ponderea lui Yandex în Rusia este de 60,5%. Audiența lunară a portalului este de 48,9 milioane de persoane. Dar, cel mai important, pentru noi, bloggerii în modul în care motorul de căutare primește cererile noastre, modul în care acestea sunt procesate și ce rezultat este obținut la ieșire. Pe de o parte, cunoașterea și înțelegerea acestor informații, este mai ușor să folosim toate resursele lui Yandex, pe de altă parte - este mai ușor să ne promovați blogurile. Prin urmare, sugerez cu mine să văd cele mai importante tehnologii ale celei mai bune motoare de căutare Runet.

Când utilizatorul de Internet dorește mai întâi să caute informații despre motorul de căutare, poate avea o singură întrebare: "Cum este căutarea?" Dar când o primește, adesea această întrebare se schimbă la altul: "De ce atât de repede?" Și într-adevăr, de ce căutarea unui fișier de pe computer durează 20 de secunde, iar rezultatul interogării din întreaga rețea de computere din întreaga lume apare după o secundă? Cel mai interesant lucru este că primele două întrebări (ca o căutare și de ce 1 secundă) pot fi într-un singur răspuns - motorul de căutare a fost pregătit în avans la cererea utilizatorului.

Pentru a înțelege principiul funcționării Yandex, ca un alt motor de căutare, vom desena o analogie cu directorul telefonic. Pentru a găsi orice număr de telefon, trebuie să știți numele de familie al abonatului și orice căutare durează în acest caz un număr maxim de un minut, deoarece toate paginile de directoare sunt un indicator alfabetic solid. Dar imaginați-vă dacă căutarea a fost urmată de o altă opțiune, unde numerele de telefon vor fi comandate de numerele înseși. După astfel de căutări care sunt deja întârziate pentru o perioadă mai lungă, numerele înainte de ochii căutării vor fi încă foarte lungi. 🙂.

Deci motorul de căutare decide toate informațiile de pe Internet într-o formă convenabilă pentru aceasta. Și, cel mai important, toate aceste date sunt puse în avans în directorul său, înainte ca vizitatorul să vină cu cererile sale. Adică când cerem lui Yandex o întrebare, el deja știe răspunsul nostru. Și ne dă o secundă. Dar acest al doilea include o serie de procese esențiale pe care le vom lua în considerare în detaliu.

Indexarea pe Internet

Yandex Ru colectează toate informațiile de pe Internet, care pot ajunge. Cu ajutorul echipamentelor speciale, se vede întregul conținut, inclusiv imaginile pe parametrii vizuali. Angajate într-o astfel de colecție a motorului de căutare și procesul de colectare și pregătire a datelor se numește indexare. Baza unei astfel de mașini include un sistem informatic diferit în robotul de căutare. Acesta ocupă în mod regulat site-urile indexate, le verifică pentru conținut nou, și scanează, de asemenea, internetul în căutarea de pagini la distanță. Dacă detectează că o astfel de pagină nu mai există sau închisă de la indexare, îl elimină din căutare.

Cum găsește robot de căutare site-uri noi? În primul rând, datorită legăturilor de la alte site-uri. Deoarece dacă un link de la un site deja indexat este pus pe o nouă resursă web, atunci data viitoare când vizitați al doilea, robotul va merge la vizită la primul. În al doilea rând, în webmasterul motorului de căutare Yandex există un serviciu minunat, oamenii au numit "Adduț" (din fraze în limba engleză -addurl - address). Este posibil să faceți adresa noului dvs. site, care, după un timp, va vizita robotul de căutare. În al treilea rând, cu ajutorul programului special "Yandex.bar", o vizită la utilizatorii care o folosesc este urmărită. În consecință, dacă o persoană a intrat într-o nouă resursă web, un robot apare curând acolo.

Faceți toate paginile intră în căutare? Milioane de pagini sunt indexate în fiecare zi. Printre acestea se numără paginile de diferite calități, în care pot conține diferite informații - de la un conținut unic la gunoi solid. Mai mult, așa cum spune statisticile, gunoiul de pe Internet este mult mai mult. Fiecare robot de căutare a documentelor analizează cu algoritmi speciali. Aceasta determină dacă are informații utile dacă poate răspunde solicitării utilizatorului. Dacă nu, atunci astfel de pagini nu iau "în astronauți", dacă da, este inclus în căutare.

După ce robotul a vizitat pagina și a determinat utilitatea sa, ea apare în spațiul de stocare al motorului de căutare. Iată analiza oricărui document la elementele de bază, așa cum spun maeștrii centrului auto - la șuruburi. Pagina este curățată de marcajul HTML, textul curat trece printr-un inventar complet - se calculează locația fiecărui cuvânt. Într-o astfel de formă dezasamblată, pagina se transformă într-o masă cu numere și litere, numită un indice diferit. Acum, astfel încât să nu se întâmple cu resursele web, care conține această pagină, ultima sa copie este întotdeauna în căutare. Chiar dacă site-ul nu mai există, distribuția documentelor sale este încă stocată pe Internet.

Fiecare indice, împreună cu datele privind tipurile de documente, codificarea, limba, împreună cu copii, sunt baza de căutare . Este actualizată periodic, prin urmare, este pe servere speciale, cu care se manipulează solicitările utilizatorului motorului de căutare.

Cât de des are loc procesul de indexare? În primul rând, depinde de tipurile de site-uri. Prima resursă web de tip se schimbă foarte des conținutul paginilor sale. Adică, atunci când un robot de căutare vine la aceste pagini de fiecare dată, ele conțin un alt conținut de fiecare dată. Pentru ei, nimic data viitoare nu va fi găsit, astfel încât aceste site-uri nu sunt incluse în index. Cel de-al doilea tip de site-uri - Depozit de date, pe paginile care sunt adăugate periodic legături către documente pentru descărcare. Conținutul acestui site, de obicei, nu se schimbă, astfel încât robotul său vizitează extrem de rar. Alte site-uri depind de frecvența actualizării materialelor. Aceasta se referă la următoarele - cu cât este mai rapid noul conținut pe site, cu atât vine mai des robotul de căutare. Iar prioritatea este dată în primul rând cele mai importante resurse web (site-ul de știri este un ordin de mărime mai important decât orice blog, de exemplu).

Indexarea vă permite să efectuați prima funcție a motorului de căutare - colectarea de informații pe paginile noi de pe Internet. Dar Yandex are cea de-a doua funcție - căutați un răspuns la solicitarea utilizatorului din baza de căutare deja pregătită.

Yandex pregătește răspunsul

Procesul de procesare a cererii și emiterii de răspunsuri relevante este angajat sistemul de calculator "Metapoisk" . Pentru munca sa, la început, ea colectează toate informațiile introductive: din ce regiune a fost o cerere, la care clasa crede, există erori în cerere etc. După o astfel de prelucrare, metapoiskul verifică dacă există exact aceleași cereri cu aceiași parametri din baza de date. Dacă răspunsul este pozitiv, sistemul arată utilizatorul în prealabile salvate în avans. Dacă nu există o astfel de întrebare în baza de date, Metapoisk se referă la baza de căutare care conține datele indexului.

Și aici sunt lucruri uimitoare. Imaginați-vă că există un computer super puternic care păstrează tot internetul procesat de către roboții de căutare. Utilizatorul specifică solicitarea și celulele de memorie începe căutarea tuturor documentelor implicate în interogare. Răspunsul este găsit și toți sunt mulțumiți. Dar luați un alt caz când există multe cereri care conțin cuvinte identice în corpul vostru. Sistemul trebuie să treacă prin aceleași celule de memorie de fiecare dată, ceea ce poate crește momentul pentru prelucrarea datelor. În consecință, timpul crește, ceea ce poate duce la pierderea utilizatorului - va fi solicitat ajutor unui alt motor de căutare.

Astfel încât să nu existe astfel de întârzieri, toate copiile din indicele site-ului sunt distribuite prin computere diferite. După trimiterea unei solicitări, Metapoisk oferă comenzii acestor servere pentru a căuta piesa dvs. cu text. După aceasta, toate datele de la aceste mașini se întorc la computerul central, combină toate rezultatele obținute și oferă utilizatorului primele zece dintre cele mai bune răspunsuri. Cu o astfel de tehnologie, două iepuri sunt uciși imediat: timpul de căutare este redus de mai multe ori (răspunsul este pe acțiune de oa doua) și datorită creșterii platformelor, informațiile sunt duplicate (datele nu sunt pierdute din cauza defecțiunilor bruște) . Computerele cu informații duplicate alcătuiesc centrul de date - aceasta este o cameră cu servere.

Atunci când utilizatorul motorului de căutare își stabilește cererea, în 20 de cazuri din 100, obiectivele ambigue sunt obținute în întrebare. De exemplu, dacă scrie în șirul de căutare, cuvântul "Napoleon" nu este încă cunoscut ce este răspunsul - rețeta pentru tort sau biografia marelui comisar. Sau expresia "Brothers Grimm" - povești, filme, trupa de muzică. Pentru un astfel de posibil fan al obiectivelor pentru a restrânge la răspunsurile specifice în Yandex există tehnologie specială Spectru. Acesta ia în considerare nevoile utilizatorilor care utilizează statisticile interogărilor de căutare. Din toate întrebările specificate în vizitatorii Yandex, spectrul alocă diverse obiecte în ele (nume de oameni, cărți, modele, modele etc.) Aceste obiecte sunt distribuite în unele categorii. Până în prezent, astfel de categorii au mai mult de 60 de ani. Folosind-le, motorul de căutare are cuvinte diferite de cuvinte în baza de date în cererile de utilizator. Interesant, aceste categorii sunt verificate periodic (analiza are loc de câteva ori pe săptămână), ceea ce permite Yandex să ofere mai precis răspunsuri la întrebări.

Pe baza tehnologiei, Spectrumul Yandex a organizat sfaturi de dialog. Ele apar sub șirul de căutare în care utilizatorul își formează cererea ambiguă. Această linie reflectă categoriile la care obiectul obiectului se poate relaționa. Rezultatele ulterioare de căutare depind de selectarea utilizatorului unei astfel de categorii.

De la 15 la 30% din toți utilizatorii motorului de căutare Yandex doresc să primească numai informații locale (date ale regiunii în care locuiesc). De exemplu, despre noi filme din cinematografele orașului dvs. Prin urmare, răspunsul la o astfel de solicitare ar trebui să fie diferit pentru fiecare regiune. În acest sens, Yandex își folosește tehnologia căutați regiuni . De exemplu, astfel de răspunsuri pot primi rezidenți care caută un repertoriu de filme în cinema din octombrie:

Dar un astfel de rezultat va primi locuitorii orașului Stavropol la aceeași cerere:

Regiunea utilizatorului este determinată în primul rând de adresa IP. Uneori, aceste date nu sunt corecte, deoarece un număr de furnizori pot lucra imediat în mai multe regiuni și, prin urmare, pot schimba adresele IP utilizatorilor. În principiu, dacă acest lucru se întâmplă cu dvs., puteți schimba cu ușurință regiunea în setările motorului de căutare. Acesta este specificat în colțul din dreapta sus din pagina cu rezultate. Puteți schimba-o.

Motorul de căutare Yandex Ru - Rezultatele răspunsului

Când metapoiscul a pregătit răspunsul, motorul de căutare Yandex trebuie să-l dea pe pagină cu rezultatele. Este o listă de referințe care au găsit documente cu informații mici pe fiecare. Sarcina tehnologiei de emitere a rezultatelor este de a furniza mai mult informativ utilizatorului cele mai relevante răspunsuri. Șablonul unei astfel de legături arată astfel:

Luați în considerare această formă a rezultatului în detaliu. Pentru Rezultat de căutare Yandex folosește adesea numele titlului paginii (faptul că optimizatorii sunt prescrise în eticheta de titlu). Dacă nu este, atunci cuvintele din titlul articolului sau postului apar aici. Dacă textul antetului este mare, motorul de căutare își pune fragmentul în acest câmp, care este cel mai relevant pentru interogarea specificată.

Este foarte rar, dar se întâmplă că titlul nu corespunde conținutului cererii. În acest caz, Yandex generează antetul rezultat de căutare utilizând textul din articol sau post. El va avea cu siguranță un cuvânt de interogare.

Pentru snippeet. Motorul de căutare utilizează întregul text de pe pagină. Ea alege toate fragmentele în care răspunsul este prezent solicitării, apoi selectează cele mai relevante dintre ele și introduce un link către document la document. Datorită acestei abordări, optimizatorul competent îl poate remasa după ce a văzut Snippeet, îmbunătățind astfel atractivitatea referinței.

Pentru o percepție mai bună a performanței, cererea utilizatorului, antetele sunt întocmite ca referințe în text (evidențierea în albastru, cu accent). Pentru atractivitatea resurselor web și recunoașterea acesteia, este adăugată Favon - o mică pictogramă a site-ului. Acesta apare în partea stângă a textului în prima linie înainte de titlu. Toate cuvintele care au fost incluse în cererea de răspuns sunt, de asemenea, evidențiate cu caractere aldine pentru confortul percepției.

Recent, într-un fragment, motorul de căutare Yandex adaugă diverse informații care vor ajuta utilizatorul chiar mai rapid și mai precis, își găsesc răspunsul. De exemplu, dacă utilizatorul scrie numele oricărei organizații în cererea sa, atunci în Snippet, Yandex va adăuga adresa, contactați telefoanele și referința la locația în hărțile geografice. Dacă motorul de căutare este familiarizat structurii site-ului, în care există un document cu răspunsul pentru utilizator, acesta va arăta cu siguranță. În plus, Yandex poate adăuga imediat la un fragment de pagini cele mai vizitate ale unei astfel de resurse web, astfel încât, dacă se dorește, vizitatorul poate merge imediat la secțiunea de care aveți nevoie, salvându-i timpul.

Există fragmente care conțin o valoare a oricărui produs pentru un magazin online, un rating de hotel sau un restaurant sub formă de stele, alte informații interesante cu numere diferite despre obiecte în documentele de căutare. Sarcina acestor informații este de a oferi o listă completă a datelor pe acele subiecte sau obiecte care sunt interesate de utilizator.

În general, cu exemple diferite, pagina cu răspunsurile va arăta astfel:

Clasament și piese

Sarcina Yandex include nu numai căutarea tuturor răspunsurilor posibile, ci și selectarea celor mai bune (relevante). La urma urmei, utilizatorul nu va fi risipit în toate legăturile pe care le va fi furnizat ca urmare a căutării Yandex. Procesul de comandă a rezultatelor căutării este numit clasament . Adică, este clasamentul care determină calitatea răspunsurilor oferite.

Există reguli pentru care Yandex definește paginile relevante:

  • reducerea în poziții de pe pagină cu rezultate așteaptă site-uri care agravează calitatea căutării. De obicei, acestea sunt astfel de resurse web ale căror proprietari încearcă să înșele motorul de căutare. De exemplu, acestea sunt site-uri cu pagini care sunt texte lipsite de sens sau invizibile. Desigur, el este vizibil și înțeles de către robotul de căutare, dar nu de un vizitator care citește acest document. Sau site-uri, care la trecerea la legătura din zona de emitere, traduc imediat utilizatorul către un alt site.
  • ele nu intră în emiterea de rezultate sau scăderea puternic a locurilor de clasare care conțin conținut erotic. Acest lucru se datorează faptului că adesea astfel de resurse web utilizează metode de promovare agresive.
  • site-urile infectate cu viruși nu sunt reduse în extrădare și nu sunt excluse din rezultatele căutării - în acest caz, utilizatorul este informat cu privire la pericolul utilizând o pictogramă specială. Acest lucru se datorează faptului că Yandex sugerează că astfel de resurse web pot conține documente importante cu privire la solicitarea vizitatorului motorului de căutare.

De exemplu, site-urile Yandex vor fi clasate la cerere "Apple":

În plus față de factorii de rang, Yandex folosește mostre speciale cu cereri și răspunsuri la acestea, pe care utilizatorii motorului de căutare sunt considerați cel mai adecvat. Astfel de probe Nu se poate face nici o mașină în acest moment - aceasta este prerogativa unei persoane. În Yandex, acești experți sunt chemați asistare . Sarcina lor include o analiză completă a tuturor documentelor de căutare și evaluarea răspunsurilor la cererile specificate. Ei aleg cele mai bune răspunsuri și constituie un eșantion special de formare. În ea, motorul de căutare vede relația dintre paginile relevante și proprietățile acestora. Având astfel de informații Yandex poate alege pentru fiecare cerere o formulă optimă de clasare. Metoda de construire a unei astfel de formule este numită matricenet. Plus acest sistem este că este rezistent la recalificare, ceea ce face posibilă luarea în considerare a unui număr mare de factori de clasificare, fără a crește numărul de estimări și modele inutile.

La sfârșitul postării mele, vreau să vă arăt statistici interesante colectate de motorul de căutare Yandex în procesul de lucru.

1. Popularitatea numelor personale în Rusia și orașele rusești (Datele sunt preluate de la bloggerii și utilizatorii de rețea socială în martie 2012).

2. Statistici cu diferite tipuri de interese.

Postul meu cu privire la modul în care motorul de căutare Yandex este finalizat.

În 1863, marele scriitor Jules Verne a creat un alt Paris în secolul al XX-lea. În ea, el a descris în detaliu metroul, masina, scaunul electric, calculatorul și chiar internetul. Cu toate acestea, editorul a refuzat să tipărească cartea și sa așezat mai mult de 120 de ani, până când a fost găsită de străbunicul lui Jules Verne în 1989. Publicat a fost o carte în 1994.

Motorul de căutare sau pur și simplu "motor de căutare" este căutarea paginilor online în conformitate cu solicitarea utilizatorului. Cel mai faimos motor de căutare din lume este Google, cel mai popular în Rusia - Yandex, iar unul dintre cele mai vechi motoare de căutare este Yahoo. În arhitectura motorului de căutare puteți aloca motor de căutare - nucleul sistemului reprezentat de un set de module software; Baza de date sau indexstocarea informațiilor despre toate bine-cunoscute motor de căutare al resurselor de internet; și un set de site-uri care sunt puncte de intrare Utilizatori (www.google.com, www.yandex.ru, ru.yahoo.com etc.). Toate acestea corespund arhitecturii sistemului de informații clasice pe trei niveluri: există o interfață de utilizator, logica de afaceri, care în acest caz este reprezentată de implementarea algoritmilor de căutare și a bazei de date.

Specificul de căutare online

La prima vedere, căutarea pe Internet nu este mult diferită de căutarea obișnuită a informațiilor, de exemplu, de la procesarea în baza de date sau din sarcina de căutare a fișierelor. Deci, ei au considerat dezvoltatorii primelor motoare de căutare pe Internet, dar în timp au dat seama că au greșit ...

Prima diferență în căutarea pe Internet de la obișnuit este că algoritmul de căutare pentru aceeași bază de date presupune că structura sa este cunoscută în avans de către motorul de căutare și de autorul de solicitare. Pe Internet, din motive evidente, nu este. Paginile de Internet formează structura directorului, ci rețeaua, care afectează și algoritmii de căutare, iar formatul de date Postat pe resursele de Internet nu este controlat de nimeni.

A doua diferență, ca fiind una dintre consecințele primului este că cererea nu este prezentată sub forma unui set de valori ale parametrilor (criterii de căutare) și sub forma unui text scris de om pe o limbă naturală pentru el . Astfel, înainte de a începe să căutați, încă mai trebuie să înțelegeți ce dorește autorul cererii. Eu, notă, nu înțeleg o altă persoană, ci o mașină de calcul.

A treia diferență este deja mai puțin evidentă, dar nu mai puțin fundamentală: În directorul sau baza de date, toate elementele sunt egale. Există o competiție pe Internet și, în consecință, împărțirea mai multor "furnizori de informații de încredere" și surse apropiate de statutul de "Muscul de informații". Astfel încât resursele de clasă, includ, de asemenea, motoarele de căutare.

Și în concluzie, ar trebui adăugat că zona de căutare este miliarde de pagini, mai multe kilobyte și multe altele. Despre un cort de milioane de pagini este adăugat zilnic și actualizat la fel de mult. Toate acestea sunt reprezentate de diferite formate digitale. Din păcate, chiar și tehnologiile și resursele moderne disponibile la dispoziția liderilor de piață pe Internet nu le permit să se ocupe de toate aceste varietăți "pe zbor" și în întregime.

Care este motorul de căutare

În primul rând, este important să realizăm altul și, probabil, cea mai semnificativă diferență dintre activitatea motorului de căutare pe Internet și activitatea oricărui alt sistem de informații care exercită în diferite tipuri de directoare și baze de date. Motorul de căutare nu caută informații între ceea ce se află pe Internet la momentul primirii cererii și încearcă să creeze un răspuns pe baza stocării proprii - baza de date numită indicele, unde stochează un dosar pentru toți cunoscute și actualizează periodic. Cu alte cuvinte, motorul de căutare nu funcționează cu originalul, ci cu zona de proiecție a valorilor permise de căutare. Toate cele mai recente modificări de pe Internet pot fi reflectate în rezultatele căutării numai după ce vor fi paginile relevante indexuri - adăugat la indicele motorului de căutare. Deci, motorul de căutare din prima aproximare constă într-un motor de căutare, o bază de date sau un index (index) și puncte de conectare.

Acum, pe scurt despre ceea ce motorul de căutare constă din:

  • Spider sau Spider (păianjen). O aplicație care este angajată în descărcarea de pagini de resurse Internet. Nicăieri Spider nu va "crawl" - solicită numai conținutul paginilor în același mod ca și browserul de Internet obișnuit, trimițând o solicitare către serverul HTTP și obținerea unui răspuns de la acesta. După descărcarea conținutului paginii, acesta este trimis la indexerul și crawlerul, care este descris mai jos.

  • Indexer (indexer). Indexerul generează analiza inițială a conținutului paginii descărcate, alocă părțile principale (numele paginii, descrierea, link-urile, anteturile etc.) și refuză toate acestea prin secțiunile bazei de date de căutare - locații în indexul motorului de căutare. Acest proces este numit indexarea resurselor de internetDe aici și numele subsistemului în sine. Pe baza rezultatelor analizei inițiale, indexatorul poate decide, de asemenea, că pagina este în general "nedemnă" să fie în index. Motivele unei astfel de soluții pot fi diferite: pagina nu are un nume, este o copie exactă a celuilalt deja disponibilă în indexul paginii sau conține referințe la resursele interzise de lege.

  • Tractor pe şenile. Acest "animal" este conceput pentru a "crawl" de link-uri disponibile pe o pagină de păianjen. Crawlerul analizează căile care conduc de la pagina curentă la alte secțiuni ale site-ului sau pe pagina de resurse externe de Internet și determină procedura ulterioară de ocolire a păianjenului firelor World Wide Web. A fost Krauller care găsește nou pentru pagina motorului de căutare și le transferă de Spider. Lucrarea crawler-ului este construită pe baza algoritmilor de căutare pe coloane în lățime și adâncime.

  • Motor de căutare și motor de rezultate). Cea mai importantă parte a oricărui motor de căutare. Algoritmii dezvoltatorilor de subsistemici ai companiei sunt stocați în strictă secret, deoarece acestea sunt un secret comercial. Este această parte a motorului de căutare care este responsabilă pentru adecvarea răspunsului motorului de căutare la solicitarea de utilizator. Aici puteți selecta două componente principale:
    • Subsistemul de clasament. Variind. - Acestea sunt pagini ale site-urilor Internet în conformitate cu relevanța acestora pentru o interogare specifică. Pagina relevanță - Aceasta, la rândul său, gradul de conformare a conținutului semnificației paginii a interogării și această valoare a motorului de căutare determină independent, pe baza numărului imens de parametri. Clasament - Aceasta este cea mai misterioasă și controversată parte a "inteligenței artificiale" a motorului de căutare. În clasamentul paginii, în plus față de structura și conținutul său (conținutul), afectează și: numărul și calitatea legăturilor care conduc la această pagină din alte site-uri; vârsta domeniului site-ului însuși; Natura comportamentului utilizatorilor care privesc prin pagină și mulți alți factori.

    • Subsisteme de emitere a rezultatelor. Sarcina acestui subsistem include o interpretare a unei interogări de utilizatori, traducerea în limba solicitărilor structurate la indexul și formarea paginilor rezultatelor căutării. În plus față de parsarea textului interogării, motorul de căutare poate lua în considerare și:
      • Solicitați contextul, Formabilă pe baza semnificației solicitărilor implementate anterior. De exemplu, dacă utilizatorul vizitează adesea site-uri pe teme de mașini, atunci probabil că dorește să primească informații despre aceste branduri în cuvântul "Volga" sau "Oka", și nu în cazul în care rușii de același nume începe râuri. Se numeste căutare personalizatăLa emiterea uneia și aceeași solicitare pentru diferiți utilizatori este semnificativ diferită.

      • Preferințe personalizatepe care ea (motor de căutare) poate "ghici" analizând legăturile selectate ale utilizatorului pe paginile rezultatelor căutării. Acesta este un alt mod de a ajusta contextul cererii: utilizatorul cu acțiunile sale ca și cum ar spune mașinii, exact ce voia să găsească. De regulă, motoarele de căutare din rezultatele căutării încearcă să adauge pagini, o anchetă relevantă, dar referitoare la diferite domenii ale vieții. Să presupunem că utilizatorul este interesat de filme și, prin urmare, selectează adesea link-uri către pagini cu anunțurile din Kinonovinki, chiar dacă aceste pagini nu sunt destul de relevante pentru interogarea originală. Când formați un răspuns la următoarea solicitare, sistemul poate prefera pagini cu o descriere a filmelor, în numele căruia sunt cuvinte din textul interogării.

      • RegiuneEste foarte important atunci când prelucrează cererile comerciale legate de achiziționarea de bunuri și servicii de la furnizorii locali. Dacă sunteți interesat de vânzări și reduceri și sunteți la Moscova, atunci cel mai probabil nu sunteți deloc interesant, ce acțiuni sunt deținute pe acest subiect în Sankt Petersburg, dacă nu ați specificat acest lucru în mod explicit în textul interogării. În primul rând, informațiile despre vânzările din Moscova ar trebui să apară în rezultatele căutării. Astfel, motoarele moderne de căutare acționează cererile de geospendant și geone-dependent. Cel mai probabil, dacă motorul de căutare decide că cererea dvs. este dependentă de Geo, aceasta adaugă automat un semn al unei regiuni care încearcă să determine informațiile despre furnizorul dvs. de Internet.

      • Timp. Uneori, motoarele de căutare trebuie analizate când au apărut evenimentele descrise pe pagină. La urma urmei, informațiile sunt constant învechite, iar utilizatorul are nevoie în primul rând de link-uri cu cele mai recente știri, previziunile actuale și anunțurile de evenimente care nu au fost încă finalizate sau ar trebui să vină în viitor. Se înțelege că relevanța paginii depinde de timp, și comparați-o cu momentul executării interogării, de asemenea, necesită motorul de căutare pentru complexul inteligenței.

      Apoi, motorul de căutare caută cea mai apropiată în sensul cererea cheie În indexul și formularele rezultatele, sortarea referințelor în ordinea descrescătoare a relevanței acestora. Fiecare interogare cheie din index corespunde unei ratinguri separate de pagini relevante pentru el. Nu pentru fiecare combinație de litere și numere, sistemul începe o nouă interogare cheie și o face pe baza analizei de frecvență a anumitor solicitări de utilizator. Motorul de căutare poate amesteca, de asemenea, evaluările din diferite interogări cheie din rezultatele căutării, dacă consideră că este necesar utilizatorului.

Principii generale ale motorului de căutare

Este necesar să înțelegem că serviciile de căutare de pe Internet sunt o afacere foarte profitabilă. În detalii, din cauza căruia companiile precum Google și Yandex nu pot intra, deoarece partea principală a profiturilor lor sunt veniturile lor din publicitatea contextuală. Iar odată ce căutarea pe Internet este o afacere extrem de profitabilă, atunci concurența dintre aceste companii este foarte gravă. Ce determină competitivitatea pe piața de căutare online? Răspunsul este calitatea motorului de căutare. Este logic că cu cât este mai mare, cu atât mai mulți utilizatori noi apar la sistem și cu atât mai valoroase pe paginile acestei emisiuni de publicitate contextuală. Dezvoltatorii motorului de căutare își cheltuiesc eforturi mari care vizează "curățarea" rezultatele rezultatelor căutării de la diferite tipuri de resturi de informații, numite spam (spam). În detaliu despre modul în care acest lucru se face, va fi spus într-un articol separat, iar aici voi da principiile generale ale comportamentului motorului de căutare, formulat sub formă de concluzii pe parcursul celor de mai sus.

  1. Motorul de căutare reprezentat de păianjenii și crawlerul său scanează în mod constant Internetul pentru apariția de noi și actualizări ale paginilor existente, deoarece informațiile irelevante sunt apreciate mai jos.

  2. Motorul de căutare actualizează periodic rangarea resurselor prin relevanța acestora la întrebările cheie, deoarece paginile noi apar în mod constant în index. Acest proces este numit de actualizare (actualizare) rezultate de căutare.

  3. În virtutea unor cantități uriașe de informații postate în resursele Worldwide Web și Resursele limitate ale motorului de căutare, motorul de căutare încearcă întotdeauna să încarce numai cel mai mult (în opinia sa) necesar. În arsenalul ei există tot felul de filtre care au tăiat o mulțime de inutile deja la etapa de indexare sau aruncați spamul de la indicele pe baza rezultatelor rezultatelor căutării.

  4. Motoarele de căutare moderne în timpul analizei interogării încearcă nu numai să țină seama de textul celei mai multe cereri, dar și de mediul său: contextul și preferințele utilizatorului, care a fost anterior, precum și timpul de solicitare, regiunea și regiunea mult mai mult.

  5. Nu numai parametrii interni (structura, conținutul), ci și parametrii externi, cum ar fi legăturile cu pagina din alte site-uri și comportamentul utilizatorului, afectează relevanța unei anumite pagini.

Lucrarea motoarelor de căutare este îmbunătățită în mod constant. Opera ideală a motorului de căutare (pentru o persoană) este posibilă numai dacă toate soluțiile privind indexarea și clasamentul vor lua o comisie constând dintr-un număr mare de specialiști din toate zonele și direcțiile activității umane. Deoarece acest lucru este nerealist, atunci Comisia înlocuiește sistemele expert, algoritmi de căutare euristică și alte elemente ale inteligenței artificiale. Probabil că activitatea tuturor acestor subsisteme ar putea, de asemenea, să dea rezultate mai adecvate dacă ar fi posibil să proceseze absolut toate datele disponibile pe Internet, dar este practic imposibilă. Inteligența artificială imperfectă și resurse limitate - două motive principale pentru faptul că rezultatele rezultatelor căutării nu vă rog întotdeauna utilizatorii, dar toate acestea sunt tratate. Pentru ziua de azi, în opinia mea, lucrarea celor mai renumite și mari motoare de căutare este destul de compatibilă cu nevoile și așteptările utilizatorilor lor.

Bună ziua, dragi cititori!

Motoarele de căutare din spațiul de internet mondial sunt în prezent destul de mult. Fiecare dintre ele are propriile lor algoritmi de indexare și clasare, dar, în general, principiul muncii motoarelor de căutare este destul de similar.

Cunoașterea modului în care funcționează motorul de căutare în condițiile unei concurențe în creștere rapidă reprezintă un avantaj semnificativ în promovarea nu numai a site-urilor comerciale, ci și a informațiilor și a blogurilor. Aceste cunoștințe ajută la construirea unei strategii eficiente de optimizare a site-ului și cu un efort mai mic pentru a intra în emiterea de vârf în grupurile promoționale.

Principiile motoarelor de căutare

Semnificația lucrării optimizatorului este de a "configura" paginile progresive pentru algoritmii de căutare și, prin urmare, pentru a ajuta aceste pagini să obțină poziții înalte pe anumite solicitări. Dar înainte de a începe lucrul la optimizarea site-ului sau a blogului, este necesar să înțelegeți cel puțin caracteristicile motoarelor de căutare să înțeleagă modul în care pot reacționa la optimizatorul de acțiune.

Desigur, detalii detaliate ale formării rezultatelor căutării sunt informațiile pe care motoarele de căutare nu sunt dezvăluite. Cu toate acestea, pentru eforturile corecte de a găsi suficientă înțelegere a principiilor principale pe care funcționează motoarele de căutare.

Metode de căutare de informații.

Cele două metode principale utilizate astăzi de motoarele de căutare se disting prin abordarea căutării.

  1. Algoritmul de căutare directăCare implică cartografierea la fiecare dintre documentele stocate în baza de date a motorului de căutare, fraza cheie (solicitarea utilizatorului) este o metodă destul de fiabilă care vă permite să găsiți toate informațiile necesare. Dezavantajul acestei metode este că atunci când căutați în mari dimensiuni de date, timpul necesar pentru a găsi un răspuns este destul de mare.
  2. Algoritmul indicii inversariAtunci când o frază cheie este comparată cu o listă de documente în care este prezentă este convenabilă atunci când interacționează cu bazele de date care conțin zeci și sute de milioane de pagini. Cu această abordare, căutarea nu este făcută pe toate documentele, ci numai pe fișiere speciale, inclusiv liste de cuvinte conținute pe paginile site-urilor. Fiecare cuvânt dintr-o listă similară este însoțită de o indicație a coordonatelor pozițiilor în care apare și alți parametri. Această metodă se aplică astăzi în activitatea unor astfel de motoare de căutare bine-cunoscute ca Yandex și Google.

Trebuie remarcat faptul că atunci când accesează utilizatorul la bara de căutare a browserului, căutarea nu este direct pe Internet, ci în bazele de date pre-asamblate, stocate și actuale care conțin informațiile prelucrate de motoarele de căutare (paginile site-ului) . Formarea rapidă a rezultatelor căutării poate fi datorată indiciilor inverse.

Conținutul de text al paginilor (indexuri directe) de motoarele de căutare sunt, de asemenea, salvate și este utilizat la formarea automată a fragmentelor de la cea mai potrivită cerere de fragmente de text.

Modelul de clasificare matematică

Pentru a accelera căutarea și a simplifica procesul de formare a emiterii, cea mai rană solicitare de utilizator, se aplică un anumit model matematic. Sarcina acestui model matematic este de a găsi paginile dorite la baza indexului invers, evaluarea gradului de respectare a interogării și distribuției în ordinea descendentă a relevanței.

Pur și simplu găsirea expresiei dorite pe pagină nu este suficientă. La definirea motoarelor de căutare, se calculează calculul greutății documentului privind solicitarea utilizatorului. Pentru fiecare cerere, acest parametru este calculat pe baza următoarelor date: frecvența utilizării pe pagina analizată și coeficientul care reflectă modul în care același cuvânt se găsește în alte documente din baza de date a motorului de căutare. Produsul acestor două valori și corespunde greutății documentului.

Desigur, algoritmul prezentat este foarte simplificat, deoarece există un număr de alți coeficienți suplimentari utilizați în calculele la dispoziția motoarelor de căutare, dar nu se schimbă de la aceasta. Cu cât este mai adesea un cuvânt separat din cererea utilizatorului, se găsește în orice document, cu atât este mai mare greutatea acestuia din urmă. În același timp, conținutul paginii paginii este recunoscut ca spam-ul dacă anumite limite sunt depășite, care sunt diferite pentru fiecare cerere.

Funcții de bază ale motorului de căutare

Toate sistemele de căutare existente sunt chemate să efectueze mai multe funcții importante: căutați informații, indexarea acestuia, o evaluare calitativă, o clasare adecvată și formarea rezultatelor căutării. Sarcina prioritară a oricărui motor de căutare este de a furniza utilizatorului informațiile pe care le caută, ca răspuns precis la o cerere specifică.

Deoarece majoritatea utilizatorilor nu au nicio idee despre modul în care motoarele de căutare lucrează pe Internet și abilitatea de a instrui utilizatorii de căutare "corectă" sunt foarte limitate (de exemplu, sfaturi de căutare), dezvoltatorii sunt forțați să îmbunătățească căutarea în sine. Acesta din urmă implică crearea de algoritmi și principiile de funcționare a motoarelor de căutare care vă permit să găsiți informațiile necesare, indiferent de modul în care este formulată o interogare de căutare.

Scanare.

Se urmărește modificările în documentele deja indexate și căutați pagini noi care pot fi reprezentate în rezultatele emiterii de utilizatori la cereri. Scanarea resurselor pe motoarele de căutare pe Internet sunt efectuate utilizând programe specializate numite păianjeni sau roboți de căutare.

Scanarea resurselor Internet și colectarea datelor este produsă automat de boot-urile de căutare. După prima vizită la site și porniți-o în baza de date de căutare, roboții încep să viziteze periodic acest site pentru a urmări și a remedia modificările apărute în conținut.

Deoarece numărul de resurse în curs de dezvoltare pe Internet este mare, iar noile site-uri apar zilnic, procesul descris nu se oprește pentru un minut. Un astfel de principiu de funcționare a motoarelor de căutare pe Internet le permite să aibă întotdeauna informații actuale despre site-urile disponibile în rețea și despre conținutul acestora.

Sarcina principală a robotului de căutare este căutarea de date noi și transferul motorului de căutare pentru prelucrare ulterioară.

Indexare

Motorul de căutare este capabil să găsească date numai pe site-urile prezentate în baza de date - cu alte cuvinte, indexate. În acest pas, motorul de căutare trebuie să determine dacă informațiile găsite informații trebuie introduse în baza de date și, dacă introduceți, în care dintre partițiile. Acest proces este, de asemenea, efectuat automat.

Se crede că indexele Google aproape toate informațiile disponibile în rețea, Yandex pentru indexarea conținutului este adecvat mai ales și nu atât de repede. Ambele giganți de căutare RUnet lucrează în beneficiul utilizatorului, dar principiile generale ale activității motorului de căutare Google și Yandex sunt oarecum diferite, deoarece se bazează pe unic, care alcătuiesc fiecare sistem de soluții software.

Sistemele generale pentru motoarele de căutare este că procesul de indexare a tuturor resurselor noi durează mai mult decât indexarea noului conținut pe siturile bine cunoscute ale sistemului. Informațiile apar pe site-uri, încrederea motoarelor de căutare la care se încadrează în indice este practic instantaneu.

Variind.

Clasamentul este o evaluare a algoritmilor motorului de căutare pentru importanța datelor indexate și construirea acestora în conformitate cu factorii caracteristică acestui motor de căutare. Informațiile obținute sunt procesate pentru a forma rezultate de căutare în cadrul spectrului de solicitări de utilizator. Ce fel de informații vor fi prezentate în rezultatele căutării de mai sus și cât mai scăzută este determinată pe deplin de modul în care funcționează motorul de căutare selectat și algoritmii săi.

Site-urile care se află în baza de date a motorului de căutare sunt distribuite pe subiectele și grupurile de solicitări. Pentru fiecare grup de interogări, este formată o emitere preliminară supusă unei ajustări ulterioare. Pozițiile majorității site-urilor se schimbă după fiecare actualizare a actualizărilor de clasificare, pe care Google apare zilnic, în căutarea Yandex - o dată la câteva zile.

Om ca asistent în lupta pentru calitatea emiterii

Realitatea este că chiar și cele mai avansate sisteme de căutare, cum ar fi Yandex și Google, sunt încă nevoie să ajute o persoană să formeze o emitere care să îndeplinească standardele de calitate adoptate. În cazul în care algoritmul de căutare nu este bine declanșat, rezultatele sunt ajustate manual - prin evaluarea conținutului paginii pe o multitudine de criterii.

Numeroasele armate de oameni special instruiți din diferite țări - moderatori (evaluatori) de motoare de căutare - trebuie să efectuați o mulțime de lucrări la verificarea conformității paginilor site-ului la solicitările utilizatorului, filtrarea emiterii de spam și conținut interzis (texte, imagini, imagini video). Activitatea evaluatorilor vă permite să faceți un distribuitor de emisiune și să contribuiți la dezvoltarea în continuare a algoritmilor de căutare de auto-învățare.

Concluzie

Odată cu dezvoltarea internetului și a schimbării treptate a standardelor și a formelor de reprezentare a conținutului, abordarea căutării se schimbă, procesele de indexare și de clasare utilizate de algoritmi sunt îmbunătățite, apar noi factori de clasificare. Toate acestea permit motoarelor de căutare să formeze cererile de cea mai înaltă calitate și adecvate, dar în același timp complică viața de webmasteri și specialiști implicați în promovarea siturilor.

În comentariile, în conformitate cu articolul, propunem să vorbim despre care dintre principalele motoare de căutare ale lui Runet - Yandex sau Google, în opinia dvs., funcționează mai bine, oferind utilizatorului o căutare mai bună și de ce.

Sunt unul dintre cele mai importante și mai importante servicii de internet.

Cu ajutorul motoarelor de căutare, miliarde de utilizatori de Internet găsesc informațiile necesare pentru ei înșiși.

Ce este un motor de căutare?

Motorul de căutare este un complex de software și hardware care utilizează algoritmi speciali pentru procesarea unei cantități uriașe de informații despre cele mai diferite site-uri, despre conținutul lor până la fiecare pagină.

Motorul de căutare, din punctul de vedere al vizitatorilor simpli, este un site inteligent care conține o mulțime de informații și oferă răspunsuri la orice solicitare de utilizator.

Utilizatorii de Internet utilizează diverse motoare de căutare în diferite țări. În segmentul de limbă engleză al Internetului, cel mai popular este motorul de căutare Google.

Motoarele de căutare în RUTnet

În Rusia, mai mult de jumătate dintre utilizatori preferă sistemul de căutare Yandex și Google reprezintă aproximativ 35% din cereri. Utilizatorii rămași utilizează Rambler, Mail.ru, Nigma și alte servicii.

În Ucraina, aproximativ 60% dintre utilizatori utilizează Google, ponderea conturilor Yandex pentru un pic mai mult de 25% din cererile prelucrate.

Prin urmare, la promovarea site-urilor din Renet, specialiștii încearcă să promoveze site-ul, concentrându-se pe motoarele de căutare Yandex și Google.

Sarcini pentru motoarele de căutare

Pentru a maximiza cu exactitate la întrebările de la vizitatori, motoarele de căutare trebuie să îndeplinească următoarele sarcini:

  1. Colectați rapid și eficient informații despre diferite pagini de diferite site-uri.
  2. Procesarea informațiilor despre aceste pagini și determinați ce fel de solicitare sau solicitări corespund.
  3. Formați și emiteți rezultatele căutării ca răspuns la solicitările utilizatorului.

Componente ale motoarelor de căutare

Motoarele de căutare sunt un pachet software complex care constă din următoarele blocuri principale:

  1. Colectare de date.
  2. Indexare.
  3. Calcul.
  4. Variind.

Această separare este condiționată, deoarece lucrarea diferitelor motoare de căutare este oarecum diferită una de cealaltă.

1. Colectarea datelor

În acest stadiu există o provocare pentru a găsi noi documente, elaborarea unui plan pentru vizitele și scanarea lor.

Webmasterii trebuie să fie acordate motoarelor de căutare despre apariția de noi materiale utilizând adresa adresei paginii din adducerka sau pentru a conduce anunțul paginilor de rețea socială.

Personal, folosesc cel din urmă și cred că este destul de suficient.

Cometariu. Un pic distras și spune despre eficacitatea plasării anunțurilor privind rețelele sociale cu privire la rata de indexare a paginilor noi ale site-ului.

Folosesc pentru a controla și fixa unicitatea textului pe paginile site-ului dvs. text.ru.

El verifică calitativ unicitatea, o rezolvă și face posibilă plasarea unui banner unic pe paginile site-ului dvs.

Dar, uneori, pe acest serviciu există o prelucrare mare. Am avut mai multe cazuri când nu m-am așteptat la un control unic, a postat un articol pe site și a condus-o pe rețelele sociale.

Dacă verificarea unicității a fost întârziată timp de aproximativ o oră și mai mult, atunci procentul de unicitate a fost întotdeauna egal cu 0%. Aceasta înseamnă că pentru o oră incompletă după plasare, pagina a fost deja indexată și listată în baza de date a motoarelor de căutare.

2. Indexarea

Motoarele de căutare, colectarea datelor pe pagini web noi, plasați-le în baza lor de date. În acest caz, se formează un index, adică cheia pentru a accesa rapid datele de pe această pagină, dacă apare o astfel de nevoie.

3. Calculul

După introducerea bazei de date a paginii, site-urile noastre trec stadiul de calcul al diferiților parametri și indicatori.

Câți dintre acești indicatori și modul în care sunt calculați exact, cu excepția dezvoltatorilor de algoritmi ai motoarelor de căutare, nimeni nu poate.

4. Clasament

Apoi, pe baza parametrilor și a indicatorilor calculați, se determină să determine relevanța paginii cu aceste solicitări și clasament această pagină.

Acesta va fi important pentru formarea rapidă și calitativă a paginii privind rezultatele căutării cu privire la aceste solicitări.

Motoarele de căutare formează răspunsuri la solicitările utilizatorului și formează rezultate pentru ele ca pe o pagină cu rezultatele căutării.

Trebuie remarcat faptul că algoritmii de prelucrare a datelor pe pagini, formarea de indicatori și metodele de clasificare sunt îmbunătățite în mod constant. Schimbați prioritățile pentru care clasarea.
Motoarele de căutare încearcă să răspundă la cererile de utilizator cât mai exact posibil încercând să ia în considerare natura cererii, interesele unui anumit utilizator, locul de reședință, vârsta, sexul, obiceiurile, înclinațiile.

Cel mai popular serviciu web al modernității este motorul de căutare. Totul este explicat aici, deoarece acele vremuri în care reprezentanții primilor utilizatori de Internet ar putea observa articole noi în rețea cu mult timp în urmă.

Informațiile apar și se acumulează atât de mult încât persoana a devenit foarte dificil de găsit exact cel pe care el ar fi nevoie. Imaginați-vă, ca și cum o căutare pe Internet, dacă un utilizator obișnuit ar trebui să caute informații să nu înțeleagă unde. Nu este că nu înțelegem unde, pentru că nu puteți găsi o mulțime de informații pentru o căutare manuală.

Motorul de căutare, ce este?

Ei bine, dacă utilizatorul este deja cunoscut pentru a cunoaște site-urile pe care este posibil să aveți informațiile necesare, dar ce să faceți altfel? Pentru a facilita durata de viață a unei persoane în găsirea informațiilor necesare pe Internet și a inventat motoarele de căutare sau pur și simplu motoarele de căutare. Motorul de căutare efectuează o funcție foarte importantă, fără de care internetul nu ar plăcea așa cum am folosit pentru a vedea - aceasta este o căutare a informațiilor despre rețea.

Sistem de căutare - Acesta este un nod web special sau un site diferit care oferă utilizatorilor un hyperlink la pagini, site-uri care îndeplinesc interogarea de căutare specificată.

Pentru a fi puțin mai precis, atunci căutați informații despre Internet, care se efectuează prin setare funcțională software și hardware și interfață web pentru interacțiunea cu utilizatorii.

Pentru a interacționa o persoană cu motor de căutare și a fost creată o interfață web, adică coaja vizibilă și ușor de înțeles. Această abordare a dezvoltatorilor de dezvoltare facilitează căutarea multor oameni. De regulă, este pe Internet că o căutare este efectuată utilizând motoarele de căutare, dar există și sisteme de căutare pentru serverele FTP, tipuri individuale de bunuri în World Wide Web sau informații despre știri sau alte instrucțiuni de căutare.

Căutarea poate fi efectuată nu numai prin conținutul textual al site-urilor, ci și de alte tipuri de informații pe care o persoană le poate căuta: imagini, videoclipuri, fișiere de sunet etc.

Cum este căutarea motorului de căutare?

Căutarea însăși este pe Internet, exact la fel ca vizionarea site-urilor web este posibilă cu browserul de Internet Internet Browser. Numai după ce utilizatorul a întrebat interogarea sa în barul de căutare, căutarea în sine este direct.

Orice motor de căutare conține o parte software pe care se bazează întregul motor de căutare, se numește motorul de căutare - acesta este un pachet software și oferind posibilitatea de a căuta informații. După pornirea la motorul de căutare, formarea interogării de căutare a unei persoane și introduceți-o în șirul de căutare, motorul de căutare generează o pagină cu o listă de rezultate de căutare, cea mai relevantă, în funcție de motorul de căutare aici sunt situate mai sus.

Căutarea relevanță - Căutați cel mai răspuns serviciu la materialele utilizatorului și locația hyperlink-ului pe ele pe pagina de emisiune cu rezultate mai precise deasupra celorlalte. Distribuția în sine este numită clasamentul site-urilor.

Deci, cum se pregătește motorul de căutare pentru a vă emite materialele și cum se găsește numele motorului de căutare? Colectarea informațiilor din rețea contribuie unic pentru fiecare sistem de căutare un robot sau un bot diferit, care are și o serie de alte sinonime ca un crawler sau un păianjen, iar sistemul de căutare poate fi împărțit în trei etape:

La primul pas al lucrării motorului de căutare, puteți atribui site-uri de scanare în rețeaua globală și puteți colecta propriile copii ale paginilor web. Aceasta formează un număr mare de informații care nu sunt încă prelucrate și nu sunt potrivite pentru rezultatele căutării.

A doua etapă a motorului de căutare este redusă la aducerea în ordine a celor obținute anterior, în prima etapă a informațiilor din site-uri. Această sortare este produsă, care pentru cel mai mic timp va favoriza favorabil căutarea de cea mai bună calitate, pe care utilizatorii așteaptă de fapt motorul de căutare. Etapa se numește indexare, înseamnă că paginile sunt deja pregătite pentru extrădare, iar baza curentă va fi considerată un index.

Doar a treia etapă și cauzează rezultatele căutării după primirea unei solicitări de la clientul său, pe baza cheii sau despre cuvintele cheie specificate în cerere. Acest lucru contribuie la selectarea celei mai relevante cereri de informare și emitere ulterioară. Deoarece informația, foarte, foarte mulți, motorul de căutare efectuează clasament în conformitate cu algoritmii săi.
Cel mai bun motor de căutare este cel care poate oferi cel mai corect material de răspuns la cererea utilizatorului. Dar aici pot îndeplini rezultatele care au fost influențate de persoane interesate de promovarea site-ului lor, astfel de site-uri nu sunt întotdeauna, dar apar adesea în rezultatele căutării, dar nu pentru o lungă perioadă de timp.

Deși sunt definite liderii mondiali în multe regiuni, motoarele de căutare continuă să-și dezvolte calitatea de înaltă calitate. Cu cât căutarea pe care o vor putea oferi, cu atât mai mulți oameni o vor folosi.

Cum se utilizează motorul de căutare?

Ce este un motor de căutare și cum funcționează deja de înțeles, dar cum să-l utilizați corect? Cele mai multe site-uri sunt întotdeauna prezente un șir de căutare, iar lângă acesta este butonul Găsire sau căutarea. O solicitare este introdusă în șirul de căutare, după care trebuie să apăsați butonul de căutare sau cum se întâmplă mai des, apăsați tasta Enter de pe tastatură și într-o chestiune de secunde obțineți rezultatul interogării ca o listă.

Dar pentru a obține răspunsul potrivit la cererea de căutare, nu este întotdeauna posibilă să obțineți prima dată. Pentru a căuta acest lucru nu a devenit dureros, este necesar să compuneți corect o interogare de căutare și să urmați recomandările de mai jos.

Efectuați o interogare de căutare corectă

Următorul va indica sfaturi despre modul de utilizare a motorului de căutare. În urma unor trucuri și reguli atunci când căutați informații în motorul de căutare vor oferi posibilitatea de a obține rezultatul dorit mult mai rapid. Urmați aceste recomandări:

  1. Scrierea competentă a cuvintelor asigură numărul maxim de meciuri cu obiectul de informare dorit (cel puțin motoarele de căutare moderne au învățat deja să corecteze erorile de ortografie, dar nu este necesar să neglijăm acest sfat).
  2. Prin utilizarea sinonimelor în interogare, puteți ajunge la o gamă mai largă de căutare.
  3. Uneori, schimbarea cuvântului în textul interogării poate aduce un rezultat mai mare. Solicitați o cerere.
  4. Promovarea speciilor la cerere, utilizați intrarea exactă a frazei pentru a determina esența principală a căutării.
  5. Experimentați cu cuvinte cheie. Utilizarea cuvintelor cheie și a frazelor poate ajuta la identificarea esenței principale, iar motorul de căutare va da un rezultat mai relevant.

Deci, un astfel de motor de căutare nu este altceva decât posibilitatea de a găsi informațiile de interes și de obicei este complet liber să o folosească, să învețe ceva, să înțeleagă ceva sau să facă concluzia potrivită pentru tine. Mulți nu mai reprezintă viața lor fără căutare vocală, în care textul nu trebuie să câștige, trebuie doar să vă pronunți solicitarea, iar dispozitivul de intrare microfon este aici. Toate acestea indică o dezvoltare constantă a tehnologiilor de căutare pe Internet și necesitatea acestora.

Acțiune