Kurš ierosināja globālo tīmekli. WWW — globālais tīmeklis. Ceļošana pa globālo tīmekli

Internetam attīstoties, tā apritē tika iesaistīts arvien vairāk informācijas, un navigācija internetā kļuva arvien grūtāka. Tad radās uzdevums izveidot vienkāršu un saprotamu veidu, kā sakārtot interneta vietnēs ievietoto informāciju. Jaunais www (world wide web) pakalpojums ir pilnībā ticis galā ar šo uzdevumu.

Globālais tīmeklis ir dokumentu sistēma ar teksta un grafisku informāciju, kas ievietota interneta vietnēs un ir savstarpēji savienota ar hipersaitēm. Iespējams, šis konkrētais pakalpojums ir vispopulārākais, un daudziem lietotājiem tas ir sinonīms pašam vārdam INTERNET. Bieži vien iesācēju lietotāji jauc divus jēdzienus - internetu un WWW (vai Web). Jāatgādina, ka WWW ir tikai viens no daudzajiem pakalpojumiem, kas tiek sniegti interneta lietotājiem.

Galvenā ideja, kas tika izmantota www sistēmas izstrādē, bija ir ideja piekļūt informācijai, izmantojot hiperteksta saites. Tās būtība ir dokumenta tekstā iekļaut saites uz citiem dokumentiem, kas var atrasties vai nu tajos pašos, vai attālos informācijas serveros.

www vēsture sākas no brīža, kad 1989. gadā slavenās zinātniskās organizācijas CErN darbinieks Berners-Lī ierosināja savai vadībai izveidot datu bāzi informācijas tīkla veidā, kas sastāvētu no dokumentiem, kas ietvertu gan pašu informāciju. un saites uz citiem dokumentiem. Šādi dokumenti ir nekas vairāk kā hiperteksts.

Vēl viena iezīme, kas atšķir www no citiem pakalpojumu veidiem, ir tā, ka ar šīs sistēmas palīdzību jūs varat piekļūt gandrīz visiem citiem interneta pakalpojumu veidiem, piemēram, FTP, Gopher, Telnet.

WWW ir multivides sistēma. Tas nozīmē, ka, izmantojot www, var, piemēram, noskatīties video par vēstures pieminekļiem vai uzzināt informāciju par pasaules čempionātu. Ir iespējams piekļūt bibliotēkas informācijai un jaunākajām pasaules fotogrāfijām, kuras pirms piecām minūtēm uzņēma meteoroloģiskie pavadoņi, kopā ar.

Ideja organizēt informāciju hiperteksta veidā nav jauna. Hiperteksts dzīvoja ilgi pirms datoru parādīšanās. Vienkāršākais nedatorizētā hiperteksta piemērs ir enciklopēdijas. Daži vārdi rakstos ir atzīmēti slīprakstā. Tas nozīmē, ka varat atsaukties uz attiecīgo rakstu un iegūt sīkāku informāciju. Bet, ja hipertekstā, kas nav dators, ir jāpāršķir lapas, tad monitora ekrānā sekošana hiperteksta saitei notiek uzreiz. Jums vienkārši jānoklikšķina uz saites vārda.

Iepriekš minētā Tima Bernersa-Lī galvenais nopelns ir tas, ka viņš ne tikai izvirzīja ideju par informācijas sistēmas izveidi, kas balstīta uz hipertekstu, bet arī ierosināja vairākas metodes, kas veidoja nākotnes www pakalpojuma pamatu. .

1991. gadā idejas, kas radās CErN, aktīvi sāka attīstīt Supercomputing Applications (NCSA) centrs. Tieši NCSA izveido hiperteksta dokumentu valodu html, kā arī programmu Mosaic, kas paredzēta to apskatei. Marka Andersena izstrādātā Mosaic kļuva par pirmo pārlūkprogrammu un atvēra jaunu programmatūras produktu klasi.

1994. gadā www serveru skaits sāka strauji augt un jaunais interneta serviss ne tikai ieguva atpazīstamību visā pasaulē, bet arī piesaistīja internetam milzīgu skaitu jaunu lietotāju.

Tagad sniegsim pamata definīcijas.

www– tas ir tīmekļa lapu kopums, kas atrodas interneta vietnēs un ir savstarpēji savienotas ar hipersaitēm (vai vienkārši saitēm).

tīmekļa lapa ir www struktūrvienība, kas ietver aktuālo informāciju (tekstu un grafiku) un saites uz citām lapām.

tīmekļa vietne– tās ir tīmekļa lapas, kas fiziski atrodas vienā interneta mezglā.

www hipersaišu sistēma ir balstīta uz to, ka viena dokumenta dažas atlasītās sadaļas (kas var būt teksta daļas vai ilustrācijas) darbojas kā saites uz citiem dokumentiem, kas ar tiem ir loģiski saistīti.

Šajā gadījumā tie dokumenti, uz kuriem tiek izveidotas saites, var atrasties gan lokālā, gan attālā datorā. Turklāt ir iespējamas arī tradicionālās hiperteksta saites - tās ir saites vienā dokumentā.

Saistītie dokumenti savukārt var saturēt savstarpējas atsauces viens uz otru un uz citiem informācijas resursiem. Tādējādi ir iespējams apkopot dokumentus par līdzīgām tēmām vienotā informācijas telpā. (Piemēram, dokumenti, kas satur medicīnisku informāciju.)

Arhitektūra www

www arhitektūra, tāpat kā daudzu citu interneta pakalpojumu arhitektūra, ir veidota pēc principa klients-serveris.

Servera programmas galvenais uzdevums ir piekļuves organizēšana informācijai, kas glabājas datorā, kurā darbojas šī programma. Pēc palaišanas servera programma darbojas režīmā, kas gaida pieprasījumus no klientu programmām. Parasti tīmekļa pārlūkprogrammas tiek izmantotas kā klientu programmas, kuras izmanto parastie www lietotāji. Kad šādai programmai ir jāiegūst kāda informācija no servera (parasti tie ir tur glabātie dokumenti), tā nosūta serverim atbilstošu pieprasījumu. Ar pietiekamām piekļuves tiesībām starp programmām tiek izveidots savienojums, un servera programma nosūta klienta programmai atbildi uz pieprasījumu. Pēc tam starp tiem izveidotais savienojums tiek pārtraukts.

Lai pārsūtītu informāciju starp programmām, tiek izmantots HTTP protokols (Hypertext Transfer Protocol).

www servera funkcijas

www-serveris ir programma, kas darbojas resursdatorā un apstrādā pieprasījumus, kas nāk no www klientiem. Saņemot pieprasījumu no www klienta, šī programma izveido savienojumu, pamatojoties uz TCP/IP transporta protokolu, un apmainās ar informāciju, izmantojot HTTP protokolu. Turklāt serveris nosaka piekļuves tiesības dokumentiem, kas tajā atrodas.

Lai piekļūtu informācijai, kuru serveris nevar apstrādāt tieši, tā tiek izmantota bloķēšanas sistēma. Izmantojot īpašu CGI (Common Gateway Interface) interfeisu informācijas apmaiņai ar vārtejām, www serverim ir iespēja saņemt informāciju no avotiem, kas būtu nepieejami cita veida interneta pakalpojumiem. Tajā pašā laikā gala lietotājam vārteju darbība ir “caurspīdīga”, t.i., apskatot tīmekļa resursus savā iecienītākajā pārlūkprogrammā, nepieredzējis lietotājs pat nepamanīs, ka kāda informācija viņam tika parādīta, izmantojot vārtejas sistēmu.

www klienta funkcijas

Ir divi galvenie www klientu veidi: tīmekļa pārlūkprogrammas un utilītu lietojumprogrammas.

tīmekļa pārlūkprogrammas tiek izmantoti, lai tieši strādātu ar www un iegūtu informāciju no turienes.

Pakalpojumu tīmekļa lietojumprogrammas var sazināties ar serveri, lai iegūtu statistiku vai indeksētu tur esošo informāciju. (Tā informācija nokļūst meklētājprogrammu datubāzēs.) Turklāt ir arī servisa tīmekļa klienti, kuru darbs ir saistīts ar informācijas glabāšanas tehnisko pusi dotajā serverī.

Jau šobrīd interneta lietotāju skaits sasniedz 3,5 miljardus cilvēku, kas ir gandrīz puse no pasaules iedzīvotāju skaita. Un, protams, visi to zina Pasaules tīmeklis ir pilnībā aptvēris mūsu planētu. Bet joprojām ne visi var pateikt, vai pastāv atšķirība starp interneta un globālā tīmekļa jēdzieniem. Savādi, daudzi ir pilnīgi pārliecināti, ka tie ir sinonīmi, taču gudri puiši var sniegt argumentus, kas mazinās šo pārliecību.

Kas ir internets?

Neiedziļinoties sarežģītās tehniskās detaļās, mēs to varam teikt Internets ir sistēma, kas savieno datortīklus visā pasaulē. Datori tiek iedalīti divās grupās – klientos un serveros.

Klienti tiek sauktas par parastajām lietotāju ierīcēm, kas ietver personālos datorus, klēpjdatorus, planšetdatorus un, protams, viedtālruņus. Viņi nosūta pieprasījumu, saņem un parāda informāciju.

Visa informācija tiek glabāta serveros, kurus var klasificēt pēc dažādiem mērķiem:

  • tīmekļa serveris,
  • pasts,
  • tērzēšana,
  • radio un televīzijas apraides sistēmas,
  • failu koplietošana.

Serveri ir jaudīgi datori, kas strādā nepārtraukti. Papildus informācijas glabāšanai viņi saņem pieprasījumus no klientiem un nosūta nepieciešamo atbildi. Tajā pašā laikā viņi apstrādā simtiem šādu pieprasījumu.

Arī mūsu īsajā izglītības programmā ir nepieciešams pieminēt to ir vērts pieminēt interneta pakalpojumu sniedzēji, kas nodrošina saziņu starp klientu un serveri. Pakalpojumu sniedzējs ir organizācija ar savu interneta serveri, ar kuru ir savienoti visi tās klienti. Pakalpojumu sniedzēji nodrošina saziņu, izmantojot tālruņa kabeli, īpašu kanālu vai bezvadu tīklu.


Tādā veidā jūs nokļūstat internetā

Vai ir iespējams iztikt bez pakalpojumu sniedzēja un tieši izveidot savienojumu ar internetu? Teorētiski tas ir iespējams! Jums būs jākļūst par savu pakalpojumu sniedzēju un jāiztērē milzīga naudas summa, lai nokļūtu centrālajos serveros. Tāpēc nevainojiet pārāk daudz savu interneta pakalpojumu sniedzēju par augstajiem tarifiem — arī šiem puišiem ir jāmaksā par daudzām lietām un jātērē nauda aprīkojuma uzturēšanai.

World Wide Web ir sapinājis visu pasauli

World Wide Web vai vienkārši tīmeklis - “tīmeklis”. Patiesībā to attēlo milzīgs skaits lapu, kas ir savstarpēji saistītas.Šo savienojumu nodrošina saites, caur kurām jūs varat pāriet no vienas lapas uz otru, pat ja tā atrodas citā datorā, kas ir savienots ar.


Vispasaules tīmeklis ir vispopulārākais un lielākais interneta pakalpojums.

Vispasaules tīmeklis izmanto īpašus tīmekļa serverus, lai darbotos. Tajos tiek glabātas tīmekļa lapas (vienu no tām redzat tagad). Lapas, kas savienotas ar saitēm, kurām ir kopīga tēma, izskats un kuras parasti atrodas vienā serverī, tiek sauktas par vietni.

Lai apskatītu tīmekļa lapas un dokumentus, tiek izmantotas īpašas programmas - pārlūkprogrammas.

Pasaules tīmeklī ir iekļauti forumi, emuāri un sociālie tīkli. Bet tā darbu un pastāvēšanu tiešā veidā nodrošina internets...

Vai ir liela atšķirība?

Patiesībā atšķirība starp internetu un globālo tīmekli ir diezgan liela. Ja internets ir milzīgs tīkls, kas savieno miljoniem datoru visā planētas informācijas apmaiņai, tad globālais tīmeklis ir tikai viens veids, kā apmainīties ar šo informāciju. Papildus globālā tīmekļa darbības nodrošināšanai internets ļauj izmantot e-pastu un dažādus tūlītējos kurjerus, kā arī pārsūtīt failus, izmantojot FTP protokolu,

Internets ir tas, kas savieno daudzus datortīklus.

Globālais tīmeklis ir visas lapas, kas tiek glabātas īpašos interneta serveros.

Secinājums

Tagad jūs zināt, ka globālais tīmeklis un globālais tīmeklis ir dažādas lietas. Un pats galvenais, jūs varēsiet parādīt savu inteliģenci un izskaidrot saviem draugiem, kāda ir šī atšķirība.

World Wide Web (saīsināti Globālais tīmeklis vai WWW) ir informācijas resursu vienotība, kas ir savstarpēji savienoti ar telekomunikāciju palīdzību un kuru pamatā ir visā pasaulē izkaisītu datu hiperteksta attēlojums.

Par globālā tīmekļa dzimšanas gadu tiek uzskatīts 1989. gads. Tieši šogad Tims Berners-Lī ierosināja kopīgu hiperteksta projektu, kas vēlāk kļuva pazīstams kā World Wide Web.

“Tīmekļa” veidotājs Tims Berns-Lī, strādājot Eiropas Kodolpētījumu centra “CERN” elementārdaļiņu fizikas laboratorijā Ženēvā (Šveice), kopā ar partneri Robertu Kailo (Robert Caillot) strādāja pie hiperteksta ideju pielietošanas problēmām. veidot informācijas vidi , kas vienkāršotu informācijas apmaiņu starp fiziķiem .

Šī darba rezultāts bija dokuments, kurā tika izskatīti jēdzieni, kas ir būtiski “tīmeklim” tā mūsdienu formā, un piedāvāti URI, HTTP protokols un HTML valoda. Bez šīm tehnoloģijām vairs nav iespējams iedomāties mūsdienu internetu.

Berners-Lī izveidoja pasaulē pirmo tīmekļa serveri un pasaulē pirmo hiperteksta tīmekļa pārlūkprogrammu. Pasaulē pirmajā tīmekļa vietnē viņš aprakstīja, kas ir globālais tīmeklis un kā iestatīt tīmekļa serveri, kā lietot pārlūkprogrammu utt. Šī vietne bija arī pasaulē pirmais interneta katalogs.

Kopš 1994. gada svarīgākos uzdevumus globālā tīmekļa attīstībai ir pārņēmis World Wide Web Consortium ( World Wide Web Consortium, WZS), kuru organizēja un joprojām vadīja Kims Berns-Lī. Konsorcijs izstrādā un ievieš tehnoloģiju standartus internetam un globālajam tīmeklim. WZS misija: "Atbrīvojiet visu globālā tīmekļa potenciālu, izveidojot protokolus un principus, kas garantē tīkla ilgtermiņa attīstību." WZS izstrādā “Rekomendācijas”, lai panāktu dažādu uzņēmumu programmatūras produktu un iekārtu savietojamību, kas padara globālo tīmekli modernāku, universālāku un ērtāku.

Meklētājprogrammas: sastāvs, funkcijas, darbības principi.

Meklēšanas sistēma ir programmatūras un aparatūras komplekss, kas paredzēts, lai meklētu internetā un atbildētu uz lietotāja pieprasījumu, kas norādīts teksta frāzes (meklēšanas vaicājuma) veidā, izveidojot saišu sarakstu uz informācijas avotiem, atbilstības secībā (saskaņā ar Lūgums). Lielākās starptautiskās meklētājprogrammas: "Google", "Yahoo", "MSN". Krievijas internetā tas ir - "Yandex", "Ramblers", "Ports".

Aprakstīsim Meklētājprogrammu galvenās īpašības :

    Pilnīgums

Pilnīgums ir viens no galvenajiem meklēšanas sistēmas raksturlielumiem, kas ir pēc pieprasījuma atrasto dokumentu skaita attiecība pret kopējo internetā esošo dokumentu skaitu, kas apmierina doto pieprasījumu. Piemēram, ja internetā ir 100 lapas, kurās ir frāze “kā izvēlēties automašīnu”, un tikai 60 no tām tika atrastas atbilstošajam vaicājumam, tad meklēšanas pilnība būs 0,6. Acīmredzot, jo pilnīgāka meklēšana, jo mazāka iespējamība, ka lietotājs neatradīs sev vajadzīgo dokumentu, ja vien tas internetā vispār eksistē.

    Precizitāte

Precizitāte ir vēl viena galvenā meklētājprogrammas īpašība, ko nosaka tas, cik lielā mērā atrastie dokumenti atbilst lietotāja vaicājumam. Piemēram, ja vaicājumā "kā izvēlēties automašīnu" ir 100 dokumenti, 50 no tiem satur frāzi "kā izvēlēties automašīnu", bet pārējie vienkārši satur šos vārdus ("kā izvēlēties pareizo radio un uzstādīt to automašīna”), tad meklēšanas precizitāte tiek uzskatīta par 50/100 (=0,5). Jo precīzāka meklēšana, jo ātrāk lietotājs atradīs sev nepieciešamos dokumentus, jo mazāk starp tiem tiks atrasti dažāda veida “atkritumi”, jo retāk atrastie dokumenti neatbilst pieprasījumam.

    Atbilstība

Tikpat svarīga meklēšanas sastāvdaļa ir atbilstība, ko raksturo laiks, kas paiet no dokumentu publicēšanas brīža internetā līdz to ievadīšanai meklētājprogrammas indeksu datubāzē. Piemēram, nākamajā dienā pēc interesantu ziņu parādīšanās liels skaits lietotāju vērsās pie meklētājprogrammām ar atbilstošiem vaicājumiem. Objektīvi, kopš ziņu informācijas publicēšanas par šo tēmu ir pagājusi nepilna diena, taču galvenie dokumenti jau ir indeksēti un pieejami meklēšanai, pateicoties tā dēvētajai lielo meklētājprogrammu “ātrās datubāzes” esamībai, kas tiek atjaunināts vairākas reizes dienā.

    Meklēšanas ātrums

Meklēšanas ātrums ir cieši saistīts ar tā slodzes pretestību. Piemēram, saskaņā ar Rambler Internet Holding LLC datiem, šodien darba laikā Rambler meklētājprogramma saņem aptuveni 60 pieprasījumus sekundē. Šāda darba slodze prasa samazināt individuāla pieprasījuma apstrādes laiku. Šeit sakrīt lietotāja un meklētājprogrammas intereses: apmeklētājs vēlas iegūt rezultātus pēc iespējas ātrāk, un meklētājprogrammai pieprasījums ir jāapstrādā pēc iespējas ātrāk, lai nepalēninātu turpmāko vaicājumu aprēķinu.

    Redzamība

Rezultātu vizuāla prezentācija ir svarīga ērtas meklēšanas sastāvdaļa. Lielākajai daļai vaicājumu meklētājprogramma atrod simtiem vai pat tūkstošiem dokumentu. Neskaidru vaicājumu vai neprecīzu meklējumu dēļ pat pirmajās meklēšanas rezultātu lapās ne vienmēr ir tikai nepieciešamā informācija. Tas nozīmē, ka lietotājam bieži vien pašam ir jāveic meklēšana atrastajā sarakstā. Dažādi meklētājprogrammas rezultātu lapas elementi palīdz jums orientēties meklēšanas rezultātos. Detalizētus meklēšanas rezultātu lapas skaidrojumus, piemēram, Yandex, var atrast saitē http://help.yandex.ru/search/?id=481937.

Īsa meklētājprogrammu attīstības vēsture

Interneta attīstības sākuma periodā tā lietotāju skaits bija neliels, un pieejamās informācijas apjoms bija salīdzinoši neliels. Lielākoties tikai pētnieku darbiniekiem bija piekļuve internetam. Tolaik informācijas meklēšanas uzdevums internetā nebija tik steidzams kā tagad.

Viens no pirmajiem veidiem, kā organizēt piekļuvi tīkla informācijas resursiem, bija atvērtu vietņu direktoriju izveide, saites uz resursiem, kas tika sagrupētas atbilstoši tēmām. Pirmais šāds projekts bija Yahoo.com vietne, kas tika atvērta 1994. gada pavasarī. Pēc tam, kad vietņu skaits Yahoo direktorijā ievērojami palielinājās, tika pievienota iespēja direktorijā meklēt nepieciešamo informāciju. Pilnā nozīmē tā vēl nebija meklētājprogramma, jo meklēšanas apgabals bija ierobežots tikai ar katalogā esošajiem resursiem, nevis visiem interneta resursiem.

Saišu katalogi tika plaši izmantoti pagātnē, taču šobrīd tie ir gandrīz pilnībā zaudējuši savu popularitāti. Tā kā pat mūsdienu katalogi, kuru apjoms ir milzīgs, satur informāciju tikai par niecīgu interneta daļu. Lielākais DMOZ tīkla direktorijs (saukts arī par Open Directory Project) satur informāciju par 5 miljoniem resursu, savukārt Google meklētājprogrammas datu bāze sastāv no vairāk nekā 8 miljardiem dokumentu.

Pirmā pilnvērtīgā meklētājprogramma bija WebCrawler projekts, kas tika publicēts 1994. gadā.

1995. gadā parādījās meklētājprogrammas Lycos un AltaVista. Pēdējais jau daudzus gadus ir līderis informācijas meklēšanas jomā internetā.

1997. gadā Sergejs Brins un Lerijs Peidžs izveidoja Google meklētājprogrammu Stenfordas universitātes pētniecības projekta ietvaros. Google šobrīd ir populārākā meklētājprogramma pasaulē!

1997. gada septembrī oficiāli tika paziņots par Yandex meklētājprogrammu, kas ir vispopulārākā krievu valodā internetā.

Šobrīd ir trīs galvenās starptautiskās meklētājprogrammas – Google, Yahoo un MSN, kurām ir savas datu bāzes un meklēšanas algoritmi. Lielākā daļa citu meklētājprogrammu (kuru ir liels skaits) vienā vai otrā veidā izmanto trīs uzskaitīto rezultātus. Piemēram, AOL meklēšana (search.aol.com) izmanto Google datu bāzi, bet AltaVista, Lycos un AllTheWeb izmanto Yahoo datu bāzi.

Meklēšanas sistēmas sastāvs un darbības principi

Krievijā galvenā meklētājprogramma ir Yandex, kam seko Rambler.ru, Google.ru, Aport.ru, Mail.ru. Turklāt šobrīd Mail.ru izmanto Yandex meklētājprogrammu un datu bāzi.

Gandrīz visām lielākajām meklētājprogrammām ir sava struktūra, kas atšķiras no citām. Tomēr ir iespējams identificēt galvenās sastāvdaļas, kas ir kopīgas visām meklētājprogrammām. Atšķirības struktūrā var būt tikai šo komponentu mijiedarbības mehānismu īstenošanas veidā.

Indeksēšanas modulis

Indeksēšanas modulis sastāv no trim palīgprogrammām (robotiem):

zirneklis – programma, kas paredzēta tīmekļa lapu lejupielādei. Zirneklis lejupielādē lapu un izgūst visas iekšējās saites no šīs lapas. Katras lapas html kods tiek lejupielādēts. Lai lejupielādētu lapas, roboti izmanto HTTP protokolus. Zirneklis darbojas šādi. Robots serverim nosūta pieprasījumu “get/path/document” un dažas citas HTTP pieprasījuma komandas. Atbildot uz to, robots saņem teksta straumi ar pakalpojuma informāciju un pašu dokumentu.

    Lapas URL

    datums, kad lapa tika lejupielādēta

    Servera atbildes http galvene

    lapas pamatteksts (html kods)

Kāpuris (“ceļojošs” zirneklis) – programma, kas automātiski seko visām lapā atrastajām saitēm. Atlasa visas lapā esošās saites. Tās uzdevums ir noteikt, kur zirneklim vajadzētu doties tālāk, pamatojoties uz saitēm vai iepriekš noteiktu adrešu sarakstu. Rāpuļprogramma, sekojot atrastajām saitēm, meklē jaunus dokumentus, kas meklētājprogrammai joprojām nav zināmi.

Indeksētājs (robotu indeksētājs) - programma, kas analizē zirnekļu lejupielādētās tīmekļa lapas. Indeksētājs parsē lapu tā sastāvdaļās un analizē tās, izmantojot savus leksiskos un morfoloģiskos algoritmus. Tiek analizēti dažādi lapas elementi, piemēram, teksts, virsraksti, saites, strukturālās un stila iezīmes, speciālo pakalpojumu HTML tagi utt.

Tādējādi indeksēšanas modulis ļauj pārmeklēt noteiktu resursu kopu, izmantojot saites, lejupielādēt atrastās lapas, iegūt saites uz jaunām lapām no saņemtajiem dokumentiem un veikt pilnīgu šo dokumentu analīzi.

Datu bāze

Datubāze jeb meklētājprogrammas indekss ir datu glabāšanas sistēma, informācijas masīvs, kurā tiek glabāti visu indeksēšanas modulī lejupielādēto un apstrādāto dokumentu īpaši pārveidotie parametri.

Meklēt serveri

Meklēšanas serveris ir vissvarīgākais visas sistēmas elements, jo meklēšanas kvalitāte un ātrums ir tieši atkarīgs no algoritmiem, kas ir tā darbības pamatā.

Meklēšanas serveris darbojas šādi:

    No lietotāja saņemtais pieprasījums tiek pakļauts morfoloģiskai analīzei. Katra datu bāzē esošā dokumenta informācijas vide tiek ģenerēta (kas pēc tam tiks parādīta fragmenta veidā, tas ir, teksta informācija, kas atbilst pieprasījumam meklēšanas rezultātu lapā).

    Saņemtie dati tiek nodoti kā ievades parametri īpašam ranžēšanas modulim. Dati tiek apstrādāti par visiem dokumentiem, kā rezultātā katram dokumentam ir savs vērtējums, kas raksturo lietotāja ievadītā vaicājuma atbilstību un meklētājprogrammas rādītājā saglabātajām dažādajām šī dokumenta sastāvdaļām.

    Atkarībā no lietotāja izvēles šis vērtējums var tikt pielāgots ar papildu nosacījumiem (piemēram, tā sauktā “izvērstā meklēšana”).

    Tālāk tiek ģenerēts fragments, tas ir, katram atrastajam dokumentam no dokumentu tabulas tiek izvilkts nosaukums, īsa kopsavilkums, kas vislabāk atbilst vaicājumam, un saite uz pašu dokumentu, un atrastie vārdi tiek izcelti.

    Iegūtie meklēšanas rezultāti tiek pārsūtīti lietotājam SERP (Search Engine Result Page) formā – meklēšanas rezultātu lapa.

Kā redzat, visas šīs sastāvdaļas ir cieši saistītas viena ar otru un darbojas mijiedarbībā, veidojot skaidru, diezgan sarežģītu meklēšanas sistēmas darbības mehānismu, kas prasa milzīgus resursus.

Neviena meklētājprogramma neaptver visus interneta resursus.

Katra meklētājprogramma apkopo informāciju par interneta resursiem, izmantojot savas unikālās metodes, un veido savu periodiski atjauninātu datubāzi. Lietotājam tiek piešķirta piekļuve šai datubāzei.

Meklētājprogrammas ievieš divus veidus, kā meklēt resursu:

    Meklēt pēc tēmas katalogi - informācija tiek parādīts hierarhiskas struktūras veidā. Augšējā līmenī ir vispārīgas kategorijas (“Internets”, “Bizness”, “Māksla”, “Izglītība” utt.), nākamajā līmenī kategorijas ir sadalītas sadaļās utt. Zemākais līmenis ir saites uz konkrētām tīmekļa lapām vai citiem informācijas resursiem.

    Atslēgvārdu meklēšana (indeksa meklēšana vai detalizēta meklēšana) - lietotājs nosūta meklētājprogrammai pieprasījumu, kas sastāv no atslēgvārdiem. Sistēma atgriežas lietotājam pēc pieprasījuma atrasto resursu sarakstu.

Lielākā daļa meklētājprogrammu apvieno abas meklēšanas metodes.

Meklētājprogrammas var būt lokālas, globālas, reģionālas un specializētas.

Interneta Krievijas daļā (Runet) populārākās vispārējas nozīmes meklētājprogrammas ir Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www.rambler.ru). google.ru).

Lielākā daļa meklētājprogrammuīstenota portālu veidā.

Portāls (no angļu valodas.portāls- galvenā ieeja, vārti) ir vietne, kurā ir integrēti dažādi interneta pakalpojumi: meklēšanas rīki, pasts, ziņas, vārdnīcas utt.

Portāli var būt specializēti (piemēram,www. muzejs. ru) un vispārīgi (piemēram,www. km. ru).

Meklēt pēc atslēgvārdiem

Meklēšanai izmantoto atslēgvārdu kopu sauc arī par meklēšanas kritēriju vai meklēšanas tēmu.

Pieprasījums var sastāvēt no viena vārda vai vārdu kombinācijas, ko apvieno operatori – simboli, pēc kuriem sistēma nosaka, kāda darbība tai jāveic. Piemēram: pieprasījums “Maskava Sanktpēterburga” satur operatoru UN (tā tiek uztverta telpa), kas norāda, ka jāmeklē dokumenti, kuros ir abi vārdi - Maskava un Sanktpēterburga.

Lai meklēšana būtu atbilstoša (no angļu valodas relevant - relevant, relevant), jāņem vērā vairāki vispārīgi noteikumi:

    Neatkarīgi no formas, kādā vārds tiek izmantots vaicājumā, meklēšanā tiek ņemtas vērā visas tā vārdu formas saskaņā ar krievu valodas noteikumiem. Piemēram, vaicājums “biļete” atradīs arī vārdus “biļete”, “biļete” utt.

    Lielie burti jālieto tikai īpašvārdos, lai izvairītos no nevajadzīgu atsauču skatīšanas. Pēc “kalēju” lūguma, piemēram, tiks atrasti dokumenti, kuros runāts gan par kalējiem, gan Kuzņecoviem.

    Ieteicams sašaurināt meklēšanu, izmantojot dažus atslēgvārdus.

    Ja vajadzīgā adrese nav starp pirmajām divdesmit atrastajām adresēm, jums ir jāmaina pieprasījums.

Katra meklētājprogramma izmanto savu vaicājumu valodu. Lai ar to iepazītos, izmantojiet meklētājprogrammas iebūvēto palīdzību

Lielu vietņu tīmekļa lapās var būt iebūvētas informācijas izguves sistēmas.

Vaicājumi šādās meklēšanas sistēmās, kā likums, tiek veidoti saskaņā ar tiem pašiem noteikumiem kā globālajās meklētājprogrammās, tomēr pārzināšana ar palīdzību šeit nebūs lieka.

Izvērstā meklēšana

Meklētājprogrammas var nodrošināt mehānismu, kā lietotājs var izveidot sarežģītu vaicājumu. Sekojot saitei Izvērstā meklēšanaļauj rediģēt meklēšanas parametrus, norādīt papildu parametrus un izvēlēties ērtāko formu meklēšanas rezultātu attēlošanai. Tālāk ir aprakstīti parametri, kurus var iestatīt izvērstās meklēšanas laikā Yanex un Rambler sistēmās.

Parametra apraksts

Vārds pakalpojumā Yandex

Vārds iekšāRambler

Kur meklēt atslēgvārdus (dokumenta nosaukums, pamatteksts utt.)

Vārdnīcas filtrs

Meklēt pēc teksta...

Kādiem vārdiem jābūt vai nevajadzētu būt dokumentā un cik precīzai ir jābūt atbilstībai

Vārdnīcas filtrs

Meklēt vaicājuma vārdus... Izslēgt dokumentus, kuros ir šādi vārdi...

Cik tālu viens no otra jāatrodas atslēgvārdiem?

Vārdnīcas filtrs

Attālums starp vaicājuma vārdiem...

Dokumenta datuma ierobežojums

Dokumenta datums...

Ierobežojiet meklēšanu līdz vienai vai vairākām vietnēm

Vietne/Augšā

Meklēt dokumentus tikai šādās vietnēs...

Meklēšanas ierobežošana pēc dokumenta valodas

Dokumenta valoda...

Meklējiet dokumentus, kuros ir attēls ar noteiktu vārdu vai parakstu

Attēls

Meklējot lapas, kurās ir objekti

Īpaši objekti

Meklēšanas rezultātu prezentācijas forma

Izdošanas formāts

Tiek rādīti meklēšanas rezultāti

Dažas meklētājprogrammas (piemēram, Yandex) ļauj ievadīt vaicājumus dabiskā valodā. Jūs rakstāt to, kas jums jāatrod (piemēram: pasūtot vilciena biļetes no Maskavas uz Sanktpēterburgu). Sistēma analizē pieprasījumu un rada rezultātu. Ja jūs tas neapmierina, pārslēdzieties uz vaicājuma valodu.

Internets mūsu dzīvē ieņem arvien nozīmīgāku vietu. Neviena cita cilvēka radīta tehnoloģija nav ieguvusi tik plašu popularitāti. Internets — globālais tīmeklis, kas aptver visu zemeslodi, aptverot to televīzijas torņu tīklā. Tas sāka iegūt savu popularitāti salīdzinoši tālajos deviņdesmitajos gados. Rakstā mēs apspriedīsim, no kurienes tas nāca un kāpēc tas kļuva tik populārs.

Internets kā globālais tīmeklis

Šāda plāna otrais nosaukums nebija bez pamata. Fakts ir tāds, ka internets apvieno daudzus lietotājus visā pasaulē. Kā zirnekļa tīkls ar saviem pavedieniem apņem visu zemeslodi. Un tā nav parasta metafora, tā patiešām ir. Internets sastāv no vadiem un bezvadu tīkliem, no kuriem pēdējie mums ir neredzami.

Bet šī ir liriska atkāpe; patiesībā internets ir savienots ar globālo tīmekli (www vai Word Wide Web). Tas attiecas uz visiem datoriem, kas savienoti ar internetu. Attālajos serveros lietotāji glabā nepieciešamo informāciju un var sazināties arī internetā. Šo nosaukumu bieži saprot kā globālo tīmekli vai globālo tīklu.

Tas ir balstīts uz vairākiem īpaši svarīgiem protokoliem, piemēram, TCP/IP. Pateicoties internetam, World Wide Web jeb, citiem vārdiem sakot, Word Wide Web (WWW), veic savas darbības, tas ir, pārraida un saņem datus.

Lietotāju skaits

2015. gada nogalē tika veikts pētījums, uz kura pamata iegūti šādi dati. Visā pasaulē ir 3,3 miljardi interneta lietotāju. Un tas ir gandrīz 50% no visiem mūsu planētas iedzīvotājiem.

Tik augsti rādītāji tika sasniegti, pateicoties 3G un ātrgaitas 4G mobilo tīklu izplatībai. Liela loma bija pakalpojumu sniedzējiem, pateicoties masveida interneta tehnoloģiju ieviešanai, serveru uzturēšanas un optisko šķiedru kabeļu ražošanas izmaksas samazinājās. Lielākajā daļā Eiropas valstu interneta ātrums ir lielāks nekā Āfrikas valstīs. Tas skaidrojams ar pēdējo tehnisko nobīdi un zemo pieprasījumu pēc pakalpojuma.

Kāpēc internetu sauc par globālo tīmekli?

Lai cik paradoksāli tas nešķistu, daudzi lietotāji ir pārliecināti, ka iepriekš minētais termins un internets ir viens un tas pats. Šo dziļo nepareizo priekšstatu, kas valda daudzu lietotāju prātos, izraisa jēdzienu līdzība. Tagad mēs sapratīsim, kas ir kas.

Vispasaules tīmeklis bieži tiek sajaukts ar līdzīgu frāzi "World Wide Web". Tas atspoguļo noteiktu informācijas apjomu, kura pamatā ir interneta tehnoloģija.

Pasaules tīmekļa vēsture

Līdz 90. gadu beigām pasaulē beidzot tika nostiprināta NSFNet dominēšana pār ARPANET tehnoloģiju. Savādi, ka to izstrādi veica viens zinātniskais centrs. ARPNET tika izstrādāts pēc ASV Kara departamenta pasūtījuma. Jā, jā, pirmie internetu izmantoja militāristi. Un NSFNet tehnoloģija tika izstrādāta neatkarīgi no valsts aģentūrām, gandrīz aiz entuziasma.

Tieši konkurence starp abiem notikumiem kļuva par pamatu to tālākai attīstībai un masveida ieviešanai pasaulē. Plašai sabiedrībai globālais tīmeklis kļuva pieejams 1991. gadā. Tam kaut kā bija jādarbojas, un Berners Lī sāka izstrādāt interneta sistēmu. Pēc divu gadu veiksmīga darba viņš izveidoja hipertekstu jeb HTTP, slaveno HTML un URL elektronisko valodu. Mums nav jāiedziļinās detaļās, jo tagad mēs tās redzam kā regulāras saites uz vietņu adresēm.

Informācijas telpa

Pirmkārt, šī ir informācijas telpa, kurai piekļuve tiek nodrošināta caur internetu. Tas ļauj lietotājam piekļūt datiem, kas atrodas serveros. Ja mēs izmantojam vizuāli figurālu metodi, tad internets ir tilpuma cilindrs, un globālais tīmeklis ir tas, kas to aizpilda.

Izmantojot programmu, ko sauc par "pārlūkprogrammu", lietotājs iegūst piekļuvi internetam, lai sērfotu tīmeklī. Tas sastāv no neskaitāma skaita vietņu, kuru pamatā ir serveri. Tie ir savienoti ar datoriem un ir atbildīgi par datu uzglabāšanu, ielādi un apskati.

Zirnekļu tīkli un mūsdienu cilvēks

Pašlaik Homo sapiens attīstītajās valstīs ir gandrīz pilnībā integrēts globālajā tīmeklī. Mēs nerunājam par mūsu vecvecākiem vai attāliem ciematiem, kur viņi pat nezina par kaut kādu internetu.

Iepriekš cilvēks informācijas meklējumos devās tieši uz bibliotēku. Un bieži gadījās, ka vajadzīgā grāmata netika atrasta, tad nācās doties uz citām iestādēm ar arhīviem. Tagad šādas manipulācijas vairs nav vajadzīgas.

Bioloģijā visi sugu nosaukumi sastāv no trim vārdiem, piemēram, mūsu pilnais nosaukums Homo sapiens neanderthalensis. Tagad varam droši pievienot ceturto vārdu internetiys.

Internets pārņem cilvēces prātus

Piekrītu, gandrīz visu informāciju mēs iegūstam no interneta. Mums ir pieejams ļoti daudz informācijas. Pastāstiet par to mūsu sencim, viņš ar nepacietību skatījās monitora ekrānā un sēdēja tur visu savu brīvo laiku, meklējot informāciju.

Tas bija internets, kas cilvēci pacēla principiāli jaunā līmenī, tas veicina jaunas kultūras - jauktas vai daudzveidīgas - radīšanu. Dažādu tautu pārstāvji atdarina un pielāgojas, it kā sapludinot savas paražas vienā katlā. No kurienes tad nāk gala produkts?

Tas ir īpaši noderīgi zinātniekiem, vairs nav jāpulcējas uz konsultācijām valstī, kas atrodas 1000 km no jums. Jūs varat apmainīties pieredzē, nesatiekoties klātienē, piemēram, izmantojot tūlītējos ziņnešus vai sociālos tīklus. Un, ja ir jāapspriež kāds svarīgs jautājums, tad to var izdarīt caur Skype.

Secinājums

World Wide Web ir interneta sastāvdaļa. Tā darbība tiek nodrošināta, pateicoties uzglabāšanas serveriem, kas sniedz informāciju lietotājam pēc pieprasījuma. Pats tīkls tika izstrādāts, pateicoties ASV zinātniekiem un viņu entuziasmam.

Pasaules tīmeklis(angļu World Wide Web) ir izplatīta hiperteksta hipermediju informācijas sistēma, kas nodrošina piekļuvi savstarpēji saistītiem dokumentiem, kas atrodas dažādos datoros, kas ir savienoti ar internetu.

Pasaules tīmeklis sastāv no miljoniem tīmekļa serveru. Lielākā daļa globālā tīmekļa resursu ir hiperteksts. Hiperteksta dokumentus, kas ievietoti globālajā tīmeklī, sauc par tīmekļa lapām.

Vairākas tīmekļa lapas, kuras vieno kopīga tēma, dizains, kā arī savstarpēji saistītas saites un parasti atrodas vienā tīmekļa serverī, tiek sauktas par vietni.

Lai lejupielādētu un apskatītu tīmekļa lapas, tiek izmantotas īpašas programmas - pārlūkprogrammas. Pasaules tīmeklis ir izraisījis īstu revolūciju informācijas tehnoloģijās un interneta attīstības uzplaukumu.

Bieži vien, runājot par internetu, tiek domāts globālais tīmeklis, taču ir svarīgi saprast, ka tie nav viens un tas pats. Vārds tīmeklis un “WWW” tiek lietoti arī, lai apzīmētu globālo tīmekli.

Globālā tīmekļa struktūra un principi Pasaules tīmeklis sastāv no miljoniem interneta tīmekļa serveru, kas atrodas visā pasaulē. Tīmekļa serveris ir programma, kas darbojas datorā, kas savienots ar tīklu, un datu pārsūtīšanai izmanto HTTP protokolu.

Vienkāršākajā formāšāda programma tīklā saņem HTTP pieprasījumu par konkrētu resursu, atrod atbilstošo failu lokālajā cietajā diskā un nosūta to pa tīklu pieprasītājam datoram.

Sarežģītāki tīmekļa serveri spēj dinamiski piešķirt resursus, reaģējot uz HTTP pieprasījumu. Lai identificētu resursus (bieži vien failus vai to daļas) globālajā tīmeklī, tiek izmantoti vienoti resursu identifikatori (URI).

Vienotie resursu meklētāji (URL) tiek izmantoti, lai noteiktu resursu atrašanās vietu tīklā. Šādi URL lokatori apvieno URI identifikācijas tehnoloģiju un DNS domēna nosaukumu sistēmu (Domain Name System) — domēna nosaukums (vai tieši IP adrese ciparu apzīmējumā) ir daļa no URL, lai apzīmētu datoru (precīzāk, vienu no tā tīkla). saskarnes ), kas izpilda vajadzīgā tīmekļa servera kodu.

Lai apskatītu informāciju, kas saņemta no tīmekļa servera, klienta datorā tiek izmantota īpaša programma - tīmekļa pārlūkprogramma. Tīmekļa pārlūkprogrammas galvenā funkcija ir hiperteksta attēlošana.

Pasaules tīmeklis ir nesaraujami saistīts ar hiperteksta un hipersaišu jēdzieniem. Lielākā daļa informācijas internetā ir hiperteksts. Lai atvieglotu hiperteksta izveidi, uzglabāšanu un attēlošanu globālajā tīmeklī, tradicionāli tiek izmantota hiperteksta iezīmēšanas valoda HTML (HyperText Markup Language).

Hiperteksta iezīmēšanas darbu sauc par izkārtojumu; iezīmēšanas meistaru sauc par tīmekļa pārzini vai tīmekļa pārzini (bez defises). Pēc HTML iezīmēšanas iegūtais hiperteksts tiek ievietots failā; šāds HTML fails ir visizplatītākais resurss globālajā tīmeklī [avots nav norādīts 141 dienu].

Kad HTML fails ir pieejams tīmekļa serverim, to sauc par “tīmekļa lapu”. Tīmekļa lapu kolekcija veido vietni. Hipersaites tiek pievienotas tīmekļa lapu hipertekstam.

Hipersaites palīdz globālā tīmekļa lietotājiem viegli pārvietoties starp resursiem (failiem) neatkarīgi no tā, vai resursi atrodas lokālajā datorā vai attālajā serverī. Tīmekļa hipersaites ir balstītas uz URL tehnoloģiju.

Pasaules tīmekļa tehnoloģijas.

Kopumā mēs varam secināt, ka globālais tīmeklis ir balstīts uz "trīs pīlāriem": HTTP, HTML un URL. Lai gan pēdējā laikā HTML ir sācis nedaudz zaudēt savas pozīcijas un piekāpties modernākām iezīmēšanas tehnoloģijām: XHTML un XML. XML (eXtensible Markup Language) ir citu iezīmēšanas valodu pamats.

Lai uzlabotu tīmekļa vizuālo uztveri, plaši tiek izmantota CSS tehnoloģija, kas ļauj daudzām tīmekļa lapām iestatīt vienotus dizaina stilus. Vēl viens jauninājums, kam vērts pievērst uzmanību, ir URN (Uniform Resource Name) resursu nosaukumu sistēma.

Populārs globālā tīmekļa attīstības jēdziens ir semantiskā tīmekļa izveide. Semantiskais tīmeklis ir esošā globālā tīmekļa papildinājums, kas paredzēts, lai tīklā ievietoto informāciju padarītu saprotamāku datoriem. Semantiskais tīmeklis ir tīkla jēdziens, kurā katrs resurss cilvēku valodā būtu nodrošināts ar datoram saprotamu aprakstu.

Semantiskais tīmeklis paver piekļuvi skaidri strukturētai informācijai jebkurai lietojumprogrammai neatkarīgi no platformas un programmēšanas valodām. Programmas pašas varēs atrast nepieciešamos resursus, apstrādāt informāciju, klasificēt datus, identificēt loģiskās sakarības, izdarīt secinājumus un pat pieņemt lēmumus, pamatojoties uz šiem secinājumiem.

Ja semantiskais tīmeklis tiek plaši pieņemts un saprātīgi ieviests, tas var izraisīt revolūciju internetā. Lai izveidotu mašīnlasāmu resursa aprakstu, semantiskais tīmeklis izmanto RDF (Resource Description Framework) formātu, kura pamatā ir XML sintakse un resursu identificēšanai izmanto URI.

Jaunums šajā jomā ir RDFS (RDF shēma) un SPARQL (protokolu un RDF vaicājumu valoda), jauna vaicājumu valoda ātrai piekļuvei RDF datiem.