Интернетте, әртүрлі сайттарда пайдаланушыға әртүрлі ақпараттың үлкен көлемі ұсынылады. Қажетті ақпаратты алу, сұрақтарға жауап іздеу үшін іздеу жүйелері құрылды. Бұл тіркесті естігенде көптеген адамдар Google, Яндекс деп ойлайды. Дегенмен, Интернетте көптеген іздеу жүйелері бар.
Іздеу жүйесі дегеніміз не
Іздеу жүйесі құжаттардың дерекқорынан тұратын бағдарламалық құрал болып саналады. Пайдаланушыларға қажетті сұрауларды енгізуге және тиісті ақпаратпен сілтемелер алуға мүмкіндік беретін арнайы интерфейс беріледі. Белгілі бір адам іздеген нәрсеге барынша сәйкес келетін құжаттар әрқашан іздеу нәтижелерінің жоғарғы жағында болады.
Енгізілген сұрауға сәйкес жасалған іздеу нәтижелері әдетте әртүрлі нәтиже түрлерін қамтиды. Онда веб-беттер, бейне және аудио файлдар, суреттер, pdf файлдары, арнайы өнімдер болуы мүмкін (егер іздеу интернет-дүкенде жүргізілсе).
Іздеу жүйелерінің классификациясы
Қолданыстағы іздеу жүйелері бірнеше түрге жіктеледі. Ең алдымен, дәстүрлі іздеу жүйелерін атап өткен жөн. Мұндай іздеу жүйелері үшін жұмыс принциптері бар сайттардың үлкен саны туралы ақпаратты табуға бағытталған. Іздеу жүйелері әлі де бөлек интернет ресурстарында қолжетімді:
- Интернет-дүкендерде(дұрыс өнімдерді іздеу үшін);
- форумдар мен блогтарда (жазбаларды іздеу үшін);
- ақпараттық сайттарда (қажетті тақырып немесе жаңалықтар бойынша мақалаларды іздеу үшін) және т.б.
Іздеу жүйелері де географиялық ерекшеліктеріне қарай бөлінеді. Бұл классификацияда іздеу жүйелерінің 3 тобы бар:
- Жаһандық. Іздеу бүкіл әлем бойынша жүргізілуде. Бұл топтағы көшбасшы Google іздеу жүйесі болып табылады. Бұрын Inktomi, AltaVista, т.б. сияқты іздеу жүйелері болған.
- Аймақтық. Іздестіру бір тілге біріктірілген елдер немесе елдер тобы бойынша жүргізіледі. Аймақтық іздеу жүйелері кең таралған. Олардың Ресейдегі мысалы - Yandex, Rambler.
- Жергілікті. Іздеу белгілі бір қалада жүргізіледі. Мұндай іздеу жүйесінің мысалы - Tomsk.ru.
Іздеу жүйелерінің құрамдастары
Кез келген іздеу жүйесінде іздеу жүйесінің принциптерін анықтайтын 3 құраушы элемент бар:
- робот (индексатор, өрмекші, тексергіш);
- деректерқоры;
- сұрау өңдеушісі.
Робот – мақсаты дерекқорды қалыптастыру болып табылатын арнайы бағдарлама. Дерекқор сақтайды және сұрыптайдыжиналған барлық ақпарат. Клиент деп те аталатын сұраныс өңдеушісі пайдаланушы сұрауларымен жұмыс істейді. Оның дерекқорға кіру мүмкіндігі бар. Клиент әрқашан бір компьютерде орналаса бермейді. Сұраныс өңдеушісі физикалық байланысы жоқ бірнеше электрондық компьютерлерге таралуы мүмкін.
Іздеу жүйелерінің принциптері
Барлық бар жүйелер бірдей принцип бойынша жұмыс істейді. Мысалы, Интернетке арналған дәстүрлі іздеу жүйелерінің жұмысын қарастырайық. Роботтың жұмысы қарапайым пайдаланушының әрекеттеріне ұқсас. Бұл бағдарлама мезгіл-мезгіл барлық сайттарды айналып өтіп, мәліметтер базасына жаңа беттер мен интернет ресурстарын қосады. Бұл процесс индекстеу деп аталады.
Интернеттегі пайдаланушы іздеу жолағына белгілі бір сұрауды енгізгенде, клиент жұмыс істей бастайды. Бағдарлама бар дерекқорға қол жеткізеді және түйінді сөздер негізінде нәтижелерді жасайды. Іздеу жүйесі белгілі бір ретпен пайдаланушыға сілтемелер береді. Олар сұрауға сәйкес сұрыпталады, яғни сәйкестік ескеріледі.
Әр іздеу жүйесінде сәйкестікті анықтаудың өзіндік әдісі бар. Егер пайдаланушы әртүрлі жүйелерге нақты сұрау жіберсе, ол дәл бірдей нәтижелерді алмайды. Сәйкестікті анықтау алгоритмі құпия сақталады.
Сәйкестік мәліметтері
Қарапайым сөзбен айтқанда, өзектілік – іздеуде енгізілген сөздің немесе сөз тіркесінің сәйкестігіSERP ішіндегі арнайы сілтемелер. Тізімдегі құжаттардың орнына бірнеше нюанстар әсер етеді:
- Құжаттардағы іздеу сөздерінің болуы. Бұл нюанс анық. Құжатта пайдаланушы енгізген сұраудағы сөздер болса, бұл құжаттың іздеу шарттарына сәйкес келетінін білдіреді.
- Сөздердің кездесу жиілігі. Құжатта кілт сөздер неғұрлым жиі пайдаланылса, ол SERP тізімінде соғұрлым жоғары болады. Дегенмен, бәрі қарапайым емес. Сөздерді тым көп пайдалану іздеу жүйесі үшін сапасыз мазмұнның белгісі болуы мүмкін.
Сәйкестікті анықтау алгоритмі өте күрделі. Бірнеше жыл бұрын қажетті кілт сөздері бар, бірақ мазмұны бойынша оларға сәйкес келмейтін сілтемелер іздеу нәтижелеріне енуі мүмкін еді. Қазіргі уақытта іздеу жүйелерінің жұмыс істеу принциптері күрделі. Енді роботтар мәтінді толығымен талдай алады. Іздеу жүйелері әртүрлі факторлардың үлкен санын ескереді. Осының арқасында мәселе жоғары сапалы, сәйкес сілтемелерден құралады.
Сұраныстарды қалай дұрыс құрастыруға болады
Мектепте де бізге сұрақты дұрыс қоюды үйрететін. Бұл біздің қандай жауаптар алатынымызға байланысты. Дегенмен, іздеу жүйелерін пайдалану кезінде бұл ережені сақтау қажет емес. Заманауи іздеу жүйелері үшін адамның сұранысын қандай нөмірде немесе жағдайда жазғаны маңызды емес. Кез келген жағдайда шығыс бірдей нәтижелерді қамтиды.
Іздеу жүйелеріне сұрақтың нақты тұжырымы қажет емес. Пайдаланушы тек дұрыс кілт сөздерді таңдауы керек. Мысал қарастырайық. Біз табуымыз керекәйгілі «Виа-Гра» әйелдер эстрадалық тобы орындайтын «Сенсіз бір күн» әнінің мәтіні. Іздеу жүйесіне хабарласқанда топты атау қажет емес, бұл ән екенін көрсетіңіз. «Сенсіз бір күн» деп жазу жеткілікті. Регистрді сақтаңыз, тыныс белгілері қажет емес. Бұл нюанстарды іздеу жүйелері ескермейді.
Әлемдегі іздеу жүйелерінің рейтингі
Әлемдегі жетекші іздеу жүйесі – Google. Ол 1998 жылы құрылған. Жүйе өте танымал, бұл аналитикалық ақпаратпен расталады. Интернетке түсетін сұраулардың шамамен 70%-ын Google өңдейді. Іздеу жүйесінің деректер базасы өте үлкен. 60 триллионнан астам әртүрлі құжаттар индекстелді. Google қарапайым интерфейсімен пайдаланушыларды тартады. Негізгі бетте логотип және іздеу жолағы бар. Бұл мүмкіндік Google-ды ең минималистік іздеу жүйелерінің бірі деп атауға мүмкіндік береді.
Bing - ең танымал екінші іздеу жүйесі. Ол Google-мен бір жылы пайда болды. Бұл іздеу жүйесін жасаушы – белгілі халықаралық Microsoft корпорациясы. Рейтингтегі төменгі орындарда Baidu, Yahoo!, AOL, Excite, Ask.
Ресейде не танымал
Яндекс - Ресейдегі ең танымал іздеу жүйесі. Бұл қызмет 1997 жылы пайда болды. Алдымен онымен ресейлік CompTek International компаниясы айналысты. Біраз уақыттан кейін іздеу жүйесінде жұмыс істеуді жалғастырған Яндекс компаниясы пайда болды. үшін іздеу жүйесіжылдар бойы үлкен танымалдылыққа ие болды. Оны бірнеше тілде іздеуге болады - орыс, белорус, украин, татар, қазақ, ағылшын, неміс, француз, түрік.
Статистикалық деректерге қарағанда, «Яндекс» Runet пайдаланушыларының 50%-дан астамын қызықтыратыны белгілі. Адамдардың 40%-дан астамы Google-ды қалайды. Пайдаланушылардың шамамен 3%-ы орыс тілді интернет порталы Mail.ru-ды таңдады.
Қорғалған іздеу жүйелері
Бізге таныс әдеттегі іздеу жүйелері балаларға мүлдем сәйкес келмейді. Жас интернет пайдаланушылар ересектерге арналған кейбір материалдарды, психикаға зиянын тигізетін ақпаратты кездейсоқ тауып алуы мүмкін. Осы себепті арнайы қауіпсіз іздеу жүйелері жасалды. Олардың дерекқорларында тек балаларға арналған қауіпсіз мазмұн бар.
Осындай іздеу жүйесінің бір мысалы - Sputnik. Children. Бұл қызмет өте жас. Оны 2014 жылы Ростелеком жасаған. Іздеу жүйесінің басты беті жарқын және қызықты түрде жасалған. Мұнда әртүрлі жастағы балаларға арналған отандық және шетелдік мультфильмдердің кең ауқымы ұсынылған. Сонымен қатар, басты бетте бірнеше айдарларға қатысты ақпараттық сілтемелер бар - «Спорт», «Мен бәрін білгім келеді», «Өзің жаса», «Ойындар», «Технология», «Мектеп», «Табиғат».
Қауіпсіз балалар іздеу жүйесінің тағы бір мысалы - Agakids.ru. Бұл мүлдем қауіпсіз ресурс. Іздеу жүйесі қалай жұмыс істейді? Робот балаларға арналған тақырыптарға қатысты сайттарды ғана айналып өтетіндей конфигурацияланған.ата-аналарға пайдалы. Іздеу жүйесінің мәліметтер базасында мультфильмдер, кітаптар, оқу әдебиеттері, ойындар, бояу кітаптары бар ресурстар бар. Ата-аналар Agakids.ru сайтын пайдалана отырып, балаларының тәрбиесі мен денсаулығына қатысты сайттарды таба алады.
Қорытындылай келе, іздеу жүйелері күрделі жүйелер екенін атап өткен жөн. Олар көптеген мәселелермен бетпе-бет келеді - спам мәселелері, құжаттардың өзектілігін анықтау, сапасыз мазмұнды скринингтен өткізу, мәтіндік ақпараты жоқ құжаттарды талдау. Осы себепті әзірлеушілер интернет іздеу жүйелерінің жұмысына коммерциялық құпия болып табылатын жаңа тәсілдер мен алгоритмдерді енгізуде.