Пошукавая машына

Пошукавая машына — комплекс праграм, прызначаны для пошуку інфармацыі. Звычайна з’яўляецца часткай пошукавай сістэмы.

Асноўнымі крытэрыямі якасці работы пошукавай машыны з’яўляюцца рэлевантнасць (ступень адпаведнасці запыту і знойдзенага, то бок слушнасць выніку), паўната індэкса, улік марфалогіі мовы.

Класіфікацыя правіць

Па вобласці пошуку (умоўна) правіць

Лакальныя правіць

Прызначаныя для пошуку інфармацыі па якой-небудзь частцы сусветнай сеткі, напрыклад па аднаму ці некалькім сайтам, альбо па лакальнай сетцы. Такія пошукавыя машыны звычайна выкарыстоўваюцца ўнутры прыватных (карпаратыўных) сетак ці ў сістэмах для электроннай камерцыі (інтэрнэт-магазінах). Таму іх таксама часта называют «карпаратыўнымі». Сярод папулярных карпаратыўных пошукавых машын вядомыя такія як: Apache Solr, Endeca, Sphinx, Elasticsearch.

Персанальныя правіць

Служаць для пошуку сярод файлаў на персанальных камп’ютарах ці ў невялікіх лакальных сетках.

Глабальныя правіць

Прызначаныя для пошуку інфармацыі па ўсёй сетцы Інтэрнэт альбо па значнай яе частцы. Уладальнікамі такіх пошукавых машын з’яўляюцца пошукавыя сістэмы Google, Яндэкс і інш. Пошукавыя машыны ажыццяўляюць пошук інфармацыі рознага тыпу, напрыклад тэкстаў, відэа, выяў, геаграфічных аб’ектаў, персанальных даных і інш. Пры гэтым файлы, з якімі можа працаваць пошукавая машына, могуць быць як тэкставага фармату (напрыклад .html, .htm, .txt, .doc, .rtf…), гэтак і графічнага (.gif, .png, .svg…) ці мультымедыйнага (відэа і гук). Пакуль найболей распаўсюджаным з’яўляецца менавіта пошук па тэкставых дакументах.

Пошукавы запыт правіць

Зыходнай інфармацыяй для пошуку з’яўляецца пошукавы запыт.

Функцыі правіць

Пошукавыя машыны выконваюць некалькі функцый:

Пошук спасылак правіць

Пошук спасылак на старонкі і іншыя дакументы сайтаў.

Аўтаматычны правіць

Пошукавая машына шукае спасылкі са старонак сайтаў.

Ручны рэжым правіць

Карыстальнікі самі дадаюць у базу даных пошукавай машыны спасылкі на старонкі сваіх сайтаў

Індэксацыя дакументаў сайтаў правіць

Вынятка з дакументаў інфармацыі, важнай для пошуку, пераўтварэнне гэтай інфармацыі ў фармат, зручны для пошукавай машыны і захаванне гэтай інфармацыі ў базе даных пошукавай машыны

Пошук па базе даных праіндэксаваных дакументаў правіць

Можа складацца з некалькіх этапаў

Знаходжанне дакументаў, адпаведных пошукаваму запыту правіць

Ранжырыванне дакументаў у адпаведнасці з іх рэлевантнасцю пошукавым запытам правіць

Кластэрызацыя дакументаў правіць

Гл. таксама правіць