VII. Információkeresés, keresési stratégiák

VII.3. Keresőszavak egymás utáni leválasztása












Az ábra alapján mondjon példát a keresőszavak egymás utáni leválasztására!

A teljesség növelésének heurisztikus módszere a keresőszavak egymás utáni leválasztása (angol neve successive facet strategies). Ilyenkor valamelyik kész építőkockát (keresőfogalmat reprezentáló kifejezések csoportját) vagy annak/azoknak egyes alkotóit töröljük, és a maradékkal keresünk. Fokozatosan leválasztjuk a felesleges találatokat egészen addig, míg megfelelő méretű releváns találati halmazt nem kapunk. Ez persze a leggazdaságtalanabb eljárás, hiszen gondosan megszerkesztett építőkockáról mondunk le.

Ha feltehető, hogy az összes fontos keresőfogalom (építőkocka) felhasználásával túl kevés a találat (vagy egyáltalán nincs találat), vagy egyes építőkockák csak bizonytalanul reprezentálnak valamilyen keresőfogalmat, akkor módosítani kell a keresőfogalmakon alapuló stratégiát. A módosítás lényege, hogy a nagyobb teljességet (sok találatot) eredményező kérdésformával kezdjük a keresést, és a következő kérdésformák fokozatosan csökkentik a találati halmazt a már kezelhető, értelmes méretre.

Az egymás utáni leválogatás módszere:

Az eljárás alapelve, hogy az első két keresőfogalomból ÉS-kapcsolattal származtatott keresőfogalmakat (származtatott építőkockákat) egyesével kell megszerkeszteni, lépésről-lépésre és mindig szükség szerint, nem pedig mindet egyszerre. Minden lépésben az előző keresési eredmény segítségével szerkesztik meg a következő új származtatott keresőfogalmat. E keresés akkor ér véget, amikor a teljesség és a pontosság kívánt mértékét sikerült elérni, előnyös esetben még azelőtt, hogy az összes szóba jöhető építőkockát meg kellett volna szerkeszteni.






Az egymás utáni leválogatás tehát úgy kezdődik, hogy első lépésben létrehozunk egy kezdő találati halmazt, és annak méretét szükség szerint, lépésről-lépésre csökkentjük. A kezdő találati halmaz gyakran dokumentumtípus, nyelv, vagy a kiadás éve. Mindezek a stratégiák olyan találati halmazzal kezdődnek, melyre a nagy teljesség a jellemző, és ennek mértékét csökkentik a további lépésekben az ÉS operátorral összekapcsolt fogalmakkal vagy más módon. Különösen olyankor célszerű a lépésenkénti leválogatás stratégiájával élni, amikor a keresés tárgya, témája nem körvonalazható pontosan, vagy túl általános, vagy egyéb okból hasznos, de nem lényeges korlátozások engedhetők meg a kérdésben.

Példa:
„Diszlexiás gyerekek írás-, olvasásoktatása az alapfokú oktatási intézményekben”.

Attól tarthatunk, hogy ha a szokványos keresőképet adjuk meg: ((diszlexi? ÉS gyer?ek?) ÉS (írás VAGY olvasás)) ÉS (alapfokú oktatási intézmény? VAGY alapfokú oktatás), nem sok találatot kapunk, ha egyáltalán kapunk. Ezért először lekérdezünk a „diszlexia” illetve „diszlexiás” keresőszavakkal (a „gyermek” szót eleve elhagyjuk), ha túl sok a találat vagy nem elég pontos, finomítunk az „írás” és az „olvasás” felhasználásával, és csak ha még ezek után érdemes finomítani a találati halmazt, használjuk föl az „oktatás” vagy az „alapfokú oktatás” vagy az „alapfokú oktatási intézmény” keresőszavakat.

F1              diszlexi?             ha nem elég:
F2              F1 ÉS (írás VAGY olvasás)           ha nem elég:
F3              F2 ÉS ((elemi VAGY általános) EGYÜTT (alapfokú oktatás)
VAGY       oktatási intézmény)
F4              eredményhalmaz