|
VII. Információkeresés, keresési stratégiákVII.3. Keresőszavak egymás utáni leválasztása |
Az ábra alapján mondjon példát a keresőszavak egymás utáni leválasztására! |
A teljesség növelésének heurisztikus módszere a keresőszavak egymás utáni leválasztása (angol neve successive facet strategies). Ilyenkor valamelyik kész építőkockát (keresőfogalmat reprezentáló kifejezések csoportját) vagy annak/azoknak egyes alkotóit töröljük, és a maradékkal keresünk. Fokozatosan leválasztjuk a felesleges találatokat egészen addig, míg megfelelő méretű releváns találati halmazt nem kapunk. Ez persze a leggazdaságtalanabb eljárás, hiszen gondosan megszerkesztett építőkockáról mondunk le. Ha feltehető, hogy az összes fontos keresőfogalom (építőkocka) felhasználásával túl kevés a találat (vagy egyáltalán nincs találat), vagy egyes építőkockák csak bizonytalanul reprezentálnak valamilyen keresőfogalmat, akkor módosítani kell a keresőfogalmakon alapuló stratégiát. A módosítás lényege, hogy a nagyobb teljességet (sok találatot) eredményező kérdésformával kezdjük a keresést, és a következő kérdésformák fokozatosan csökkentik a találati halmazt a már kezelhető, értelmes méretre. Az egymás utáni leválogatás módszere: Az eljárás alapelve, hogy az első két keresőfogalomból ÉS-kapcsolattal származtatott keresőfogalmakat (származtatott építőkockákat) egyesével kell megszerkeszteni, lépésről-lépésre és mindig szükség szerint, nem pedig mindet egyszerre. Minden lépésben az előző keresési eredmény segítségével szerkesztik meg a következő új származtatott keresőfogalmat. E keresés akkor ér véget, amikor a teljesség és a pontosság kívánt mértékét sikerült elérni, előnyös esetben még azelőtt, hogy az összes szóba jöhető építőkockát meg kellett volna szerkeszteni. |
Az egymás utáni leválogatás tehát úgy kezdődik, hogy első lépésben létrehozunk egy kezdő találati halmazt, és annak méretét szükség szerint, lépésről-lépésre csökkentjük. A kezdő találati halmaz gyakran dokumentumtípus, nyelv, vagy a kiadás éve. Mindezek a stratégiák olyan találati halmazzal kezdődnek, melyre a nagy teljesség a jellemző, és ennek mértékét csökkentik a további lépésekben az ÉS operátorral összekapcsolt fogalmakkal vagy más módon. Különösen olyankor célszerű a lépésenkénti leválogatás stratégiájával élni, amikor a keresés tárgya, témája nem körvonalazható pontosan, vagy túl általános, vagy egyéb okból hasznos, de nem lényeges korlátozások engedhetők meg a kérdésben. Példa: Attól tarthatunk, hogy ha a szokványos keresőképet adjuk meg: ((diszlexi? ÉS gyer?ek?) ÉS (írás VAGY olvasás)) ÉS (alapfokú oktatási intézmény? VAGY alapfokú oktatás), nem sok találatot kapunk, ha egyáltalán kapunk. Ezért először lekérdezünk a „diszlexia” illetve „diszlexiás” keresőszavakkal (a „gyermek” szót eleve elhagyjuk), ha túl sok a találat vagy nem elég pontos, finomítunk az „írás” és az „olvasás” felhasználásával, és csak ha még ezek után érdemes finomítani a találati halmazt, használjuk föl az „oktatás” vagy az „alapfokú oktatás” vagy az „alapfokú oktatási intézmény” keresőszavakat. F1 diszlexi? ha nem elég: |