299 104 3MB
Hungarian Pages 181 Year 2011
Információkereső nyelvek III.
Pálvölgyi Mihály
MÉDIAINFORMATIKAI KIADVÁNYOK
INFORMÁCIÓKERESŐ NYELVEK III.
Pálvölgyi Mihály
Eger, 2011
Lektorálta: CleverBoard Interaktív Eszközöket és Megoldásokat Forgalmazó és Szolgáltató Kft.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg.
Felelős kiadó: dr. Kis-Tóth Lajos Készült: az Eszterházy Károly Főiskola nyomdájában, Egerben Vezető: Kérészy László Műszaki szerkesztő: Nagy Sándorné
Kurzusmegosztás elvén (OCW) alapuló informatikai curriculum és SCORM kompatibilis tananyagfejlesztés Informatikus könyvtáros BA, MA lineáris képzésszerkezetben TÁMOP-4.1.2-08/1/A-2009-0005
INFORMÁCIÓKERESŐ NYELVEK III.
Információkereső nyelv III. 1. Bevezetés ....................................................................................................................... 9 1.1 Célkitűzés (kurzusra) ........................................................................................ 9 1.2 A kurzus tartalma .............................................................................................. 9 1.3 A kurzus tömör kifejtése ................................................................................. 10 1.4 Kompetenciák és követelmények .................................................................... 10 1.5 Tanulási tanácsok, tudnivalók ......................................................................... 11 2. Információkereső rendszerek és modellek alaptényezői ......................................... 12 2.1 Célkitűzés ........................................................................................................ 12 2.2 Tartalom .......................................................................................................... 12 2.3 A tananyag kifejtése ........................................................................................ 13 2.3.1 Az információkereső rendszer fogalma és összetevői.............................. 13 2.3.2 Az információkereső rendszer modelljei ................................................. 13 2.3.3 Infokommunikációs stratégiai összefüggések .......................................... 16 2.3.4 Az információhordozók és dokumentumbázis kérdése ............................ 19 2.3.5 Felhasználók, keresési szokások, elvárások, készségek ........................... 23 2.4 Összefoglalás................................................................................................... 25 2.5 Önellenőrző kérdések ...................................................................................... 25 3. Az információkereső rendszerek típusai .................................................................. 27 3.1 Célkitűzés ........................................................................................................ 27 3.2 Tartalom .......................................................................................................... 27 3.3 a tananyag kifejtése ......................................................................................... 27 3.3.1 Az információkereső rendszerek hagyományai ....................................... 27 3.3.2 A ma létező információkereső rendszerek és elemzési szempontjaik ...... 30 3.3.3 Cédulakatalógusok ................................................................................... 31 3.3.4 Online katalógusok .................................................................................. 32 3.3.5 Adatbázisok.............................................................................................. 34 3.3.6 Internetes keresőrendszerek ..................................................................... 36 3.3.7 Internetkatalógusok .................................................................................. 38 3.3.8 Szemantikus web szolgáltatások .............................................................. 40 3.3.9 A rendszerek táblázatos áttekintése ......................................................... 42 3.4 Összefoglalás................................................................................................... 43 3.5 Önellenőrző kérdések ...................................................................................... 43 4. Cédulakatalógusok ..................................................................................................... 45 4.1 Célkitűzés ........................................................................................................ 45 4.2 Tartalom .......................................................................................................... 45 4.3 A tananyag kifejtése ........................................................................................ 46 4.3.1 A cédulakatalógus fogalma, fejlődéstörténete ......................................... 46 4.3.2 Szolgáltatók, dokumentumbázis, használók ............................................ 47 4.3.3 A feltárási stratégiája és eszközei ............................................................ 48 4.3.4 A feltárás munkafolyamatai és jellemzői ................................................. 50 5
INFORMÁCIÓKERESŐ NYELVEK III.
4.3.5 Katalógusépítés – szakkatalógus .............................................................. 52 4.3.6 Katalógusépítés – Tárgyszókatalógus ...................................................... 54 4.3.7 A tárgyi katalógus használata, a keresés jellemzői .................................. 55 4.3.8 Fejlesztés és értékelés .............................................................................. 56 4.4 Összefoglalás................................................................................................... 58 4.5 Önellenőrző kérdések ...................................................................................... 58 5. Online katalógusok az integrált könyvtári rendszerekben ..................................... 59 5.1 Célkitűzés ........................................................................................................ 59 5.2 Tartalom .......................................................................................................... 59 5.3 A tananyag kifejtése ........................................................................................ 60 5.3.1 Online katalógusok .................................................................................. 60 5.3.2 Szolgáltatók, dokumentumbázis, felhasználók ........................................ 60 5.3.3 A feltárási stratégiája, intellektuális és technikai eszközei ...................... 62 5.3.4 A feltárás munkafolyamatai ..................................................................... 65 5.3.5 Az OPAC használata, a keresés és böngészés lehetőségei....................... 65 5.3.6 Tájékoztatás, támogatás ........................................................................... 68 5.3.7 Megjelenítés, hozzáférés .......................................................................... 69 5.3.8 Az OPAC-ok értékelése és fejlesztése ..................................................... 70 5.4 Összefoglalás................................................................................................... 72 5.5 Önellenőrző kérdések ...................................................................................... 72 6. Közös katalógusok ...................................................................................................... 73 6.1 Célkitűzés ........................................................................................................ 73 6.2 Tartalom .......................................................................................................... 73 6.3 A tananyag kifejtése ........................................................................................ 74 6.3.1 A közös katalógus fogalma, fejlődése ...................................................... 74 6.3.2 Előállítók, szolgáltatók, dokumentumbázis, felhasználók ....................... 75 6.3.3 Stratégia, intellektuális és technikai eszközök ......................................... 77 6.3.4 A feltárás munkafolyamatai és jellemzői ................................................. 80 6.3.5 Használat, keresés, böngészés .................................................................. 81 6.3.6 Tájékoztatás, támogatás, hozzáférés ........................................................ 82 6.3.7 A közös katalógusok értékelése, fejlesztése............................................. 83 6.4 Összefoglalás................................................................................................... 85 6.5 Önellenőrző kérdések ...................................................................................... 85 7. Adatbázisok. Alapfogalmak. Nemzetközi adatbázisok ........................................... 86 7.1 Célkitűzés ........................................................................................................ 86 7.2 Tartalom .......................................................................................................... 86 7.3 A tananyag kifejtése ........................................................................................ 87 7.3.1 Az adatbázis fogalma, fejlődéstörténete .................................................. 87 7.3.2 Szolgáltatók, dokumentumbázis, felhasználók ........................................ 88 7.3.3 A feltárás stratégiája, intellektuális és technikai eszközei ....................... 92 7.3.4 Példák az adatbázisok eszközeinek alkalmazására .................................. 93 7.3.5 Használat, keresés, böngészés, támogatás ................................................ 98 7.3.6 Értékelés, fejlesztés .................................................................................. 99 7.4 Összefoglalás................................................................................................. 101 6
INFORMÁCIÓKERESŐ NYELVEK III.
7.5
Önellenőrző kérdések .................................................................................... 102
8. Magyar adatbázisok ................................................................................................. 103 8.1 8.1.Célkitűzés ................................................................................................ 103 8.2 8.2.Tartalom .................................................................................................. 103 8.3 8.3. A tananyag kifejtése ............................................................................... 104 8.3.1 Magyar adatbázisok jellegzetességei ..................................................... 104 8.3.2 A magyar mezőgazdasági szakirodalom feltárási példája...................... 107 8.3.3 A magyar műszaki és gazdasági szakirodalom feltárási példája ............ 110 8.3.4 A magyar orvostudományi szakirodalom feltárási példája .................... 111 8.3.5 A magyar pedagógiai szakirodalom feltárási példája ............................ 113 8.3.6 A humántudományi cikkirodalom feltárási példája ............................... 115 8.3.7 A Magyar Elektronikus Könyvtár feltárási példája................................ 116 8.3.8 A magyar adatbázisok értékelése és fejlesztése ..................................... 119 8.4 8.4. Összefoglalás.......................................................................................... 121 8.5 8.5. Önellenőrző kérdések ............................................................................. 121 9. Automatikus indexelés ............................................................................................. 123 9.1 Célkitűzés ...................................................................................................... 123 9.2 Tartalom ........................................................................................................ 123 9.3 A tananyag kifejtése ...................................................................................... 124 9.3.1 Az automatikus indexelés fogalma és fejlődése ..................................... 124 9.3.2 Az internetes keresőrendszer alapjai ...................................................... 128 9.3.3 A feltárás stratégiája, eszközei és munkafolyamatai .............................. 129 9.3.4 A használat, keresés, támogatás jellemzői ............................................. 132 9.3.5 Az internetes keresők értékelése ............................................................ 134 9.3.6 A fejlesztés új irányai és lehetőségei ..................................................... 136 9.4 Összefoglalás................................................................................................. 140 9.5 Önellenőrző kérdések .................................................................................... 141 10. Internetkatalógusok ................................................................................................. 142 10.1 Célkitűzés ...................................................................................................... 142 10.2 Tartalom ........................................................................................................ 142 10.3 A tananyag kifejtése ...................................................................................... 143 10.3.1 Az internetkatalógus fogalma, fejlődése.......................................... 143 10.3.2 Szolgáltatók, dokumentumbázis, felhasználók ................................ 144 10.3.3 Stratégia, intellektuális és technikai eszközök, munkafolyamatok .. 145 10.3.4 Használat, keresés, böngészés, támogatás ....................................... 146 10.3.5 Általános és tematikus internetkatalógus példák ............................. 148 10.3.6 Értékelés, fejlesztés ......................................................................... 151 10.4 Összefoglalás................................................................................................. 152 10.5 Önellenőrző kérdések .................................................................................... 153 11. Szemantikus web szolgáltatások ............................................................................. 154 11.1 Célkitűzés ...................................................................................................... 154 11.2 Tartalom ........................................................................................................ 154 11.3 A tananyag kifejtése ...................................................................................... 155 7
INFORMÁCIÓKERESŐ NYELVEK III.
11.3.1 Fogalma, fejlődése ........................................................................... 155 11.3.2 A szemantikus web stratégiája, modelljei, eszközei ........................ 157 11.3.3 Alkalmazások és használat .............................................................. 163 11.3.4 Szemantikus keresők ....................................................................... 166 11.3.5 A szemantikus web fejlődésének értékelése, a fejlesztés távlatai.... 167 11.4 Összefoglalás................................................................................................. 169 11.5 Önellenőrző kérdések .................................................................................... 170 12. Összefoglalás ............................................................................................................. 171 12.1 A kurzusban kitűzött célok összefoglalása.................................................... 171 12.2 Tartalmi összefoglalás ................................................................................... 171 12.2.1 A tananyagban tanultak részletes összefoglalása............................. 172 12.2.2 Információkereső rendszerek és modellek....................................... 172 12.2.3 Az információkereső rendszerek típusai .......................................... 173 12.2.4 Cédulakatalógusok........................................................................... 173 12.2.5 Online katalógusok .......................................................................... 173 12.2.6 Közös katalógusok ........................................................................... 174 12.2.7 Nemzetközi adatbázisok .................................................................. 174 12.2.8 Magyar adatbázisok ......................................................................... 175 12.2.9 Automatikus indexelés .................................................................... 175 12.2.10 Internetkatalógusok ........................................................................ 176 12.2.11 Szemantikus web alkalmazások ..................................................... 176 13. Kiegészítések ............................................................................................................. 177 13.1 Irodalomjegyzék ............................................................................................ 177 14. Ábrajegyzék .............................................................................................................. 182 15. Médiaelemek ............................................................................................................. 183 16. Tesztek ....................................................................................................................... 184 16.1 Próbateszt ...................................................................................................... 184 16.2 Záróteszt A. ................................................................................................... 187 16.3 Záróteszt B. ................................................................................................... 190 16.4 Záróteszt C. ................................................................................................... 193
8
INFORMÁCIÓKERESŐ NYELVEK III.
1.
BEVEZETÉS
1.1 CÉLKITŰZÉS (KURZUSRA) A könyvtárak életében a különféle információkereső rendszerek gyors fejlődése új megoldásokat, s egyben új kihívásokat jelentett. Jegyzetünk harmadik kurzusában segíteni kívánunk abban, hogy a dokumentumok tartalmi feltárása és az információkereső nyelvek alkalmazása szempontjából alapvetően fontos információkereső rendszereket rendszerezett formában megismerje. A tananyag nagy vonalaiban egy hasonló című, 7 évvel ezelőtt készült jegyzetre épül. (Pálvölgyi Mihály: Információkereső nyelvek 3.) Ebbe a szerkezeti keretbe épültek be a bekövetkezett jelentős változások. Célunk, hogy Ön a stabilnak bizonyult elemeken túl, megismerje az eltelt időszak változásait, az összefüggéseket és trendeket is. Kurzusunk kapcsolódik az Információkereső nyelvek c. tantárgy első félévében (alapvető ismeretek + Egyetemes Tizedes Osztályozás), ill. második félévében (természetes nyelven alapuló információkereső nyelvek) tanultakhoz. Célunk, hogy építve az első két félév eredményeire, betekintést nyerjen napjaink széles körben használt információkereső rendszereinek (cédulakatalógus, online katalógus, adatbázis, internetes keresőszolgáltatások, internetes katalógusok, szemantikus alkalmazások) legfontosabb jellemzőibe. Ismerje meg fogalmi összefüggéseiket, fejlődéstörténetüket, szolgáltatóikat, dokumentumbázisaikat, használóikat. Nyerjen áttekintést stratégiáikról, intellektuális és technikai eszközeikről, használatuk, keresésük jellegzetességeiről. Az egyes információkereső rendszertípus tárgyalását követően fontos, hogy értékeljük azt, és felvázoljuk a fejlesztés lehetőségeit és teendőit. Ezek a rendszerek egymás mellett léteznek, sok tekintetben kiegészítik egymást, és a könyvtárak használói szinte naponta igénybe veszik szolgáltatásaikat. Az egyes leckéket úgy méreteztük, hogy képes legyen egyenletes tempóban haladni.
1.2 A KURZUS TARTALMA 1. Bevezetés 2. Információkereső rendszerek és modellek 3. Az információkereső rendszerek típusai 4. Cédulakatalógusok 5. Online katalógusok 6. Közös katalógusok 7. Nemzetközi adatbázisok 8. Magyar adatbázisok 9. Automatikus indexelés 10. Internetkatalógusok 11. Szemantikus web alkalmazások
9
INFORMÁCIÓKERESŐ NYELVEK III.
1.3 A KURZUS TÖMÖR KIFEJTÉSE A kurzus négy modulból tevődik össze. Az 1. modul (2-3. lecke) az információkereső rendszerek és modellek alapvető kérdéseivel foglalkozik. A bevezetést követően a 2. lecke – a korábban tanultakra építve- felidézi az információkereső rendszerek lényegi ismérveit (fogalmát, összetevőit, az illesztéses és asszociatív modell fő ismérveit) majd a direktindirekt szolgáltatási, illetve a tudásszervezési modellt mutatja be. Ezt követően feltárja a könyvtár mint tartalomszolgáltató intézmény infokommunikációs stratégiai összefüggéseit, ezzel összefüggésben a feltárandó dokumentumbázis kérdéseit, végül a felhasználók változó szokásait, elvárásait. A 3. lecke áttekintést ad az információkereső rendszerek könyvtári és bibliográfiai hagyományairól, majd ezek 19–20. századi megvalósulási formáiról. Ezt követően bemutatja a ma létező legfontosabb információkereső rendszertípusok elemzésének szempontjait, majd a megadott szempontok szerint tömör, rendszeres áttekintést ad a cédulakatalógusok, online katalógusok, közös katalógusok, adatbázisok, internetes keresőrendszerek, internetkatalógusok, illetve a szemantikus web szolgáltatások fő jellemzőiről. A 2. modul (4-6. lecke) a katalógusok fő megvalósulási formáival ismertet meg. A 4. lecke a cédulakatalógusok, az 5. lecke az online katalógusok, a 6. lecke a közös katalógusok ismérveit most már részletesen, elemző módon, példákon keresztül tárgyalja. (Az online katalógusok, illetve a közös katalógusok már egyben átvezetnek az adatbázisok világába.) A 3. modul (7-8. lecke) a megadott szerkezetben az adatbázisok sajátos információkereső rendszereit vizsgálja. Ezen belül a 7. lecke átfogó áttekintést ad, majd a nemzetközi adatbázisok sajátos ismérveit vizsgálja részletesen, példákkal is illusztrálva. A 8. lecke ezekre az ismeretekre is építve a magyar adatbázisok sajátos jellemzőit vizsgálja, konkrét példákkal. Ily módon, a modul lehetőséget ad arra, hogy a 8. lecke végén összehasonlítsuk a nemzetközi, illetve magyar szakterületi adatbázisok minőségi jellemzőit két, egymáshoz kapcsolódó átfogó felmérés eredményeire támaszkodva. A 4. modul (9-11. lecke) az internetes dokumentumok feltárására szerveződött rendszereket vizsgálja. Ezen belül a 9. lecke az automatikus indexelés és osztályozás alapvető tudnivalóit, majd az internetes keresőszolgáltatások ismérveit taglalja, majd értékeli a követett szempontrendszer szerint. A 10. lecke az intellektuális munkára épülő internetkatalógusok fogalmát, ismérveit, alkalmazásait vizsgálja, majd értékeli azokat, és felvázolja a fejlesztés teendőit, lehetőségeit. A 11. lecke a kibontakozó szemantikus web fejlesztéseket, azok fogalmát, eddigi alkalmazásait, eredményeit, majd a távlati lehetőségeit elemzi, különös tekintettel a könyvtárosok részvételére.
1.4 KOMPETENCIÁK ÉS KÖVETELMÉNYEK Ismeretek elsajátítása és fejlesztése – a tudás reprezentálását és keresését lehetővé tevő információkereső rendszertípusok (IKR-típusok) rendszerezett fejlődéstörténeti megismerése a bibliográfiai rendszereken, cédulakatalóguson, online katalógusokon, adatbázisokon, automatizált megoldásokon át az intelligens szemantikus web alkalmazásokig. Képességek fejlesztése – az IKR-típusok egységes elvek szerinti megközelítésének, elemzésének a képessége, a hasonlóságok, különbségek, összefüggések, alternatív megoldások, fejlesztési lehetőségek feltárása.
10
INFORMÁCIÓKERESŐ NYELVEK III.
Készségek, jártasságok lépésről lépésre történő fejlesztése – a vizsgált IKR-típusok funkcióinak, profiljainak megfelelő tárgyi feltárás és keresés, és azzal összefüggő tevékenységek elemzésének elsajátítása, gyakorlása, feladatok megoldása. Információ- és tudásfeltárási szerepek és eszközök változó formáinak megismerése, felismerése, elismerése, megbecsülése – a szerep stabil és dinamikus elemeinek felismerése, alternatíváinak számbavétele, nagy egyéniségek hozzájárulásnak megismerése, a szereppel való azonosulás. Énkép, önkép, önértékelés – az IKR-típusok fejlődéstörténetében való megismerése, a pozitív, értékes hagyományok megbecsülése révén nagyobb tudatosság, magabiztosság, a ma is használt és fejlesztett IKR-ekben való feltárás és keresés módszereinek megismerése, a globális mellett a magyar hozzájárulás tudatosítása. Pozitív személyiségvonások fejlesztése (céltudatosság, összpontosító képesség, rendezettség, kreativitás, csapatmunka). Ld. bővebben a BA képzéssel szemben megfogalmazott Képzési és Kimeneti Követelmények, illetve az európai uniós információs szakemberekkel kapcsolatban elvárt általános képesség jegyzékét. 1 2 Motiváltság – a felfedezés élménye, érdekes, hasznos információforrások megismerése az IKR-ek rendszerezett tárgyalása során, a megismerési folyamat élményként való felfogása.
1.5 TANULÁSI TANÁCSOK, TUDNIVALÓK Az e-tananyag jellegéből fakad a lehetőség, hogy az IKR-ek legfontosabb típusait élő, valóságos állapotukban, szemléletesen, életszerűen, „virtuális IKR-látogatások” révén is tanulmányozza. Az elméleti és módszertani ismereteket ilyen formában közlő leckékhez önellenőrző kérdések, tesztek kapcsolódnak, erősítve az ismeretek megszilárdítását, a bizonytalanságok feltárását és megszüntetését. Mindezekhez feladatmegoldások is kapcsolódnak, az egyes IKR-modellekben alkalmazott IKNY-ek alapján. E kurzus tanulása során is fontos, hogy a tárgyat az informatikus könyvtáros képzés más tárgyaival való összefüggésében is lássa. A tantárgy lehetséges kapcsolatai: Elektronikus dokumentumok feldolgozása, Számítógépes hálózatok, Adatbázis-kezelés, Integrált könyvtári rendszerek, Virtuális könyvtárak, Tudásbázisok alkalmazása, illetve Internetes keresőrendszerek működése.
1
2
LIS Euroguide. Kompetenciák, tulajdonságok, minősítési szintek. Bp., 2007. Könyvtári Intézet, 133 p. LIS EUROGUIDE. 1. kötet. Európai információs szakemberek kompetenciái és tulajdonságai. Országos Széchényi Könyvtár Könyvtári Intézet, 2006. ADBS Éditions 2004. URL: http://www.ki.oszk.hu/old/dok/euroguide.pdf
11
INFORMÁCIÓKERESŐ NYELVEK III.
2.
INFORMÁCIÓKERESŐ RENDSZEREK ÉS MODELLEK ALAPTÉNYEZŐI
2.1 CÉLKITŰZÉS A lecke tanulmányozása után legyen képes − az információkereső rendszer (IKR) fogalmának árnyalt értelmezésére, − a rendszerelméleti – illesztéses - és az asszociatív modelltípusok lényegi jegyeinek, alkalmazásainak kifejtésére, − a szolgáltatás direkt/indirekt jellege szerinti modelltípusok kifejtésére, − az adat-, ill. információszintet meghaladó, azokat integráló tudásszervező, tudásmenedzsment rendszerek lényegi ismérveinek kifejtésére, − a vizsgálandó IKR-típusok fejlesztéséhez szükséges kritériumok kifejtésére (stratégia, dokumentumbázis, felhasználói igények és szokások, IKR-fejlesztés közös alapelvei).
2.2 TARTALOM 1. Az információkereső rendszer fogalma és összetevői 2. Az információkereső rendszer modelljei − A rendszerelméleti és asszociatív modell fő ismérvei − A direkt/indirekt szolgáltatás szerinti modellek − A tudásszervezési modell 3. Infokommunikációs stratégiai összefüggések − Tartalom, informatika, távközlés konvergenciája − A stratégiafejlesztés és együttműködés kérdései − A könyvtárak stratégiai partnerei 4. Az információhordozók és dokumentumbázis kérdése − Az információhordozók kérdése − A digitális dokumentumbázis alakulása − A bázis feltérképezése, a források típusai − Forrástípusok a feldolgozottság foka szerint − Az értékelés, válogatás növekvő szerepe 5. Felhasználók, szokások, elvárások, készségek − A felhasználók elvárásai − A felhasználók információs készségei − A felhasználók képzése és támogatása
12
INFORMÁCIÓKERESŐ NYELVEK III.
2.3 2.3.1
A TANANYAG KIFEJTÉSE Az információkereső rendszer fogalma és összetevői
Az információkereső rendszer fogalmát és összetevőit az Információkereső nyelvek 1. kurzus 6. leckéjében első megközelítésben már elemeztük. Kérjük, frissítse fel annak anyagát a továbbiak jobb megértéséhez! Itt kiindulópontul az információkereső rendszer alapvető ismérveit vesszük sorba. A rendszerelméleti meghatározás szerint: − az információs rendszer alrendszere, − a felhasználóval való kommunikációt hivatott biztosítani, − a könyvtáron belül ezt a funkciót a tájékoztató apparátus látja el, − amelybe a katalógustól a bibliográfiákon és adatbázisokon át a személyes tájékoztatásig minden beletartozik.3 A logikai meghatározás szerint: − dokumentumok és információk szervezett gyűjteménye, − melyet megfelelő szellemi és műszaki segédeszközökkel láttak el, − hogy az abban található dokumentumok, információk − a feltett kérdésekkel (keresőképekkel) összehasonlíthatók − és a kérdező számára találatként kiadhatóak legyenek.4 Az információkereső rendszer összetevői Az információkereső rendszer (IKR) az információs rendszer részeként négy részfunkciót betöltő, azokat integráló: információfeldolgozó, -tároló, -rendszerező és -kereső rendszer. Ahhoz, hogy a negyedik funkció (a keresés) jól működjön, a megelőző három funkciónak jól kell teljesíteni! Az IKR a feldolgozási, tárolási, rendszerezési és keresési funkcióit az összetevő, önmagukban is komplex részek összehangolt működésével látja el. Ennek megfelelően bonyolult, soktényezős rendszer. 2.3.2
Az információkereső rendszer modelljei
A rendszerelméleti és asszociatív modell fő ismérvei Az Információkereső nyelvek I. kurzus 6. leckéjében már elemeztük az információkereső rendszer modelljeit is, s megismertük a két legfontosabbat: a rendszerelméleti (illesztéses, összehasonlításos), ill. az asszociatív modellt. A rendszerelméleti modell
3 4
HORVÁTH Tibor – SÜTHEŐ Péter: Tartalmi feltárás. In: Könyvtárosok kézikönyve. Szerk. Horváth Tibor, Papp István. Bp.: Osiris, 2001, 28. p. UNGVÁRY Rudolf: Az osztályozás alapjai: bevezetés az információkereső nyelvek elméletébe. Bp.: OSZK KMK, 1982. 47. p.
13
INFORMÁCIÓKERESŐ NYELVEK III.
Megtanultuk, hogy az illesztésre épülő rendszerelméleti modell elsősorban a már hagyományosnak tekinthető rendszerekre: a cédulakatalógusokra, bibliográfiákra, de jórészt az online katalógusokra, adatbázisokra is vonatkozik. A keresést segítő szellemi és technikai segédeszközök köre folyamatosan bővül, s közülük számossal ismerkedtünk már az Információkereső nyelvek 1. és a 2. kurzusa során. Az illesztést, hasonlítást segítő fejlesztési eszközökre visszatérünk az olyan IKR-típusok sajátosságainak részletes tárgyalásakor, mint az online katalógusok (OPAC-ok), a közös katalógusok, és adatbázisok. Az asszociatív modell Az asszociatív modell a teljes mértékben digitális környezetre, a digitális univerzumban való felfedezéses tájékozódás eseteire (böngészés, szörfölés, lekérdezés) vonatkozik. A hálózati (internetes) környezet adta lehetőségeket használja ki, beleértve a HTML, ill. XML-technika adta lehetőségeket. Az asszociatív modell elemei a következők: − keresőkérdések − keresőnyelvek+hiperhivatkozások − kognitívumok (szövegek) + szurrogátumok (származékszövegek). Az asszociatív modell, nevéből következően az asszociációs lehetőségek kihasználására, a hipertext-linkek követésére, az azzal járó „felfedezésre” épít. Hangsúlyozni kell, hogy ez a modell akárcsak az illesztéses modell, a lehetőséget adja meg, amellyel hatékonyan élni csak a felhasználó szellemi aktivitásával lehet! Vannevar Bush volt a hipertextre épülő asszociatív modell „megálmodója”. 1945-ben kezdett el dolgozni egy olyan keresési eljáráson, melyben a szakirodalmat olvasó és feldolgozó szakember tudása hozzáadott értékként jelenik meg a szövegek tartalma mellett. Az eljárása azon alapult, hogy a különböző dokumentumok, szövegrészletek (kognitívumok) között explicit módon nem jelölt, de a szakember számára felismerhető tartalmi, asszociatív kapcsolatokat rögzíti, láthatóvá teszi. Ily módon a kognitívumoknak olyan hálózata keletkezik, amelyik az eredeti, a szöveg lineáris felépítésén túlmutató tartalmi kapcsolatrendszeren alapszik. Ted Nelson segítette a gondolat technikai megvalósulását 1965-ben. Elképzelésének megfelelően az egy adott témán dolgozó tudósok, szakemberek gondolataikat olyan formában rögzíthetik, hogy mutató, kapcsolat (hiperlink) segítségével jelzik annak összefüggéseit más, már leírt gondolatokkal. Kurzusunkban feltárjuk azokat a lehetőségeket, amelyeket a digitális, a virtuális könyvtárak, az automatikus osztályozó és indexelő rendszerek, az internetes katalógusok, a nyelvtechnológiai, ill. szemantikus alapon dolgozó rendszerek nyújtanak. Az asszociatív modell megvalósulása a digitális univerzumban már a közvetlen felhasználható információk világának felfedezését is magában foglalja, a szurrogátumból az eredeti dokumentumokba való közvetlen, kötetlen átlépés adta lehetőségekkel.
14
INFORMÁCIÓKERESŐ NYELVEK III.
A direkt-indirekt szolgáltatás szerinti modellek Nézzük meg a felosztást aszerint, hogy az alkalmazott keresőrendszer a felhasználó kérdéseire közvetlenül használható adatokat ad-e, vagy „csupán” hivatkozási információkat! A hivatkozási (forrásra hivatkozó, referensz) rendszerek „csak” másodlagos információkat szolgáltatnak. Olyan felhasználókat szolgálnak ki, akiket nem meghatározott tények, hanem meghatározott szakterület állapota, szemlejellegű áttekintése érdekel. Az adatkereső rendszerek (vagy adatszolgáltató rendszerek) közvetlenül hasznosítható faktografikus, tényadatokat szolgáltató rendszerek, kérdés-válasz típusú rendszerek. Az adatkereső rendszerek a legkülönfélébb területeken szolgáltatnak olyan tényadatokat, melyek értelmezése, mérlegelése a döntéshozatalt közvetlenül segítheti. Ilyenek pl. a tőzsdei árfolyamok, a termelési, szolgáltatási, piaci adatok, a cégadatok, a népszámlálási adatok, a demográfiai adatok, internet-hozzáférési adatok, tartalomszolgáltatási adatok. Ide tartoznak a vállalati információs rendszerekben tárolt és hozzáférhető adatok: a trendadatok, piaci, termelési, pénzügyi, személyzeti, vezetői, marketing, kontrolling stb. adatok. A közérdekű direkt tájékoztatás kategóriájába tartoznak az Európai Unió adatbázisai, köztük az Eurostat adatbázis, az Egyesült Nemzetek Szervezete átfogó és szakosított adatbázisai, a Világbank (World Bank) széleskörű, az egyes országok közötti interaktív összehasonlításra is lehetőséget adó adatbázisai, helyet adva a Világbank tanulástámogató programjának is). A fentiekhez kapcsolódik az internetes szolgáltatásokban a mindennapi élet legkülönfélébb kérdéseivel, problémáival, igényeivel, szükségleteivel összefüggő tények, adatok keresése, lekérdezése. Ehhez az eszközcsoporthoz számos különböző megoldás kapcsolódik, pl. a WOLFRAM ALPHA vagy az Ask.com. Ide tartoznak az egyes emberek és vállalkozások mindennapi ügyeivel kapcsolatos tények, adatok is (pl. menetrend-adatok, elérhetőségi adatok, cégadatok, intézményi adatok), de az e-társadalom, e-közigazgatás, e-kultúra különféle adatcsoportjai is. A keresőrendszer fogalmát tehát joggal vizsgálhatjuk a direkt/indirekt modellpár szerint. A modellpár mindkét típusa egyaránt fontos, s nem zárja ki egymást! A felhasználó az „adatok birtokában” feljebb jut az adat-információ-tudás piramison, az adatok értelmezésének, az „információknak a szintjére”, majd az információkat a tudásrendszerébe integrálva, a „tudás szintjére”, s végül az alkalmazásképes kompetencia szintjére. E lehetőség érvényesítését szolgálja a tudásszervezési rendszermodell.
A tudásszervezési rendszermodell Az ismeretszervezési rendszerekről már az Információkereső nyelvek 1. félévében is ismertetést adtunk, mint sajátos célirányos rendszerektől. Nyomukban alakultak ki az információszervezési, és azok eredményeiket integrálva az információmenedzsment rendszerek.
15
INFORMÁCIÓKERESŐ NYELVEK III.
Az 1990–2000-es években – a fenti fejleményekre építve – széles körben jelent meg a tudásszervezés (knowledge organisation), alakultak ki tudásszervezési rendszerek, és bontakoztak ki az ezekkel kapcsolatos alkalmazások – összefüggésben az adatok és információk digitális integrációjával, a feldolgozási szintjeinek integrálásával, a magasabb szinteken történő feldolgozhatósággal. A tudásszervezési rendszerek olyan sajátos rendszerek, melyek segítségével a dokumentumokban rögzített tudás differenciált feltárása fejlett technológiai és szellemi eszközök igénybevételével történik, úgy, hogy az adat-információ-tudás spektrumon belül a tudásösszetevőre tevődik a hangsúly. A fenti alapokon létrejövő tudásmenedzsment rendszerek fontos ismérve, hogy adott vállalati, intézményi stratégiák teljesítése érdekében integrálják az explicit és tacit tudás erőforrásait. Ugyancsak fontos ismérvük, hogy az emberi intelligencia, illetve a gépi intelligencia szervesen kiegészíti egymást, szerves rendszert alkot, melyben a gépbe táplált intelligencia hatékonysága folyamatosan nő. Az egyes információkereső rendszertípusok hatékony működtetése szempontjából – a fentiekből követően – szintén elengedhetetlen az emberi tényező (intellektuális eszközök) és az alkalmazott technológiák adott cél megvalósítására irányuló szintézise (ezt a szempontot külön elemezzük az egyes keresőrendszer-típusok stratégiája alatt, pl. online katalógusok, adatbázisok, internetes katalógusok stb.) A digitális információmennyiség gyors ütemű növekedése, az információs túlterheléssel való megbirkózás megköveteli, hogy az információ- és tudásfeldolgozásban az idő-, és munkaigényes, ismétlődő, manuális folyamatokat, szellemi tevékenységeket növekvő mértékben tegyük automatikussá. 2.3.3
Infokommunikációs stratégiai összefüggések
Tartalom, informatika, távközlés konvergenciája A globális digitális univerzumban az egyes államcsoportok, államok fejlődése sajátos tendenciák szerint alakul. Az Amerikai Egyesült Államok, az Európai Unió, illetve a távolkeleti országok a legfontosabb fejlesztési gócpontok. A 2000. évben 2010-ig megfogalmazott Lisszaboni stratégiát követően, a Digitális Menetrend az, ami a 2020-ig tartó teendőket meghatározza (adat-, információkereső és szolgáltató rendszerek digitális alapokra helyezése – az e-közigazgatás, az e-gazdaság, az e-egészségügy, e-kultúra … területén.) A fejlesztések irányai és módjai is egyértelműek. A fejlesztés motorja az informatika, távközlés és a tartalom (média) konvergálódása. Ezek a „multimédiás háromszög”5 alapelemei. (Ld. melléklet.) Mindegyik felöl középre irányul a nyíl, a három tényező ott találkozik, egymásba csúszik, integrálódik, „konvergálódik”.
5
Közszolgálatiság a digitális korban: a Magyar Rádió Rt. Stratégiája 2002–2005. http://www.mrka.hu/text/mr_startegia_2002_2005.php/
16
INFORMÁCIÓKERESŐ NYELVEK III.
1. kép
A multimédiás háromszöget jellemző koncentráció
A konvergálódás azt jelenti, hogy sajátos, új termékek és szolgáltatások jelennek meg, az informatika és távközlés fejlődésének köszönhetően. A szöveget, ábrát, hangot, képet, mozgóképet stb. integráló digitális multimédia kiemelt fejlesztési tényező. Az új tartalomtípusok és tartalomszolgáltatások informatikai és mobilhálózatokon keresztül érhetők el. Megjelent az új jelszó: „Bármit, bárhonnan, bármikor!”. Ezek az infokommunikációs fejlemények hatnak a tudásmegosztás, tudásreprezentáció világára: a tartalmi termékek, szolgáltatások változásával járnak! Szakmánk alapvetően érintett abban, hogy a felhasználók által igénybevett új lehetőségekre, tényekre reagáljon. (Jellemző, hogy pl. a Kongresszusi Könyvtár feldolgozási gyakorlatába bevonta a web.2.0 produkálta tartalmak egy részét!) Az infokommunikációs-informatikai-média szektorban (1) távközlési szolgáltatók, (2) műsorszórók, (3) (3) elektronikus kiadók, (4) internet szolgáltatók, (5) tartalomelőállítók, (6) és szoftverfejlesztők tevékenykednek. (Ld. Szektorszereplők – a mellékelt ábrában). Látható, hogy fő tevékenységeik mellett egyre több terjeszti ki részlegesen tevékenységét más területekre a többtényezős infokommunikációs értékláncban.6
6
SALLAI Gyula: Technológiai fejlődés és jogalkotás, 2002. URL:
http://www.jogiforum.hu/publikaciok/56
17
INFORMÁCIÓKERESŐ NYELVEK III.
2. kép
A szektorszereplők az értéklánc mentén
A könyvtárak, funkciójuktól, méreteiktől függően fontos szerepet, szerepeket játszhatnak ebben az értékláncban, részt vállalva a tartalom-előállításban, a digitalizálásban, a digitális tartalmak közvetítésében, az elektronikus kiadásban, az internetes szolgáltatásban, és a használati feltételek biztosításában. A könyvtárak tevékenységén belül az utóbbi 10 évben alapvetően megnőtt a feldolgozott, kezelt, szolgáltatott digitális tartalom aránya. E vonatkozásban nagyobb az esély arra, hogy megvalósuljon Sütheő Péter 2001-ben megfogalmazott „jóslata”, 7 mely szerint a digitális szakkönyvtárakban néhány éven belül hazánkban is napi gyakorlattá válhat pl. az automatikus indexelés vagy szövegrészek automatikus kiválasztása (szegmentálás), esetleg ezeknek – a mai értelemben hagyományosnak tekintett dokumentumok helyett – bibliográfiai egységként való kezelése. Az Európai Uniós Digitális Menetrendet követő infokommunikációs stratégiában és megvalósításában tehát fontos szerep jut a könyvtáraknak, megújított, továbbfejlesztett információkereső rendszereivel, közvetítő szolgáltatásaival. A tét az interneten digitális formában elérhető tudás hatékony közvetítése!
A stratégiafejlesztés és együttműködés keretei A tudásreprezentációs szolgáltatások fejlesztéséhez részletes és alapos helyzetelemzés alapján fogalmazhatjuk a stratégiánkat, a megvalósítás lépéseit, ütemtervét. Egyaránt mérlegelni kell az emberi tényezőt, és az alkalmazott technológiát. Nem szabad elfeledkezni a 7
SÜTHEŐ Péter: Elektronikus, digitális, virtuális könyvtárak In: Könyvtárosok kézikönyve. 3. kötet – A könyvtárak rendszere. Szerk. Horváth Tibor, Papp István. Bp.: Osiris, 2001
18
INFORMÁCIÓKERESŐ NYELVEK III.
Davenport és Prusak8 által hivatkozott „1/3 törvényéről”, amely kimondja, hogy ha időnknek, energiánknak és pénzünknek több mint egyharmadát a technológiára fordítjuk, akkor más fontos tényezőket elhanyagolunk: pl. a tartalmat, a szervezeti kultúrát, a motivációs rendszereket és így tovább. (Davenport, Prusak, 2001, 185. p.) A stratégia megfogalmazása során meg kell határozni a feldolgozó szakember (feldolgozó könyvtáros, információszervező, tudásszervező) változó és új feladatait, szerepeit. Az új fejlődési szakaszban még jobban kibontakozhat a könyvtárosokban, könyvtárakban levő potenciál a tudásszervezésben (az információk elemzésében, szűrésében, értékelésében, a felhasználók felkészítésében), a szabályozott, nagy pontosságot adó IKNY-i elemek használatában. Nő integráló, értékelő, feltáró, rendszerező és szolgáltató szerepük.
A könyvtárak stratégiai partnerei A digitális univerzumban többféle háttérrel rendelkező szakmai csoport, szolgáltató, fejlesztő tevékenykedik meghatározott célok érdekében. A sikeres programokhoz a könyvtári, információs szakértelem mellett elengedhetetlen az informatikai (rendszerinformatikai, szoftverfejlesztő), az alkalmazott nyelvészeti, az infokommunikációs, valamint kommunikációs és média szakértelem is! A közös sikerhez még intenzívebb együttműködés szükséges a tartalomszolgáltatás, a távközlés és informatika és más kapcsolódó területek (pl. kognitív tudomány) között. A partneri kapcsolatok kialakultak, fejlődtek (pl. az online katalógusok, közös katalógusok, adatbázisok fejlesztésében), de még intenzívebbé kell válniuk! 2.3.4
Az információhordozók és dokumentumbázis kérdése
Az információhordozók kérdése Az első, amit közelebbről meg kell vizsgálnunk, az információhordozó kérdése. A papírkönyvtártól a digitális könyvtárig terjedő út három fő szakasza: a papírkönyvtári, az automatizált könyvtári, illetve a digitális könyvtári. Az eredeti szövegek, A szurrogátumok hordozói információk hordozói Papír /karton/ digitális Papír PAPIRKÖNYVTÁR AUTOMATIZÁLT KÖNYVTÁR Digitális DIGITÁLIS KÖNYVTÁR Ezek összefüggéseit elsők között Michael Buckland vizsgálta.9 A papírkönyvtárban mind az eredeti szövegek, mind a róluk készített szurrogátumok papírhordozón vannak 8 9
DAVENPORT, Thomas H. – PRUSAK, Laurence: Tudásmenedzsment. Bp.: Kossuth Kiadó, 2001. 185 p. BUCKLAND, Michael: A könyvtári szolgáltatások újratervezése. (Redesigning library services: A manifesto.) Bp.: OSZK, 1998. 102 p. A függelékben: Buckland, Michael: What will collection developers do? – In: Information Technology and Libraries. – Vol. 14. No. 3. (Sept. 1995), p. 155-159. Ford. Murányi Péter, Pálvölgyi Mihály.
19
INFORMÁCIÓKERESŐ NYELVEK III.
rögzítve (a katalóguscédulát, kartont is ebbe a kategóriába véve). Az információkeresés szempontjából ez azt jelentette, hogy egy könyvtári cédulakatalógus-rendszerben akár 15– 20 különféle katalógust kellett építeni, gondozni, ahhoz, hogy a keresés lehetősége egymás mellett párhuzamosan megvalósulhasson (pl. szerző, cím, tárgyszó, ETO-szám … szerint)! A papírkönyvtárban a papíralapú adathordozók, kartontárak, kartotéktárak voltak dominánsak az 1980-as évekig, Magyarországon az 1990-es évek végéig, sőt van, ahol, még tovább. A cédulakatalógusokra még ma is szükség van, mert a retrospektív konverzió halad ugyan, de még éveket vehet igénybe. A könyvtárak állományának mintegy 30–35%-a nincs még jelenleg képviselve az adatbázisban, online katalógusban! Az „automatizált könyvtárban” (az 1960-as évektől), az elsődleges információkat hordozó szövegek meghatározó része továbbra is papíron maradt (könyvek, folyóiratok stb.), de a róluk készült szurrogátumok számítógépes katalógusokban lettek kereshetők, integrált közös felületeken, szerzők, címek, tárgykörök és szempontok szerint. A „digitális könyvtárban” mind a szövegek, mind a szurrogátumaik digitális formában rögzítettek és használhatók. Ennek előnye a teljes szövegben, illetve a szurrogátumokban való keresés összekapcsolása, az asszociatív, felfedezéses keresési modell érvényesítése. A könyvtár napjainkban továbbra is különféle dokumentumokat gyűjt, a könyvektől a digitális dokumentumokig. E komplex könyvtárnak meghatározó a szerepe információ- és tudásfeldolgozásban, a felhasználók sokoldalú segítésében.
A digitális dokumentumbázis alakulása Kurzusunk során minden egyes információkereső rendszer-típus esetén megvizsgáljuk, mik a dokumentumbázisának a fő ismérvei. E téren jelentős eltérések vannak: − Az online katalógusok általában egy könyvtár (és hálózata, részlegei) dokumentumanyagát dolgozzák fel. − A szakterületi adatbázisok a bibliográfiai hagyományok folytatásaként egy-egy szakterület irodalmának, forrásainak a feldolgozására vállalkoznak. − Az internetes keresőrendszerek a web kaotikus digitális univerzumában „teljességre törekvően” keresik a választ felhasználói kérdéseire, stb. Napjainkra a bázissal szembeni igények légiesednek, a gyűjtés helyett/mellett egyre nagyobb teret kap az elérés. – A közös katalógusoknak, illetve (az ahhoz kapcsolódó) dokumentumellátó rendszereknek köszönhetően az együttműködő könyvtárak együttesen szavatolják a kibővült bázis feldolgozását, elérését, szolgáltathatóságát. Ez a kiterjedt bázis a feldolgozott dokumentumok legkülönfélébb típusaira vonatkozik (nyomtatott könyvek, időszaki kiadványok, AV-dokumentumok, mikrodokumentumok, elektronikus dokumentumok stb.). Nem a birtoklás, hanem az ésszerű időn belüli elérés, elérhetőség követelménye a mérvadó. Ami az interneten található dokumentumokat illeti, életjelenségeik, a tárolás, rendszerezés, elérhetőség paraméterei eltérnek a „hagyományos” dokumentumokétól. Illékonyabbak, pl. egyik napról a másikra megszűnhet egy weblap. A többnyelvűség, a különböző karakterek használata, a feldolgozottság hiánya, vagy mikéntje sajátos problémákat vet fel.
20
INFORMÁCIÓKERESŐ NYELVEK III.
A bázis feltérképezése, a források típusai Tekintettel a könyvtár minden médiumot gyűjtő funkciójára, alapkérdés, hogy a könyvtár, vagy a könyvtárak együttműködő együttese esetében mely forrásokra terjedjen ki a dokumentumok feltárását, elérését biztosító tudásreprezentáció? Nézzük meg, hogy Michael Gorman szerint mi mindent lehet/kell számításba venniük a könyvtáraknak?10 1.
A források jellege Megfogható (helyi) dokumentumok Megfoghatóvá tehető/ távoli dokumentumok Megfogható helyi elektronikus források Megfoghatatlan elektronikus távoli források
A források gyűjtésének és feldolgozásának alaptényezői
Példa, magyarázat A könyvtár birtokában levő, s meghatározott fizikai helyeken tárolt könyvek, térképek, videokazetták stb. Más könyvtárak birtokában levő, de könyvtárközi- forrásmegosztási rendszerek és közös katalógusok/adatbázisok útján kereshető és elérhető dokumentumok stb. A könyvtár birtokában levő, helyben vagy kölcsönzéssel használható, digitális hordozón tárolt dokumentumok A könyvtár, vagy más intézmények tulajdonában levő elektronikus dokumentumok, amelyekhez a könyvtár vagy intranetes, vagy internetes hálózati hozzáférést nyújt.
A bibliográfiai számbavétellel biztosított tudásreprezentációnak 2 fő követelménye van: − Nyújtson gyors és hatékony hozzáférést a szükséges anyagokhoz. − Segítse az egyes nemzetek, illetve globálisan nézve az emberiség „emlékezetének” megőrzését és tovább hagyományozását. Tudnunk kell, hogy mit őrizzünk meg, illetve, mit milyen mélységben tárjunk fel. A lényeg az, hogy a felhasználó kényelmesen, gyorsan hozzáférhessen a dokumentumokhoz, bárhol is tárolják azokat. Az integrált közös katalógusok és dokumentumellátási rendszerek segítenek ennek optimális megoldásában. (ld. bővebben a 6. leckében. A dokumentumok feltárásának négy választható lehetősége: − (1) teljes katalogizálás nemzetközi, nemzeti szabványok alapján, − (2) a gazdagított feldolgozás, − (3) a minimális Dublin Core metaadatok alkalmazása, − (4) a strukturálatlan kulcsszavas keresésre (keresőrendszerekre) hagyatkozás. A négy lehetőség idő-, energia-, és költségigénye jelentősen eltér! Gorman szerint a nemzetközi, nemzeti szabványok alapján végzett (munka- és időigényes) katalogizálást azon források esetében „éri meg” elvégezni, amelyek a könyvtár számára állandó értéknek tűnnek. Gyűjtés, elérés, együttműködés?
10
GORMAN, Michael : Metadata or cataloguing? A false choice. Journal of Internet Cataloguing. 2. vol. 1999. 1. no. 5–22. Bibl. Ismert. Mohor Jenő, In: Könyvtári figyelő 2000. 1–2. sz. 205-207. p. - Metaadatok, vagy katalogizálás. Hamis alternatíva. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?00/050*35495
21
INFORMÁCIÓKERESŐ NYELVEK III.
Az ésszerű, reális megközelítés az, ha arra törekszünk, - a fentebb említett könyvtári és más együttműködésekre alapozva - hogy kényelmesen, gyorsan hozzáférhessünk az információkhoz, dokumentumokhoz, bárhol is tárolják azokat. E szempontból fontos tényező, hogy nő a könyvtárak szerepe a digitális tartalom feldolgozásában és szolgáltatásában (az eleve digitális könyvtárként kialakított gyűjtemények mellett olyan szegmensekként is, mint digitalizált szakdolgozattár, oktatói publikációtár, helyismereti dokumentumtár építése, működtetése, webkalauzok, linkgyűjtemények összeállítása és karbantartása (Pl. DEENKT, MTA Központi Könyvtár, FSZEK stb.). A könyvtári, levéltári és múzeumi feldolgozás közeledése, összehangolása is aktuális feladat. Forrástípusok a feldolgozottság foka szerint A feldolgozásnál számításba jöhető források körében Lyn Robinson11 elsődleges, másodlagos, harmadlagos és negyedleges – kategóriát különböztet meg: 2.
A feldolgozásnál számításba jöhető források köre
Az eredeti dokumentumok , források, ismeretegységek fajtái Eredeti dokumentum minden formája, pl. cikk, jelentés, adat, jogszabály, honlap Az elsődleges dokumentumokat/kognitívumokat meghatározott módokon feltáró, rendszerező források: pl. indexelő és referáló szolgáltatások, tanulmányok, szótárak, képletgyűjtemények stb. A többi forrás használatát segítő források, pl. évkönyvek, bibliográfiák, kutatási nyilvántartások, a szakterület Internetes forrásait feltáró összeállítások A források jegyzékeihez hozzáférést biztosító eszközök, pl. bibliográfiák, katalógusok
Kategórianevük „Elsődleges” „Másodlagos”
„Harmadlagos” „Negyedleges”
Az értékelés, válogatás növekvő szerepe A könyvtárostól a gyűjtés, feltárás során fokozott odafigyelést igényel az a tény, hogy az internet, s azon belül a web terjedelme óriási mértékben növekszik. A web terjedelmi növekedésének van egy pozitív és egy negatív oldala is: − Pozitív oldal: több a tartalomszolgáltatás, nagyobb a választék. − Negatív oldal: a strukturálatlan adatok túltengése, az információs káosz, az információ túlterhelés, a tartalmak jelentős részének megbízhatatlansága.
11
ROBINSON, Lyn: A strategic approach to research using Internet tools and resources. Aslib Proc. 52.vol. 2000. 1.no. 11-19. p. bibl .10 tétel. Ismert. Hegyközi Ilona: Az Internet eszközeinek és forrásainak kiválasztása az irodalomkutatáshoz: stratégiai megközelítés. In: Könyvtári figyelő, 2000. 3. sz. 516-517.p. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?00/285*36960
22
INFORMÁCIÓKERESŐ NYELVEK III.
A negatív oldalhoz kapcsolódik, hogy a tények, adatok, vélemények, értelmezések, elképzelések, gondolatok, információk, „tudás” univerzumában csillagévnyi eltérések vannak a tartalmak valóságtartalmában, szintjében, minőségében is. A különféle nyelveken megjelenő adatok, információk, tudás jelentős hányadát teszik ki a „hamis”, „téves”, „megtévesztő”, „félrevezető”, „elavult”, „tudománytalan”, „áltudományos” stb. jelzőkkel illethetők (olykor meghaladva a pozitív jelzőkkel illethetőket (megbízható, releváns, alapos, részletes, tudományos, naprakész stb.) 2.3.5
Felhasználók, keresési szokások, elvárások, készségek
A felhasználók elvárásai A stratégiai fejlesztésekhez való kapcsolódás első lépése a kiszolgált felhasználói igények, elvárások, szokások elemzése. – Mik a felhasználók tematikus keresési igényei, elvárásai, preferált területei, hogyan tesznek szert információkra, hogyan igazodnak el az információk világában? Az információkereső nyelvek hatékony használata szempontjából alapvető a felhasználó-központúság: a változó felhasználói igények, elvárások, szokások megismerése, nyomon követése. Ma fokozott mértékben érvényesek Michael Buckland12 megállapításai, mely szerint a felhasználó elvárja, hogy a szövegekhez való hozzáférés szinte azonnal biztosítva legyen. Elvárja, hogy valamely hivatkozást követve, akár a szövegből, akár hivatkozási indexből, azt otthagyva, eljuthasson más szövegekbe, visszamehessen katalógusrekordokhoz, vagy áttekinthesse a tárgyszavakat, hogy keresőkérdéséit újrafogalmazhassa, mivel a találattal elégedetlen. Számot kell vetni azzal, hogy csökken a könyvolvasás szerepe, nő a vizuális ismerethordozóké (pl. AV-dokumentumok, DVD-, hálózati digitális dokumentumok, a szöveget, képet, hangot, videót magában foglaló „rich media”). Az információkeresésben döntő, már szinte kizárólagos az internetes böngészők és a hálózati források (különféle wikik stb.) szerepe, – míg a könyvtári tájékoztatás rohamosan veszít jelentőségéből.13 A web 2.0 lehetőségeire építve a felhasználói szerepek mellett a felhasználók tömegei töltenek be szerzői, feldolgozói, tájékoztatói, közvetítői szerepeket is a blogok, wikik, közösségi portálok, fájmegosztók, képmegosztók, linkmegosztók oldalak és podcastok segítségével.
A felhasználók információs készségei Az új szerepeknek megfelelően kialakuló web 2.0- ás közösségek világában a felhasználók viszonylag jól tájékozódnak. A könyvtárak, tájékoztatási intézmények, internetes szolgáltatók keresőrendszereinek alkalmazásában is folyamatosan fejlődik az „írástudás”, 12
BUCKLAND, Michael: A könyvtári szolgáltatások újratervezése. (Redesigning library services: A manifesto.) Bp.: OSZK, 1998. 102 p. A függelékben: Buckland, Michael: What will collection developers do? – In: Information Technology and Libraries. – Vol. 14. No. 3. (Sept. 1995), p. 155-159. Ford. Murányi Péter, Pálvölgyi Mihály. 13 SONNEVEND Péter: A könyvtár új élete. In: Könyv, könyvtár, könyvtáros, 2008. 8. sz. 6–13. p. URL: http://www.ki.oszk.hu/3k/e107_plugins/content/content.php?content.157
23
INFORMÁCIÓKERESŐ NYELVEK III.
ugyanakkor még mindig jellemző egyfajta felhasználói igénytelenség. A tapasztalatok szerint Adatbázisok, online katalógusok esetében − a hétköznapi használók jelentős része alapvető dolgokkal nincs tisztában, többek között az információkeresés folyamatával sem, − csak az egyszerű keresést veszi igénybe, nem él a nagyobb pontosságot biztosító összetett keresés lehetőségével, − alig él a böngészés lehetőségével, pedig ezt a könyvtárak számos (gyakran 10–15) különféle index szerint is lehetővé teszik. Internetes keresők esetében − csak a Google-t használja, esetleg alkalmanként egy-két másikat, eközben sohasem, vagy ritkán használja a kulcsszavak szinonimáit, − nem néz utána a fogalmak meghatározásainak online lexikonban, enciklopédiában, − nincs tisztában a keresőgép és a linkgyűjtemény közti különbséggel. Általánosságban − a felkínált súgókat az online katalógusok, adatbázisok, internetes keresők stb. használatakor nem olvassa el, − nem megy el a könyvtárba, hogy esetleg cédulakatalógusban, nyomtatott bibliográfiákban, más nyomtatott információs kiadványban is keressen, − csak a Google-t, esetleg az OPAC-ot nézi meg, ha abban nem talál meg valamit, azt mondja, hogy nincs meg! Gondok vannak a fontos IKNY-ek használatával, pl. az Egyetemes Tizedes Osztályozást a felhasználók töredéke veszi csak igénybe kereséshez, de a tárgyszavak, tezauruszok adta relációk felkutatásával és alkalmazásával is kevesen élnek még.
A felhasználók képzése és támogatása E negatív jelenségekkel szembe kell nézni, és fokozni kell az információs írástudás, azon belül az információhasználati, keresési kompetenciák fejlesztését. A felsőoktatásban minden hallgató számára fontos, hogy részt vegyen bevezető használóképzési kurzuson. Ehhez előadás-, és szemléltető anyagok, hasznos linkgyűjtemények is rendelkezésre állnak (pl. a Nyugat Magyarországi Egyetem Savaria Egyetemi Központ könyvtárának a honlapján, Szmrekovszkyné Farkas Éva14 összeállításában.) Rita Vine 2001-ben közzétett 15 tanácsai ma is érvényesek, pl. a könyvtárnak „világos egyszerű keretet kell biztosítani a felhasználók számára a kereséshez. Egy helyre kell mindig koncentrálnia: a hálózatra, és ott is csak egy weboldalt kell megtalálnia: a könyvtárét, 14
SZMREKOVSZKYNÉ Farkas Éva: Online könyvtári és szakirodalmi szolgáltatások. URL: http://www.bdtf.hu/KONYVTAR/informaciokereses/link.htm 15 VINE, Rita: Real people don’t do Boolean: how to teach end users to find high-quality information on the Internet = Inf. Outlook. 5. vol. 2001. 3. no. 16–23. p. – Ismert. In: Könyvtári figyelő, 2001. 3. sz. 01/256. Az „igazi használók” nem Boole-algebrával keresnek. Hogyan tanítsuk meg a közvetlen használókat arra, hogyan jussanak színvonalas információhoz az interneten URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?01/256*40243
24
INFORMÁCIÓKERESŐ NYELVEK III.
ahonnan a felhasználó elkezdheti a keresést. Ebben és ott kell a könyvtárosnak a lehető legegyszerűbb formákban és módokon segítenie!” A könyvtárosnak közérthetően és naprakészen kell eligazítani a felhasználókat az IKRek legkülönbözőbb típusainak (online katalógusok, adatbázisok, internetes keresők, internetkatalógusok, digitális könyvtárak keresőrendszerei, szemantikus keresők stb.) használatában. Ahhoz, hogy az információkereső rendszereket az emberek megtanulják használni, különféle feltételek szükségesek (motiváltság, technikai hozzáférés, hálózat, s természetesen minőségi tartalmak, adatok, információk, amelyek között kereshetünk, válogathatunk, amelyeket felhasználhatunk.)
2.4 ÖSSZEFOGLALÁS A lecke keretében megismerte, illetve felfrissítette az információkereső rendszerek működésének alapjául szolgáló elméleti tudnivalókat (az IKR fogalma, összetevői, az illesztéses, az asszociatív, illetve a tudásszervezési modell). Megismerkedett a digitális technológiából adódó új lehetőségekkel, melyek az illesztéses modell lehetőségeit egyre intenzívebben kitágítják. Áttekintette azt a nagy fejlődési vonulatot, mely a papírkönyvtárból elvezet a digitális könyvtárhoz, pontosabban a komplex könyvtárhoz, melyben egyaránt fontos a virtuális és valóságos kommunikációs szintér. Tudatosíthatta a könyvtárak, mint tartalomszolgáltatók növekvő szerepét az infokommunikációs stratégiában, a „multimédia háromszögben”, a tartalom közvetítésében, a különféle tartalmak közötti eligazodásban. Áttekintettük a dokumentumbázis kérdését, a gyűjtés, illetve elérés alternatíváját az információfeldolgozás szempontjából. A zárófejezetet a felhasználók elvárásainak, keresési szokásainak szenteltük. Az információkereső rendszerek a használókért vannak, ezért is igényeiket, információkeresési, használati és alkalmazási szokásaikat a keresőrendszerek bemutatásánál külön is vizsgáljuk.
2.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Értelmezze az információkereső rendszerek meghatározó modelljeit, mi az,
amire legjobban emlékszik legjobban az IKNY 1. kurzusában tanultakból! 2. Fejtse ki a rendszerelméleti modell alapvető jellemzőit, és hogyan alakul
alkalmazása! 3. Példán keresztül mutassa be az asszociatív modell alapvető jellemzőit, és
alkalmazási területeit! 4. Hasonlítsa össze a böngészés, általános keresés, illetve szörfölés alapvető
jellemzőit és alkalmazási területeit! 5. Fejtse ki a direkt információszolgáltató/kereső modell fő jellemzőit, érvé-
nyesülésének feltételeit!
25
INFORMÁCIÓKERESŐ NYELVEK III.
6. Véleménye szerint hogyan alakul a tudásszervezési/tudásmenedzsment
rendszerek helyzete, mik a fejlődési kilátásai? 7. Miért fontos, hogy közösen elfogadott alapelvek legyenek az IKR-ek fej-
lesztésére, működtetésére? 8. Milyen mértékben látja felkészültnek a felhasználókat a különböző inter-
netes szolgáltatások igénybevételére? 9. Hogyan látja az infokommunikációs stratégia szerepét és szereplőinek
együttműködést? 10. Vázolja fel a könyvtárak tudásreprezentációs stratégiájának fő elemeit az
új körülmények között!
26
INFORMÁCIÓKERESŐ NYELVEK III.
3.
AZ INFORMÁCIÓKERESŐ RENDSZEREK TÍPUSAI
3.1 CÉLKITŰZÉS A lecke tanulmányozása után legyen képes − az információkereső rendszerek hagyományainak kifejtésére, − a katalógusok, bibliográfiák 20. század eleji megvalósulásainak kifejtésére, − napjaink információkereső rendszereinek felsorolására, elemzési szempontjaik kifejtésére, − az egyes információkereső rendszer-típusok – cédulakatalógusok, online katalógusok, adatbázisok, automatikus indexelési és osztályozási rendszerek, keresőrendszerek, internetkatalógusok, elektronikus, digitális, virtuális könyvtárak – jellemző ismérveinek kifejtésére.
3.2 TARTALOM 1. Az információkereső rendszerek hagyományai – Katalógusok és bibliográfiák – A katalógusok és bibliográfiák megvalósítási formái 2. A ma élő információkereső rendszerek és elemzési szempontjaik – A vizsgált keresőrendszerek – A vizsgálat fő szempontjai 3. Cédulakatalógusok 4. Online katalógusok 5. Közös katalógusok 5. Adatbázisok 6. Internetes keresőrendszerek 7. Internetkatalógusok 8. Szemantikus web szolgáltatások 9. A rendszerek táblázatos áttkeintése
3.3 3.3.1
A TANANYAG KIFEJTÉSE
Az információkereső rendszerek hagyományai
Katalógusok és bibliográfiák Az információkereső rendszerek közül a katalógusnak az ókorig visszamenő hagyományai vannak a könyvtári gyűjtemények rendszerezésében, feltárásában. A ninivei könyvtár, majd különösen az alexandriai könyvtár katalógusából fent maradt töredékek jelzik a rendszerezés megközelítési módjait. (ld. 7. lecke). A katalógusok a római korban, a középkorban, újkorban továbbfejlődve szolgálták a könyvtári állomány rendszerezett feltárását.
27
INFORMÁCIÓKERESŐ NYELVEK III.
A napjainkra is érvényes elméleti szintézis az IKNY 2. kurzusában hivatkozott Charles A. Cutternek16 köszönhető (1876), s mind a leíró, mind pedig a tárgyi katalógusokra vonatkozik. (1) tegye lehetővé, hogy az olvasó megtaláljon egy könyvet, amelynek a szerzője ismert, a címe ismert, a tárgya ismert, (2) mutassa meg a felhasználónak, hogy a könyvtár mivel rendelkezik: adott szerzőtől, adott témában, adott fajta irodalomban, (3) segítsen az olvasónak egy könyv kiválasztásában, annak bibliográfiai, tartalmi jellemzői szerint. Nyilvánvaló, hogy ma már a „könyv” fogalmát tágabban kell értelmeznünk, a dokumentumok, köztük a digitális dokumentumok, ismeretegységek fogalmát is bele kell értenünk! A katalógusok, különösen a kötetkatalógusokhoz képest nagyobb rugalmasságot biztosító cédulakatalógusok, majd a 20. század második felében az adatbázisok, a szintén megjelenő online katalógusok, illetve azok közös katalógusokba szerveződése révén az információkeresés, böngészés alapvető eszközei lettek. A bibliográfiák („könyv-leírások”) a könyvtári katalógussal szemben nem a konkrét állományokról adnak számot, hanem „az irodalomról”, függetlenül az információforrások gyűjteményeitől. Konrad Gesner világbibliográfiája (Bibliographia universalis) 1548–49ben készült. Az elmúlt századokban folyamatosan fejlődtek, finomodtak a bibliográfiakészítés módszerei az emberi tudás és szellemi alkotások számbavétele érdekében. Kétszáz éve kialakult az elmélete, s az arra épülő módszertan olyan nagy és ismert nevekkel, mint Debure, Feipel, Malcles, Schneider …, a magyarok közül Szinnyei József, Szabó Károly, Petrik Géza. A bibliográfiakészítés elvei, intellektuális megközelítései szolgáltak alapul a bibliográfiai adatbázisok létrehozásánál az 1960-as években. (Értékes hagyományaik tovább élnek azok modern változataiban is.) A továbbiakban a katalógusok és bibliográfiák technikai megvalósulásairól – keresőrendszereiről - adunk rövid 20. századi fejlődéstörténeti áttekintést, a szórványosan még ma is létező kötetkatalógusok, lyukkártyák, mikrofilmes rendszerek fő jellemzőinek rendszerek áttekintésével.
A katalógusok és bibliográfiák megvalósítási formái A 20. század második felében a számítógépes információtárak megjelenése előtt a katalógusok fizikai-technikai megvalósításaként a cédulakatalógusokat, kötetkatalógusokat, gépi és kézi lyukkártyás rendszereket, mikrofilmes katalógusokat használták (megj.: ugyanabban a könyvtárban, információs központban sajátos funkciók ellátására is tekintettel, gyakran többféle rendszert is használtak). Kötetkatalógusok A kötetkatalógusok a cédulakatalógusok megjelenése, a 19. század vége előtt fontos szerepet játszottak. Ez a szerepe az 1960–70-es években újra feléledt, köszönhetően a számítógépes előkészítésnek, valamint a fényszedéses, illetve offset nyomásos technológiá-
16
CUTTER, Charles A. :Rules for a dictionary catalog. 4th edition, rewritten. Washington, Government Printing Office, 1904. URL: http://digital.library.unt.edu/ark:/67531/metadc1048/m1/12/
28
INFORMÁCIÓKERESŐ NYELVEK III.
nak. Nemcsak egyes könyvtárak, hanem teljes hálózatok anyagának is népszerű feltárási formái voltak, főleg szakkönyvtári, dokumentációs környezetekben.17 Fő előnyük az volt, hogy az olvasó hazavihette, fő hátrányuk pedig, hogy bizonyos mértékig már a megjelenés pillanatában elavultak. Gyakran egyes különgyűjteményekről készültek ilyen kötetkatalógusok, pl. AV-dokumentumokról. A kötetkatalógus fő része valamilyen osztályozási hierarchia szerint készült, mely egy logikus tájékozódást tett lehetővé. Az itt található tételekhez biztosították a betűrendes indexek, pl. szerzők, címek, tárgyszavak a finomkeresés lehetőségét. (Megj.: e technológiával retrospektív KWIC-, és KWOC-indexművek is készültek ld. még IKNY 2. 4. lecke). A kötetkatalógusok formájukat tekintve rokonságban állnak a kötetalakban megjelenő nyomtatott retrospektív bibliográfiákkal, referáló lapokkal. A fő különbség, hogy a retrospektív bibliográfiák általában az irodalmat tárják fel, s nem egy-egy könyvtár (vagy hálózat) állományát. Egyes tudományos és szakkönyvtárak mélyén még ott rejtőznek ezek a vaskos kötegek, melyek sok türelmet igénylő manuális és repetitív használata a mai mentalitással szinte felfoghatatlan. Lyukkártyás IKR-ek Az alábbiakban röviden szólunk ezekről a szűkebb körben elterjedt speciális technológiákról. A gépi és kézi lyukkártyás rendszerek közül először meglepő módon a gépi lyukkártya technika terjedt el (1880-ban használták elsőként az amerikai népszámlálási adatok feldolgozására!) Információfeldolgozás célú alkalmazása azonban csak később kezdődött, és az 1950–60-as években „kulminálódott”. Olyan helyeken használták, ahol a viszonylag kis (néhány ezres) dokumentumennyiséget mélyen akarták feltárni, biztosítva a rugalmas, sokszempontú, posztkoordinált keresés lehetőségét. A kézi lyukkártyás rendszerek használata az 1960–80-as évekhez kötődött. Ezt követően a számítástechnika szélesebb körű megjelenésével megszűnt. (ld. részletesebben Pálvölgyi Mihály Információs technológia, 1991, 45–66. p.) Mikrofilmes IKR-ek A mikroformátumú katalógusokat sokkal szűkebb körben használták, mint a cédulakatalógusokat, az alábbi formákban: (1.) mikroformát közvetítőként a katalógus cédulák sokszorosítására, (2.) egyes helyeken, különösen biztonsági szempontokból, a cédulakatalógus helyett, azaz a cédulakatalógust fényképezték mikrofilmre vagy mikrofilmlapra, (3.) a számítástechnika és mikrográfia ötvözeteként. Ez utóbbi volt az ún. COMkatalógus (Computer Output Microfilm), mely mikroformában tárolt szövegek, dokumentumok kompakt IKR-je volt, magában foglalva mind a keresési, mind a közvetlen elérési lehetőségeket. E rendszereket főleg az 1970–80-as években használták. (ld. részletesebben Pálvölgyi Mihály Információs technológia, 1991, 182–188. p.) A cédulakatalógus kissé részletesebb tárgyalása azért indokolt, mert (1) ugyan befagyasztották, lezárták őket, de még sok helyütt kell fenntartani, használni őket, mert bizonyos állományrészek anyagát csak ezekben lehet keresni, (2) ma is tanulságokkal szolgál17
PÁLVÖLGYI Mihály: Információs technológia. Főiskolai jegyzet könyvár szakos hallgatók részére. Egységes jegyzet. Budapest: Tankönyvkiadó, 1991. 169-181.p.
29
INFORMÁCIÓKERESŐ NYELVEK III.
nak egyes, a körülményekhez képest felhasználóbarát megoldások, pl. az ETO-szerinti szakkatalógusban való eligazodást segítésére. A következő fejezetben a ma létező legfontosabb keresőrendszerekről adunk egy bevezető áttekintést egységes szempontok szerint 3.3.2
A ma létező információkereső rendszerek és elemzési szempontjaik
A vizsgált keresőrendszerek A használat szempontjából legfontosabb IKR-ek 1. Könyvtári cédulakatalógusok 3. Online katalógusok és a könyvtárak közös katalógusai 4. Adatbázisok különféle fajtái (bibliográfiai, referensz, teljes szövegű adatbázisok) 5. Indexelő rendszerek, internetes keresőrendszerek 6. Internetkatalógusok (webkalauzok, linkgyűjtemények és más intellektuális úton készülő IKR-ek) 7. Szemantikus web alkalmazások (Megj.: A katalógus, a bibliográfiák, online katalógusok, adatbázisok jellemzőivel a Bibliográfiai adatfeldolgozás c. kurzus keretében is bőven foglalkozik. Itt a továbbiakban leglényegesebb ismeretekre összpontosítunk.)
A vizsgálat fő szempontjai Az ismertetésre kerülő keresőrendszerek fő ismérveit az alábbi szempontrendszer szerint vizsgáljuk jegyzetünkben, a fogalmi és fejlődéstörténeti áttekintés után: 1. Szolgáltatók, dokumentumbázis, felhasználók − Üzemeltetők, szolgáltatók, dokumentumbázis, felhasználók 2. A feltárási stratégiája, intellektuális és technikai eszközei − A feltárás stratégiája, a feltárás intellektuális eszközei, szabványai, technikai és szoftver eszközök 3. A feltárás munkafolyamatai és jellemzői − A feltárás munkafolyamatai – A feltárás, építés, szerkesztés, karbantartás jellemzői ( integrált jellege és mélysége) 4. Az IKR használata, keresés és böngészés − Keresőfelület, böngészés, keresés lehetőségei, kereséstechnikai eszközök – keresőnyelvek alkalmazása 5. Tájékoztatás, támogatás − A használatot, keresést segítő útmutatók, súgók, módszertani anyagok, példatárak stb.
30
INFORMÁCIÓKERESŐ NYELVEK III.
6. Megjelenítés, hozzáférés − A találatok megjelenítése – Az eredeti szöveghez való hozzáférés lehetősége 7. Értékelés, fejlesztés − A keresőrendszerekkel szembeni kritériumoknak való megfelelés – teljesség, pontosság biztosítása. Fejlesztési igények, elvárások, teendők. 3.3.3
Cédulakatalógusok
A könyvtárak döntő többségében még használják a cédulakatalógusokat, melyek több mint száz éven át voltak a fő információkereső eszközök a különféle típusú és nagyságrendű könyvtárakban. Elektronikus formára való retrospektív konverziójukat még nem oldották meg, sok könyvtárban az állomány 20–40%-a ezekben van feltárva. (Mindezek miatt a cédulakatalógusokat „a jelen időt használva’ mutatjuk be a továbbiakban). (1) Szolgáltatók, dokumentumbázis, felhasználók − A cédulakatalógusok szolgáltatói az egyes könyvtárak és társulásaik. A dokumentumbázis nagysága, az egyes dokumentumtípusok jelenléte a könyvtár típusától, funkciójától, méretétől függ. A használói köre általában megegyezik egy adott könyvtár olvasóinak körével. A felhasználók a könyvtárlátogatás során vehetik igénybe a helyhez kötött cédulakatalógust. (2) A feltárás stratégiája, intellektuális és technikai eszközei − A feltárás stratégiája arra irányul, hogy a leíró és tárgyi katalógusok segítségével reprezentáljuk a gyűjteményt, különböző keresési, böngészési lehetőséget biztosítva a felhasználók számára. − Az eredeti művekről készült egyes szurrogátumokat egy-egy katalóguscédula tartalmazza, melyet annyi példányban kell másolni, vagy sokszorosítani, ahány formai, tartalmi stb. ismérv szerint biztosítani akarjuk a kereshetőségét. Intellektuális eszközök: a keresőnyelvi szabályok, szabványok, a bibliográfiai szabványok, a formai, illetve tárgyi katalógusszerkesztést segítő útmutatók. − Az adathordozó papír alapú, a tárgyi-technikai eszközrendszer: katalógusszekrények, fiókok, azon belül különböző osztólapokkal rendezett katalóguscédulák. Ezek előállítására külön könyvtárellátó vállalat szakosodott. (3) A feltárás munkafolyamatai és jellemzői − A feltárás munkafolyamatainak jellemzője a manualitás, a sok egymást követő részfolyamat, amely a feltáráshoz, a szerkesztéshez, a karbantartáshoz, selejtezéshez szükséges. Egy katalóguscédula példányait annyi különböző helyre kell beosztani, ahány különböző keresési ismérvet tartalmaz. (4) A keresőrendszerben való keresés − Alapvetően kétféle katalógusban lehet keresni: a leíró katalógusban, illetve a tárgyi katalógusban. A leíró katalógusban a cím-, ill. szerzőségi adatok szerint, a tárgyi katalógusban, pl. ETO szerinti szakkatalógusban, tárgyszókatalógusban a tárgyi31
INFORMÁCIÓKERESŐ NYELVEK III.
tartalmi ismérvek szerint lehetséges a keresés. Egyszerre egy ismérv szerint lehet keresni, az ismérvek kombinálására korlátozott a lehetőség. A két alapkatalógus mellett a különkatalógusok garmadáját hozzák létre, pl. dokumentumtípusok, nyelvek szerint stb. (5) Tájékoztatás, támogatás − A katalógus használatát, a keresést különböző útmutatók, mutatók segítik, pl. a szakkatalógus esetében a betűrendes mutató (ld. 11. lecke). A csoportképzéses szakkatalógusban a feliratok alapján viszonylag jól el lehet igazodni, pl. az osztólapok mögötti betűrendes elrendezésnek köszönhetően. (6) Megjelenítés, hozzáférés − A keresés során az adott katalóguscédulán szereplő adatok közül a raktári jelzet segítségével lehet eljutni a szabadpolcon vagy raktárban elhelyezett dokumentumokhoz. (7) Értékelés, fejlesztés − A papíralapú hordozó miatt nagy a helyigénye, nagyon redundáns, ahány kereshető ismérvet tartalmaz a feldolgozási egységről, annyiszor kell megismételni a teljes katalógustételt. Rugalmatlan, mert egyszerre egy ismérv szerint lehet keresni. A katalógus egy példányban van, használatához fel kell keresni a könyvtárat. 3.3.4
Online katalógusok
A nyilvános online katalógusok a könyvtári katalógusok modernizált, technikai lehetőségekkel kibővített, szabványosított feldolgozást biztosító változatai. Több mint 20 éves múltra tekinthetnek vissza, Magyarországon az 1990-es második felében jelentek meg. (1) Szolgáltatók, dokumentumbázis, felhasználók − A katalógus előállítói és szolgáltatói a legkülönfélébb nagyságú és típusú könyvtárak és társulásaik, együttműködve az integrált könyvtári rendszerek szolgáltatóival Egy vagy több könyvtár állományát tükröző szurrogátumtárak, melyek általában a könyvtár állományát képező dokumentumok rendszerezését, rendszerezett áttekintését, illetve az egyes dokumentumok részletes ismérvek (szerzők, címek, tárgykörök stb.) szerinti keresését teszik lehetővé. − Az online katalógus (OPAC – Online Public Access Catalog – nyilvánosan elérhető online katalógus) a hálózaton keresztül a könyvtár honlapján érhető el A használói kör szerteágazó, a könyvtártípustól is függve (általános települési, szakkönyvtár, iskolai könyvtár, felsőoktatási könyvtár stb.). (2) A feltárás stratégiája, intellektuális és technikai eszközei − A feltárási stratégia kulcsszava az integráció, mely segítségével sokrétű feltárás, rugalmas differenciált keresés biztosítható. Az online katalógusban integrálódik a leíró és tárgyi katalógus. Az egyes szurrogátumokban – bibliográfiai rekordokban – pedig egységes szerkezetben, a MARC-formátumban találhatók mind a leíró, 32
INFORMÁCIÓKERESŐ NYELVEK III.
−
mind a tárgyi ismérvek. A keresés is ebben az integrált, többdimenziós rendszerben történik. Az IKNY-ek integrált alkalmazását segítik a besorolási adatok (névadatok, egységesített címek, tartalmi jelölők) szabványai, a tárgyszókategóriák és a tartalmi feltárás adatmezői. A HUNMARC egységes mederbe terelte az adatexport-import lehetőségeket. A tezauruszfejlesztést és központi karbantartást jelenleg a RELEX tezauruszkezelő program szolgálja, a tezaurusz-kifejezések szerinti keresést, böngészést pedig a HunTéka-Monguz rendszer egyik modulja. A feltárás intellektuális eszközei: az IKNY-szabványok és bibliográfiai szabványok, az egyes keresőnyelvek szabályozott szótárai (pl. ETO-táblázat, tárgyszórendszer, tezaurusz). Az OPAC-ok fejlesztéséhez fontos, hogy az integrált könyvtári rendszerek (adatbázis-kezelő rendszerek) fejlesztői új és hatékony változatokat fejlesszenek ki, elősegítve az ismérvek háromféle üzemmódban való kereshetőségének (egyszerű kereső, összetett kereső, böngésző) korszerű megoldásait.
(3) A feltárás munkafolyamatai és jellemzői − Az online katalógus működése az integrált könyvtári rendszer munkafolyamatainak sorába kapcsolódik (szerzeményezés, katalogizálás, OPAC, kölcsönzés, statisztika), melyeket külön modulok támogatnak. A feltárás/keresés szempontjából a katalogizálási modul (adatbázis), illetve az online katalógus (OPAC) a legfontosabb. A katalogizálási modult a könyvtárosok építik, erre az alapvető feladatra összpontosítanak. Az olvasók számára a feltárási adatokat tartalmazó OPAC a legfontosabb. − A munkafolyamatok egymáshoz kapcsolódnak, egy műveletet csak egyszer kell elvégezni, annak kimenetét a következő műveletek bemeneteként használják. Az integrált megközelítés a belső munkafolyamatok mellett kiterjed a közös katalogizálási rendszer munkafolyamataira is, a máshol elvégzett művelet, feltárás eredménye átvehető, bemenetként kezelhető – a résztvevő könyvtárak átveszik egymás szurrogátumait, és igényeik szerint módosítják. (4) Az IKR-ben való keresés − Az online katalógus ugyanazon szurrogátumokban integrálja a leíró, és a tárgyi feltárás adatait. Ezek közös felületen érhetők el, és kereshetők mind egyszerű, ill. összetett keresési, mind pedig böngészési üzemmódban. A leíró és tárgyi adatok kombinálhatók az összetett keresés során. A böngészésre 8-10-féle ismérv szerint ( kulcsszó, tárgyszó, szerző, cím, ETO-szám, tezaurusz-kifejezés stb.) van lehetőség. A szurrogátumokban általában két keresőnyelvet használnak (pl. hazánkban valamely tárgyszórendszert és az Egyetemes Tizedes Osztályozást). (5) Tájékoztatás, támogatás − Az online katalógusban való eligazodást, a keresést számos elektronikus segédlet, útmutató, súgó segíti, a szakkatalógus építését pedig külön a könyvtárosok számára készített módszertani útmutató és példatár. (6) Megjelenítés, hozzáférés − A találatokat többféle formátumban jeleníthetjük meg. A megfelelőt kiválasztva, a bibliográfiai rekordban szereplő, azonosító adatok, raktári jelzet segítségével lehet eljutni a szabadpolcon, vagy raktárban elhelyezett dokumentumokhoz. Az elérés 33
INFORMÁCIÓKERESŐ NYELVEK III.
fokozatai: (1) A katalógusban megtaláljuk az ismérveknek megfelelő dokumentumok bibliográfiai leírását, tárgyszavait, osztályozási jelzeteit stb., illetve a raktári jelzetét (2) A raktári jelzetet követve kikeressük a relevánsnak tűnő dokumentumot a dokumentumtárból. Amennyiben digitális dokumentumról van szó, közvetlenül eljuthatunk a teljes szöveghez. (7) Értékelés, fejlesztés − Az online katalógusokban fokozatosan helyet kapnak a saját digitális források mellett az internetes források is. Ugyanakkor viszonylag kevés online katalógus van, ahol a rekordot szöveges tartalmi ismertetéssel, annotációval vagy referátummal egészítik ki. Megoldatlan az ETO-számok szerinti felhasználóbarát keresés, bár ilyen irányú kezdeményezések vannak. Az online katalógus ETO böngészőjének használatával már a tantárgy első félévében (11. lecke) foglalkoztunk, a természetes nyelven alapuló keresőnyelvekkel pedig a tantárgy 2. félévében. A könyvtárak közötti együttműködés a katalogizálásban és keresésben is erősödik. Keresse fel a Magyar Országos Közös Katalógust a keresési, böngészési funkciók kipróbálására, ill. a honlapon elérhető szakértői fejlesztési tervek megismerésébe.18 Erősödik az ugyanazt az integrált könyvtári rendszert használók együttműködése is, mind a közös katalógusépítés, mind a közös lekérdező-keresési felületek vonatkozásában.19 3.3.5
Adatbázisok
Az adatbázisok elektronikusan tárolt, egymással kapcsolatban levő adatok, adatállományok szervezett halmazai, melyek segítségével összetett szerkezetű adatmodelleket valósíthatunk meg. Az 1960-as évektől tart több szakaszban megújuló működtetésük. (1) Szolgáltatók, dokumentumbázis, felhasználók − Az előállítók és szolgáltatók nemzetközi és nemzeti szinten széles kört fognak át. Ide tartoznak a szakterületi adatbázis-előállítók, azok globális szolgáltatói, a nemzeti szaktájékoztatás központi intézményei, a nemzeti bibliográfiai rendszer, és az a legkülönfélébb típusú adatbázisok előállítói. − Az adatbázisok nem egy konkrét könyvtári állományról, hanem „az irodalomról” adnak számot. A bibliográfiákhoz hasonló funkciót töltenek be. Széleskörű, s egyben differenciált felhasználói igényeket elégítenek ki. Az internetes megjelenés révén alternatív kínálatokkal a használók széles köreit képesek „megszólítani”. − Funkciójuk szerint lehetnek (a) forrásra hivatkozó adatbázisok (bibliográfiai adatbázisok, forrástájékoztató adatbázisok), (b) Forrástípusú adatbázisok (numerikusak, szöveges numerikusak), (c) teljes szövegű adatbázisok, (d) online adattárak, lexikonok, szótárak, kézikönyvek, (e) tudásbázisok.20
18 19
20
Magyar Országos Közös Katalógus – MOKKA. URL: http://www.mokka.hu TÓTH Kornél: Mi újság a MOKKA háza táján? Az IMOLA (Integrált MOKKA, ODR, OLA) koncepció. Tudományos és Műszaki Tájékoztatás, 56. évf. 2009. 8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=5192&issue_id=507
PÁLVÖLGYI Mihály : Információs technológia, Budapest : Tankönyvkiadó, 1991. 210.p.
34
INFORMÁCIÓKERESŐ NYELVEK III.
−
−
A további szempontok kibontása során a bibliográfiai, referáló adatbázisok jellemzőire összpontosítunk. Az adatbázisokkal feltárt dokumentumállomány eredete lehet nemzetközi, nemzeti, regionális, ill. helyi bázis, a szűrés, szelektálás gyakran nyelvi alapon történik. A tematikus adatbázisok a dokumentumok széles körét integráltan tárják fel: a folyóiratcikkeket, kongresszus kiadványokat, hivatalos kiadványokat, egyetemi kiadványokat, újabban weblapokat, vizuális, auditív, multimédia dokumentumokat is. A lehetőségek tovább bővülnek.21 Hivatkozás: Ungváry–Vajda könyvtári információkeresés
(2) A feltárás stratégiája, intellektuális és technikai eszközei − Az adatbázisok feltárási stratégiája arra irányul, hogy a tartalom válogatásával, sokszempontú, többszintű feltárással minőségi, összetett szerkezetű szolgáltatást nyújtsanak, a megkívánt teljesség mellett a pontosságra helyezve a hangsúlyt. − A feltárás során igénybe veszik mind a szabályozott (osztályozási rendszerek, tezauruszok), mind a szabályozatlan keresőnyelvek (kulcsszavak) lehetőségét. A feltárást metaadatszabványok, tezauruszok segítik. − Az interneten megjelenő adatbázisokban a feldolgozás egyre mélyebb szinteket érint a feldolgozási spektrumban, s ehhez új automatizált feltárási eljárásokat alkalmaz. (3) A feltárás munkafolyamatai és jellemzői − A munkafolyamatok függnek a feltárás mélységétől (címközlő, referáló, teljes szövegű szolgáltatás, teljes tájékoztatást nyújtó szolgáltatás.) − Az adatbázisok építésében jelentős szerepet kap az intellektuális munka (válogatás, kvantálás, feltárás, osztályozás, tartalmi kivonatok megfogalmazása). Ugyanakkor az automatizálás eszközeit is növekvő mértékben veszik igénybe (az asszociatív modell kiterjesztése, a kereshető adatok kombinálása stb.) (4) Az IKR-ben való keresés − Általában többféle keresőnyelv használatát teszik lehetővé, beleértve a szabályozott (tárgyszó, deszkriptor, osztályozási jelzet szerinti), illetve a szabályozatlan (szövegszavas, kulcsszavas) rendszerek szerinti keresést is. Jellemző, hogy az adatbázisokban jelentek meg először a deszkriptorok. − Mind egyszerű, mind haladó (összetett) keresésre, sőt parancsszavas keresésre is módot adnak. (A parancsszavak az adatbázis-szolgáltatók professzionális parancsnyelvének a szavai). Emellett különféle indexek szerinti böngészést is támogatják. − A nemzetközi adatbázisok esetében a keresés finomítását egy sor eszköz szolgálja (ld. bővebben a 6. pont alatt.) Az indexgenerálásnak köszönhetően a keresés sokféle adattípus (szerzői nevek, tárgykörök, földrajzi helyek, intézmények neve, nyelv stb.) szerint történhet. 21
UNGVÁRY Rudolf, VAJDA Erik: Könyvtári információkeresés...Bp.: Typotex Kft, 2002. URL:
http://www.tankonyvtar.hu/konyvtartudomany/konyvtari-080905-74
35
INFORMÁCIÓKERESŐ NYELVEK III.
(5) Tájékoztatás, támogatás − A felhasználói kényelmet a nemzetközi adatbázisok esetében olyan online elérhető segédeszközök fokozzák, mint − az online szolgáltatók által a rendszerekhez biztosított „help” üzenetek; a weblapjukról lekérhető információk; hirdetőtáblák (BBS) stb., tájékoztató felületek, súgók, − a fogalmi csoportok (fogalomkörök) kialakításának megfelelő segédletei (tezauruszok, tárgyszójegyzékek, osztályozási táblázatok), − ezek egymáshoz kapcsolása a Boole-operátorok segítségével: (a teljesség növelésére az OR, a pontosság növelésére pedig az AND, ill. NOT szolgál). − a helyzeti operátorok használata – keresőszavak egymáshoz viszonyított előfordulásának meghatározására, a pontosság növelésére, − a csonkolás különféle változatai (szóvégi egy vagy több karakter, szóközbeni, szóeleji karakter stb.) a teljesség növelésére, − a korlátozás stb. alkalmazása a nagyobb pontosság növelésére. (6) Megjelenítés, hozzáférés − A találatok megjelenítésére különböző alternatívák lehetnek, a komplett bibliográfiai leírástól a legszükségesebb adatok (pl. tétel nyilvántartási száma) kiíratásáig. − Az adatbázisok igénybevétele napjainkban dominánsan az interneten keresztül történik, így a felhasználó jó esetben közvetlenül eljuthat az igényelt internetes dokumentumhoz (ingyenes, vagy térítéses formában). (7) Értékelés, fejlesztés − A fejlesztés alapvetői vetülete, hogy az adatbázisoknak alkalmazkodni kell az internethez. Az internet megjelenésével nő az igény jó minőségű, ingyenes vagy olcsó, a weben hozzáférhető adatbázisok iránt. Az adatbázisok, tekintettel differenciált feltáró rendszerükre, egyaránt lehetőséget adnak a nagyobb teljesség, illetve a nagyobb pontosság (több releváns találat) elérésére, a felhasználót ez irányú döntésében segítve a keresés során. 3.3.6
Internetes keresőrendszerek
Az internetes keresőrendszerek (más neveken internetes keresők, internet keresők, internetes keresőszolgáltatások, indexelő szolgáltatások) a világhálón található dokumentumok keresésére, mindennapos, tömeges tájékoztatási szolgáltatást nyújtanak. Az 1990-es évek második felében jelentek meg. (1) Szolgáltatók, dokumentumbázis, felhasználók − Az átfogó szolgáltatást nyújtó rendszerek (pl. Google, Yahoo stb.) a weben általuk elérhető dokumentumok teljességében keresnek, a speciális keresők egy-egy szegmenset fednek le: tematikus keresők, képkeresők, blogkeresők, hírkeresők stb. − Az átfogó szolgáltatók ambiciózus módon mindig az elérhető „teljes weben” történő kulcsszavas, szabadszavas keresésének biztosítására vállalkoztak. A weben ta36
INFORMÁCIÓKERESŐ NYELVEK III.
−
lálható legkülönfélébb dokumentumok indexelése alapján történik a keresés. Az elérhetőség köre tovább bővül. A felhasználók zöme az egyszerű keresési megoldásokat részesíti előnyben, bár specifikus, összetett keresési módszerek is rendelkezésére állnak.
(2) A feltárás stratégiája, intellektuális és technikai eszközei − Az elérhető Web módszeres és rendszeres végigjárására vállalkoznak, törekedve a teljességre, hogy a feltett keresőkérdésekre minél teljesebb bázison adjanak találatokat, illetve a pontosságra, hogy ezek a találatok minél jobban megfeleljenek a felhasználó számára. A web jelentős, mélyebb rétegeit (a „mély webet”) e rendszerek nem képesek még elérni (pl. az adatbázisok strukturált adatainak rendszerét). − Az internetes dokumentumok indexelése mély, középpontjában a szövegszó, kulcsszó áll, annak sokoldalú elemzése a relevanciaellenőrzés (milyen gyakran fordul elő a szövegben, előfordul-e együttesen a címben, címfejben és a szövegben is, csatolóként ugrópontként kijelölték-e a szót a szövegen belül. (3) Az indexelés munkafolyamatai és jellemzői − Az indexelés fő „műveleti tényezői: − A robotok, melyek az egyes dokumentumok szövegét átvizsgálják, szurrogátumait begyűjtik az indexelés érdekében. − A kereső adattárai, százmilliós nagyságrendben tartalmazva az indexelt oldalak adatait. − Az indexelő adatbázis, amely az indexelés eredményeképpen a tartalom szerint képződik automatikusan, kivonatos formában a végiglátogatott helyek adatait tartalmazza, s ahol a keresőkérdés reprezentációja történik. − A relevanciaelemzés (a keresett szó előfordulásának sokrétű elemzése (ld. 3. pont) mellett kitérve arra is, hogy az adott weblapra milyen számban mutatnak linkek más weblapokról, a weblap szövegének nyelvi elemzése, a beírt keresőszó előfordulási gyakorisága az adott indexelő-szolgáltatás teljes adatbázisában stb.) A relevanciaelemzés alapján kerül a találat rangsorolására. − A lekérdező felület, amelyen a rendszer megjeleníti a felhasználó számára a megadott szavakra illeszkedő dokumentumok találati listáját, rangsorban, rövid címeikkel és rövid, pár soros kivonataikkal (a leginkább illeszkedő részekkel). − Majd a frissítő modulon, robotokon keresztül az adatbázis rendszer újra frissítése, aktualizálása, meghatározott, egyre rövidülő – egy-két hetes – intervallumokban. (4) A keresőrendszerben való keresés − A felhasználó kulcsszavakat fogalmaz meg, melyeket beírva elindítja a keresést, hogy néhány másodpercen belül megkapja a találati listát. Az egyszerű keresésen túl elvileg fejlettebb keresőeszközöket is igénybe vehet (pl. „pontos kifejezés” megadása, Boole-algebrai műveletek, időszakra, nyelvre, földrajzi helyre korlátozás stb.). Ezekre a specifikus keresési lehetőségekre külön is felhívja a figyelmet az internet kereső, de, a felmérések szerint – kevesen veszik igénybe. 37
INFORMÁCIÓKERESŐ NYELVEK III.
(5) Tájékoztatás, támogatás − Egyes keresőrendszerekben újabban böngészhető tárgyszólisták, szinonimajegyzékek, vizuális megjelenítés, fordítási szolgáltatások is elérhetők a kereséshez, illetve a talált szövegek értelmezéséhez. Mint a 4. pontnál jeleztük, külön felhívják a figyelmet a specifikus, kombinált keresési lehetőségre. (6) Megjelenítés, hozzáférés − A keresőkérdésnek valamilyen szinten megfelelő találatokat az internet keresők több szempontot magában foglaló sajátos szempontrendszerük alapján rangsorolják. A legsikeresebb e tekintetben a Google rangsorolása. Olyannyira megbíznak benne, hogy a felhasználók többsége óriási találatmennyiségek esetében is csak az első 10 találatot futja át. − A találatként kapott internetes dokumentumok elérése két lépésben történik: (1) a keresőkérdésre válaszul a képernyőn megjelennek rangsorolva az ismérvekhez kapcsolódó találatok, látható az egyes tételek rövid leírása (a kérdésben szerepelt kulcsszavakkal). (2) A relevánsnak tűnő dokumentumokat a webcímek, linkek segítségével megjelenítjük a képernyőn, majd elkezdjük a tanulmányozásukat. (7) Értékelés, fejlesztés − A pontosság viszonylag alacsony fokú – sok esetben kezelhetetlenül sok találatot kapunk és nagy a zaj. / − Az összefüggések nem megfelelően kezeltek – nem képesek kellően láttatni a jelentésbeli (szemantikai) összefüggéseket. Főleg a felhasználó tudására, leleményességére van bízva, hogy keresőkérdését mely kulcsszavakkal fogalmazza meg, hogyan kombinálja azokat. − A tartalom ellenőrizetlen – az adatbázisokkal ellentétben, az indexelő-szolgáltatások által feltárt teljes szövegekben a tartalom nem ellenőrzött. Az indexelőszolgáltatások keresőprogramjai által végzett relevancia-ellenőrzés nem teljesen kielégítő. − A teljesség nem valósul meg „teljes mértékben” – a szolgáltatások teljes körű keresésre törekszenek, de ez nem valósul meg, mivel a web bizonyos, minőségi részeit, a mély webet az internet keresők nem tudják elérni. (Megj.: az internetes keresők áttekintéséhez jó szolgálatot nyújtanak a startlapok pl. a kereső.lap.hu, illetve a mélyweb.lap.hu 3.3.7
Internetkatalógusok
Olyan, az intelligens feldolgozó munkára épülő szolgáltatások, melyek egyesek szerint az online bibliográfiai adatbázisok alkalmazásai az internetes környezet dokumentumainak feltárására. Az 1990-es évek második felében jelentek meg.
38
INFORMÁCIÓKERESŐ NYELVEK III.
(1) Szolgáltatók, dokumentumbázis, felhasználók − Az internetkatalógusok szolgáltatói abból a tényből indulnak ki, hogy a használat során nemcsak keresési, hanem böngészési igények is felmerülnek. Ehhez kapcsolódik az a tény, hogy az internethasználók meghatározott körei a nagy teljességet biztosító internetes keresők nyújtotta szolgáltatások mellett, a nagyobb pontosságot biztosító, eleve válogatott forrásokat nyújtó szolgáltatást is igényelnek. − Az internetes katalógusok ehhez szolgáltatnak jól használható keresőeszközt (általános, szakterületi, nyelvhez, kultúrához kötődve). A nagyobb pontosság azt is jelenti, hogy a bázis szűkebb mint az internetes keresők esetében, mivel a weben tárolt dokumentumok között minőségi szelekciót végeznek. (2) A feltárás stratégiája, intellektuális és technikai eszközei − Az internetkatalógusok feltárási stratégiája arra irányul, hogy a szellemi munkával végzett feltárás révén, a tartalom szűrésével relevánsabb, minőségi szolgáltatást nyújtsanak. Kiemelt szerepet kap a katalógusépítés és szerkesztés folyamatossága, a következetesség, ezekhez kapcsolódva megfelelő intellektuális és automatizált eszközök igénybevétele (különböző szinteken böngészhető osztályozási rendszerek, tárgyszólisták, kulcsszólisták, tezauruszok). (3) A feltárás munkafolyamatai és jellemzői − A feltárást célirányosan megválasztott hierarchikus rendszerek, vagy kategóriák kidolgozásával és alkalmazásával végzik. A rendszer adatbázisát könyvtári és más szakemberek építik, a digitális források válogatása, rendszerezése, sokféle szempont szerinti kereshetővé tétele alapján. A szerkesztés, s a szükséges feltáró munka (osztályozás, tartalmi kivonatok készítése) szerkesztőségekben zajlik. (A katalógusba való felvételt kívülről is lehet igényelni, a kérést a szerkesztőség bírálja el). − A szerkesztőségi munka során építenek az automatikus indexelés eredményeire, de a feldolgozandó webhelyeket gondosan megválasztják, és gondosan tárják fel. Az új dokumentumok viszonylag gyorsan, egy-két héten belül beépülnek a rendszerbe (nyílt katalógus esetén). A teljes katalógus aktualizálása viszont kevésbé folyamatos, mint az automatikus indexelés esetében (heteket, esetleg hónapokat késhet). (4) Az IKR-ben való keresés − Az intellektuális úton készülő internetes katalógusok elsősorban szisztematikus böngészést tesznek lehetővé. A feltárt forrásokat általában valamely hierarchikus rendszer, vagy saját készítésű kategóriarendszer szerint csoportosítják, s teszik böngészhetővé. A kereskedelmi célú általános katalógusok főként praktikus célokat szolgáló „home-grown”felosztási rendszert használnak. (ilyen pl. a Google). A böngészés hierarchiaszintek között történik, mélységében rugalmas megközelítést biztosítva. A dokumentumokba való betekintést követően a felhasználó tovább böngészhet, vagy a talált forrást megjelenítve, annak tanulmányozásába kezdhet. − A szisztematikus böngészés mellett lehetőség van az indextípusú keresésre is, tárgyszavak, kulcsszavak, földrajzi helyek és egyéb ismérvek szerint.
39
INFORMÁCIÓKERESŐ NYELVEK III.
(5) Tájékoztatás, támogatás − A felhasználók számára széles tájékozódási spektrumot biztosít (böngészés, adott szakrend szerint navigálás, valamint keresés). Differenciált felületekkel segíti a kezdő és a tapasztalt felhasználókat. Egyéb hasznos kiegészítő szolgáltatások is rendelkezésre állhatnak (ajánló jegyzékek, külső csatolók, fórum, visszajelzés) − Számos esetben az internetkatalógus a keresőrendszerrel egy szolgáltatási rendszerben együttesen fordul elő. Így mind a mellérendelő, mind a hierarchikus feltárás lehetőségei igénybe vehetők, pl. a Google Directory esetében. (6) Megjelenítés, hozzáférés − A találatok megjelenítése strukturáltabb, részletesebb, mint az automatikus indexelés esetében. A böngészés során a relevánsnak bizonyuló találatok alapján a felhasználó közvetlenül eljuthat a megfelelő igényelt internetes dokumentumhoz. (7) Értékelés, fejlesztés − Az internetes katalógusok szabványos tárgyi metaadatokat használnak, esetükben kisebb a teljesség, ugyanakkor nagyobb a pontosság stb.) A költség- és munkaigény magasabb, mint az internetes keresőknél, tekintettel arra, hogy a feldolgozás (elemzés, gyűjtés, indexelés, osztályozás stb.) időigényes és költségigényes. − A nagyobb hatékonyság érdekében az intellektuális és manuális munka mellett feltétlenül igénybe kell venni az automatizálás adta lehetőségeket (az intelligens gépi alkalmazásokat). A webhelyek fenntartói, szerkesztői mellett fontos lehet az önkéntes bedolgozók szerepe is. Ez valósul meg az Open Directory Project keretében, azon belül is az egyes nyelvi változatok építésében. Az önkéntesekkel szemben elvárás, hogy a megadott feldolgozási szempontrendszert kövessék. Példák internetes katalógusokra: Open Directory Project (http://dmoz.org), Librarians’s Index (http://www.lii.org), Academic Info (http://www.academicinfo.net), Infomine (http://www.infomine.ucr.edu , Yahoo (http://www.yahoo.com). 3.3.8
Szemantikus web szolgáltatások
A 2000-es években jelentek meg. A működésükhöz kidolgozott szabványok a W3C oldalain rendelkezésre állnak. Fejlesztésük még főként kutatási, kísérleti fázásban van. (1) Szolgáltatók, dokumentumbázis, felhasználók − A meglevő internetes keresők nem képesek a szemantikus kapcsolatok értelmezésére, így az általuk a keresésekre adott válaszok relevanciája esetleges. Ugyanakkor a felhasználók tömegei igénylik, hogy pontos találatokat, illetve ne csak találatokat kapjanak, hanem megfelelő dokumentumbázis alapján – problémáik megoldására válaszokat. Ld. Herendy Csilla tanulmányát.22 22
HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web
40
INFORMÁCIÓKERESŐ NYELVEK III.
−
A főként intellektuális alapon működő internetkatalógusok nem képesek teljes mértékben megfelelni ennek a kihívásnak, az intellektuális feltárás nagy munkaigénye és időigénye miatt. Ezért új, automatizált megoldásokat kell kifejleszteni.
(2) A feltárás stratégiája, intellektuális és technikai eszközei − A feltárási stratégia abból indul ki, hogy elengedhetetlen a szövegek szemantikus kapcsolatainak ábrázolása, ezek adatbázisokban való tárolása, értelmezésükhöz intelligens gépek igénybevétele. − A stratégia alapvető eleme a bevitt adatokat értelmezni tudó, „betanított” gép, mely a beépített algoritmusok alapján aktívan és közvetlenül képes segíteni a felhasználót mindennapi gyakorlati vagy tudásszerzési problémája megoldásában. A rendszer működéséhez az alkalmazásokat lehetővé tevő szabványokra, valamint az adatokat digitális formában rögzítő nagy összefüggő adatbázisra van szükség. (3) A feltárás munkafolyamatai és jellemzői − A reprezentálás e megközelítése a fogalmi, nyelvi, jelzetelési (azonosítási) szintek szoros összefüggését tartja szem előtt. A tudást a fogalmi kapcsolatokban helyezi el. Biztosítja az értelmezések, kijelentések, következtetések megfogalmazását. A számítógépek számára értelmezhető, formalizált leírásokat készít. Ily módon lehetővé teszi az digitálisan leképezett entitások (egyedek, dolgok, jelenségek) közötti kapcsolatok kifejezését. (4) Az IKR-ben való keresés − A szemantikus keresőben a keresés, problémamegoldás számítógéppel támogatott, „felfedezéses”, interaktív folyamat, melyben a kapott válaszokat a gép elemzi, értékeli, következetéseket von le. A keresési folyamat eredményeképpen a feltárt új információk tudásrendszerünk részévé válnak. (5) Tájékoztatás, támogatás − A szemantikus web alkalmazásához a fogalmi, nyelvi, jelzetelési (azonosító) szinteket átfogó szabványcsomag szükséges. Ennek szintjeit fogja át a szemantikus web lépcsős modellje. A technológiai alkalmazáshoz szükséges tájékoztatás, támogatás a W3C különféle nyelveken, így magyarul is megjelenő weblapjain férhetők hozzá. (6) Megjelenítés, hozzáférés − A felhasználó az eljárást követve, a kérdéseket- válaszokat értelmezni képes gép segítségével nemcsak találatokat, hivatkozásokat kap a kérdésére, hanem megoldási javaslatokat is az összetett problémáira. (7) Értékelés, fejlesztés − A szabványok nagy része a W3C szervező munkájának köszönhetően magyar fordításban hozzáférhető a.W3C Magyar Iroda weblapján. Bár folynak világszerte konkrét kutatások, fejlesztési alkalmazások, ezek köre még szűk. Ahhoz, hogy a 41
INFORMÁCIÓKERESŐ NYELVEK III.
szemantikus web megvalósulhasson, a könyvtárosok aktív részvétele is nélkülözhetetlen, a szabályozott feltáró rendszerekben, osztályozási rendszerekben, tezauruszokban rejlő szemantikus értéktöbblet érvényre juttatásával.23 A szemantikus web elveinek, módszereinek részletes ismertetéséről, szabványokról, eredményekről, folyó tevékenységekről, új szolgáltatásokról és kezdeményezésekről a W3C Magyar Iroda honlapján tájékozódhat.24 3.3.9
A rendszerek táblázatos áttekintése bázis
cédulakatalógus online katalógus adatbázis digitális könyvtárak internetes keresőrendszer internetkatalógus webkalauz linkgyűjtemény szemantikus web
Többféle típusú sokféle típusú sokféle típusú Különféle digitális Különféle digitális Különféle digitális Különféle digitális Különféle digitális
Intellekt. manuális
Gépi automat.
IKR modell
Teljesség
Pontosság
5
1
illeszt
1-2
1-2
4
3
illeszt
1-2-3
3-4
4
4
illeszt asszoc
3-4
3-4-5
4
4
asszoc
3-4
4-5
2
5
asszoc
4-5
2-3-4
4
4
asszoc
2-3
3-4-5
4
4
2-3
3-4-5
4
5
3-4
4-5
asszoc
A számok 1-től 5-ig terjedő skálán fejezik ki a vizsgált összetevők (intellektuális-gépi), illetve kritériumok (teljesség, pontosság) megvalósulási teljesítményét napjaink rendszereiben. Ezek a tól-ig megadott számok tapasztalatok alapján levont számok, az összehasonlítást segítik, tájékoztató jellegűek. A számok a rendszertípusok létező megvalósításait, jelenlegi lehetőségeit is jelzik. (Megj. ugyanazon típuson belül egymástól rendkívül eltérő minőségű megvalósulások is lehetségesek!) Magyarázat a számokhoz: Intellektuális-manuális összetevő: A manuális igény egyértelműen a cédulakatalógusokban a legmagasabb. Az intellektuális igény továbbra is magas azokban a rendszerekben, ahol a keresőnyelvek szabályozottak, ahol értelmezni, mérlegelni kell. Gépi-automatizálási összetevő: A legmagasabb a gépi intelligencia az internetes keresőkben, illetve a szemantikus keresőkben, de a digitalizált környezetben működő rendszerekben 23
TÓTH Máté: A szemantikus web. A könyvtárak a szemantikai paradigmában. Doktori értekezés tézisei. Budapest : ELTE Irodalomtudományi Doktori Iskola, 2010. 8 p. URL: http://doktori.btk.elte.hu/lit/tothmate/tezis.pdf 24 W3C Magyar Iroda. URL: http://www.w3c.hu/
42
INFORMÁCIÓKERESŐ NYELVEK III.
Teljesség: A legnagyobb dokumentumbázison az internetes kereső működik, a többinél eltérő mértékben, de sokkal szűkebb, eleve meghatározott a kör. Pontosság: a szabályozott nyelvekkel dolgozó keresőrendszereknél a legmagasabb. Nagy különbségeket eredményez, ha strukturált adatokkal dolgozunk, (pl. online katalógusok, adatbázisok, internetes katalógusok, digitális könyvtári katalógusok), vagy strukturálatlan adatokkal (mint az internetes keresők). A pontosságot meghatározó fontos tényezők: a kereshető ismérvek száma, a kereshető ismérvek kombinálhatóságának a lehetősége, az asszociatív keresés lehetősége, a szurrogátumból a szövegbe való átlépés lehetősége. Külön kiemeljük az automatikusan támogatás fontosságát, pl. az indexgenerálásban, vagy a kategóriák szerinti keresést biztosító automatikus osztályozásban.
3.4 ÖSSZEFOGLALÁS A 3. leckében átfogó áttekintést adunk a különböző információkereső rendszer-típusok legfontosabb jellemzőiről, fejlesztési, működtetési kritériumairól. Először a mai keresőrendszerek elődjeit, hagyományait tekintjük át (katalógusok és bibliográfiák), majd azt, milyen keresőrendszereket alkalmaztak ezek alapján a 20. században. Ezt követi a ma „élő” információkereső rendszerek (cédulakatalógusok, online katalógusok, adatbázisok, internetes keresők, internetes katalógusok, illetve a jövő szempontjából ígéretes szemantikus web alkalmazások sajátos jellemzőit bemutatása a megadott legfontosabb szempontok szerint. (Szolgáltatók, dokumentumbázis, használók, a feltárás stratégiája, intellektuális és technikai eszközei – feldolgozás, feltárás munkafolyamatai, – az IKR használata, keresés és böngészés – Tájékoztatás, támogatás – Megjelenítés és hozzáférés.) E logikusan egymáshoz kapcsolódó elemzések után rövid összefoglaló értékeléssel, illetve a fejlesztési teendők megfogalmazásával fejezzük be a rendszerek egységes alapokon történő, így összehasonlításra jobb lehetőséget adó ismertetését. A lecke anyagának más tárgyakkal való érintkezési pontjai: Bibliográfiai adatfeldolgozás, Az elektronikus dokumentumok feldolgozása, Adatbázis-kezelés, Integrált könyvtári rendszerek, Virtuális könyvtárak, Internetes keresőrendszerek működése.
3.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Fejtse ki, mik a katalógusok legfontosabb hagyományai? 2. Fejtse ki a bibliográfiák legfontosabb hagyományait? 3. Mik voltak az információkereső rendszerek sajátos megvalósulásai formái a 20. században? 4. Mik a ma élő információkereső rendszerek fő elemzési szempontjai? 5. Hasonlítsa össze a cédulakatalógus és online katalógus lényegi ismérveit! 6. Hogyan függ össze az online katalógusok és közös katalógusok témaköre? 7. Fejtse ki az internetes keresőrendszerek működésének fő ismérveit!
43
INFORMÁCIÓKERESŐ NYELVEK III.
8. Milyen különbségek fedezhetők fel az online katalógus és a bibliográfiai adatbázis között? 9. Fejtse ki, hogyan viszonyul egymáshoz az internetes keresőrendszer és az internetkatalógus! 10. Tömören foglalja össze a szemantikus web fejlesztések lényegét!
44
INFORMÁCIÓKERESŐ NYELVEK III.
4. 4.1
CÉDULAKATALÓGUSOK CÉLKITŰZÉS
A lecke áttanulmányozása után legyen képes: − A 20. század második felében használt „nem-számítógépes” IKR-ek rövid áttekintésére, − a cédulakatalógusokban megvalósuló tárgyi feldolgozás tényezőinek kifejtésére, − történetének, alakulásának rövid kifejtésére, − a cédulakatalógus formájú tárgyi katalógusok tervezésével, létrehozásával, szerkesztésével, gondozásával kapcsolatos feladatok kifejtésére, − a szakkatalógus, illetve a tárgyszókatalógus szerkesztési sajátosságainak bemutatására, − a tárgyi katalógusokban folyó keresési folyamat bemutatására, − fejlesztésük fő jellemzőinek kifejtésére, értékelésükre. 4.2
TARTALOM
1. A cédulakatalógus fogalma, fejlődéstörténete − A cédulakatalógus fogalma − A cédulakatalógus fejlődéstörténete 2. Szolgáltatók, dokumentumbázis, felhasználók − Szolgáltatók − Dokumentumbázis − Felhasználók 2. A feltárás stratégiája és eszközei − A feltárás stratégiája és jellemzői − A feltárás intellektuális eszközei − A feltárás technikai eszközei 4. A feltárás munkafolyamatai és jellemzői − A feltárás munkafolyamatai − A munkafolyamatok részműveletei − A feltárás jellemzői (mélysége, integrált jellege) 5.Katalógusépítés, szerkesztés, karbantartás − Szakkatalógus − Tárgyszókatalógus 6.A tárgyi katalógus használata, a keresés jellemzői − Használati szempontok − Keresési szempontok 45
INFORMÁCIÓKERESŐ NYELVEK III.
7. Tájékoztatás, támogatás 8. Fejlesztés és értékelés kérdései. − Fejlesztés − Értékelés − Váltás online katalógusra, adatbázisra
4.3 A TANANYAG KIFEJTÉSE A cédulakatalógus részletesebb tárgyalása azért indokolt, mert (1) ugyan befagyasztották, lezárták őket, de még sok helyütt kell fenntartani, használni őket, mert bizonyos állományrészek anyagát csak ezekben lehet keresni, (2) ma is tanulságokkal szolgálnak egyes, a körülményekhez képest felhasználóbarát megoldások, pl. az ETO-szerinti szakkatalógusban való eligazodást segítésére. 4.3.1
A cédulakatalógus fogalma, fejlődéstörténete
A cédulakatalógus fogalma A cédulakatalógus a kartotékrendszer egy fajtája. Olyan információtár, melyben az információtételek hordozója valamilyen meghatározott méretű karton, és amelyben az adatműveletek zöme manuálisan kerül végrehajtásra. A fogalom más megnevezései: kartotéktár, kartonrendszer, kivágat-gyűjtemény stb.
A cédulakatalógus fejlődés története Az, hogy a cédulakatalógus sikeres lehetett, nagymértékben köszönhető Charles A.. Cutternak (1837–1903), aki „lelket lehelt a kartotékrendszerbe. A tárgyszavazás, a tárgyszókatalógus-építés elméleti, módszertani elveinek, kérdéseinek kidolgozásával, minden egyes esetnél példákkal illusztrálva. (A legszűkebb fogalom elve – a művet a tárgyszó alá kell besorolni, és nem az osztályba, ahova a tárgy tartozik.)25 Megj.: jórészt neki köszönhető a Tizedes Osztályozás szerinti szakrendi elhelyezés elterjedése a dokumentumok rendszerezett elhelyezéséhez, tematikus böngészéséhez, („Cutter-szám” – a betűrendes helyet mutató csoportos jelzet, a raktári jelzet szakcsoport része nem része a Cutter –számnak, az valóban az ETO-ból vezetődik le) A cédulakatalógus a 19. század végén lett a könyvtárakban a másodlagos információk feltárásának és keresésének közel száz éven át használt fő eszközévé. A könyvtárak dokumentumait tükröző szurrogátumok szabványos katalóguscédulákon rögzítették, és ezek alapján szerzők, címek, tárgyszavak, ETO-számok szerint rendszerezett szurrogátumtárakat építettek, és tettek kereshetővé. A cédulakatalógusok fejlesztésére alapvető hatást gyakorolt Charles A. Cutter munkája, melyre a fentiekben már hivatkoztunk (1) lehetővé tenni, hogy az olvasó megtaláljon egy 25
CUTTER, Charles A. :Rules for a dictionary catalog. 4th edition, rewritten. Washington, Government Printing Office, 1904. URL: http://digital.library.unt.edu/ark:/67531/metadc1048/m1/1/
46
INFORMÁCIÓKERESŐ NYELVEK III.
könyvet, amelynek a szerzője ismert, a címe ismert, a tárgya ismert, (2) megmutatni neki, hogy a könyvtár mivel rendelkezik: adott szerzőtől, adott témában, adott fajta irodalomban, (3) segíteni neki egy könyv kiválasztásában annak bibliográfiai vagy tartalmi jellemzői szerint. A siker fontos tényezője volt, hogy Cutter az alapelvekhez kapcsolódva jól követhető alapos feltárási módszertant is kidolgozott. A tárgyi katalógusok közül a tárgyszókatalógus, illetve a szakkatalógus terjedt el világszerte cédula-katalógus formában. Ez utóbbiban nagy szerepe volt Paul Otlet-nak és Henri La Fontaine-nek (Nemzetközi Bibliográfiai Intézet alapítása, a Tizedes Osztály Egyetemes Tizedes Osztályozássá fejlesztése, a Mundaneum katalógusrendszer26 létrehozása és működtetése).
3. kép 4.3.2
A Mundaneum cédulakatalógus-rendszere
Szolgáltatók, dokumentumbázis, használók
Szolgáltatók A cédulakatalógusok szolgáltatói, karbantartói, működtetői a legkülönfélébb könyvtárak voltak, belefoglalva a legnagyobbtól a legkisebb könyvtárakat, az általános és speciális gyűjtőkörű könyvtárakat. A cédulakatalógusok közvetlen szolgáltatóinak segítésébe országos szinten is jelentős támogatások születtek, pl. a központi cédulakatalógus szolgáltatása, illetve Magyarországon az Új Könyvek állománygyarapítási tanácsadó, mely a bibliográfiai leírás mellett tartalmi ismertetést is adott. Ugyancsak a központi szolgáltatás körébe tartozott a cédulakatalógus-építés, működtetés technikai és eszközfeltételeinek támogatása: katalógusszekrények, osztólapok, cédulák szolgáltatása. 26
Mundaneum katalógusrendszere [fotó] URL: http://www.mathewingram.com/work/2007/04/02/todaysinteresting-link-the-mundaneum/
47
INFORMÁCIÓKERESŐ NYELVEK III.
Dokumentumbázis A feldolgozható dokumentumok száma a cédulakatalógusban: elvileg tetszőleges volt, ugyanakkor a felső határnak mindig is gátat szabott a helyigény, illetve a használat kényelmetlensége (egyszerre egy katalógusfiókban csak egy valaki kereshetett). A feldolgozott dokumentumok köre: általában egy-egy könyvtár állományát dolgozták fel (esetleg egy könyvtár hálózatát, vagy egy szűkebb terület irodalmát, bibliográfiai kartotékrendszerben). A feldolgozott dokumentumok típusa: a dokumentumok különféle típusait dolgozták fel, és tették visszakereshetővé (könyveket, időszaki kiadványokat, AV-dokumentumokat, mikrodokumentumokat stb.
Felhasználók A használók köre valamely könyvtár (általános közművelődési, szak-, iskola) felhasználóit, olvasóit fogja át. Tehát elvileg széles körű a potenciális használók köre. Ugyanakkor ahhoz, hogy a katalógust valóban használhassák, nyitvatartási időben fel kellett keresni a könyvtárat. A használók elvárták, hogy az állományról sok szempontból tájékozódhassanak a katalógusban, de ez csak úgy valósulhatott meg, hogy egymás mellett számos katalógust kellett építeni, gondozni (pl. szerzői és címrendszós katalógus, szakkatalógus, tárgyszókatalógus stb.).
4.3.3
A feltárási stratégiája és eszközei
A feltárás stratégiája és jellemzői A feltárás stratégiája A könyvtárak funkciójuk szerint fogalmazták meg gyűjtőköri és feldolgozási szabályzataikat, a leíró és tárgyi elemeket tartalmazó katalógushálózat fejlesztésével kapcsolatos házi szabályzatokat. Ebben a kisebb könyvtárak módszertani segítséget kaptak a hálózati pl. megyei könyvtári hálózatok központjaitól. 3.
Műveletek Felhasználói igények felmérése Logikai tervezés Fizikai tervezés Katalógus létrehozása Katalógus működtetése 48
A tárgyi katalógus fejlesztésével kapcsolatos fő folyamatok:
Jellemzői A katalógushálózattal szembeni követelmények meghatározása A formai és tartalmi leírás szabványainak felhasználásával Az adathordozók (cédulák), a katalógusfiókok, katalógusszekrények kiválasz-tása A szükséges eszközök beszerzése, elhelyezése Katalógusépítés, szerkesztés, karbantartás, felújítás.
INFORMÁCIÓKERESŐ NYELVEK III.
A nagy közművelődési könyvtárakban általában a tárgyi katalógusok két fajtáját használták: az ETO-szakrendi katalógust és a tárgyszókatalógust. Az esetek többségében a teljes állomány tárgyi feltárása „csak” az ETO szerinti szakkatalógusban történt meg, a tárgyszavas feltárást gyakran csak egyes különgyűjtemények feltárására dolgozták ki és használtak. (ezek egy része, különösen a helyismereti katalógusok néhány könyvtárban már fénylyukkártyás, illetve számítógépes formában valósultak meg az 1970–80-as években). A feltárás jellemzői (mélysége, integrált jellege) A kisebb általános nyilvános könyvtárakban az egy dokumentumra eső ismérvek átlagos száma 5-6 volt. Ez nem jelenthetett igazi tartalmi feltárást, inkább a dokumentumok leíró jegyei szerinti visszakeresését, az azonosítást, bizonyos szempontok szerinti csoportosítást szolgálta. A nagyobb nyilvános könyvtárakban, valamint a tudományos és szakkönyvtárakban ennél mélyebb feltárást valósítottak meg, de ez azzal járt, hogy többfajta katalógust kellett építeni egymás mellett: szerzői betűrendeset, sorozati katalógust, tárgyszókatalógust, szakkatalógust, nyelvi katalógust stb., hogy a különféle ismérvtípusok kereshetők legyenek. Olyan integrált katalógust ritkán építettek, melyben együtt szerepeltek volna pl. könyvek, AV-anyagok stb. leírásai. Az Országos Oktatástechnikai Központ (OOK) veszprémi könyv- és médiatára volt jó példa erre az integrált megoldásra az 1970–80-as években, ahol a cédulák színével is jelölték, hogy milyen dokumentumtípusról van szó. Ehelyett inkább különkatalógusokat hoztak létre dokumentumtípusok szerint, ahol az egyik a könyveket, a másik a folyóirat-cikkeket, a harmadik a helyismereti gyűjteményt, a negyedik a zenei (hangzóanyagokat) stb. tárta fel. A különgyűjteményeket feltáró apparátus típusai is különbözők voltak: ETO-szakrendi katalógus, tárgyszókatalógus, műfaji katalógus, témakatalógus (pl. évfordulókhoz összeállított anyagok), földrajzi katalógus. Egy nagy könyvtár (pl. megyei könyvtár) akár 20-25 különböző katalógust is építhetett (pl. különkatalógusokat az egyes dokumentumtípusok számára, pl.- könyvek, folyóiratok, zenei anyagok stb.) Ezekben azonban nem volt egységes IKNY, mely segítségével az olvasó egyben láthatta volna az állományt.
A feltárás intellektuális eszközei A cédulakatalógusok építését jól szolgálták az IKNY-szabványok (pl. az ETO), szakkatalógus-építési szabályzatok (mechanikus vagy csoportképzés alapján), a tárgyszókatalógus-szerkesztési szabályzatok. A cédulakatalógusban történő feltárási modellben négy hierarchiaszint épült egymásra legátfogóbbtól a legelemibbig
49
INFORMÁCIÓKERESŐ NYELVEK III.
4.
Megnevezés Katalógushálózat Katalógusok Katalógusfiókok Információtételek
Cédulakatalógus IKR hierarchiaszintjei
Jellemzők a legkülönfélébb katalógusok együttese egy könyvtárban vagy hálózatban a katalóguscédulákon szereplő információtételek rendezett állományai („kartotékfájlok”) a katalóguscédulák tárolására, a tagolásra szolgáló, feliratozott fiókok A katalóguscédulák a rajtuk található információtételekkel
A nagyobb könyvtárakban a tárgyi katalógusok a katalógushálózaton belül általános olvasói és különgyűjteményi tárgyi katalógusokra oszlottak. Az általános olvasói katalóguson belül, cédulakatalógus formájában, ahol együtt használták – az ETO-szakrendi és tárgyszókatalógus – jól kiegészítette egymást: (a) tárgyszókatalógus a tárgyszavak szigorú betűrendjében, (b) a szakkatalógus többé-kevésbé hierarchikus szerkezetben). (Megj.: Sajnos a tárgyszókatalógust kevés könyvtárban építettek.
A feltárás technikai eszközei A katalóguscédulára írt tételek sokszorosítása az 1960–70-es évektől fontos központi, hálózati szolgáltatás volt. A könyvtárak a cédulákat megadott példányszámban igényelhették a Könyvtárellátótól, a beszerzett könyvek mellett. Így helyben a feladat csak a szükséges módosítás, illetve a katalógus szerkesztése, gondozása volt. Saját feltárású tételek esetén a cédulasokszorosítást az 1970-es években az elektrosztatikus másolók, majd az 1980as években megjelenő Commodore gépekhez készült szoftverek segítették. (Ilyen volt pl. a „Vizygráf”, melyet a körmendi városi könyvtár akkori vezetőjéről, Vizy Lászlóról neveztek el.27) 4.3.4
A feltárás munkafolyamatai és jellemzői
A feltárás munkafolyamatai A katalóguscédulán található vizuális, könnyen áttekinthető információtételekkel az alábbi adatműveleteket lehetett megvalósítani:
27
PÁLVÖLGYI Mihály: Információs technológia. Főiskolai jegyzet könyvár szakos hallgatók részére. Egységes jegyzet. Bp. Tankönyvkiadó, 1991. 179-181.p.
50
INFORMÁCIÓKERESŐ NYELVEK III.
5.
Művelet Rögzítésük Beillesztésük Módosításuk
Keresésük
Törlésük
Adatműveletek a cédulakatalógusban
Jellemzője az információtételek meghatározott rendben történő szabványos rögzítése a katalóguscédulán a katalóguscédulán rögzített információtételek beillesztése a megfelelő katalógus megfelelő fiókjába, a megfelelő osztólapok mögé, a meghatározott sorrendbe illeszkedve A leírási szabvány, ETO-szám, tárgyszórendszer stb. revíziója esetén egyes tételeket módosítani kellett a katalógusban. Menete: a megfelelő fiók kiválasztása, a cédula kivétele, a módosítás elvégzése, a cédula visszahelyezése. Konkrét keresési cél esetén egy katalógus (adatállomány) megfelelő tételének közvetlen kiválasztása. Menete: a tájékoztató feliratokkal ellátott megfelelő fiók kihúzása, az osztólapokkal tagolt cédulák között a megfelelő tételhez lapozás. Böngészés esetén a feliratozott osztólapokkal tagolt anyagban való lapozgatás. Az elveszett, vagy kiselejtezett mű céduláit ki kellett venni a megfelelő katalógusrészekből (pl. a leíró, tárgyi katalógusok megfelelő helyeiről), azokat el kellett távolítani.
A munkafolyamatok részműveletei A fenti rögzítési, beillesztési, módosítási, törlési funkciók a feldolgozó szakember többé-kevésbé mindennapos feladatai közé tartoztak. A rövid ismertetésből is kitűnhet, hogy munka- és időigényes feladatok voltak. Pl. a beillesztés művelete az alábbi részműveletek elvégzését követelte meg: − Kijelölés – a katalóguscédulán azoknak az elemeknek a kijelölése, amelyek szerint majd a beosztás, besorolás történik − Előrendezés – a cédulák vagy betűrendben (tárgyszókatalógus szerkesztésnél), vagy ETO-számok szakrendjében való előrendezése. − Beosztás – a tényleges beillesztés. A fenti alapvető adatműveletek mellett szükség volt a tárgyi katalógus szerkesztésével, gondozásával kapcsolatos olyan intellektuális, döntést igénylő műveletek végzése, mint pl. az utalások, hivatkozások, mutatók készítése. A műveletek között többször említettük a fiókok szerepét. A feliratozott fiókok tették lehetővé, hogy a katalógusban nem kellett az összes cédulát végiglapozgatni. A katalógusfiók a tételek egy intervallumát képviselték, amelyet az intervallum megadásával könnyen azonosíthattunk. Pl. a szakkatalógusban a 943.9”0896”/943.9”1000” Magyarország története feliratú fiók egyértelműen jelölte bárki számára, hogy benne a honfoglalástól István király megkoronázásáig tartó időszakkal kapcsolatos dokumentumokat képviselő leírások vannak. A tárgyszókatalógusban az Aa/Az feliratú fiók egyértelműen jelezte, hogy benne mely betűvel kezdődő tárgyszavakhoz tartozó leírásokat kereshet. 51
INFORMÁCIÓKERESŐ NYELVEK III.
Katalógusépítés – szakkatalógus
4.3.5
Bevezetés Az ETO-t széles körben használták a szakkatalógus-szerkesztésben. E katalógusok ma is fontos szerepet töltenek be, hiszen az online katalógusok nem komplettek. A tárgyi katalógusok helyzetét az 1980-as évek közepén Rónai Tamás28 mérte fel megyei könyvtárakban, főiskolai könyvtárakban. A továbbiak során építünk az általa, akkor megállapított tényekre. Az ETO-jelzetek ritkán mentek el az individualizáló feltárás szintjére, inkább a csoportosítást szolgálták tárolóstruktúrákban. A feldolgozási folyamat fő lépései az alábbiak voltak: (1) a tétel osztályozása (vagy központi megoldás esetén esetleges módosítása) (2) katalóguscédulán való rögzítése (3) a katalóguscédulán levő ETO-jelzetek kijelölése, (4) a cédulák előrendezése (főosztályok, osztályok stb. szerint) (5) a cédulák beosztása (a megfelelő fiókokon belül a megfelelő osztólapok mögé). Mechanikus szakrend Az ETO-jelzeteket tartalmazó katalógustételek beosztásának sorrendje a szakkatalógusok tárolószerkezetében vagy mechanikus (szoros szakrendezésen alapuló), vagy csoportképzéses volt. 6.
ETO-jelzet 378 378:001.891 378:31 378(439) 378.046 378.048 378.147
Példa a mechanikus szakrend szerinti besorolásra
Megnevezés Felsőoktatás. Egyetemek. Főiskolák Magassy Loránt: Tudományos kutatómunka a felsőoktatásban Varga Aladár: Felsőoktatási statisztika Magyarország felsőoktatása A felsőoktatás tanulmányi szintjei Ajtósi Pál: Pályaválasztás a felsőoktatásban Bölcs Béla: Oktatási módszerek, eljárások a felsőoktatásban
Ennek egy egyszerű alkalmazási példája a fenti táblázatban látható. Amennyiben mélyebben tudatosítani akarja, ismételje át a szakrenddel kapcsolatos tudnivalókat az Információkereső nyelvek, 1 félév, 11. leckéje alapján. A magyar könyvtárak többségében a fentebb szemléltetett mechanikus szakrend helyett (mely csak nehezen, nagy odafigyeléssel követhető), az egyszerűbb csoportképzéses módszer terjedt el. Rónai Tamás felmérése szerint 1984-ben 16 megyei könyvtár közül 11-ben a csoportképzéses módszert használták, csak 3-ban volt szoros szakrendi, illetve 2-ben kombinálódtak a szerkesztési elvek.(RÓNAI, 1985.) 28
RÓNAI Tamás: A megyei könyvtárak tárgyi katalógusairól. = Könyvtári Figyelő, 1985. 2. sz. 160–168. p.
52
INFORMÁCIÓKERESŐ NYELVEK III.
Csoportképzéses szakkatalógus szerkesztés Ebben az esetben az ETO-számok beosztásának mechanikus sorrendje csak az osztólapok szintjéig volt érvényben. Azon belül már a szerzők, címek betűrendje érvényesült. A csoportképzéses szakkatalógus szerkesztés lépései: − (1) szakcsoportokat képeztek (pl. 378 Felsőoktatás. Egyetemek. Főiskolák) − (2) A szakcsoport adatait osztólapokra írták, melyek kiemelkedtek a cédulák közül − (3) Az osztólapon belül a cédulákat mechanikusan sorolták be: (a) sima betűrend, (b) fordított időrend, azaz a legfrissebb tételek, vagy pedig (c) feldolgozás szerinti rend szerint. Következő példánkban ugyanazon tételek besorolásáról van szó, mint a fentiben, csak ezúttal a szerzők, és címek betűrendje szerint. 7.
378 Felsőoktatás. Egyetemek. Főiskolák 378.048 378.147 378 378.046 378:001.891 378(439) 378:31
Példa a szakcsoporton belüli betűrendes beosztásra
A szakcsoporton belül a tételek betűrendben Ajtósi Pál: Pályaválasztás a felsőoktatásban Bölcs Béla: Oktatási módszerek, eljárások a felsőoktatásban Felsőoktatás, egyetemek, főiskolák A felsőoktatás tanulmányi szintjei Magassy Lóránt: Tudományos kutató munka a felsőoktatásban Magyar felsőoktatás Varga Aladár: Felsőoktatási statisztika
A csoportalkotás alkalmazkodott az egy-egy szakban lévő állomány mennyiségéhez, a lényeg az volt, hogy a világosan értelmezhető szakcsoportokat jelképező osztólapok mögötti anyag jól áttekinthető maradjon. (Megj.: az osztólapok formája jelezte a hierarchiát: voltak egészfüles osztólapok – főosztályok, középfülesek – osztályok, balfülesek – alosztályok, illetve kiemelt szakcsoportok, jobbfülesek – további szakcsoportok. A feldolgozó munka műveletei, közé tartozott a katalógusok gondozása (beillesztés, módosítás, törlés, valamint a keresést szolgáló információkkal való ellátása.), ami a fentiekhez hasonlóan manuális, időigényes tevékenység volt. Jellemző, hogy egyes ETOszakkatalógus revíziók majdnem annyi munkát jelentettek, mint a teljes újrakészítés (a bibliográfiai szabvány-változás utáni drasztikus változtatásokról itt nem is beszélve). A könyvtárosok rendszerszerűen törekedtek arra, hogy minél jobban segítsék a szakkatalógus használatát. A katalógust utalókkal látták el, amelyek jól orientálták az olvasókat. Hivatkozásokat is elhelyeztek, pl. 681.3.06 lásd még 800.92 és fordítva. Betűrendes mutatókat dolgoztak ki és tartottak karban cédula formában. Ezek alapján könnyen el lehetett jutni a szakkatalógus osztólapjaihoz, s azon belül már önállóan keresni.
53
INFORMÁCIÓKERESŐ NYELVEK III.
A betűrendes mutatóban helyet kellett kapni a szakkatalógusban előforduló összes főosztály, osztály, alosztály szintű fogalom megnevezésének a vonatkozó számokkal, illetve a szakcsoportokat jelölő osztólapokon szereplő fogalmak megnevezéseinek és számainak. 4.3.6
Katalógusépítés – Tárgyszókatalógus
A központi tárgyszavazás, a katalógusépítés helyi teendői A cédulakatalógus-rendszerben tárgyszókatalógust nem sok helyen építettek, szerkesztettek. Az elvi lehetőség megvolt: az Új Könyvek állománygyarapítási tanácsadóban, illetve a központilag készített katalóguscédulákon az ETO- jelzetek mellett az Új Könyvek tárgyszavak is szerepeltek már az 1960-as évek közepe óta. (ld. bővebben IKNY 2/8). A tárgyszókatalógus építést (mint említettük) központi segédletek támogatták. Tárgyszójegyzék és tárgyszómutató az Új Könyvek 1965–1976. évfolyamaihoz, 1980/, A központi katalóguscédula-ellátott és e módszertani segédletek alapján a helyi teendők – az esetleges módosítások, illetve a tárgyszókatalógusba való beosztás, a katalógus gondozása könnyedén megoldhatók lettek volna. Csak találgatni lehetne, hogy ilyen különlegesen jó helyzetben, a magyar közművelődési könyvtárak – nem tartották fontosnak, hogy éljenek azzal a lehetőséggel, amellyel az amerikai könyvtárak tömegesen éltek már a 19. század, 20. század eleje óta. A helyi katalógusépítési, szerkesztési teendők az alábbiak voltak: − a fogalmak egyértelmű jelölése (utalás-, értelmezés- cédulák elhelyezése) − a fogalmak (IKNY-szavak) áttekinthetőségének biztosítása (fiókok feliratozása, osztólapok elhelyezése), − a keresés mélységbeli rugalmasságának elősegítése (bokrosítás), − a tárgyszavak közötti alapvető értelmi összefüggések kimutatása (hivatkozáscédula, logikai kapcsolatok kimutatása), − az egyszerű kényelmes használat feltételeinek biztosítása (tanácsadás, útmutatók). A tárgyszókatalógus szerkezete – elsősorban a klasszikus (tiszta) tárgyszókatalógus elveit követte. Ezzel kombinálták az ún. bokrosító megoldást az alábbiak szerint: A klasszikus, tiszta tárgyszókatalógust elsősorban ott használták „tisztán”, ahol ETOszerinti szakkatalógust is építettek – biztosítva a szisztematikus, logikus keresés lehetőségét. Ez esetben a tárgyszókatalógusban érvényesülhetett a tárgyszavak mechanikus betűrendje. Ha bárkit bármilyen speciális téma érdekli, a betűrendben könnyen megtalálja annak tárgyszava alatt. A bokrosító megoldást akkor használták, amikor egyes átfogó tárgyszavak alatt össze akarták vonni annak alárendelt fogalmait- melyek különben a betűrendben szétszóródtak volna, pl. − Kémia − Kémia, analitika − Kémia, fizikai, − Kémia, orvosi, − Kémia, szerves − kémia, szervetlen stb. (Forrás: Új Könyvek tárgyszómutató és tárgyszójegyzék, 1980) 54
INFORMÁCIÓKERESŐ NYELVEK III.
A tárgyszókatalógusban a tárgyszavak mellett utalások, értelmezések és hivatkozások is szerepeltek a tárgyszókatalógusok nélkülözhetetlen elemeiként. A tárgyszavas feldolgozás folyamata A feldolgozási folyamat fő lépései a tárgyszókatalógusban (1) a tétel tárgyszavazása (vagy központi megoldás esetén esetleges módosítása), a megoldás ellenőrzése (revíziója) (2) a tárgyszótétel katalóguscédulán való rögzítése (3) a katalóguscédulán levő tárgyszavak kijelölése a katalógusba való beosztásra, (4) a cédulák előrendezése (betűk szerint) (5) a cédulák beosztása (a megfelelő fiókokon belül a megfelelő osztólapok mögé). A tárgyszókatalógus szerkesztésének fontos összetevője az olvasók eligazodását segítő utalók, hivatkozások és kiemelések rendszerének folytonos kiépítése. Ugyancsak fontos volt az osztólapok rendszerének karbantartása. Osztólapokat a fontosabb tárgyszavak elé helyeztek a katalógus használatának megkönnyítésére. A tájékozódást segíti a katalógusfiókok feliratozása is. A szerkesztést és az olvasói tájékozódást szolgáló segédeszközök között legfontosabbak a tárgyszavak betűrendes és szakrendes mutatói. − A betűrendes mutató a katalógusban használt tárgyszavak és altárgyszavak betűrendes jegyzéke, melyet elsősorban az alárendelő rendszereknél használtak. − A szakrendi mutató – szisztematikus index – az előforduló tárgyszavak szakterületenkénti jegyzéke. Szerepe hasonló volt, mint a hierarchikus rendszerek esetében a betűrendes mutatónak, csak éppen ellenkező irányú. (Megj. ezeket a segédeszközöket kevés helyen építették következetesen.) 4.3.7
A tárgyi katalógus használata, a keresés jellemzői
Használati szempontok A cédulakatalógus a könyvtár központi részében kapott helyet, a szabadpolcok, és a kölcsönzés közvetlen közelében. Ilyenek voltak a szerzői betűrendes, szerzői és cím szerinti betűrendes katalógus, a tárgyi katalógusok: az ETO szerint épített szakkatalógus és (viszonylag kevés helyen) a tárgyszókatalógus. Az 1980-as évek felmérése szerint a használók elsősorban a leíró katalógusokat használták, de némi segítséggel az ETO-szakkatalógusban is eligazodtak. Mivel a cédulakatalógusok általában csak „egy példányban” készültek, helyhez kötöttek voltak. Aki használni akarta őket, annak nyitvatartási időben be kellett menni a könyvtárba. A katalógusnál esetleges tumultusok támadhattak, esetleg várni kellett a sorunkra.
Keresési szempontok A visszamenőleges keresési időszak Az adott könyvtártól függött, hogy mekkora volt a retrospektív keresés lehetősége. Nyilvánvalóan attól függött, hogy mikor kezdték el a katalógusok építését, s az mennyire volt folyamatos. A Fővárosi Szabó Ervin Könyvtárban szakkatalógusában még néhány éve 100 éves cédulák között keresgélhettünk. 55
INFORMÁCIÓKERESŐ NYELVEK III.
Különféle típusú dokumentumok feltárása és tárgyi keresése A használat szempontjából gondot jelentett az olyan integrált katalógusok hiánya, melyekben a legkülönfélébb kiadványfajtákat együtt tárták volna fel. Egy adott téma keresésénél külön-külön meg kellett nézni a könyvek, az időszaki kiadványok, az AV-anyagok, a hanganyagok stb. különkatalógusait. A kereshető adatok köre, a feltárás mélysége Általában igen alacsony volt, 5-6 ismérv/dokumentum. Mélyebb, individualizálóbb keresésre csak egy-egy kifejezetten fontos különgyűjtemény, pl. a helyismereti gyűjtemény tárgyi katalógusában volt lehetőség.
Tájékoztatás, támogatás A használat kényelme, fizikai értelemben Az olvasónak a használat során sokat kellett lapozgatni, jegyzetelni is, hiszen a cédulán levő adatokat ugyanis nem lehet kimásoltatni, a cédulákat általában nem volt szabad kiemelni. (félve, hogy elveszik, vagy nem a megfelelő helyre teszik vissza.) A használat kényelme, intellektuális értelemben A tárgyi katalógusok használata bizonyos előképzettséget, logikát és gyakorlatot igényelt. A bennük való tájékozódást a könyvtárosok átgondoltan igyekeztek segíteni. Pl. a csoportképzéses szakkatalógusok szerves része volt a betűrendes mutató (cédulaformában). A fogalommegnevezések + azok ETO-számai segítségével könnyen el lehetett jutni a szakkatalógus megfelelő fiókjához, azon belül a megfelelő osztólaphoz. Adatvédelem A cédulakatalógus adatvédelmi szempontból sérülékeny volt – bár rendszabályok védték a cédulák sorrendjét, de gondatlanság vagy egyéb okok miatt a sorrend megkeveredhetett, cédulák tűnhettek el, ami megnehezítette vagy lehetetlenné tehette a releváns tételek kikeresését. A dokumentumok (elsődleges információk) elérése Két fokozatban történt: − (1) a tárgyi-tartalmi ismérvek alapján azonosított cédulán megtaláltuk a dokumentum azonosító jelzetét. − (2) ennek alapján megkerestük azt szabadpolcon (persze előfordulhatott, hogy ki volt kölcsönözve), vagy felkérettük a raktárból (hosszú időt is igénybe vehetett, míg megkaptuk helyben olvasásra). 4.3.8
Fejlesztés és értékelés
Fejlesztés A tárgyi katalógusokat a feldolgozó osztály, vagy az olvasószolgálat munkatársai szerkesztették, lehetőleg ugyanazok, akik a dokumentumokat osztályozták, tárgyszavazták. 56
INFORMÁCIÓKERESŐ NYELVEK III.
Az osztályozás és katalógusszerkesztés egységét osztályozási segédletek biztosították: példatárak, szakmutató osztólap-másolatok, katalógus-szerkesztési szabályzat. A központi katalóguscédula-ellátás, s az ezzel összefüggő gépi előállítás a 20. sz. második felében fontos központi szolgáltatásnak számított. Több nemzeti könyvtár (pl. az amerikai Kongresszusi Könyvtár), és hálózati központi könyvtár nyújtott szolgáltatási rendszere keretében katalógus-cédulaszolgáltatást más könyvtárak számára. Magyarországon ez a szolgáltatás az OSZK Könyvtártudományi és Módszertani Központja illetve a Könyvtárellátó Új Könyvek állománygyarapítási tanácsadója együttműködésének volt köszönhető. A könyvtárakban a központilag megállapított ETO-jelzeteket, tárgyszavakat szükség szerint módosítani is lehetett. A katalógusszerkesztést központi módszertani kiadványok segítették, miáltal a keresőrendszer építése, gondozása perspektivikus, következetes, újdonságkövető, rugalmas lehetett.29 Nagy figyelmet szenteltek a keresést segítő eszközök fejlesztésének is (pl. a szakkatalógushoz készített betűrendes mutató, tájékoztató feliratok stb.)
Értékelés A cédulakatalógusok általában lépést tudtak tartani az állomány gyarapodásával. Ugyanakkor meghatározták komoly hiányosságaikat is: − Információkeresési szempontok: alacsony feltárási mélység (5-6 volt az egy dokumentumra eső ismérvek száma), az egydimenziós keresés nem tette lehetővé a sokszempontú, kombinált keresést. − A használat kényelme: a használat helyhez, időhöz kötött. − Előállítás – Idő-és munkaigényes. − Szerkesztés és gondozás – Sok a manuális munkafolyamat, melyben keveredtek a rutin elemek (kijelölés, előrendezés, beosztás, ill. az intellektuális, döntést igénylő elemek (változások beépítése, az utalások, hivatkozások, mutatók készítése). − Átalakítás – Sokszor majdnem ugyanannyi munkát jelent, mint a teljes újrakészítés (pl. ETO-revízió vagy bibliográfia szabvány-változás utáni változtatások). − Technikai eszközök – szinte kizárólag a katalóguscédulák sokszorosítását segíti (elektrosztatikus másolás, számítógépek) − Horizontális integráció – általában megoldatlan, nincs olyan katalógusrész, mely a könyvtár teljes állományát tartalmazta volna tárgyi feltárásra. − Költségek – a katalógusszerkesztés munka-, és időigényes. Az egyes könyvtárak egymástól függetlenül, párhuzamosan építik állományfeltáró katalógusaikat, fizetik a munkadíjat, a technikai eszközöket. A nagy helyigény is kiadást jelent. A tárgyszavazásbeli együttműködés (illetve annak hiánya) nem volt feltétlen összefüggésben az alkalmazott technikával. Tény azonban, hogy a tárgyszavazás terén a nyelvi szabályozás alacsony foka közrejátszott abban, hogy amikor a 1990-es években megjelentek az online katalógusok, sok könyvtár saját tárgyszavas feltárásba kezdett – s csak a 2000-es években kezdtünk újra eljutni a „közös nevezőkig”. (Ami „szerencsés országokban” több mint száz éve adott.) 29
BERECZKY Lászlóné, SURJÁN Miklós: Szakkatalógus szerkesztés csoportképzés alapján. [kiad. az] OSZK KMK, OMKDK. 2. átd. bőv. kiad. Budapest : OSZK KMK : OMKDK, 1981. 165 p.
57
INFORMÁCIÓKERESŐ NYELVEK III.
Váltás online katalógusra, adatbázisra Az 1990-es évek második felében fentebb felsorolt problémák, illetve az integrált könyvtári rendszerek kínálata – a számítógépes feltárás lehetősége – egyre több könyvtárat ösztönzött arra, hogy lezárja cédulakatalógusait, és a beérkező új dokumentumokat már számítógépes úton dolgozza fel, s adatbázist és online katalógust építsen valamely integrált könyvtári rendszer moduljaiként. A cédulakatalógusban vagy más módszerrel (lyukkártya, mikrofilm) korábban feldolgozott tételek közel 20–30%-nak konvertálására máig (2010) sem került sor!
4.4 ÖSSZEFOGLALÁS A leckében áttekintést kapott a tárgyi katalógusok cédulakatalógus formában történő megvalósulásairól, azok fejlesztési, gondozási, karbantartási teendőiről, keresési-használati jellemzőiről, értékeléséről, a lezárásuk, befagyasztásuk motívumairól. A cédulakatalógusnak történeti szerepe volt az IKR-ek tárgyi megvalósulásai közt, több mint száz éven át szolgált domináns keresőrendszer a könyvtárakban. Ma is van szerepe: még nem fejeződött be a könyvtárakban a kartonon levő adatok online elérhető katalógusrekordokra konvertálása (a 2000 előtt beszerzett állomány jelentős részéről van szó!). Senki nem sírja vissza azt a rengeteg, aprólékos, időigényes munkafolyamatot, mely a tárgyi katalógusok építéshez kellett. Ugyanakkor a rendszer egyes elemeire kidolgozott jó megoldásokra ma is szívesen gondolnak vissza felhasználók és könyvtárosok egyaránt, pl. a jól áttekinthető, rendszerezett, követhető csoportképzéses szakkatalógus-szerkesztésre és –használatra, az abban való eligazodást segítő feliratozott osztólapokra, a naprakész betűrendes mutatóra.
4.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Fejtse ki, milyen információkereső rendszerek működtek a 20. század második felében, a számítógép széles körű bevezetése előtt? 2. Mik voltak a cédulakatalógus fejlődésének fő állomásai? 3. Fejtse ki, milyen szerepet játszottak a központi szolgáltatások a cédulakatalógusok építésében, fejlesztésében? 4. Foglalja össze, milyen technikai, tárgyi eszközökre épült az információfeltárás, megjelenítés, keresés a cédulakatalógus-rendszerben? 5. Vegye számba az egymást követő munkafolyamatokat és azok funkciót! 6. Mi a véleménye a feltárás integrált jellegéről a cédulakatalógusban? 7. Fejtse ki a feltárás mélységével kapcsolatos jellemzőket! 8. Foglalja össze a szakkatalógus csoportképzéses módszerét! 9. Hogyan segítették a tárgyi katalógusokban való keresést? 10. Mik voltak a cédulakatalógus használatának fő problémái a felhasználók szempontjából?
58
INFORMÁCIÓKERESŐ NYELVEK III.
5.
ONLINE KATALÓGUSOK AZ INTEGRÁLT KÖNYVTÁRI RENDSZEREKBEN
5.1
CÉLKITŰZÉS
A lecke tanulmányozása alapján legyen képes − az online katalógusok fogalmának kifejtésére, − a dokumentumbázis és felhasználók fő jellemzőinek bemutatására, − az integrált feltárási stratégia elemzésére, − az intellektuális és technikai eszközök fontosságának értelmezésére, − az online katalógusban való keresés jellemzőinek kifejtésére, − a teljesség, pontosság, és feltárási mélység igényét kielégítő megoldások kifejtésére, − a tájékoztatás, támogatás, súgók alkalmazási kritériumainak bemutatására, − a megjelenítési, letöltési stb. igények bemutatására, − a kialakuló együttműködési formák /közös katalógusok stb./ fejlesztési elveinek, gyakorlatának bemutatására, − a fejlesztések követésére. 5.2
TARTALOM
1 Az online katalógus (OPAC) fogalma, fejlődéstörténete − Könyvtári adatbázis, OPAC fogalma − Fejlődéstörténete 2. Szolgáltatók, dokumentumbázis, felhasználók − Szolgáltatók − A feltárás dokumentumbázisa − Felhasználók 3. A feltárás stratégiája, intellektuális és technikai eszközei − A feltárás stratégiája − intellektuális eszközök − Technikai eszközök 4. A feltárás munkafolyamatai 5. Az OPAC-ok használata, keresés és böngészés − Használati feltételek, szokások − Keresés − Böngészés 6. Tájékoztatás, támogatás 7. Megjelenítés, hozzáférés 59
INFORMÁCIÓKERESŐ NYELVEK III.
8. Az OPAC-ok értékelése és fejlesztése − Értékelés − Fejlesztés
5.3 A TANANYAG KIFEJTÉSE 5.3.1
Online katalógusok
Az online katalógusok megjelenése A könyvtárak állományát feltáró adatbázisok, melyek a használók számára „online katalógusokban” érhetők el. A könyvtári katalógus online elérése, használata az 1980-as évek közepétől lett szélesebb körű. Eszerint a helyi hálózatba kapcsolt személyi számítógépek és terminálok használója „online” módon férhetett hozzá a központi gépen kezelt helyi – saját – adatbázishoz, online katalógushoz (OPAC; Online Public Access Catalogue). E katalógusok az 1990-es években (nálunk a második felében) váltak tömegesen könyvtárak weblapjain. A nagy sávszélesség, az egyre gyorsabb elérés, a felhasználói végpontok számának növekedése révén fokozatosan egyre több olvasó keresett ebben az újfajta katalógusban. A 2000-es években az integrált könyvtári rendszerek üzemeltetői, ill. a közös katalógusok új impulzusokat adtak az egyes könyvtárak közös alapokon történő feldolgozásának fejlődéséhez.
Az online katalógus fogalma A könyvtári adatbázisok a könyvtárak által készített nyomtatott bibliográfiák, cédula-és egyéb formájú katalógusok folytatásai megújult technológiai környezetben. Az adatbázis segítségével összetett szerkezetű adatmodell valósítható meg, integrálhatók a részkatalógusok, ahogy a kurrens és retrospektív szolgáltatások is. A nyilvános online katalógusok a könyvtári katalógusok modernizált, technikai lehetőségekkel kibővített, szabványosított feldolgozást biztosító változatai. Egy vagy több könyvtár állományát tükröző szurrogátumtárak, melyek lehetővé teszik a dokumentumok rendszerezését, rendszerezett áttekintését, illetve az egyes dokumentumok részletes ismérvek (szerzők, címek, tárgykörök stb.) szerinti keresését, böngészését. Az online elérhető katalógus, vagy bővebben: nyilvánosan elérhető online katalógus, az OPAC (Online Public Access Catalogue) magyar megnevezése. A könyvtári adatbázisok egyik fő fajtája. Funkcióját tekintve forrásra hivatkozó adatbázis, amely a dokumentumtartalmak bibliográfiai tételek (bibliográfiai leírás, tárgyi-tartalmi adatok – osztályozási jelzet, tárgyszó, kulcsszó stb.) szerinti keresését és böngészését teszi lehetővé. Az online katalógusok általában valamely integrált rendszer funkcionális részeként működnek. 5.3.2
Szolgáltatók, dokumentumbázis, felhasználók Szolgáltatók
Az online katalógusok, könyvtári adatbázisok építői és –szolgáltatói elsősorban a könyvtárak és társulásaik. A szolgáltatást általában valamely integrált könyvtári rendszer 60
INFORMÁCIÓKERESŐ NYELVEK III.
keretében végzik. Tekintettel arra, hogy Magyarországon is számos különböző integrált könyvtári rendszer létezik, (pl. az ALEPH, HunTéka, OLIB, Szirén, TextLib stb.), a szolgáltatók a rendszerüket igénybevevő könyvtárakat hálózatszerűen szolgálják ki. Fontos szerepet kapnak a közös katalogizálási rendszerek, ill. a közös felületeken való keresés előmozdítása terén. Dokumentumbázis A könyvtári adatbázisok közül az online katalógus kezdetben „csak” a könyvtár állományában szereplő dokumentumokat tárta fel. Ez a korlátozás a könyvtárak közötti együttműködéssel, a digitális gyűjteményeik gyarapodásával csökkenőben van. A katalógusokban fokozatosan helyet kapnak a saját digitális források mellett internetes források is. Három adatot különösen fontos tudni: 1. Mi kerüljön feldolgozásra a könyvtár adatbázisában? 1, Hány %-os az állomány feltártsága egy adott könyvtár elektronikus adatbázisában? 2. Milyen dokumentumtípusok vannak feltárva jelenleg az elektronikus adatbázisban? Az alábbi adatok a MOKKA Egyesület szűk körű felméréséből származnak, tájékoztató jellegűek. 1. A feltárás dokumentumbázisa − Csak a saját állomány (28%) − Csak a saját állomány kerül feltárásra, de több telephely adataival (39%) − Az adatbázis tartalmazza más könyvtárak állományadatait is (26%) − Egyéb (7%) (MOKKA Szakértői vélemény 54.p) 2. Az állomány feltártsága az a könyvtári adatbázisban, reprezentáltsága az OPAC-ban A MOKKA Egyesület felmérése szerint az ODR könyvtárak elektronikus adatbázisai az állomány 100%-os és 15%-os határértékek között tárják fel az állományt (átlagosan a teljes állomány 67%-át). Ebben szerepelnek példány- és analitikus rekordok is. (MOKKA. Szakértői vélemény30.) Ez a tapasztalatok szerint megfelel a 2009–2010-re érvényes országos átlagnak. Van tehát mit tenni a visszamenőleges feldolgozásban! 3. A különböző dokumentumtípusok feltártsága a könyvtári adatbázisban, reprezentáltsága az OPAC-ban A fenti felmérés szerint a könyvek (100%), kiadványok 91%, elektronikus dokumentumok 89%, disszertációk és szakdolgozatok 81%, video dokumentumok 72%, hangzó dokumentumok 67%, időszaki kiadványokban megjelent részdokumentumok 67%, kartográfiai adatok 50%, kották 44%, szabványosított kiadványok 24%, kutatási és fejlesztési jelentések 19%-a van feltárva az elektronikus adatbázisban. (MOKKA Szakértői vélemény 48–49. p.)
30
A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 48 p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf
61
INFORMÁCIÓKERESŐ NYELVEK III.
Felhasználók A legkülönfélébb nagyságrendű könyvtárakban használják, a többmilliós nagyságrendű könyvtártól kezdve a kis községi könyvtárakig, és a legkülönfélébb típusú könyvtárakban (a nemzeti könyvtártól, települési könyvtárakon, felsőoktatási könyvtárakon át a szakkönyvtárakig). Így a felhasználók köre is rendkívül szerteágazó. A felhasználói körnek több mint 10 éves tapasztalatai vannak az online katalógus használatával kapcsolatban, igényeik, elvárásaik kikristályosodni látszanak. Tekintettel arra, hogy az esetek nagy részében virtuális felhasználóként veszik igénybe az OPAC-ot − Mélyebb, alaposabb tárgyi feltárást igényelnek, hogy eldöntsék, hogy egy dokumentum valóban hasznos lehet-e számukra. − Igénylik, hogy az alkalmazott keresőnyelvek használata minél kényelmesebb legyen. − A keresés, megjelenítés során több támogatást kapjanak, többféle, ugyanakkor egyszerűen igénybe vehető változat között választhassanak. − Igénylik, hogy valamely számukra szükséges dokumentum legyen hozzáférhető, akár digitális úton, akár könyvtárközi kölcsönzéssel. 5.3.3
A feltárási stratégiája, intellektuális és technikai eszközei
A feltárási stratégia Az OPAC egy integrált rendszer része A feltárási stratégia kulcsszava az integráció – a feldolgozási láncban egy műveletet csak egyszer kell elvégezni, a későbbiekben annak kimenetét a következő műveletek (modulok) bemeneteként használják. Ez hatékonyabb munkavégzéshez vezethet. Az integrációt az integrált könyvtári rendszer moduljainak egymáshoz kapcsolódása (szerzeményezési, katalogizálási, OPAC, kölcsönzési, statisztikai) teszi lehetővé. A feltárás/keresés szempontjából a katalogizálási modul (adatbázis), illetve az OPAC a legfontosabb. A katalogizálási modult általában a feldolgozó könyvtárosok építik, de gyakran tájékoztató könyvtárosok is részt vállalnak benne. Az olvasók számára a feltárási adatokat tartalmazó OPAC a legfontosabb. A feltárás dokumentumbázisa A feltárás stratégiája szempontjából alapvető annak tisztázása, hogy mi kerüljön feldolgozásra a könyvtár adatbázisában. A MOKKA Egyesület felmérésére adott válaszok szerint − Csak a saját állomány (28%) − Csak a saját állomány, de több telephely adataival (39%) − Az adatbázis tartalmazza más könyvtárak állományadatait is (26%) − Egyéb (7%) (MOKKA Szakértői vélemény 54. p) A leíró és tárgyi katalógus integrálása Az OPAC meghatározásánál már utaltunk rá, hogy funkciójukat tekintve forrásra hivatkozó adatbázisok. A bibliográfiai adatok mellett, arra törekszenek, hogy a dokumentumok tárgyi jellemzőit igényesen és sokrétűen tárják fel. 62
INFORMÁCIÓKERESŐ NYELVEK III.
Nagyon fontos, hogy a leíró adatokat (a szerzők, címek stb.), illetve tárgyi adatokat (tárgyi, tartalmi ismérvek) integrált, közös keresőfelületről lehet igénybe venni. Ily módon a katalógusok két főtípus, a leíró, illetve tárgyi katalógus integráltan vehető igénybe. Ehhez járul hozzá, hogy a tárgyi katalógusok különféle változatait (pl. az ETO alapján szerkesztett szakkatalógust, és a tárgyszókatalógust is közös felületen integrálja. Az analitikus feltárás erősítése Fontos hangsúlyt kap az analitikus feltárás, amely mélyebb szintre megy a fizikai dokumentum szintjénél, és amelybe az alábbiakat vonják be. − a helyismereti szempontból fontos dokumentumokat, a szépirodalmi gyűjteményes köteteket, az antológiákat és a tanulmányköteteket, − a hangzó anyagokat és a kottákat, − az oktatói, kutatói publikációkat a felsőoktatási könyvtárak egyetemi publikációs adatbázisaiban, − a főgyűjtőkör szerint meghatározott dokumentumokat teljes körben, a szakkönyvtárak körében, − az időszaki kiadványokat elsősorban a helyismereti és szakirodalmi adatbázisok esetében. − A MOKKA Egyesület felmérése szerint az analitikus feltárást végző könyvtárak 58%-a külön analitikus rekordban, 30%-a a monográfiai rekordon belül végzi az analitikus rekordok feltárását. (forrás: MOKKA szakértői vélemény, áttekintés a könyvtárak analitikus feltárási gyakorlatáról, 51-52.p.) A felhasználó segítése problémája megoldásában A feltárás stratégiája arra irányul, hogy a felhasználókat a lehető legjobban segítsük az adatbázisban való sokféle módon történő keresésben és böngészésben. Fontos, hogy bibliográfiai mezők, almezők, kódmezők alapján szabadon definiálhassunk indexeket. Egyaránt fontos lehet számukra − a teljesség áttekintésének igénye, – a kényelmes átlépés a közös katalógusba, ha a helyi adatbázisban nem találja a kívánt művet, − illetve a pontosság igénye, hogy a témakört különféle módszerekkel leszűkíthesse (pl. Boole-operátorok (ÉS, NEM), különféle indexek együttes használatával, vagy lelőhely szerint stb. Más adatbázisok elérhetőségének, kereshetőségének lehetővé tétele A felhasználók számára előnyös, ha a könyvtár különféle adatbázisok (pl. helyismereti, országos, nemzetközi adatbázisok), csatolóit gyűjti össze egy közös felületen, amelyekhez a könyvtárnak hozzáférési jogosultsága van. Így a felhasználók széles köre számára a könyvtár a legfontosabb adatbázis-szolgáltató. A fentiekkel kapcsolatos tapasztalatgyűjtéshez érdemes megtekinteni pl. az MTA Könyvtárának, a nagy egyetemi könyvtárak (Szeged, Debrecen, Corvinus, BME-OMIKK stb.) honlapjait, OPAC-jait, hogy láthassuk az elérhető kínálat gazdagságát!
63
INFORMÁCIÓKERESŐ NYELVEK III.
Ugyancsak érdemes tanulmányozni a különféle integrált könyvtári rendszerek központi lapjait (elérhetők a könyvtár.lap.hu könyvtári rendszerek szekciójában), hogy képet nyerhessen azok sajátos profiljairól. A korábbi kurzusokban egyes feltárási esettanulmányokban tárgyalt könyvtárak OPACjait is keresse fel, hogy lássa az esetleges fejleményeket (pl. a HunTéka rendszerben a Kisfaludy Károly Megyei Könyvtár, vagy az ALEPH rendszerben a BME-OMIKK könyvtára OPAC-ját. Intellektuális eszközök Az alkalmazott IKNY-ek magukban foglalják az osztályozási rendszereket (Magyarországon az ETO a legelterjedtebb), a tárgyszórendszereket, illetve a tezauruszokat. A tárgyszó forrásai között megtalálhatók a Magyarországon kidolgozott különböző tezauruszok és tárgyszórendszerek, pl. a közművelődési könyvtárak átfogó tezaurusza (Köztaurusz), és természetesen a helyi rendszerek. Egyetemi, illetve tudományos szakkönyvtárak esetében fontos a nemzetközi rendszerek alkalmazása, pl. Library of Congress Subject Headings (LCSH) – azaz a Kongresszusi Könyvtár tárgyszórendszere, a Medical Subject Headings (MeSH) – orvostudományi tezaurusz. A keresés pontosságát nagymértékben segítik a besorolási adatok (authority rekordok, (névadatok, egységesített címek, tartalmi jelölők, a bibliográfiai leírás adatcsereformátuma szerinti szabályozások (a tárgyszókategóriák és a tartalmi feltárás adatmezői, a tartalmi feltárás HUNMARC-on belüli adatmezőire született szabályozások) Rendkívül fontos a közös katalógusokhoz való kapcsolódás, annak építésében való szoros együttműködés. Ez egyaránt segíti az egységesebb, módszeresebb tartalomreprezentációt, illetve a közös katalógusokban található további eszközök igénybevételét. Technikai eszközök Az online katalógusok felhasználóbarát alkalmazásához elengedhetetlen, hogy a könyvtárosok pontosan, s egyben markánsan fogalmazzák meg feltárási-keresési-böngészésitámogatási-megjelenítési-elérési igényeiket, s ezeket az integrált könyvtári rendszerek fejlesztői meg is valósítsák. A HUNMARC mederbe terelte az adatok átadásának-átvételének (exportálásánakimportálásának) lehetőségeit, javultak azok technikai feltételei is, mellyel a könyvtárak a 2000-es években egyre intenzívebben éltek. A fejlesztések a z Európai Uniós támogatással működő programokban is prioritást kaptak. A közös katalógusok technológiai továbbfejlesztése számos előnnyel jár a felhasználó, együttműködő könyvtárak számára (ld. ott). Az alkalmazott adatbázis-kezelő rendszerek lehetővé teszik az adatok háromféle üzemmódban való kereshetőségét (egyszerű kereső, összetett kereső, böngésző). A böngésző üzemmód szerint használatra többféle indexet (szerzői, cím, tárgyszó, ETO) generálnak. A tezauruszfejlesztés és központi karbantartás tezauruszkezelő programot igényel. Széles körben ismert a RELEX tezauruszkezelő program, melynek egyik exportja a HUNMARC formátumnak felel meg; ennek alapján a HUNMARC formátumot fogadni képes könyvtári adatbázisrendszerekbe akár a teljes tezaurusz, akár annak részei, akár leegyszerűsített formája átvehető – a tezauruszadatok integrálhatók a bibliográfiai tételbe. A 64
INFORMÁCIÓKERESŐ NYELVEK III.
tezaurusz kifejezések szerinti kereséshez a HunTéka – Monguz rendszer kínál komplett alkalmazató modult. 5.3.4
A feltárás munkafolyamatai
A munkafolyamatok számos elemet foglalnak magukban: bibliográfiai feldolgozás, tárgyi feltárás, rekordfeltöltés, adatbázis-kezelés, a közös katalógusba való adatbevitel, illetve onnan adatátvétel végzése (adatexportálás, importálás). Emellett számos fontos fejlesztési, kezelési folyamat tartozik ide, a tárgyszórendszer fejlesztése, karbantartása (tárgyszó fölvétele, törlése, tárgyszókapcsolatok kialakítása stb.), tezauruszkezelés, az osztályozási rendszer módosításainak nyomon követése, Sajátos szerepként alakul adatbázis-kezelés, rekordfeltöltés. A MOKKA szakértői véleményben közölt felmérés is kitér erre.31 8.
Az adatbázis-kezelést, rekordfeltöltést végzők köre
sorszám Adatbázis kezelést, feltöltést végző személy 1 Saját informatikus szakember, rendszergazda 2 Az integrált könyvtári szoftver beszállítója 3 Külső cég 4 Nem rendelkezik ehhez szakemberre 5 Egyéb (MOKKA, Szakértői vélemény, 53.p.)
válasz 31 13 0 2 6
% 60% 25% 0% 4% 11%
A tezauruszkezelést tartalmazó könyvtári rendszerek tezauruszkezelő része − − − −
nem alkalmas a tezaurusz érdemi karbantartására/szerkesztésére (nehézkes kezelhetőség, ellenőrző/hibamegállapító képességek hiánya); nem képes a tezauruszt felhasználóbarát formában megjeleníteni; nem alkalmas a tezaurusz fájlba exportálására, hogy abból szövegszerkesztővel megfelelő minőségű nyomtatott változat készülhessen; nem alkalmas a nemzeti és nemzetközi szabványoknak megfelelő tezauruszszerkezet és HUNMARC besorolási adatformátum kezelésére.
5.3.5
Az OPAC használata, a keresés és böngészés lehetőségei Használati feltételek, szokások
Napjainkra gyakorlatilag minden online távoli hozzáférés az interneten keresztül valósul meg. A keresések számottevő részét „távolról”, az adott könyvtáron kívülről kezdemé31
A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 53. p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf
65
INFORMÁCIÓKERESŐ NYELVEK III.
nyezik (pl. más könyvtárból, munkahelyről, otthonról, vagy az ún. webkávézóknak nevezett nyilvános helyiségekből), bár természetesen a könyvtár területén belül is igénybe lehet venni az online olvasói katalógusokat. A keresőfelület megvalósítása integrált könyvtári rendszerfüggő: Mint tendencia, elmondható, hogy egyre barátságosabb, könnyebben kezelhető lesz, bár e téren a fejlesztésekre továbbra is szükség van. A leíró adatok (a szerző, cím stb.), a tárgyi adatok (tárgyi, tartalmi ismérvek), vagy éppen azok kombinációi egy keresőfelületről kiindulva kereshetők. Általában három üzemmód vehető igénybe (egyszerű kereső, összetett kereső, böngésző). A többféle (általában két) szabályozott IKNY-et vehet igénybe a kereséshez (magyar viszonylatban általában az ETO-t és egy tárgyszórendszert, de több helyütt az ETO mellett tezaurusz is igénybe vehető. A kulcsszavas keresés itt is népszerű, egyszerűsége miatt is. A hatékony használathoz fontos, hogy a felhasználó tisztában legyen olyan alapvető fogalmakkal, mint a teljesség és pontosság, a keresőkérdés és a keresési stratégia összefüggéseivel, ismerje az IKNY-ket, legyen gyakorlata a kereséstechnikai eszközök használatában. A használatról jó bevezetést ad Szmrekovszkyné Farkas Éva32: Keresés A keresés funkció alatt az OPAC-ban a direkt módon való keresést értjük, amely lehet egyszerű és összetett. Akkor használjuk, ha meglehetősen pontosan tudjuk, hogy mire vagyunk kíváncsiak. Itt a keresés eredményeként bibliográfiai tételeket kapunk (rövid, vagy teljes leírások formájában); A kereséstechnikai eszközök alkalmazása − egyszerű, összetett és haladók számára kialakított keresési lehetőségek, − a Boole-operátorok használata, a csonkolás, a közelségi operátorok alkalmazása, a teljes bibliográfiai rekord hipertext-linkekkel való megjelenítése, − a keresés időbeli, nyelvi, dokumentumtípus, lelőhely és egyéb behatárolása, korlátozása. Ezeknek megfelelő, példákkal is illusztrált, súgóval segített támogatása jelentősen hozzájárulhat a sikeres kereséshez. Konkordancia – ugyanazon fogalmakat kifejező osztályozási jelzetek, ill. tezaurusz deszkriptorok egymáshoz illesztése, vagy ugyanez jelzetek illetve egy tárgyszórendszer tárgyszavai vonatkozásában. Asszociatív eszközök (csatolók, linkek) – a hipertext-szerkezetű találati rekordban szereplő hiperlinkek (szerzőnevek, tárgyszavak, ETO-számok) szerint is érdemes tovább keresnünk, újabb keresőkérdés megfogalmazása nélkül. Ez nagyon hasonlít az asszociatív modell szerinti keresésre, amelyre a digitális környezet ad lehetőséget. A mélyebb szintű kereshetőség A mélyebb kereshetőség érdekében a bibliográfiai tételhez kapcsolódva nagyobb szerepet kell kapnia a szöveges ismertetésnek, annotációnak, − a KELLO, Új Könyvek állománygyarapítási tanácsadóban szereplő annotációk elektronikus változásának rendelkezésre állásával, 32
SZMREKOVSZYNÉ Farkas Éva: Keresés számítógépes katalógusokban és bibliográfiákban. URL: http://palotas.mgk.u-szeged.hu/Farkas_Eva_online.pdf
66
INFORMÁCIÓKERESŐ NYELVEK III.
− −
online könyváruházakkal való kapcsolattal, könyvtárosok vagy/és felhasználók által készített könyvismertetéseknek a rekordokhoz kapcsolásával. Jól segíti a keresés pontosságát a tartalomjegyzéknek a rekordokhoz kapcsolása. Ez a megoldás plusz energia-befektetés nélkül hatékony analitikus szintű feltárást tesz lehetővé. Böngészés A böngészést akkor alkalmazzuk, ha konkrét kérdésünk még nem fogalmazódott meg, ekkor a kereséshez csak a böngészés eredményeként kapott indexlista tanulmányozása után kezdünk hozzá. A böngészés szerepe is nőtt, különösen olyankor, ha a keresés nem specifikus, a kívánt eredmény nem ismert már előre, és ismeretlen a keresésre használandó korrekt kifejezés. Mindez azt az igényt, hogy a használót online-szójegyzékek támogassák. (ROE, Sandy, 1999.)33 A böngészőfelület sok tekintetben a keresőéhez hasonlít. A böngészés indexekben történik, az indexek általában egy legördülő listából választhatók ki. A rendszer a kiválasztott kulcsszó indextől (szerző, cím, tárgyszó, ETO-szám, kiadó stb.) függően képes a beírt szótöredék alapján vonatkozó szavakat mutatni a felhasználó számára, melyekből választva az adott szóra lefut a böngészés. Jelentősége nő a tárgyi keresésben, elsősorban tárgyszavak szerint. Az ETO szerinti böngészés nem elég felhasználóbarát, ezért kevesen használják. http://infoserver.kkmk.hu/katalogus/index.jsp?page=search
33
ROE, Sandy: Online subject access: Journal of Internet Cataloguing. l2.vol. 1999. 1. no. 69-78. Bibl. a jegyzetekben. Ismert. Mohor Jenő: Tárgy szerinti hozzáférés az online katalógusokban. In: Könyvtári Figyelő, 2000. 1.sz. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?00/055*35497
67
INFORMÁCIÓKERESŐ NYELVEK III.
4. kép
Tezaurusz-kifejezés szerinti keresés a Kisfaludy Károly Megyei Könyvtár Monguz OPAC-jában
http://infoserver.kkmk.hu/katalogus/index.jsp?from_page=browse&page=details&dbna me=database&bib1id=2019&bib1field=0&term=labdar%FAg%E1s%7C1848475%7C328 36%7C9758%7Ca154 előtte http://infoserver.kkmk.hu/katalogus/index.jsp?page=browse&dbname=database&user_t erm=labdar%FAg%E1s+&bib1ext=2019-0 5.3.6
Tájékoztatás, támogatás
A támogatás általános elvei A könyvtáros felelőssége, hogy megteremtse a web OPAC-okban való hatékony keresés feltételeit, figyelemmel a felhasználók sokszor eltérő keresési szokásaira. A felhasználó felelőssége pedig az, hogy ismerje ezeket és éljen velük. A felhasználók gyakran – mivel nem ismerik pontosan – nem használják ki a lehetőségeket. (DE PRADO, Rosario López, 2000)34. Ez az eltelt tíz évben változott, de még nem kellő mértékben. Egy szolgáltatási felületről juthasson a felhasználó sokféle támogatáshoz. Tehát célszerű az adatbázisról, a kapcsolódási pontokról stb. szóló információkat közös felületen integ-
34
DE PRADO, Rosario López: Do users dream of electronic libraries? = El. Libr. 18. vol. 2000. 3. no. 202209. Bibliogr. – Ismert. Szénászky Mária. In: Könyvtári Figyelő, 2001. 1. sz. 01/102. – Valóban elektronikus könyvtárakról álmodnak a használók? URL: URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?01/102*38470
68
INFORMÁCIÓKERESŐ NYELVEK III.
rálni az adatbázisban való kereséshez szükséges elemekkel és a találati lista összetevőivel. A támogatás barátságos környezetben valósuljon meg. A súgórendszer és összetevői A súgóval kapcsolatban jó tanáccsal szolgál a MOKKA szakértői tanulmány. A súgórendszer három szinten oldható meg: − 1. Globális súgó - bárhonnan elérhető, elsősorban keresési stratégiákat fogalmaz meg. Innen lehet tájékozódni a katalógusról, az egyes funkcióiról, tartalmáról stb. − 2. Keresési típusonként eltérő súgó - mindig a kiválasztott kereséshez kapcsolódó információkat tartalmaz (pl. mikor és hogyan érdemes az adott keresést használni). − 3. Keresési szempontokhoz tartozó, ún. helyérzékeny súgó - tartalma attól függően változik, hogy a felhasználó milyen keresési feltételt vagy indexet választott ki (pl. mit jelent pontosan, ha szerzőre, címre stb. keres). Fontos szempontok: A súgó legyen tömör, közérthető és célirányos. Csak annyi információval szolgáljon, amennyire a használónak éppen szüksége lehet. 5.3.7
Megjelenítés, hozzáférés Megjelenítés
Az online katalógusok nagy részére ma már jellemző, ami tíz évvel ezelőtt még kifogások tárgya volt35 (BABU, B. Ramesh – O’BRIEN, Ann, 2000): Különböző megjelenítési formátumok rendelkezésre állása − a rövid és a hosszú megjelenítési formátum testre szabható megjelenítése, − a megjelenítendő rekordok számának meghatározása, − a találati rekordok letöltése, a letöltött rekordok elküldése e-mailben, valamint e rekordok tárolása. Kapcsolódó rendezési, és kezelési teendők. − a találati rekordok sorba rendezésére, és relevancia szerint rangsorolása, − az egységes besorolási adatok (szerzőnév, földrajzi név, intézménynév stb.) és a lelőhelyadatok kezelése, − az alkalmazott keresési stratégia (stratégiák) megjelenítése. A megjelenített szurrogátumadatok birtokában képesnek kell lenni arra, hogy az eredeti forrásban található információk értékét előzetesen legalábbis megközelítőleg meg tudjuk ítélni a lehetőséges felhasználás szempontjából. Az alábbi kérdéseket kell mérlegelni: − tartalom, a munka célja rendeltetése, − hitelessége és ellenőrizhetőség, − a tartalom érvényessége, aktualitása,
35 ) BABU, B. Ramesh, O'BRIEN, Ann: Web OPAC interfaces: an overview = El.Libr. 18.vol. 2000. 5.no. 316-327.p. Bibliogr. - Ismert. Koltay Tibor:A világhálóra adaptált on-line katalógusok In: Könyvtári Figyelő, 2001. 2.sz. 01/163. - URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?01/163*39410
69
INFORMÁCIÓKERESŐ NYELVEK III.
− −
a tartalom objektivitása (tényekkel alátámasztott vagy spekuláció, vélekedés), szerzőség (bizonyított teljesítmény, azonosítható munkahely, e-mail stb.) Hozzáférés
A dokumentumokhoz tartalmához, ismeretegységeihez való közvetlen hozzáférés egyre természetesebb, összhangban az infokommunikációs stratégiának annak a jelszavával hogy „bármit, bármikor, bárhonnan” – bármilyen módon: digitális formában, könyvárból való kikölcsönzéssel, könyvtárközi kölcsönzéssel, esetleg a dokumentum megvásárlásával, beszerzésével. 5.3.8
Az OPAC-ok értékelése és fejlesztése Értékelés
A webOPAC ma már minden integrált könyvtári rendszer természetes funkciója. Esetében különösen fontos a felhasználói igények követése, hiszen speciális, általában távoli kapcsolatról van szó. Az ebből adódó sajátos elvárásoknak növekvő mértékben felel meg, köszönhetően az intellektuális, illetve technikai eszközök fejlődésének, melyek mind a keresés teljességét, mind pedig annak pontosságát pozitívan befolyásolhatják. Az online katalógus összetett keresési eszköz. Egyszerű, közérthető formában történő megismertetése a könyvtáros kötelessége, pl. jól kidolgozott útmutatók, módszertani tanácsok, súgórendszer segítségével. A felhasználó érdeke, hogy tisztában legyen a feltételekkel és lehetőségekkel. Ismernie kell a keresési stratégia, a pontosság és teljesség fogalmát, egymáshoz való viszonyát. Rendelkeznie kell bizonyos technikai készségeket (pl. a megfelelő keresőablak behívása, kereséstechnikai eszközök igénybevétele, a megjelenítési formátumok behívása). Fejlesztés A fejlesztés alapkérdése, hogyan lehetne még hatékonyabbá tenni az adatbázist, online katalógust, hogy sokrétű funkcióit minél jobban teljesítse. A szövegösszefüggések minél jobb tükrözése érdekében az intellektuális eszközök fejlesztése: − Az információkereső nyelvek karbantartása, fejlesztése, kiegészítése. − Megfeleltetésük konkordanciák létrehozásával, karbantartásával, pl. ETO-számok és tárgyszavak között. − A tezauruszkezelés megoldása. A keresési lehetőségek fejlesztése − új megoldások bevezetése, pl. bármilyen beírt tárgyszónál meg lehessen jeleníteni a keresés után a legközelebbi relációk linkjeit, melyek alapján tovább lehet menni vagy újabb keresést indítani. − Az egységesebb tárgyi feltárás érdekében tezauruszok, tárgyszórendszerek közös használata. 70
INFORMÁCIÓKERESŐ NYELVEK III.
− −
A besorolási rekordokban rejlő lehetőségek jobb kihasználása a pontosság növelése érdekében. A találatok szűkítési lehetőségeinek bevezetése, pl. szerzők, intézmények, formátumok, kiadási évek, nyelvek, témák (tárgyszavak) és más ismérvek szerint.
A fejlesztés terén fontos szerepet játszik a BME OMIKK Könyvtára, mely az Egyetemes Tizedes Osztályozás szerinti keresés felhasználóbarát módjainak kifejlesztésén dolgozik. Ld. Alkalmazások a BME OMIKK Könyvtárában c. videót. Könyvtári együttműködés A könyvtárak együttműködésben fontos szerepet kap az ugyanazt az integrált könyvtári rendszert használók közötti együttműködés, mely meghatározza a katalogizálási és az OPAC-modult is. Ennek alapján intenzívebb a bibliográfiai rekordok, szurrogátumok átadása, átvétele, az online katalógus, illetve a közös katalógus egymáshoz kapcsolása. Innovatív projektek A technikai és szoftver eszközök fejlesztését, a feltárás, keresés hatékonyságának növelését segítik az Európai Uniós TÁMOP-projektek. Fontos szerepet kap a több könyvtár összehangolt együttműködése, a konzorciumi forma közös célok elérése érdekében. E körbe tartoznak a közös katalógusok fejlesztését szolgáló projektek is. A Magyarországon meghatározó szerepet játszó OSZK katalógusrendszer, illetve MOKKA közös katalógus fejlesztési céljait és módszereit elemző szakértői vélemény más közös katalógusok, de egyes online katalógusok számára is fontos tanulságokkal szolgál. Kiemelten fontos a keresési, böngészési, megjelenítési, elérési feltételek fejlesztése. Érdemes tanulmányozni a tárgyi feltárás fejlesztés szempontjából számba jöhető kezdeményezéseket, pl. Könyvtárportál újdonságainak figyelésével, mely a könyvtárügy stratégiájának fontos elemét képezi. − az „épülettől és a nyitvatartási időtől független hozzáférés biztosítása (közhasznú) információkhoz és adatokhoz, a könyvtári szolgáltatások jelentős részéhez, − a használók bevonása a könyvtári tevékenységekbe, könyvtár2.0, − nem könyvtári és nem hagyományos információk és tudások (iwiw, wikik, könyvesboltok, antikváriumok, más archívumok, elektronikus szolgáltatások) integrálása. Ugyancsak tanulságos az Adatmustra sorozat követése36 – ezek egyes számaiban független szakemberek értékelik a magyar nyelvű internet könyvtári szempontból fontos tartalomszolgáltatásait; a hivatkozott számban pl. három nagy katalógust ismertetnek (MOKKA, Nektár, HunTéka.) Az Adatmustra értékelései a használók számára fontos kezelőfelülettel, a keresőrendszerrel, a tartalommal és a metaadatokkal foglalkoznak. Ily módon segítik a rendszerek minél eredményesebb használatát, felhívják a fejlesztők és karbantartók figyelmét a szolgáltatás esetleges hiányosságaira, a jövőbeli minőségi javítások érdekében.
36
DRÓTOS László, KŐRÖS Kata, TERNAI Zita: Adattármustra. Könyvtári katalógusok Tudományos és Műszaki Tájékoztatás, 6. évfolyam (2009), 11-12. sz. http://tmt.omikk.bme.hu/issue.html?issue_id=510
71
INFORMÁCIÓKERESŐ NYELVEK III.
5.4
ÖSSZEFOGLALÁS
A lecke elején az online katalógusok általános kérdéseivel, az igényekkel, a szolgáltatókkal, a dokumentumbázissal ismerkedett meg. Tudatosította, hogy milyen fontos a szolgáltató-üzemeltető, az integrált könyvtári rendszer-szolgáltató és a könyvtár közötti folyamatos munkakapcsolat. Az online katalógusokban sokféle típusú dokumentumot dolgoznak fel és tesznek kereshetővé. Ugyanakkor még az állománynak csak kb. 2/3 kereshető bennük, a többi cédulakatalógusban, fénylyukkártyás, mikrofilmes rendszerben férhető hozzá. Nagyon fontos az online katalógusban való teljes integrációjuk biztosítása. A tárgyi feltárás stratégiája éppen arra irányul, hogy integrált módon tegye lehetővé a munkafolyamatok kapcsolódását, a minél részletesebb, analitikus feltárást egy sor dokumentumtípus esetében. A könyvtárak által használt intellektuális eszközök közös alkalmazása, fejlesztése (pl. tárgyszójegyzékek, tezauruszok, besorolási adatok rendszerezett gyűjteményei) fontos fejlesztési irány. Ezt követően megismerte, hogy mennyire nélkülözhetetlen a fejlett technológia (hardver, szoftver) alkalmazása a felhasználóbarát, minőségi keresés, böngészés támogatásához. Megismerkedett az online katalógusok használati, keresési lehetőségeivel, technikáival, az azokat támogató eszközök körével (súgók, útmutatók stb.). A leckét az értékelés és fejlesztés kérdéseinek elemzése zárta, mely a további felhasználóbarát módszerek meghonosítását, a felhasználók szélesebb körű bevonását, aktivizálását tűzi ki célul.
5.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Foglalja össze röviden a könyvtári adatbázis, online katalógus fejlődéstörténetét! 2. Fejtse ki a könyvtári adatbázis, online katalógus fogalmát! 3. Határozza meg a könyvtári adatbázisok típusait, szolgáltatóit! 5. Fejtse ki, hogyan alakul a feltárás dokumentumbázisa az online katalógusokban! 6. Hozzon példákat az IKNY-ek integrált használatára, fejlesztésére! 7. Hozzon példákat a feltárás technikai és szoftver eszközeinek alkalmazására! 8. Elemezze a kereséssel kapcsolatos legfontosabb elvárásokat! 9. Indokolja a böngészés fontosságát, a tezaurusz-kifejezések használatára is kitérve! 9. Fejtse ki a keresést segítő tájékoztatás és támogatás legfontosabb elveit! 10. Sorolja fel és indokolja meg a fejlesztés területeit és teendőit! .
72
INFORMÁCIÓKERESŐ NYELVEK III.
6.
KÖZÖS KATALÓGUSOK
6.1 CÉLKITŰZÉS A lecke tanulmányozása alapján legyen képes − A közös katalógusok fogalmának kifejtésére, − a dokumentumbázis és felhasználók fő jellemzőinek bemutatására, − a közös katalógus feltárási stratégiájának elemzésére, − az intellektuális és technikai eszközök fontosságának értelmezésére − a közös katalógusban való keresés és böngészés jellemzőinek kifejtésére, − a keresés, böngészés fejlesztési teendőinek megfogalmazására, − a tájékoztatás, támogatás, súgók alkalmazási kritériumainak bemutatására, − a megjelenítési, letöltési stb. igények bemutatására − a közös katalógusok jelenlegi helyzetének értékelésére, − a fejlesztési teendők megfogalmazására.
6.2 TARTALOM 1 A közös katalógus fogalma, fejlődése − A közös katalógus fogalma − Fejlődéstörténete 2. Szolgáltatók, dokumentumbázis, felhasználók − Szolgáltatók − A feltárás dokumentumbázisa − Felhasználók 3. A feltárás stratégiája, intellektuális és technikai eszközei − A feltárás stratégiája − Intellektuális eszközök − Technikai eszközök 4. A feltárás munkafolyamatai a közös katalógusban 5. A közös katalógus használata, keresés és böngészés − Használati feltételek, szokások − Keresés − Böngészés 6. Tájékoztatás, támogatás, hozzáférés − Tájékoztatás, támogatás − Megjelenítés − Hozzáférés 7. A közös katalógusok értékelése és fejlesztése 73
INFORMÁCIÓKERESŐ NYELVEK III.
− −
Értékelés Fejlesztés
6.3 A TANANYAG KIFEJTÉSE 6.3.1
A közös katalógus fogalma, fejlődése
A közös katalógus fogalma A közös katalógus olyan kombinált könyvtári katalógus, mely számos könyvtár gyűjteményét egy közös felületen teszi elérhetővé számos felhasználási cél érdekében. Napjaink közös katalógusai az informatika és távközlés konvergenciája (az infokommunikáció) adta lehetőségeket használják ki a tartalom szolgáltatására, az adatállományok távoli elérésére, a különböző adatállományokhoz való hozzáférésre, adatállományok összekapcsolására és kombinálására, az adatállományok használatával kapcsolatos műveletek körének kibővülése, pl. letöltés, kinyomtatás, integrálás. A hálózati együttműködés lehetővé teszi a közös katalógusok építését, a közös adatállományok használatát.
Fejlődéstörténete A közös katalógusok számos dokumentumformátumban készültek, a múlt században nyomtatott könyv vagy kötet formában, mikrofilm, illetve cédula formában jelentek meg. A nyomtatott közös katalógusokat általában szerző vagy cím, esetleg könyvtári osztályozási rendszer alapján rendezték. Az elektronikus adatbázisforma világméretekben az 1980-es években, Magyarországon végétől az elektronikus adatbázisforma vált dominánssá. Az Amerikai Egyesült Államokból indultak ki ma is leghatékonyabb formái. A legtöbbet hivatkozott fejlesztés az Kongresszusi Könyvtárhoz (Library of Congress), ill. az OCLC-hez (Online Computer Library Center) köthető, világméretű keresőrendszer. (Az Információkereső nyelvek 2. félévében, a 7. leckében utaltunk rá a Kongresszusi Könyvtár tárgyszavas rendszerének kifejtése kapcsán.) E globális együttműködés a WorldCat37 keretében valósul meg. Szintén jelentős a Karslruhei Virtuális Katalógus – Karlsruher Virtueller Katalog38 (KVK) Az első magyarországi kísérletek közös katalogizáló rendszerek kiépítésére az 1980-as évek végére tehetők. Az együttműködés középpontjában ekkor a hazai könyvtárak állományában található külföldi kiadványok álltak. Az NPA (Nemzeti Periodika Adatbázis) vagy az OSZKÁR (Magyar Műszaki Könyvtárak Osztott Katalogizálási Rendszere) projektek, a közös katalógust a dokumentumok körét szűkítve: dokumentumtípus vagy szakterület szerint kezdték építeni. Az országos hatókörű, a katalogizálás feladatát a tagkönyvtárak között megosztó együttműködés létrejöttére 2000 után került sor. A VOCAL és az Országos Széchényi Könyvtár (OSZK) Amicus rendszere mellett 2001 óta működik a Magyar Országos Közös Katalógus (MOKKA). Ezt számos további közös katalógus működtetése követte.
37 38
WorldCat. URL: http://www.worldcat.org – Karlsruher Virtueller Katalog.URL: http://www.ubka.uni-karlsruhe.de/kvk/kvk/kvk_en.html
74
INFORMÁCIÓKERESŐ NYELVEK III.
6.3.2
Előállítók, szolgáltatók, dokumentumbázis, felhasználók
Előállítók és szolgáltatók A közös katalógusok előállítóit, szolgáltatóit illetve az általuk nyújtott szolgáltatásokat egyrészt a könyvtár.lap.hu alatt található alszekció,39 illetve tanulmányokban megfogalmazott adattármustrák alapján40 ismerhetjük meg, s lehetőség nyílik közvetlen tanulmányozásra is. Tanulságos Tóth Kornél tanulmánya is, mely a közös katalógusokról átfogó áttekintést ad, illetve vázolja az integrált fejlesztési elképzeléseket 2009.évi tanulmányában. 41 Magyar Országos Közös Katalógus (MOKKA)42 Magyar Országos Közös Katalógus (MOKKA) Régi Nyomtatványok Tagozat (MOKKA-R)43 Corvina VOCAL – A Corvina rendszert használó könyvtárak közös katalógusa (VOCAL)44 – Az Országos Dokumentumellátó Rendszer (ODR) (lelőhely-adatbázis) új felülete.45 OSZK NEKTÁR46 az OSZK differenciált katalógusrendszerének elemeit hangolja öszsze. http://nektar.oszk.hu – A Nektár kifejezés összefoglaló nevet takar: nemzeti könyvtárunk számítógépes katalógusainak portfóliója: az OSZK NEmzeti KönyvTári Átfogó Információs Rendszere. Szűkebb értelemben az OSZK-ban használt AMICUS integrált könyvtári rendszer adatbázisainak egy helyről, egységes felületről való elérését jelenti. HUMANUS – gyakran Cikk Mokka összefüggésben szerepel. Az OSZK koordinálásában az időszaki kiadványok részdokumentumainak feltárására szolgál, de külön adatbázisban, fokozatosan integrálva korábbi adatbázisokat, pl. az IKER-t A feltárás teljességre törekvően, más könyvtárakkal konzorciumban folyik. – HunKat47 A HunKat a HunTéka integrált rendszert használó könyvtárak virtuális közös katalógusa, melyet 2005 áprilisában adtak át. Fenntartója a MTA SZTAKI és iKron Kft. A „virtuális” szó itt azt jelenti, hogy – például a MOKKA-val ellentétben – nincs közös adatbázis a HunKat mögött, hanem a keresések a tagkönyvtárak saját katalógusában futnak le, majd egyesített találati listában látható az eredmény. 39
Közös katalógusok. URL: http://konyvtar.lap.hu/kozos_katalogusok/11227633 DRÓTOS László, KŐRÖS Kata, TERNAI Zita: Adattármustra. Könyvtári katalógusok. In: Tudományos és Műszaki Tájékoztatás, 6. évfolyam (2009), 11-12. sz. URL: http://tmt.omikk.bme.hu/issue.html?issue_id=510 41 TÓTH Kornél: Mi újság a MOKKA háza táján? Az IMOLA (Integrált MOKKA, ODR, OLA) koncepció. Tudományos és Műszaki Tájékoztatás, 56. évf. 2009. 8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=5192&issue_id=507 42 Magyar Országos Közös Katalógus (MOKKA) URL: http://ww3.mokka.hu 43 Magyar Országos Közös Katalógus (MOKKA) Régi Nyomtatványok Tagozat (MOKKA-R) http://www.eruditi.hu/lectio/mokka-r 44 Corvina VOCAL – A Corvina rendszert használó könyvtárak közös katalógusa (VOCAL) URL: http://odr.lib.klte.hu/ 45 Országos Dokumentumellátó Rendszer (ODR) (lelőhely-adatbázis) URL: http://odr.lib.klte.hu/corvina/odr/page.cgi?page=ujrov 46 OSZK NEKTÁR URL: http://nektar.oszk.hu 40
47
HunKat URL: http://www.hunkat.hu
75
INFORMÁCIÓKERESŐ NYELVEK III.
Theca48 (katolikus egyházi könyvtárak közös keresőrendszere) KözElKat 49 (Közös Elektronikus Katalógus) Erdélyi Közös Katalógus Erdélyi Közös Katalógus (EKKA) A felsoroltak mellett jelentős szerepet játszanak további integrált könyvtári rendszerszolgáltatók, pl. a Szirén, Szikla is a tagkönyvtáraik közös feldolgozási igényeinek kielégítésében. (Ld. könyvtár.lap.hu könyvtári rendszerek alszekció alatt.) A közös katalógusok működtetésének alapja a közös adatbázisok üzemeltetőinek, illetve az együttműködő, szolgáltató könyvtáraknak a kapcsolata. Web 2.0-ás szolgáltatásnak is felfogható, amennyiben a tartalmát a könyvtáros közösséget képviselő könyvtárak hozzák létre, töltik fel, osztják meg vagy véleményezik. Dokumentumbázis A dokumentumbázis kiterjed a különböző típusú dokumentumokra. Az ezzel kapcsolatos kereshetőségi igények a MOKKA-t használó könyvtárak véleménye szerint50 (26 válaszoló könyvtár %-os arányában) − könyvek (100%), − elektronikus dokumentumok (88%), − folyóiratok (81%), − folyóiratcikkek (81%), − egyéb (kotta, AV-dokumentum, térkép, analitika). Az adatbázis mindenféle dokumentum leírásait tartalmazza, beleértve a folyóiratokat és analitikákat is. A hivatkozott felmérés szerint igény van a közös katalógusok szélesebb körének elérhetőségére, pl. a Mokkát használó könyvtárak többsége igényli, hogy a MOKKA-n keresztül legyen elérhető az Országos Dokumentumellátási Rendszer (ODR), Nemzeti Periodika Archívum, Magyar és Nemzetközi Cikkek (MANCI), Digitális Archívum (a jövőben megvalósítandó), MOKKA-R, Cikkadatbázisok (HUMANUS, MATARKA) (MOKKA szakértői vélemény: 149. p.) Felhasználók A közös katalógusok egyaránt szolgálják a könyvtárosok, illetve felhasználóik igényeinek kielégítését. Nagy segítséget jelentenek a könyvtárosok számára az állománygyarapítás, a feldolgozó munka, a tájékoztatás, a könyvtárközi kölcsönzés, a bibliográfiakészítés, s a könyvtárhasználat oktatása is. Az érdeklődők, olvasók, felhasználók is közvetlenül felhasználhatják tájékozódási, bibliográfiakészítési, kutatási stb. célokból. A kutatók számára pl. információforrás olyan különleges gyűjteményekhez, mint pl. kéziratgyűjteményekhez, melyek adataihoz egyébként nem tudnának hozzáférni. 48
Theca URL: http://biblio.osb.hu KözElKat Közös Elektronikus Katalógus URL: http://www.eduport.kozelkat/ 50 A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 149. p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf 49
76
INFORMÁCIÓKERESŐ NYELVEK III.
A könyvtárak esetében a felhasználási arányokat érzékeltetjük az alábbi táblázattal. „Milyen célokra, mely munkafolyamatokhoz és milyen sűrűséggel használják a MOKKAt?” kérdésre adott válaszok (MOKKA szakértői vélemény51 (A MOKKA Egyesület 2008ban végzett felmérése alapján) 9.
Cél hetente 1x (munkafolyamat) Beszerző-feldolgozó 18% munka Tájékoztatás 10% Könyvtárközi kölcsön5% zés Egyéb, pl. bibliográfia készítése, könyvtárhasználat oktatása 6.3.3
A MOKKA közös katalógus felhasználási arányai a részvevő könyvtárakban hetente többször
naponta többször
Egyéb sűrűséggel
23%
59%
0%
36%
55%
0%
33%
52%
10% évente 2 x , kampányszerűen
Stratégia, intellektuális és technikai eszközök Stratégia
A stratégia legfontosabb pontjai: A hálózati együttműködésre építve, könyvtárak együttműködésével közös katalógus építése, a közös adatállományok növekvő mértékű kooperatív használata, Az adatok fokozott mértékű szabványosítása, a munkafolyamatok egységesítése, szabályozása: adatok feltöltése, ellenőrzése, módosítása, a felhasználók számára keresőfelületeken történő hozzáférhetővé tétele. A könyvtárak és felhasználók tevékenységének (pl. könyvtárközi kölcsönzés, állománygyarapítás, a feldolgozó munka, a tájékoztatás, a könyvtárközi kölcsönzés, a bibliográfiakészítés stb.) sokrétű segítése. A közös együttműködésen történő feltárás, illetve ahhoz kapcsolódva a keresés, böngészés feltételeinek magas szintű biztosítása. A közös katalógusok stratégiájába új elemek épülnek be. A Magyar Országos Közös Katalógus (MOKKA) 2009–2010-ben kidolgozott és a honlapján közzétett szakértői vélemény nagymértékben veszi figyelembe a résztvevő könyvtárak, könyvtárosok, illetve a felhasználók közvetlen igényeit is. A stratégia elemét képezi az a terv, mely szerint integrálni kell a közös katalógus építését, az abban való keresést, valamint az Országos Dokumentumellátó Rendszermodult, ily módon segítve a felhasználók által a keresés során megtalált és igényelt
51
A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 41. p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf
77
INFORMÁCIÓKERESŐ NYELVEK III.
dokumentumok minél hatékonyabb elérését.52 [A megvalósítás módja azonban még nyitott a 2010.december 10-i keltezésű MOKKA rendszerterv 1. vált. szerint is. (ld.: URL: http://www.mokka.hu/?q=node/112)]
5. kép
3. ábra Az IMOLA felépítése és sematikus működési modellje a modulokkal, rétegekkel és a központi tároló gyarapodási
A MOKKA adatbázissal szemben a könyvtárak által megfogalmazott igények, elvek általános érvényűek (MOKKA Szakértői vélemény, 56-57.lap) − Legyen nyílt – a szabványos rendszert használó könyvtárak mindegyike – a használt integrált könyvtári szoftverre való tekintet nélkül – csatlakozhasson hozzá. − Legyen rugalmas és naprakész – az egyes könyvtárak kurrens adatait naprakészen tudja szolgáltatni, tekintettel a törölt vagy módosított dokumentumokra. − Használata legyen egyszerű – Lehetőleg az integrált könyvtári rendszer felületén keresztül,35 automatikusan történjen a kurrens adatok feltöltése. − Használata legyen stabil és megbízható – A hardveres eszközpark nyújtson stabil és megbízható hátteret, biztosított legyen az adatbázis gyors lekérdezése. A Könyvtár 2.0 filozófia fokozatosan helyet kap a központi katalógusokban. Hangsúlyt kap a kétirányú információáramlás: a felhasználói visszajelzések, értékítéletek nyomán, és akár közvetlen közreműködésével a felhasználói közösség saját kezűleg is alakíthatja a 52
TÓTH Kornél: Mi újság a MOKKA háza táján? Az IMOLA (Integrált MOKKA, ODR, OLA) koncepció. Tudományos és Műszaki Tájékoztatás, 56. évf. 2009. 8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=5192&issue_id=507
78
INFORMÁCIÓKERESŐ NYELVEK III.
szolgáltatást. – A TextLib rendszerben pl. a felhasználó a saját megjegyzéseit is hozzáfűzheti egy-egy címhez, leíráshoz – ehhez regisztráció sem szükséges. Intellektuális eszközök −
−
−
− −
−
−
−
A közös katalógusokban a feltárás intellektuális eszközei kapcsolódnak az online katalógusokénál megismertekhez. Ide tartoznak a bibliográfiai és az IKNYszabványok, az egyes keresőnyelvek szabályozott szótárai (pl. ETO, tárgyszórendszer, tezaurusz). (Ezek esetében eltérések lehetnek az egyes résztvevő könyvtárak által használt változatok, megoldások között.) Bizonyos IKNY-ek, tárgyszórendszerek megkülönböztetett rendszerként való kezelése (pl. a Köztaurusz karbantartása és fejlesztése a MOKKA rendszer részeként). Az adatbáziskezelő rendszerek révén új és hatékonyabb változatok kidolgozása a kereshetőség (egyszerű kereső, összetett kereső, böngésző + parancsmódon alapuló kereső) felhasználóbarát megoldására. A használt tárgyszórendszerek fogalom-kapcsolataiban rejlő információk jobb kihasználása a keresésben. A MOKKA adatbázis bibliográfiai rekordok mellett név, cím és tárgyi jellegű besorolási rekordokat használata. A tárgyi besorolási adatokban rejlő lehetőségek jobb kihasználása – pl. bibliográfiai rekordkapcsolatokban, duplumként biztosan azonosítható bibliográfiai rekordokban lévő információk alapján automatikus mechanizmusok kidolgozása a Köztaurusz, LCSH/magyar változat, MeSH-orvostudományi tárgyszórendszer, Szegedi Tudományegyetem tárgyszavai kiterjesztett használatára (MOKKA szakértői vélemény, 167.p.) A MOKKA adatbázis besorolási adataiként szereplő tárgyszó rekordok szoros kapcsolata, együttműködése a szintén megújításra váró Köztaurusz-kezelő rendszerrel. A MOKKA keresési mechanizmusainak és keresőfelületének átalakítása annak érdekében, hogy a besorolási adatokban rejlő sokoldalú információkat minél teljesebben ki lehessen használni a hatékonyabb keresések céljaira. (ETO-számok, tárgyszavak, tezaurusz-kifejezések stb.) A MARC használata a tagkönyvtárakkal való kommunikációban és a MOKKA adatbázis adatkezelésében. Technikai eszközök
A központi katalógusok felhasználóbarát alkalmazásához elengedhetetlen, hogy a lehető legkorszerűbb technikai eszközök álljanak rendelkezésre. A közös katalógusok technológiai továbbfejlesztése új lehetőségeket tár fel az alkalmazásokhoz. Az alkalmazott adatbázis-kezelő rendszerek lehetővé teszik a rendszer adminisztratív teendőinek működtetését, a használat, keresés, böngészés zavartalan, és részben automatikus eszközökkel támogatott működtetését. A tezauruszkezelés, karbantartás szoftver igényeit is ki kell elégíteni. 79
INFORMÁCIÓKERESŐ NYELVEK III.
A hardveres eszközparktól azt várjuk, hogy nyújtson stabil és megbízható hátteret, biztosított legyen az adatbázis gyors lekérdezése. Az egységes és szabványos formai és tartalmi feltáráshoz álljon rendelkezésre egységes adatbázisháttér. Az adatbáziskezelő-rendszerrel szembeni elvárások: − Legyen jól hangolható, könnyen üzemeltethető, biztonságos, rendelkezzen gazdag eszközkészlettel (mentés, klaszterezés, szinkronizálás). − Legyen nagyteljesítményű, a legtöbb korszerű funkcióra alkalmas, biztosítsa a nagyméretű táblák több szálon történő, megfelelő válaszidejű, egy időben történő lekérdezését (MOKKA szakértői vélemény5,1,2., 69–70.p.) A könyvtárak javaslatai szerint elvárás, hogy minden integrált rendszer csatlakozhasson az adatbázishoz, illetve, hogy az integrált rendszer felületén keresztül, lehetőleg egy gombnyomással tudják feltölteni az adatokat, de legyen lehetőség retrospektív együttes adatfeltöltésre is. Az adatbegyűjtésben automatikus módszerek is érvényesüljenek! 6.3.4
A feltárás munkafolyamatai és jellemzői
A munkafolyamatok egymáshoz kapcsolódnak, egy műveletet egyszer kell elvégezni, annak kimenetét a következő műveletek bemeneteként használják. A résztvevő könyvtárakban elvégzett feltárás eredménye más könyvtárakban átvehető, bemenetként kezelhető. A közös katalógus adatbázisa és az együttműködő könyvtárak kapcsolata legyen rendszeres és folyamatos, kölcsönös visszacsatoláson alapuló. A rendszer egészének működéséről legyen széleskörű és teljes tájékozódási lehetőség az egyes könyvtárak, intézmények informatikusai és feldolgozó könyvtárosai számára. A közös munkafolyamatok rendje legyen szabályozott, az adatokkal kapcsolatos műveletek – adatbetöltés-feltöltés, módosítások, javítás, esetleg törlés, duplumellenőrzés (duplumszűrés), megőrzés, lekérdezés, export – szabályozását. Az adatokat közvetlenül a katalogizáló modulból lehessen feltölteni, azonnali visszajelzéssel (sikeres feltöltés, duplum-figyelmeztetés, sikertelen feltöltés jelzése). A munkafolyamatok végzése alapos szakértelmet igényel, tekintettel a speciális részfolyamatokra is: − Beállítások, mezőkezelés, ellenőrzések, jogosultságok, statisztika, fájlkezelés, létrehozás, módosítás. − Lexikai egységek szerkesztése, a keresési, böngészési, megjelenítési, letöltési folyamatok támogatása. − Tezauruszkezelés, résztezaurusz-szerkesztés, a besorolási és tárgyszórekord kezelés stb.) A szemantikus web működéséhez szükséges adatcsere formátumok használata. Az exportálásához és importáláshoz használt formátumokban új adatcsere-formátumoknak is meg kell jelennie a szemantikus web szolgáltatások biztosítása érdekében. A meglévő tezaurusz és osztályozási rendszer adatbázisának karbantartása, szerkesztése, tezaurusz és osztályozási rendszer exportja és importja során használt adatcsere formátumok között hagyományosnak tekinthető a MSZ34178-as szövegformátum, a HUNMARC MRC21adatcsere-formátum. Emellett megjelenik az export és import SKOS adatcsere-
80
INFORMÁCIÓKERESŐ NYELVEK III.
formátumban és -formátumból, valamint OWL light és full változatban (MOKKA szakértői vélemény, 110.p.) 6.3.5
Használat, keresés, böngészés
Használati feltételek, használói szokások Az egyes közös katalógusok használatáról részletes, alapos elemzést adnak az adatmustrák, pl. a MOKKA, Nektár és HunKat vonatkozásában.53 Tóth Kornél tanulmánya is számos forrásra hivatkozik. Ismerni kell a könyvtárak, felhasználók véleményét, hogy mit tartanak fontosnak a keresés szempontjából. Pl. a MOKKA szakértői véleményben (40.p.) közölt felmérésben a válaszadók 92%-a találta fontosnak a téma szerinti keresést, lehetőleg több tárgyszórendszer használatával. A Köztaurusz és az ETO használatát is szorgalmazták. (Kérdés, hogy a régi vagy az új ETO használandó-e, tekintve, hogy a közelmúltban megjelent új ETO bevezetésére a legtöbb helyen kapacitáshiány miatt nincs mód.) A központosított tárgyszó, illetve tezaurusz használatának igénye is felmerült, illetve az is, hogy az azonos tételhez tartozó különféle tárgyszavak együtt jelenjenek meg. A MÁTRIKSZ felélesztését is szívesen látnák. E felmérés elemzésére alapozva a MOKKA a téma szerinti keresést, a tárgyszókezelést „újratervezi”, mint ahogy a fejlesztésével párhuzamosan a Köztaurusz egész rendszerét is megújítja, és a két adatbázist összekapcsolja. A fejlesztési tervek között szerepel a Tezaurusz keresés opció (MOKKA szakértői vélemény, 94.p.) amely lehetőséget ad arra, hogy a tezauruszokban rejlő minden információt (a tezaurusz kapcsolatok jellege, a deszkriptor és nem-deszkriptor rekordokban lévő megjegyzések stb.) kibonthassanak, megtekinthessenek. A tezaurusz böngészés során kiválasztott kifejezéssel keresést lehessen indítani a MOKKA bibliográfiai rekordjai között.
Keresés Az online katalógusoknál megszokott módon, a leíró adatok (a szerző, cím stb.), a tárgyi adatok (tárgyi, tartalmi ismérvek), vagy éppen azok kombinációi a közös katalógusoknál is egy keresőfelületről kiindulva kereshetők. Három üzemmód vehető igénybe (egyszerű kereső, összetett kereső, böngésző). Ehhez kapcsolódik a parancsmódban történő keresés (CCL Common Command Language), mely nagy pontosságra lehetőséget adó professzionális keresés. A közös katalógusokban különféle tárgyszórendszerek szerinti tárgyszóindexeléssel találkozhatunk. A keresés szempontjából tudni kell, hogy az adott közös katalógus milyen keresőnyelveket használ tárgyi feltáró eszközökként. A tárgyszórendszer(ek) mellett az ETO használata mondható általánosnak. A MOKKA által kitüntetetten kezelt tárgyszórendszerek (Köztaurusz, MeSH, Library of Congress Subject Headings (LCSH), az LCSH magyar fordítása, Szegedi Tudomány-
53
DRÓTOS László, KÖRÖS Kata, TERNAI Zita: Adattármustra. Könyvtári katalógusok. In: Tudományos és Műszaki Tájékoztatás, 6. évfolyam (2009), 11-12. sz. URL: http://tmt.omikk.bme.hu/issue.html?issue_id=510
81
INFORMÁCIÓKERESŐ NYELVEK III.
egyetem tárgyszórendszere). Ezekhez a kitüntetett tárgyszórendszerekhez kézzel szerkesztett tárgyszó rekordok érkeznek az authority rekordot küldőként konfigurált könyvtárakból. A nagyobb keresési pontosság érdekében a találati halmaz szűkítése legyen lehetséges, pl. a listák elemeire kattintva az eredeti találati halmazt szűkíteni lehessen.
Összetett keresés Az összetett keresés azért is fontos, mert a közös katalógusokban az egyes könyvtárak online katalógusaihoz képest nagyobb számú és differenciáltabb szurrogátumanyagban kell keresni. Ezért szükséges, hogy számos beállítási lehetőséggel rendelkezzen, sok szempontú kereséseket tegyen lehetővé az összetett keresés. Ide tartozik pl. − a keresőmezők kombinált használata, − a három Boole-operátor (és, vagy, de nem) használata, − szűkítési lehetőségek felkínálása a használók számára. A szűkítés segít a releváns találatok pontosításában. Történhet pl. kiadási év, kiadási hely, nyelv, dokumentumtípus és lelőhely megadásával.
Böngészés A böngészésnek fontos szerepe van a közös katalógusban, amikor a felhasználó nem tudja pontosan a keresőkérdést megfogalmazni. Segítséget jelent, ha különféle indexek szerint el tud indulni, és el tudja jutni annak megfogalmazásáig. A böngészőfelület sok tekintetben a keresőéhez hasonlít. Használatához fontos, hogy legyen beállításérzékeny súgó, mely információt nyújt a legördülő listából kiválasztott indexről. A böngésző rendszer a kiválasztott kulcsszó indextől (szerző, cím, tárgyszó, kiadó stb.) függően képes a beírt szótöredék alapján vonatkozó szavakat mutatni a felhasználó számára, melyekből választva az adott szóra lefut a böngészés. A fejlesztési tervek között szerepel a MOKKA esetében, hogy a böngésző keresés eredménylistáján a tárgyszavak (és nevek) mellett legyen egy olyan gomb, amelyre rákattintva a teljes besorolási - authority rekordot lehet látni. 6.3.6
Tájékoztatás, támogatás, hozzáférés
A modern közös katalógustól elvárt az akadálymentes hozzáférési felület biztosítása. A használatot, keresést, böngészést megfelelően kell támogatni, hogy minél hatékonyabban lehessen azokat végezni.
Súgórendszer rendelkezésre állása A közös katalógus használatát súgórendszernek kell támogatnia. Optimális egy olyan összetett súgószolgáltatás kiépítése, ami lehetővé teszi, kis-, és nagy mennyiségű információ közlését is az olvasóval. Mindig csak annyi információval szolgáljon, amennyire a használónak éppen szüksége lehet. − 1. Globális súgó – legyen bárhonnan elérhető, segítse a keresési stratégiákat megfogalmazását, adjon tájékoztatást a közös katalógusról, annak egyes funkcióiról, tartalmáról stb.
82
INFORMÁCIÓKERESŐ NYELVEK III.
−
2. Keresési típusonként eltérő súgó – a kiválasztott kereséshez kapcsolódó információkat tartalmazza (pl. mikor és hogyan érdemes az adott keresést használni). − 3. Keresési szempontokhoz tartozó, ún. helyérzékeny súgó – tartalma attól függően változik, hogy, felhasználó milyen keresési feltételt vagy indexet választott ki (pl. mit jelent pontosan, ha szerzőre, címre stb. keres). (MOKKA szakértői vélemény, 127–128.p) A keresés, böngészés kényelmének fokozása érdekében elvárt, hogy legyen lehetőség kosár használatára, amelynek tartalmát bármikor ellenőrizheti, a korábbi keresések megtekintése.
Megjelenítés WebPAC megjelenítés esetében elvárt − Rövid, normál, hosszú megjelenítés konfigurálható adattartalommal. − Tárgyszó-böngészésben jelölve, hogy melyik tárgyszórendszer része az adott tárgyszó. − Az összes, kidolgozott és alkalmazott formátum használata. − Mű – Kifejezési forma – Megjelenési forma – példány szintű megjelenítések − Az egyes megjelenítési szintekhez fűződő Web2-es szolgáltatások (olvasói megjegyzések, olvasói értékelés, …)
Külső források hozzáférése Újszerű megoldások a Textlib alapján A leírások alatt külső források adatai is megtalálhatók: a konyvtar.hu, a www.antikvarium.hu, a www.konyvnet.hu, a www.kello.hu, és a books.google.hu adatbázisaiban a dokumentumra lefolytatott keresés eredménye. A leírások mellett található „Felkutat” gomb aktiválásával az oldalon különféle szempontok szerint lehessen a dokumentum (tartalma) után keresni különféle helyeken (pl. http://ker.eso.hu, wikipedia, google, yahoo stb.). 6.3.7
A közös katalógusok értékelése, fejlesztése Értékelés
Számos különböző gyakorlat alakult ki a közös katalógus szolgáltatói, illetve a közös keresőfelületet működtetők többéves tapasztalatai alapján. Ezek nagy részét az Adatmustrák alaposan kiértékelik, ami tanulságos az érintett és más rendszerek számára is. − A TÁMOP projektek lehetőségeket nyújtottak a rendszerszervezés sokrétű – intellektuális, technikai, funkcionális megújításához. − A fejlődését segítette az együttműködés fokozásának felismert igénye, általában és a különböző integrált könyvtári rendszereket használó könyvtárak körében: − A tárgyi feltárási rendszerek fokozatos fejlesztése. − A tárgyszórendszerek egymás melletti használata optimális módjainak biztosítása (pl. MÁTRIKSZ, Vocal tárgyszó adatbázis). 83
INFORMÁCIÓKERESŐ NYELVEK III.
− −
Egyes tárgyi feltáró rendszerek (Köztaurusz) szélesebb körű terjedése, elfogadottsága, a keresési, böngészési szolgáltatásokba való beépülése. A módszertani/technikai fejlesztések ösztönzése a szakfolyóiratokban (Könyvtári Figyelő, Tudományos és Műszaki Tájékoztatás) megjelenő tanulmányok segítségével. Fejlesztés
A központi katalógusok helyzetének alapos elemzése, értékelése alapján, a szolgáltató rendszereknek meg kell újítaniuk fejlesztési terveiket. Az alábbiak a MOKKA szakértői véleményben fogalmazódtak meg, de minden közös katalógus számára tanulságosak: − A szolgáltatásban – mint a fenti elemzésekben láthattuk – kiemelten fontos az egységes katalogizálási elvek szerint folyó munka, egységes formai és tartalmi feltárás, a partnerségen alapuló együttműködés, a folyamatos kommunikáció. − A közös katalógusok kibővült használói körrel, felhasználóbarát, komplex szolgáltatásokkal tudjanak eleget tenni az olvasók és a könyvtári hálózat igényeinek. − A fejlesztés iránya a minél nagyobb használói kényelem biztosítása a keresés, böngészés, megjelenítés, letöltés során. − A Köztaurusz helyi katalógusokban való tükröztetése, s azt követően a MOKKA kereshetővé tétele szintén a Köztaurusz segítségével. (az utalókkal együtt). − ETO-tárgyszó megfeleltetés alapján egységesebb rendszer. − A rendszerben résztvevő könyvtárak által használt információkereső nyelvek egymásnak megfeleltetett megjelenése a keresőfelületen, azaz az azonos tárgyköröket leíró különböző tárgyi kifejezések párhuzamba állítása. − A tárgyi keresések fejlesztése mind a szabályozott (tezaurusz, tárgyszórendszer), mind pedig a szabályozatlan megoldások, pl. szavas keresésekben is felhasználhatóvá tenni besorolási rekordokban rejlő információkat. − Az ODR fejlesztésekkel megvalósuló részletesebb példányinformáció szolgáltatás bibliográfiai és besorolási - authority rekord alapjainak megteremtése. − A fejlesztések – a dokumentumok tükrében – kiterjednek a felhasználók szélesebb körének a bevonása, a web 2.0, könyvtár 2.0 lehetőségeinek növelésére is. − A világméretű együttműködésbe, globális hálózatba való bekapcsolódás. A WorldCat54 program, egyrészt tetszőlegesen bármely könyv lakóhelyünkhöz közeli lelőhelyének megállapításában segít, másrészt hozzáadott értékként, a könyvekről bibliográfiai információkat, ismertetéseket tartalmaz. − A Google Book Search55 használata, mely lehetővé teszi új könyvek felfedezését, recenziók, referátumok, könyvrészletek megismerését, és azt is, hogy a könyvek szövegében kereshessünk. Linkek vezetnek el online könyvesboltokhoz, könyvtárakhoz, melyekben megtalálható a keresett könyv.
54 55
WorldCat URL: http://www.worldcat.org/ Google Book Search URL: http://books.google.com/
84
INFORMÁCIÓKERESŐ NYELVEK III.
6.4
ÖSSZEFOGLALÁS
A lecke során először megismerte a közös katalógus fogalmát, e katalógustípus kialakulását Magyarországon. Ezt követően áttekintette az előállítók és szolgáltatók széles körét, részben az ugyanazon integrált könyvtári rendszerekhez való tartozás alapján. Kiemelt figyelmet szenteltünk a Magyar Országos Közös Katalógusnak (MOKKA), a közös katalógushasználat és a dokumentumokhoz való hozzáférés integrálási elképzeléseire. Sorba vettük a dokumentumbázis kérdését (minden dokumentumtípus érintett lehet a feltárásban), a felhasználók (könyvtárosok, olvasók, kutatók) különféle igényeit. A stratégia ismertetésénél bemutattuk a megújítás mozgató rugóit, az optimális rendszerfejlesztés területeit, az alapvető célokat, ill. az azok eléréséhez szükséges intellektuális és technikai eszközöket. Ezt követte az egyre szervesebb közös katalógus építési munkafolyamatok bemutatása. A lecke kiemelten fontos része volt a közös katalógusban való keresés lehetőségeinek, módszereinek bemutatása, beleértve az új elképzeléseket is. Ehhez kapcsolódtak a bevált, illetve új megjelenítésre, letöltési formátumokra, a web2.0 és könyvtár2.0 lehetőségeit támogató formákra vonatkozó részek. A leckét átfogó értékelés, és a fejlesztési teendők és lehetőségek legfontosabb pontjainak kifejtése zárta.
6.5 ÖNELLENŐRZŐ KÉRDÉSEK 1.
Adjon áttekintést a közös katalógusok kialakulásának, fejlesztésének motívumairól!
2.
Tekintse át a közös katalógus-, közös elhasználói felültet szolgáltatók rendszereket!
3.
Hogyan alakul az egyes dokumentumtípusok helyzete a közös katalógusokban való feltárásában?
4.
Mik a stratégia legfontosabb pontjai a közös katalógus fejlesztéségen (MOKKA példáján)?
5.
Vegye számba a közös katalógus működtetéséhez alapvető intellektuális eszközöket!
6.
Tekintse át a közös katalógus működtetésének technikai feltételeit és munkafolyamatait?
7.
Mik az alapvető keresési, böngészési igények, és hogyan elégíthetők ki ezek?
8.
Milyen alapvető eszközöket foglal magában a használat támogatása?
9.
Foglalja össze, hogy mik a fejlesztés legfontosabb területei!
10. Véleménye szerint mivel indokolható a sok közös katalógus működtetése”?
85
INFORMÁCIÓKERESŐ NYELVEK III.
7.
ADATBÁZISOK. ALAPFOGALMAK. NEMZETKÖZI ADATBÁZISOK
7.1 CÉLKITŰZÉS A lecke tanulmányozása alapján legyen képes − az adatbázis fogalmának kifejtésére, − az adatbázis szolgáltatók körének bemutatására, − az adatbázistípusok – forrás, illetve forrásra hivatkozó adatbázisok – ismertetésére, − a nemzetközi adatbázisok dokumentumbázisának bemutatására, − a nemzetközi adatbázisok felhasználói fő jellemzőinek bemutatására, − az adatbázis előállítás és szolgáltatás integrált feltárási stratégia elemzésére, − a nemzetközi adatbázisok intellektuális és technikai eszközeinek ismertetésére, − az adatbázisban való keresés és böngészés sajátosságainak kifejtésére, − a nemzetközi adatbázisok használatát elősegítő programok (EISZ, EBSCOHOST) illetve támogató eszközeik bemutatására, − az elsődleges források elérési lehetőségének bemutatására, − a nemzetközi adatbázisok értékelésére példákon keresztül, − a fejlesztési irányok bemutatására.
7.2 TARTALOM 1 Az adatbázis fogalma, fejlődéstörténete − Fogalma − Fejlődéstörténete 2. Adatbázis-szolgáltatók, dokumentumbázis, felhasználók − Adatbázis előállítók és szolgáltatók − Az adatbázisok típusai − Dokumentumbázis − Az adatbázisok felhasználói 3. A feltárás stratégiája, intellektuális és technikai eszközei − A feltárás stratégiája − Intellektuális eszközök − Technikai eszközök − A feltárás munkafolyamatai 4. Példák az adatbázisok eszközeinek alkalmazására − EISZ-, és EBSCOhost adatbázisok − Dialog Bluesheets
86
INFORMÁCIÓKERESŐ NYELVEK III.
− MeSH tezaurusz − ERIC adatbázis 5. Használat, keresés, böngészés − Használati feltételek − Keresés, böngészés − Tájékoztatás, támogatás − Hozzáférési alternatívák 6. Értékelés, fejlesztés - Értékelés - Fejlesztés
7.3 A TANANYAG KIFEJTÉSE 7.3.1
Az adatbázis fogalma, fejlődéstörténete
Fogalma Az adatbázisok elektronikusan tárolt, egymással kapcsolatban levő adatok, adatállományok szervezett halmazai, melyek segítségével összetett szerkezetű adatmodelleket valósíthatunk meg. Az adatbázisok közül a könyvtári adatbázisokkal, illetve azok felhasználói formájával az online katalógussal már külön leckében foglalkoztunk. Ebben a leckében az adatbázisok átfogó tipizálása után elsősorban a forrásra hivatkozó (bibliográfiai, referáló) adatbázisokat ismerheti meg, a már ismert szempontrendszer szerint elemezve. − Az adatbázisok nem egy konkrét könyvtári állományról, hanem „az irodalomról” adnak számot. E szempontból a bibliográfiákhoz hasonló funkciót töltenek be. Széleskörű, s egyben differenciált felhasználói igényeket elégítenek ki. Az internetes megjelenés révén alternatív kínálatokkal a használók széles köreit képesek „megszólítani”. − Funkciójuk szerint lehetnek (a) forrásra hivatkozó adatbázisok (bibliográfiai adatbázisok, forrástájékoztató adatbázisok)- elemzésünkben elsősorban ezekre összpontosítunk, ill. (b) Forrás-, vagy más néven forrástípusú adatbázisok, melyek további altípusokra tagozódnak.56 Interneten hozzáférhető ismertetésükhöz lásd a Könyvtári információkeresést57 − Az adatbázisokkal feltárt dokumentumállomány eredete lehet nemzetközi, nemzeti, regionális, ill. helyi bázis, a szűrés, szelektálás gyakran nyelvi alapon történik. − A tematikus adatbázisok a dokumentumok széles körét integráltan tárják fel: a folyóiratcikkeket, kongresszus kiadványokat, hivatalos kiadványokat, egyetemi kiadványokat, újabban weblapokat, vizuális, auditív, multimédia dokumentumokat is. A lehetőségek tovább bővülnek 56
57
Pálvölgyi Mihály : Információs technológia, Budapest : Tankönyvkiadó, 1991. 210.p. UNGVÁRY Rudolf – VAJDA Erik: Könyvtári információkeresés. Typotex Kft, 2002. URL: http://www.tankonyvtar.hu/konyvtartudomany/konyvtari-080905-74
87
INFORMÁCIÓKERESŐ NYELVEK III.
Az adatbázisok működése nem öncélú, általában egy-egy szolgáltatási rendszer fontos összetevőjeként működnek, melyben a feltárás-keresés mellett az eredeti szövegekhez való hozzáférés biztosítása is benne foglaltatik.
Fejlődéstörténete A szakterületek, tudományterületek forrásait feltáró bibliográfiai adatbázisok jelentős része kereskedelmi vállalkozásként indult az 1960-as években. Elsőként az American Chemical Society referálólapja, a Chemical Abstracts (1961-től) élt az új technikai lehetőséggel. Ekkor jelentek meg a tanulmányaink során már megismert hivatkozási adatbázisok, az ERIC adatbázis is. Az 1960-as években bibliográfiai adatok hamarosan kiegészültek referátumokkal, az azokban levő kereshető kulcsszavakkal. A rekord a kibővült keresőnyelvi eszközök gazdag tárháza lett, a referáló lapok számítógépes változatai adatbázisokká fejlődtek. Az 1960-as évek második felétől az adatbázisok mágnesszalagra vitele és terjesztése és az alapján végzett szelektiv információterjesztés (SDI) jellemezte. Az 1970-es években az adatbázisokat egységesen kezelve, kidolgozott parancsnyelv szerint keresést biztosítva, megjelentek az online szolgáltató-központok (szolgáltatók), elkezdte hálózati átviteli működését a TYMNET. A Dialog, DataStar, STN stb. jól szervezett, zárt rendszerű keresést, s komplett szolgáltatási rendszert kínáltak (amelyet Magyarországon is igénybe vettek). Az 1980-as években megjelentek a CD-ROM-os adatbázisok, melyek témafigyelés alapjául is szolgáltak (pl. a Magyar Tudományos Akadémián). 1990-es évek – az adatbázisok kezdtek megjelenni az Interneten, terjedt az önkiszolgálás: emberek saját terminálról, PC-ről folytathattak kereséseket. A keresés, technikái, módszerei egyszerűsödtek. 2000-es évek: folytatódott az adatbázisok tömeges elterjedése elérhetősége az interneten. A „mély weben” rejlő adatbázisok tovább fejlődtek, mind nemzetközi, mind kontinentális, illetve nemzeti vonatkozásokban. Néhány éven belül nagy részük alkalmazkodott az internetes környezethez, a fizetős mellett ingyenes szolgáltatásokat is nyújtanak. Egyaránt törekszenek a teljesség és pontosság lehetőségeinek biztosítására. (Megj.: Az információkereső nyelv tárgy eddigi oktatásában részletesen megismerkedhetett két fontos adatbázissal, a Citation Index különféle típusaival, valamint az ERIC adatbázissal, a tárgyszavazási ismeretek során pedig a Medical Subject Heading (orvosi tárgyszórendszer) is terítékre került). 7.3.2
Szolgáltatók, dokumentumbázis, felhasználók
Előállítók és szolgáltatók A fejlődéstörténet bemutatásánál már említettünk néhány fontos konkrét rendszert. A különféle adatbázisok iránti sokféle igényre, a különféle szervezetek készítenek és szolgáltatnak adatbázisokat. A hivatkozási indexeket pl. az ISI (Institute for Scientific Information) állítja elő (mely jelenleg a Thomson Scientific része), az indexek a weben pedig a Web of Science név alatt érhetők el, a Web of Knowledge adatbázis csoport részeként. 88
INFORMÁCIÓKERESŐ NYELVEK III.
Az adatbázisok előállítói lehetnek kormányzati intézmények, minisztériumok (pl. ERIC, Medline), kereskedelmi vállalkozások, profitorientált intézmények. A globális tudásreprezentáció meghatározó fő szereplői a nagy nemzetközi adatbázisok készítői és szolgáltatói, az adatbázis-szolgáltatásoknak regionális és nemzeti szinten is fontos műhelyei alakultak ki. Az adatbázis-szolgáltatásban erős a verseny, pl. a hivatkozási indexek terén az ISI mellett az Elsevier is fontos szerepet kap, mely a Scopus-t adja ki online módon, nem is beszélve az újonnan megjelenő automatizált hivatkozási indexekről!
Az adatbázisok típusai Az adatbázisokat a szolgáltatott információk szempontjából a Carlos A. Cuadra által kialakított taxonómia alapján szokták tipizálni, csoportosítani. Ez a taxonómia egyaránt magukban foglalják az információkeresést, illetve az adatkeresést szolgáló rendszereket, amelyekről a 3. leckében adtunk számot. Itt rövid áttekintést adunk, részletesebb kifejtésük magyarul ld. a Könyvtári információkeresésben.58 Referensz adatbázisok Az eredeti, elsődleges forrásokra vonatkozó ún. másodlagos információkat, adatokat tartalmazzák. Két fajtájuk van: (1) A forrásra hivatkozó adatbázisok, melyek a bibliográfiai, illetve a referáló-indexelő adatbázisokat fogják át. Mindkettő esetében széleskörűek lehetnek az elsődleges források pl. a kiadott vagy nem kiadott dokumentumok (könyvek, időszaki kiadványok, folyóiratcikkek, szabadalmak, térképek, zeneművek, digitális dokumentumok stb.). Bibliográfiai adatbázisok A forrásokra vonatkozó szurrogátumok bibliográfiai leírást és tárgyi indextételeket tartartalmaznak. Ilyenek a könyvtárak online olvasói katalógusai, a bibliográfiai cikkadatbázisok stb. Referáló-indexelő adatbázisok A nemzetközi szakterületi adatbázisok esetében, mint majd részletesen is látni fogjuk, a szöveges ismertetés a tudásreprezentáció integráns része lett. (pl. ERIC adatbázis). (2) Forrástájékoztató adatbázisok Az elsődleges információforrások nem dokumentumok, hanem személyek, szervezetek, cégek, szolgáltatások, projektek adatait tartalmazó és kereshetővé tevő adatbázisok. A másodlagos információk a rájuk vonatkozó szurrogátumok (rekordok, szöveges ismertetésekkel kiegészítve). Ilyen adatbázisok a nemzetközi vagy országos céginformációs adatbázisok (név- és címtárak, cégkatalógusok), termékinformációs adatbázisok (az előállított áruk, szolgáltatások elérésére vonatkozó adatokkal, stb.) egyéb szervezetek adatai) szerepelnek (például az Európai Uniós cégnyilvántartások, nemzetközi termékinformációs adatbázisok
58
UNGVÁRY Rudolf – VAJDA Erik: Könyvtári információkeresés. Typotex Kft, 2002. URL: http://www.tankonyvtar.hu/konyvtartudomany/konyvtari-080905-74
89
INFORMÁCIÓKERESŐ NYELVEK III.
Forrás adatbázisok A forrás adatbázisok olyan elsődleges adat- vagy információforrások, amelyek az eredeti forrás tartalmát (számszerű vagy szöveges adatait, teljes szövegét) közvetlenül szolgáltatják. Három fő fajtáját különböztetik meg: 1. Numerikus adatbázisok Eredeti statisztikai vagy más numerikus adatokat tartalmaznak (pl. termelési, ipari, fogyasztási, költségvetési, pénzügyi, választási, demográfiai adatokat) különféle, pl. idősoros, területi stb. rendezettségben. A legismertebbek a statisztikai hivatalok adatbázisai, a demográfiai adatbázisok, a lakossági címnyilvántartás, az igazgatási (miniszteriális és önkormányzati) adatbázisok, a World Bank adatbázisa, stb. Fontosak az egyes gazdasági szektorok adatait tartalmazó adatbankok (országosan, vagy nemzetközileg, pl. az Eurostat által összeállítva), a termelés, fogyasztási és népességi adatokat tartalmazó PTS Time Series) stb., az információs társadalom fejlődését többféle szempontból vizsgáló adatbázisok stb. 2. Szöveges-numerikus adatbázisok Eredeti szöveges és számszerű adatokat felváltva tartalmaznak (pl. az ENSZ egyes szakosított adatbázisai) 3. Teljes szövegű adatbázisok – az eredeti szöveges dokumentumokat tartalmaznak. Ide tartoznak az online adatbázisok, lexikonok, enciklopédiák, szótárak, kézikönyvek, digitális könyvtárak. A legismertebb és leggyorsabb tempóban növekvő online lexikon a Wikipédia59 többnyelvű, nyílt tartalmú, a nyílt közösség által fejlesztett webes enciklopédia, melynek szerkesztését önkéntes közösség végzi.
Egy nemzetközi felmérés tanulságai A különböző szakterületek közleményeit feldolgozó referensz adatbázisok előállítása, forgalmazása, a bennük való kereséshez szükséges ismeretek átadása óriási üzleti lehetőségeket rejt. Az adatbázis-szolgáltató cégek – Ovid, CSA, Proquest, EBSCO, OCLC, hogy csak a legnagyobbakat említsük – sokszor ugyanazt az adatbázist kínálják más-más formában és szolgáltatásokkal.60 Csík Tibor és Varga Katalin hivatkozott nemzetközi felmérése 50 adatbázisra terjedt ki. Célja annak tanulmányozása volt, hogyan valósul meg a közleményekben felhalmozott ismeretek megfelelő reprezentációja, mondanivalójának tematikus feltárása, milyen eszközöket használnak a tartalmi feltárásra. Különös figyelmet fordítottak arra, hogy a legmérvadóbb nemzetközi szakirodalmi adatbázisok hogyan oldják meg ezt a problémát. E felmérés eredményeinek közvetítése leckénk fontos célja.
Dokumentumbázis A feltárt dokumentumbázis jellemzői Az adatbázisokkal feltárt dokumentumállomány eredete lehet nemzetközi, nemzeti, regionális, helyi bázis, a szűrés, szelektálás gyakran nyelvi alapon történik. (A hivatkozási index kapcsán (IKNY 2.4. lecke) láthattuk pl. a globális, nemzetközi anyagot erősen válo59 60
Wikipédia kezdőlap. URL: http://hu.wikipedia.org/wiki/Kezd%C5%91lap CSÍK Tibor – VARGA Katalin: A tudás és az információfeldolgozás. Tudományos és Műszaki Tájékoztatás. 52. évf., 2005, 7-8.sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464
90
INFORMÁCIÓKERESŐ NYELVEK III.
gatva közlő adatbázisban az angol nyelvű anyag dominál. Ugyanez vonatkozik a globális nemzetközi szakterületi adatbázisokra). Az adatbázisokkal feltárt dokumentumállomány eredete lehet nemzetközi, nemzeti, regionális, helyi bázis, a szűrés, szelektálás gyakran nyelvi alapon történik. (Figyelem: a globális, nemzetközi anyagot átfogó szakmai adatbázisok jórészt leszűkülnek az angol nyelvi dokumentumok bemutatására!). A feltárt és kereshető dokumentumok típusai A tematikus adatbázisok (ilyen a bibliográfiai adatbázisok jelentős része) a dokumentumok széles körét integráltan tárja fel: a könyveket, folyóiratcikkeket, konferenciai kiadványokat, hivatalos kiadványokat, egyetemi kiadványokat, speciális kiadványokat, fordításokat, zeneműveket, térképeket, digitális dokumentumokat – a szöveges dokumentumok mellett vizuális, auditív, multimédia dokumentumokat. Léteznek dokumentumtípusra koncentráló rendszerek is.
Felhasználók Az adatbázisok használói köre, igényeik Az adatbázisok elsősorban a munkához, tanuláshoz, kutatáshoz kapcsolódó sokrétű igényeket elégítik ki. Fontos felhasználói a különféle tudományok kutató-fejlesztő szakemberei, a felsőoktatási hallgatók és szakemberek, termelő és szolgáltató vállalatok, valamint intézmények munkatársai. A sokrétű igényeknek megfelelően az adatbázisok funkciója is sokrétű: a különféle szakterületeken való tájékozódás + a források elérésének segítése, vagy/és közvetlenül hasznosítható tényszerű adatok szolgáltatása stb. (Ld. bővebben az adatbázisok típusainak bemutatásánál.) Keresse fel az alább felsorolt könyvtárak honlapjait, ahol a felhasználóik által igénybevehető, hozzáférhető adatbázisok adatai és elérhetőségei találhatók: Debreceni Egyetem Egyetemi és Nemzeti Könyvtár61 Magyar Tudományos Akadémia könyvtára 62 BME OMIKK könytára 63 Budapesti Corvinus Egyetem könyvtára 64 (Az EISZ-, és EBSCOHOST lehetőségeket ld. külön alfejezetben) Minél kidolgozottabb egy adatbázis, annál több megközelítési szempontot alkalmaz. Az adatbázis alapvető feladata, hogy demonstrálja a feltárt tudományterület, szakterület sajátos ismérveit, egyediségét, különbözőségét. Következésképpen a felhasználóknak megalapozott tudással kell rendelkezniük az adatbázisokról, ha hatékonyan akarnak információt keresni.
61
Debreceni Egyetem Egyetemi és Nemzeti Könyvtár igény bevehető adatbázisok. URL: http://mfk.lib.unideb.hu/hun/databases.php 62 MTA könyvtára – Igény bevehető adatbázisok URL: http://www.mtak.hu/index.php?name=v_5_1 63 BME OMIKK könyvtára. Igény bevehető adatbázisok. URL: http://www.omikk.bme.hu/main.php?folderID=906 64 Budapesti Corvinus Egyetem – hozzáférhető adatbázisok. URL: http://www.lib.uni-corvinus.hu/content/view/31/190/lang,hu/
91
INFORMÁCIÓKERESŐ NYELVEK III.
7.3.3
A feltárás stratégiája, intellektuális és technikai eszközei
A feltárás stratégiája Az adatbázisok feltárási stratégiája arra irányul, hogy a tartalom válogatásával, sokszempontú, gyakran többszintű feltárással minőségi, összetett szerkezetű szolgáltatást nyújtsanak, a megkívánt teljesség mellett a pontosságra helyezve a hangsúlyt. Napjainkban az adatbázisok többsége az Interneten keresztül elérhető, feltárást, keresést és dokumentumszolgáltatást, és sok esetében plusz szolgáltatásokat nyújtva. Az adatbázisok az 1960-as évek óta kiemelkedően fontos szerepet játszottak a sokszempontú, differenciált feltárás és keresés feltételeinek biztosításában, az IKNY-ek fejlesztésében, a szabványosítás terén végzett együttműködésben, a szabványos adatcsereformátumok elterjedésében. Stratégiájukban egyaránt fontos szerepet kap a tematikus vagy pl. a nemzeti bibliográfiai adatbázisokban elvárható teljesség, de különösen a nagyobb pontosság biztosítása. Fejlesztésük fontos jellemzője az adatok fokozott mértékű szabványosítása, valamint szegmentálása, a szabályozott és szabályozatlan feltárási elemek szintézise, mindezek érdekében fejlett intellektuális és technikai eszközök alkalmazása.
Intellektuális eszközök A feltárás során igénybe veszik mind a szabályozott (osztályozási rendszerek, tezauruszok), mind a szabályozatlan keresőnyelvek (kulcsszavak) lehetőségét. A feltárást metaadatszabványok, tezauruszok segítik. Az egyes tudományterületek globális, vagy akár országos feltáró rendszerei, adatbázisai általában saját kidolgozott tartalmi feltáró eszközeiket használják, s azokat folyamatosan fejlesztik. (Arra való hivatkozással is, hogy az átfogó gyűjtőkörű könyvtárakban alkalmazott hagyományos osztályozási rendszerek nem tudnak a szaktudományos, specifikus igényeknek megfelelni.) Az adatbázisok már kezdetektől (az 1960-as évektől) élen jártak az IKNY-ek (pl. speciális osztályozási rendszerek, tárgyszórendszerek, tezauruszok) fejlesztésében, az igénybe vehető keresési lehetőségek bővítésében (Boole-operátorok, helyzeti operátorok, csonkolás, felhasználói preferencia szerint keresés, mezők szerinti keresés és szűkítés, böngészés lehetősége). Fontos jellemzőjük, hogy többféle IKNY használatát teszik lehetővé: beleértve a szabályozatlan, szabadszavas (szövegszavas, kulcsszavas), illetve a szabályozott (tárgyszó, deszkriptor, osztályozási jelzet szerinti) keresőnyelvek alkalmazását. Az indexgenerálásnak köszönhetően általában sokféle adattípus (szerzők neve, tárgykörök, földrajzi helyek, intézmények neve, nyelv, tudományspecifikus jelölések, stb.) szerinti indexeket állítanak elő, a nagyobb pontosság elérése érdekében. A Thompson adatbázisszolgáltató, kétféle indexet generál: a fő indexet (basic index), a kiegészítő indexeket (additional indexes) (ld. pl. az Dialog Bluesheets-et bemutató képmellékletben). Az adatbázisok sajátossága, hogy jelentős részük (az adatbázis-közvetítők, szolgáltatók által kidolgozott) több évtized során folyamatosan fejlesztett parancsnyelvvel is igénybe vehető.
92
INFORMÁCIÓKERESŐ NYELVEK III.
A feltárás mélységét illetően fontos jellemzőjük, hogy a bibliográfiai leíráson, IKNY-k alkalmazásán túl érdemi szöveges ismertetést, általában referátumot is tartalmaznak. Ilyenek pl. a Chemical Abstracts Service, INIS; INSPEC, ERIC stb.
Technikai eszközök Az adatbázisok szolgáltatási rendszereire egyébként is a folyamatos megújulás a jellemző: az 1960-as évek óta mintegy tízévente mentek át jelentős technológiai fejlesztésen (1) offline mágnesszalagos SDI-szolgáltatás, (2) online hálózati szolgáltatás, (3) CDROM-ok hálózati vagy offline szolgáltatása, (4) internetes, webes szolgáltatás –(5) felületi és mély webes szolgáltatások integrálása, intellektuális eszközök és automatizált eljárások szintézise. Adatbázis alapvető jellemzője az adatok szervezettsége, az összetett szerkezetű adatmodell megvalósítása, az adatfrissítés, az adatbiztonság elősegítése, az adatredundancia minimalizálása, ami a tárolókapacitás optimális kihasználásához, illetve az egyszeri feldolgozás, többszöri felhasználás elvének érvényesítéséhez fontos. Az interneten megjelenő adatbázisokban a feldolgozásban szerencsésen ötvöződik a magas szintű intellektuális tényező, illetve a Dialog Bluesheet-ekben bemutatott sokféle automatizált funkció.
A feltárás munkafolyamatai és termékei − −
−
A munkafolyamatok függnek a feltárás mélységétől (címközlő, referáló, teljes szövegű szolgáltatás, teljes tájékoztatást nyújtó szolgáltatás.) Az adatbázisok építésében jelentős szerepet kap az intellektuális munka (válogatás, kvantálás, feltárás, osztályozás, tartalmi kivonatok megfogalmazása, mindezek ellenőrzése). Ugyanakkor az automatizálás eszközeit is növekvő mértékben veszik igénybe (az asszociatív modell kiterjesztése, a kereshető adatok kombinálása stb.) A nemzetközi adatbázisokat különféle szolgáltatók teszik hozzáférhető egymástól eltérő feltételekkel, hogy a piacképes kereslet minden szegmensének igényeit ki tudják elégíteni. 7.3.4
Példák az adatbázisok eszközeinek alkalmazására
EISZ és EBSCOhost adatbázisok Az Elektronikus Információ Szolgáltatás (EISZ)65 egy olyan nemzeti program, amelynek célja, hogy a felsőoktatás és a tudományos kutatás számára nélkülözhetetlen elektronikus információforrásokat központilag, nemzeti licensz alapján vásárolja meg, hogy az eddigieknél lényegesen több információt, szélesebb felhasználói körnek, fajlagosan kedvezőbb áron lehessen biztosítani. Az EISZ szerveréről elérhető a már korábbról ismert és a hivatkozási indexet is szolgáltató Web of Science, a ScienceDirect – az Elsevier tudományos kiadó fulltext és adatbázis szolgáltatása, és a SpringerLink – a Springer kiadó
65
Elektronikus Információ Szolgáltatási program. URL: http://www.om.hu/eisz
93
INFORMÁCIÓKERESŐ NYELVEK III.
folyóiratai közös keresőfelületen online is hozzáférhetők az egyetemi hálózat számítógépeiről.66 Az EBSCO Publishing EBSCOhost nevű szolgáltatása bibliográfiai és teljes szövegű adatbázisokat kínál. A magyar könyvtárak minisztériumi támogatással, az EBSCOhost keresőrendszeren keresztül férhetnek hozzá a következő angol nyelvű folyóirat-adatbázisokhoz: Academic Search Premier, Business Source Premier, Masterfile Premier, Newspaper Source, Medline, ERIC. Az adatbázishoz részletes tájékoztató anyagok és keresési segédletek állnak rendelkezésre a bejelentkezést követő oldalakon. Az adatbázis tartalma másokkal együtt vagy külön is kutatható. A rendszerben használt adatbázisokkal kapcsolatban a legkülönfélébb információkat szolgáltatják angol nyelven, tudásbázis, képzési tájékoztatók, csomagok, információk, hírek, gyakran feltett kérdések és blogok alapján.67 Az EBSCOHOST magyar kereső felülettel is rendelkezik a magyar felhasználók számára. A felhasználás érdekében mind a pontosság, mind a teljesség növelésére lehetőséget adnak. A szolgáltatást vonzóvá, hasznossá, felhasználóbaráttá kívánják tenni. Az EBSCOhost példája jól mutatja, hogy milyen nagy hangsúlyt helyeznek nemcsak az angol, hanem más, így a magyar anyanyelvűek keresési igényeinek, módszertani felkészítésének. Mellékletünk azoknak a forrásoknak a weboldalát mutatja be, amelyek a magyar nyelven teszik lehetővé a kereséshez szükséges ismeretek elsajátítását (egyszerű keresés használata, az összetett keresés használata, a felhasználói beállítások képernyőjének használata, az datbázisok magyar nyelvű leírása, hírek, kérdések és válaszok stb.)68
6. kép 66
AZ EBSCOHOST-ban való keresés segédeszközei
Elektronikus Információ Szolgáltatás. URL: http://www.eisz.hu/ EBSCOhost support URL: http://support.ebsco.com/ 68 EBSCOhost training magyar nyelvű források. URL: http://support.ebscohost.com/training/lang/hu/hu.php 67
94
INFORMÁCIÓKERESŐ NYELVEK III.
Számos magyarországi, magyar nyelvű tájékoztatási anyag létezik, intézményenként, atás is létezik, pl. amelyek az Eszterházy Károly Főiskola számítógépes hálózatáról69 ingyenesen érhetők el.
Dialog Bluesheets A korábban offline elérhető segédeszközök (a keresőrendszer dokumentumai, pl. parancsnyelv kézikönyve, adatbázisok dokumentumai, az adatbázis információkereső nyelvének dokumentumai) napjainkra online hozzáférhetővé váltak. Bárki, bármikor felhasználhatja azokat az önálló kereséshez, annak előkészítéséhez és hatékony lebonyolításához. Így pl. ERIC Dialog Bluesheets „kék lapok” jó minőségben, jól strukturáltan, jól tálaltan kínálja online támogató szolgáltatásait 20 szegmensben csoportosítva.70 Ld. 7. melléklet Forrás:
7. kép
Dialog blueshets
MeSH tezaurusz A használói kényelmet szolgálja a dinamikus (navigálható hipercsatolásokat alkalmazó) HTML-formátumú tezauruszokra bemutatott példánk, a Medical Subject Headings (MeSH), http://www.nlm.nih.gov/mesh/. Alaposan kidolgozva, dinamikus, asszociatív felfedezéses módon tárja fel egyes deszkriptorok hierarchikus és egyéb fogalmi kapcsolatait. A mellékletben szereplő deszkriptor (Brain), ami magyarul agyat jelent, jó példája a lehető legalaposabban kidolgozott tezauruszcikknek („MeSH-tárgyszónak”) Az alábbi kapcsolatokat, ismérveket tünteti fel: hierarchikus jelzet, annotáció, megjegyzés, ld. még hivatkozások, egyéb kifejezések, megengedett minősítő jelek, online megjegyzés, a tárgyszó történetével kapcsolatos megjegyzések, bemeneti kombinációk, a deszkriptor beviteli dátuma, egyedi azonosítója. Valóságos enciklopédikus mélységben, részletesen tárja fel az egyes orvostudományi fogalmak kapcsolatait.71 A tájékozódást oldaltérkép segíti.72 69
EBSCO használat útmutató http://www.ektf.hu/konyvtar/upload/ebsco_magyar.doc Dialog Bluesheets URL: http://library.dialog.com/bluesheets/html/bl0001.html illetve: http://support.dialog.com/searchaids/essentials.shtml 71 National Library of Medicine MeSH URL: http://www.nlm.nih.gov/mesh/filelist.html ill. URL: http://www.nlm.nih.gov/medlineplus/ency/article/000028.htm 70
95
INFORMÁCIÓKERESŐ NYELVEK III.
(Megj.: A MeSH böngésző nem kapcsolódik közvetlen se a MEDLINE-hoz, se más visszakereső rendszerhez, így nem helyettesíti a PUBMED rendszert, amelyben keresni lehet. National Library of Medicine – Medical Subject Headings 2010 MeSH Descriptor Data
8. kép
National Library of Medicine MeSH-rendszere
ERIC adatbázis Az ERIC (Educational Resource Information Center), az egyesült államokbeli oktatásügyi, neveléstudományi információs rendszer, mely több mint 1,1 millió oktatási dokumentum elérését teszi lehetővé a weben, ebből több mint százezer ingyenesen elérhető teljes szövegű dokumentum. Különféle változatokban jelenik meg a szolgáltatótól függően. Az ERIC adatbázis jó példával szolgál a fejlődés szemléltetésére. A feltárás munkafolya72
National Library of Medicine Medlineplus sitemap URL: http://www.nlm.nih.gov/medlineplus/sitemap.html
96
INFORMÁCIÓKERESŐ NYELVEK III.
matai, illetve ezek termékei sokat fejlődtek az utóbbi tíz évben. Két mellékletet mutatunk be, két ERIC-rekordot. Az első 1999-ből származik, a második 2009-ből. A kettő összevetése alapján képet alkothatunk az alapvető változásokról. Az 1999. évi rekordban a szokásos szerző, cím, kiadás adatok, kiadás típus és nyelv mellett megfigyelhető, milyen nagy hangsúlyt helyeztek a feltáró adatok tipizálására main descriptors = fődeszkriptorok, minor descriptors =aldeszkriptorok, identifiers = identifikátorok, azonosítók).
9. kép
ERIC adatbázis egyik tétele 1999
A 2009. évi rekord jelzi, hogy a deszkriptorok rendszere stabilizálódott, körük kibővült, kereshetőségük, használatuk egyszerűsödött. Rövid és teljes referátum változat áll rendelkezésre. Látható, hogy a korábbiakhoz képest még nagyobb hangsúlyt fektetnek a szöveges ismertetésre, a hasonló tételek bemutatására, a teljes szöveg elérési változatainak bemutatására, a segítségnyújtásra a teljes szöveg megtalálásában, amennyiben könyvtárban található meg a teljes szöveg, akkor annak ajánlásában, illetve végső fokon a kiadó weboldalához való elvezetésben.
10. kép
ERIC adatbázis egyik tétele 2009 97
INFORMÁCIÓKERESŐ NYELVEK III.
7.3.5
Használat, keresés, böngészés, támogatás
Használati feltételek Az aktualitás, frissesség az adatbázisok típusától, illetve a szakterülettől függően változó, az internetes megjelenéssel (ahol a verseny kiéleződött, és minden szem előtt van) általában gyorsabb lett. Egyes adatbázisok (pl. tőzsdei adatbázisok) esetében percek is számítanak. Ugyanakkor jó, ha ellenőrizzük az aktualizálás idejét, hiszen önmagában az a tény, hogy az az adatbázisok online módon elérhetőek, nem feltétlenül jelenti, hogy kurrensek. (Idézi Murányi Péter Jacsó Pétert 2002-ben készült fordításában).73
Keresés, böngészés Általában többféle keresőnyelv használatát teszik lehetővé, beleértve a szabályozott (tárgyszó, deszkriptor, osztályozási jelzet szerinti), illetve a szabályozatlan (szövegszavas, kulcsszavas) rendszerek szerinti keresést is. Jellemző, hogy az adatbázisokban jelentek meg először a deszkriptorok. Mind egyszerű, mind haladó (összetett) keresésre, sőt parancsszavas keresésre is módot adnak. (A parancsszavak az adatbázis-szolgáltatók professzionális parancsnyelvének a szavai). Emellett különféle indexek szerinti böngészést is támogatják. A nemzetközi adatbázisok esetében a keresés finomítását egy sor eszköz szolgálja (ld. bővebben a 6. pont alatt.) Az indexgenerálásnak köszönhetően a keresés sokféle adattípus (szerzői nevek, tárgykörök, földrajzi helyek, intézmények neve, nyelv, stb.) szerint történhet. A böngészés a Dialog Bluesheets kapcsán említett indexgenerálásnak köszönhetően a legkülönfélébb indexekben lehetséges.
Tájékoztatás, támogatás A felhasználói kényelmet a nemzetközi adatbázisok esetében olyan online elérhető segédeszközök fokozzák, mint − az online szolgáltatók által a rendszerekhez biztosított „help” üzenetek; a weblapjukról lekérhető információk; tájékoztató felületek, súgók, − az adatbázisok használatával kapcsolatos komplex ismertetők, pl. Dialog Bluesheets 20-féle szempont szerint, − a fogalmi csoportok (fogalomkörök) kialakításának megfelelő segédletei (tezauruszok, tárgyszójegyzékek, osztályozási táblázatok), − ezek egymáshoz kapcsolása a Boole-operátorok segítségével, − a helyzeti operátorok használata – keresőszavak egymáshoz viszonyított előfordulásának meghatározására, a pontosság növelésére, − a csonkolás különféle változatai (szóvégi egy vagy több karakter, szóközbeni, szóeleji karakter stb.) a teljesség növelésére, 73
JACSÓ Péter: Content evaluation of textual CD-ROM and Web databases (magyar) Szöveges CD-ROM és webes adatbázisok tartalmának elemzése [hálózati elektronikus mu] / Jacsó Péter; ford. Murányi Péter. – Budapest : Könyvtári Intézet: Magyar Elektronikus Könyvtár, 2005. URL: http://mek.oszk.hu/03000/03040
98
INFORMÁCIÓKERESŐ NYELVEK III.
−
a szűkítés, korlátozás stb. alkalmazása a nagyobb pontosság növelésére.
Találatok megjelenítése Különböző lehetőségeket kínálnak fel. A Thomson Reuters (eredetileg Dialog) adatbázisok esetében hatféleképpen lehet megjeleníteni a tételt, a komplett leírástól a legszükségesebb adatok (pl. a tétel nyilvántartási számának) kiíratásáig.
Hozzáférési alternatívák Az adatbázisok igénybevétele napjainkban dominánsan az interneten keresztül történik. Ugyanaz az adatbázist különféle szolgáltatókon, vagy keresőrendszereken keresztül teszik elérhetővé. Ezekben jelentősen eltér a hozzáférhető információk köre (pl. bibliográfiai-referáló rész, tömörítvények, teljes szövegű rész), a kereshető mezők köre (kulcsszó, deszkriptorok, szerzőségi, kiadási adatok stb.), az igénybe vett keresőszolgáltatás, illetve az alkalmazható operátorok (Boole-, közelségi operátorok, szinonimák stb.). Tekintettel az internete megjelenésre, a felhasználó jó esetben közvetlenül eljuthat az igényelt internetes dokumentumhoz (közvetlenül vagy áttételesen a teljes szöveghez, ingyenesen vagy térítéses formában). Ez alapvetően fontos, hiszen a nemzetközi adatbázisok működésének szerves része (jogosultság esetén) a megtalált dokumentumhoz való hozzáférés biztosítása. A használók visszajelzései Az adatbázisokban, mint más internetes szolgáltatásokban (indexelő szolgáltatások, metakeresők), egyre nagyobb hangsúlyt helyeznek arra, hogy a visszajelzést kérjenek a felhasználótól, mennyire elégedett a kapott találatokkal. 7.3.6
Értékelés, fejlesztés
Értékelés Az értékelés során támaszkodunk a már hivatkozott nemzetközi felmérésre, Csík Tibor és Varga Katalin tanulmányára. A vizsgálat során egy 50 adatbázisból álló mintán tanulmányozták, hogy milyen eszközöket használnak a tartalmi feltárásra. Az adatbázis-szolgáltató cégek – köztük a legnagyobbak, az Ovid, CSA, Proquest, EBSCO, OCLC, sokszor ugyanazt az adatbázist kínálják más-más formában és szolgáltatásokkal.74 A vizsgálat eredményei kimutatták, hogy az online professzionális adatbázisok egyre kifinomultabb eszközökkel szolgálják a felhasználói szakmai közönségeket, lehetőségeket nyújtva mind a teljesség, mind a pontosság sokféle módszerrel történő biztosítására. Az elérhető tudásreprezentáló eszközök és módszerek elemzése alapján két összefüggő alapelvet azonosítottak: „szedd szét és illeszd össze”. Ezt a maximális mértékű szegmentálást a keresőszoftverek kifinomult kombinációs lehetőségei teszik lehetővé. A sokféle szempont és ismérv-típus elkülönítésének egyértelmű célja a keresés zajosságának csökkentése. Fontos szerepük van a limitálást, szűkítést szolgáló kiemelt szempontoknak. 74
CSÍK Tibor – VARGA Katalin: A tudás és az információfeldolgozás. Tudományos és Műszaki Tájékoztatás. 52. évf., 2005, 7-8.sz. http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464
99
INFORMÁCIÓKERESŐ NYELVEK III.
A másik fontos alapelv, melyre a felmérés fényt derített: a maximális szabályozottság. A szabályok elsajátítása idő- és energiaigényes, de a keresés pontosságában megtérül. A következetes és átlátható szabályokon alapuló feltárást a felhasználók is könnyen megtanulják. A tezauruszok mellett az adatbázisok sok más mezőben is alkalmaznak szabályozott listákat (dokumentumtípusok, földrajzi nevek, osztályozási jelzetek stb.). A tudományterületi adatbázisok kizárólag saját tartalmi feltáró eszközöket használnak. A generalizáló és individualizáló feltárás egymás mellett él – csak egymást kiegészítve tudnak hatékony keresést biztosítani. Az is világos, hogy a hagyományos osztályozási rendszerek (pl. ETO, DDC, LC) nem találhatók meg a nagy adatbázisokban, ezek inkább saját rendszereket használnak. A fentiek mellett még nagy hangsúlyt helyeznek az újdonság és aktualitás kifejezésére. Mivel a szabályozott feltárás mindig kis késéssel tudja csak az új fogalmakat átvenni, ezért az újdonság leírására szabályozatlan, az aktuális terminológiát azonnal tükrözni tudó eszközök kellenek. Ezek alkalmazását kiválóan szemlélteti a PsycINFO rendszere. A 7.3.4. részben láthattuk, hogy az adatbázisok milyen differenciált eszközökkel szolgálják a nagyobb teljességet, s főleg a nagyobb pontosságot. Fontos, hogy a használat során fontos, hogy a felhasználó élni tudjon a mindenkor megfelelő eszközökkel, a megfelelő módon.
Fejlesztés A fejlesztés alapvetői vetülete, hogy az adatbázisoknak alkalmazkodni kell az internethez. Az internet megjelenésével nő az igény jó minőségű, ingyenes vagy olcsó, a weben hozzáférhető adatbázisok iránt. A piaci körülmények között zajlik és döntő szerepet kap a verseny. A siker alapvető feltétele, melyik cég hogyan tudja felhasználni az internet adta lehetőségeket, amihez alkalmazkodni kell. (Jacsó Péter magyar származású amerikai információtudományi professzor szerint, 2001). Azoknak van sikerre reménye, a túlélésre lehetősége, melyek nem csak indexelő adatbázisok, hanem tetemes számú rekordjai vannak, figyelési köre széles, nagyszámú folyóiratot dolgoznak fel, és szinte minden nap frissítik anyagukat, tehát a legfontosabb folyóiratcikkek teljes szövege elérhető az Interneten. Ezek közül is csak a legjobb minőségű, széles körű keresési sajátságokkal rendelkező kereskedelmi változatok képesek a túlélésre. Az útmutató (directory) A weben ugyanis megjelentek a webes kereskedelmi céginformációs adatbázisok, melyek pénzügyi adatokra specializálták magukat. Ilyen pl. az előfizetéssel igénybe vehető 10-Kwizard75 intuitív, vizuálisan vonzó, és számos különleges tulajdonságot kínál. Egyfajta termékcsaládnak tekinthető, van egy szabadon használható altípusa, mely az internetes keresés különféle módszereibe, típusaiba vezet be ugyanakkor előfizetéssel vehetők igénybe. A drága teljes szövegű adatbázisok megszűnnek, helyükre újak jönnek, pl. USA szabadalmak teljes szövegei HTML és PDF formátumban ingyenesen érhetők el76 az Intellectual Property Network (IPN) www.delphion.com webhelyén. Ez a webhely számos keresési többletet nyújt, pl. hiperlinkeket idézett és idéző szabadalmakhoz. 75 76
10Kwizard URL: http://www.10kwizard.com/ http://www.10kwizard.com/help.php?g= Intellectual Property Network (IPN) URL: http://www.delphion.com/
100
INFORMÁCIÓKERESŐ NYELVEK III.
Az internetes hálózati környezet jellemző lett az adatbázisokra, ösztönözve a szellemi és technikai segédeszközök fejlesztését, a nyelvtechnológiai módszerek és az automatizálás integrált alkalmazását. A többfajta szolgáltatás, termék válik jellemzővé A HighWire jó példa erre. A legnagyobb ingyenesen is elérhető tudományos teljes szövegű folyóirat archívum. A Stanford University adja ki. Mind a keresés, mind pedig a böngészés segítésére számos, a pontosságot segítő megoldást alkalmaz. Jacsó Péter szavaival: „Csodálatos webszülte fajok jelentek meg”77. Ilyen pl. a HighWire Press78„ melyet a Standford University gondoz, s mind a kutatók, könyvtárosok, mind pedig a kiadók számára fontos információkat tartalmaz. Közel 1500-féle folyóiratcím, referensz, tudományos sorozat kereshető benne kiadó, téma cím szerint. keresés és böngészés útján lehet hozzáférni. (http://highwire.stanford.edu/lists/allsites.dtl ) Felhasználói költségek, ingyenesség Az online szolgáltatásként általában térítés ellenében lehetett és lehet igénybe venni, ugyanakkor egyre több változat férhető hozzá ingyenesen a világhálón. Az időigény, költségigény az erősödő automatizálási eljárásoknak köszönhetően csökkent, növekedett a kedvező csomagok köre. Így érhető el, hogy a rendkívül szegmentált piac résztevőinek esélye van arra, hogy a lehetőségeikhez igazodó adatbázisok szolgáltatásaihoz hozzáférjenek.
7.4 ÖSSZEFOGLALÁS A lecke első részében megismerte a mai adatbázisok kialakulásához vezető, sok szempontból tanulságos út állomásait. Áttekintést nyert az adatbázisok jellemző jegyeiről, konkrét példákon keresztül. Az információkereső rendszerek között is kiemelkedően fontos és sokféle funkciót betöltő típusokat ismerhetett meg. Az adatbázisok feltárási stratégiája meggyőzően mutatta, hogy milyen nagy hangsúlyt fektetnek a nagy nemzetközi szakterületi adatbázisok mind a teljesség, mind pedig a pontosság növelésére a szolgáltatásban. Egy nagy nemzetközi vizsgálat (Csík Tibor- Varga Katalin) eredményei alapján megalapozottan láthatja a jelenlegi helyzet és fejlődés tényeit, a az egyre kifinomultabb intellektuális és technikai eszközök körét, a szegmentáltság és a szabályozottság alapvető szerepét a minőségi feltárásban. Az internetes környezethez való igazodás ösztönzően hatott az adatbázis-előállítók, illetve szolgáltatók tevékenységére, számos új szolgáltatás jelenik meg, felhasználva az az automatizálás adta lehetőségeket is. Az adatbázis szolgáltatások területén erős a piaci verseny, és ez is jótékony hatással van és lehet a további fejlesztésekre, arra, hogy ki-ki anyagi és egyéb lehetőségei szerint minőségi információkhoz juthasson.
77
JACSÓ Péter: Content evaluation of textual CD-ROM and Web databases (magyar) Szöveges CD-ROM és webes adatbázisok tartalmának elemzése [hálózati elektronikus mu] / Jacsó Péter; ford. Murányi Péter. – Budapest : Könyvtári Intézet: Magyar Elektronikus Könyvtár, 2005. URL: http://mek.oszk.hu/03000/03040 78 High Wire Press URL: http://highwire.stanford.edu/
101
INFORMÁCIÓKERESŐ NYELVEK III.
7.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Milyen fejlődési fázisokon mentek keresztül a nagy nemzetközi bibliográfiaireferáló szakmai adatbázisok? 2. Mutassa be az adatbázisok fő típusait és jellemzőit! 3. Fejtse ki az adatbázis előállítók és szolgáltatók fő jellemzőit! 4. Fejtse ki részletesen az adatbázisok fő típusainak jellemzőit! 5. Mik az adatbázisokon alapuló feltárás fő stratégiai elemei? 6. Miben látja az ERIC adatbázis fejlődési vonulatát? 7. Fejtse ki részletesen az adatbázisok feltárásának intellektuális eszközeit! 8. Fejtse ki az adatbázis-szolgáltató programok (EISZ, EBSCO) fő ismérveit! 9. Fejtse ki az adatbázisok sikerének tényezőit az internetes környezetben! 10. Foglalja össze a hivatkozott nemzetközi felmérés fő tanulságait!
102
INFORMÁCIÓKERESŐ NYELVEK III.
8. 8.1
MAGYAR ADATBÁZISOK 8.1.CÉLKITŰZÉS
A lecke tanulmányozása alapján legyen képes − Az adatbázis típusainak, magyar példáinak kifejtésére, − Az adatbázis előállítók és szolgáltatók jellemzésére, − Az adatbázisok dokumentumbázisával kapcsolatos jellemzők kifejtésére − Az adatbázisok magyar felhasználóinak jellemzésére, − A magyar adatbázisok jellegzetes célrendszerének, stratégiájának elemzésére, − az alkalmazott intellektuális és technikai eszközök jellemzésére − az adatbázisokban való keresés, böngészés, támogatás lehetőségeinek bemutatására, − a nemzetközi és magyar adatbázisok minőségének összehasonlítására, − a magyar adatbázisok tudásreprezentációs teljesítménynek értékelésére, − a fejlesztési teendők megfogalmazására 8.2
8.2.TARTALOM
1 Magyar adatbázisok jellegzetességei − Adatbázisok típusai − Adatbázis-előállítók és szolgáltatók − Dokumentumbázis és felhasználók − Intellektuális és technikai eszközök − A feltárás munkafolyamatai és jellemzői − Keresés és támogatás − Megjelenítés, hozzáférés 2. A magyar mezőgazdasági szakirodalom feltárási példája − Tájékoztató adatok − Böngészési és keresési példa 3. Magyar műszaki és gazdasági szakirodalom feltárási példája − Tájékoztató adatok − Keresési példa − Utóélet - Magyar műszaki folyóiratcikkek 4. Magyar orvostudományi szakirodalom feltárási példája − Tájékoztató adatok − Feltárási és keresési példák 5. Magyar pedagógiai szakirodalom feltárási példája − Tájékoztató adatok 103
INFORMÁCIÓKERESŐ NYELVEK III.
− Feltárási példa 6. A humántudományi cikkirodalom feltárási példája − Tájékoztató adatok − Feltárási példa 7. A Magyar Elektronikus Könyvtár feltárási példája − Tájékoztató adatok − A feltárás kérdésköre 8. A magyar adatbázisok értékelése és fejlesztése − - Értékelés − - Fejlesztés
8.3 8.3. A TANANYAG KIFEJTÉSE 8.3.1
Magyar adatbázisok jellegzetességei
Adatbázisok típusai A magyar adatbázisok funkciójuk szerint szintén lehetnek (a) forrásra hivatkozó adatbázisok (referensz adatbázisok, forrástájékoztató adatbázisok), (b) Forrás adatbázisok (numerikusak, szöveges numerikusak, teljes szövegű adatbázisok, online adattárak, lexikonok, szótárak, kézikönyvek, illetve tudásbázisok.79 A magyar adatbázisok fontos szegmensét képezik a szakterületi adatbázisok, melyek széleskörű, s egyben differenciált felhasználói igényeket elégítenek ki. Az internetes megjelenés révén alternatív kínálatokkal a használók meghatározott köreit képesek „megszólítani”. Ismertetésünkben elsősorban ezeknek az adatbázisoknak a jellemzőire összpontosítunk. A szakterületi adatbázisok a dokumentumok széles körét integráltan tárják fel: a folyóiratcikkeket, kongresszus kiadványokat, hivatalos kiadványokat, egyetemi kiadványokat, újabban weblapokat, vizuális, auditív, multimédia dokumentumokat is. A lehetőségek tovább bővülnek.80
Adatbázis-előállítók és szolgáltatók A nemzetközi adatbázisok piacához viszonyítva, Magyarországon kicsi a piac, ezért nem is honosodott meg igazán a szakirodalmi adatbázisok rendszere, nincsenek független adatbázis-előállító, és -szolgáltató intézmények. Az Arcanum adatbázis-előállító cég az a kivétel, amely számos kiváló adatbázisa sorában szakirodalmi adatbázisokat is szolgáltat (pl. a szociológiai adatbázist és a PRESSDOK-ot). Általában azonban a könyvtárak vállal-
79 80
PÁLVÖLGYI Mihály : Információs technológia, Budapest : Tankönyvkiadó, 1991. 210.p. Ungváry Rudolf, Vajda Erik: Könyvtári információkeresés. Bp.: Typotex Kft, 2002.URL:
http://www.tankonyvtar.hu/konyvtartudomany/konyvtari-080905-13
104
INFORMÁCIÓKERESŐ NYELVEK III.
ják a feladatot, és többnyire saját katalógusaik keretein belül szolgálják ki az információs igényeket.81 A magyarországi adatbázisok tartalmi feltáró rendszerének elemzésére Varga Katalin vállalkozott. Az egyes tudományterületek információiért felelős országos vagy regionális intézmények által készített adatbázisokat elemezte (jogtudomány, politika, szociológia, közgazdaság-tudomány, neveléstudomány, statisztika, mezőgazdaság, orvostudomány, műszaki tudományok, nemzetiségekkel kapcsolatos irodalom, filmszakirodalom, kertészeti szakirodalom, könyvtártudományi szakcikkek.) Ezek nagy része könyvtárakhoz, tájékoztatási központokhoz kötődik. Ugyanazokra a módszerekre támaszkodott, mint amelyekkel Csík Tiborral együtt 1997ben 50 nemzetközi adatbázis feltárását vizsgálta.82 Figyelembe vett minden olyan eszközt, amelyet az adatbázis a tartalom reprezentálására használ. A vizsgálat célja az volt, hogy minél több információt szerezzenek a tartalmi feltárás professzionális gyakorlatáról. Öt szempontból elemezte az adatbázisokat: − 1. A tartalmi feltáró eszközök száma − 2. A tartalmi elemek jelölése − 3. A feltáró eszközök szabályozottsága − 4. Generikusság – specifikusság − 5. Relációk, kontextus kifejezése Mindezek alapján feltárta a helyzetet és megfogalmazta a tapasztalatokat, eredményeket, hiányosságokat és a fejlesztési teendőket. Ezekre a leckénk további részében, az átfogó, általános részekben hivatkozunk.
Dokumentumbázis és felhasználók A magyarországi adatbázisokkal feltárt dokumentumállomány eredete lehet nemzetközi, hazai, regionális, ill. helyi bázis. A tematikus adatbázisok a dokumentumok széles körét integráltan tárják fel: a folyóiratcikkeket, kongresszus kiadványokat, hivatalos kiadványokat, egyetemi kiadványokat, újabban weblapokat, vizuális, auditív, multimédia dokumentumokat is. A lehetőségek tovább bővülnek.83 A vizsgálat során kiderült, hogy a felhasználóknak nem sok lehetőségük van arra, hogy információs igényeikre gyors és célzott választ kapjanak, inkább arra kell felkészülniük, hogy nagyobb mennyiségű szövegből kell kiválogatniuk a relevánsakat.
81
VARGA Katalin: A magyar szakirodalom tartalmi reprezentációjának jelenlegi állapota. In: Tudományos és Műszaki Tájékoztatás, 52. évf. 2005. 7-8.sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4008&issue_id=464 82 CSÍK Tibor – VARGA Katalin: A tudás és az információfeldolgozás. Tudományos és Műszaki Tájékoztatás. 52. évf., 2005, 7-8.sz. http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464 83 UNGVÁRY Rudolf, VAJDA Erik: Könyvtári információkeresés. Bp.: Typotex Kft, URL:
http://www.tankonyvtar.hu/konyvtartudomany/konyvtari-080905-13
105
INFORMÁCIÓKERESŐ NYELVEK III.
Intellektuális és technikai eszközök Intellektuális eszközök Varga Katalin vizsgálatában számba vett minden olyan adatelemet, amely valamilyen formában utal az eredeti szöveg tartalmára, tehát mindenfajta osztályozási jelzetet, tárgyszavazási eljárást, kiemelt tartalmi jellemzőt (dokumentumtípus, felhasználói célcsoport stb.), a súlyozást, a szintaxis minden formáját. Ha ugyanaz az adatelem többféle formában (pl. természetes nyelven és kóddal) is megjelent a rekordban, akkor ezt két különféle feltáró eszköznek tekintette, amennyiben a kódolásban rejlő rendszer hozzáadott információt jelent. A számbavételen kívül vizsgálta a feltáró eszközök több tulajdonságát: mennyire szabályozottak (szabad szöveg vagy szabályozott jegyzék), milyen formában fejezik ki a tartalmat (kód vagy természetes nyelv), mennyire generikusak vagy specifikusak, milyen módon képesek tükrözni az eredeti szövegösszefüggést. Ezek mindegyike jellemző valamilyen módon hozzájárul a szöveg tartalmának hívebb reprezentálásához. A vizsgálat eredményei szerint a magyar adatbázisokban egyaránt élnek a szabályozott, illetve a szabályozatlan keresőnyelvek (kulcsszavak) lehetőségével. Lehetőség van kulcsszavas feltárásra, a cím szignifikáns szavai alapján történő keresésre, ugyanakkor nagyon kevés referátum készül a magyar tudományos szövegekről. A hierarchikus rendszerek, illetve a mellérendelő tárgyszavas feltárás szintén bevett gyakorlat az adatbázisok nagy részénél. A szintaxisra, az indextétel tudatos megformálására azonban alig akad példa. Technikai eszközök Mivel kicsi a piac – a nemzetközi adatbázisok piacához viszonyítva –, a kifinomultabb adatbázisok előállításához nincsenek megfelelő szoftverek sem. Ezért nem érdemes nagyon költséges szolgáltatásokat nyújtani, amelyeket nem tud a kereslet eltartani. A szöveghez igazodó szurrogátum-szerkezetet a könyvtári katalógusokat (OPAC-okat) szolgáltató integrált könyvtári szoftverek nem igazán támogatják.
A feltárás munkafolyamatai és jellemző − −
A munkafolyamatok függnek a feltárás mélységétől (címközlő, referáló, teljes szövegű szolgáltatás, teljes tájékoztatást nyújtó szolgáltatás.) Az adatbázisok építésében jelentős szerepet kap az intellektuális munka (válogatás, kvantálás, feltárás, osztályozás, tartalmi kivonatok megfogalmazása). Ugyanakkor az automatizálás eszközeit is növekvő mértékben veszik igénybe (az asszociatív modell kiterjesztése, a kereshető adatok kombinálása stb.)
Keresés és támogatás − −
106
A felhasználói kényelmet a magyar adatbázisok esetében olyan online elérhető segédeszközök fokozzák, mint Az adatbázis-szolgáltatók weblapjairól lekérhető információk; tájékoztató felületek, súgók,
INFORMÁCIÓKERESŐ NYELVEK III.
−
a fogalmi csoportok kialakításának megfelelő segédletei (tezauruszok, tárgyszójegyzékek, osztályozási táblázatok), − ezek egymáshoz kapcsolása a Boole-operátorok segítségével, − az egyszerű, összetett keresés, illetve a böngészés célirányos támogatása, − egyes esetekben a korlátozás stb. alkalmazása a nagyobb pontosság növelésére. Az interneten megjelenő adatbázisokban a feldolgozás egyre mélyebb szinteket érint a feldolgozási spektrumban, s ehhez új automatizált feltárási eljárásokat alkalmaz.
Megjelenítés, hozzáférés − −
A találatok megjelenítésére különböző alternatívák léteznek. Az adatbázisok igénybevétele napjainkban dominánsan az interneten keresztül történik, így a felhasználó távolról elérheti ezek jelentős részét (ingyenes, vagy térítéses formában). A nemzetközi adatbázisokhoz képest, ahol a digitális elérés kiemelten fontos, nálunk még sok a tennivaló e téren. (figyelemreméltó e téren a BME OMIKK Könyvtár kezdeményezése a digitálisan elérhető magyar műszaki időszaki irodalom keresésének lehetőségére).
A következőkben egyedi példákat mutatunk be a 8.3.2. résztől a 8.3.7. részig: a magyar mezőgazdasági szakirodalom, a műszaki és gazdasági szakirodalom, az orvostudományi szakirodalom, a pedagógiai szakirodalom, a humántudományi cikkirodalom, illetve elektronikus könyvtári feltárási példákat. Ezt követően összefoglaljuk a lecke tanulságait, és megfogalmazzuk a fejlesztési teendőket. 8.3.2
A magyar mezőgazdasági szakirodalom feltárási példája
Tájékoztató adatok Az Országos Mezőgazdasági Könyvtár és Dokumentációs Központ, a mezőgazdaság, az agrártudományok, az élelmiszeripar, az erdészet és a faipar országos szakkönyvtára. Mind a kutatás, mind a gyakorlati eredményeket leíró dokumentumok hazai legjelentősebb feldolgozója. A teljesség igényével igyekszik feldolgozni a mezőgazdasági szakirodalmat, jelenleg több mint 300 folyóirat, a megjelent szakkönyvek, és a szakmai jellegű konferenciák kiadványainak áttekintését biztosítja. Előállítja a Magyar Mezőgazdasági Bibliográfiát (MAB), amely folyóiratcikkek, könyvek, illetve könyvrészletek és konferenciaanyagok leírásait tartalmazza, és adatbázisként is hozzáférhető. Az adatállomány számítógépes feldolgozásának kezdete 1989. Jelenleg több mint 85 000 bibliográfiai tételt tartalmaz. Évente kb. 6000–8000 új tételt dolgoznak fel és integrálnak az adatbázisba. Az adatbázis az ALEPH integrált könyvtári rendszerünk részeként használható az interneten.84 Két lépésben választva előbb a http://www.omgk.hu honlapot kell behozni, majd azon az aláhúzott ALEPH könyvtári adatbázisra kell kattintani.
84
Országos Mezőgazdasági Könyvtár URL: http://www.omgk.hu
107
INFORMÁCIÓKERESŐ NYELVEK III.
A témára utaló adatelemek: kulcsszó, tárgyszó, ETO-jelzet, tárgyi melléktétel, tárgykód. A tárgykód kivételével mindegyik kereshető. A tárgyszórendszerét évtizedek óta fejleszti, s az alapul szolgált (a múltban) nemcsak a hazai szakirodalom feltárásának, hanem a nemzetközi irodalomról való áttekintésnek is (az Agrárirodalmi Szemle mutatójaként). A tárgyszavak mind a böngésző, mind pedig a keresés üzemmódban használhatók.
Böngészési és keresési példa Mellékletünkben szereplő böngészési példa azt mutatja be, hogy milyen lehetőséget ad a böngészés a tárgyszó környezetének feltérképezésére. A böngészőlistában egyaránt megjelennek az átfogó tárgyszavak (mint gyümölcs, gyümölcsfa), melyek nincsenek prekoordinálva más tárgyszavakkal, - illetve a specifikus, kevesebb találatot adó tárgyszavak, mint pl. gyümölcs-ágazat, gyümölcsbor stb. A példából betekintést kapunk a tárgyszórendszer differenciált fogalomszervezési szintjébe (egytagú szavak, összetett szavak, többtagú kifejezések).
11. kép
Mezőgazdasági tárgyszórendszer szerinti böngészés
Keresés A keresés üzemmódban egyszerű, többmezős, haladó, illetve CCL (Common Command Language) típusú keresés választható. A haladó keresésben három szó/kifejezés kombinálható, akár 3 tárgyszó is választható egyszerre: pl. az áfonya termesztése és fajtái c. témához: áfonya, termesztés, fajta. Lásd melléklet! Amelyik tételben mind a három (s természetesen más, nem jelölt is) előfordul, az találatként jelentkezik.
108
INFORMÁCIÓKERESŐ NYELVEK III.
12. kép
Tárgyszavak alkalmazása az Országos Mezőgazdasági Könyvtárban 1999
A következő mellékletben szereplő példa a differenciált, posztkoordinált tárgyszavas megoldást mutatja be egy 2009-ben készült bibliográfiai rekord keretében. 5 tematikus, 1 formai tárgyszót tartalmaz, földrajzi tárgyszót nem. Ezek a tárgyszavak nem alkotnak indextételt, csak egymás után állnak, mint 10 évvel azelőtt is. Belépő a Magyar Mezőgazdasági Bibliográfiába85
13. kép
85
Bibliográfiai tétel az Országos Mezőgazdasági Könyvtárból 2009
Belépő a Magyar Mezőgazdasági Bibliográfiába. URL: http://www.omgk.hu/MABI/bibl.htm
109
INFORMÁCIÓKERESŐ NYELVEK III.
8.3.3
A magyar műszaki és gazdasági szakirodalom feltárási példája
Tájékoztató adatok A Budapesti Műszaki Egyetem Országos Műszaki Információs Központ és Könyvtár (BME OMIKK) a műszaki és élettelen természettudományok országos szakkönyvtára. 2001-ig előállította a műszaki és természettudományi cikkeket feldolgozó adatbázisát (CIKK), amely kulcsszavakkal, kötött és szabad tárgyszavakkal, valamint hárombetűs kódokból álló osztályozási jelzetekkel tárja fel a szövegek tartalmát. Folytatása a Magyar Műszaki és Gazdasági Repertórium adatbázisa (MMR), amelyben már csak magyar cikkek voltak találhatók, ugyanakkor azonban a konferenciakötetek tanulmányait is feltárta. Tartalmi feltáró eszközei ugyanazok voltak. Az adatbázisok építése megszűnt, de szolgáltatásuk folytatódik, az alábbi időintervallumokra vonatkozóan: CIKK-adatbázis – 2001. december 31. Műszaki és Gazdasági Repertórium – 2002. január 1. – 2007. április 30-ig Műszaki Gazdasági Információk – 2007. április 30-ig, Környezetvédelem – 2007. április 30-ig. BME OMIKK az átszervezés után címmel kapunk áttekintést a 2007-ben bekövetkezett megváltozott helyzetről.86 A Műszaki és Gazdasági Repertórium tárgyszavaira jellemző a viszonylag alacsony fogalomszervezési szint, tehát az egytagú szavak, illetve a kéttagú összetett szavak dominanciája (pl. szoftver, fejlesztés, hatás – illetve munkanélküliség, idegenforgalom stb.). Az egyes dokumentumokat átlagosan 6-10 tárgyszóval indexeltek, posztkoordinált indexelésre alkalmasak.
Keresési példa Az egyszerű keresésben a „város” szóra kapott találati listából egy, a rendszert jellemző tételt mutatunk be. Ld. 14. melléklet A példa abból a szempontból is tanulságos, hogy a tárgyszó nem teszi szükségtelenné a kulcsszavak használatát, pl. a kisvárosok kifejezés csak kulcsszó formában fordul elő. (a kulcslistában található meg)
86
BME OMIKK az átszervezés után. URL:
http://www.omikk.bme.hu/main.php?folderID=1289&articleID=1205&ctag=articlelist&iid=1
110
INFORMÁCIÓKERESŐ NYELVEK III.
14. kép
Tárgyszavazási gyakorlat a Magyar Műszaki és Gazdasági repertóriumban
Utóélet – Magyar műszaki folyóiratcikkek Az átszervezést követően a BME OMIKK megállapodást kötött a magyar műszaki folyóiratok kiadóinak jelentős részével, amelynek értelmében a 6 hónapnál régebbi cikkeket digitális formában honlapján hozzáférhetővé teszi. Ezen cikkek egy része eddig nem állt digitális formában rendelkezésre, más részük különböző honlapokon, különböző pontosságú kereső rendszerek útján volt elérhető. A BME OMIKK most egységes rendszerben, teljes szöveges keresés útján interdiszciplináris szemléletben biztosít hozzáférést a magyar cikkekhez. A munka folyamatos, mind az időben visszafelé, mind az újabb számok bevitelével gazdagítani fogja a cikkek digitális könyvtárát.87 8.3.4
A magyar orvostudományi szakirodalom feltárási példája
Tájékoztató adatok Magyar Orvosi Bibliográfia. Kiadja az Egészségügyi Stratégiai Kutatóintézet (ESZKI MEDINFO), korábban: Országos Egészségügyi Információs Intézet és Könyvtár, még korábban 1997-ig Országos Orvostudományi Információs Intézet és Könyvtár - Az egészségügy, az orvostudomány, a gyógyszerészet és az ápolástudomány országos szakkönyvtára. a Magyar Orvosi Bibliográfiát és adatbázist (MOB) állítja elő. Az adatbázis könyveket, folyóiratcikkeket és más típusú dokumentumokat egyaránt feldolgoz. A szövegek tartalmi feltárására kulcsszavakat, szabályozott tárgyszavakat és speciális osztályozási jelzeteket alkalmaz, de ezek nem mindig a tartalomra utalnak. A folyóiratcikkek egy részéhez tartalmi kivonat is tartozik, ezek azonban nem a szorosan vett szakcikkek, inkább ismeretterjesztő jellegűek. Tárgyszórendszere, a National Library of Medicine MeSH rendszerének magyar nyelvű adaptációja, a szókészlethez tartozó indexelési elveket azonban nem vették át.
Feltárási és keresési példák 1990-ben kezdték el a korábbi 33-as szakcsoport szerint elrendezés helyett az új szerkezeti felépítésű MOB-füzetek kísérleti előállítását. Az indexelés alapja a MeSH (Medical 87
Magyar műszaki folyóiratcikkek. URL: http://www.omikk.bme.hu/main.php?folderID=1190&articleID=988&ctag=articlelist&iid=1
111
INFORMÁCIÓKERESŐ NYELVEK III.
Subject Headings) magyar változatának tárgyszórendszere. A kiadvány új szakbeosztása is az így képzett tárgyszóláncon alapul. A MeSH magyarra történő adaptációja88 hasonlónak indult ahhoz, ahogy a DEENK adaptálta a Kongresszusi Könyvtári szakrendszerét, és bekapcsolódott a globális vérkeringésbe. A tárgyszavak alakjának megválasztása az orvosi terminológiának megfelelően történik. A latin, ill. más idegen eredetű kifejezések dominálnak Tárgyszópélda: ENZIMINDUKÁLT IMMUNOSZORBENS ASSAY MeSH tárgyszóutaló példák: KOPONYACSONTVARRATOK lásd KOPONYA alatt GESTALT ELMÉLET lásd PSZICHOLÓGIAI ELMÉLET alatt FERTŐTLENÍTÉS lásd STERILIZÁLÁS alatt. AIDS lásd: SZERZETT IMMUNHIÁNYSZINDRÓMA alatt A MesH tárgyszavak sajátos alkalmazása figyelhető meg a 15. képmellékletben. A VOCAL tárgyszó-adatbázisából származik, és egybeszerkesztett listában mutatja a Cukorbetegség tárgyszó magyarra fordított MeSH tárgyszó prekoordinált alkalmazásait a szegedi, illetve a debreceni tudományegyetem esetében.
15. kép
A Cukorbetegség tárgyszó a Vocal tárgyszó-adatbázisban
A következő, 16. képmelléklet szintén a cukorbetegség fogalmát kifejező, de ezúttal angol nyelvű megfelelőjével [Điabetes Mellitus] találkozunk MeSH-tárgyszóként alosztályozott formáiban. Az ESKI (Egészségügyi Stratégiai Kutatóintézet) által kiadott Magyar Orvosi Bibliográfiai tárgyszórendszerben az angol változat Diabetes Mellitus szerepel a fogalom megnevezésére.89 Jól látható ugyanakkor, hogy az angol, illetve magyar változat alosztályozása azonos elvek szerint történik. Ld. 16. képmelléklet: 88
ANTALNÉ SOÓS Katalin: A MESH (Medical Subject Headings) és a magyar MESH (HUNMESH) http://mek.oszk.hu/03100/03128/html/mesh.htm
89
Egészségügyi Stratégiai Kutatóintézet Szakkönyvtár, MOB tárgyszójegyzék részlet http://www.eski.hu/new3/konyvtar/mob/d.htm
112
INFORMÁCIÓKERESŐ NYELVEK III.
16. kép
Alosztályozott MESH tárgyszavak
A továbbiakban még példát láthatunk a nyomtatott Magyar Orvosi Bibliográfiából annak illusztrálására, hogy az orvostudományi tárgyszórendszerben a tudományos műszavak használata elterjedt (Diabetes mellitus, stb.) különös tekintettel a betegségek, gyógymódok, eljárások megnevezése során. Ld. 17. melléklet. (Megj.: ugyanezek a tárgyszavak fordulnak elő az adatbázisban a 2010. évben is.)
17. kép 8.3.5
Magyar Orvosi Bibliográfia tárgyszavazási példák
A magyar pedagógiai szakirodalom feltárási példája
Tájékoztató adatok Az Országos Pedagógiai Könyvtár és Múzeum a neveléstudomány és az oktatáspolitika országos szakkönyvtára. Nemzeti szakkönyvtári feladatként gyűjti a magyar közoktatás tankönyveit. A neveléstudomány szakirodalmi adatbázisát állítja elő. A PAD (Pedagógiai Adatbázis) 1989-től tartalmazza a Magyarországon megjelent pedagógiai szakirodalmat (könyvek, tanulmányok, folyóiratcikkek), valamint egy reprezenta113
INFORMÁCIÓKERESŐ NYELVEK III.
tív válogatást a Magyarországon hozzáférhető jelentősebb idegen nyelvű folyóiratcikkekről, illetve az Országos Pedagógiai Könyvtár állományában lévő idegen nyelvű könyvekről (1975-ig visszamenőleg). Az információk elérését jól strukturált adatszerkezet és változatos keresési lehetőségek segítik. A tartalmi feltárás több szinten történik. Valamennyi tartalmi információt hordozó adatmező (pl. cím, alcím, sorozat) szavanként kereshető, a keresőszoftver lehetőségeit figyelembe véve különféle logikai kombinációkkal (és, vagy, de nem, közelségi operátorok).
Feltárási példa A mélyebb tartalmi feltárást egy átfogó szakcsoportrendszer és az Országos Pedagógiai Könyvtárban kifejlesztett tárgyszórendszer tárgyszavai adják. A szakcsoportok egyfajta osztályozási rendként a pedagógia nagyobb témaköreit ölelik fel, használatuk a keresésben egyrészt egy téma összefoglaló irodalmának megtalálását, másrészt a tárgyszavas keresés további finomítását teszik lehetővé. Az adatbázisban szereplő tételek tartalmáról a tárgyszavak és az idegen nyelvű cikkek esetében a tartalmat összefoglaló magyar nyelvű referátumok adnak képet. A tárgyszavazás egységes elvek alapján, szabályozott szótár segítségével történik, a tárgyszavak egymás utáni sorrendje az esetek többségében mondatszerűen tükrözi a közöttük fennálló szintaktikai kapcsolatokat is. Keresni lehet földrajzi nevek, iskolatípusok, iskolák neve stb. alapján, a hatékonyság azonban megkívánja, hogy a keresésben alkalmazott elemeket a keresőrendszer kínálta lehetőségek szerint kombináljuk. A melléklet a jól kidolgozott összetett keresőfelületet mutatja be, a sokféle szűkítési lehetőséggel, valamint a világos, egyértelmű segítséggel a WebOPAC használatához.
18. kép
114
Összetett keresés az OPKM pedagógiai adatbázisában
INFORMÁCIÓKERESŐ NYELVEK III.
8.3.6
A humántudományi cikkirodalom feltárási példája
Tájékoztató adatok A HUMANUS adatbázis feltárási fejleményeiről Rácz Ágnes számolt be.90 A HUMANUS az Országos Széchényi Könyvtár alig néhány éves szolgáltatása Humántudományi Tanulmányok és Cikkek Adatbázis, a HUMANUS, amely elérhető a honlapján keresztül (http://www.oszk.hu/humanus/) Az alábbi tudományterületeket fogja át: irodalomtudomány, nyelvtudomány, történelemtudomány, hadtudomány, politikatudomány, könyvtártudomány, könyvtörténet, filozófia, vallás, teológia, művészet, neveléstudomány, néprajztudomány, helytörténet, kisebbségtudomány. (Megj.: e tekintetben fontos, hogy az egyes bibliográfiai rekordok generikus „tárgyszavazását” is megoldják annak a tudományterületnek a jelölésére, amelybe a tétel beletartozik.)
A feltárás kérdésköre A feltárás területei közül a tárgyszavazással, a tárgyszavak használatával kapcsolatos fejleményekre összpontosítunk. Már a tervezés korai szakaszában (2004–2005-ben) megfogalmazódott, hogy az adatbázisba kerülő bibliográfiai rekordok tartalmi jellemzésére természetes nyelvű, szabályozott feltáró eszközöket fognak alkalmazni. Kézenfekvőnek látszott erre a célra a könyvtárak nagyobb körében bevezetett OSZK-tezaurusz/Köztaurusz-t használni. Az is világos volt, hogy a résztvevő könyvtárak meglévő szaktezauruszaikat, tárgyszójegyzékeiket szintén használhatják majd. A HUMANUS háttéradatbázisaként már működik az OSZK-tezaurusz, illetve a Könyvtári és tájékoztatási tézaurusz. A HUMANUS adatbázisrendszeren belül fontos helyet foglal el a MANCI adatbázis. Nemzetközi viszonylatban is megállja a helyét.91 Bebizonyosodott az is, amit már a tervezésnél sejtettek, hogy az OSZK Tezaurusz nem nyújt elég lehetőséget a mélyebb tárgyi feltárásra bizonyos, a HUMANUS gyűjtőkörébe eső területeken! Ráadásul nehézkes az egyes szakterületekhez tartozó tárgyszókészletének áttekintése, mivel nincs szakrendi csoportosítása! Így a feldolgozás kezdeti szakaszában az OSZK Humántudományi Bibliográfiai Osztálya kísérletképpen, szaktudósok bevonásával a régészet, majd az irodalomtudomány területén dolgozott ki olyan tárgyszójegyzéket, amely jobban megfelel a cikkek tartalmi feltárásának. Napirenden van a történettudományi fogalmak ez irányú összegyűjtése is. Ezeket az elkészült tárgyszólistákat az OSZK Tezaurusz/KÖZTAURUSZ fejlesztőinek rendelkezésére bocsátják. Ugyancsak fontos elképzelés (amely a MOKKA esetében is hangsúlyozott volt), az adatbázisban a tezauruszok „authority fájljának” kezelése. Ennek megvalósítására kísérlet
90
RÁCZ Ágnes: A HUMANUS adatbázis kifejlesztése, különös tekintettel a könyvtártudományi és könyvtörténeti dokumentációra. In: Könyvtári Figyelő, 54. évf. 2008. 2. sz.
http://epa.oszk.hu/00100/00143/00067/113.htm 91
MÉSZÁROS Judit: A MANCI és a LISA könyvtártudományi adatbázisok tartalmi feltáró rendszerének (összehasonlító elemzése). In: Tudományos és Műszaki Tájékoztatás, 54. évf. (2007) 11–12. sz. 210–211.p. http://tmt.omikk.bme.hu/show_news.html?id=4803&issue_id=488
115
INFORMÁCIÓKERESŐ NYELVEK III.
folyik a Könyvtári és tájékoztatási tézaurusz tárgyszóanyagával, megtörtént a deszkriptorcikkek konverziója az eddig használt MikroISIS-ből a Bodzában kialakított alkalmazásba. A tezauruszok építését és karbantartását is szeretnék automatizálni, ehhez további szoftverfejlesztés szükséges. Lehetőség van böngészésre a tezauruszban, illetve a keresőkifejezések összeállítására a tezauruszból. A melléklet a HUMANUS adatbázis informatív kezdőlapját mutatja, mely alapján a feltárással és kereshetőséggel kapcsolatos információk átfogóan követhetők, és tovább lehet lépni a részinformációk irányában.
19. kép 8.3.7
A HUMANUS adatbázis rendszer nyitóoldala
A Magyar Elektronikus Könyvtár feltárási példája
Tájékoztató adatok A 2000-es években erőteljesen fejlődött a digitális könyvtári szegmens. Kialakultak az elektronikus könyvtári gyűjtemények, pl. a Magyar Elektronikus Könyvtár, a nagy egyetemek elektronikus könyvtárai, régiók, megyék elektronikus könyvtárai, és más nagy digitális kezdeményezések. Ezek az integrált rendszerek, melyekben minden digitális formában van jelen, mind az elsődleges, mind pedig a másodlagos információk, különleges figyelmet érdemelnek a tudásreprezentáció, a tudáselérés korszerű megoldása szempontjából. Az asszociatív modell célirányos alkalmazását segíti, hogy a digitális könyvtárban adat és metaadat egyaránt elektronikus formában van, elmosódik a határ a kettő között. Sőt, már a használóknak is „digitális aspektusaik” vannak, gondoljunk a köztük folyó kommunikációra. A felhasználóbarát módszerek, eljárások jól alakíthatók, messzemenően figyelembe véve az aktuális használói igényeket és feladatokat. Ld. bővebben a hivatkozott videót 92 92
MOLDOVÁN István: Fejlesztések, újdonságok az OSZK MEK osztályán. Eger. Networkshop, 2007 április. URL: http://videotorium.hu/hu/recordings/details/1773,Fejlesztesek_ujdonsagok_az_OSZK_MEK_osztalyan
116
INFORMÁCIÓKERESŐ NYELVEK III.
Feltárási és keresési példák A Magyar Elektronikus Könyvtár is nagy utat járt be a kezdetektől. A 20. képmellékletben látható, hogy a választott tétel (A hajtástól az újborig. A szőlő és bor ünnepei Lendvavidéken) a címben szereplő kulcsszavak mellett 3 tematikus és 2 földrajzi tárgyszót tartalmazott. A 2001. évi nyomtatott kiadvány 2002–03-ban került be a MEK-be.
20. kép
Indextétel a Magyar Elektronikus Könyvtárból régen
A 21. melléklet a cédulaformátumban rövid természetes nyelvű megjegyzést is tartalmaz, illetve átfogóbb tárgyszavakat is megad.
21. kép
Indextétel a Magyar Elektronikus Könyvtárból ma
A következő 22. melléklettel a gazdag formátumkínálatra, a sokféle megtekinthetőségi verzióra, a kapcsolódó oldalakra, az olvasói vélemény kifejthetőségére, valamint a szöveges ismertetés megjelenésére hívjuk fel a figyelmet, a sokféle szempontú asszociatív alapú felfedezés kötetlen, szabad, szárnyaló lehetőségére (szurrogátum + a dokumentum tartalomjegyzéke, teljes szövege + a fentebb felsorolt lehetőségek).
117
INFORMÁCIÓKERESŐ NYELVEK III.
22. kép
Magyar Elektronikus Könyvtár - egy tétel sokrétű feldolgozottsága
Bár megszünt, de meg kell említenünk a Neumann János Digitális Könyvtárat is, mely számos újdonsággal szolgálta a digitális tudásreprezentáció ügyét: − Elméleti-módszertani szinten: Tanulmánygyüjteményeket jelentetett meg a tárgyi feltárás elősegítésére. − Gyakorlati szinten: a tartalmi feltárás szerint innovativ megoldásokat vezetett be, pl. a tématérképes megoldást, példát és mintát mutatott más digitális gyüjtemények feltárása számára az egyszerű, használóbarát keresés támogatásához. Az utóbbiakról Pajor Enikő tanulmánya ad máig tanulságos áttekintést. 93 A 23. sz. melléklet a keresést segítő eszközök gazdag lehetőségeit mutatja.
23. kép
93
A keresést segítő eszközök a Neumann János Digitális Könyvtár webkatalógusában
PAJOR Enikő: Tükörkép - remélhetőleg nem homályos - a Webkat.hu fejlesztés utáni változatáról. In: Könyvtári Figyelő, 2002/1-2. 130-147. p. http://www.ki.oszk.hu/kf/kfarchiv/2002/1_2/pajor.html
118
INFORMÁCIÓKERESŐ NYELVEK III.
8.3.8
A magyar adatbázisok értékelése és fejlesztése
Értékelés A leckében megismerte a magyar adatbázisok tanulságos, sajátos fejlődését. Áttekintést nyert a szakterületi adatbázisok jellemző jegyeiről, a mezőgazdasági, műszaki, orvostudományi és pedagógiai példákon keresztül. A fejlődés, a műszaki kivételével kétségkívül követhető, de a nemzetközi és hazai felmérések azt mutatják, hogy egyáltalán nem kielégítő. Az adatbázisok fejlesztése nagyon fontos lenne. A PAD, illetve az Arcanum adatbázisai esetében kellően szegmentált az adatszerkezet és az ehhez szükséges korszerű keresőeszközöket is biztosítják. A magyar adatbázisoknak sem az intellektuális, sem a technikai eszközei nem kielégítők ahhoz, hogy megfeleljenek a velük szemben támasztott tudásreprezentációs elvárásoknak. A nemzetközi adatbázisokhoz képest nagy az elmaradás e tekintetben, ahogy azt a használati, keresési tényezők elemzése is mutatja. Varga Katalin vizsgálata kimutatta, hogy a felmért 16 magyar szakirodalmi adatbázisban, átlagosan négyféle eszközt használnak az adatbázisok (illetve azok szabadon hozzáférhető internetes változatai) a szövegjelentés reprezentálására.94 A nemzetközi összevetés kedvéért megemlíti, hogy a nemzetközi vizsgálatban ez az átlag 10 volt, igaz, hogy az ott vizsgált adatbázisok zöme nem szabadon hozzáférhető, csak drága előfizetési díj ellenében használható.95 A generikus és a specifikus feltáró eszközök egymás melletti alkalmazása nemzetközi tendencia, amely elég jól jelenik meg a hazai adatbázisokban is. Fontos szerepe van ennek az egészséges egyensúlynak, hiszen a generikus feltárásoknak hangsúlyos feladatuk a szövegvilág reprezentálása. Tudatosítja, hogy a szakirodalmi adatbázisok mindenhol a világon – így nálunk is – saját tudományterületi osztályozásokat használnak, és nem a könyvtárakban egyébként megszokott osztályozásokat (pl. ETO). A hazai adatbázisok között is csak egy-kettő alkalmazza már az ETO-jelzeteket. Ugyanakkor azonban eltér a magyarországi trend a nemzetközitől a tekintetben, hogy a nemzetközi adatbázisok kedvelik a természetes nyelvi és a kóddal jelölt elemek együttes alkalmazását, mivel ezzel többféle megközelítést adnak a témáknak. Ennek a tendenciának még csak a csírái vannak meg a magyar adatbázisokban (pl. a közgazdaság-tudományi adatbázisnál). A szabályozottság a tudományos szakirodalom tartalmi feltárásában kulcsfontosságú. A keresés pontossága nagyban függ attól, mennyire biztos a feltárás egységessége. Az adatbázisok többsége alkalmaz szabályozott feltáró eszközöket, sokszor többet is, ez nagyon jó tendencia. Általánosságban megállapítható, hogy a magyarországi szakirodalmi adatbázisok jelenlegi feltáró rendszere nem elegendő a részletesebb szövegreprezentáláshoz Ahol van refe94
VARGA Katalin: A magyar szakirodalom tartalmi reprezentációjának jelenlegi állapota. In: Tudományos és Műszaki Tájékoztatás, 52. évf. 2005. 7-8.sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4008&issue_id=464 95 CSÍK Tibor, VARGA Katalin: A tudás és az információfeldolgozás. In: Tudományos és Műszaki Tájékoztatás. 52. évf., 2005, 7-8.sz. http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464
119
INFORMÁCIÓKERESŐ NYELVEK III.
rátum vagy kivonat, ott van erre valami esély, egyéb esetekben azonban nem látszik, hogy a tárgyszavazást szintaktikai megfontolások befolyásolnák. Az esetek többségében csak egymás után álló tárgyszavakat találunk Varga Katalin nemzetközi összefüggésbe ágyazott felmérésének a tanulsága az, hogy jelentős lemaradásban vagyunk, a tudás reprezentációja területén. Ennek számos okát taglalja, pl. kis ország lévén, a koncentráció, a vállalkozások, a technikai eszközök viszonylagos hiányát.
Fejlesztés A fejlesztés alapvető vetülete, hogy az adatbázisoknak alkalmazkodni kell az új digitális környezethez. Az adatbázisoknak a feltárás szemszögéből nézve maximálisan segíteniük kell az eredeti szövegekben levő tudás, összefüggések magas szintű, differenciált reprezentációját, a keresés szemszögéből tekintve pedig mind a nagyobb teljesség, illetve a nagyobb pontosság (több releváns találat) feltételeinek segítését. Az információkhoz való könnyű és gyors hozzáférés már megoldott, a technológia egyre inkább rendelkezésre áll, mégis egyre nagyobb probléma az információkeresés. Varga Katalin szerint, ehhez egyrészt elengedhetetlen a minőségi szemléletváltás, az innováció. A „mindenkinek mindenhol mindent” elvet hamarosan fel kell váltania a „mindenkinek mindig minőséget” elvnek. Az innováció szerepéről szóló cikkében részletesen is elemzi a pozitív változáshoz elengedhetetlen fejlesztési tényezőket, tennivalókat, különös tekintettel az innovatív hozzáállásra.96 − Új módszereket kell bevezetni a feldolgozásban és a tájékoztatásban. A szakkönyvtárak akkor kreatívak, ha úgy tudják megvalósítani a nagy mennyiségű információtömegben a minőségi szempontú válogatást, hogy az olvasó nem veszi észre, nem érzi azt, hogy eltagadnak előle valami fontosat. − Sokkal részletesebb feltárásra, sokkal nagyobb szabályozásra, sokkal modernebb keresőrendszerekre, olyan új szolgáltatásokra van szükség, amelyek speciálisan a szakterület kifinomult igényeit szolgálják. Napjaink legmodernebb könyvtári szolgáltatásainak meg kell felelniük néhány alapelvnek: − Könyvtár 2.0: a szakmát művelő szakemberek bevonása az információszolgáltatásba, szigorúan a minőség támogatása érdekében (publikációk értékelése, viták generálása stb.). − Távoli elérés: A lehető legtöbb szolgáltatás elérhetővé tétele az olvasó otthonából (pl. témafigyelés, irodalomkutatás, szaktájékoztatás). − Kényelem: A szakember szakmai gondolkozásához igazodó keresési lehetőségek, nyelvezet stb. − Új minőség a szolgáltatásban és az adatbázisokban: több minőségi tartalom, változatos forma, széles keresési lehetőségek, kényelmi szolgáltatások.
96
VARGA Katalin: A szakkönyvtári innováció lehetséges útjai* http://www.tanszertar.hu/eken/2008_04/vka_0804_2.htm
120
INFORMÁCIÓKERESŐ NYELVEK III.
−
−
−
Új technika: A fenti követelmények csak a legmagasabb technikai színvonalon teljesíthetők. A célok érdekében speciális technikai és technológiai újításokra van szükség. Új szaktudások. A szükséges innovációt és fejlesztéseket csak olyan könyvtárosok tudják megvalósítani, akik egyaránt magas szinten értik az információtudományt és az érintett szaktudományt! (Megj.: ehhez a múltban készen kaptunk szakembereket a kétszakos képzés keretében, most a BA-MA célzott egymásra épülésében kell gondolkodnunk!)
8.4 8.4. ÖSSZEFOGLALÁS A lecke első részében a magyar adatbázisok jellegzetességeivel, típusaival ismerkedett meg. Ezt követte az adatbázis- előállítók és szolgáltatók körének áttekintése (pl. nemzeti (szak)bibliográfiai, szakterületi-tematikus és egyéb) áttekintése. Az intellektuális és technikai tényezők, valamint a munkafolyamatok, keresés és támogatás közül itt csak a leglényegesebbekre utaltunk. Egy nagy nemzetközi, illetve hazai felmérés eredményeit vázoltuk fel, és állítottuk párhuzamba. A 2. résztől konkrét szakterületek feltárási példái következtek, mellékletekkel illusztrálva: Magyar mezőgazdasági irodalom (2. rész), Magyar műszaki és gazdasági szakirodalom (3. rész), Magyar orvostudományi szakirodalom (4. rész), Magyar pedagógiai irodalom (5. rész), Humántudományi cikkirodalom (6. rész). Magyar Elektronikus Könyvtár (7. rész). Ezt követte, a kezdő részhez is szorosan kapcsolódva a magyar adatbázisok értékelése és fejlesztése, melyben Varga Katalin és Csík Tibor nemzetközi felmérésének fő eredményeit, és a magyar adatbázisok ezt követő felmérésének (Varga Katalin) párhuzamba állítása, számos nagyon fontos tanulsággal szolgál a jelenre és jövőre nézve. (8. rész).
8.5 8.5. ÖNELLENŐRZŐ KÉRDÉSEK 1. Fejtse ki a magyar adatbázisok fő típusait, példákkal! 2 Fejtse ki a magyar adatbázis-előállítás és szolgáltatás fő jellegzetességeit! 3 Vázolja fel az adatbázisok elemzésének, értékelésének legfontosabb tényezőit, kritériumait! 4 Fejtse ki a magyar mezőgazdasági szakirodalom feltárásnak fő jellegzetességeit! 5. Fejtse ki a magyar műszaki és gazdasági szakirodalom feltárásának fő jellegzetességeit! 6. Fejtse ki a magyar orvostudományi szakirodalom feltárásának fő jellegzetességeit! 7. Fejtse ki a magyar pedagógiai szakirodalom feltárásának fő jellegzetességeit! 8. Fejtse ki a magyar humántudományi cikkirodalom feltárásának fő jellegzetességeit!
121
INFORMÁCIÓKERESŐ NYELVEK III.
9. Tanulmányozza a Magyar Elektronikus Könyvtárat és jellemezze a feltárás fejleményeit! 10. Értékelje a magyar adatbázisok helyzetét, és határozza meg fejlesztésük fő kritériumait és teendőit!
122
INFORMÁCIÓKERESŐ NYELVEK III.
9.
AUTOMATIKUS INDEXELÉS
9.1 CÉLKITŰZÉS A lecke tanulmányozása alapján legyen képes az alábbiak kifejtésére − az automatikus feltárás iránti igények, − az automatikus indexelés fogalma, − a szavak morfológiai vizsgálata, − az internetes kereső fogalma, kialakulása, − a szolgáltatók és felhasználók fő jellemzői, − az integrált feltárási stratégia, − az intellektuális és technikai eszközök jellemzői, − az internetes keresőrendszer működési elve, − a használat, keresés jellemzői, − a kereséstámogatás eszközei, − az internetes keresők előnyös és hátrányos ismérvei, − az internetes keresők értékelési szempontjai, − a fejlesztés irányai és lehetőségei.
9.2 TARTALOM 1 Az automatikus indexelés fogalma és fejlődése − Az automatikus feltárás iránti igények − Fejlődése − Az automatikus indexelés megközelítései − A morfológiai vizsgálat elemei 2. Az internetes keresőrendszer alapjai − Kialakulása − Fogalma − Szolgáltatói és felhasználói 3. A feltárás stratégiája, eszközei és munkafolyamatai − A stratégia fő elemei − Intellektuális eszközei − A rendszer működése, munkafolyamatai 4. A használat, keresés, támogatás jellemzői − A keresés jellemzői, keresési szokások − Egyszerű és összetett keresés − Támogatás, megjelenítés, hozzáférés 123
INFORMÁCIÓKERESŐ NYELVEK III.
5. Az internetes keresők értékelése − Pozitív és negatív ismérvek − A keresőrendszerek értékelési kritériumai 6. A fejlesztések új irányai és lehetőségei − Komplex szolgáltatások − Tudományos keresést segítő eszközök − Metakeresők − Vizuális keresők − Természetes nyelvi keresők − Speciális célú keresők − Mélyweb keresők
9.3 A TANANYAG KIFEJTÉSE 9.3.1
Az automatikus indexelés fogalma és fejlődése
Az automatikus feltárás iránti igények Az automatikus feltárás középpontjában a szöveg áll. Abból indul ki, hogy a tudás kezelésének eljárásait a szövegek vizsgálatára kell alapozni. A szövegből minden megtudható (abból minden kiolvasható), pl. témája, a tartalma, azok nyelvi kifejezései mind benne vannak a szövegben. Csak megfelelő eljárásokat kell alkalmazni ahhoz, hogy e kifejezéseket megtaláljuk.97 (HORVÁTH, 1999, 53. p.). A kiinduló kérdés, hogyan lehet az ismérveket automatikusan vagy félautomatikusan meghatározni. Hogyan lehet jellemző ismérveket, szavakat, szószerkezeteket meghatározni, kulcsmondatokat, tézismondatokat megtalálni egy szövegből, vagy használható tömörítést elvégezni belőle? Az automatikus feltárás kapcsán automatikus osztályozásról, illetve automatikus indexelésről beszélnünk. − automatikus indexelés = amikor a szövegből kiválasztott kulcsszavak alkotják az ismérvet [az indexkifejezést vagy keresőkifejezést]), − automatikus osztályozás = amikor a dokumentum szövegében szereplő szavak gyakorisági elemzése alapján a dokumentumokat hasonlósági osztályokba sorolják).98 A szöveget alapul vevő automatikus indexelés jobb megértéséhez fel kell idéznünk a szövegszó és a kulcsszó fogalmát: szövegszó: A szövegből meghatározott, bármely módszerrel kiemelt szó, kulcsszó: a címből, bibliográfiai leírásból és kiegészítőiből (pl. referátum) vett meghatározott szó. 97 98
HORVÁTH Tibor: idézett mű, 1999. 53.p. UNGVÁRY Rudolf, ORBÁN Éva: Osztályozás és információkeresés. Kommentált szöveggyűjtemény, 2. kötet. 246.p. URL: http://mek.oszk.hu/01600/01683/pdf/01683-2.pdf
124
INFORMÁCIÓKERESŐ NYELVEK III.
Fejlődése Az 1960-as években sor került olyan vizsgálatokra, melyek szerint a feldolgozó szakemberek által végzett indexelés következetlen, szubjektív, helyette tudatosan kell törekedni az objektívebb feldolgozás rendszerek kidolgozására. (egyes vizsgálatok szerint ugyanazt a dokumentumot csak 10-80%-ban osztályozták hasonlóan vagy ugyanúgy a különböző szakemberek!) Az ún. Aberystwith-i jelentés99 kimutatta, hogy a vizsgált keresőnyelvek nem mutattak szignifikáns különbségeket a keresés hatékonysága illetően. A szabályozatlan nyelvek mindazt nyújtották, amit a szabályozott nyelvek nyújtottak. A szabályozatlan nyelv sohasem volt olyan rossz, mint a legrosszabb szabályozott nyelv, sem pedig olyan jó, mint a legjobb szabályozott nyelv. A nagy specifikusság nem eredményezett rosszabb teljességet, mint a kis specifikusság. „A bizonyítási kényszerek” hatására az 1960-as évek második felében egyre intenzívebbek lettek az automatikus indexelési és osztályozási kutatások és egyre több gépi információkeresési rendszer jelent meg. A kutatást nemcsak egyetem égisze alatt folytatták, hanem olyan hatalmas szakmai szervezet égisze alatt, mint az ASIS (American Society of Information Science).
Az automatikus indexelés megközelítései Abból indul ki, hogy a dokumentum természetes szövegének elemzésével megoldható a dokumentum, kognitívum tartalmának a reprezentálása – „objektívebb”, hiszen eleve kihagyja a szubjektív, „gyönge láncszemet”, a feldolgozó szakembert. Az indexelő kifejezéseket közvetlenül a dokumentumok eredeti, természetes nyelvű szövegéből veszi különféle automatikus eljárásokkal (statisztikai elemzések, valószínűségi számítások, vagy/és természetes nyelvi elemzések alapján.) Ily módon a szerzőktől eredő természetes nyelvi szavakat torzítatlanul használja. Az automatikus indexelés fentebbi meghatározásánál az alábbi funkciók kapcsolódnak egymáshoz100 − (1) a szöveg, referátum vagy a cím szavainak gépi segítséggel történő kivonatolása, extrahálása, - különféle módszerekkel - pl. úgy, ahogy a szavak az eredeti dokumentumban szerepelnek, akár a szótövek alapján összevetve (tudományos szakszóval konflálva), akár súlyozva, statisztikai vagy valószínűségi alapon, − (2) az így kivonatolt szavakból mutató, invertált fájl készítése (UNGVÁRY, ORBÁN, 2001, 239. p.). Aszerint, hogy az (1) funkciót hogyan, milyen módszerekkel oldják meg, Luhn után három irányzat kristályosodott ki: a statisztikai, a valószínűség-számítási és a nyelvészeti. Mind a három a természetes nyelvet használja a szövegek leírására, a tárolási szerkezetek kialakítására, illetve a keresés biztosítására. Az automatikus indexelés és osztályozás főcsapása a nyelv problémáit kizárólag, mint statisztikai-kvantitatív kérdést kezeli, nem mélyed el szintaktika, szemantikai kérdésekben. 99
HORVÁTH Tibor: Az Aberystwyth-i jelentés. In: Könyvtári figyelő, 1975. 21. évf. 3. sz. 564-569. p.
100
UNGVÁRY Rudolf , ORBÁN Éva hivatkozott mű, 2001, 239. p.
125
INFORMÁCIÓKERESŐ NYELVEK III.
A kialakult három irányzat közül a fenti elvet képviseli a statisztikai irányzat, illetve részben a valószínűség-számítási. A statisztikai irányzat statisztikai elemzéseket alkalmaz (például a szógyakoriságot is vizsgálják a kulcsszavak súlyozott megállapítása érdekében). A valószínűségi indexelés a legösszetettebb eljárások egyike, amelyhez valószínűségszámítási módszereket is felhasználnak. A nyelvészeti megközelítés – mai nevén a természetes nyelvi feldolgozás (natural language processing, NLP), vagy nyelvtechnológiai megközelítés tekintettel van a szintaktikai és szemantikai szintre is. Ez kvalitatív nyelvészetről is beszélhetünk. Magyar viszonylatban fontos képviselője Prószéky Gábor és a morphologic 101 A szógyakorisági vizsgálatok gépesítésének alapfeltétele bizonyos morfológiai vizsgálatok elvégzése, az automatikus szótőfelismerés biztosítása. A statisztikai irányzat Olyan automatikus feltárás irányzat, mely a természetes nyelvet használja a dokumentumok, információk leírására, a tárolási struktúrák kialakítására és a visszakeresés biztosítására. A szövegekben természetes nyelven szógyakorisági (szóstatisztikai) eljárások alapján határozza meg azokat a kulcsszavakat, amelyek ismérvül szolgálnak az adott szöveg reprezentálására. H.P: Luhn alapgondolatai alapján a rendszert G. K. Zipf fejlesztette tovább. Fő kiindulópontok: A nyelv statisztikai vizsgálatra alkalmas − Olyan jelrendszer, melynek jelei (szavak, szerkezetek) nem azonos valószínűséggel vagy gyakorisággal fordulnak elő, igy a nyelv legkülönfélébb rendű elemeit a fonémáktól a mondatokig statisztikai vizsgálatnak vethetjük alá A statisztikai vizsgálat alapján a szöveg tartalma leírható. A statisztikai eljárások könnyen automatizálhatók. Meg kell határozni, hogy milyen összefüggés van a szavak gyakoriásga és relevanciája, szignifikáns volta között. A Luhn-féle alaptétel szerint a túlságosan alacsony, illetve túlságosan magas frekvenciájú kifejezéseket ki kell zárni az indexelésből – Ugyanakkor a súlyozott kulcsszavas indexelés követői, Salton és McGill szerint ez a kizárás a keresés során veszteséget okozhat mind a teljesség, mind a pontosság viszonylatában. Valószínűségi eljárás − A valószínűségi eljárásban a keresés bővítését és élesítését a kulcsszavak statisztikai együttes előfordulásának a vizsgálata alapján oldják meg. E modellből fejlődött ki a hetvenes évek közepén a valószínűségi indexelés. − A szöveg tartalmát alkotó szavak közül a speciális szavak a tartalomhordozók, a speciális szavak a mérvadóak, a mondatalkotást szolgáló funkcionálisak nem tartalomhordozók. 101
MorphoLogic URL: http://www.morphologic.hu
126
INFORMÁCIÓKERESŐ NYELVEK III.
−
Egy indexkifejezés hasznossága a teljesség és pontosság viszonylatában a használata során ítélhető meg.
A morfológiai vizsgálat elemei A szavak szintjén való előfordulási gyakoriság vizsgálat, a morfológiai szinten az alábbiak elemzését foglalja magában. Szövegszó − az az egység, amely szóköztől szóközig tart, és szövegszónak nevezzük. − A „Szón azt az egységet értjük, amely szóköztől szóközig tart, és szövegszónak nevezzük” mondat, ha az írásjelektől eltekintünk - 12 szövegszóból áll. Lexéma − a különböző szóalakok egy olyan csoportja, melyet a nyelvész együvé tartozónak ítél a jelentés, használat stb. alapján. − A lexéma a nyelv absztrakt egysége, gyakorlatilag bármely szóalakja szimbolizálhatja. A „szeretni” ige szótári alakját a magyar jelen idő egyes szám harmadik személyben „szeret, a latin a jelen idő egyes szám első személyű alakkal „amo”, az orosz pedig infinitívusszal „LJUBIT” adja meg, ahogy az angol is: „love”. − „A valószínűség-számítás a populációból következtet a mintára, a statisztika pedig a mintából következtet a populációra” mondat 15 szövegszóból, 7 lexémából áll. Szókapcsolatok − A keresésre alkalmas kulcsszó nemcsak önmagában álló szó, vagy összetett szó lehet, hanem a szókapcsolatok is. − Valós értelemmel bíró szintagmák, mint pl. „progresszív adó”, „északi fény”, „légügyi egyezmény stb. − Terminus technikusok, melyek szintén felbonthatatlanok és osztályozásra alkalmasak, pl. „matematikai logika”, „természetes számok”, „automatikus indexelés” stb. − Frazeológiai egységek, melyek jellemzője, hogy jelentésük teljesen eltér összetételeik jelentésétől, ezért lexikailag megbonthatatlanok (pl. „Cosa Nostra”). − Az olyan szintagmák, amelyeknek összetevői a téma szempontjából kis relevanciaértékűek, ugyanakkor együtt kulcsszóértékűek lehetnek, pl. „gyakorisági vizsgálat”. Szókapcsolatoknál az előfordulás gyakoriságából következtethetünk a kapcsolat mértékére. Könnyen belátható, hogy ha két szó egy szövegben gyakran fordul elő együttesen, akkor közöttük erős értelmi kapcsolat van. A szavak szintjén végzett elemzések (szövegszó, lexéma stb.) is alapvetően befolyásolják, hogy a felhasználható oldalon mi, és hogyan válik kereshetővé. E tekintetben számos olyan megoldást alkalmaznak, melyek nagyobb rugalmasságot biztosítanak számára, és lehetővé teszik, hogy nagyobb pontosságra vagy teljességre törekedjen. Szövegrelációk Fontos kérdés, hogyan teszi a statisztikai alapokon nyugvó indexelés lehetővé az eredeti szövegrelációk keresését, azokét, amelyek csak az adott szövegre érvényesek? M a teendő
127
INFORMÁCIÓKERESŐ NYELVEK III.
akkor, ha mondjuk egy tanulmány az aranyat, mint meseelemet visszafejti a kelta kézművességre? 9.3.2
Az internetes keresőrendszer alapjai
Kialakulása Az indexelőszolgáltatások a késői hatvanas, korai hetvenes években kidolgozott automatikus eljárások alapján jelentek meg az 1990-es években. Ezek az egyszerűbb rendszerek néhány évig úgy ahogy kielégítették a nagy tömegű információkeresés igényeit. Az automatizált indexelés legelterjedtebb alkalmazása az internetes dokumentumok indexeléséhez köthető. Az 1990-es évek közepétől – a digitális dokumentumállomány feltárására kezdtek el működni az első webes indexelő és kereső szolgáltatások (pl. AltaVista, a Yahoo!, a magyar Heuréka stb., majd nemsokára követte az AltaVizsla). A tartalom szerinti információkeresésre az interneten az alábbi fő szolgáltatási formák alakult ki: − az indexelőszolgáltatások – a természetes nyelven való keresést tesznek lehetővé, − az internetkatalógusok – a hierarchikus osztályozási rendszereket alkalmaznak − a metakeresők (a keresőrendszerek keresői), − a szoftvereszközök (a felhasználó számítógépére telepíthető, a keresést segítő programok köre).
Fogalma Az internetes keresőrendszerek (más neveken internetes keresők, internet keresők, internetes keresőszolgáltatások, indexelő szolgáltatások) a világhálón található dokumentumok keresésére mindennapos, tömeges tájékoztatási szolgáltatást nyújtanak. Az internetes keresőrendszerek az individualizáló osztályozás, indexelés feladatának megoldására szerveződtek, amit automatikus eljárások segítségével, az eredeti dokumentumok (meghatározott részeinek) indexelésével, az azokban szereplő kulcsszavak adatbázisba szervezésével, és kereshetővé tételével oldanak meg.
Szolgáltatói és felhasználói Szolgáltatói − Az átfogó szolgáltatást nyújtó rendszerek (pl. Google, Yahoo stb.) a weben általuk elérhető dokumentumok teljességében keresnek − A speciális keresők egy-egy szegmenset fednek le, pl. tematikus keresők, képkeresők, blogkeresők, hírkeresők stb. − Az átfogó szolgáltatók ambiciózus módon az elérhető „teljes weben” történő kulcsszavas, szabadszavas keresésének biztosítására vállalkoztak. Az elérhetőség köre szélesedik, bővül. A weben található legkülönfélébb dokumentumok indexelése alapján történik a keresés. 128
INFORMÁCIÓKERESŐ NYELVEK III.
Felhasználói Az indexelő szolgáltatásokat a használók lehető legszélesebb köre igényli, beleértve az az egyéneket és intézményeket. Azt várják el tőlük, hogy képesek legyenek a dokumentumforrások teljességének a feltárására, oly módon, hogy a tételek rövid leírása, s rangsorolása alapján a megadott csatolók segítségével viszonylag hamar elérhessék a számukra szükséges dokumentumokat, információkat. Az igények sokféle szinten és nagyon sokféle mélységben jelentkeznek a „felületi web” milliárdos dokumentumállományában levő információk iránt, ezért és számos típusuk alakult ki 10. A felhasználói igények irányultsága és típusai
Az igények irányultsága Gyűjtőkör szerint –földrajzi, nyelvi értelemben
Kialakult típusok
- globális - nemzeti - regionális Nyelvek szerint - globális („minden” nyelv) - nyelvhez kötött Gyűjtött és indexelt tematika - egyetemes (mindenféle tartalmú) szerint - speciális tartalmú, blogok, hírek keresői stb. Dokumentumtípus szerint - mindenfajta dokumentum, - speciális, pl. képkeresők, videókeresők stb. Az elérhető adatok típusa szerint - elsődleges” keresők, - metakeresők (melyek tovább adják a keresést több keresőgépnek). 9.3.3
A feltárás stratégiája, eszközei és munkafolyamatai
A stratégia fő elemei A feltárás stratégiájának jellemzői 102 A szövegből indul ki – a szolgáltatások leírására a szabad szavas és/vagy teljes szöveges (free-text és/vagy a full-text) formákat használja. A szabad szavas terminus azt fejezi ki, hogy bármilyen karaktersorozat alapján lehet keresni a szövegben, a teljes szöveges kifejezés arra utal, hogy „minden” karaktersorozatot (szót) beleveszünk az indexállományba. Automatikusan tárja fel az interneten található dokumentumokra jellemző ismérveket. Egyszerű eszközöket, módszereket használ, a legszélesebb (globális) felhasználói kör, köztük a sok kezdő kiszolgálása érdekében Feltár és kereshetővé tesz minden szót – a szabad szavas keresés keretében függetlenül a szófaji hovatartozáshoz. Teljességre törekszik A dokumentumok „teljességét” (a digitális világirodalmat) indexeli. (Nyilvánvaló, hogy csak elvi teljességről lehet szó, hiszen a szervezetlen, kaotikus
102
Szavak.hu URL: http://wwww.szavak.hu azon belül: archívum, visszakeresés
129
INFORMÁCIÓKERESŐ NYELVEK III.
Interneten, ahol napról napra milliónyi dokumentum születik, illetve milliónyit iktatnak ki, ez lehetetlen.) Összetett haladó keresést is lehetővé tesz a nagyobb pontosság érdekében. Lehetővé teszi a szövegrelációk kimutatását egyszerű, posztkoordinált eszközökkel, a kulcsszavak kombinálásával. Minden nyelv digitális anyagát kereshetővé teszi - az angol, a kinaí és a spanyol a legnagyobb felhasználói tömegekkel rendelkező nyelv. A kisebb nyelvekről sem feledkezik meg!
Intellektuális eszközei Az indexelés mély, a szabad szavas keresés elemei szerint sokszempontú keresés valósítható meg. Kezdetben csak statisztikai módszerek voltak, majd fokozatosan böngészhető tárgyszólisták, szinonimajegyzékek, fogalmi meghatározások jelentek meg, de ma sem használ ellenőrzött nyelvet (kivéve a metaadatokat) Differenciált kereséstechnikai eszközök – Boole operátorok, helyzeti operátorok, egyéb korlátozó funkciók (nyelvre, domain-re, stb.) Algoritmusok kidolgozása a találatok rangsorolására – ami automatikusan történik, nincs szubjektivitás. A rangsor (relevancia) megállapítása indexelő szolgáltatások szerint más. (ld. bővebben kifejtve a továbbiakban)
A rendszer működése, munkafolyamatai A továbbiakban ismertetjük egy keresőrendszer alkotóelemeit és azok elvégzendő feladatait. A 24. ábra (szerzői Friedman – Uher és Windhager) vázlatos áttekintést nyújt számunkra egy kereső szerkezeti felépítéséről.103 Az indexelés összetevői, munkafolyamatai és jellemzői A robotok − Az indexelő-szolgáltatások úgy dolgoznak, hogy meghatározott időközönként szisztematikusan átnézik a hálózaton lévő dokumentumok jellemző adatait és az indexkifejezéseket. átvizsgálják a weben található egyes dokumentumok szövegét, és szurrogátumait begyűjtik az indexelés érdekében. − A web jelentős, mélyebb rétegeit (a „mély webet”) e rendszerek nem képesek még elérni (pl. az adatbázisok strukturált adatainak rendszerét). − A robotok többsége nem a teljes szöveget nézi át az indexelés érdekében, hanem csak a dokumentum elején meghatározott számú (például 20-30) sort. A weblap karbantartójának a felelőssége, hogy ez magvas, lényegre törő, a tartalmat kifejező legyen. − Egy részük figyelembe veszi a címfejben szereplő metaadatokat is. − Az indexelő-szolgáltatások többsége, „a szándékos félrevezetés elleni védekezés érdekében nem veszi figyelembe a „keyword”-ben megadott kulcsszavakat, hanem csak az oldalak tényleges szövegét. 103
TÓTH Erzsébet: Hatékony információkeresés a weben: az internetes keresők lekérdezési hatékonyságának vizsgálata. Nyíregyháza: Örökségünk, 2010.
130
INFORMÁCIÓKERESŐ NYELVEK III.
A kereső adattárai − százmilliós nagyságrendben tartalmazzák az indexelt oldalak adatait. Az indexelő adatbázis − Az indexelés eredményeképpen a tartalom szerint képződik automatikusan, kivonatos formában a végiglátogatott helyek dokumentumait tartalmazza. − A keresés az index adatbázisban történik a felhasználó által megadott szavak alapján. − Az index adatbázis mérete, pontossága és frissessége határozza meg azt, hogy milyen eséllyel találhatunk meg egy adott weblapot a keresővel. A relevanciaelemzés − Többféle szempont szerint történik: a keresett szó előfordulásának sokrétű elemzése, az adott weblapra milyen számban mutatnak linkek más weblapokról, a weblap szövegének nyelvi elemzése, a beírt keresőszó előfordulási gyakorisága az adott indexelő-szolgáltatás teljes adatbázisában stb.) − A relevanciaelemzés alapján kerül a találat rangsorolására. A relevancia-ellenőrzés eredménye alapján történik a találatok sorrendjének meghatározása és megjelenítése. A rangsorolás a megadott kritériumok szerint szintén automatikusan történik. A lekérdező felület és keresés − A rendszer a lekérdező felületen jeleníti meg a felhasználó számára a megadott szavakra illeszkedő dokumentumok találati listáját, rangsorban, rövid címeikkel és rövid, pár soros kivonataikkal (a leginkább illeszkedő részekkel). Ld. melléklet
24. kép
Az internetes keresőrendszer működési elve
131
INFORMÁCIÓKERESŐ NYELVEK III.
9.3.4
A használat, keresés, támogatás jellemzői
A keresés jellemzői, keresési szokások A rendszerben való keresés − A felhasználó kulcsszavakat fogalmaz meg, melyeket beírva elindítja a keresést, hogy néhány másodpercen belül megkapja a találati listát. − Az egyszerű keresésen túl fejlettebb keresőeszközöket is igénybe vehet (pl. „pontos kifejezés” megadása, Boole-algebrai műveletek, időszakra, nyelvre, földrajzi helyre korlátozás stb.). Ezekre a specifikus keresési lehetőségekre külön is felhívja a figyelmet az internet kereső, de, a felmérések szerint – kevesen veszik igénybe. A használók keresési módszerei, szokásai A releváns találatokat eredményező keresés sikerét befolyásoló tényezők − A keresési stratégia megfogalmazására számos tényező hat: a keresés tárgya, célja, nyelve, a nagyobb pontosság, vagy a nagyszámú találat igénye stb. − Más alternatív források figyelembevétele, pl. internetkatalógusok, linkgyűjtemények, webkalauzok – az esetek jelentős részben ezek a koncentrált, emberi munkával készült eszközök gyorsabban vezetnek pontos eredményhez. − A kereső személy előismeretei, nyelvtudása, képességei, motiváltsága, koncentrálóképessége, kombinációs képessége − A keresési módszerek és értékelő szempontok ismerete. − A tárgyi-tartalmi keresés kulcsszókategóriáinak tudatos átgondolása (tematikus, személy, intézmény, földrajzi, idő, dokumentumformák, formátumok kódjai)
Egyszerű és összetett keresés Egyszerű keresés, összetett keresés, koncepció alapú keresés. Egyszerű keresést minden rendszer kínál, többségüknél használható az összetett keresés is, és csak kevesen használják a harmadik módszert. (1) Egyszerű keresés Alapértelmezésben a keresőrendszereket a legtájékozatlanabb felhasználó számára alakították ki. Ha több keresőszót adunk meg szóközzel elválasztva, a rendszer automatikusan ÉS-kapcsolatnak értelmezi. Lehetőleg pontosan tudni kell, mit akarunk keresni (mely személyt, intézményt, témakört, földrajzi helyet), és ezt meg kell tudni fogalmazni. Számos keresőrendszer biztosítja a kérdésnek megfelelő találatok mellett még a hasonló találatok is megjelenítését.
132
INFORMÁCIÓKERESŐ NYELVEK III.
(2) Összetett keresés 11. Az összetett keresés fő lehetőségei
Módszer Két keresőszó együttes előfordulásának keresése
Példa, megnevezés AND logikai operátor (1) OR logikai operátor Megadott keresőszavak közül bármelyik keresése Pl. theater OR theatre NOT logikai operátor Egy szó kizárása a keresésből pl. cikk AND NOT törvénycikk Két szó együttes keresése n szó távolságig NEAR/n helyzeti operátor Egy szó bővített, toldalékolt formáinak keresése Csonkolás Címmezőben való keresés Szűkítés, korlátozás lehetősége, pl. domain-re, Szövegrészben való keresés időintervallumra stb. Hivatkozások keresése Képek keresése (1) A Google a Boole-operátorok közül az AND-et nem teszi szükségessé, azt automatikusan alkalmazza. OR operátor használata szükséges lehet szinonimák (Pszichológia OR Lélektan) vagy eltérő helyesírási mód esetében.
Támogatás, megjelenítés, hozzáférés Fejlemények − A keresést egyre több nyelvészeti, nyelvtechnológai módszerrel is támogatják, pl. szinonimajegyzékek, a keresőkérdés automatikus fordítása más nyelvre, a találatok szövegének automatikus lefordítása a felhasználó nyelvére. − Egyes keresőrendszerekben újabban böngészhető tárgyszólisták, szinonimajegyzékek, vizuális megjelenítés is elérhetők a kereséshez, ill. a találatok értelmezéséhez. − Általában nem a kezdőlapon vannak a specifikus, haladó keresési lehetőségek, de ezekre felhívják a figyelmet, és egy kattintással el lehet érni ezek űrlapjait. Megjelenítés − A keresőkérdésnek valamilyen szinten megfelelő találatokat az internet keresők több szempontot magában foglaló sajátos szempontrendszerük alapján rangsorolják. A legsikeresebb e tekintetben a Google rangsorolása. Olyannyira megbíznak benne, hogy a felhasználók többsége óriási találatmennyiségek esetében is csak az első 10 (esetleg 20) találatot futja át. Hozzáférés A találatként kapott internetes dokumentumok elérése két lépésben történik: − (1) a keresőkérdésre válaszul a képernyőn megjelennek az ismérvekhez kapcsolódó találatok, rangsorolva, látható az egyes tételek rövid leírása (a feltett kérdésben szereplő kulcsszavakkal). − (2) A rövid leírás alapján relevánsnak tűnő dokumentumokat a webcímek, linkek segítségével megjelenítjük a képernyőn, majd elkezdjük a tanulmányozását.
133
INFORMÁCIÓKERESŐ NYELVEK III.
9.3.5
Az internetes keresők értékelése
Pozitív és negatív ismérvek Elönyök, pozitívumok − Sok újdonságot, hasznos megközelítést hoztak a dokumentumtömeg minél árnyaltabb feltárására, ismérvekkel történő reprezentálására. − Objektívebb feltárás – egységes szabályok alapján választ ki bizonyos elemeket az eredeti szövegből, ezáltal a kapott eredmény független attól, hogy ki végzi az elemzést. − Posztkoordinált keresés lehetősége – a kereső szabadon érvényesítheti egyéni szempontjait a keresés során.
− − − − − −
−
− − − −
134
A szóstatisztikán nyugvó indexelés alapvető korlátai csak a szöveg fizikai tulajdonságain alapul, nincs tekintettel arra, hogy a kivont elemek (szavak) milyen értelemben fordulnak elő a szövegben. Környezetüktől függetlenül vizsgálja a szavakat, mely problémán a szókapcsolatok elemzése enyhít, de ezt a hátrányt nem lehet teljesen kiküszöbölni. A dokumentum a hagyományos értelemben osztályozatlan marad, illetve az osztályozást csak a szavak primitív síkján végezzük el. Mivel értelmi összefüggéseket nem vizsgálnak, megoldatlan marad a homonimák és a szinonimák problémája is. A rendszerek nagy része szintaktikailag érzéketlen, kivéve a kvalitatív nyelvészeti eredményeit alkalmazókat. A feldolgozási munka nagy része átkerül a felhasználói oldalra, a találati listákban a felhasználónak többletkeresési munkát kell befektetnie, hoy megtalálják a legrelevánsabb tételeket. Az összefüggések nem megfelelően kezeltek – nem képesek kellően láttatni a jelentésbeli (szemantikai) összefüggéseket. Főleg a felhasználó tudására, leleményességére van bízva, hogy keresőkérdését mely kulcsszavakkal fogalmazza meg, hogyan kombinálja azokat. A tartalom ellenőrizetlen – az adatbázisokkal ellentétben, az indexelő-szolgáltatások által feltárt teljes szövegekben a tartalom nem ellenőrzött. Az indexelő-szolgáltatások keresőprogramjai által végzett relevancia-ellenőrzés nem teljesen kielégítő. A fentiek következtében a pontosság viszonylag alacsony fokú – sok esetben kezelhetetlenül sok találatot kapunk és nagy a zaj. A teljesség sem valósul meg „teljes mértékben” – a szolgáltatások teljes körű keresésre törekszenek, de a web bizonyos, minőségi részeit, a mély webet az internet keresők nem tudják elérni.
INFORMÁCIÓKERESŐ NYELVEK III.
A keresőrendszerek értékelési kritériumai A számba jöhető mértékekről Tóth Erzsébet PhD disszertációja, illetve az alapján megjelent könyve tájékoztat.104 Az eddig megjelent értékelésekben a kutatók az internetes keresők minőségét számos mérték alapján mérik. Ezeknek a megbízható mutatóknak a megtalálása rendkívül nehéz feladat, számos vita folyik erről a kutatók körében. Számos listát fejlesztettek ki. Szabványos értékelési módszereket nehéz alkalmazni, azért is, mert a keresők állandó változásban vannak, illetve az elemzők elfogultsága egyes keresőkkel szemben. Oppenheim és Froehlich egy olyan szabvány kidolgozását javasolták, amely az alábbi mértékeket tartalmazná: 1. pontosság = a visszakeresett dokumentumok összességén belül a releváns dokumentumok aránya 2. teljesség = a megtalált releváns dokumentumoknak az összes (akár talált, akár nem) releváns dokumentumhoz viszonyított aránya 3. relatív teljesség = az adott kereső által visszakeresett releváns dokumentumok száma osztva az összes vizsgált keresők valamelyike által megtalált releváns dokumentumok számával 4. válaszidő = az átlagos időeltérés a keresőkérdés feltétele és a válasz megadása között 5. tesztelési idő = a tesztelésre fordított teljes időtartam hossza 6. a találatok megbízhatóságának mérése = egy adott időtartamon belül a találatok megbízhatóságának mérése, abból a szempontból, hogy az adott keresőkérdésre mindig ugyanazokat a találatokat adják-e 7. zsákutcás, halott hivatkozások aránya 8. ismétlődő találatok aránya 9. találatok minősítése felhasználókkal 10. grafikus felhasználói felület értékelése = mennyire felhasználóbarát 11. súgó és keresőprogram = mennyire hasznos a kezdő és a tapasztalt felhasználók számára 12. találatmegjelenítés = az output megjelenítési módja 13. reklámok jelenléte 14. a gyűjtemény terjedelme, a vélhető érdeklődést lefedő volta = milyen mértékben tartalmaz a rendszer releváns dokumentumokat, = az adott kereső adatbázisában lévő összes releváns dokumentum és az összes vizsgált kereső adatbázisában található releváns dokumentumok hányadosa 15. elvárt keresési hossz = átlagosan hány nem releváns dokumentumot kell áttekintenie a felhasználónak ahhoz, hogy bizonyos számú releváns dokumentumot megtaláljon 16. a találatleírások terjedelme és olvashatósága. 104
TÓTH Erzsébet: Hatékony információkeresés a weben: az internetes keresők lekérdezési hatékonyságának vizsgálata. Nyíregyháza: Örökségünk, 2010.
135
INFORMÁCIÓKERESŐ NYELVEK III.
Egyéb értékelési szempontok: 17. Testreszabhatóság = a keresőszolgáltatás testreszabható-e? 18. Vizuális egyértelműség = a keresőkérdés és a találatmegjelenítés világos, érthető és következetes-e? 19. Navigáció = egyértelmű-e a navigációs eszközök használata, könnyen tudunk-e a találatmegjelenítéstől a forrásdokumentumig eljutni és fordítva? 20. egyéb eszközök felkínálása, pl. tartalmaz-e valamilyen webes katalógust, amiben böngészhetünk? A fentiekhez kapcsolódik még, hogy az indexelés mely forrásokra terjed ki az Interneten, milyen gyakori a frissítés, mekkora az adatbázis mérete, melyek a keresés lehetőségei. (Megj.: az internetes keresők áttekintéséhez jó szolgálatot nyújtanak a startlapok pl. a kereső.lap.hu, illetve a mélyweb.lap.hu) 9.3.6
A fejlesztés új irányai és lehetőségei
Komplex szolgáltatások A napirenden levő fejlesztések a keresés relevanciájának, a pontosságnak a növelésére irányulnak. A legfontosabb a relevancia elemzés javulása, a találati lista automatikusan kategóriákba szervezése, ami a keresés szűkítését, és így a nagyobb pontosságot segíti. Egyes keresőrendszerek, elsősorban a Google weblapjának a tanulmányozása azt mutatja, hogy minden újdonságra fogékonyan reagál, és bevesz az eszköztárába. A nyelvi korlátok leküzdése érdekében automatikus fordítást tesz lehetővé, mind a kérdés angolra fordítását, mind pedig a kapott találatok szövegének fordítását. (Ezek minősége fokozatosan javul.) A mindent átfogó szolgáltatás magában foglalja a hagyományos egyszerű keresést, a specifikus eszközökkel támogatott keresést, különféle tematikus kereséseket (pl. blogok, képek), térképek alkalmazását. A találatok vizuális ábrázolását (kiegészítő szolgáltatásként) szintén lehetővé teszi. Ld. 25. melléklet
136
INFORMÁCIÓKERESŐ NYELVEK III.
25. kép
A Google varázskereke a találati relációk bemutatására
Mint minden kereső, a Google is szeretne szemantikailag erős lenni.105 A vállalat elgondolása szerint „a legjobb keresőmotor képes felismerni, hogy a felhasználó valójában mire szeretne rátalálni”.Ennek érdekében rendszeresen fejlesztenek és mutatnak be újabb és újabb mikro-alkalmazásokat, keresőrendszerüket nagyságrendileg hetente frissítik. Újdonságaikat a http://googleblog.blogspot.com/ címen teszik közzé. Ezek kis mikroalkalmazások többnyire kisebb (nem szemantikus jellegű) „apróságok”, amelyek – ha a felhasználó ismeri őket – nagyban segíthetik a keresés folyamatát. Ilyen például a képek szín és méret szerinti kereshetősége vagy a kereső ablak számológépként való működése. Magyar nyelven is elérhető fejlesztésük a SearchWiki. A mikroalkalmazás segítségével saját keresési eredményeiket rendezhetik át a felhasználók a nekik tetsző sorrendbe: előbbre sorolhatják a számukra fontos találatokat, a feleslegeseket pedig törölhetik a találatok közül. Módosításaikat a rendszer automatikusan elmenti. Beállításaikat és véleményüket megoszthatják a többi felhasználóval. (A keresés ebben az esetben a keresés „társas navigáció” felhangot kap.)
Tudományos keresést segítő eszközök A keresőrendszerek új, speciális kategóriája alakul ki - a tudományos kereső. Ilyen pl. a Scirus keresőrendszer.106 Jellemzője, hogy nagyobb pontosságra törekszik, árnyaltak a keresési lehetőségek.
105
HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web 106 Scirus keresőrendszer. URL: http://www.scirus.com
137
INFORMÁCIÓKERESŐ NYELVEK III.
A megadott kategóriák mindegyikét vagy bármely kategóriák kombinációját kiválaszthatjuk. Kereshetünk pontos kifejezésre (Exact phrase), a megadott szavak mindegyikére (All of the words) vagy bármelyikére (Any of the words). Összetett keresés (Advanced search) esetén két ismérvet kombinálhatunk ÉS, VAGY, és NEM operátorokkal, kiválaszthatjuk, hogy milyen mezőben akarunk keresni (cikk címe, folyóirat címe, szerző(k), kulcsszó, ISSN, URL és domain név). Szűkíthetjük a keresést dokumentumtípus, forrás, és időintervallum szerint. A tagsággal rendelkezők a megtalált folyóiratcikkek teljes szövegéhez is eljuthatnak.
Metakeresők A keresőkön belül különleges változatot képviselnek a metakeresők. A metakereső olyan internetes alkalmazás, amely a felhasználó által megadott szót vagy szavakat (a bevitt mintát) különböző keresőrendszereknek és webkatalógusoknak adja át a megfelelő formátumokban, s ennek alapján egyszerre keres mindegyikben. Az így kapott találatokat egyedileg kialakított fontossági sorrendben jeleníti meg, a találatoknál feltüntetve, hogy mely szolgáltatás adatbázisában sikerült megtalálni a rekordot, s a duplumok egy részét is kiszűri. A metakereső működési elvét a mellékelt 26. ábra szemlélteti.
26. kép
Metakereső működési elve
A metakeresők esetében különösen fontos a relevancia megállapítása, ha lehet mondani, még fontosabb, mint az elsődleges keresők esetében. Olyan algoritmust kell kidolgozni, amely a több kereső által visszaadott listákat több szempont figyelembevételével képes szűrni és rendezni (pl. az ismétlődések (ha több kereső is ajánlotta a lapot), a lapok mérete (egy rövidebb lapon megtalált szó általában relevánsabb találatot jelent, mint egy hosszabbon megtalált), az időpont (általában a frissebb oldalakon értékesebb, kevésbé elavult információ van). 138
INFORMÁCIÓKERESŐ NYELVEK III.
Legismertebb metakeresők a MetaCrawler107 a Dogpile108), vagy http://www.search.com Az eredmény csoportokra bontható, pl. a Clusty esetében klaszterálással: Különleges szerepet játszik a GlobalSpec mérnöki tudományokra szakosodott vertikális keresője, mely nemcsak az weblapokba, hanem az adatbázisok világába is eljut. 109
Vizuális keresők Nő a vizuális keresők jelentősége, bár elég nagy a fluktuáció e tekintetben. PL. a francia Ujiko kereső aratott nagy feltünést és elismerést, majd „zárta be kapuit”. Mint azt már tantárgyunk első félévében is láthattuk, a vizualitás alapvetően fontos mind a fogalmi szinten (elmetérképek, gondolati térképek, tématérképek, szemantikai háló),valamint az információkerés szintjén. A melléklet a Liveplasma vizuális keresőt mutatja be. Pajor Enikő tanulmányát követve110
27. kép
Kép: Liveplasma vizuális kereső
107
MetaCrawler URL: http://www.metacrawler.com Dogpile. URL: http://www.dogpile.com 109 HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web 110 PAJOR Enikő: Tématérkép (topic map) alkalmazások az interneten = Könyvtári Figyelő, 51. évf. 2005. 4.sz. URL: http://www.ki.oszk.hu/kf/kfarchiv/2005/4/pajor.html 108
139
INFORMÁCIÓKERESŐ NYELVEK III.
Természetes nyelvű keresés Fontos megközelítést jelent a természetes nyelvű keresés. Az Ask.com111 – korábbi nevén: Ask Jeeves – oldalán a szabad szavas keresés mellett kérdő mondatokat is beírhatunk, és azután a rendszer további opciókat kínál a találatok pontosításához. E körbe tartozik az Answers.com112, ahol szintén lehet angol mondatokkal keresni, de a szótárak és lexikonok szócikkei mellett az internetező közönség által összeállított, kétes minőségű WikiAnswers oldalai is megjelennek a találatok közt.
Speciális célú keresők A speciális célú keresők magukban foglalják a hírkeresőket, a képkeresőket, videokeresőket, blogkeresőket stb. A világháló jelentősen megváltoztatta a modell elemeinek egymáshoz való viszonyt: az interneten bárki létrehozhat, terjeszthet, közvetíthet információt, és az egyes emberek ugyanazon a felületen felváltva játszhatják az információlétrehozói, felhasználói szereket. A blogkeresők példája mutatja, hogy számos ilyen kereső Példák: Blogsearch113, a Miner114, a blogkatalógus.net115, a Google blogkereső.116 A Miner magyar blogkereső, vertikális kereséseket és ezeket középpontba helyező webkeresést kínál, kiegészítve tartalom-aggregációs megoldásokkal különböző témakörökben. Az általános webkeresőkhöz képest egy-egy adott típusú tartalomban mélyebb kereséseket képes kínálni, és jellemzően az adott tartalmak jóval gyorsabban is jelennek meg rajta. Blog, videó kereső, twitter, fotókereső egyaránt van rajta.
Mélyweb keresők Az internetes keresőket úgy fejlesztették ki, hogy képesek legyenek a hipertext szerkezetű dokumentumok megtalálására. A fejlődéssel azonban mindenféle fájlformátum felkerült az internetre. Sem ezeket, sem a dinamikusan generált lapokat a keresők nem ismerték fel. Ezért ez lett a web láthatatlan része. Ezek megtalálásához ad segítséget a mélyweb elnevezésű startlap.117 Szerk. Pajor Enikő. A sekély web, szürke web és a mély web jellemzését ld. még Herendy Csilla tanulmányában.118
9.4 ÖSSZEFOGLALÁS A leckében megismerkedett az automatikus feltárás iránti igényekkel, az automatikus indexelés alapjaival, megközelítéseivel, irányaival, és a morfológiai vizsgálat elemeivel. Ezt követően a 2. részben az internetes keresőrendszer alapjaival, a keresőrendszer felépítésével, illetve működésével, a 3. részben a feltárás stratégiájával, intellektuális eszkö111
Ask.com URL: htpp://www.ask.com Answers.com URL: http://www.answers.com 113 Blogsearch URL: Bhttp://www.blogsearch.hu/ 114 Miner URL: http://www.miner.hu 115 Blogkatalógus.net URL: http://www.blogkatalogus.net/ 116 Google blogkereső URL: http://blogsearch.google.hu/ 117 Mélyweb.lap.hu URL: http://www.melyweb.lap.hu 118 HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web 112
140
INFORMÁCIÓKERESŐ NYELVEK III.
zeivel, a rendszer működésével, a 4. részben pedig az internetes keresők használatának, keresésének és támogatásának kérdéseivel foglalkoztunk. Az 5. részben a hagyományos internetes keresőrendszerek értékelése következett, az értékelés tényezőinek meghatározása, valamint a problémák felvetése, illetve a megoldásai irányok felvázolása. A 6. részben az új fejleményeket vázoltuk fel, köztük a metakeresőket, a természetes nyelvű keresőket, a blogkeresőket és a mélyweb keresőket. A leckét a jövőbeni lehetőségek taglalásával fejeztük be.
9.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.
Fejtse ki mit ért az automatikus indexelés fogalma alatt! Tisztázza az automatikus irányzat megközelítéseit! Tisztázza a morfológiai vizsgálat elemeit! Fejtse ki az internetes keresőrendszer fogalmát és fő ismérveit! Elemezze az internetes keresőrendszer felépítését és működését! Magyarázza el a metaadatok szerepét az internetes keresés előmozdításában! Értékelje a teljesség és pontosság szempontjából a keresőrendszereket! Vázolja fel, melyek a keresőrendszerek fő problémái! Sorolja fel és elemezze az új fejleményeket! Véleménye szerint a mélyweb milyen szerepet játszik napjainkban?
141
INFORMÁCIÓKERESŐ NYELVEK III.
10.
INTERNETKATALÓGUSOK
10.1 CÉLKITŰZÉS A lecke tanulmányozása alapján legyen képes − az internetkatalógusok fogalmának kifejtésére, − a szolgáltatók, típusok, dokumentumbázis és felhasználók fő jellemzőinek bemutatására, − az internetkatalógusok feltárási stratégiának, célrendszerének elemzésére, − az intellektuális és technikai eszközök fontosságának értelmezésére − az internetkatalógusban való keresés jellemzőinek kifejtésére, − a használatot segítő tájékoztatás, támogatás eszközeinek, módszereinek bemutatására, − a megjelenítési, letöltési stb. igények, lehetőségek bemutatására, − az internetkatalógusok értékelésére, − a fejlesztések irányainak követésére. 10.2 TARTALOM 1 Az internetkatalógus fogalma, fejlődése − Az internetkatalógus fogalma − Fejlődéstörténete 2. Szolgáltatók, dokumentumbázis, felhasználók − Szolgáltatók − A feltárás dokumentumbázisa − Felhasználók 3. Stratégia, intellektuális és technikai eszközök, munkafolyamatok − Stratégia − Intellektuális eszközök − Technikai eszközök − Munkafolyamatok 4. Használat, keresés, böngészés, támogatás − Használat, keresés és böngészés − Tájékoztatás, támogatás, hozzáférés 5. Általános és tematikus internetkatalógus példák − Tudományos célú katalógusok − Tematikus katalógusok − Praktikus célú általános katalógusok
142
INFORMÁCIÓKERESŐ NYELVEK III.
6. Értékelés, fejlesztés − Teljesség és pontosság − Fejlesztés − Webkalauzok, portálok, linkgyűjtemények
10.3 A TANANYAG KIFEJTÉSE 10.3.1 Az internetkatalógus fogalma, fejlődése
Az internetkatalógus fogalma Az internetkatalógusok olyan internetes keresőszolgáltatások, melyek többnyire, vagy nagymértékben intellektuálisan módon dolgozzák fel az adatbázisaikba felvett internetes dokumentumokat. Adatbázisaik többnyire ezeket az intellektuálisan feldolgozott digitális dokumentumok rekordjait tartalmazzák, valamint kapcsolatokat más adatbázisokhoz. E katalógusok lehetnek általános internetkatalógusok, melyek átfogó témaköröket fednek le, illetve tematikus katalógusok, szakterületekre specializálódott gyűjtőkörű katalógusok. Mind a két típus esetében minőségbiztosítási szempontokat alkalmaznak a kiválasztásban és feldolgozásban, részletes tartalmi és formai leírást készítenek, többek között annotációt, összefoglalásokat, és a munkákat a szakterület szakértőivel végeztetik el. Gyakran hagyományos, bevált és tudományos igénnyel készült osztályozási rendszereket használnak. Az általános, illetve tematikus katalógusok egy része a fentiektől eltérően mindennapi gyakorlati igényeket szolgál ki, és tudományos igényű osztályozási rendszer helyett a felhasználók feltételezett/felmért igényeit követő gyakorlati célú kategóriarendszer szerint építkezik, és „házi készítésű” (home grown) kategóriarendszert használ (pl. HuDir, Google Directory stb.) Különösen vonatkozik ez a kereskedelmi célú általános katalógusokra.
Fejlődéstörténete Az automatikus indexelő szolgáltatások fontos szerepet vállaltak az internetes dokumentumok individualizáló feltárásában, kereshetővé tételében. Ugyanakkor a logikus, hierarchikus, rendszerező áttekintésére, a tudás fogalmi szintű reprezentációjára nem tudtak elfogadható megoldásokat kínálni. Ezért már az 1990-es évek második felében kifejlődött az igény az olyan szolgáltatások iránt is, melyek intellektuális módon készülnek, rendszerezik, megszűrik, szelektálják az információkat minőségi és egyéb kritériumok szerint. Ily módon lehetővé teszik, hogy az internetes forrásokban tükrözött emberi tudást a felhasználók összességében, összefüggéseiben és logikusan tekinthessék át. Ez az igény hozta létre mind az általános internetkatalógusokat, a tematikus katalógusokat, mind pedig a specifikus célú webkalauzokat és strukturált linkgyűjteményeket. A fenti elvárásoknak abban az időszakban nem lehetett dominánsan automatikus eszközökkel megfelelni, ahogy ma sem, ezért fontos az emberi értelem, intelligencia, az intellektuális osztályozás, rendszerezés igénybevétele is. (bár napjainkban az automatikus eszközök arányát sikerül fokról fokra növelni). 143
INFORMÁCIÓKERESŐ NYELVEK III.
10.3.2 Szolgáltatók, dokumentumbázis, felhasználók
Előállítók és szolgáltatók A szolgáltatások a feltárt dokumentumbázis, annak tematikus megoszlása szerint szerveződnek, általános, illetve szakterületi vagy tematikus katalógusok előállítására, illetve szolgáltatására. A két típus kiegészíti egymást, mindkettő sajátos és fontos szerepet tölt be. Az általános internetkatalógusok az emberi tudás egészét fogják át, osztják főosztályokra, majd bontják osztályokra, alosztályokra, míg a hierarchia alján az egyedi információk találhatók. A szolgáltatók a földrajzi lefedés szerint: nemzetközi, országos, illetve helyi szolgáltatók. Az előállítás, illetve szolgáltatás esetében két alternatíva lehetséges (1) teljes mértékben egy szakmai szerkesztő testület vállalja magára az internetes dokumentumok gyűjtését, feldolgozását és szolgáltatását, vagy pedig (2) ebbe a munkába önkénteseket is bevonnak, akik tevékenyen részt vesznek a rendszer építésében, fejlesztésében. A legtöbb internetkatalógus az első kategóriába tartozik napjainkig, de a web 2.0 terjedésével az önkéntes szakmai hozzájárulások szerepe nő. Van olyan rendszer, az Open Directory Project, mely eleve az tömeges önkéntes munka igénybevételére épít. (ld. bővebben a 10.3.4. munkafolyamatok kifejtésénél.). Az internetes katalógusok körében nagy a fluktuáció, mivel nagy a szellemi munkaigény.
Dokumentumbázis Meghatározott célok és elvek szerint válogatott. Lehetnek általános dokumentumbázisokra, illetve speciális dokumentumbázisokra alapozottak. A felhasználói igénytípusokat tükröző szerkezetben átfogják a világhálón megjelenő dokumentumok, szolgáltatások legkülönfélébb tartalmi, formai és egyéb szempont szerinti csoportjait, kategóriát, a tudományos, képzési, kereskedelmi, szórakozási stb. dokumentumokat. Az elsődleges, másodlagos, stb. források mellett kereshetők benne a közvetlen tájékoztatást nyújtó online adattárak, lexikonok, szótárak stb. Az adatbázis frissitése a garanciája annak, hogy a feltárt, felvett anyag létezik.
Felhasználók Az internethasználók meghatározott körei a nagy teljességet biztosító internetes keresők nyújtotta szolgáltatások mellett, igénylik a nagyobb pontosságot is. Az internetes katalógusok ehhez szolgáltatnak jól használható keresőeszközt (általános, szakterületi, nyelvhez, kultúrához kötődve). A nagyobb pontosság azt is jelenti, hogy a bázis szűkebb, mint az internetes keresők esetében, mivel a weben tárolt dokumentumok között minőségi szelekciót végeznek. A felhasználók igénylik, hogy a találatok minél megbízhatóbbak, pontosabbak legyenek. Sajátos motivációt jelent az is a használatra, ha nem teljesen biztosak abban, hogy konkrétan hogyan fogalmazzák meg a keresőkérdésüket, és szívesebben böngésznek egy előre elkészített hierarchikus, vagy kategóriarendszerben. Vannak, akik nem veszik igénybe az általános internetkatalógusokat. Húzódozásuk motívumai: a katalógus szerkezetét külön meg kell ismerni, vannak témakörök, melyek nehezen katalogizálhatók, a teljesen új dokumentumok (az intellektuális feltárás miatt) nem 144
INFORMÁCIÓKERESŐ NYELVEK III.
biztos, hogy megjelennek benne. Számukra fontos alternatívát a speciális, adott szűk területekre koncentráló tematikus katalógusok. 10.3.3 Stratégia, intellektuális és technikai eszközök, munkafolyamatok
Stratégia Az internetkatalógusok célja, hogy az internethasználók meghatározott körének adjanak jól használható keresőeszközt (pl. valamely nyelvhez, kultúrához kötődve keresnek megbízható, minőségi tartalmú helyeket. Építésük stratégiája arra irányul, hogy az általános és szabadszavas keresést biztosító internetes keresők alternatívájaként az emberi közreműködéssel készülő válogatásra, feldolgozásra építve minőségi szolgáltatásokat nyújtsanak. Feltételezik, hogy a szakértők által összegyűjtött, feldolgozott, keresőtechnikai eszközökkel böngészhetővé és kereshetővé tett minőségi információforrások segítségével a felhasználók relevánsabb találatokhoz juthatnak. Horváth Tibor szerint az interneten egyre hatékonyabban számba vett (ellenőrzött) emberi tudásnak (1) meg kell adni a szerkezetét, mely e tudást összefüggő egészként mutatja meg (2) meghatározott ismérvekkel, tartalmi jegyekkel (logontartalommal), a részeket el kell tudni helyezni ebben a struktúrában akkor is, ha illesztésük némi ficamokkal is jár. (HORVÁTH, 2002)119
Intellektuális eszközök Az általános internetkatalógusok egy része osztályozási rendszereket használ az egyes hierarchiaszinteken való böngészés segítésére. Számos internetkatalógus használ világszerte elismert, bevált osztályozási rendszert, pl. a Cyberstacks a Kongresszusi Könyvtár osztályozási rendszerét (Library of Congress Classification), a bubl (bubl.ac.uk) a Dewey Tizedes Osztályozást (DDC, Dewey Decimal Classification). Korábban több rendszer kezdte el működését az Egyetemes Tizedes Osztályozással, de időközben vagy megszűntek vagy más rendszerrel váltottak. Az általános, főleg üzleti-kereskedelmi célból szerveződött internetkatalógusok a felhasználók mindennapi igényeit tükrözve, gyakorlatias kategóriákat alakítottak ki (melyekben szépségápolástól, a főzésig, a sportig, hobbikig minden, a nagyközönség érdeklődésére számot tartó témakör helyet kapott). Ezekben, polihierarchikus elemek is helyet kaptak egyes osztályozási fogalmak több helyütt, más főosztályok alá is beépülhettek. A „házi készítésű” kalauzokkal szemben a nemzetközileg elfogadott osztályozó rendszerek jelentős előnye a szabványosság, egységesség, az egységes alkalmazás. A böngészés mellett a rendszerek nagy része egyedi fogalmak keresését is lehetővé teszi a saját rendszerben.
Technikai eszközök Sajátos megoldások is kialakultak, pl. a katalógusok és az indexelő-szolgáltatások egy szolgáltatási keretbe szerveződésével (ilyen úttörő szerepet vállalt pl. az AltaVizsla). A
119
HORVÁTH Tibor: id. mű, 2002.
145
INFORMÁCIÓKERESŐ NYELVEK III.
keresőszót megadva egyrészt megjelennek az indexelő-szolgáltatás segítségével nyert találatok, másrészt a rendszer fölkínálja a releváns osztályokat is. Fontos, hogy az „automatikus” és az „intelligens” egy rendszerbe integrálódjon, így megvalósítható legyen az osztályozási rendszer automatikus konvertálása is.
Munkafolyamatok Intellektuális munkával végzik a tárgyi feltárást, ami a rohamosan növekedő Web tartalom mellett egyre nehezebb feladat. Lehetőséget teremtenek a tartalom szerinti szűrésre, azaz elvárható tőlük a relevánsabb tartalom egy adott témához. Kiemelten fontos a katalógusépítés és szerkesztés folyamatossága, a következetesség, az ehhez szükséges intellektuális, és technikai segédeszközök felhasználása. A rendszer adatbázisát könyvtári és más szakemberek építik, a digitális források gondos válogatásával, rendszerezésével, és sokféle szempont szerinti visszakereshetővé tételével. A szerkesztést, a szükséges feltáró munkát (osztályozás, tartalmi kivonatok megfogalmazása) könyvtári és más szakemberek végzik szerkesztőségeikben. Ugyanakkor a weblapok fenntartói maguk is kérhetik weblapjaik fölvételét a katalógusba. Ők maguk igényelhetik, határozhatják meg a weblap besorolását és ők szövegezhetik meg a rövid tartalmi kivonatot. A különböző kategóriákba érkező kéréseket a szerkesztők elbírálják, és ezt követően regisztrálják a megadott weblapokat. Az új dokumentumok gyorsan, egy-két héten belül beépülnek a rendszerbe (nyílt katalógus). Az aktualizálás kevésbé folyamatos, mint az automatikus indexelésnél. A webhelyek fenntartói, szerkesztői mellett fontos lehet az önkéntes bedolgozók szerepe is. Ez valósul meg az Open Directory Project keretében, azon belül is az egyes nyelvi változatok építésében. Az önkéntesekkel szemben elvárás, hogy a megadott feldolgozási szempontrendszert kövessék. 10.3.4 Használat, keresés, böngészés, támogatás
Használat, keresés és böngészés Az általános rendszerek angol nyelvűek, de nő a nemzeti nyelvű rendszerek száma is, gyakran az angol nyelvű globális rendszerek részhalmazaként. Az internetkatalógusok két irányban fejlődnek (1) az általános, átfogó internetkatalógusok, (2) illetve a tematikus katalógusok kidolgozásával és fejlesztésével. Az internetkatalógusok használatának legegyszerűbb módja az osztályozási rendszerben való böngészés. A böngészés főleg a kevésbé tapasztalt, vagy a szakterületet, annak szerkezetét, terminológiáját kevésbé ismerő felhasználót segíti. Belépéskor megjelenik a főosztályok – általános fogalomcsoportok sora (általában 15– 20 között). A keresett kérdést tehát a katalógus osztályaival (vagy kategóriáival) írjuk le, és ezek mentén végighaladva találjuk meg a szükséges specifikus fogalmakat (pl. sport – futball - világbajnokság – Dél-Afrika 2010 Ezekből választhatunk és léphetünk tovább a szűkebb jelentésű fogalmak (osztályok majd alosztályok) lapjaira, majd megjelenik az adott fogalomhoz tartozó katalógustételek listája. A kívánt tételre kattintva megjelenik maga a katalógustétel, az internetkatalógusra jellemző szerkezetben, klikkelhető formában, és már el is jutunk a kívánt dokumentumhoz. 146
INFORMÁCIÓKERESŐ NYELVEK III.
A szisztematikus böngészés mellett lehetőség van az indextípusú keresésre is. A böngészés mellett természetesen arra is lehetőség van, ha a témát a felhasználó konkrétan ismeri, a kereső rovatba beírja, és pillanatok alatt megkapja a vonatkozó találatokat a rendszeren belül. A lekérdezés és szörfölés támogatása – a szisztematikus böngészés az indexek alapján végzett lekérdezés összekapcsolása egy összefüggő navigációs térben. Tetszés szerinti belépési pontokból kiindulva felváltva végezhetők szisztematikus böngésző- és szabad lekérdező műveletek, lapozni lehet az osztályozási struktúrában, deszkriptorokkal és kulcsszavakkal lekérdezés végezhető és szörfölve véletlenszerűen továbblapozhatunk a talált dokumentumok környezetében120 A böngészés csak a katalógus tartalmára korlátozódik. Az ugyanazon a felületen található kereső is gyakran a katalógus tartalmára korlátozódik.
Tájékoztatás, támogatás, hozzáférés 12. A használat támogatásának fő jellemzői
keresési tényező Grafikus felhasználói felület Elérhetőség, elérési alternatívák Hozzáférhetőség Elrendezés módja Keresési technikák Keresési módszerek, segédeszközök Találatok megjelenítése Súgó és keresőprogram Aktualizálás, frissítés Kiegészítő szolgáltatások
értékelés Kényelmes, könnyen kezelhető Igény szerint globálistól a helyiig bármely dokumentum elérését. Ugyanazon a felületen gyakran automatikus indexelő szolgáltatás is igénybe vehető, pl. Google Bármikor Osztályozási rendszer (vagy kategóriarendszer) hieararchiaszintjei szerint Hierarchiaszentek közötti böngészéssel, dokumentumba való betekintés, újra böngészés stb. Kombinált alkalmazás az automatikus indexeléssel Böngészés. egyes szavak, kifejezések keresése Tezaurusz használata Strukturáltabb, részletesebb, mint az automatikus indexelnél Differenciált felületekkel segíti a kezdő és a tapasztalt felhasználókat Az új dokumentumok gyorsan, egy-két héten belül beépülnek a rendszerbe (nyílt katalógus) Egyéb hasznos kiegészítő szolgáltatások jelennek meg (ajánló jegyzékek, külső csatolók, fórum, visszajelzés)
A lényeg, hogy a felhasználó számára a teljes tájékozódási spektrum rendelkezésre áll: böngészhet, adott szakrend szerint navigálhat, vagy kereshet is a kereső tételei között.
120
UNGVÁRY Rudolf, ORBÁN Éva: 2001. 2. kötet. 483–484. p.
147
INFORMÁCIÓKERESŐ NYELVEK III.
Számos esetben az internetkatalógus a keresőrendszerrel egy szolgáltatási rendszerben együttesen fordul elő. Így mind a mellérendelő, mind a hierarchikus feltárás lehetőségeit igénybe veheti a felhasználó, pl. a Google esetében. A találatok megjelenítése strukturáltabb, részletesebb, mint az automatikus indexelés esetében. A böngészés során a relevánsnak bizonyuló találatok alapján a felhasználó közvetlenül eljuthat a megfelelő, igényelt internetes dokumentumhoz. 10.3.5 Általános és tematikus internetkatalógus példák
Tudományos célú katalógusok A tudományos igényű katalógusok között kiemelkedik a brit Intute121 (www.intute.ac.uk) adatbázisa, ami már több mint 100 ezer, oktatási, illetve tudományos jellegű forrást tartalmaz – jellemzően kormányhivatalok, kutatóintézetek és szervezetek honlapjait. A keresés leszűkíthető nagyobb témákra, mint művészetek és humán területek, egészségügy és élettudományok, mérnöktudományok és technika, valamint társadalomtudományok. Az Intute 2006-ban jött létre az RDN (Resource Discovery Network) nyolc félig-autonóm egységéből, melyek a felsőoktatás, kutatás különféle tematikus területeit szolgálták ki. Az Intute-ot napjainkban a Mimas, a Manchesteri Egyetem rendszere tatja fent.122 Egy nagyon fontos és érdekes oldal az önmagát „tematikus indítóállvány”-ként definiáló Pinakes.123 Az Alexandriai Könyvtár katalógusáról elnevezett oldal nem tartalmaz saját keresőt, hanem csak ugrópontokat a legfontosabb tematikus webkatalógusokhoz, olyan változatos témákban, például a jog, az építészet, az űrhajózás, a történelem, a zene, a várostervezés. Ha angol nyelvű tematikus internetkatalógusra vagyunk kíváncsiak, akkor a directory, vagy web directory kifejezést kell használnunk a téma megnevezése után. Mivel számos tematikus katalógust hoztak létre, nagy valószínűséggel megjelennek találatként. Fontos szerepet játszik angol nyelvű minőségi források feltérképezésében a Dulcineas guide to searching on the web.124 Mely kifejezetten kalauzokat tesz elérhetővé, pl. a technológiai területén. Kínai, orosz és spanyol verziója is van. Az Infomine125 Számos könyvtár vesz részt a szerkesztésében, jó forrást jelent az egyetemi szintű kutatásokhoz, tanulmányokhoz. Adatbázisokhoz, elektronikus folyóiratokhoz, kutatási kalauzokhoz nyújt hozzáférést Az Academic Info126 több, mint 25,000 tudományos szintű forrást, tartalmaz, többek között annotált szakterületi kalauzokat, s a felsőoktatási szféra, könyvtárak, múzeumok digitális gyűjteményeit További hasznos internetkatalógusok : Librarians’s Index 127 Yahoo!128 121
Intute URL: http://www.intute.ac.uk Mimas URL: http://mimas.ac.uk/portfolio/current/ 123 Pinakés URL: www.hw.ac.uk/libwww/irn/pinakes/pinakes.html 124 Dulcinea Guide to Searching on the Net. URL: 122
http://www.findingdulcinea.com/guides/Technology/Internet/Dulcineas-Guide-to-Searching-onthe-Web.html 125 Infomine URL: http://www.infomine.ucr.edu 126 Academic Info http://www.academicinfo.net
148
INFORMÁCIÓKERESŐ NYELVEK III.
Tematikus katalógusok Educator’s Reference Desk129 – mely teljes egészében az oktatással foglalkozik, annak minden szeletét átfogja. Az Information Institute of Syracuse gondozza, mind a tanárokat, mind a szülőket bőséges és hasznos információkkal és forrással látja el. Egy másik példával azt kívánjuk jelezni, hogy specifikus web-kalauzok is készülhetnek szűkebb témákból is, Ebben a kalauzba mindent meg lehet találni, ami egy sikeres fagyiüzlethez szükséges.130 A magyar nyelvű tudományos ismeretterjesztő katalógus példája is ide kívánkozik : Válas György tematikus internet-katalógusa. 131
Praktikus célú általános katalógusok A magyar példák közül átfogó praktikus célú katalógusok közül elsőként a HuDirt, a magyar weblapok katalógusát kell megemlíteni, Hungary Network szolgáltatásaként. Szerkezetére a tételek katalogizált, témák szerint osztályozott rendszere lett jellemző. Kulcsszavas keresésre, böngészésre egyaránt használható. Abból a szempontból is érdemes megemlíteni, hogy a HuDir már kb. 6 héttel a Yahoo! szárnybontása után megindult, 1995. júniusában! 15 évvel a rendszer létrejötte után elmondhatjuk, hogy az ma is létezik, a linkek nagy része él, de bőven vannak halott linkek is. http://www.hudir.hu A Google-nak – kulcsszavas keresőrendszere mellett – többek között van egy internetkatalógusa (Google directory), mely szintén kategória-szintek szerint osztja be anyagát. A fő kategóriák 3-4 hierarchiaszintre bomlanak. A munka sajátossága, a nyelvi változatai önkéntes bedolgozókkal készülnek, akik egy megadott feldolgozási szempontrendszert követnek. Az Open Directory Project, the ODP internetkatalógusának kezdőoldala. Az osztályozási rendszer legfelső szintje osztályainak száma 16, ezek teljesen megegyeznek a Google internetkatalóguséval, betűrendben követik egymást, balról jobbra, alattuk az osztályon belüli alosztályok közül három kiemelt szerepel. A felső csíkban az „about dmoz”alatt többet tudhatunk meg a katalógusról, az „add URL” arra biztat, hogy adjuk meg a internetcímünket , a „help”-re kattintva a katalógushasználatban kapunk segítséget. A „link „ segítségével hasznos csatolókat kapunk „az editor login” az önkéntes szerkesztők számára való belépést jelenti. Az osztályok felett, az indexelő-szolgáltatásoknál megszokott „search” mező található, melyben megadható a keresőszó, melynek alapján a rendszer a megfelelő speciális osztályt jeleníti majd meg, ha a „search” parancsot megadják. A képen alul a különféle nyelvű változatok választhatók ki. Az Open Directory Project, the ODP internetkatalógusának kezdőoldala. - http://dmoz.org 127 128
Librarians’s Index URL: http://www.lii.org Yahoo! URL :http://www.yahoo.com
129
Educator’s Reference Desk URL: http://www.eduref.org/ Ice CreamProfits.com URL: IceCreamProfits.com 131 Válas György tematikus internet-katalógusa. URL: http://freeweb.interware.hu/valas/Valas/katalog/katalog.htm 130
149
INFORMÁCIÓKERESŐ NYELVEK III.
28. kép
Open Directory Project katalógus
Az önkéntes együttműködésre épülő DMOZ katalógust az AltaVista és a Google keresőrendszer magába integrálta. A jelszó: „Az emberek jobban csinálják.” Mára ez lett a világ legnagyobb és legjobb találati arányú webkatalógusa. A módszerrel további nemzeti katalógusok készülnek folyamatosan Az általános internetkatalógus működtetésének fontos alternatívája az önkéntesek tömegeinek együttműködése, az interneten alkalmazható katalógus-csereformátumra épülő nyílt rendszer. (Ez a modell érvényesül a magyar startlap tematikus linkgyűjteményszerkesztősében is.) A rendszer együttműködést tételez fel a szerkesztőségek és a közreműködők között. Az Open Directory Project-nek közel 60 ezer önkéntes szerkesztője van, a közel 4 millió weblap feltárására használt kategóriák száma meghaladja a 460 ezret. A nyílt katalógus az internetinformációk elérésére fejlesztett, emberi tevékenységgel épített tartalomjegyzék. Az ODP (Open Directory Project) a katalogizálandó szakterületek önként jelentkező szakértőiből építkezik. Az ODP-szoftver módszertannal és segédeszközökkel látja el a szerkesztőket. A fő témaköröket elismert főszerkesztők tartják kézben, ők választják ki az új szerkesztőket, szórják ki a nem megfelelő anyagokat.
Internetkatalógusok, linkgyűjtemények, webkalauzok virtuális könyvtárak A katalógusban böngészhető tételek, a linkgyűjteményekben megkapott linkek, illetve a webkalauzokban megkapott, részletesen ismertetett tételek alapján eljuthatunk az eredeti
150
INFORMÁCIÓKERESŐ NYELVEK III.
forráshoz, mely virtuálisan van összekötve a keresőrendszerrel. (Ezt természetesen a felhasználó nem feltétlenül érzékeli.). Elég gyakori, hogy ezen az alapon szimpla linkgyűjteményeket is ilyen meg ilyen szakterület virtuális könyvtárának neveznek, hiszen „betölti a funkciót, elvezet a forráshoz”. Természetesen ilyen esetben előfordulhatnak halott linkek, hiszen a források a katalógusszerkesztők hatáskörén kívül vannak. 10.3.6 Értékelés, fejlesztés
A teljesség és pontosság kérdése Mind az általános, mind pedig tematikus internetkatalógusok ugyanúgy közelítik meg ezt a kérdést. Arra törekszenek, hogy a találatok választ adjanak a keresőkérdésekre, minél nagyobb arányban relevánsak legyenek. Hogy a hivatkozott tételek megfeleljenek az adott használói elvárásnak, ízlésnek, csak úgy oldható meg, ha készítői, szerkesztői a pontosságra törekszenek (megtalált releváns találatok arányára jellemző mutató) P = releváns találatok száma( az összes találat % Ehhez természetesen minőségi szűrésre van szükség. Nem törekszenek tehát a nagy teljességre) a minél több releváns találat kihozatalára. Az e mutatóban való „villogást” meghagyják az indexelőszolgáltatásoknak. T = megtalált releváns dokumentumok száma ( az adatbázisban lévő összes releváns dokumentum %. A visszakereső rendszer hatékonyságát mutatja meg. Az internetkatalógus esetében sokkal kevesebb a találat, mint az indexelőszolgáltatásoknál, viszont sokkal kisebb a zaj. Az internetes katalógusok szabványos tárgyi metaadatokat használnak, esetükben kisebb a teljesség, ugyanakkor nagyobb a pontosság. (ilyen a Bubl.ac.uk, Infomine, a Google Directory stb.) Költség- és munkaigény – Tekintettel arra, hogy a feldolgozás (az intellektuális alapon történő elemzés, gyűjtés, indexelés, osztályozás stb.) időigénye, költségigénye tételekre lebontva nagyobb az automatikus indexénél. A továbbiakra vonatkozóan kérdés, hogy intellektuális, manuális munkával mennyire követhető a digitális dokumentumrobbanás? A jelek arra mutatnak, hogy helyet hagyva az emberi ítélőképességnek, egyre több intelligenciával ruházzák fel a gépeket.
Fejlesztés Az internetkatalógusok fejlesztése szempontjából az alábbiak a kulcskérdések: 1, a tömegek további önkéntes részvétele, sőt intenzívebb részvétele esélyt jelent a fejlesztésekhez, különösen az egyes nyelvi változatok fejlesztéseihez Vonatkozik ez különösen az Open Directory Project-re (http://dmoz.org) 2. Nagyobb mértékben építés az indexelőszolgáltatások által produkált „félkésztermékeire”. 3. Helyet hagyva az emberi ítélőképességnek, az intelligens munkafolyamatoknak, nagyobb szerepet kell kapniuk az automatizált elemeknek a sokrétű szolgáltatás érdekében. 151
INFORMÁCIÓKERESŐ NYELVEK III.
Az információkeresés ugyanis az interneten is a nagy számok problémája előtt áll. Vonatkozik ez különösen a dominánsan intellektuálisan építkező szolgáltatásokra. 3. A szolgáltatások diverzifikálása, web 2.0 elemekkel való frissítése, további vonzó elemekkel való kiegészítése.
Linkgyűjtemények, webkalauzok, portálok Az általános és tematikus internetkatalógusok mellett feltétlenül említést érdemelnek „kistestvéreik”: a linkgyűjtemények, webkalauzok, valamint ezekhez kapcsolódva a portálok. Linkgyűjtemények Általában egyszerű felépítésű, könnyen áttekinthető szerkezetben vezetnek el egy-egy szakterület, témakör forrásaihoz. Lényegüket tekintve az ajánló szakbibliográfiák folytatásainak tekinthetők. Használatuk könnyen elsajátítható és gyors. A forrásokat külön nem elemzik meghatározott szempontok szerint. Példa: Magyarország legnagyobb nyitólapja, a Startlap http://www.startlap.hu. Ebbe a kategóriába tartoznak a Weblink linkgyűjtemény, a linkmegosztók, a link exchange néven futó megoldások. Webkalauzok Weboldalak előre meghatározott listái, amelyeket emberek szerkesztenek (nem gépi úton készülnek), téma (tárgy) szerinti rendezettségűek és szelektívek. Minőségi kritériumok szerint válogatott forrásokat tartalmaznak, gyakran röviden szövegesen is ismertetve a felvett forrásokat. Portálok Főbejáratok egy-egy szakterület információforrásaihoz és szolgáltatásaihoz, számos más funkcióval kiegészítve. Ha a felkínált weblapokat hierarchikus rendszerbe szervezve kínálják, akkor vortálról (vertikális portálról) beszélnek. Példa: Jogi fórum szakmai és jogi információs portál (összetevői a linkgyűjtemény mellett friss hírek, információk, interjúk, publikációk, útmutatók, eseménynaptár, hírlevél, fórum, jogszabályok, ügyvédi szaknévsor stb. 10.4 ÖSSZEFOGLALÁS A lecke első részében internetkatalógus fogalmát és fejlődéstörténetét ismerte meg. A internetes dokumentumok feltárásának intellektuális megoldásaként jött létre, annak érdekében, hogy a tudatos gyűjtés, feldolgozás, és mélységben rugalmas hierarchikus böngészés révén nagyobb pontosságot nyújtson a felhasználóknak. A 2. részben megismerte, hogy a szolgáltatók általános vagy tematikus katalógusokra specializálódnak. A felhasználók egyaránt lehetnek igényes, minőségi forrásokra vágyók, illetve a keresésben, böngészésben nagyobb segítséget igénylők. Ezt követően a 3. részben részletesen megismerte a feltárás intellektuális és technikai eszközeit, A 4. részben megismerte a komplex munkafolyamat egyes részleteit, a gyűjtés, válogatás, feltárás, az annotálás, a hierarchiába való beosztás műveleteit. A 4 részben áttekintést nyert a használat módjairól, a böngészés és keresés kombinált alkalmazásának lehetőségéről. Mindezt a rendszer számos módon, az intellektuális mellett automatikusan is támogatja (keresőrendszer integrálásával.)
152
INFORMÁCIÓKERESŐ NYELVEK III.
A zárórészben e sajátos keresőrendszer előnyeivel, hátrányaival, fejlesztési teendőivel, illetve más kapcsolódó szolgáltatási formákkal ismerkedett meg.
10.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Fejtse ki az internetkatalógus fogalmát! 2. Indokolja meg az internetkatalógusok létrejöttének szükségességét! 3. Fejtse ki miben különböznek a hagyományos osztályozási rendszerek, il-
letve a kategóriák szerint építkező katalógusok! 4. Magyarázza el, mire irányul az internetkatalógusok feltárási stratégiája! 5. Fejtse ki az internetkatalógus készítésének munkafolyamatát! 6. Hozzon fel példaként és elemezzen röviden egy általános internetkata-
lógust! 7. Hozzon fel példaként és elemezzen egy tematikus katalógust! 8. Fejtse ki a böngészés és keresés kombinált alkalmazásának lehetőségeit! 9. Vonja meg a mérleget az internetkatalógusok alkalmazásával kapcsolat-
ban! 10. Milyen további megoldások vannak az internetes dokumentumok intel-
lektuális alapú gyűjtésére, rendszerezésére?
153
INFORMÁCIÓKERESŐ NYELVEK III.
11.
SZEMANTIKUS WEB SZOLGÁLTATÁSOK
11.1 CÉLKITŰZÉS A lecke tanulmányozása alapján legyen képes − a szemantikus web fogalmának, fejlődéstörténetének kifejtésére, − a szemantikus webtársadalom, szolgáltatók és felhasználók jellemzőinek bemutatására, − a szemantikus web stratégiájának, célrendszerének elemzésére, − a lépcsős modell és elemeinek értelmezésére, − a szemantikus web alkalmazások, keresési jellemzők kifejtésére, − a szemantikus web keresés támogatási kritériumainak bemutatására, − a szemantikus web szolgáltatások értékelésére − a fejlesztési irányainak és teendőinek kifejtésére. 11.2 TARTALOM 1 A szemantikus web víziója, fogalma, összefüggései − Problémafelvetés, a szemantikus web víziója − A szemantikus web fogalma − A webtársadalom és a webkonzorcium (W3C) − Felhasználók és szolgáltatók érdekközössége 2.A szemantikus web stratégiája, modellje, eszközei − Stratégia − A modell kidolgozása és megvalósítása − A szemantikus web lépcsős modellje − Ontológiák, taxonómiák, osztályozási rendszerek és tezauruszok 3. Alkalmazások és használat − A szemantikus kereső, mint álomkönyvtáros? − Az alkalmazások fejlődése − Tudományos és ismeretterjesztő alkalmazások 4. Szemantikus keresők − A szemantikus keresők megjelenése − A szemantikus keresők működésének támogatottsága − Szemantikus keresők és keresés jellemzői 5. A szemantikus web fejlődésének értékelése, a fejlesztés távlatai − Értékelés − Fejlesztések, könyvtárak a szemantikus web megvalósításáért
154
INFORMÁCIÓKERESŐ NYELVEK III.
11.3 A TANANYAG KIFEJTÉSE 11.3.1 Fogalma, fejlődése
Problémafelvetés, a szemantikus web víziója Az internetes keresők bemutatásánál világossá vált a web kaotikus, gyorsan változó, nehezen követhető, színvonalában egyenetlen jellege. Láthattuk, hogy a meglevő keresőrendszerek új és új megoldásokkal próbálkoznak ebben a hatalmas információhalmazban való tájékozódás segítésével, pl. nyelvi szinten (fordításokkal), az összefüggések bemutatásával (pl. vizuális formában is megjelenítve a találatokat), illetve speciális keresési eszközök rendelkezésére bocsátásával (Boole-algebra elemei, a keresés szűkítésének különféle módszereivel (nyelvre, dokumentumtípusra, kiadványformára, szintre stb.). Ugyanakkor a keresés továbbra sem a fogalmi kapcsolatok, hanem a nyelv, azon belül karakterek, jelek, szavak szintjén történik. Ezért a tudományos alkalmazásokhoz megkívánt pontosságot, megbízhatóságot e rendszerek nem tudják biztosítani. Ezt ismerte fel Tim Berners-Lee, aki az új évezred hajnalán, 2001. májusában egy új víziót vázolt fel a szemantikus web víziót, mely címlaptéma lett a Scientific American magazin 2001. májusi számában. A cikkben Tim Berners-Lee, a Word Wide Web Consortium (W3C) igazgatója megfogalmazta az ember-gép kapcsolat magasabb szintű szintézisét képviselő intelligens web vízióját, a fentebb részletezett problémák megoldására.
29. kép
Tim Berners-Lee a szemantikus web megálmodója
A szemantikus web fogalma A hivatkozott cikkben Tim Berners-Lee a következőképpen határozta meg a szemantikus web fogalmát (magyar fordításban): 132 „A szemantikus web egy adatokból álló háló, néhány tekintetben olyan, mint egy globális adatbázis. A webnek nem csak az ember és ember közötti kommunikációban kell hasznosnak lennie, hanem gépeknek is képesnek kell lennie a részvételre és a segítségnyújtásra”. 132
Calimera kötet. Útmutató. 3. kötet Háttértechnológiák. URL: http://www.ki.oszk.hu/old/calimera/3kotet/3kotethattertechnologiak.html
155
INFORMÁCIÓKERESŐ NYELVEK III.
Ahhoz, hogy ez a részvétel és segítségnyújtás megvalósulhasson, szükséges a weben fellelhető információk egységbe rendezése, egy olyan hálózat létrehozása, ahol az adatokat nemcsak az ember, hanem az automatizált eszközök is képesek egymással megosztani és feldolgozni. A szemantikus web víziójáról manapság már úgy szokás beszélni, mint az „értő” vagy „intelligens” webről, ahol az információk rendezettek, a keresés magától értetődően könynyű és precíz, ahol minden felhasználó egyszerűen és gyorsan megtalálja egészen pontosan azt az információt, amire szüksége van. Ideája tehát a „tökéletes keresés” és az „értő web”, amely elérése érdekében többen, többféle megoldást javasolnak, és a keresés tökéletesítésére is sokféle fejlesztés van folyamatban.133 A szemantikus web fejlesztése a webtársadalom hatékony közreműködésével a W3C révén egyre dinamikusabban megy végbe, és eredményei jól követhetők mind a globális angol nyelvű weblapon, mint pedig a Magyar Iroda weblapján134
A webtársadalom és a webkonzorcium (W3C) A webtársadalom azokat foglalja magában, akik „böngésznek vagy információkat helyeznek el a weben, akiknek a web jelenti a munkahelyüket, akik új termékeket és szolgáltatásokat fejlesztenek a weben, ezenkívül az internetszolgáltatók, valamint azok, akik elképzelésekkel rendelkeznek arról, hogyan fejlesszék tovább a webet. A webkonzorcium, hivatalos nevén World Wide Web Consortium (rövidítve W3C) az a semleges közeg, melyben a webtársadalomnak ezek a csoportjai megegyezésre juthatnak a szabványokat illetően. Ezeknek az erőknek a találkozása révén gazdagodik a W3C. 135 A W3C célja, hogy minél hatékonyabban járuljon hozzá a web hosszú távú fejlődéséhez, azáltal, hogy minél jobban kihasználja az internet (web) nyújtotta lehetőségeket szabványok és iránymutatások kidolgozása révén. A cél érdekében tett erőfeszítések mind a W3C „Egyetlen Web” víziójának megvalósítását hozzák közelebb. A web fejlődésére hatást gyakorló, kulcsfontosságú szervezetek legnagyobb része W3C-tag, s ezt be is építik marketingstratégiájukba. A webtársadalom tudatában összekapcsolódnak a W3C-tagok a régóta várt szabványokkal, s a tagok termékeik terjesztésekor elmondhatják, hogy azok a megfelelnek a W3C ajánlásainak.136 (Tim Berners-Lee, a W3C igazgatója) Felhasználók és szolgáltatók érdekközössége A webtársadalom a fentiek szerint egyaránt magában foglalja a felhasználókat (akik böngésznek vagy információkat helyeznek el a weben), és a szolgáltatókat (akiknek a web jelenti a munkahelyüket, akik új termékeket és szolgáltatásokat fejlesztenek a weben). E közösség együttműködésének egyik fontos közös tényezője és érdeke az, hogy a weben folyó tevékenységek új alapra helyeződjenek. 133
HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web 134 W3C Magyar iroda URL: http://www.w3c.hu/ 135 W3C Magyar Iroda. URL: http://www.w3c.hu/forditasok/w3cmission.html 136 W3C tagság: URL: http://www.w3c.hu/w3cmi/w3ctagsag.html
156
INFORMÁCIÓKERESŐ NYELVEK III.
Mint láthattuk, az internetes keresők – mai működésmódjukban - nem képesek kielégíteni kiszolgálni őket teljes mértékben, mivel nem képesek a szemantikus kapcsolatok értelmezésére, így az általuk a keresésekre adott válaszok relevanciája esetleges. Ugyanakkor a felhasználók tömegei igénylik, hogy ne csak találatokat kapjanak, hanem megfelelő dokumentumbázis alapján – problémáik megoldásához kapjanak válaszokat, ötleteket, javaslatokat.137 A szolgáltatóknak is érdeke, hogy megfeleljenek ezeknek a követelményeknek, hiszen a weben folyó versenyben csak úgy tudnak helytállni, ha megfelelnek a felhasználói elvárásoknak. A webnek a fentiek mellett egy másik fontos, meghatározó tényezője a web.2.0 szolgáltatásainak dinamikus fejlődése (közösségi oldalak, blogok, twitterek,tumblr-ek, linkmegosztók, stb.) Ezek a tevékenységek a felhasználók óriási tömegeit vonzzák, és az egymással való kommunikáció leghatékonyabb csatornáit nyitják meg. A két tényezőt összeköti az, hogy a két irány nem zárja ki egymást. Ahhoz, hogy a web2.0 működjön, elengedhetetlen a felhasználói aktivitás, amelynek a csatornái már kialakultak és hatékonyan működnek. A szemantikus web (sokan web3.0-nak nevezik) esetében is elengedhetetlen a tömegek részvétele, a felhasználói aktivitás. Nézzük meg, mik ennek a stratégiai alapjai és feltételei! 11.3.2 A szemantikus web stratégiája, modelljei, eszközei
Stratégia A stratégia abból indul ki, hogy a szemantikus web célja a weben fellelhető információk egységbe rendezése, olyan hálózat létrehozása, ahol az adatokat nemcsak az ember, hanem az automatizált eszközök is képesek egymással megosztani és feldolgozni. Ahhoz, hogy a gépeket be tudjuk vonni a munkába, egységes elvek szerint kell feltárni az adatokat, ábrázolni a szemantikus kapcsolatokat, adatbázisokban tárolni azokat, oly módon, hogy az intelligens gépek is értelmezni, feldolgozni, alkalmazni tudják azokat. A stratégia alapvető eleme a bevitt adatokat értelmezni tudó, „betanított” gép, mely a beépített algoritmusok alapján aktívan és közvetlenül segíti a felhasználót mindennapi gyakorlati vagy tudásszerzési problémája megoldásában. A weben fellelhető adatokat tehát oly módon kell leírni és egymáshoz kapcsolni, hogy a különböző információkat a gépek ne pusztán megjeleníteni, hanem automatizált módon kezelni, egységbe rendezni és különféle alkalmazások segítségével újra felhasználni is képesek legyenek. Első megközelítésben: a szemantikus web a weboldalakon található információkhoz leíró címkéket rendel hozzá, és oly módon kapcsolja össze őket, hogy a számítógép hatékonyabban találhassa meg a kívánt adatokat, újfajta asszociációs kapcsolatokat létesítve a különböző információk között. Mindennek eredményeképpen egy globálisan elérhető
137
HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web
157
INFORMÁCIÓKERESŐ NYELVEK III.
adatbázis jön létre. (Vámos Tibor: Gottdank Tibor: Szemantikus web. c. könyvének ismertetetőjéből.) 138
A modell kidolgozása és megvalósítása A stratégiát a webtársadalom szívós, közös munkájával évről évre haladva valósítja meg. A stratégia megvalósításának első lépése az volt, hogy kidolgozták az intelligens web soktényezős, soklépcsős elméleti-módszertani alapjait, „lépcsős modelljét”. Ezt követte a modell egyes szintjeinek részletes kidolgozása, a szakértők szabványajánlásokat fogalmaztak meg, ezeket lefordították a webtársadalom által használt nyelvekre. A modell egyes szintjeihez érvényes szabványok születtek, melyeket teszteltek és kipróbáltak. Ezt követték a további kutatások, az elfogadott szabványok szerinti kísérleti programok, projektek bevezetése az egyes országokban, így Magyarországon is, majd e programok lebonyolítását követően azok kiértékelése, a tapasztalatok, tanulságok megfogalmazása. Magyarországon eddig is számos intézmény vett részt e kutatási programokban, pl. a Magyar Tudományos Akadémia Számítástechnikai Kutatóintézete (MTA SZTAKI), de létezik pl. egy szegedi műhely is (MASZAKER). A kutatások, kísérleti programok révén a 2000-es évek második felében fokozatosan megjelentek a szemantikus web alkalmazások. A stratégia megvalósításának fontos összetevője – a fentiek mellett – a tudományos, szakmai eredmények terjesztése, a projekt-ismertetések. E körbe tartozik szakkönyvek, monográfiák, tanulmányok megjelentése, hogy a webtársadalom érintett felhasználói, szolgáltatói, tágabb értelemben a legszélesebb tömegek megismerkedjenek az új technológia alapjaival, működésével, szolgáltatásaival. Magyar vonatkozásban nagyhatású volt Gottdank Tibor fentebb hivatkozott, 2005-ben megjelent monográfiája, melyet újak is követtek. A Tudományos és Műszaki Tájékoztatásban a SZTAKI munkatársai már 2004-ben áttekintést adtak a szemantikus web modelljéről, összetevőiről, majd ugyanitt, illetve a Könyvtári Figyelőben is számos tanulmány jelent meg, mely a könyvtáros társadalom oldaláról vizsgálta a szemantikus web fogalmát, összetevőit, a bekapcsolódás lehetőségeit. (Horváth Zoltánné, Ungváry Rudolf, illetve Tóth Máté, aki e témakörben írta és védte meg 2010-ben PhD-dolgozatát. (későbbiekben műveikkel hivatkozunk rájuk.)
A szemantikus web lépcsős modellje A szemantikus web technológiai alkalmazását a lépcsős modell, és az ahhoz kapcsolódó szabványok (szabványcsomag) használata teszi lehetővé. Ezek elfogadott, magyarra is lefordított változatai, valamint minden további szükséges tájékoztatás, támogatás a W3C weblapjain, így a W3C Magyar Iroda weblapján férhető hozzá - beleértve a szabványok tesztelő alkalmazását, a projektekkel kapcsolatos információkat, eredményeket, az új kezdeményezések, szolgáltatások híreit.139 138
GOTTDANK Tibor: Szemantikus web: Bevezetés a tudásalapú Internet világába Budapest : ComputerBooks, 2005
139
W3C Magyar Iroda. URL: http://www.w3c.hu/
158
INFORMÁCIÓKERESŐ NYELVEK III.
Nézzük meg a lépcsős modell ábráját (ld. 30. képmelléklet), és értelmezzük az egyes szintek, összetevők szerepét!
30. kép
A szemantikus web lépcsős modellje
A szemantikus web lépcsős modelljének egyes szintjeit Fülöp Csaba, Kovács László, és Micsik Andrásnak a TMT-ben megjelent cikke alapján mutatjuk be.140 1. szint − Az első szinten a Unicode és URI ajánlások biztosítják az egységes nemzetközi karakterformátumot és az egységes címezhetőséget. A szemantikus weben belül az URI-k használata jóval túlmutat a megszokott weblapcímeken. − Egy személyt is azonosíthat, mondjuk az e-mail címét tartalmazó URI, vagy egy intézetet a weblapjának a címe. Tulajdonságokat, állításfajtákat is URI-k azonosítanak, így az az állítás, amely szerint Zöld Béla az MTA SZTAKI munkatársa, 3 URI segítségével oly módon fogalmazható meg, hogy az más állításokkal az URIk mentén összekapcsolhatóvá válik. − Ez a szint az egyedi adatok megragadását szolgálja. A szemantikus technológiák közös jellemzője, hogy identitásalapúak, azaz URI-k reprezentálnak valóságban is létező fogalmakat. 2. szint: − Az XML réteg biztosítja, hogy a szemantikus web definíciókat egyéb XML alapú szabványokkal integrálhassuk. − Az XML a névtér- és sémadefiníciókkal együtt lehetővé teszi, hogy egy XML dokumentum a létrehozásakor alkalmazott szintaktikai és szemantikus szabályokra hivatkozzon. Ezáltal egy önleíró, érvényesíthető dokumentumformátum jön létre. Az XML a weboldalakon leggyakrabban használt nyelv, a HTML is leírható XMLben, az így létrejövő XML alkalmazás az XHTML-nyelv, melyet sokan a HTML nyelv 5-ös verziójának tekintenek. 140
FÜLÖP Csaba – KOVÁCS László – MICSIK András: A metaadatsémák és a szemantikus web: egységesítés és specializáció a metaadatok világában Tudományos és Műszaki Tájékoztatás 51. évf. 2004. 7. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=3648&issue_id=452
159
INFORMÁCIÓKERESŐ NYELVEK III.
3. szint − Az RDF és RDFS réteg biztosítja, hogy állításokat tehessünk az objektumokról URI-k segítségével, és olyan szótárakat készítsünk, amelyekre ezen URI-k hivatkozhatnak. Az első RDF és RDFS specifikáció 1999-ben készült el, de végleges W3C-ajánlássá csak 2004 februárjában vált. − Az RDF nyelv (Recource Description Framework – Erőforrás-leíró Keretrendszer) segítségével tetszőleges webes tartalomhoz társíthatunk szabványos módon metainformációt, azaz jelentést. − Az RDF alkalmazása teszi lehetővé, hogy az átvitt, tárolt információ a felek számára egyértelmű legyen, az információ a gépek számára feldolgozható és érthető formában legyen tárolva, ha ez megvalósul, akkor a keresőrobot is érteni fogja bizonyos internetes erőforrások tartalmát. 4. szint − Az ontológiaréteg lehetőséget ad bonyolultabb szótárak felépítésére. Itt már a különböző fogalmak közötti összefüggések is megadhatók, hasonlóan egy tezauruszhoz. A szemantikai paradigma technológiáinak szintén közös jellemzője az, hogy ontológiákban írják le az alkalmazásokhoz a háttértudást. − Ennek jellemző technológiái az OWL (Web Ontology Language), az RDFS (RDF Schema), a RIF (Rule Interchange Format), a SKOS, valamint a tématérképek esetében a TMCL (Topic Maps Constraint Language). 5. szint − A logika szintje, az előtte való rétegre vonatkozó szabályok kidolgozottságát, koherens összefüggését jelenti. Fontos szerepet kapnak itt a metaadat-szabványok A legfelsőbb szintek − Két egymáshoz kapcsolódó összetevőt fog át: (proof) hitelesség, megbízhatóság, illetve (trust) bizalom, amely az alsóbb szintek megbízható, zavartalan, pontos működését tételezik fel. Ide tartozik a digitális aláírás réteg, mely a dokumentumok hitelességét igazolja. Miután 2004-ben megjelentették az RDF- és OWL ajánlásokat, a szemantikus web a kísérleti-kutatási fázisából kilépve viszonylag rövid idő alatt, egy széles körben elfogadott, kereskedelmi szinten is támogatott rendszerré vált. Megindultak a projektek, fejlesztések. Magyarországon a 2006. évi W3C Szemantikus Web Műhelykonferencián ízelítőt adtak a hazai fejlesztésekről a kutatóintézeti, egyetemi és ipari szférából, lehetőséget adva az ismerkedésre és „társkeresésre”.141 Számos érdekes előadás anyaga, prezentációja férhető hozzá a rendezvény információs anyagában.
141
W3C Szemantikus Web Műhelykonferencia. URL: http://www.w3c.hu/rendezvenyek/2006/szemweb/
160
INFORMÁCIÓKERESŐ NYELVEK III.
Ontológiák, taxonómiák, osztályozási rendszerek és tezauruszok Ontológia Az ontológia fogalmára számos meghatározás van. Vegyük azt, amely a hivatalos W3C fordításban szerepel.142 Az ontológia azokat a kifejezéseket definiálja, amelyek egy tudásterület leírására és ábrázolására alkalmasak. Az ontológiákat olyan emberek, adatbázisok és alkalmazások használják, akiknek/amelyeknek egy bizonyos tudásterületen együtt kell működniük (ilyen lehet egy szűkebb tudományos, gazdasági vagy kulturális terület, mint például az orvostudomány, a szerszámgépgyártás, az ingatlangazdálkodás, a pénzügyi igazgatás stb.). Az ontológiák a tudásterület alapfogalmainak, valamint ezek összefüggéseinek géppel értelmezhető definícióit tartalmazzák (a „definíció” kifejezést a szónak nem a technikai értelmében használjuk, ahogy a logika szakemberei értik). Az ontológiák lekódolják egy-egy terület tudásanyagát, sőt azokat a tudás-elemeket is, amelyek átívelnek ezek között, hogy ezáltal többszörösen felhasználhatóvá tegyék az ismereteket. Az „ontológia” szót különböző strukturáltsági fokú alkotások megnevezésére használjuk. Ezek az egyszerű taxonómiáktól kezdve (mint pl. a Yahoo hierarchia), a metaadatsémákon keresztül (mint a Dublin Core), egészen a logikai elméletekig terjedhetnek. A szemantikus web komoly strukturáltsági fokú ontológiákat igényel. Ezeknek specifikálniuk kell az alábbiakat: − az osztályokat (általános fogalmakat) sokféle tématerületen, − a dolgok közötti releváns viszonyokat, − azokat a tulajdonságokat, amelyekkel ezek a dolgok rendelkezhetnek. Összefoglalva, az ontológia arra szolgál, hogy szigorú fogalmi rendszer alapján megkísérelje az adott doménhez rendelt fogalmakat egy hierarchikus adatstruktúrában definiálni úgy, hogy az tartalmazzon minden releváns entitást, kapcsolataikkal és szerepeikkel együtt. Taxonómia A taxonómia szintetikus szemlélet alapján kialakított információkereső nyelv, − amelynek készítésekor egy meghatározott felhasználói környezet által használt és elfogadott fogalomrendszert építenek ki kapcsolatainak feltárásával együtt, − ezekhez a fogalmakhoz rendezik az információforrásokat, dokumentumokat, karaktersorozatokat (adatokat) vagy ugrópontokat, amelyek természetesen dokumentumhoz is, és közvetlenül információkhoz is vezethetnek, − A taxonómia ily módon webes környezetben biztosítja az információforrások, illetve dokumentumok csoportba rendezését hasonlóságaik alapján a tartalomfeltárás céljára;
142
OWL Web Ontology Language – Use cases and requirements. Az OWL Web Ontológia Nyelv – Alkalmazási esetek és követelmények. Ford. Pataki Ernő. URL:
http://www.w3c.hu/forditasok/OWL/REC-webont-req-20040210.html
161
INFORMÁCIÓKERESŐ NYELVEK III.
−
szisztematikus és szintetikus osztályozási eszközként a tudás-, illetve ismeretreprezentáció céljából, hierarchikus struktúrában tartalmazza a fogalmakat, és terminusai a tudásmegosztás nézőpontjából fejlesztik az adott közös nyelvet.143 Egyes tudományágak taxonómiai rendszerei (pl. biológia és más természettudományok) történetileg jóval korábban megjelentek. A pedagógiában is széles körben használt a Bloom-féle taxonómia. Közelebbről megvizsgálva a fenti meghatározásokat, világosan látható, hogy az osztályozási rendszerek (pl. az Egyetemes Tizedes Osztályozás), és a tezauruszok rendelkeznek annak ismérveivel. Az ontológia, az osztályozási rendszer és tezaurusz egyaránt a tudásreprezentáció és kezelés eszközrendszeréhez tartoznak. Egymástól függetlenül jöttek létre, de elvi alapjaik összhangban állnak. A tezaurusz és ontológia kapcsolatáról lásd. Ungváry Rudolf tanulmányát.144 Ungváry Rudolf145 szerint Magyarországon az ETO és a Köztaurusz az a két egyetemes rendszer, mely 10 éven belül fel fog értékelődni a szemantikus web fejlesztések hatására. A kiérlelt ontológiák piaci bevezetői ugyanis vissza fognak nyúlni az egyetemes osztályozási rendszerekhez, illetve a tezauruszokhoz. Az ETO és a tezaurusz segítségével lehet majd szelektívebben és hatékonyabban megvalósítani a tömegméretűvé vált automatizált kereséseket és adathalászatot, elvégezni azokat a gépi hasonlósági találatelemzéseket, melyekkel a felhasználók tömegeinek könnyítik meg a tájékozódást a weben. Az ETO Konzorciumban (UDCC) is egyre határozottabban jelenik meg az igény, az Egyetemes Tizedes Osztályozás bevezetése az internetes dokumentumok osztályozásába, a meglevő szemantikus kapcsolatainak előnyeire építve. Az ETO Konzorcium honlapján már 2000 ETO szám férhető hozzá, több mint harminc nyelven!146 Hasonló irányokban tevékenykedik az OCLC is, mely a Tizedes Osztályozást gondozza. Az intellektuális eszközök között fontos helyet foglalnak el a tezaurusz relációk és a metaadat-formátumok relációi, más néven besorolási adatcsere-formátumok.147 Ezeknek kitüntetett szerepük van a gyűjteményi rendszerek logikai strukturálásában, s egyben e rendszerek jobb megismerésének is tárházai. A metaadat-formátumok ismerete ugyanúgy elengedhetetlen az információs társadalom körülményei között dolgozó könyvtári, levéltári, múzeumi szakemberek számára, akár az orvos számára az anatómia. A könyvtárosok tehát egy sor általuk kidolgozott rendszerre építhetnek, amelyek mind alapvetően fontosak lehetnek a szemantikus web alkalmazásokban, így osztályozási rend143
Horváth Zoltánné: Taxonómia – az egyezményes nyelvek szerepe és rokonságai - útközben a szemantikus webhez. In: Tudományos és Műszaki Tájékoztatás, 53. évf. (2006), 5. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4410&issue_id=472 144 UNGVÁRY Rudolf: Tezaurusz és ontológia, avagy a fogalmi ismertetőjegyek generikus öröklődésének formalizálása. Tudományos és Műszaki Tájékoztatás, 51. köt. 5. sz. 2004. p. 1–10. 145 UNGVÁRY Rudolf: Fejős László halálára. URL: https://listserv.niif.hu/pipermail/katalist/2009May/018399.html Katalist, 2009. május 7. 146 UDCC Summary: URL: http://www.udcc.org/udcsummary/php/index.php 147 UNGVÁRY Rudolf: MARC21/HUNMARC: a besorolási adatok metaadat-formátuma. Főbb jellemzők, fejlődés és problémák. Könyvtári Figyelő (Library Review) 20. (56). vol. 2010. 1. no.
162
INFORMÁCIÓKERESŐ NYELVEK III.
szerekre, a tezauruszokra, a szabványos, pontos keresést biztosító metaadatokra, besorolási adatokra (authority rekordokra). Lásd pl. a Kongresszusi Könyvtár szabadon hozzáférhető authority rekordjait!148 11.3.3 Alkalmazások és használat
A szemantikus kereső mint álomkönyvtáros? Vámos Tibor Gottdank Szemantikus web c. könyvéhez írt előszavában párhuzamba állítja a mindentudó álomkönyvtárost és a majdan mindentudó intelligens webet.149 „Az intelligens, szemantikus, értelmes összefüggéseket feltáró háló talán olyan lesz, mint egy álomkönyvtáros, az Akadémiai Könyvtár ezerarcú, ezerkezű Vekerdi László az Akadémiai Könyvtár, aki eligazít, aki először segít tisztázni, mit is kérdezzünk, hol sejtjük, elmagyarázza, hogy mire gondolhatunk, majd arról is felvilágosít, hogy hol találunk friss és hiteles forrást, mit kezeljünk óvatosan, mert tele van hamis információval.” A szemantikus weben alapuló keresés, problémamegoldás számítógéppel támogatott, „felfedezéses”, interaktív folyamat, melyben a kapott válaszokat a gép elemzi, értékeli, következetéseket von le. A keresési folyamat eredményeképpen a feltárt új információk tudásrendszerünk részévé válnak. A felhasználó a szemantikus web eljárást követve, a kérdéseket-válaszokat értelmezni képes gép segítségével nemcsak találatokat, hivatkozásokat kap a kérdésére, hanem megoldási javaslatokat összetett problémáira is. Az elképzelt szemantikus színtér része egyben annak elképzelt felhasználója – user vagy ágens – is, aki használja is és „építi” is a hálót, segíti a keresés és a kereső tökéletesítését. Aki adja a tudását, többedmagával rendszeresen frissülő online enciklopédiát hoz létre, dokumentumokat címkéz fel pontos és releváns metaadatokkal, vagy – akár anélkül, hogy tisztában lenne vele – nyomokat hagy maga után. Ha kíváncsi valamire, feltételezi, hogy a keresett információ valahol, valamilyen formában megtalálható a weben, így nekiáll és megkeresi. Például, ha valaki utazását szeretné megtervezni, valószínűleg térképeket, menetrendeket, szállodák listáit, időjárás előrejelzést, látnivalókkal kapcsolatos információt fog keresni és gyűjteni a weben. Ezután elkészíti útitervét, kiválasztja, hogy melyik szállodában szeretne lakni, és elintézi az összes szükséges foglalást. A szemantikus web alkalmazás képes lesz arra (sokkal jobban, mint egy utazási iroda dolgozója tudná), hogy összerakja az egyes különálló információdarabkákat, és egyetlen csomaggá állítsa össze őket.
148 149
Library of Congress Authorities- http://authorities.loc.gov/ GOTTDANK Tibor: Szemantikus web. Bevezetés a tudásalapú Internet világába Budapest : ComputerBooks, 2005 . URL: http://webbolt.webwall.hu/computerbooks/Szemantikus_web/Szemantikus_web.php?k%F6nyv=Szemantik us%20web&kategoria=Internet%20%20alkalmaz%E1s%20%E9s%20fejleszt%E9s&mn=tartalom&pid=79
163
INFORMÁCIÓKERESŐ NYELVEK III.
Az alkalmazások fejlődése Közel egy évtizeddel a szemantikus web vízió publikálását követően számos lépés történt annak érdekében, hogy Tim Berners-Lee elképzelése valósággá váljon. Az elterjedését szolgáló szabványok fejlesztésének eredményei, az alkalmazások kiindulópontjai, a W3C, így a Magyar Iroda weblapján érhetők el. Gyarapodik az olyan alkalmazások köre, melyek célja, hogy a szemantikus technológiákkal - sokféle területet és szintet integrálva – megvalósuljanak a világméretű tudáscseréhez szükséges feltételek. Osztályozási rendszerek, tezauruszok Világosan megfigyelhető az osztályozási rendszerek, tezauruszok szemantikus web alkalmazásainak a fokozatos bevezetése. Ebbe a körbe tartoznak a Tizedes Osztályozás internetes mikroalkalmazásai, melyek az OCLC weblapján kísérhetők figyelemmel. Az ETO is ebben az irányban halad. Az EuroVoc tezaurusz a W3C ajánlásainak és a tezaurusz-szabványokkal kapcsolatos legújabb fejleményeknek megfelelően áttért az ontológián alapuló tezaurusz-kezelésre és a szemantikus web-technológiákra.150 Internetes katalógusok − az internetes katalógusok között megismert Open Directory Project (ODP) esete mutatja, hogy az alkalmazások bevezetése hosszú, olykor problémákkal teli folyamat ( RSS - RDF Site Summary). Wordnet alkalmazások − Elektronikus lexikális szemantikai adatbázisra épülnek, melyben a nyelvi fogalmak hálózatba szerveződnek. A fogalmakat szinonimahalmazok, a közöttük lévő kapcsolatokat szemantikai relációk képviselik. − Angol nyelvű alkalmazás a Princeton Egyetem által fejlesztett, online elérhető szótár, a WordNet, mely több százezer kifejezést tartalmaz.151 − A Magyar WordNetet három magyar intézmény 3 éves munkájával hozták létre. A projekt eredményeképpen 2007-re létrejött mintegy 40 000 magyar szinonimahalmaz, melyek nagy része meg van feleltetve ekvivalens angol WordNet szinonimahalmazoknak (synseteknek), így implicit módon más nyelvek wordneteinek is152 Könyvtári alkalmazások 153 − A szemantikus web könyvtári alkalmazására az első kísérletek az XML (Extensible Markup Language) és az RDF implementálásával kezdődtek. 150
EuroVoc, az Európai Unió többnyelvű tezaurusza URL: http://eurovoc.europa.eu/drupal/?q=hu WordNet. URL: http://wordnetweb.princeton.edu/perl/webwn 152 PRÓSZÉKY Gábor – MIHÁLTZ Márton: Wordnet. Az első magyar lexikális szemantikai adatbázis. In: Magyar Terminológia, Vol. 1., no.1. June 2008. 43-57.p. http://www.akademiai.com/content/u261854q27q2108j/ 153 TÓTH Máté: A szemantikus web. Könyvtárak a szemantikai paradigmában. Doktori értekezés tézisei. Témavezető: Dr. Horváth Péter. Budapest: Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar Irodalomtudományi Doktori Iskola Könyvtártudományi Program. 2010. URL: http://doktori.btk.elte.hu/lit/tothmate/tezis.pdf 151
164
INFORMÁCIÓKERESŐ NYELVEK III.
−
A vízió megjelenését követően kísérleti digitális könyvtári rendszerek is megjelentek. (FEDORA, JeromeDL, BRICKS, Talia) − A jelenleg legsikeresebb projekt a Svéd Nemzeti Könyvtárhoz fűződik, ahol arra tettek kísérletet, hogy az ország közös katalógusát, a LIBRIS-t, amely nagy menynyiségű strukturált és ellenőrzött adatot tartalmaz, átkonvertálják a szemantikus webhez kompatibilis módon. − A tématérképek esetében a kísérleti könyvtári rendszerek (pl. Potnia, Wandora) mellett találhatók kész, működő alkalmazások is (pl. NZETC). Több kísérlet történt könyvtári katalógusrekordok szemantikus technológiákkal való leírására is. Adatbázis alkalmazások − A Wikipédia mint adatbázis, fontos szerepet kap a szemantikus web fejlesztésekben. Elengedhetetlen, hogy színvonalas webes enciklopédiák álljanak rendelkezésre, melyek a fogalomrendszert és annak elemeit jó színvonalon tudják reprezentálni, a fogalmakat, azok jellemző jegyeit azonosítani. − A Wikipedia projekt részeként működik a DPedia tudásbázis, mely jelenleg 3,4 entitást foglal magában, melyből 1,4 millió következetes ontológia szerint osztályozott. 154
31. kép
Jimmy Wales a Wikipédia egyik alapítója
e-kereskedelmi alkalmazások GoodRelations ontológia jó példa erre, melynek tárgya termék-modell jellemzők, termék-információk, árak, fizetési feltételek. Az ontológiát használja többek között a Google, BestBuy, Overstock, Yahoo, OpenLink Software, O'Reilly Media, a Book Mashup stb155. A szemantikus kereső-alkalmazásokról a következő fejezetben külön szólunk.
154 155
DPedia. URL: http://dbpedia.org/About Good Relations Ontológia http://www.ebusiness-unibw.org/wiki/GoodRelations
165
INFORMÁCIÓKERESŐ NYELVEK III.
11.3.4 Szemantikus keresők
A szemantikus keresők megjelenése Egyre több szemantikus kereső, tudásbázis, vagy egyéb alkalmazás jelenik meg az interneten. Sok kétséget vet fel, hogy ez vajon azt jelenti-e, hogy valóban így fejlődik a technológia, vagy a szemantikus jelző jelentése veszít sokat tartalmából. Így mire elérjük azt, hogy valóban szemantikus keresőink legyenek, már új elnevezést kell kitalálni, ami az „álszemantikus” szolgáltatásoktól megkülönbözteti ezeket. Így a Hakia (szemantikus) kereső blogján megjelent bejegyzés 156eredeti címét (10 dolog, amitől egy kereső szemantikus) óvatosabban fogalmazva így lehetne leírni: 10 dolog, ami közelebb visz egy szemantikus kereső megvalósításához. Közéjük tartozik a morfológiai változások kezelése, a szinonimák kezelése stb. (ld. Bővebben a támogatás résznél). Van magyar fejlesztésű szemantikus kereső is, pl. az iGlue.157 Ez a szolgáltatás nem linkeket gyűjt össze, mint a többi kereső, hanem értelmezi és rendszerezi az információkat. Vaskó Péter szerint az iGlue éppen ezért a web pillanatragasztója: mert képes újraszervezni a világháló töredékes adatait, és megmutatni az azok közötti kapcsolatot. Olvassa el Herendy Csilla cikkét, melyben a lehetséges szemantikus színtér résztvevőit: az intelligens böngészőt, a kereshető dokumentumokat és adatbázisokat, valamint a usert mutatja be– aki ismeri lehetőségeit, a kereső belső logikáját és ennek köszönhetően képes is keresni a kereshető dokumentumok között. 158 A szemantikus web világában a szemantikus keresés gyakran a szemantikai információkkal kiegészített, előre feldolgozott adathalmazokból való információkinyerést jelenti. Ilyen például az RDF (Resource Description Framework) metaadat-adatmodellje, melyek létrehozása körülményes és sok munkát igényel. A nem ilyen módon rendelkezésre álló szövegek jelentés alapján való keresése a szemantikus keresés egy másik irányába vezet, ahol a nyelvészeti adottságokból eredő szemantikai összefüggések, ontológiai tudásreprezentációk és statisztika alapú megközelítések játszanak elsődleges szerepet.159
A szemantikus keresők működésének támogatottsága A szemantikus keresést egy sor módon kell támogatnia a rendszernek. Siklósi Borbála az alábbiakban foglalja össze a használatnál már hivatkozott 10 pontot. (A hakia 10 pontja) 1. Morfológiai változatok kezelése: az egyes szavak különböző nyelvtani alakjainak egységes, konzisztens kezelése (igeidők, többes szám, egyéb toldalékok stb.). A keresés eredménye ne változzon bármely alakban történik a keresőszó beírása.
156
SIKLÓSI Borbála: A szemantikus keresés 10 pontja. URL: http://kereses.blog.hu/2010/06/24/a_szemantikus_kereses_10_pontja 157 iGlue URL: http://iglue.com 158 HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web 159 SIKLÓSI Borbála: Szemantikus keresés: négy példa. URL: http://kereses.blog.hu/2009/08/31/szemantikus_kereses_negy_pelda
166
INFORMÁCIÓKERESŐ NYELVEK III.
Szinonimák kezelése: a megfelelő jelentésű szinonimák figyelembe vétele természetesen a megfelelő kontextus esetén. A jelentésegyértelműsítés alkalmazása mindenképpen a fejlődésre utal. 3. Általánosítások kezelése: a felhasználó által megfogalmazott általános formájú keresés eredménye legyen specifikus. 4. Fogalmi kapcsolatok: a keresett kifejezésre adott választ nem csak szóillesztéssel, hanem tágabb fogalmi kapcsolatok feltárásával határozza meg. 5. Tudás alapú kapcsolódások: az előzőhöz hasonlóan a kereső alkalmazza a beépített tudásbázisát a releváns találatok megtalálására. 6. Természetes nyelvű keresések és kérdések kezelése: reagáljon megfelelően, ha a keresett kifejezést a felhasználó kérdés formájában fogalmazza meg, de mégsem azonos módon egy kérdés-válasz rendszerrel, ahol az eredmény csupán egyetlen válasz, nem pedig rangsorolt találatok. Az eredményeken belül is találja meg a konkrét választ: jelezze a felhasználó felé, hogy az adott oldalon hol és milyen formában található meg a kérdésére, keresésére Internetes keresőrendszerek 1. A lekérdezések formája legyen szabad: ne kelljen külön szintaktikát megtanulni egy kereső használatához, ne legyen szükség idézőjelekre, logikai kapcsolatok kifejezésére, melyek a jelentést helyettesítik. 2. Ne alapozzon statisztikai megfigyelésekre, felhasználói viselkedésre: a válaszokat elsősorban a források elemzésével, és ne a link-kapcsolatok, felhasználói jelölések és egyéb mesterséges kiegészítők alapján találja meg. Sok esetben nem is állnak rendelkezésre ilyen információk. 3. A saját teljesítményének meghatározása: ha egy kereső nem alkalmaz szemantikai jellemzők feltárását, elemzését, akkor az eredményeinek sorrendje olyan mesterséges mércék alapján kerül meghatározásra, mint a népszerűség, felhasználói reakciók. A szemantikus keresőknek a jelentés alapján kell meghatározniuk a sorrendet. A felsorolt 10 pont megvalósítása is nagyon nehéz feladat, olykor szinte lehetetlen és nem is feltétlenül szükséges. Látszik, hogy egy mai határok szerint működő szemantikus kereső létrehozása is rendkívül sok erőforrást igényel, így már az is eredmény lenne, ha ilyen „szemantikus” keresők működnének, ha tanár-diák kapcsolatot még nem is alakíthatunk ki velük. 2.
11.3.5 A szemantikus web fejlődésének értékelése, a fejlesztés távlatai
Értékelés A szemantikus web működéséhez digitális formában rögzített egyetlen nagy összefüggő adatbázisra, valamint az alkalmazásokat lehetővé tevő szabványokra van szükség. A szemantikus web révén olyan globális hálózati metaadat-infrastruktúra hozható létre, amely lehetővé teszi a világhálón lévő adatok integrálását, a közöttük lévő kapcsolatok definiálását és jellemzését, illetve az adatok értelmezését.
167
INFORMÁCIÓKERESŐ NYELVEK III.
Hosszú távú cél, hogy az intelligens világháló az önleíró dokumentumra épülve a metaadatok segítségével, formális logikai szabályok szerinti következtetések levonására legyen képes. A vízió további, intenzív megvalósulásának fontos feltételei − a tömegek szakismereteket feltételező munkája, − az ontológiák tömeges létrehozása, vagy meglévő tudásszervezési rendszerekből való generálása, − a globális hálózati metaadat-infrastruktúra fejlesztésével kapcsolatos szabványok, szabályozások további kifejlesztése A technológiai lehetőségek adottak arra, hogy szemantikailag kódolt információval a világhálón megvalósuljon a globális tudáscsere, a metaadat-tartalom generálásának problémáját egyelőre nem sikerült megoldani. A könyvtárak – a tudás szervezésében szerzett évezredes tapasztalatukkal – ebben játszhatnak jelentős szerepet. A web2 által hozott új szemlélet legnagyobb áttörése, hogy soha korábban nem helyeződött ekkora hangsúly a produkcióra, így lehetőséget kapott a könyvtár virtuális térben közösségek alakítására. A tudásreprezentáció szempontjából a szemantikus technológiák kifinomultabb eszközrendszerrel rendelkeznek, mint a jelenlegi rendszerek, beleértve a web 2.0 eszközeit. . A szemantikus weben a tartalom ellenőrzése és a bizalom alapja is az intézményes szaktudás, amellyel szemben a web2 paradigmája a tömegek bölcsességére épít. A szemantikus technológiák a magas szinten strukturált tudásszervezési rendszerek szükségessége miatt olyan szakemberek szaktudására számít, akik jártasak a tudásreprezentációban. A web2 paradigmája a közösségek megszólításában tapasztalattal bírók munkájára épít. A tudásmérnök és a közösségi tereket építő szakember a könyvtáros szakma két olyan szerepe, amelyet a digitális korban fokozottan fel kell vállalnia a könyvtárak a szemantikai paradigmában.
Fejlesztések, könyvtárak a szemantikus web megvalósításáért A szemantikus web tárgykörébe tartozó fejlesztések már több mint tíz éve jelen vannak a tudományos és technológiai kutatásokban, a könyvtáros szakma részéről viszont csak 2010-ben született meg magyarul olyan áttekintés, amely saját szempontjából elemezte a jelenséget.160 A globális metaadat-infrastruktúra megvalósulását Tóth Máté tématérkép alkalmazásokkal modellezte, amelyekkel bemutatta, hogy miként működik együtt a könyvtárak által közzétett metaadat-tartalom más szolgáltatók szemantikus web-kompatibilis alkalmazásaival. Tóth Máté szerint a szemantikus web fejlesztések kezdettől fogva azon végső cél elérését szolgálták, hogy megvalósuljon egy globális metaadat-infrastruktúra, a hálózati környezetben megvalósuló világméretű tudáscsere. 160
TÓTH Máté: A szemantikus web. Könyvtárak a szemantikai paradigmában. Doktori értekezés tézisei. Témavezető: Dr. Horváth Péter. Budapest: Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar Irodalomtudományi Doktori Iskola Könyvtártudományi Program. 2010. URL: http://doktori.btk.elte.hu/lit/tothmate/tezis.pdf
168
INFORMÁCIÓKERESŐ NYELVEK III.
A könyvtárosok szempontjából egyértelmű, hogy helyük van a vízió megvalósításában, hiszen egy globális metaadat-struktúrát kiteljesedéséről van szó, amelyben ellenőrzött szótárak (taxonómiák, tezauruszok, ontológiák) hordozzák a következtetések elvégzéséhez szükséges háttértudást. A könyvtárak számára a legelső lépés a meglévő, szemantikailag kódolt információtartalom konvertálása a szemantikus technológiákkal kompatibilis formátumokba. Ez egyben jelenti annak a vállalását is, hogy egyre kevésbé lesznek világosak a könyvtár határai a virtuális térben. A tudásmérnöki szerep kiterjed a fogalmak azonosításának megoldására, a szemantikus technológiákat leíró szabványok használatának elősegítésére valamint tudásszervezési rendszerek közzétételére. A könyvtáraknak fontos érdekük, hogy szerepet vállaljanak a webes enciklopédiák létrehozásában, fejlesztésében, naprakészen tartásában. Ebben a legkülönfélébb könyvtártípusok játszhatnak szerepet, a városi, megyei, regionális szerepkörű könyvtárak, a nemzeti könyvtárak, de a különféle szakkönyvtárak is. A könyvtár a szemantikai paradigmában az általa birtokolt (metaadat- és egyéb) tartalmak szemantikus technológiákkal kompatibilis közzétételével, tudásszervezési rendszerek készítésével, valamint a szemantikus web szabványok támogatásával járulhat hozzá egy globális hálózati metaadat-infrastruktúra megvalósításához. Közös keretben, a fejlesztés szempontjait szem előtt tartva kell átgondolni, összehangolni olyan fontos területeket, mint a besorolási metaadatok, a tezauruszok, a digitális könyvtári alkalmazások kérdése. Video helye Szemantikus web és ETO Ide tartozik az ETO fejlesztése, hogy a szemantikus technológiákkal alkalmazható legyen. Ezirányú TO fejlesztésekkel már találkozhatunk. Nagy szerepet kap ebben az ETO konzorcium, amelynek weblapján 32 nyelven férhető hozzá már 2000 ezer legfontosabb ETO-szám. Az ETO konzorcium eltökélte magát ebben az irányban. Már második nagy konferenciát szervezi A mindentudó robotkönyvtáros álma lehet, hogy tökéletesen soha nem válhat valósággá, de a kutatás, a hatalmas gépekkel és hatalmas szellemi erőfeszítéssel dolgozó nemzetközi közösség – köztük a könyvtárosok - lépésről lépésre igyekszik ezt az ideált megközelíteni.
11.4 ÖSSZEFOGLALÁS A 4. modul (9-11. lecke) részeként a 11. leckében először a szemantikus web fogalmát és fejlődéstörténetét tekintettük át. Majd részletesen megvizsgáltuk a W3C weboldala alapján a szemantikus web céljait és küldetését, bázisát és potenciális felhasználóit. Ezt követően a szemantikus web fejlődését, eddigi eredményeit és távlatait elemeztük mint az intelligens web automatizálási eszközökre építő megvalósítását. Ezután a szemantikus web lépcsős modelljét elemeztük, azonosítottuk annak egyes szintjeit és funkcióit. Megvizsgáltuk a szemantikus keresőkkel szemben elvárásokat, és néhány kísérleti keresőt kapott kipróbálásra. Az értékelés és fejlesztési kritériumok kapcsán külön hangsúlyt fektettünk arra, hogy a könyvtárosok hogyan tudnak hozzájárulni a szemantikus web sikeréhez.
169
INFORMÁCIÓKERESŐ NYELVEK III.
11.5 ÖNELLENŐRZŐ KÉRDÉSEK 1. Fejtse ki a szemantikus web fogalmának jelentését! 2. Adjon áttekintés a szemantikus web fejlődéstörténetéről! 3. Fejtse ki milyen szintekből áll a szemantikus web lépcsős modellje! 4. Indokolja meg az intelligens web fejlesztések szükségességét! 5. A szemantikus web szolgáltatók, dokumentumbázis és felhasználók jel-
lemzőinek bemutatására, 6. Fejtse ki a szemantikus web stratégiájának 3 legfontosabb pontját! 7. Mely technikai eszközökre van szükség a szemantikus weben, 8. Fejtsen ki legalább 4 kritériumot, mely alapján szemantikusnak nevezhető
a keresés! 9. Mi a szerepe az XML-nek a szemantikus web alkalmazásokban? 10. Mi a véleménye a könyvtárosok potenciális szerepéről a szemantikus web
fejlesztésekben?
170
INFORMÁCIÓKERESŐ NYELVEK III.
12.
ÖSSZEFOGLALÁS
12.1 A KURZUSBAN KITŰZÖTT CÉLOK ÖSSZEFOGLALÁSA A könyvtárak életében a különféle információkereső rendszerek gyors fejlődése új megoldásokat, s egyben új kihívásokat jelentett. Jegyzetünk harmadik kurzusában segíteni kívánunk abban, hogy a dokumentumok tartalmi feltárása és az információkereső nyelvek alkalmazása szempontjából alapvetően fontos információkereső rendszereket rendszerezett formában megismerje. A tananyag nagy vonalaiban egy hasonló című, 7 évvel ezelőtt készült jegyzetre épül. (Pálvölgyi Mihály: Információkereső nyelvek 3.) Ebbe a szerkezeti keretbe épültek be a bekövetkezett jelentős változások. Célunk, hogy Ön a stabilnak bizonyult elemeken túl, megismerje az eltelt időszak változásait, az összefüggéseket és trendeket is. Kurzusunk kapcsolódik az Információkereső nyelvek c. tantárgy első félévében (alapvető ismeretek + Egyetemes Tizedes Osztályozás), ill. második félévében (természetes nyelven alapuló információkereső nyelvek) tanultakhoz. Célunk, hogy építve az első két félév eredményeire, betekintést nyerjen napjaink széles körben használt információkereső rendszereinek (cédulakatalógus, online katalógus, adatbázis, internetes keresőszolgáltatások, internetes katalógusok, szemantikus alkalmazások) legfontosabb jellemzőibe. Ismerje meg fogalmi összefüggéseiket, fejlődéstörténetüket, szolgáltatóikat, dokumentumbázisaikat, használóikat. Nyerjen áttekintést stratégiáikról, intellektuális és technikai eszközeikről, használatuk, keresésük jellegzetességeiről. Az egyes információkereső rendszertípus tárgyalását követően fontos, hogy értékeljük azt, és felvázoljuk a fejlesztés lehetőségeit és teendőit. Ezek a rendszerek egymás mellett léteznek, sok tekintetben kiegészítik egymást, és a könyvtárak használói szinte naponta igénybe veszik szolgáltatásaikat. Az egyes leckéket úgy méreteztük, hogy képes legyen egyenletes tempóban haladni. 12.2 TARTALMI ÖSSZEFOGLALÁS A kurzus négy modulból tevődik össze. Az 1. modul (2-3. lecke) az információkereső rendszerek és modellek alapvető kérdéseivel foglalkozik. A 2. lecke – a korábban tanultakra építve- feltárja az információkereső rendszerek lényegi ismérveit, és az illesztéses és asszociatív modell mellett megismertet a direkt-indirekt szolgáltatási modell tudnivalóival, az információkereső rendszerek létrehozásának, építésének, fejlesztésének legfontosabb tényezőivel. Ezt követően a 3. lecke áttekintést ad az információkereső rendszerek 19–20. századi megvalósulásairól, majd – egységes szerkezetben (fogalmuk, fejlődéstörténetük, dokumentumbázisuk, használóik, feltárási stratégia, a keresés és szolgáltatás kérdései, támogatás és megjelenítés, értékelési és fejlesztési kérdések) megvizsgáljuk és összevetjük napjaink fontos információkereső rendszertípusait. A 2. modul (4-6. lecke) a nagy hagyományokkal rendelkező katalógusokkal ismertet meg. A 4. lecke a cédulakatalógusok, az 5. lecke az online katalógusok, a 6. lecke a közös katalógusok információkereső rendszer-típusait vizsgálja átfogó szerkezeti keretben, a
171
INFORMÁCIÓKERESŐ NYELVEK III.
megadott szempontok szerint. (Az online katalógusok, illetve a közös katalógusok már egyben átvezetnek az adatbázisok világába.) A 3. modul (7-8. lecke) az adatbázisok információkereső rendszereit vizsgálja fő ismérvkörei szerint. A 7. lecke átfogó áttekintést ad, majd a nemzetközi, a 8. lecke pedig ezekre alapozva a hazai adatbázisok sajátos jellemzőit vizsgálja, konkrét példákra is hivatkozva. E modul lehetőséget ad arra, hogy a 8. lecke végén összehasonlítsuk a nemzetközi, illetve magyar szakterületi adatbázisok minőségi jellemzőit két, egymáshoz kapcsolódó átfogó felmérés eredményeire is támaszkodva. A 4. modul (9-11. lecke) az internetes dokumentumok feltárására szerveződött rendszereket elemzi. Ezen belül a 9. lecke az automatikus indexelő rendszerek, internetes keresőrendszereket vizsgálja, kimutatva eredményeiket, a fejlődés tényeit, de feltárva az ismérveikből adódó hiányosságokat is. A 10. lecke az intellektuális munkára épülő internetkatalógusok sajátos ismérveit, példáit vizsgálja. A 11. lecke a szemantikus web fejlődését, eddigi eredményeit és távlatait elemzi, mint az intelligens web automatizálási eszközökre építő megvalósítását, kiemelt figyelemmel a könyvtárosok részvételére. 12.2.1 A tananyagban tanultak részletes összefoglalása 1 2 3 4 5 6 7 8 9 10 11
Bevezetés Információkereső rendszerek és modellek Az információkereső rendszerek típusai Cédulakatalógusok Online katalógusok Közös katalógusok Nemzetközi adatbázisok Magyar adatbázisok. Automatikus indexelés Internetkatalógusok Szemantikus web alkalmazások
12.2.2 Információkereső rendszerek és modellek A lecke keretében megismerte, illetve felfrissítette az információkereső rendszerek működésének alapjául szolgáló elméleti tudnivalókat (az IKR fogalma, összetevői, az illesztéses, az asszociatív, illetve a tudásszervezési modell). Megismerkedett a digitális technológiából adódó új lehetőségekkel, melyek az illesztéses modell lehetőségeit egyre intenzívebben kitágítják. Áttekintette azt a nagy fejlődési vonulatot, mely a papírkönyvtárból elvezet a digitális könyvtárhoz, pontosabban a komplex könyvtárhoz, mely mindkettő előnyeit ötvözi. Tudatosíthatta a könyvtárak, mint tartalomszolgáltatók növekvő szerepét az infokommunikációs stratégiában, a „multimédia háromszögben”a tartalom közvetítésében, a különféle tartalmak közötti eligazodásban. Áttekintettük a dokumentumbázis kérdését, a gyűjtés, illetve elérés alternatíváját az információfeldolgozás szempontjából. 172
INFORMÁCIÓKERESŐ NYELVEK III.
A zárófejezetet a felhasználók elvárásainak, keresési szokásainak elemzésének szenteltük. Az információkereső rendszerek a használókért vannak, ezért is igényeiket, információkeresési, használati és alkalmazási szokásaikat a különféle keresőrendszerek bemutatásánál külön is vizsgáljuk. 12.2.3 Az információkereső rendszerek típusai A 3. leckében átfogó áttekintést adtunk a különböző információkereső rendszer-típusok legfontosabb jellemzőiről, fejlesztési, működtetési kritériumairól. Először a mai keresőrendszerek elődjeit, hagyományait tekintettük át (katalógusok és bibliográfiák), majd azt, milyen keresőrendszereket alkalmaztak ezek alapján a 20. században. Ezt követte a ma létező információkereső rendszerek (cédulakatalógusok, online katalógusok, adatbázisok, internetes keresők, internetes katalógusok, illetve a jövő szempontjából ígéretes szemantikus web alkalmazások sajátos jellemzőit bemutatása a megadott legfontosabb szempontok szerint. (Szolgáltatók, dokumentumbázis, használók, a feltárás stratégiája, intellektuális és technikai eszközei – feldolgozás munkafolyamatai, – az IKR használata, keresés és böngészés – tájékoztatás és támogatás – megjelenítés és hozzáférés.) A fenti egymáshoz kapcsolódó elemzésekhez összefoglaló értékelés, és a fejlesztési teendők megfogalmazása kapcsolódott. A lecke tantárgyi kapcsolatai: Bibliográfiai adatfeldolgozás, Az elektronikus dokumentumok feldolgozása, Adatbázis-kezelés, Integrált könyvtári rendszerek, Virtuális könyvtárak, Internetes keresőrendszerek működése. 12.2.4 Cédulakatalógusok A 4. leckében áttekintést kapott a tárgyi katalógusok cédulakatalógus formában történő megvalósulásairól, azok fejlesztési, gondozási, karbantartási teendőiről, keresési-használati jellemzőiről, értékeléséről, a lezárásuk, befagyasztásuk motívumairól. A cédulakatalógusnak történeti szerepe volt az IKR-ek tárgyi megvalósulásai közt, több mint száz éven át szolgált domináns keresőrendszer a könyvtárakban. Ma is van szerepe: még nem fejeződött be a könyvtárakban a kartonon levő adatok online elérhető katalógusrekordokra konvertálása (a 2000 előtt beszerzett állomány mintegy 30 %-a 2010. évi becslés szerint). Senki nem sírja vissza azt a rengeteg, aprólékos, időigényes munkafolyamatot, mely a tárgyi katalógusok építéshez kellett. Ugyanakkor a rendszer egyes elemeire kidolgozott jó megoldásokra ma is szívesen gondolnak vissza felhasználók és könyvtárosok egyaránt, pl. a jól áttekinthető, rendszerezett, követhető csoportképzéses szakkatalógus-szerkesztésre és –használatra, az abban való eligazodást segítő feliratozott osztólapokra, a naprakész betűrendes mutatóra. 12.2.5 Online katalógusok A könyvtári adatbázisok közül az online katalógus fogalmát tisztáztuk először, melyet a fejlődéstörténetükkel, a szolgáltatókkal, a dokumentumbázissal, illetve a használókkal kapcsolatos tudnivalók követtek. Eközben tudatosítani kívántuk, hogy milyen szoros munkakapcsolat szükséges az integrált könyvtári rendszer-szolgáltató és a könyvtár között. Az online katalógusokban igen sokféle típusú dokumentumot dolgoznak fel és tesznek kereshetővé. Ugyanakkor az állománynak még csak kb. 2/3 kereshető bennünk, a többi pl. cédu173
INFORMÁCIÓKERESŐ NYELVEK III.
lakatalógusban, és más korábban használt katalógusokban (pl. fénylyukkártyás, mikrofilmes). A tárgyi feltárás stratégiája arra irányul, hogy építve a munkafolyamatok egymáshoz kapcsolódására, minél mélyebb szinten tegye lehetővé a dokumentumokban rejlő tudás reprezentálását. A könyvtárak által használt, kidolgozott, egymással megosztott intellektuális szellemi segédeszközök fejlesztése fontos prioritás (pl. tárgyszójegyzékek, tezauruszok, besorolási adatok rendszerezett gyűjteményei). Ezt követően tudatosíthatta, hogy az alkalmazott technológia (hardver és szoftver) milyen fontos szerepet kap a keresés, böngészés felhasználóbarát módszereinek biztosításában. Megismerkedett az online katalógusok használati, keresési lehetőségeivel, technikáival, az azokat támogató eszközök körével (súgók, útmutatók stb.). A leckét az értékelés és fejlesztés kérdéseivel zártuk, rámutatva a felhasználóbarát módszerek még intenzívebb bevezetésére. 12.2.6 Közös katalógusok A lecke során először a közös katalógus fogalmát ismerte meg, majd e katalógustípus kialakulásának körülményeit. Ezt követte a közös katalógus előállítók és szolgáltatók széles körének bemutatása, részben az ugyanazon integrált könyvtári rendszerekhez való tartozás alapján. Kiemelt figyelmet szenteltünk a Magyar Országos Közös Katalógus (MOKKA), megismerésének, mely a közös katalógushasználat és az országos dokumentum ellátási rendszer funkcióinak integrálása irányában halad. Sorba vettük a dokumentumbázis kérdését (minden dokumentumtípus érintett a feltárásban), a felhasználók (könyvtárosok, olvasók, kutatók) különféle igényeit. A stratégia ismertetésénél rámutattunk a megújítás mozgató rugóira, az optimális rendszerfejlesztés igényeire és területeit. Ezt követte a célok eléréséhez szükséges intellektuális és technikai eszközök bemutatása. Nagy figyelmet szenteltünk a munkafolyamatok alakulásának, az együttműködő könyvtárak, illetve a közös adatbázis közötti együttműködésnek, a folyamatszabályozás, kommunikáció fejlesztésének. A lecke kiemelten fontos részeként a közös katalógusban való keresés, böngészés fejlődését, az ezzel kapcsolatos igényeket, újszerű megoldásokat mutattuk be. Ehhez kapcsolódva a használat, keresés, böngészés támogatási formáinak részletes elemzése (tekintettel a web2.0, illetve szemantikus web technológiai igényekre). A leckét átfogó értékelés, és a tervezett fejlesztések legfontosabb pontjainak kifejtése zárta. 12.2.7 Nemzetközi adatbázisok A 7. lecke az adatbázisok fejlett, strukturált keresőrendszerének alapvető jellemzőit, illetve a nemzetközi adatbázisokat mutatta be. Az 1. részben az adatbázis átfogó fogalmát, majd az adatbázisok öt évtizedes fejlődésének fázisait, eredményeit tekintettük át. Ezt követően a 2. részben az adatbázis-előállítók, szolgáltatók sajátos jellemzőit, s ezzel összefüggésben az adatbázisok típusait elemeztük a Cuadra féle taxonómia alapján. Az adatbázisokkal szembeni magas minőségi követelményekre való tekintettel, fontos szerepet kapott a 3. részben a stratégia megfogalmazása, az azt segítő intellektuális és technikai eszközök fejlődésükben történő bemutatása. Eközben nagy figyelmet szenteltünk arra, hogy a mondandóban helyet kapjanak egy átfogó nemzetközi adatbázis-felmérés 174
INFORMÁCIÓKERESŐ NYELVEK III.
(Csík Tibor – Varga Katalin) tanulságai, tapasztalatai. A nemzetközi adatbázisok sajátos fejlődési jellemzőit konkrét példákon keresztül is vizsgáltuk. A feltárással szembeni új kihívások megnyilvánulnak a munkafolyamatokban és termékekben is, ahogy ezt az ERIC adatbázis példáján keresztül láthattuk. (4. rész). Az 5. részt az adatbázisok használatának, keresésének, az azt szolgáló tartalomreprezentációs elemek vizsgálatának szenteltük, majd ezekhez kapcsolódva a használat támogatásának eszközeit, illetve az eredeti szövegekhez való eljutás lehetőségeit vizsgáltuk. A záró részben mindezek alapján átfogó értékelést adtunk a létező adatbázisok lényegi vonásairól, majd összefoglaltuk a fejlesztés irányait, lehetőségeit. 12.2.8 Magyar adatbázisok A lecke első részében a magyar adatbázisok sajátos ismérveivel ismerkedett meg. Ezt követte az adatbázis-előállítók és szolgáltatók körének áttekintése. A leckében fontos helyet kapott a magyar adatbázisok átfogó tartalomreprezentációs vizsgálata (Varga Katalin), annak céljai, módszerei, tanulságai, különös tekintettel a nemzetközi felméréshez viszonyítva. Ennek fényében került sor az intellektuális és technikai tényezők, a keresés és támogatás sajátosságainak vizsgálatára. Ezek mellett a 2-6. fejezetben példákon keresztül vizsgáltuk meg néhány fontos szakterület feltárási gyakorlatát (mezőgazdaság, műszaki-gazdasági terület, orvostudomány, pedagógia, humántudományi cikkirodalom). Ezekhez kapcsolódott a 7. fejezetben két elektronikus könyvtári feltárási példa. A zárófejezetben, a kezdő részhez szorosan kapcsolódva, a magyar szakterületi adatbázisok lényegretörő értékelése, illetve a fejlesztési teendők megfogalmazása következett, melynek során sor került az előző leckében hivatkozott nemzetközi felmérés, illetve Katalin magyar adatbázisokra vonatkozó felmérésének párhuzamba állítására, a jövőben elengedhetetlenül fontos teendők megfogalmazására. (8. rész). 12.2.9 Automatikus indexelés A leckében az 1. részben először az automatikus feltárás (automatikus osztályozás, illetve indexelés) alapfogalmaival ismerkedett meg. Ezt követte az automatikus indexelés történeti fejlődésének, fejlesztési irányainak a bemutatása. Az elméleti, módszertani alapok tisztázása után következett a 2. részben az internetes keresőrendszerek elméletimódszertani tényezőinek megismerése: beleértve azok felépítését, elemeinek összehangolt működését, fontos helyet kaptak a relevanciaelemzés alapjául szolgáló szempontok. A 4. részben a hagyományos internetes keresőrendszerek értékelési kritériumainak megismerése következett. Az értékelés részben részletesen elemeztük a problémák okait, és megoldási lehetőségeit. Az 5. részben az új fejleményeket vizsgáltuk, köztük a komplex fejlesztéseket, a metakeresőket, a természetes nyelvű keresőket, a blogkeresőket, és a mélyweb keresőket. A leckét a jövőbeni lehetőségek taglalásával zártuk. A hatalmas dokumentumhalmaz, illetve az igények növekedése új és új megoldásokra ösztönzi a szolgáltatókat. Igen sok kihasználatlan potenciál van mind a szolgáltatói, mind pedig a felhasználói oldalon. A keresőrendszerek terén globális verseny folyik, az átfogó keresőrendszerek mellett számos innovatív, illetve részfunkcióra orientált rendszer jelenik meg, és egyre intenzívebben folynak a szemantikus web kutatások.
175
INFORMÁCIÓKERESŐ NYELVEK III.
12.2.10 Internetkatalógusok A lecke első részében az internetkatalógus fogalmát és fejlődéstörténetét ismerte meg. A internetes dokumentumok feltárásának intellektuális megoldásaként jött létre, annak érdekében, hogy a tudatos gyűjtés, feldolgozás, és mélységben rugalmas hierarchikus böngészés révén nagyobb pontosságot nyújtson a felhasználóknak. A 2. részben megismerte, hogy a szolgáltatók általános vagy tematikus katalógusokra specializálódnak. A felhasználók egyaránt lehetnek igényes, minőségi forrásokra vágyók, illetve a keresésben, böngészésben nagyobb segítséget igénylők. Ezt követően a 3. részben részletesen megismerte a feltárás intellektuális és technikai eszközeit, A 4. részben megismerte a komplex szerkesztési munkafolyamat egyes részleteit, a gyűjtés, válogatás, feltárás, az annotálás, a hierarchiába való beosztás műveleteit. A 4 részben áttekintést nyert a használat módjairól, a böngészés és keresés kombinált alkalmazásának lehetőségéről. Mindezt a rendszer számos módon, az intellektuális mellett automatikusan is támogatja (keresőrendszer integrálásával) A zárórészben e sajátos keresőrendszertípus használatának előnyeivel, problémáival, illetve fejlesztési teendőivel ismerkedett meg. 12.2.11 Szemantikus web alkalmazások A 4. modul (9-11. lecke) záróleckéjének megismerését a szemantikus web fogalmának, céljának, fejlődéstörténetének áttekintésével kezdtük. Majd részletesen megvizsgáltuk weebtársadalom szolgáltatói, használói oldalának egyre határozottabb igényét az intelligens web fejlesztésére. Ezután a szemantikus web lépcsős modelljét elemeztük, azonosítottuk annak egyes szintjeit és funkcióit. Nyomon követtük a szemantikus web vízió megvalósításának lépéseit, a szabványajánlások megszületését, a kísérleti alkalmazások megjelenését. Eközben kitértünk a szemantikus web alkalmazások típusaira, az azokkal szembeni követelményekre. Megvizsgáltuk a szemantikus keresőkkel szemben sokrétű elvárásokat. Ezt követte a szemantikus web alkalmazások vizsgálata a könyvtárak oldaláról, és könyvtárosok szemszögéből. A könyvtárak tudásreprezentációs hagyományai, tapasztalatai, innovatív eredményei alapján előre jelezhető a szemantikus web alkalmazásokban való intenzív felelősségvállalás. Számba vettük ennek intellektuális és technológiai feltételeit. Az eddigi eredmények értékelése, illetve a további teendők megfogalmazása a könyvtáriinformációs intézmények kívánatos és lehetséges szerepvállalása nézőpontjából történt.
176
INFORMÁCIÓKERESŐ NYELVEK III.
13.
KIEGÉSZÍTÉSEK
A tananyagban található internetes hivatkozások ellenőrzése: 2010.október 30.
13.1 IRODALOMJEGYZÉK Könyv, folyóiratcikk BERECZKY Lászlóné, SURJÁN Miklós: Szakkatalógus szerkesztés csoportképzés alapján. [kiad. az] OSZK KMK, OMKDK. 2. átd. bőv. kiad. Bp. : OSZK KMK : OMKDK, 1981. 165 p. BUCKLAND, Michael: A könyvtári szolgáltatások újratervezése. (Redesigning library services: A manifesto.) Bp.: OSZK, 1998. 102 p. A függelékben: Buckland, Michael: What will collection developers do? – In: Information Technology and Libraries. – Vol. 14. No. 3. (Sept. 1995), p. 155-159. Ford. Murányi Péter, Pálvölgyi Mihály. DAVENPORT, Thomas H., PRUSAK, Laurence: Tudásmenedzsment. Kossuth Kiadó, Bp.: 2001. 195 p. GOTTDANK Tibor: Szemantikus web: Bevezetés a tudásalapú Internet világába Bp.: ComputerBooks, 2005 HORVÁTH Tibor: Az általános tárgyszójegyzék munkálatairól = Könyvtári Figyelő, 2. (38.) évf. 1992. 610-617.p HORVÁTH Tibor: A könyvtártudomány és információtudomány alapjai. In: Könyvtárosok kézikönyve. 1. kötet. Szerk. HORVÁTH Tibor, PAPP István. Budapest : Osiris, 1999. HORVÁTH Tibor, SÜTHEŐ Péter: Tartalmi feltárás. In: Könyvtárosok kézikönyve. Szerk. Horváth Tibor, Papp István. Bp.: Osiris, 2001, 28. p.) PÁLVÖLGYI Mihály: Információs technológia. Főiskolai jegyzet könyvár szakos hallgatók részére. Egységes jegyzet. Bp. Tankönyvkiadó, 1991. 169-181.p. RÓNAI Tamás: A megyei könyvtárak tárgyi katalógusairól. = Könyvtári Figyelő, 1985. 2. sz. 160168. p. SÜTHEŐ Péter: Elektronikus, digitális, virtuális könyvtárak In: Könyvtárosok kézikönyve. 3. kötet – A könyvtárak rendszere. Szerk. Horváth Tibor, Papp István. Bp.: Osiris, 2001 TÓTH Erzsébet: Hatékony információkeresés a weben: az internetes keresők lekérdezési hatékonyságának vizsgálata. Nyíregyháza: Örökségünk, 2010. 159 p UNGVÁRY Rudolf: MARC21/HUNMARC: a besorolási adatok metaadat-formátuma. Főbb jellemzők, fejlődés és problémák. Könyvtári Figyelő (Library Review) 20. (56). vol. 2010. 1. no. UNGVÁRY Rudolf: Az osztályozás alapjai: bevezetés az információkereső nyelvek elméletébe. Bp.: OSZK KMK, 1982. 47. p.
Elektronikus dokumentumok / források ANTALNÉ SOÓS Katalin: A MESH (Medical Subject Headings) és a magyar MESH (HUNMESH) URL: http://mek.oszk.hu/03100/03128/html/mesh.htm Calimera kötet. Utmutató. 3.kötet Technikai utmutató . Feltárás és visszakeresés http://www.ki.oszk.hu/old/calimera/3kotet/3kotetffeltaras.html Calimera kötet. Útmutató. 3. kötet Háttértechnológiák. URL: http://www.ki.oszk.hu/old/calimera/3kotet/3kotethattertechnologiak.html CSÍK Tibor, VARGA Katalin: A tudás és az információfeldolgozás. Tudományos és Műszaki Tájékoztatás. 52. évf., 2005, 7-8.sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4007&issue_id=464
177
INFORMÁCIÓKERESŐ NYELVEK III.
CUTTER, Charles A.: Rules for a dictionary catalog. 4th edition, rewritten. Washington, Government Printing Office, 1904. URL: http://digital.library.unt.edu/ark:/67531/metadc1048/m1/12/ CUTTER, Charles A.: Rules for a dictionary catalog. 4th edition, rewritten. Washington, Government Printing Office, 1904. URL: http://digital.library.unt.edu/ark:/67531/metadc1048/m1/1/ DRÓTOS László, KŐRÖS Kata, TERNAI Zita: Adattármustra. Könyvtári katalógusok. In: Tudományos és Műszaki Tájékoztatás, 6. évfolyam (2009), 11-12. sz. URL: http://tmt.omikk.bme.hu/issue.html?issue_id=510 FÜLÖP Csaba, KOVÁCS László, MICSIK András: A metaadatsémák és a szemantikus web: egységesítés és specializáció a metaadatok világában Tudományos és Műszaki Tájékoztatás 51. évf. 2004. 7. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=3648&issue_id=452 GORMAN, Michael : Metadata or cataloguing? A false choice. Journal of Internet Cataloguing. 2. vol. 1999. 1. no. 5-22. Bibl. Ismert. Mohor Jenő, In: Könyvtári figyelő 2000. 1-2. sz. 205-207. p. - Metaadatok, vagy katalogizálás. Hamis alternatíva. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?00/050*35495 GOTTDANK Tibor: Szemantikus web. Bevezetés a tudásalapú Internet világába Budapest : ComputerBooks, 2005 . URL: http://webbolt.webwall.hu/computerbooks/Szemantikus_web/Szemantikus_web.php?k%F6nyv =Szemantikus%20web&kategoria=Internet%20%20alkalmaz%E1s%20%E9s%20fejleszt%E9s&mn=tartalom&pid=79 HERENDY Csilla: A kereső, a dokumentumok és a user. A szemantikus web egy lehetséges nézőpontja. URL: http://www.mediakutato.hu/cikk/2010_01_tavasz/03_szemantikus_web HORVÁTH Zoltánné: Taxonómia – az egyezményes nyelvek szerepe és rokonságai - útközben a szemantikus webhez. In: Tudományos és Műszaki Tájékoztatás, 53. évf. (2006), 5. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4410&issue_id=472 JACSÓ Péter: Content evaluation of textual CD-ROM and Web databases (magyar) Szöveges CDROM és webes adatbázisok tartalmának elemzése [hálózati elektronikus mu] / Jacsó Péter; ford. Murányi Péter. – Budapest : Könyvtári Intézet: Magyar Elektronikus Könyvtár, 2005. URL: http://mek.oszk.hu/03000/03040 Közszolgálatiság a digitális korban: a Magyar Rádió Rt. Stratégiája 2002–2005. http://www.mrka.hu/text/mr_startegia_2002_2005.php/ MÉSZÁROS Judit: A MANCI és a LISA könyvtártudományi adatbázisok tartalmi feltáró rendszerének (összehasonlító elemzése). Tudományos és Műszaki Tájékoztatás, 54. évf. (2007) 11–12. sz. 210–211.p. http://tmt.omikk.bme.hu/show_news.html?id=4803&issue_id=488 A MOKKA közös katalógus továbbfejlesztése. Szakértői vélemény. Munkaanyag. 2010.03.23. Készítette a MOKKA szakértői munkacsoportja. 41. p. URL: http://www.mokka.hu/files/tamop/A_MOKKA_tovabbfejlesztese_5_20100323.pdf MOLDOVÁN István: Fejlesztések, újdonságok az OSZK MEK osztályán. Eger. Networkshop, 2007 április. URL: http://videotorium.hu/hu/recordings/details/1773,Fejlesztesek_ujdonsagok_az_OSZK_MEK_os ztalyan OWL Web Ontology Language – Use cases and requirements. Az OWL Web Ontológia Nyelv – Alkalmazási esetek és követelmények. Ford. Pataki Ernő. URL: http://www.w3c.hu/forditasok/OWL/REC-webont-req-20040210.html PAJOR Enikő: Tükörkép - remélhetőleg nem homályos - a Webkat.hu fejlesztés utáni változatáról. Könyvtári Figyelő, 2002/1-2. 130-147. p. http://www.ki.oszk.hu/kf/kfarchiv/2002/1_2/pajor.html
178
INFORMÁCIÓKERESŐ NYELVEK III.
PRÓSZÉKY Gábor, MIHÁLTZ Márton: Wordnet. Az első magyar lexikális szemantikai adatbázis. In: Magyar Terminológia, Vol. 1., no.1. June 2008. 43-57.p. URL: http://www.akademiai.com/content/u261854q27q2108j/ RÁCZ Ágnes:A HUMANUS adatbázis kifejlesztése, különös tekintettel a könyvtártudományi és könyvtörténeti dokumentációra Könyvtári Figyelő, 54. évf. 2008.2.sz. http://epa.oszk.hu/00100/00143/00067/113.htm ROBINSON, Lyn: A strategic approach to research using Internet tools and resources. Aslib Proc. 52.vol. 2000. 1.no. 11-19. p. bibl .10 tétel. Ismert. Hegyközi Ilona: Az Internet eszközeinek és forrásainak kiválasztása az irodalomkutatáshoz: stratégiai megközelítés. In: Könyvtári figyelő, 2000. 3. sz. 516-517.p. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?00/285*36960 ROE, Sandy: Online subject access: Journal of Internet Cataloguing. l2.vol. 1999. 1. no. 69-78. Bibl. a jegyzetekben. Ismert. Mohor Jenő: Tárgy szerinti hozzáférés az online katalógusokban. In: Könyvtári Figyelő, 2000. 1.sz. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?00/055*35497 SALLAI Gyula: Technológiai fejlődés és jogalkotás, 2002. URL: http://www.jogiforum.hu/publikaciok/56 SIKLÓSI Borbála: A szemantikus keresés 10 pontja. URL: http://kereses.blog.hu/2010/06/24/a_szemantikus_kereses_10_pontja SIKLÓSI Borbála: Szemantikus keresés : négy példa. http://kereses.blog.hu/2009/08/31/szemantikus_kereses_negy_pelda SZMREKOVSZKYNÉ Farkas Éva: Online könyvtári és szakirodalmi szolgáltatások. URL: http://www.bdtf.hu/KONYVTAR/informaciokereses/link.htm SZMREKOVSZYNÉ Farkas Éva: Keresés számítógépes katalógusokban és bibliográfiákban. URL: http://palotas.mgk.u-szeged.hu/Farkas_Eva_online.pdf SONNEVEND Péter: A könyvtár új élete = Könyv, könyvtár, könyvtáros, 2008. 8. sz. 6-13. p. URL: http://www.ki.oszk.hu/3k/e107_plugins/content/content.php?content.157 TÓTH Kornél: Mi újság a MOKKA háza táján? Az IMOLA (Integrált MOKKA, ODR, OLA) koncepció. Tudományos és Műszaki Tájékoztatás, 56. évf. 2009. 8. sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=5192&issue_id=507 TÓTH Máté: A szemantikus web. Könyvtárak a szemantikai paradigmában. Doktori értekezés tézisei. Témavezető: Dr. Horváth Péter. Budapest: Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar Irodalomtudományi Doktori Iskola Könyvtártudományi Program. 2010. URL: http://doktori.btk.elte.hu/lit/tothmate/tezis.pdf UNGVÁRY Rudolf: Fejős László halálára. URL: https://listserv.niif.hu/pipermail/katalist/2009May/018399.html Katalist, 2009. május 7. UNGVÁRY Rudolf: Tezaurusz és ontológia, avagy a fogalmi ismertetőjegyek generikus öröklődésének formalizálása. Tudományos és Műszaki Tájékoztatás, 51. köt. 5. sz. 2004. p. 1– 10. UNGVÁRY Rudolf, ORBÁN Éva: Osztályozás és információkeresés. Kommentált szöveggyűjtemény, 2. kötet. URL: http://mek.oszk.hu/01600/01683/pdf/01683-2.pdf UNGVÁRY Rudolf, VAJDA Erik: Könyvtári információkeresés. Typotex Kft, 2002. http://www.tankonyvtar.hu/konyvtartudomany/konyvtari-080905-74 VARGA Katalin: A magyar szakirodalom tartalmi reprezentációjának jelenlegi állapota. In: Tudományos és Műszaki Tájékoztatás, 52. évf. 2005. 7-8.sz. URL: http://tmt.omikk.bme.hu/show_news.html?id=4008&issue_id=464 VARGA Katalin: A szakkönyvtári innováció lehetséges útjai* http://www.tanszertar.hu/eken/2008_04/vka_0804_2.htm VINE, Rita: Real people don't do Boolean: how to teach end users to find high-quality information on the Internet = Inf. Outlook. 5. vol. 2001. 3. no. 16-23. p. - Ismert. In: Könyvtári figyelő, 2001. 3. sz. 01/256. - Az „igazi használók” nem Boole-algebrával keresnek. Hogyan tanítsuk meg a
179
INFORMÁCIÓKERESŐ NYELVEK III.
közvetlen használókat arra, hogyan jussanak színvonalas információhoz az interneten. URL: http://w3.oszk.hu/manscr/wwwi32.exe/[in=ref1.in]/?01/256*40243
Weblapok, adatbázisok, online katalógusok 10Kwizard URL: http://www.10kwizard.com/ http://www.10kwizard.com/help.php?g= Academic Info http://www.academicinfo.net Belépő a Magyar Mezőgazdasági Bibliográfiába http://www.omgk.hu/MABI/bibl.htm BME OMIKK az átszervezés után . URL: http://www.omikk.bme.hu/main.php?folderID=1289&articleID=1205&ctag=articlelist&iid=1 BME OMIKK könyvtára. Igény bevehető adatbázisok. URL: http://www.omikk.bme.hu/main.php?folderID=906 Budapesti Corvinus Egyetem – hozzáférhető adatbázisok. URL: http://www.lib.unicorvinus.hu/content/view/31/190/lang,hu/ Corvina VOCAL – A Corvina rendszert használó könyvtárak közös katalógusa (VOCAL) URL: http://odr.lib.klte.hu/ Debreceni Egyetem Egyetemi és Nemzeti Könyvtár igény bevehető adatbázisok. URL: http://mfk.lib.unideb.hu/hun/databases.php Dialog Bluesheets URL: http://library.dialog.com/blues http://library.dialog.com/bluesheets/html/bl0001.html heets/html/bl0001.html DPedia. URL: http://dbpedia.org/About Dulcinea Guide to Searching on the Net. URL: http://www.findingdulcinea.com/guides/Technology/Internet/Dulcineas-Guide-to-Searching-onthe-Web.html EBSCO használat útmutató http://www.ektf.hu/konyvtar/upload/ebsco_magyar.doc EBSCOhost training magyar nyelvű források. URL: http://support.ebscohost.com/training/lang/hu/hu.php EBSCOhost support URL: http://support.ebsco.com/ Educator’s Reference Desk URL: http://www.eduref.org/ Egészségügyi Stratégiai Kutatóintézet Szakkönyvtár, MOB tárgyszójegyzék részlet http://www.eski.hu/new3/konyvtar/mob/d.htm Good Relations Ontológia http://www.ebusiness-unibw.org/wiki/GoodRelations Google Book Search URL: http://books.google.com/ High Wire Press URL: http://highwire.stanford.edu/ HunKat URL: http://www.hunkat.hu Ice CreamProfits.com URL: IceCreamProfits.com iGlue URL: http://iglue.com Infomine URL: http://www.infomine.ucr.edu Intellectual Property Network (IPN) URL: http://www.delphion.com/ Intute URL: http://www.intute.ac.uk Karlsruher Virtueller Katalog.URL: http://www.ubka.uni-karlsruhe.de/kvk/kvk/kvk_en.html KözElKat Közös Elektronikus Katalógus URL: http://www.eduport.kozelkat/ Közös katalógusok. URL: http://konyvtar.lap.hu/kozos_katalogusok/11227633 Librarians’s Index URL: http://www.lii.org Library of Congress Authorities- http://authorities.loc.gov/ Magyar műszaki folyóiratcikkek. URL: http://www.omikk.bme.hu/main.php?folderID=1190&articleID=988&ctag=articlelist&iid=1 Magyar Országos Közös Katalógus (MOKKA) URL: http://ww3.mokka.hu Magyar Országos Közös Katalógus (MOKKA) Régi Nyomtatványok Tagozat (MOKKA-R) http://www.eruditi.hu/lectio/mokka-r
180
INFORMÁCIÓKERESŐ NYELVEK III.
Mimas URL: http://mimas.ac.uk/portfolio/current/ MTA könyvtára – Igény bevehető adatbázisok URL: http://www.mtak.hu/index.php?name=v_5_1 Mundaeum katalógusrendszere [fotó] URL: http://www.mathewingram.com/work/2007/04/02/todays-interesting-link-the-mundaneum/ National Library of Medicine MeSH URL: http://www.nlm.nih.gov/mesh/filelist.html http://www.nlm.nih.gov/medlineplus/ency/article/000028.htm National Library of Medicine Medlineplus sitemap URL: http://www.nlm.nih.gov/medlineplus/sitemap.html Országos Dokumentumellátó Rendszer (ODR) (lelőhely-adatbázis) URL: http://odr.lib.klte.hu/corvina/odr/page.cgi?page=ujrov Országos Mezőgazdasági Könyvtár URL: http://www.omgk.hu OSZK NEKTÁR URL: http://nektar.oszk.hu Pinakés URL: www.hw.ac.uk/libwww/irn/pinakes/pinakes.html Theca URL: http://biblio.osb.hu UDCC Summary: URL: http://www.udcc.org/udcsummary/php/index.php Yahoo! URL :http://www.yahoo.com W3C Magyar Iroda. URL: http://www.w3c.hu/ W3C Magyar Iroda. URL:http://www.w3c.hu/forditasok/w3cmission.html W3C Szemantikus Web Műhelykonferencia. URL: http://www.w3c.hu/rendezvenyek/2006/szemweb/ W3C tagság: URL: http://www.w3c.hu/w3cmi/w3ctagsag.html Wikipédia kezdőlap. URL: http://hu.wikipedia.org/wiki/Kezd%C5%91lap WorldCat URL: http://www.worldcat.org/ WordNet. URL: http://wordnetweb.princeton.edu/perl/webwn
181